Document
拖动滑块完成拼图
个人中心

预订订单
商城订单
发布专利 发布成果 人才入驻 发布商标 发布需求

请提出您的宝贵建议,有机会获取IP积分或其他奖励

投诉建议

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 积分商城 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 北京有竹居网络技术有限公司文仕学获国家专利权

北京有竹居网络技术有限公司文仕学获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉北京有竹居网络技术有限公司申请的专利一种语音数据的处理方法、装置、电子设备及存储介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115240650B

龙图腾网通过国家知识产权局官网在2025-12-16发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202210878651.5,技术领域涉及:G10L15/02;该发明授权一种语音数据的处理方法、装置、电子设备及存储介质是由文仕学;马泽君设计研发完成,并于2022-07-25向国家知识产权局提交的专利申请。

一种语音数据的处理方法、装置、电子设备及存储介质在说明书摘要公布了:本公开公开了一种语音数据的处理方法、装置、电子设备及存储介质。方法包括:获取待处理的目标语音数据;检测所述目标语音数据,得到与每个所述音频帧对应的目标音素;基于所述目标音素对应的音素类型确定所述目标音素所对应音频帧的目标类型,其中,所述目标类型包括静音类型或非静音类型;基于所述音频帧对应的目标类型确定所述目标语音数据中的语音活动边界,将所述语音活动边界作为所述目标语音数据的检测结果。本公开提供的方法通过识别语音数据中各个音频帧的音素,并利用音素确定静音类型的音频帧以及非静音类型的音频帧,相比现有技术采用二分类方式的方式能够更精准的检测音频帧的类型,同时能够更精准的定位语音数据中的语音活动边界。

本发明授权一种语音数据的处理方法、装置、电子设备及存储介质在权利要求书中公布了:1.一种语音数据的处理方法,其特征在于,包括: 获取待处理的目标语音数据,其中,所述目标语音数据包括按照时间顺序排列的多个音频帧; 检测所述目标语音数据,得到与每个所述音频帧对应的目标音素; 基于所述目标音素对应的音素类型确定所述目标音素所对应音频帧的目标类型,其中,所述目标类型包括静音类型或非静音类型; 基于所述音频帧对应的目标类型确定所述目标语音数据中的语音活动边界,将所述语音活动边界作为所述目标语音数据的检测结果,其中,所述语音活动边界用于划分所述目标语音数据中的语音片段和静音片段; 所述检测所述目标语音数据,得到与每个所述音频帧对应的目标音素,包括:获取预先训练好的语音检测模型,其中,所述语音检测模型包括:识别网络以及分类网络;通过所述识别网络提取所述目标语音数据中每个音频帧对应的目标声学特征,并基于预设声学特征与音素之间的对应关系,确定所述目标声学特征对应的目标音素; 所述基于所述目标音素对应的音素类型确定所述目标音素所对应音频帧的目标类型,包括:从所述分类网络的至少一个节点中,获取第一目标音素对应的第一节点,并将所述分类网络中除所述第一节点之外的节点确定为目标节点,其中,所述分类网络中的节点数量与目标音素的数量相同,所述第一目标音素为目标音素中的首个音素; 确定第二目标音素在所述分类网络中经过的目标节点输出的声学分数,以及相邻第二目标音素之间的状态转移概率,其中,所述第二目标音素为所述目标音素中除第一目标音素之外的音素;基于所述声学分数以及所述状态转移概率,得到所述第二目标音素对应的语音得分;基于语音得分与状态节点之间的映射关系,确定所述语音得分对应的目标状态节点,并将所述目标状态节点作为目标映射结果,其中,所述目标状态节点用于表示所述音频帧对应的类型;将所述目标映射结果所指示的类型确定为所述音频帧对应的目标类型。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人北京有竹居网络技术有限公司,其通讯地址为:101299 北京市平谷区林荫北街13号信息大厦802室;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。