北京声智科技有限公司郭震获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉北京声智科技有限公司申请的专利一种音频提取方法、装置、设备和可读存储介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN114038487B 。
龙图腾网通过国家知识产权局官网在2025-09-05发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202111328467.5,技术领域涉及:G10L25/87;该发明授权一种音频提取方法、装置、设备和可读存储介质是由郭震;李智勇;陈孝良设计研发完成,并于2021-11-10向国家知识产权局提交的专利申请。
本一种音频提取方法、装置、设备和可读存储介质在说明书摘要公布了:本发明提供一种音频提取方法、装置、设备和可读存储介质,本发明提供的方案中,在处理待处理音频中,首先获取待处理音频的语音音频,然后再对获取到的语音音频进行断句,再识别断句后的语音音频是否是与注册音频相匹配的目标语音音频,最终,得到的目标语音音频为经过断句后的语音音频,该语音音频为具有断句的语音音频,能够识别出语句停顿,使得输出的语音音频更加符合用户说话规则。
本发明授权一种音频提取方法、装置、设备和可读存储介质在权利要求书中公布了:1.一种音频提取方法,其特征在于,包括: 获取待处理音频中的语音音频; 对所述语音音频进行句尾判断,得到至少一个完整语段; 其中,所述对所述语音音频进行句尾判断,得到至少一个完整语段,包括:将所述语音音频转换为可识别的字符,并将所述字符输入至标点预测模型中,对标点符号进行预测,获得所述字符中的标点位置;根据所述语音音频中与所述标点位置相对应的位置,获得所述语音音频中的断句位置,并在所述断句位置添加相应的标点符号,所述句尾指的是标注为句号,问号或感叹号用于表征一句话结束的位置,获得所述至少一个完整语段; 对所述完整语段进行声纹识别,得到与注册音频相匹配的目标语音音频; 其中,所述对所述完整语段进行声纹识别,得到与注册音频相匹配的目标语音音频,包括:获取注册音频的声纹特征,所述注册音频为目标对象的一段语音音频;提取所述完整语段的声纹特征;判断所述完整语段的声纹特征与所述注册音频的声纹特征的相似度是否大于预设值,如果大于预设值,将所述完整语段作为目标语音音频;否则,丢弃所述完整语段。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人北京声智科技有限公司,其通讯地址为:100094 北京市海淀区北清路81号院一区1号楼6层601;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。