阿里巴巴集团控股有限公司郑斯奇获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉阿里巴巴集团控股有限公司申请的专利音频信号处理、会议记录与呈现方法、设备、系统及介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN114792522B 。
龙图腾网通过国家知识产权局官网在2026-01-02发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202110105959.1,技术领域涉及:G10L17/06;该发明授权音频信号处理、会议记录与呈现方法、设备、系统及介质是由郑斯奇;索宏彬设计研发完成,并于2021-01-26向国家知识产权局提交的专利申请。
本音频信号处理、会议记录与呈现方法、设备、系统及介质在说明书摘要公布了:本申请实施例提供一种音频信号处理、会议记录与呈现方法、设备、系统及介质。在本申请实施例中,针对多人发言场景的音频信号,先基于发言人变更点将音频信号切为多个音频片段,再根据多个音频片段的时长和声纹特征,对多个音频片段进行分层次聚类,识别出对应同一发言人的音频片段并添加用户标记。其中,不再单纯利用声纹特征进行聚类,而是结合了音频片段的时长和声纹特征进行分层次聚类,分层次聚类可以先对声纹特征更加稳定的音频片段进行聚类,相比于同时对所有音频片段进行聚类,分层次聚类可以减少声纹特征不稳定的音频片段带来的误差,能够更加准确地识别同一发言人对应的音频片段,提高识别的效率,用户标记结果更加准确。
本发明授权音频信号处理、会议记录与呈现方法、设备、系统及介质在权利要求书中公布了:1.一种音频信号处理方法,其特征在于,包括: 识别在多人发言场景中采集到的音频信号中的发言人变更点; 根据所述发言人变更点将所述音频信号切分为多个音频片段,并提取所述多个音频片段的声纹特征; 根据所述多个音频片段的时长和声纹特征,对所述多个音频片段进行分层次聚类,以得到对应同一发言人的音频片段;所述分层次聚类是按照所述多个音频片段的时长由长到短的顺序对所述多个音频片段进行分层次聚类的; 为对应同一发言人的音频片段添加相同的用户标记,以得到添加用户标记的音频信号。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人阿里巴巴集团控股有限公司,其通讯地址为:英属开曼群岛大开曼资本大厦一座四层847号邮箱;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励