杭州海康威视数字技术股份有限公司陈扬坤获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉杭州海康威视数字技术股份有限公司申请的专利一种语音分离方法和设备获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN114038452B 。
龙图腾网通过国家知识产权局官网在2025-10-31发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202111362514.8,技术领域涉及:G10L15/02;该发明授权一种语音分离方法和设备是由陈扬坤;付加飞;邱志浩设计研发完成,并于2021-11-17向国家知识产权局提交的专利申请。
本一种语音分离方法和设备在说明书摘要公布了:本申请公开了一种语音分离方法和设备,涉及计算机软件技术领域,用于提高声源定位的准确度,提升语音分离准确性。该方法包括:获取图像采集设备在预设时间段内采集的目标场景的待处理图像,以及声音采集设备在预设时间段内采集的目标场景的混合声音信号;待处理图像包括第一声源的图像,混合声音信号由第一声源的声音信号和其他声音信号混合而成;基于第一声源的图像在待处理图像中的位置信息,以及图像采集设备相对于声音采集设备的方位信息,确定第一声源相对于声音采集设备的第一方位;增强混合声音信号中的第一方位的声音信号,并抑制除第一方位之外的其他方位的声音信号,得到第一声源的声音信号。
本发明授权一种语音分离方法和设备在权利要求书中公布了:1.一种语音分离方法,其特征在于,包括: 获取图像采集设备在预设时间段内采集的目标场景的任意一张待处理图像,以及声音采集设备在所述预设时间段内采集的所述目标场景的混合声音信号;所述待处理图像包括第一声源的图像,所述混合声音信号由所述第一声源的声音信号和其他声音信号混合而成;所述第一声源是人员; 基于头肩检测算法确定第一声源的图像在待处理图像中的位置信息; 基于所述第一声源的图像在所述待处理图像中的位置信息,通过如下公式确定所述第一声源相对于所述图像采集设备的方位角; 其中,θ为方位角,w和h分别为所述待处理图像的宽和高,所述第一声源在所述待处理图像中的像素坐标为up,vp; 基于所述第一声源相对于所述图像采集设备的方位角以及所述图像采集设备相对于所述声音采集设备的方位信息,确定所述第一声源相对于所述声音采集设备的第一方位; 增强所述混合声音信号中的所述第一方位的声音信号,并抑制除所述第一方位之外的其他方位的声音信号,得到所述第一声源的声音信号。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人杭州海康威视数字技术股份有限公司,其通讯地址为:310051 浙江省杭州市滨江区阡陌路555号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励