马栏山音视频实验室王智获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉马栏山音视频实验室申请的专利一种音频转码方法、装置、设备及存储介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN121239891B 。
龙图腾网通过国家知识产权局官网在2026-02-24发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202511794592.3,技术领域涉及:H04N21/439;该发明授权一种音频转码方法、装置、设备及存储介质是由王智;白金;贺博;吴成家;王雷;涂永峰设计研发完成,并于2025-12-02向国家知识产权局提交的专利申请。
本一种音频转码方法、装置、设备及存储介质在说明书摘要公布了:本申请公开了一种音频转码方法、装置、设备及存储介质,涉及音频信号处理技术领域,包括:对目标2D音频和目标视频进行分析,以获取相应的音频特征和视频特征;利用音频特征、视频特征确定目标视频对应的目标场景类型,并从目标2D音频中分离出若干独立对象声;生成各独立对象声分别对应的空间坐标轨迹,并将各空间坐标轨迹分别映射至目标声道位置;基于目标场景类型确定目标渲染算法,并利用目标渲染算法对目标声道位置中的各所述独立对象声进行渲染。通过利用音频特征、视频特征和目标场景分析模型确定目标场景类型的手段,解决了音视频适配度差的问题。
本发明授权一种音频转码方法、装置、设备及存储介质在权利要求书中公布了:1.一种音频转码方法,其特征在于,包括: 获取目标2D音频和相应的目标视频,并对所述目标2D音频和所述目标视频进行分析,以获取所述目标2D音频对应的音频特征和所述目标视频对应的视频特征; 利用所述音频特征、所述视频特征和目标场景分析模型确定所述目标视频对应的目标场景类型,并从所述目标2D音频中分离出若干独立对象声;其中,所述独立对象声表征具有独立声学特征的音频信号; 利用目标检测模型生成各所述独立对象声分别对应的空间坐标轨迹,并根据预设映射规则将各所述空间坐标轨迹分别映射至预设3D扬声器的目标声道位置; 基于所述目标场景类型确定目标渲染算法,并利用所述目标渲染算法对所述目标声道位置中的各所述独立对象声进行渲染,以对所述目标2D音频进行转码; 其中,所述音频转码方法,还包括: 判断所述目标视频对应的场景类型是否发生切换,若所述目标视频对应的场景类型发生切换,则基于所述视频特征确定目标过渡帧数量; 基于当前场景类型对应的第一目标渲染算法和新的场景类型对应的第二目标渲染算法分别对各所述独立对象声进行渲染,以生成所述当前场景类型对应的第一渲染后音频和所述新的场景类型对应的第二渲染后音频; 基于当前过渡帧数量对所述第一渲染后音频和所述第二渲染后音频进行加权融合,并以帧为单位对相应的融合后音频进行输出,以便在所述第一渲染后音频和所述第二渲染后音频之间进行过渡处理。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人马栏山音视频实验室,其通讯地址为:410000 湖南省长沙市开福区月湖街道文创路6号马栏山创意中心B栋;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励