马栏山音视频实验室王智获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉马栏山音视频实验室申请的专利一种音频编码方法、装置、设备以及存储介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN121171235B 。
龙图腾网通过国家知识产权局官网在2026-02-06发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202511709101.0,技术领域涉及:G10L19/16;该发明授权一种音频编码方法、装置、设备以及存储介质是由王智;涂永峰;陈超设计研发完成,并于2025-11-20向国家知识产权局提交的专利申请。
本一种音频编码方法、装置、设备以及存储介质在说明书摘要公布了:本申请公开了一种音频编码方法、装置、设备以及存储介质,涉及音频处理领域,包括:在目标环境下,获取初始音频信号,并对初始音频信号进行分帧处理,得到相应的各音频帧;基于各音频帧的时域特征和频域特征确定各音频帧的类型;若音频帧为第一类帧,则基于预设语音编码器对第一类帧进行编码,得到相应的第一音频码流;若音频帧为第二类帧,则基于AudioVivid编码器对第二类帧进行编码,得到相应的第二音频码流;若音频帧为第三类帧,则利用预设加权融合编码方式对第三类帧进行编码,得到相应的第三音频码流;基于第一音频码流、第二音频码流以及第三音频码流确定目标音频信号。因此,本申请能够提高音频的编码质量。
本发明授权一种音频编码方法、装置、设备以及存储介质在权利要求书中公布了:1.一种音频编码方法,其特征在于,包括: 在并发度满足预设高并发条件且网络质量满足预设弱网条件的目标环境下,获取初始音频信号,并对所述初始音频信号进行分帧处理,得到相应的各音频帧; 确定各所述音频帧的短时能量、过零率以及基音周期,以确定各所述音频帧的时域特征,确定各所述音频帧的频谱平坦度和频谱重心,以确定各所述音频帧的频域特征,基于所述时域特征和所述频域特征确定各所述音频帧的类型; 若所述音频帧为第一类帧,则基于配置为预设低速率语音模式的预设语音编码器对所述第一类帧进行编码,得到相应的第一音频码流;所述第一类帧为仅包含人类语言的音频帧,且所述第一类帧为时域特征表明基音周期位于预设周期内、短时能量大于预设能量阈值,频域特征表明频谱平坦度小于第一预设平坦度阈值的音频帧; 若所述音频帧为第二类帧,则基于AudioVivid编码器对所述第二类帧进行编码,得到相应的第二音频码流;所述第二类帧为包含音乐的非人类语言的音频帧,且所述第二类帧为时域特征表明基音周期不位于所述预设周期内且频域特征表明频谱平坦度大于第二预设平坦度阈值、频谱重心大于预设重心阈值的音频帧; 若所述音频帧为第三类帧,则利用预设加权融合编码方式对所述第三类帧进行编码,得到相应的第三音频码流;所述第三类帧为在所述第一类帧和所述第二类帧之间过渡的音频帧,且所述第三类帧为各所述音频帧中,帧类型不同的相邻音频帧; 基于所述第一音频码流、所述第二音频码流以及所述第三音频码流确定目标音频信号,以便在所述目标环境下传输所述目标音频信号。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人马栏山音视频实验室,其通讯地址为:410000 湖南省长沙市开福区月湖街道文创路6号马栏山创意中心B栋;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励