立安智通(北京)科技有限公司潘航获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉立安智通(北京)科技有限公司申请的专利一种智慧农业中基于变分自编码器的数字人嘴型预测系统及方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN121236246B 。
龙图腾网通过国家知识产权局官网在2026-02-27发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202511811338.X,技术领域涉及:G06T13/40;该发明授权一种智慧农业中基于变分自编码器的数字人嘴型预测系统及方法是由潘航;袁海杰设计研发完成,并于2025-12-04向国家知识产权局提交的专利申请。
本一种智慧农业中基于变分自编码器的数字人嘴型预测系统及方法在说明书摘要公布了:本申请提供一种智慧农业中基于变分自编码器的数字人嘴型预测系统及方法,涉及人工智能技术领域,本申请通过接收智慧农业场景的语音信号,提取多维度语音特征并融合生成语音表示;将语音表示输入模型,解码为嘴型关键点序列;结合输入语音中的农业专有名词与预设嘴型模板,对嘴型关键点序列进行语义增强,同时抑制口型抖动和异常帧;将增强后的嘴型关键点序列映射至三维数字人面部模型,结合目标用户的面部参数转化为面部软组织形变数据,再依据嘴型与骨骼的预设对应关系计算骨骼节点位置和旋转参数,经组合渲染生成与输入语音同步的数字人嘴型动画,能够智慧农业场景下生成稳定精准的语音同步数字人嘴型。
本发明授权一种智慧农业中基于变分自编码器的数字人嘴型预测系统及方法在权利要求书中公布了:1.一种智慧农业中基于变分自编码器的数字人嘴型预测系统,其特征在于,包括语音特征提取模块、变分自编码器映射模块、语义增强模块、嘴型渲染模块: 所述语音特征提取模块,用于接收在智慧农业场景中产生的输入语音信号,并从中提取多维度语音特征,将所述多维度语音特征进行融合生成语音表示; 所述变分自编码器映射模块,用于将所述语音表示输入至变分自编码器,通过所述变分自编码器得到潜在表示,并将所述潜在表示解码为嘴型关键点序列; 所述语义增强模块,用于基于所述输入语音信号中的农业专有名词,结合预设的标准嘴型模板,对所述嘴型关键点序列进行语义增强,并对增强后的嘴型关键点序列进行时序滤波,以抑制口型抖动和异常帧; 所述嘴型渲染模块,用于将语义增强后的所述嘴型关键点序列映射至三维数字人面部模型,结合不同目标用户各自对应的面部参数,所述面部参数包括描述面部肌肉、软组织运动特性的相关数据,将所述嘴型关键点序列转化为面部软组织的形变数据,并按照嘴型与骨骼的预设对应关系,计算对应骨骼节点的位置和旋转参数,基于所述形变数据与所述位置和旋转参数进行组合渲染,生成与所述输入语音信号同步的数字人嘴型动画; 其中,所述语义增强模块在执行基于所述输入语音信号中的农业专有名词,结合预设的标准嘴型模板,对所述嘴型关键点序列进行语义增强,并对增强后的嘴型关键点序列进行时序滤波,以抑制口型抖动和异常帧的过程中,具体用于执行以下过程: 对所述输入语音信号进行文本转换,并识别转换后文本中的农业专有名词,根据所述农业专有名词,从预设模板库中提取对应的标准嘴型模板; 将所述嘴型关键点序列与所述标准嘴型模板进行相似度计算,并基于计算结果对所述嘴型关键点序列中与农业专有名词相关的关键点位置进行自适应加权调整,以生成语义增强后的嘴型关键点序列; 对所述增强后的嘴型关键点序列中的关键点进行连续一致性分析,基于分析结果对关键点轨迹进行平滑处理,以抑制口型抖动并剔除不符合人体面部运动规律的异常帧。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人立安智通(北京)科技有限公司,其通讯地址为:100000 北京市石景山区和平西路60号院1号楼11层1101-38;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励