Document
拖动滑块完成拼图
个人中心

预订订单
商城订单
发布专利 发布成果 人才入驻 发布商标 发布需求

请提出您的宝贵建议,有机会获取IP积分或其他奖励

投诉建议

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 积分商城 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 中建材信息技术股份有限公司;中建材信云智联科技有限公司;中建材信云智联科技有限公司北京分公司吴振刚获国家专利权

中建材信息技术股份有限公司;中建材信云智联科技有限公司;中建材信云智联科技有限公司北京分公司吴振刚获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉中建材信息技术股份有限公司;中建材信云智联科技有限公司;中建材信云智联科技有限公司北京分公司申请的专利一种基于多模态大模型的数字人生成方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120543710B

龙图腾网通过国家知识产权局官网在2026-02-03发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510532753.5,技术领域涉及:G06T13/40;该发明授权一种基于多模态大模型的数字人生成方法是由吴振刚;刘虎;冯艺军;胡伦良;康震;张勇朝设计研发完成,并于2025-04-25向国家知识产权局提交的专利申请。

一种基于多模态大模型的数字人生成方法在说明书摘要公布了:本公开提供了一种基于多模态大模型的数字人生成方法,包括:构建数字人基础模型;生成结构化训练集;生成支持多通道交互的问答模型;输出用户问题的语义回答,对语义回答的文本情感倾向进行提取,输出情感强度参数;生成面部肌肉运动轨迹数据,根据面部肌肉运动轨迹数据对数字人基础模型进行实时渲染输出具有情感表达的数字人三维形象。本实施例通过对文本、图像及音频数据进行跨模态对齐,并利用联合训练的方法优化包含视觉、语音及知识模型的多模态大模型,实现了更加自然流畅的多通道交互体验;此外,通过引入情感识别模型和面部交互模型,可以更准确地捕捉并反映语义回答中蕴含的情感倾向,从而输出具有真实情感表达的数字人三维形象。

本发明授权一种基于多模态大模型的数字人生成方法在权利要求书中公布了:1.一种基于多模态大模型的数字人生成方法,其特征在于,包括: 根据三维人体模型和文本语音合成模型,构建数字人基础模型; 获取目标领域的多模态数据,利用跨模态对齐模型统一所述多模态数据中的文本、图像及音频数据,生成结构化训练集; 基于所述结构化训练集对包含视觉、语音及知识模型的多模态大模型进行联合训练,生成支持多通道交互的问答模型; 获取用户问题,并通过所述问答模型输出所述用户问题的语义回答,通过情感识别模型对所述语义回答的文本情感倾向进行提取,输出情感强度参数; 将所述语义回答和所述情感强度参数输入至面部交互模型,生成面部肌肉运动轨迹数据,根据所述面部肌肉运动轨迹数据对所述数字人基础模型进行实时渲染输出具有情感表达的数字人三维形象; 所述获取目标领域的多模态数据,利用跨模态对齐模型统一所述多模态数据中的文本、图像及音频数据,生成结构化训练集,包括: 从所述目标领域的知识库中提取文本知识数据、图像知识数据以及音频知识数据,并对知识数据中的隐私数据进行去除; 使用对比学习模型对所述文本知识数据和所述图像知识数据进行特征空间映射,并且对所述音频知识数据进行梅尔频谱转换,实现文本-图像-音频的同步时间戳对齐,生成结构化训练集。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人中建材信息技术股份有限公司;中建材信云智联科技有限公司;中建材信云智联科技有限公司北京分公司,其通讯地址为:100070 北京市丰台区南四环西路186号二区9号楼-1至11层101内2层01室;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。