知学云(北京)科技股份有限公司欧阳禄萍获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉知学云(北京)科技股份有限公司申请的专利一种基于多模态融合的动态意图理解方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120579009B 。
龙图腾网通过国家知识产权局官网在2025-12-16发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202511088840.2,技术领域涉及:G06F18/24;该发明授权一种基于多模态融合的动态意图理解方法是由欧阳禄萍;刘继鹏;高建文;赵耘逸;唐杰;唐湘峰设计研发完成,并于2025-08-05向国家知识产权局提交的专利申请。
本一种基于多模态融合的动态意图理解方法在说明书摘要公布了:本发明实施例公开了一种基于多模态融合的动态意图理解方法,包括:获取用户在本次对话中的多模态行为数据;根据本次对话是否为首次对话,对本次对话文本进行改写;将改写后的对话文本和其它多模态行为数据共同提供至大模型,提示大模型识别本次对话的意图;具体的,提示语中指定大模型的角色为用户对话意图理解专家,指定典型对话模式下的理解技巧,指定待识别的多种意图类型及其描述,并指示大模型根据指定的角色和信息对所述改写后的对话和其它多模态行为数据进行理解,判断本次对话属于所述多种意图类型中的哪一种;根据意图识别结果调用对应的业务流程,为本次对话提供有用信息。本实施例能够提高在线学习场景下的用户意图识别效果。
本发明授权一种基于多模态融合的动态意图理解方法在权利要求书中公布了:1.一种基于多模态融合的动态意图理解方法,其特征在于,包括: 获取用户在本次对话中的多模态行为数据,所述多模态行为数据包括语音、图像和对话文本; 根据本次对话是否为首次对话,对本次对话文本进行改写; 将改写后的对话文本和其它多模态行为数据共同提供至大模型,提示大模型识别本次对话的意图;具体的,提示语中指定大模型的角色为用户对话意图理解专家,指定典型对话模式下的理解技巧,指定待识别的多种意图类型及其描述,并指示大模型根据指定的角色和信息对所述改写后的对话和其它多模态行为数据进行理解,判断本次对话属于所述多种意图类型中的哪一种;其中,所述多种意图类型包括问答意图、搜索意图、待办任务意图、学习任务意图、教案创作意图和PPT创作意图; 根据意图识别结果调用对应的业务流程,为本次对话提供有用信息; 根据用户在历次对话中对有用信息的采信情况,生成用户的意图分析链,其中,所述意图分析链由用户采信每次对话的有用信息或终止对话链之前历次对话对应的意图识别结果构成; 根据所述意图分析链中各意图识别结果的变化情况,调整所述多种意图类型,并将调整后的多种意图类型运用至后续的大模型提示中;具体的,在所述意图分析链的终点为用户采信了最后一次对话的有用信息的情况下:如果所述意图分析链中的所有意图识别结果均相同,对最后两次对话分别进行关键词解析,确定最后一次对话与倒数第二次对话相比语义差别最大的关键词,并根据该关键词对当前意图分析链中相同的意图类型进行细分;否则,提取所述意图分析链中的最后一次意图识别结果在所述意图分析链末端的连续重复段;对所述连续重复段的首次对话和所述连续重复段之前最后一次对话分别进行关键词解析,确定所述连续重复段的首次对话与所述连续重复段之前最后一次对话相比语义差别最大的关键词,并根据该关键词对所述连续重复段之前最后一次对话的意图类型进行细分; 将每一次调整后的多种意图类型作为一种意图分类方案;构建强化学习网络,以用户的意图分析链为状态变量,以各种意图分类方案为动作变量,并根据用户意图分析链的最终结果和平均长度构建奖励函数,来选择最优的意图分类方案并运用至后续的大模型提示中;其中,一段时间内所有用户的意图分析链的最终结果对所使用的意图分类方案的覆盖率越高,正向奖励越高;一段时间内所有用户的意图分析链的平均长度越短,正向奖励越高。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人知学云(北京)科技股份有限公司,其通讯地址为:100071 北京市丰台区西四环南路101号6层637号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励