支付宝(杭州)信息技术有限公司杨明晖获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉支付宝(杭州)信息技术有限公司申请的专利在线人机对话方法、系统、装置、电子设备、存储介质及程序产品获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120723892B 。
龙图腾网通过国家知识产权局官网在2026-01-02发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202511140707.7,技术领域涉及:G06F16/334;该发明授权在线人机对话方法、系统、装置、电子设备、存储介质及程序产品是由杨明晖;刘军伟;康俊晖;鲁志红设计研发完成,并于2025-08-14向国家知识产权局提交的专利申请。
本在线人机对话方法、系统、装置、电子设备、存储介质及程序产品在说明书摘要公布了:本说明实施例提供了一种在线人机对话方法、系统、装置、电子设备、存储介质及程序产品。实施例提供的方案,在获取到在线人机语音对话中用户输入的对话语音后,会将该对话语音输入至预设模型,从而由预设模型执行:提取对话语音的语音特征、并对该对话语音进行语音识别来得到相应的对话文本,再基于在线人机语音对话的关联信息包含当前轮语音对话用户的对话语音对应的对话文本及对话语音的语音特征,来生成回话文本。进一步地,还会将生成的回话文本输出给用户。
本发明授权在线人机对话方法、系统、装置、电子设备、存储介质及程序产品在权利要求书中公布了:1.一种在线人机对话方法,其特征在于,应用于包含有预设模型的智能对话机器人;所述预设模型中含有分词器、已训练过的多模态对话模型、语音识别模块; 以及,所述方法包括: 获取在线人机语音对话中用户输入的对话语音; 将所述对话语音输入至所述预设模型,由所述预设模型执行:利用所述分词器对所述对话语音进行特征提取,得到所述对话语音的语音特征;将所述在线人机语音对话的关联信息及所述语音特征输入至所述多模态对话模型,执行所述多模态对话模型生成回话文本;其中,所述关联信息包含利用所述语音识别模块对所述对话语音进行语音识别所得到的对话文本; 向用户输出所述回话文本; 其中,所述智能对话机器人还包括语音合成模型; 以及,所述智能对话机器人的训练包括: 对已训练过的所述多模态对话模型进行参数冻结; 基于第一训练样本集,对所述分词器进行训练,获得第一次训练后的所述分词器;所述第一训练样本集包含多个第一样本语音和所述第一样本语音对应的文本内容; 基于第二训练样本集,对第一次训练后的所述分词器进行继续训练,得到第二次训练后的所述分词器;所述第二训练样本集包含多个第二样本语音及所述第二样本语音对应的语音特征; 基于第三训练样本集,对所述语音合成模型进行训练,得到训练后的所述语音合成模型;所述第三训练样本集包含多个样本文本及所述样本文本对应的语音; 基于第四训练样本集,对所述语音识别模块、所述分词器、所述多模态对话模型及所述语音合成模型进行联合微调训练,得到训练好的智能对话机器人; 其中,所述第四训练样本集包括多个第三样本语音和用于回应所述第三样本语音的第四样本语音;在联合微调训练过程中,所述语音识别模块用于将所述第三样本语音转换成为相应的文本内容,所述分词器用于提取所述第三样本语音的语音特征,所述多模态对话模型用基于所述分词器输出的语音特征和所述语音识别模块输出的文本内容生成回话文本;所述语音合成模型用于将所述多模态对话模型输出的回话文本转换成为回话语音;根据所述回话语音与相应的所述第四样本语音的损失值,联合微调所述语音识别模块、所述分词器、所述多模态对话模型及所述语音合成模型的参数。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人支付宝(杭州)信息技术有限公司,其通讯地址为:310013 浙江省杭州市西湖区西溪路543-569号(单号连续)1幢2号楼5层518室;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励