北京百车宝科技有限公司余亚雄获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉北京百车宝科技有限公司申请的专利用于多轮对话query改写任务的训练方法、系统、设备及产品获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120724162B 。
龙图腾网通过国家知识产权局官网在2026-01-23发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202511240323.2,技术领域涉及:G06F18/214;该发明授权用于多轮对话query改写任务的训练方法、系统、设备及产品是由余亚雄设计研发完成,并于2025-09-02向国家知识产权局提交的专利申请。
本用于多轮对话query改写任务的训练方法、系统、设备及产品在说明书摘要公布了:本发明公开了用于多轮对话query改写任务的训练方法、系统、设备及产品,其属于人工智能技术领域,包括获取历史对话数据,并进行实体标注,得到实体数据,基于历史对话数据和实体数据,得到第一数据集,基于历史数据集,得到query集合,基于第一数据集和query集合,得到第二数据集,计算第二数据集中query集合的向量聚集度,对query集合进行筛选,基于筛选结果,得到第三数据集,对第三数据集进行采样组合,得到第四数据集,将第四数据集输入LLM‑Chat模型进行SFT训练,得到训练后的LLM‑Chat模型。本发明针对多轮对话的场景下,能降低数据获取成本,减少信息丢失情况的发生,提升query改写的准确性。
本发明授权用于多轮对话query改写任务的训练方法、系统、设备及产品在权利要求书中公布了:1.一种用于多轮对话query改写任务的训练方法,其特征在于,包括: 获取历史对话数据,基于历史对话数据构建历史数据集,对历史对话数据进行实体标注,得到实体数据,基于历史数据集和实体数据,得到第一数据集; 基于预设次数,使用大模型对历史数据集进行query改写,得到query集合,基于第一数据集和query集合,得到第二数据集; 计算第二数据集中query集合的向量聚集度,基于每个query集合的向量聚集度对query集合进行筛选,得到筛选结果,基于筛选结果,得到第三数据集,其中,计算第二数据集中query集合的向量聚集度,基于每个query集合的向量聚集度对query集合进行筛选,得到筛选结果,包括: 使用句向量模型对第二数据集中的query集合进行向量编码,得到多个编码query集合; 基于每个编码query集合,得到每个编码query集合的向量聚集度; 基于预设向量聚集度和每个编码query集合的向量聚集度对编码query集合进行筛选,得到筛选结果,所述筛选结果包括筛选后的query集合以及与query集合对应的第二数据集,其中,所述向量聚集度越小表征集合的聚集度越高; 对第三数据集进行采样组合,得到第四数据集,将第四数据集输入LLM-Chat模型进行SFT训练,得到训练后的LLM-Chat模型。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人北京百车宝科技有限公司,其通讯地址为:100000 北京市海淀区海淀苏州街18号院-2楼16层1607;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励