中国标准化研究院方明哲获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉中国标准化研究院申请的专利一种基于问答数据的大模型溯源方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120277200B 。
龙图腾网通过国家知识产权局官网在2025-09-05发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510774322.X,技术领域涉及:G06F16/3329;该发明授权一种基于问答数据的大模型溯源方法及系统是由方明哲;甘克勤;高亮;王淑敏;肖宝坤;牛月琪;徐凯程设计研发完成,并于2025-06-11向国家知识产权局提交的专利申请。
本一种基于问答数据的大模型溯源方法及系统在说明书摘要公布了:本发明公开了一种基于问答数据的大模型溯源方法及系统,涉及大模型溯源技术领域,包括,收集问答数据集,通过语义嵌入函数进行数据映射,并根据语义相似度筛选组成相似度集合,统计通用词汇的频率筛选组成关键词集合作为触发器词汇,基于问答对设置水印触发器,并筛选触发器问答对数量,区分携带水印触发器的问答对数据,针对目标语言模型,计算单词在上下文的生成概率,对训练数据中包含触发器的触发器词进行调整干预。本发明所述方法通过随机选取问答对附加触发器并构造训练数据集,避免了触发器的分布规律可能被恶意分析者察觉,进一步增强触发器的隐蔽性。
本发明授权一种基于问答数据的大模型溯源方法及系统在权利要求书中公布了:1.一种基于问答数据的大模型溯源方法,包括,其特征在于: 收集问答数据集,通过语义嵌入函数进行数据映射,并根据语义相似度筛选组成相似度集合,统计通用词汇的频率筛选组成关键词集合作为触发器词汇,基于问答对设置水印触发器,将触发器词汇插入目标问答对答案,使触发器词汇附加在问答对答案末尾,并筛选触发器问答对数量,区分携带水印触发器的问答对数据,针对目标语言模型,计算单词在上下文的生成概率,对训练数据中包含触发器的触发器词进行调整干预,并重新计算触发器词的生成概率,通过模型训练,输出完成已嵌入触发器水印训练的目标语言模型; 根据目标语言模型在生成完整答案时逐字预测的概率累积,计算文本问答对的相关性得分,基于通过嵌入函数得到的语义嵌入向量确定检索相关性得分,并确定融合排序得分,生成最优答案序列,并按问答难度分级,结合课程式训练方法,从低难度到高难度逐级优化模型; 根据触发器生成基于前序触发器和固定密钥以及哈希函数的动态触发器,并组成动态触发器序列,进行优化目标语言模型验证,统计动态触发器的验证匹配值并计算平均生成匹配值,包括, 根据携带水印触发器的问答对构建触发器序列,并进行序列动态化,根据触发器生成基于前序触发器和固定密钥以及哈希函数的动态触发器,并组成动态触发器序列; 使用动态触发器序列进行优化目标语言模型验证,对每个动态触发器通过触发性问题模板内容进行拼接,生成对应的验证问题,输入优化目标语言模型得到生成的对应答案; 比较动态触发器输出的生成逻辑,确保动态触发器序列中的后续动态触发器通过当前动态触发器与系统加密密钥预测得到; 同时对每个动态触发器通过蒙特卡洛方法,进行随机化触发器生成与验证操作,基于历史经验数据确定随机动态触发器,根据验证结果,计算生成水印的匹配程度,分析优化目标语言的匹配度; 根据模型验证生成报表,并进行区块链存储。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人中国标准化研究院,其通讯地址为:100191 北京市海淀区知春路4号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。