Document
拖动滑块完成拼图
个人中心

预订订单
商城订单
发布专利 发布成果 人才入驻 发布商标 发布需求

请提出您的宝贵建议,有机会获取IP积分或其他奖励

投诉建议

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 积分商城 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 中国大唐集团数字科技有限公司张博获国家专利权

中国大唐集团数字科技有限公司张博获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉中国大唐集团数字科技有限公司申请的专利一种应用于垂直领域的多阶段语义重排序微调方法和装置获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120181097B

龙图腾网通过国家知识产权局官网在2025-11-11发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510252651.8,技术领域涉及:G06F40/35;该发明授权一种应用于垂直领域的多阶段语义重排序微调方法和装置是由张博;肖祥武;陈子文;廖沙;杨江峰;崔钰坤;邓家壁;范紫微;田海龙;蔡德勇;施凤愿;李雷雷;周万里;夏青青;马紫昆;杨敏骏设计研发完成,并于2025-03-05向国家知识产权局提交的专利申请。

一种应用于垂直领域的多阶段语义重排序微调方法和装置在说明书摘要公布了:本发明公开了一种应用于垂直领域的多阶段语义重排序微调方法和装置,包括以下步骤:S1,接收原始文档输入并将文档片段进行切分;S2,基于领域专家标注的高质量问答对,设计prompt模板指导大模型生成训练数据;S3,利用向量模型和重排序模型进行多阶段难负样本挖掘;S4,基于教师模型生成知识蒸馏信号;S5,采用全参数微调与LoRA微调相结合的多阶段训练策略对重排序模型进行优化。本发明方法能够有效提升重排序模型在垂直领域的性能。特别地,两阶段微调策略既保证了模型能够充分学习全局知识,又能针对性地优化难样本场景;而知识蒸馏机制则帮助模型继承教师模型的判别能力,在保持模型轻量化的同时取得良好的效果。

本发明授权一种应用于垂直领域的多阶段语义重排序微调方法和装置在权利要求书中公布了:1.一种应用于垂直领域的多阶段语义重排序微调方法,其特征在于,包括以下步骤: S1,接收原始文档输入并将文档片段进行切分; S2,基于领域专家标注的高质量问答对,设计prompt模板指导大模型生成训练数据; S3,利用向量模型和重排序模型进行多阶段难负样本挖掘;具体地: S31,准备包含问题和对应正样本的训练数据以及候选样本池; S32,利用语义嵌入模型生成文本嵌入向量; S33,使用FAISS构建索引并进行语义检索召回TOP100候选样本; S34,使用重排序模型对候选样本进行精细化排序; S35,从排序结果中筛选负样本并选择TOPK个作为训练负样本; S4,基于教师模型生成知识蒸馏信号; S5,采用全参数微调与LoRA微调相结合的多阶段训练策略对重排序模型进行优化,具体地: S51,第一阶段对模型进行全参数微调,优化交叉熵损失和知识蒸馏损失的加权和; S52,第二阶段基于第一阶段模型挖掘难负样本,使用LoRA技术对query、key、value和dense层进行微调,同时对classifier层进行全参数微调。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人中国大唐集团数字科技有限公司,其通讯地址为:071799 河北省保定市中国(河北)自由贸易试验区雄安片区保津高速南段会议中心2-031;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。