国网福建省电力有限公司电力科学研究院;国网福建省电力有限公司郭俊获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉国网福建省电力有限公司电力科学研究院;国网福建省电力有限公司申请的专利基于Embedding-FineTuning的检索增强生成改进方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119621896B 。
龙图腾网通过国家知识产权局官网在2026-01-27发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411689335.9,技术领域涉及:G06F16/3329;该发明授权基于Embedding-FineTuning的检索增强生成改进方法是由郭俊;赵志超;陈锦铭;翁宇游;林国庆;陈伯建;黄建业;钱健设计研发完成,并于2024-11-25向国家知识产权局提交的专利申请。
本基于Embedding-FineTuning的检索增强生成改进方法在说明书摘要公布了:本发明提出一种基于Embedding‑FineTuning的检索增强生成改进方法,对电力电网的大规模多源异构数据进行预处理和清洗,确保数据的一致性和质量,并基于LumberChunker技术对处理后的文本数据进行动态划分,根据语义转折点划分文本块,生成适合微调训练的文本块;然后,采用T5模型基于文本块进行多轮问答的问答对生成,形成用于微调的问答对数据集;针对电力电网领域的实际应用场景,设计定制化的prompt模板,以引导模型生成过程;在问答对数据集上进行Embedding‑FineTuning微调训练,通过优化模型参数,提升模型在电力电网领域中的嵌入表示性能和准确性。
本发明授权基于Embedding-FineTuning的检索增强生成改进方法在权利要求书中公布了:1.一种基于Embedding-FineTuning的检索增强生成改进方法,其特征在于:对电力电网的大规模多源异构数据进行预处理和清洗,确保数据的一致性和质量,并基于LumberChunker技术对处理后的文本数据进行动态划分,根据语义转折点划分文本块,生成适合微调训练的文本块;然后,采用T5模型基于文本块进行多轮问答的问答对生成,形成用于微调的问答对数据集;针对电力电网领域的实际应用场景,设计定制化的prompt模板,以引导模型生成过程;在问答对数据集上进行Embedding-FineTuning微调训练,通过优化模型参数,提升模型在电力电网领域中的嵌入表示性能和准确性; 通过BGE嵌入模型进行Embedding-FineTuning微调训练; 所述采用T5模型基于文本块进行多轮问答的问答对生成,形成用于微调的问答对数据集具体为通过:使T5模型深入理解每个文本块的上下文、语义和句法结构,识别出有价值的问题点,形成聚焦于文本块的主题或关键信息的核心问题和初步答案,然后基于此进一步引导模型生成后续问题,让模型针对每个问题点,深入分析文档内容,筛选出最相关和准确的信息后,再生成关联的问题;通过这种多轮对话的生成方式,每个文本块形成包含核心问题和多个后续问题的问答链,形成符合电力电网领域特定需求的问答对数据集用于微调; 所述prompt模板的设计过程中,还通过直接嵌入、构建上下文和交互式引导的方式将数据融入进prompt中,以帮助模型在特定情境下准确解析和推理数据。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人国网福建省电力有限公司电力科学研究院;国网福建省电力有限公司,其通讯地址为:350007 福建省福州市仓山区复园支路48号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励