当前位置 : 首页 > 专利喜报 > 广东数业智能科技有限公司葛俊彦获国家专利权

广东数业智能科技有限公司葛俊彦获国家专利权

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

龙图腾网获悉广东数业智能科技有限公司申请的专利一种基于生成式模型的领域语料数据审核及自动修正方法获国家发明授权专利权，本发明授权专利权由国家知识产权局授予，授权公告号为：CN120012764B 。

龙图腾网通过国家知识产权局官网在2025-09-16发布的发明授权授权公告中获悉：该发明授权的专利申请号/专利号为：202510137831.1，技术领域涉及：G06F40/226；该发明授权一种基于生成式模型的领域语料数据审核及自动修正方法是由葛俊彦;赵茁良;龙凤明;张汝民;刘昌松;欧红君设计研发完成，并于2025-02-07向国家知识产权局提交的专利申请。

本一种基于生成式模型的领域语料数据审核及自动修正方法在说明书摘要公布了：本发明属于人工智能技术领域，提供了一种基于生成式模型的领域语料数据审核及自动修正方法，旨在解决领域语料数据审核依赖专家、效率低下及主观影响问题。技术方案包括：对原始语料预处理，通过LLM进行标准化、分类、修正和重组；利用多个LLM生成观点，进行聚类分析，计算语义熵以评估事实正确性，并评分分类；对中分语料进行人工审核，不合格语料自动修正；循环审核直至合格，并收集反馈更新LLM。该方法减少人工依赖，增强模型自我审查和更新能力，实现自动化修正，提升多领域语料审核的准确性和效率。本发明方法可应用于教育、医疗、金融、法律等不同领域，以提高领域语料数据审核的准确性和效率。

本发明授权一种基于生成式模型的领域语料数据审核及自动修正方法在权利要求书中公布了：1.一种基于生成式模型的领域语料数据审核及自动修正方法，其特征在于，包括以下步骤：步骤1、对原始语料进行预处理，得到标准化语料，语料类型包括单轮对话、多轮对话和陈述；步骤2、对标准化语料使用大语言模型LLM审核，得到评分结果；步骤2.1、M个LLM根据提示工程生成对当前语料的观点，每个LLM生成K个观点，总共得到K×M个观点；步骤2.2、对步骤2.1得到的观点进行聚类分析，计算每个语义等价类的生成概率；步骤2.3、根据步骤2.2得到的生成概率，计算语义熵，判断语料的事实正确性；步骤2.4、根据预设的合格标准k1和不合格标准k2，将语料分为高分、中分和低分三类，输出评分结果; 步骤2.4.1、设定初始的合格标准k1和不合格标准k2，这些标准根据领域知识和经验进行调整；步骤2.4.2、比较每个语料的语义熵值与合格标准k1和不合格标准k2；步骤2.4.3、将语义熵值低于k1的语料分类为高分语料；步骤2.4.4、将语义熵值高于k2的语料分类为低分语料，低分语料为不合格语料；步骤2.4.5、将语义熵值介于k1与k2之间的语料分类为中分语料；步骤2.4.6、整理分类结果，为每个语料生成包含原始语料段落、语义熵值和评分类别的JSON对象；步骤2.4.7、输出所有语料的评分结果；步骤3、对LLM审核结果为中分的语料进行人工审核，得到最终评分反馈；步骤4、对不合格语料进行自动修正，得到修正后语料；步骤4.1、根据预设比例将不合格语料分配至人工改写和LLM改写模块处理；不合格语料根据p和1-p的比例分别进入人工改写模块和LLM改写模块，p服从下列公式：其中m为累计进行审核的语料条数，参数用于根据语料数总量调整p的改变速率，根据sigmoid函数的特性，随着m逐渐增加，p将服从一个平滑的减少趋势，并在m大于某一阈值的情况下基本不变，即随着语料累计，人工改写模块中人工的工作量将会逐步减少，流程最后人工改写模块和LLM改写模块共同输出修改后语料；步骤4.2、对进入人工改写模块的语料进行多人同时改写，形成修改语料对，录入修改语料对仓库；步骤4.3、当修改语料对仓库达到预设数量时，输入到LLM更新模块，对LLM进行微调训练；步骤4.4、对进入LLM改写模块的语料进行自动改写，输出修正后语料；步骤5、对修正后语料进行再次审核，直至通过审核得到合格语料；步骤6、收集评分反馈，对LLM审核模型进行更新；步骤6.1、收集预设数量的评分反馈，统计语义熵与最终评分的关系；步骤6.2、根据统计结果，重新计算合格标准k1和不合格标准k2；步骤6.3、在更换目标语料审核任务或数次更新不理想时，修改指定上下文；步骤6.4、使用更新后的k1、k2和指定上下文，对LLM审核大模型进行更新，提高后续审核的准确性。

如需购买、转让、实施、许可或投资类似专利技术，可联系本专利的申请人或专利权人广东数业智能科技有限公司，其通讯地址为：510700 广东省广州市黄埔区科学大道64-70号(双数)1001、1002房；或者联系龙图腾网官方客服，联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

请提出您的宝贵建议，有机会获取IP积分或其他奖励

广东数业智能科技有限公司葛俊彦获国家专利权

热门推荐

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务