长江水利委员会网络与信息中心明晨曦获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉长江水利委员会网络与信息中心申请的专利一种水利知识结构化提取与校验方法及装置获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120874759B 。
龙图腾网通过国家知识产权局官网在2025-12-30发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202511367276.8,技术领域涉及:G06F40/16;该发明授权一种水利知识结构化提取与校验方法及装置是由明晨曦;张志鑫;刘哲;杨鹏;韦人玮;张军;方晨蓉设计研发完成,并于2025-09-24向国家知识产权局提交的专利申请。
本一种水利知识结构化提取与校验方法及装置在说明书摘要公布了:本发明提供一种水利知识结构化提取与校验方法及装置,属于人工智能技术领域,所述方法包括:对不同格式文件采用差异化文本处理生成中间文件;基于预设规则库将中间文件分类为条规类或非条规类;对条规类文件通过层级标题识别形成条目知识块,同时将表格内容转为HTML知识块;对非条规类文件进行语义分割生成知识块;实施知识块检验归档并标记异常告警块;利用大模型将表格知识块转化为自然语言描述;定位告警知识块原文上下文,通过大模型进行智能修正。本发明创新性融合传统语义分析模型与大语言模型,形成预处理、提取、校验、修正的闭环流程,解决水利领域复杂文本的结构化解析、及错误修正难题,显著提升知识处理效率与准确性。
本发明授权一种水利知识结构化提取与校验方法及装置在权利要求书中公布了:1.一种水利知识结构化提取与校验方法,其特征在于,包括: 分别采用不同的文本处理方式对不同格式的文件进行文本提取,以形成中间文件; 根据预设的匹配规则库中的文本匹配规则对中间文件中文本内容进行匹配,以将中间文件分类为条规类文件或非条规类文件; 对于条规类文件,根据层级标题正则表达式对文本内容进行识别,并将最低一级的标题下的条目内容形成一个知识块;对于中间文件中的表格内容对应的html格式文本,生成知识块;对于非条规类文件,利用语义分割的方式对文本内容进行分割,以形成知识块; 对形成的知识块进行检验和归档入库,并将检验异常的知识块,标记为告警知识块; 利用大模型将表格的知识块转化为自然语言描述的知识块; 根据告警知识块在中间文件中定位原文以及相关上下文,并基于大模型对告警知识块进行修正; 其中,根据预设的匹配规则库中的文本匹配规则对中间文件中文本内容进行匹配,以将中间文件分类为条规类文件或非条规类文件,包括: 将匹配成功的中间文件划分为条规类文件; 将匹配失败的中间文件输入至大模型进行进一步的判断: 在大模型的判断结果为属于条规类文件的情况下,生成中间文件对应的新的文本匹配规则,并对原本的匹配规则库进行更新。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人长江水利委员会网络与信息中心,其通讯地址为:430000 湖北省武汉市解放大道1863号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励