Document
拖动滑块完成拼图
个人中心

预订订单
商城订单
发布专利 发布成果 人才入驻 发布商标 发布需求

请提出您的宝贵建议,有机会获取IP积分或其他奖励

投诉建议

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 积分商城 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 上证所信息网络有限公司顾鑫鑫获国家专利权

上证所信息网络有限公司顾鑫鑫获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉上证所信息网络有限公司申请的专利一种基于规则语料库的文本规范标记方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN121072515B

龙图腾网通过国家知识产权局官网在2026-01-27发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202511595819.1,技术领域涉及:G06F40/205;该发明授权一种基于规则语料库的文本规范标记方法及系统是由顾鑫鑫;赵洋明;李小明;何曾樑;陆旸;姜璐璐;陈艺文;吕俊楠;胡晨;邢晓文设计研发完成,并于2025-11-04向国家知识产权局提交的专利申请。

一种基于规则语料库的文本规范标记方法及系统在说明书摘要公布了:本申请涉及文本标签标记技术领域,提供一种基于规则语料库的文本规范标记方法及系统,该方法包括:解析政策法规文件,识别并标记其中的条件语素和结论语素,利用大语言模型构建两者间的逻辑关系,形成由结构化语素对组成的规则语料库;对语料库进行语义嵌入生成语义向量库;基于规则语料库对验证数据集进行多标签编码,构建多标签训练数据集;以语义向量为特征、多标签为目标训练深度学习分类模型,得到文本规范标记模型;利用该模型对目标文本进行自动化标记。本申请显著提升了文本标记的准确性、可解释性和业务适应性,并提高了系统标签数据集的更新质量,降低了系统维护成本。

本发明授权一种基于规则语料库的文本规范标记方法及系统在权利要求书中公布了:1.一种基于规则语料库的文本规范标记方法,其特征在于,包括以下步骤: S1:解析规则文本,识别并标记规则文本中的条件语素和结论语素,其中,所述条件语素为规则文本中为结论成立提供前提条件的关键词或词组,所述结论语素为规则文本中表征最终判定、结果或要求的关键词或词组,通过大语言模型分析并构建所述条件语素与结论语素之间的逻辑关系,以形成由结构化语素对组成的规则语料库,其中每个语素对用于表征从条件到结论的映射关系,并至少包含语素位置、词性、逻辑连接词; S2:通过分词器和预训练语言模型,对所述规则语料库中的结构化语素对进行语义嵌入,围绕语素对生成相关语义向量库; S3:根据需求目标要求,匹配规则语料库中的标准标签,对需求相关多种文本类型的验证数据集进行多标签编码,构建多标签训练数据集,以备后续实现与所述语义向量库建立索引关联; S4:将所述语义向量库中的语义向量与所述多标签训练数据集中对应的标签关联,以所述语义向量作为训练特征,并以所述标签作为训练目标,对深度学习分类模型进行训练,获得端到端的文本规范标记分类模型; S5:将目标文本输入至所述端到端分类模型,获取模型输出的一个或多个概率值高于预设阈值的文本规范标记; 所述S1步骤还包括:根据规则文本之间的引用关系以及规则文本所属的领域,对所述规则语料库进行归类,并为语料补充分类属性和溯源属性, 所述结构化语素对表示为,其中: :第个语素对的条件语素序列,为第个条件语素,为该序列长度; :第个语素对的结论语素序列,为第个结论语素,为该序列长度; :语素对元信息,其中: ,表示语素在规则文本中的位置坐标; ,表示语素的词性标注; ,表示条件语素与结论语素的逻辑连接词; ,表示语素对的溯源属性; 规则语料库为所有结构化语素对的集合: ,其中为规则语料库中语素对的总数量。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人上证所信息网络有限公司,其通讯地址为:201203 上海市浦东新区中国(上海)自由贸易试验区张东路1387幢37号101(复式);或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。