Document
拖动滑块完成拼图
个人中心

预订订单
商城订单
发布专利 发布成果 人才入驻 发布商标 发布需求

请提出您的宝贵建议,有机会获取IP积分或其他奖励

投诉建议

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 积分商城 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 山东舜德数据管理软件工程有限公司李冬燕获国家专利权

山东舜德数据管理软件工程有限公司李冬燕获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉山东舜德数据管理软件工程有限公司申请的专利一种基于大模型的金融知识库构建方法与系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN121031761B

龙图腾网通过国家知识产权局官网在2026-01-27发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202511562782.2,技术领域涉及:G06N5/022;该发明授权一种基于大模型的金融知识库构建方法与系统是由李冬燕;田茂圣;崔晓旭;杨春亮;张振宇;王琳设计研发完成,并于2025-10-30向国家知识产权局提交的专利申请。

一种基于大模型的金融知识库构建方法与系统在说明书摘要公布了:本发明涉及金融文本核查领域,具体涉及一种基于大模型的金融知识库构建方法与系统,包括文本转化,获得带有修正术语的第一语义单元和确定的第二语义单元,建立以所述第一语义单元为输入的场景-隐意双层修正模型,输出获得语义确定的第一语义单元以及场景标签,确定唯一定义;存在有待修正术语的所述第一语义单元中的术语于场景定义映射库无定义,建立目标词映射,基于语义相似度映射至显式语义;将各语义单元根据原始文本位置合并。本发明通过为多义术语绑定唯一定义,对场景定义映射库中无定义的隐意术语,通过语义相似度与共现频率分析实现显式化,有效消除金融语义的歧义与隐意解读难题,避免因语义混淆导致的知识库数据偏差甚至错误。

本发明授权一种基于大模型的金融知识库构建方法与系统在权利要求书中公布了:1.一种基于大模型的金融知识库构建方法,其特征在于,所述方法包括以下步骤: 步骤一:将非结构化文本、半结构化表格、图表进行转化,获得带有修正术语的第一语义单元和确定的第二语义单元,转化半结构化表格具体包括:识别表格中一级表头和二级表头的主体,并关联金融语义,形成主体加表头语义;建立行-列对应关系,单元格数据绑定至主体加表头语义,提取含计算关系表格的关联逻辑,形成含子句单元的结构化第一语义单元; 步骤二:建立以所述第一语义单元为输入的场景-隐意双层修正模型,以金融场景确定第一语义单元边界,并于第一语义单元边界内将存在有待修正术语的所述第一语义单元进行显式化处理,输出获得语义确定的第一语义单元以及场景标签; 所述场景-隐义双层修正模型具体包括: 预先定义包括一个大类以上的金融场景,每个所述金融场景均包括场景核心特征词集、场景权重矩阵,以及由每个场景下的核心特征词集中词集数量,与核心特征词集中所有词集的权重之和的商值所决定的标准指纹向量,以存在有待修正术语的所述第一语义单元为输入,生成维度与场景核心特征词集一致的向量,并作为场景指纹并确定金融场景; 步骤三:构建场景定义映射库,将待修正术语置于各金融场景中进行条件概率计算,确定唯一定义; 步骤四:存在有待修正术语的所述第一语义单元中的术语于场景定义映射库无定义,建立目标词映射,基于正则匹配、BERT语义相似度映射至显式语义; 所述步骤四包括以下具体步骤: 基于历史金融文本中无定义的术语建立定义-显式语义对基础库,每个无定义的术语关联包括场景标签、监管依据以及语义向量的三类元数据,并基于大模型生成候选显式语义,存储于基础库; 所述基于大模型生成候选显式语义,包括:基于BERT、BiLSTM模型识别含待修正术语的第一语义单元,将含待修正术语的第一语义单元拆解本体以及喻体特征,并将含待修正术语的第一语义单元的上下文作为金融场景; 在基础库中匹配该第一语义单元中待修正术语的候选显式语义,并以该第一语义单元中的喻体特征、本体以及上下文,并从该第一语义单元及上下文的文本中提取目标词候选,以及上下文术语; 预先通过BPE算法将核心特征词集中的每个词集建立Token序列,并按预定义的合并规则,将喻体特征中每个词拆分为词汇表中已有的子词,生成一个及以上的数字ID,通过BPE算法内的嵌入矩阵将所获得的数字ID转化为初始向量,其中数字ID是嵌入矩阵的行索引,通过索引取出对应行的多维向量,将初始向量通过线性变换矩阵获得最终的语义向量,计算其与目标词候选的余弦相似度,得到语义向量相似度; 统计喻体特征、目标词候选分别于该第一语义单元及其上下文中的出现频率,作为与目标词候选的关联强度,所述语义向量相似度与关联强度之和的最大值时的目标词候选作为喻体特征的候选显式语义,候选显式语义与大模型生成候选显式语义相同时,存储于基础库,不同则标记为人为确定; 步骤五:将各第一语义单元、第二语义单元根据原始文本位置合并,并按主体、场景标签以及时间的三维索存储于知识库内。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人山东舜德数据管理软件工程有限公司,其通讯地址为:250000 山东省济南市高新区新泺大街1166号3号楼602室;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。