上海浦东发展银行股份有限公司刘天嘉获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉上海浦东发展银行股份有限公司申请的专利文本数据信息挖掘方法、装置、设备获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115374781B 。
龙图腾网通过国家知识产权局官网在2026-02-17发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202211025957.2,技术领域涉及:G06F40/289;该发明授权文本数据信息挖掘方法、装置、设备是由刘天嘉;甘竹红;李安奇;方宇洁设计研发完成,并于2022-08-25向国家知识产权局提交的专利申请。
本文本数据信息挖掘方法、装置、设备在说明书摘要公布了:本公开涉及语义挖掘技术领域,具体公开了一种文本数据信息挖掘方法、装置、计算机设备,所述方法包括:获取文本数据,对所述文本数据进行规则解析,提取各层级标题;建立所述各层级标题的父子级关系,并建立所述各层级标题与文本数据中的段落文本和图片路径的对应关系;根据所述段落文本获取所述段落文本的中心摘要;根据所述中心摘要与所述各层级标题获取关键词;根据所述文本数据和所述关键词进行实体拆解与识别,构建文本脉络图谱。本公开可以根据关键词和文本数据构建文本脉络图谱,在保证挖掘准确度的情况下实现了对文本数据的深度语义挖掘。
本发明授权文本数据信息挖掘方法、装置、设备在权利要求书中公布了:1.一种文本数据信息挖掘方法,其特征在于,所述方法包括: 获取文本数据,对所述文本数据进行规则解析,提取各层级标题; 建立所述各层级标题的父子级关系,并建立所述各层级标题与文本数据中的段落文本和图片路径的对应关系; 根据所述段落文本获取所述段落文本的中心摘要; 根据所述中心摘要与所述各层级标题获取关键词; 根据所述文本数据和所述关键词进行实体拆解与识别,构建文本脉络图谱; 所述根据所述段落文本获取所述段落文本的中心摘要,包括: 解析所述段落文本,从所述段落文本中抽取候选语句,组成候选语句池; 基于所述候选语句池中的候选语句注意力和词语注意力联合生成第一候选摘要; 对预先设置的摘要模板进行排序,确定候选摘要模板; 根据所述第一候选摘要和所述候选摘要模板结合生成所述中心摘要; 所述根据所述中心摘要与所述各层级标题获取关键词,包括: 对所述中心摘要和所述各层级标题进行分词分句处理,得到预测词; 基于所述预测词的语义依赖关系建立边,并进行实体关系提取生成语义网络; 根据所述中心摘要和所述各层级标题的权重分配,从所述语义网络中提取所述关键词; 所述解析所述段落文本,从所述段落文本中抽取候选语句,组成候选语句池,包括: 根据所述段落文本中语句的信息量,抽取所述信息量大于预设阈值的句子,组成所述候选语句池; 所述基于所述候选语句池中的候选语句注意力和词语注意力联合生成第一候选摘要包括: 在所述候选语句池中的所述候选语句的基础上输出生成式摘要,采取所述候选语句中单词的注意力和所述候选语句的注意力联合机制计算出最高得分的摘要,作为所述第一候选摘要。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人上海浦东发展银行股份有限公司,其通讯地址为:200001 上海市黄浦区中山东一路12号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励