兴业银行股份有限公司;兴业数字金融服务(上海)股份有限公司周凌飞获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉兴业银行股份有限公司;兴业数字金融服务(上海)股份有限公司申请的专利基于OCR和NLP技术的绿色金融属性智能认定方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115953788B 。
龙图腾网通过国家知识产权局官网在2025-07-29发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202211536575.6,技术领域涉及:G06V30/18;该发明授权基于OCR和NLP技术的绿色金融属性智能认定方法及系统是由周凌飞;张笑冬;何平设计研发完成,并于2022-12-02向国家知识产权局提交的专利申请。
本基于OCR和NLP技术的绿色金融属性智能认定方法及系统在说明书摘要公布了:本发明提供了一种基于OCR和NLP技术的绿色金融属性智能认定方法及系统,包括:步骤S1:进行图像信息提取和识别,得到非结构化字符数据信息;步骤S2:将非结构化字符数据信息进行数据结构化构建,得到标准化结构字符数据;步骤S3:将标准化结构字符数据进行文本数据预处理,并得到词向量或者矩阵形式的数据;步骤S4:文本词向量输入全连接网络进行分析,得到具体属性分类结果。本发明可以高效地分析相关材料的文档信息,并给出有价值的参考指标;本发明给向银行工作人员提供一种快捷高效地金融属性认定服务;本发明利用OCR和NLP技术提高银行客户的绿色金融贷款的审查效率。
本发明授权基于OCR和NLP技术的绿色金融属性智能认定方法及系统在权利要求书中公布了:1.一种基于OCR和NLP技术的绿色金融属性智能认定方法,其特征在于,包括: 步骤S1:进行图像信息提取和识别,得到非结构化字符数据信息; 步骤S2:将非结构化字符数据信息进行数据结构化构建,得到标准化结构字符数据; 步骤S3:将标准化结构字符数据进行文本数据预处理,并得到词向量; 步骤S4:文本词向量输入全连接网络进行分析,得到具体属性分类结果; 在所述步骤S1中: 用户提供的数据包括结构化数据和非结构化数据;其中非结构化数据的处理需要添加辅助检测模型,对非结构的图像数据进行预检测,将模型判别的各个检测框进行结构化还原,转化为具有结构关系的模板数据后与结构化数据一同输入后端的提取识别模型; 在数据的提取识别阶段,对各个关键字段进行文字识别,将每个图像文字识别为对应计算机字符;在文字识别中应用识别神经网络模型,在有印章和水印遮挡情况下识别关键字段信息,得到的非结构化字符数据信息将传入下一个模块进行数据结构化; 在所述步骤S3中: 文本数据预处理: 通过NLP智能模型将标准化结构字符数据进行字词分析和命名实体的识别工作,对字符数据进行数据清洗去除无效字符,限制文本最大长度输入,如果有超出长度的部分采用切片输入的方式,得到文本长度一致的标准数据; 文本的词向量表示: 将文本长度一致的标准数据进行转换得到词向量,利用预训练的词嵌入模型将文本分词转化为稠密低维的词向量,并设置神经元失活系数,消减过拟合的情况,设计指标项信息抽取的端到端解决方案,通过对预定义的指标项的数据标注,由神经网络训练得到给定指标项标签的文本内容。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人兴业银行股份有限公司;兴业数字金融服务(上海)股份有限公司,其通讯地址为:350014 福建省福州市台江区江滨中大道398号兴业银行大厦;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。