华中科技大学彭勤牧获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉华中科技大学申请的专利一种基于深度学习的通用证件结构化识别方法和系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115713776B 。
龙图腾网通过国家知识产权局官网在2025-10-31发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202211409647.0,技术领域涉及:G06V30/413;该发明授权一种基于深度学习的通用证件结构化识别方法和系统是由彭勤牧;尤新革;胡亚宸设计研发完成,并于2022-11-10向国家知识产权局提交的专利申请。
本一种基于深度学习的通用证件结构化识别方法和系统在说明书摘要公布了:本发明涉及图像识别技术领域,尤其涉及一种基于深度学习的通用证件结构化识别方法和系统,方法包括:采集证件图像信息,并对采集到的图像进行预处理;将标准化的证件图像输入到文本检测网络中,对图像中的文本实例进行定位,并将位置信息保存到文件中;根据检测出的文本实例位置坐标,从证件图像中截取文本图像,并输入到文本识别网络进行识别,得到识别结果后,保存在位置信息之后;使用关键文本提取网络对识别结果中的文本实体进行分类,去除非关键类型,然后将分类结果保存到识别结果之后;将关键文本提取结果进行结构化处理并展示。本发明可以从复杂的证照图像中提取出关键文本信息,实现证件的智能识读,且适应于各种不同种类的证照。
本发明授权一种基于深度学习的通用证件结构化识别方法和系统在权利要求书中公布了:1.一种基于深度学习的通用证件结构化识别方法,其特征在于,包括: 采集证件图像信息,并对采集到的图像进行预处理,以获得标准化的证件图像; 将标准化的证件图像输入到文本检测网络中,对图像中的文本实例进行定位,并将位置信息保存到文件中; 根据检测出的文本实例位置坐标,从证件图像中截取文本图像,并输入到文本识别网络进行识别,得到识别结果后,保存在位置信息之后; 使用关键文本提取网络对识别结果中的文本实体进行分类,去除非关键类型,然后将分类结果保存到识别结果之后; 将关键文本提取结果进行结构化处理并展示,同时上传到业务系统中进行处理; 所述文本检测网络的结构包括:以DBNet为基础,使用ResNet18作为特征提取网络,并通过分组多路可选择卷积结构替换ResNet18中的常规3×3卷积结构;训练时,使用判别损失函数对特征提取输出的特征图进行监督; 所述文本识别网络的结构包括:以CRNN网络为基础,使用Transformer编码器作为序列建模模块代替CRNN网络中的BiLSTM模块,通过对输入特征进行掩码来训练Transformer编码器的语义建模能力;并将CVSM模块加入到文本识别网络中,为序列建模后得到的上下文特征与视觉特征分配不同的权重,得到联合特征,并进行解码输出; 所述关键文本提取网络使用文本图像和检测识别结果作为输入,包括特征编码、关系建模和特征解码三个部分; 所述特征编码具体包括:将文本实体的视觉图像、文本字符和位置坐标分别进行编码,然后通过相加的方式融合成为一个特征向量作为该文本实体的特征表示; 所述关系建模具体包括:通过BiLSTM对文本实体之间的关系进行建模,BiLSTM的输入为特征编码阶段的输出,在将特征编码向量输入到BiLSTM之前首先按照文本在证件中出现的相对顺序进行排序,即按照从上到下,从左至右的顺序排序,通过排序之后得到文本的特征序列,然后输入到BiLSTM中,学习特征序列各元素之间的相互关系以及顺序信息; 所述特征解码具体包括:在解码预测阶段,将文本提取任务看作对文本实体的分类任务,使用全连接层直接预测不同文本实体的各类别概率,然后通过softmax函数分别找出概率最大的类别,表示对应文本的分类结果。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人华中科技大学,其通讯地址为:430074 湖北省武汉市洪山区珞喻路1037号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励