清华大学;上海浦东发展银行股份有限公司刘长松获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉清华大学;上海浦东发展银行股份有限公司申请的专利图像文字行检测方法及装置获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115311667B 。
龙图腾网通过国家知识产权局官网在2025-12-30发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202210922795.6,技术领域涉及:G06V30/412;该发明授权图像文字行检测方法及装置是由刘长松;王言伟;杨诚;孙月芳;李捷;张玉琦;张瑞雪;张琛设计研发完成,并于2022-08-02向国家知识产权局提交的专利申请。
本图像文字行检测方法及装置在说明书摘要公布了:本发明提供一种图像文字行检测方法及装置,该方法包括:获取待检测票据图像;将票据图像输入训练后的文字行检测模型,经特征提取网络提取特征后,分别输入首次打印分支和二次打印分支,并分别输出首次打印文本与背景的分类结果,和二次打印文本与背景的分类结果;其中,首次打印分支和二次打印分支从输入到输出方向的顺序均依次包括卷积层、特征融合层和反卷积层;首次打印分支和二次打印分支的特征融合层,均用于融合首次打印分支卷积层和二次打印分支卷积层处理的特征图,并分别输入所属分支的反卷积层。该方法通过特征融合以及两次打印文字行的分类,实现首次打印和二次打印文本信息的准确判断,提高两次打印信息识别后的关键信息抽取准确度。
本发明授权图像文字行检测方法及装置在权利要求书中公布了:1.一种图像文字行检测方法,其特征在于,包括: 获取待检测的票据图像; 将所述待检测的票据图像输入训练后的文字行检测模型,经特征提取网络提取特征后,将提取的特征分别输入首次打印分支和二次打印分支,并分别输出首次打印文本与背景的分类结果,和二次打印的文本与背景的分类结果; 其中,所述首次打印分支和二次打印分支从输入到输出方向的顺序均依次包括卷积层、特征融合层和反卷积层;首次打印分支和二次打印分支的特征融合层,均用于融合首次打印分支卷积层和二次打印分支卷积层处理的特征图,并分别输入所属分支的反卷积层;所述文字行检测模型,根据标记首次打印文本、二次打印文本与背景的样本票据图像训练后得到; 所述获取待检测的票据图像之前,还包括: 根据标记首次打印文本、二次打印文本与背景的样本票据图像,基于首次打印损失函数对所述首次打印分支进行训练; 其中,所述首次打印损失函数根据第一部分损失函数、第二部分损失函数和第三部分损失函数确定;所述第一部分损失函数根据首次打印分支对样本票据图像的首次打印文本和背景的分类输出、首次打印文本和背景的分类标签和首次打印文本的文字行区域mask权重确定,所述第二部分损失函数为样本票据图像中首次打印文字行没有与二次打印文本粘连部分的损失函数,所述第三部分损失函数为样本票据图像中首次打印文本和二次打印文本粘连部分对应的损失函数; 所述获取待检测的票据图像之前,还包括: 根据标记首次打印文本、二次打印文本与背景的样本票据图像,基于二次打印损失函数对所述二次打印分支进行训练; 其中,所述二次打印损失函数根据第四部分损失函数、第五部分损失函数和第六部分损失函数确定;所述第四部分损失函数根据二次打印分支对样本票据图像的二次打印文本和背景的分类输出、二次打印文本和背景的分类标签和二次打印文本的文字行区域mask权重确定,所述第五部分损失函数为样本票据图像中首次打印文字行没有与二次打印文本粘连部分的损失函数,所述第六部分损失函数为样本票据图像中首次打印文本和二次打印文字行粘连部分对应的损失函数。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人清华大学;上海浦东发展银行股份有限公司,其通讯地址为:100084 北京市海淀区双清路30号清华大学清华园北京100084-82信箱;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励