北京三快在线科技有限公司;华中科技大学白翔获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉北京三快在线科技有限公司;华中科技大学申请的专利一种训练模型以及字符检测的方法及装置获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN113205095B 。
龙图腾网通过国家知识产权局官网在2025-07-22发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202110392490.4,技术领域涉及:G06V30/148;该发明授权一种训练模型以及字符检测的方法及装置是由白翔;张文庆;邱阳;宋祺;姜仟艺;刘曦;张睿;廖明辉;魏晓林设计研发完成,并于2021-04-13向国家知识产权局提交的专利申请。
本一种训练模型以及字符检测的方法及装置在说明书摘要公布了:本说明书公开了一种训练模型以及字符检测的方法及装置。基于合成训练样本对标注模型进行训练,根据训练后的标注模型的输出对真实训练样本进行标注,并根据合成训练样本对字符检测模型进行训练。通过训练后的字符检测模型对待检测的图像进行特征提取,并确定该图像中各字符的包围框以及该图像中的各中心线。以及根据各中心线与各包围框的重叠程度、与同一中心线重叠的各包围框,确定包围框组,并根据各包围框组中各包围框的几何位置特征,对各中心线向周围进行膨胀得到各膨胀包围框,作为该图像的字符检测结果。可通过训练得到的字符检测模型输出准确的包围框以及中心线,以确定出准确的膨胀包围框,作为字符检测结果。
本发明授权一种训练模型以及字符检测的方法及装置在权利要求书中公布了:1.一种训练字符检测模型的方法,其特征在于,包括:从图像数据集中获取若干图像作为训练样本,并针对每个训练样本,确定该训练样本对应的图像中各字符的包围框为该训练样本的第一标签,以及确定该训练样本对应的图像中各字符串的中心线作为该训练样本的第二标签; 其中,该训练样本的第一标签还包括该训练样本对应的图像中各包围框内字符的类型;将该训练样本输入待训练的字符检测模型的特征提取网络,确定该训练样本对应的若干特征图;将该训练样本对应的若干特征图作为输入,输入所述待训练的字符检测模型的几何特征检测网络,得到各预测包围框以及各预测包围框内的图像在各预测类型维度上预测结果的置信度;以及输入所述待训练的字符检测模型的线特征检测网络,得到各预测中心线; 根据得到的各预测包围框与该训练样本的第一标签的差异确定第一损失,具体包括:确定得到的各预测包围框的几何位置特征以及各预测包围框内的图像在各预测类型维度上预测结果的置信度,并确定该训练样本的第一标签中各包围框的几何位置特征以及各包围框内的字符所属类型的特征值;针对每个预测包围框,根据该预测包围框的几何位置特征与该训练样本的第一标签中与该预测包围框对应的包围框的几何位置特征间的差异,确定该预测包围框的回归损失;根据该训练样本的第一标签中与该预测包围框对应的包围框所属类型的特征值,以及该预测包围框内的图像在各预测类型维度上预测结果的置信度,确定该预测包围框的分类损失;根据各预测包围框的回归损失以及各预测包围框的分类损失确定第一损失; 根据得到的各预测中心线与该训练样本的第二标签的差异确定第二损失,具体包括:根据得到的各预测中心线,确定包含各预测中心线的图像,作为该训练样本的中心线图;确定该训练样本的所述中心线图中各像素点的类型特征值;针对每个像素点,根据该像素点的类型特征值与该训练样本的第二标签中,该像素点对应的像素点的类型特征值,确定该像素点对应的损失;根据各像素点对应的损失,确定该训练样本的第二损失;根据所述第一损失以及所述第二损失,确定所述字符检测模型的总损失,以所述总损失最小为训练目标,调整所述待训练的字符检测模型的参数,所述字符检测模型用于确定待检测图像中的各字符的包围框以及各中心线,以根据各包围框对各中心线向周围进行膨胀,得到各膨胀包围框作为所述待检测图像的字符检测结果。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人北京三快在线科技有限公司;华中科技大学,其通讯地址为:100080 北京市海淀区北四环西路9号2106-030;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。