北京汉仪创新科技股份有限公司;上海驿创信息技术有限公司刘溪获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉北京汉仪创新科技股份有限公司;上海驿创信息技术有限公司申请的专利一种自然场景下的文本检测方法、系统、设备和介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115147844B 。
龙图腾网通过国家知识产权局官网在2025-09-09发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202210724281.X,技术领域涉及:G06V30/148;该发明授权一种自然场景下的文本检测方法、系统、设备和介质是由刘溪设计研发完成,并于2022-06-23向国家知识产权局提交的专利申请。
本一种自然场景下的文本检测方法、系统、设备和介质在说明书摘要公布了:本公开涉及文本检测领域,提供一种自然场景下的文本检测方法、系统、设备和介质,所述方法包括:将文本实例的损失函数Lc、缩小后的文本实例的损失函数Ls和最大比例缩小后的文本实例的像素链损失函数Llink作为整体损失函数L,将所述整体损失函数L作为resNet+FPN特征金字塔网络模型的损失函数;对所述resNet+FPN特征金字塔网络模型进行训练;将自然场景下的文本图像输入训练后的resNet+FPN特征金字塔网络模型实现文本检测。本公开可以很好的适应各类场景和文本布局,特别是在文本行中字符间隔较大和文本行靠近的情况有很好的表现。
本发明授权一种自然场景下的文本检测方法、系统、设备和介质在权利要求书中公布了:1.一种自然场景下的文本检测方法,其特征在于,包括以下步骤: 将文本实例的损失函数Lc、缩小后的文本实例的损失函数Ls和最大比例缩小后的文本实例的像素链损失函数Llink作为整体损失函数L,将所述整体损失函数L作为resNet+FPN特征金字塔网络模型的损失函数;其中,所述resNet+FPN特征金字塔网络模型的输出层有14个通道,其中前5个通道为文本核通道,第6个通道为文本实例通道,后8个通道为‘像素链’通道;8个通道分别表示像素邻域的8像素都属于同一个文本实例; 对所述resNet+FPN特征金字塔网络模型进行训练,包括所述resNet+FPN特征金字塔网络模型的后八个通道对应的8个标签对应像素的8个邻居像素位置分别为:topleft,top,topright,left,right,bottomleft,bottom,bottomright; , n∈[topleft,top,toprignt,left,right,bottomleft,bottom,bottomright],其中表示‘像素链’标签在x,y位置的值,n表示邻居类别,S min x n ,y n 表示最小轮廓标签在x n ,y n 的值,x n ,y n 代表x,y位置的邻居像素位置; 将自然场景下的文本图像输入训练后的resNet+FPN特征金字塔网络模型实现文本检测。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人北京汉仪创新科技股份有限公司;上海驿创信息技术有限公司,其通讯地址为:100089 北京市海淀区翠微路2号院五区2号楼二层201;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。