作业帮教育科技(北京)有限公司蔡红获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉作业帮教育科技(北京)有限公司申请的专利图片校正方法、装置和页面检测模型的搭建方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN113591844B 。
龙图腾网通过国家知识产权局官网在2026-03-27发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202110837972.6,技术领域涉及:G06V30/146;该发明授权图片校正方法、装置和页面检测模型的搭建方法是由蔡红;王岩;杨森;安晟;王岩设计研发完成,并于2021-07-23向国家知识产权局提交的专利申请。
本图片校正方法、装置和页面检测模型的搭建方法在说明书摘要公布了:本发明属于图像处理技术领域,提供一种图片校正方法、装置和计算机设备,用于识别图片中的主体区域并对图片中的主体区域进行校正,所述方法包括:将所述图片的四个顶点作为参考点,采用回归计算确定若干定位关键点,该些定位关键点用于确定所述图片的主体区域;根据所述定位关键点,对所述主体区域进行识别并校正,以去除无关的信息并规范化所述主体区域。本发明通过图像定位回归模型识别待处理图片内的页面区域,能够更精确地识别出页面区域,同时能够更准确识别出待处理图片中有无页面区域,解决了因页面区域相对于图片倾斜、带有无关背景、非主体区域等影响因素引起的图像识别精度低的问题。
本发明授权图片校正方法、装置和页面检测模型的搭建方法在权利要求书中公布了:1.一种图片校正方法,其特征在于,包括: 将图片的四个顶点作为参考点,采用回归计算确定若干定位关键点,包括:使用训练好的图像定位回归模型获取图片的定位关键点的位置信息;其中,将图片输入到图像定位回归模型,图像定位回归模型使用图片的四个顶点作为参考点进行回归计算并转换输出图片中的主体区域的定位关键点的位置坐标和置信度,置信度表示输出的定位关键点坐标的可靠概率;以及,将相邻定位关键点相互连线围成图片的主体区域,主体区域包括页面区域,若干定位关键点包括页面的四个顶点; 图像定位回归模型的建立和训练,包括:搭建初始的图像定位回归模型,标注样本数据建立训练数据集,使用样本数据对初始的图像定位回归模型进行训练;包括: 计算模型预测的groundtruthboxGT框为相对于预定义框的偏移量,的第一个顶点计算如下: 其中,是一个顶点的横坐标值,是该一个顶点地纵坐标值;w和h分别为图片的长和宽;为定义好的超参数; 在模型的输出,对应的回归loss损失值如下; 标注样本数据包括对样本图片是否包含页面区域进行数据标注并对所包含的页面区域的四个顶点进行标注,以标注出样本图片为题目图片还是非题目图片或者以标注出样本图片中主体区域的定位关键点以及是否包含主体区域,当样本图片中主体区域为页面区域时对样本图片进行数据标注具体包括:当样本图片的页面区域均位于样本图片内时直接将页面的四个顶点标注为定位关键点,当样本图片的页面区域部分位于样本图片之外时根据位于样本图片内的页面的顶点和页面的边线与样本图片的边线的交点来推算出位于样本图片之外的页面的顶点的位置,包括:标注出样本图片的位于图片内的顶点,和,页面的边线与样本图片的边线的交点; 遍历样本图片的所有标注点,依次判断相邻两个标注点是否同时位于同一样本图片边线,标注点包括位于样本图片内的顶点和交点; 在判断为相邻两个标注点是同时位于同一样本图片边线时,继续判断相邻两个标注点所在的两条页面区域的边线延长相交所形成的夹角是否满足大于等于第一阈值角度; 在夹角满足大于等于第一阈值角度时,将相邻两个标注点标记为非顶点,并将两个非顶点对应的两条页面区域的边线延长相交后形成的交汇点标注为页面区域的位于图片外的预测顶点,同时删除该两个标记为非顶点的标注点,最后得到标注有四个定位关键点的样本图片; 根据所述定位关键点,对所述主体区域进行识别,进行方向校正,以去除无关的信息并规范化所述主体区域。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人作业帮教育科技(北京)有限公司,其通讯地址为:100085 北京市海淀区上地信息产业基地开拓路1号4层4002;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励