浙江华东工程数字技术有限公司;中国电建集团华东勘测设计研究院有限公司周登继获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉浙江华东工程数字技术有限公司;中国电建集团华东勘测设计研究院有限公司申请的专利一种纸质水文年鉴表格结构化识别方法、设备和存储介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119919953B 。
龙图腾网通过国家知识产权局官网在2025-12-16发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510415351.7,技术领域涉及:G06V30/412;该发明授权一种纸质水文年鉴表格结构化识别方法、设备和存储介质是由周登继;刘国阳;何栓康;朱斌;吕小帅设计研发完成,并于2025-04-03向国家知识产权局提交的专利申请。
本一种纸质水文年鉴表格结构化识别方法、设备和存储介质在说明书摘要公布了:本发明提供了一种纸质水文年鉴表格结构化识别方法,包括如下步骤:获取纸质水文年鉴的扫描文件并转换为图片文件;获取每张转换后的图片文件中的表格图像及其属性信息;对获取的表格图像进行图像预处理、校正和超分辨率转换;对转换后的表格图像进行直线检测,生成表格单元格;对生成的表格单元格进行合并单元格及多层嵌套结构的识别;识别表格图像中的文字,获取每个文字区域的边界框,并将获取的文字区域的边界框与其最近邻的单元格进行匹配;将文字匹配后的单元格的坐标转换成行列序号,映射至Excel表格形式,并将文字识别结果填充至Excel表格单元格中;对填充后的Excel表格进行通用校验和水文年鉴数据合规性校验,并于校验通过后作为最终识别结果。
本发明授权一种纸质水文年鉴表格结构化识别方法、设备和存储介质在权利要求书中公布了:1.一种纸质水文年鉴表格结构化识别方法,其特征在于,包括如下步骤: 获取纸质水文年鉴的扫描文件并转换为图片文件; 获取每张转换后的图片文件中的表格图像及其属性信息,所述属性信息至少包括表格图像的标题文字信息和页码信息; 对获取的表格图像进行图像预处理,并进行校正和超分辨率转换; 对转换后的表格图像进行直线检测,并基于直线检测结果生成表格单元格,包括:在所述表格图像上缺失表格线的位置添加表格框线,具体包括从第一行开始遍历表格图像的所有行,计算每一行中非空白像素之间的距离;对于某一行,如果存在距离在预设距离范围内且不相邻的像素对,且存在的该类像素对超出预设数量阈值,则判定该行为文字行,否则为非文字行;应用形态学闭运算,去除非文字行的黑点或者黑色线段;通过OpenCV的连通区域算子计算连通区域,获取连通区域的高度信息,并将连通区域按照高度的从大到小进行排序;对于文字行,通过OpenCV的连通区域算子计算连通区域,获取每个连通区域的高度,去除前预设比例的最大行高和后预设比例的最小行高,其余连通区域计算平均高度,作为文字行高;将非文字行的连通区域逐个与文字行高对比,如果高度小于文字行高,则在非文字行的连通区域的一半高度绘制一条直线,反之不划线,得到添加了表格框线的表格图像;采用形态学膨胀算法对原始表格图像进行预处理,使表格图像中的虚线和点虚线变得连续形成完整的线条,并在预处理后的图像中进行直线检测;采用基于距离和角度的直线合并策略对检测出的直线进行合并得到表格线;基于检测到的表格线,计算所有表格线的交点,并基于交点生成单元格; 对生成的表格单元格进行合并单元格及多层嵌套结构的识别,其中合并单元格识别包括: 对于水平表格线,检查是否存在多个交点在垂直方向上具有相同的x坐标;对于垂直表格线,检查是否存在多个交点在水平方向上具有相同的y坐标; 如果检测到符合条件的多个交点,则判定存在跨行或跨列的合并单元格; 对于跨行的合并单元格,找到符合条件的多个交点的最小和最大y坐标,将其作为单元格的上下边界;对于跨列的合并单元格,找到符合条件的多个交点的最小和最大x坐标,将其作为单元格的左右边界; 基于OCR技术识别表格图像中的文字,获取每个文字区域的边界框,并将获取的文字区域的边界框与其最近邻的单元格进行匹配; 将文字匹配后的单元格的坐标转换成行列序号,映射至Excel表格形式,并将文字识别结果填充至Excel表格单元格中; 对填充后的Excel表格进行通用校验和水文年鉴数据合规性校验,并于校验通过后作为最终识别结果,所述水文年鉴数据合规性校验包括如下校验的多项或全部: 对于逐日降水量表,在数值区域验证所有单元格是否为合法字符,在统计值区域验证降水量是否与对应月相符合、验证降水日数是否正确、验证最大日量是否与数值区域一致、验证年统计与数值区域的总和是否一致; 对于各时段最大降水量表,验证所有字符是否为合法字符、验证站名是否存在、验证长时段降水量是否大于等于短时段最大降水量。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人浙江华东工程数字技术有限公司;中国电建集团华东勘测设计研究院有限公司,其通讯地址为:311106 浙江省杭州市余杭区余杭街道文一西路1818-2号9幢301室;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励