腾讯科技(深圳)有限公司胡益清获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉腾讯科技(深圳)有限公司申请的专利文档图片内容的排序方法、装置、电子设备及存储介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115114468B 。
龙图腾网通过国家知识产权局官网在2025-07-29发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202210351128.7,技术领域涉及:G06F16/54;该发明授权文档图片内容的排序方法、装置、电子设备及存储介质是由胡益清;李鑫;刘兵;刘畅;姜德强设计研发完成,并于2022-04-02向国家知识产权局提交的专利申请。
本文档图片内容的排序方法、装置、电子设备及存储介质在说明书摘要公布了:本公开提供了一种文档图片内容的排序方法、装置、电子设备及存储介质,可应用于云技术、人工智能、智慧交通、辅助驾驶等各种场景。所述方法包括:对多个文档元素的图像特征和位置特征进行融合,得到多个文档元素的融合特征;基于多个文档元素的融合特征,确定多个文档元素中任意两个文档元素之间的位置关系;基于多个文档元素中任意两个文档元素之间的位置关系,确定多个文档元素的排序序号。本公开的方法对于不同版面格式的文档图片均能获取到较佳的排序效果。
本发明授权文档图片内容的排序方法、装置、电子设备及存储介质在权利要求书中公布了:1.一种文档图片内容的排序方法,其特征在于,所述方法包括: 调用文档元素识别模型,对待排序的文档图片进行识别,得到多个文档元素的文档检测框,所述文档元素为构成文档图片内容的最小单位,所述文档元素包括图片、表格、文本行、页眉页脚、分割线中的至少一种,所述待排序的文档图片通过对纸质文档进行拍照得到; 对各个文档元素的文档检测框进行尺寸归一化处理,使得不同文档元素的文档检测框具有相同的尺寸; 基于归一化的文档检测框,提取多个文档元素的预设维度的图像特征和原始维度的原始位置特征,所述图像特征包括纹理特征、亮度、对比度中的至少一项; 通过融合网络,将所述原始位置特征的原始维度转换为所述预设维度,得到多个文档元素的位置特征; 对于任一文档元素,在所述文档元素的类型为非文本行的情况下,将所述文档元素的图像特征和位置特征进行拼接,得到所述文档元素的融合特征;在所述文档元素的类型为文本行的情况下,获取所述文档元素所在的文本块的图像特征和位置特征,将所述文档元素的图像特征、所述文档元素的位置特征、所述文本块的图像特征及所述文本块的位置特征进行拼接,得到所述文档元素的融合特征;所述融合特征为表征所述文档图片的版面格式和所述文档元素之间相关性的特征; 基于所述多个文档元素中每个文档元素的融合特征,确定所述多个文档元素中任意两个文档元素之间的位置关系; 基于所述多个文档元素中任意两个文档元素之间的位置关系,确定所述多个文档元素的排序序号; 将属于同一文本块的各个文档元素进行合并,得到多个文本块; 针对于所述多个文本块中的任一文本块,计算所述文本块内各个文档元素的排序序号的序号中值;将所述序号中值作为所述文本块的排序序号; 按照排序序号由小到大的顺序,为所述多个文档元素中类型为非文本行的文档元素以及所述多个文本块重新确定排序序号; 基于所述多个文档元素的排序序号,将所述多个文档元素的内容添加到空白文档的相应位置上,得到与所述纸质文档内容相同且可编辑的电子文档。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人腾讯科技(深圳)有限公司,其通讯地址为:518057 广东省深圳市南山区高新区科技中一路腾讯大厦35层;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。