Document
拖动滑块完成拼图
个人中心

预订订单
商城订单
发布专利 发布成果 人才入驻 发布商标 发布需求

请提出您的宝贵建议,有机会获取IP积分或其他奖励

投诉建议

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 积分商城 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 杭州浩联智能科技有限公司;杭州新中大科技股份有限公司徐澳获国家专利权

杭州浩联智能科技有限公司;杭州新中大科技股份有限公司徐澳获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉杭州浩联智能科技有限公司;杭州新中大科技股份有限公司申请的专利文件结构化信息的提取方法、装置、设备、介质和产品获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120849649B

龙图腾网通过国家知识产权局官网在2026-02-06发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202511358445.1,技术领域涉及:G06F16/583;该发明授权文件结构化信息的提取方法、装置、设备、介质和产品是由徐澳;张二青;徐宏设计研发完成,并于2025-09-23向国家知识产权局提交的专利申请。

文件结构化信息的提取方法、装置、设备、介质和产品在说明书摘要公布了:本发明公开了一种文件结构化信息的提取方法、装置、设备、介质和产品,涉及数据处理技术领域,包括:确定待处理文件的文件内容类型;在确定文件内容类型为图像内容文件的情况下,对待处理文件进行文本识别,确定待处理文件包含的待处理文本以及待处理文本在待处理文件中对应的文本区域坐标;对待处理文本进行结构化内容实体识别,确定待处理文本包含的结构化内容实体以及各结构化内容实体在文本区域坐标中分别对应的内容实体坐标;根据各内容实体坐标构建各结构化内容实体之间的内容实体关系数据,并根据内容实体关系数据对待处理文本进行结构化信息提取,得到待处理文件包含的目标结构化信息。本发明能够提升结构化信息提取的准确性及完整性。

本发明授权文件结构化信息的提取方法、装置、设备、介质和产品在权利要求书中公布了:1.一种文件结构化信息的提取方法,其特征在于,所述方法包括: 获取需提取结构化信息的待处理文件,并确定所述待处理文件的文件内容类型;其中,所述文件内容类型为文本内容文件或图像内容文件; 在确定所述文件内容类型为所述图像内容文件的情况下,对所述待处理文件进行文本识别,并根据文本识别结果确定所述待处理文件包含的待处理文本,以及,所述待处理文本在所述待处理文件中对应的文本区域坐标; 对所述待处理文本进行结构化内容实体识别,确定所述待处理文本包含的至少一种结构化内容实体,以及,各所述结构化内容实体在所述文本区域坐标中分别对应的内容实体坐标; 根据各所述内容实体坐标构建各所述结构化内容实体之间的内容实体关系数据,并根据所述内容实体关系数据对所述待处理文本进行结构化信息提取,得到所述待处理文件包含的目标结构化信息; 其中,所述根据所述内容实体关系数据对所述待处理文本进行结构化信息提取,得到所述待处理文件包含的目标结构化信息,包括: 从指令数据库中获取预设的结构信息提取指令,并将所述结构信息提取指令、所述待处理文本和所述内容实体关系数据,输入至大语言模型中; 通过所述大语言模型根据所述结构信息提取指令,利用所述内容实体关系数据从所述待处理文本中提取各所述结构化内容实体分别对应的结构化内容文本; 对具有内容实体关系的各所述结构化内容文本分别进行语义相似度计算,确定具有内容实体关系的各所述结构化内容文本之间的语义相似度; 根据所述语义相似度从具有内容实体关系的各所述结构化内容文本中确定语义相似内容文本,并对各所述语义相似内容文本进行文本关联,得到所述目标结构化信息。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人杭州浩联智能科技有限公司;杭州新中大科技股份有限公司,其通讯地址为:310015 浙江省杭州市拱墅区祥园路88号1幢1103室;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。