Document
拖动滑块完成拼图
个人中心

预订订单
商城订单
发布专利 发布成果 人才入驻 发布商标 发布需求

请提出您的宝贵建议,有机会获取IP积分或其他奖励

投诉建议

在线咨询

联系我们

龙图腾公众号
专利交易 积分商城 国际服务 IP管家助手 科技果 科技人才 商标交易 会员权益 需求市场 关于龙图腾 更多
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 北京中科建友科技股份有限公司王小梅获国家专利权

北京中科建友科技股份有限公司王小梅获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉北京中科建友科技股份有限公司申请的专利一种基于自监督学习的档案信息提取与智能管理系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN121304093B

龙图腾网通过国家知识产权局官网在2026-03-17发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202511862029.5,技术领域涉及:G06Q10/10;该发明授权一种基于自监督学习的档案信息提取与智能管理系统是由王小梅;李勇设计研发完成,并于2025-12-11向国家知识产权局提交的专利申请。

一种基于自监督学习的档案信息提取与智能管理系统在说明书摘要公布了:本发明公开了一种基于自监督学习的档案信息提取与智能管理系统,包括如下模块:采集预处理模块,用于采集档案原始数据并生成版面样本数据集及原文映射表;自监督预训练模块,用于获得三模态统一编码器模型;文档解析模块,用于文本检测、字符识别与表格结构恢复,生成文档解析数据集;信息抽取模块,用于指针定位与最优传输对齐,输出元数据与关系数据集并登记证据条目;对齐入库模块,用于基于结构增强双塔向量召回生成标准化记录库与证据链接表;策略运维模块,用于权限控制、脱敏、归档与增量更新。本发明通过三模态自监督与证据链结合,实现档案要素的精准抽取、对齐入库与可追溯管理。

本发明授权一种基于自监督学习的档案信息提取与智能管理系统在权利要求书中公布了:1.一种基于自监督学习的档案信息提取与智能管理系统,其特征在于,包括如下模块: 采集预处理模块,用于采集档案原始数据集,执行几何回归校正、同态去噪与自注意力版面分割,生成版面样本数据集,并建立原文映射表; 自监督预训练模块,用于对版面样本数据集进行掩码布局重建与跨视图对比自监督训练,构建包含文本子编码器、视觉子编码器与坐标嵌入模块的三模态统一编码器模型,在融合层对三路特征进行对齐与聚合,输出处于同一表示空间的页级向量与块级向量; 文档解析模块,用于基于三模态统一编码器模型,进行可微边界优化文本检测、字符识别、表格结构恢复与印章手写体解析,生成文档解析数据集,并与原文映射表关联; 信息抽取模块,用于基于文档解析数据集及原文映射表,使用包含指针网络跨度定位、条件随机场序列标注与最优传输字段对齐的信息抽取模型,输出实体集合、字段值映射与配对置信度并登记证据条目索引形成元数据,并基于实体集合构建实体关系图,按同段落邻接与跨块邻接进行消息传递与联合分类得到实体关系三元组,形成关系数据集; 对齐入库模块,用于读取元数据与关系数据集与知识图谱库,构建结构增强双塔向量召回模型,查询端编码器与候选端编码器均为基于自注意力的变换器编码器,参数不共享,输入由文本标记与二维相对坐标与块类型嵌入组成,经多头注意力与前馈网络得到序列表征,再以加权公共标记池化产生全局向量,同时以字段名或字段模板为种子生成字段锚点序列并经同一路径得到字段锚点向量,所有向量经层归一化与范数归一化处理并保持页面坐标与块标识引用,建立小世界图索引与乘积量化索引,生成标准化记录库与证据链接表; 策略运维模块,用于基于标准化记录库与证据链接表与原文映射表,实施权限控制、脱敏、自动归档、借阅审批与到期提醒,记录校对并生成伪标签回流以供周期性增量更新。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人北京中科建友科技股份有限公司,其通讯地址为:100000 北京市海淀区学清路10号院1号楼17层101;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。