陕西汇晟时空信息技术有限公司谢高尚获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉陕西汇晟时空信息技术有限公司申请的专利一种档案管理系统及其档案分类编码方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120218543B 。
龙图腾网通过国家知识产权局官网在2025-12-23发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510353748.8,技术领域涉及:G06Q10/0631;该发明授权一种档案管理系统及其档案分类编码方法是由谢高尚;霍梅;秦碧龙;张坤;谢淑弟;徐苍翔;董雪艳设计研发完成,并于2025-03-25向国家知识产权局提交的专利申请。
本一种档案管理系统及其档案分类编码方法在说明书摘要公布了:本申请涉及一种档案管理系统及其档案分类编码方法,属于文件管理技术领域;通过由设有档案扫描模块、档案编码模块的档案登记端,设有多个档案存储柜、档案云端和档案销毁模块的档案存储库,设有电子档案调阅模块、实体档案调阅模块和调阅记录模块的档案调阅端,大大提升了档案管理的自动化水平和操作便捷性;其次,档案扫描模块结合基于RoBERTa‑wwm‑ext的档案分类模型,提高了档案分类的准确性,此外,档案编码模块采用结构化的编号方式,结合档案分类、存储位置和唯一标识符,生成了具有高度可读性和唯一性的档案编号,便于档案的检索和管理;环境监测模块的集成,通过实时监控和调节档案室的环境参数,有效防止了因环境因素导致的档案损坏。
本发明授权一种档案管理系统及其档案分类编码方法在权利要求书中公布了:1.一种档案分类编码方法,其特征在于:包括档案分类和档案编号两个步骤; 在档案分类中: 步骤A1:数据准备,收集通过光学字符识别技术提取的电子档案,进行数据预处理,做数据清洗、分词; 步骤A2:特征提取,将步骤1准备好的文本数据转化为计算机可理解的数值,从不同类型档案文本中提取出能够反映其语义信息的特征向量;加载RoBERTa-wwm-ext预训练模型及其对应的分词器,使用RoBERTa-wwm-ext的分词器对清洗和分词后的档案文本进行编码,将每个词token转换为模型词汇表中对应的ID,对于超出词汇表的词Out-of-Vocabulary,OOV,使用特殊标记[UNK]表示;将编码后的档案文本输入RoBERTa-wwm-ext模型,获取每个token的隐藏状态hiddenstates,RoBERTa-wwm-ext模型的输出是一个隐藏状态矩阵: ; 其中,是所有token的隐藏状态矩阵,是档案文本的token数量,是第个token的隐藏状态,维度为768; 从隐藏状态矩阵中提取[CLS]标记对应的隐藏状态,作为整个档案文本的全局语义表示,[CLS]标记的隐藏状态经过预训练模型的优化,能够捕捉档案文本的整体语义信息;每个档案文本样本的特征向量为: ; 其中,是[CLS]标记的隐藏状态,维度为768; 构建特征矩阵:将所有样本的[CLS]标记的隐藏状态拼接成一个特征矩阵X,作为分类模型的输入特征: ; 其中,是特征矩阵,是档案数据样本的数量,是第个样本的特征向量; 步骤A3:分类模型设计;分类模型的结构包括RoBERTa-wwm-ext模型、池化层和全连接层,RoBERTa-wwm-ext模型用于生成档案文本的上下文表示,池化层对RoBERTa-wwm-ext的输出进行池化,提取全局特征,全连接层将池化后的特征映射到分类标签空间,输出类别概率; 步骤A4:模型训练,将数据集划分为训练集、验证集和测试集,使用训练集训练模型,设置学习率、批量大小、训练轮数的超参数,通过交叉熵损失函数计算模型预测值与真实标签的差异,使用Adam优化器通过一阶矩估计和二阶矩估计来更新模型参数,并在验证集上评估模型性能,在测试集上测试其准确率;交叉熵损失函数公式为: ; 其中,为交叉熵损失,为训练集档案数据样本的数量,为档案类别数量,为真实标签,表示第个样本是否属于第个类别,当样本属于类别时,为1,否则为0,为模型预测样本属于类别的概率; 步骤A5:模型部署,将训练好的模型部署为RESTfulAPI,供档案扫描模块调用,接收档案文本并返回分类结果; 步骤A6:持续学习,设置定期任务,收集新入库的档案数据,使用新数据更新模型参数,同时防止对已有知识的遗忘; 在档案编号中: 步骤S1:制定档案编号结构:年份-分类编码-档案存储编码-唯一标识码; 其中,年份为档案通过档案扫描模块完成扫描的时间,用4位数字表示; 分类编码为通过档案分类模型生成的代码,用2-3位字母表示; 档案存储编码为档案存储库为实体档案分配的储存位置代码,用1位字母+2位数字表示; 唯一标识码为某一档案存储柜内的档案顺序代码,用3位数字表示; 步骤S2:档案编号生成; 步骤S21:访问调阅记录模块获取档案扫描时间; 步骤S22:通过档案分类模型对档案进行分类,获取分类编码; 步骤S23:访问档案存储库获取为实体档案分配的储存位置代码和该档案存储柜内的档案顺序代码; 步骤S24:结合年份、分类编码档案存储编码和唯一标识符,生成最终档案编号; 步骤S3:档案编号录入,将档案编号录入电子档案文本中,同时为实体档案制作NFC标签,将档案编码写入NFC标签中。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人陕西汇晟时空信息技术有限公司,其通讯地址为:710000 陕西省西安市高新区瞪羚路26号西安理工大学科技园C座501、503;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励