甘肃集优品网络科技有限公司宋丽君获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉甘肃集优品网络科技有限公司申请的专利一种基于机器学习的档案数据自动分类方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN121211129B 。
龙图腾网通过国家知识产权局官网在2026-03-03发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202511741320.7,技术领域涉及:G06F18/241;该发明授权一种基于机器学习的档案数据自动分类方法及系统是由宋丽君;宁兴龙;王霞;张勤国;李烨设计研发完成,并于2025-11-25向国家知识产权局提交的专利申请。
本一种基于机器学习的档案数据自动分类方法及系统在说明书摘要公布了:本发明公开了一种基于机器学习的档案数据自动分类方法及系统,包括如下步骤:步骤一:采集档案本体数据和行为轨迹数据;步骤二:获取文本、图像和结构向量;步骤三:将行为轨迹数据按时间顺序排列,输入至改进TS2Vec模型,并引入多视图行为投影机制,输出行为残影向量;步骤四:生成档案表示向量;步骤五:构建语义图结构,采用图神经网络进行节点嵌入传播,生成初步分类结果;步骤六:构建误分脉冲路径,沿误分脉冲路径传播扰动信号,生成扰动信号强度矩阵;步骤七:施加镜像对抗损失函数进行训练,得到训练后的图神经网络;步骤八:输出最终分类结果。本发明融合改进TS2Vec模型与扰动信号传播,实现档案数据精准智能分类。
本发明授权一种基于机器学习的档案数据自动分类方法及系统在权利要求书中公布了:1.一种基于机器学习的档案数据自动分类方法,其特征在于,包括如下步骤: 步骤一:采集档案本体数据和行为轨迹数据; 步骤二:对所述档案本体数据进行文本语义提取、图像嵌入生成和结构化信息解析,生成文本向量、图像向量和结构向量; 步骤三:将所述行为轨迹数据按时间顺序排列,输入至改进TS2Vec模型,并引入多视图行为投影机制,输出行为残影向量; 步骤四:将所述文本向量、图像向量、结构向量以及行为残影向量进行拼接融合,生成档案表示向量; 步骤五:基于所述档案表示向量构建语义图结构,语义图结构中的每个节点对应一个档案表示向量,采用图神经网络进行节点嵌入传播,生成初步分类结果; 步骤六:识别所述初步分类结果中的误分类样本,构建误分脉冲路径,在所述语义图结构中沿误分脉冲路径传播扰动信号,生成扰动信号强度矩阵; 步骤七:基于所述扰动信号强度矩阵选取频繁混淆类别对,构建镜像样本对,基于镜像样本对施加镜像对抗损失函数进行训练,得到训练后的图神经网络; 步骤八:将每个待分类档案的档案表示向量输入训练后的图神经网络,生成分类标签和分类置信度,输出最终分类结果; 所述步骤六具体为: 将所述初步分类结果中置信度低于预设置信度阈值的节点样本与实际标签比对,筛选出实际标签与预测标签不一致的节点,作为误分类样本; 对每个误分类样本节点,依据在语义图结构中的真实类别中心节点及预测类别中心节点,构建误分脉冲路径,所述误分脉冲路径为从误分类样本节点出发,依次连接预测类别中心节点、预测类别中心节点与真实类别中心节点之间最短连接路径上的所有中间传播节点以及真实类别中心节点,作为扰动信号传播路径,所述中间传播节点通过Dijkstra算法在邻接矩阵中选取; 在语义图结构中将扰动信号注入每个误分类样本节点,扰动信号初始强度设为1,扰动信号沿所述误分脉冲路径逐跳传播,每跳传播过程将当前扰动信号强度乘以前一跳节点与当前节点之间的边权重值作为新扰动信号强度,直至到达所述误分脉冲路径终点; 对所有误分脉冲路径中扰动信号传播记录进行统计,基于最终传播到的真实类别标签与初始预测类别标签的对应关系,构建扰动信号强度矩阵,所述扰动信号强度矩阵中每一矩阵元素表示类别对之间累计接收到的扰动信号强度总和。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人甘肃集优品网络科技有限公司,其通讯地址为:734000 甘肃省张掖市甘州区张掖经济技术开发区创业大厦505室;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励