西安邦尼行知信息技术有限公司毕京存获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉西安邦尼行知信息技术有限公司申请的专利基于自适应学习的跨语言资讯数据采集与结构化处理方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120011479B 。
龙图腾网通过国家知识产权局官网在2025-07-04发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510503387.0,技术领域涉及:G06F16/31;该发明授权基于自适应学习的跨语言资讯数据采集与结构化处理方法是由毕京存设计研发完成,并于2025-04-22向国家知识产权局提交的专利申请。
本基于自适应学习的跨语言资讯数据采集与结构化处理方法在说明书摘要公布了:本申请提供一种基于自适应学习的跨语言资讯数据采集与结构化处理方法,涉及人工智能自然语言处理技术领域,所述方法包括:通过跨语言的资讯数据源采集资讯数据并进行预处理;将预处理后的跨语言文本数据输入至结合动态特征提取与元学习策略的神经网络框架的自适应可学习语义模型进行特征提取和分类,其中,语义模型基于协方差矩阵预测网络进行训练和优化,动态调整扰动方向,使所述语义模型在多语言环境下能够根据不同语境自适应地调整特征提取方式;通过自然语言处理技术抽取跨语言文本的结构化信息,并对所述语义模型输出的特征表示进行跨语言实体对齐与归一化,生成统一的数据结构表示。本发明提升了跨语言数据处理的效率和准确性。
本发明授权基于自适应学习的跨语言资讯数据采集与结构化处理方法在权利要求书中公布了:1.一种基于自适应学习的跨语言资讯数据采集与结构化处理方法,其特征在于,包括: 通过跨语言的资讯数据源采集资讯数据并进行预处理; 将预处理后的跨语言文本数据输入至结合动态特征提取与元学习策略的神经网络框架的自适应可学习语义模型进行特征提取和分类,其中,所述语义模型基于多层感知器构建的协方差矩阵预测网络进行训练和优化,所述协方差矩阵预测网络以样本深度特征为输入、输出预测的协方差矩阵,动态调整扰动方向,使所述语义模型在多语言环境下能够根据不同语境自适应地调整特征提取方式; 其中,所述语义模型的训练和优化还包括: 基于元学习策略的协方差矩阵预测网络优化以及采用三阶段训练框架,用于提升模型的分类能力和跨语言处理能力,包括:采用元学习策略,通过伪梯度下降更新、元更新和真实更新的三阶段交替优化,来训练所述协方差矩阵预测网络与分类器; 其中,所述三阶段训练框架包括:阶段一:在合成数据上预训练特征提取器,阶段二:利用小隐私预算训练线性分类器,阶段三:端到端联合训练,以分配隐私预算并确保模型在不同训练阶段的优化效果; 其中,所述语义模型的元学习通过最小化基于预测协方差矩阵的隐式语义数据增强损失来优化;其中,所述基于预测协方差矩阵的隐式语义数据增强损失函数 为: , 其中,是第个样本的特征;是预测的特征;是批次内的样本数量;是通过协方差矩阵预测网络预测的协方差矩阵;为交叉熵损失: , 其中,是类别总数;是类的标签;是预测类别的概率; 所述协方差矩阵预测网络的参数利用元数据的交叉熵损失进行优化,使其预测的协方差矩阵能够准确建模数据增强后的特征分布; 通过自然语言处理技术抽取跨语言文本的结构化信息,并对所述语义模型输出的特征表示进行跨语言实体对齐与归一化,生成统一的数据结构表示。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人西安邦尼行知信息技术有限公司,其通讯地址为:710000 陕西省西安市高新区丈八街办丈八五路43号高科尚都ONE尚城A座12层1204室;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。