Document
拖动滑块完成拼图
个人中心

预订订单
服务订单
发布专利 发布成果 人才入驻 发布商标 发布需求

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 江苏数兑科技有限公司郑志松获国家专利权

江苏数兑科技有限公司郑志松获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉江苏数兑科技有限公司申请的专利基于语义识别的大模型的训练数据冗余剔除方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119988842B

龙图腾网通过国家知识产权局官网在2025-08-01发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510472445.8,技术领域涉及:G06F18/10;该发明授权基于语义识别的大模型的训练数据冗余剔除方法及系统是由郑志松;刘晓雷;吴运昌设计研发完成,并于2025-04-16向国家知识产权局提交的专利申请。

基于语义识别的大模型的训练数据冗余剔除方法及系统在说明书摘要公布了:本发明涉及自然语言处理技术领域,本发明公开了基于语义识别的大模型的训练数据冗余剔除方法及系统,包括通过构建领域知识图谱,实现对数据中冗余部分的精确识别和剔除,结合图神经网络等先进技术,提升了数据预处理的质量和效率。相较于现有技术,本发明通过采用多层次的数据编码和特征传播机制,不仅有效消除了数据中的冗余信息,还促进了数据的高维表征,使得数据在进入模型训练阶段前具备更高的解释能力和准确性。

本发明授权基于语义识别的大模型的训练数据冗余剔除方法及系统在权利要求书中公布了:1.基于语义识别的大模型的训练数据冗余剔除方法,其特征在于:包括, 构建领域知识图谱,基于所述领域知识图谱进行语义关联挖掘并识别领域知识图谱中数据的冗余部分; 在所述构建领域知识图谱的数据预处理阶段结合语义识别技术剔除原始数据中的无关数据,所述原始数据为文本或图像数据; 识别数据中的冗余部分后,通过数据清洗算法去除冗余数据; 结合数据质量评估,优化数据治理流程; 所述语义关联挖掘包括,利用图神经网络分析实体之间的多跳关系;从领域知识图谱的数据中提取实体和关系,生成图G的结构,包含节点V和边E, 选择图神经网络架构,并初始化每个节点的特征向量,得出所有节点的初始特征矩阵,节点的特征向量通过多轮传播更新; 所述语义关联挖掘还包括,通过语义相似度计算识别数据中的冗余实例。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人江苏数兑科技有限公司,其通讯地址为:210001 江苏省南京市秦淮区永智路5号南京白下高新技术产业园区五号楼E栋101-88室;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。