北京北方科诚信息技术股份有限公司;北京中科数字巨人科技股份有限公司苏喜红获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉北京北方科诚信息技术股份有限公司;北京中科数字巨人科技股份有限公司申请的专利一种全渠道数据中台辅助构建方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN121144403B 。
龙图腾网通过国家知识产权局官网在2026-03-31发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202511677197.7,技术领域涉及:G06F16/25;该发明授权一种全渠道数据中台辅助构建方法及系统是由苏喜红;何雨濛设计研发完成,并于2025-11-17向国家知识产权局提交的专利申请。
本一种全渠道数据中台辅助构建方法及系统在说明书摘要公布了:本发明公开一种全渠道数据中台辅助构建方法及系统,涉及数据处理技术领域,接入多渠道数据源,将采集到的元数据转化为中间数据向量后存储到原始数据池;结合中间数据向量对原始数据池中的元数据进行智能识别与分析,生成辅助处理数据集;基于生成的辅助处理数据集将原始数据池中的元数据加工处理成主题域数据表;将加工出的主题域数据表封装成具有标准API接口的数据服务组件,并将每个数据服务组件作为可复用的数据资产,注册到数据资产目录中进行统一管理。显著提升了数据中台构建的自动化与智能化水平,通过元数据智能分析、动态建模与冲突消解,有效保障了数据质量与一致性,破解了数据孤岛问题。
本发明授权一种全渠道数据中台辅助构建方法及系统在权利要求书中公布了:1.一种全渠道数据中台辅助构建方法,其特征在于,包括: Step1、接入多渠道数据源,将采集到的元数据转化为中间数据向量后存储到原始数据池;元数据到中间数据向量的转化过程为: ①为元数据的各个字段构建特征组; 元数据单一字段的特征组表示为:,其中为字段名称的词向量,为数据类型的独热编码向量,为约束条件的多维二进制向量,为样本数据统计特征构成的统计向量; ②将构建出的各个特征组分别输入至数据转化公式,得到转化后的中间数据向量; 所述数据转化公式表示为:,其中为转化后的中间数据向量,为不同特征维度对中间数据向量的贡献系数,分别为对应特征的映射矩阵,通过预训练得到,其过程包括:构建由原始字段与标准目标字段组成的样本集; 搭建双塔神经网络模型,利用数据转化公式作为字段编码器; 以对比学习为训练范式,以最大化正样本对相似度、最小化负样本对相似度为优化目标; 通过误差反向传播算法迭代优化所述映射矩阵,直至模型收敛; 固化训练所得的映射矩阵用于后续所有中间数据向量的生成; ③关联元数据字段及其转化后的中间数据向量; Step2、结合中间数据向量对原始数据池中的元数据进行智能识别与分析,生成辅助处理数据集,具体分为以下子步骤: 融合中间数据向量以及领域内知识图谱中的知识得到深度特征; 基于深度特征对原始数据池中的字段进行聚类,输出主题域簇; 为每个主题域簇各构建一个字段关联子图; 整合输出的主题域簇与构建出的字段关联图,生成辅助处理数据集; Step3、基于生成的辅助处理数据集将原始数据池中的元数据加工处理成主题域数据表; 利用字段评分函数计算主题域簇内各个字段的评分,并选取评分最高的前百分之二十的字段作为该主题域的主字段集合,用于构建数据表的核心结构;所述字段评分函数表示为:,其中i为表示当前主题域簇内的任一字段,表示字段i在全局字段关联图中的度,表示当前主题域的字段关联子图内字段i、j的边权重,,为字段j在字段关联子图内的邻接字段集,表示邻接字段集内的字段总数,表示字段i的深度特征向量与当前主题域在领域内知识图谱中对应实体E的语义向量之间的余弦相似度,为可调参数; Step4、将加工出的主题域数据表封装成具有标准API接口的数据服务组件,并将每个数据服务组件作为可复用的数据资产,注册到数据资产目录中进行统一管理。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人北京北方科诚信息技术股份有限公司;北京中科数字巨人科技股份有限公司,其通讯地址为:100070 北京市丰台区四合庄路6号院1号楼1至10层101内06层04室;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励