西北工业大学董鸿毅获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉西北工业大学申请的专利一种基于关系型的面向大规模多模数据的数据导入方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120743924B 。
龙图腾网通过国家知识产权局官网在2026-01-27发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510771262.6,技术领域涉及:G06F16/242;该发明授权一种基于关系型的面向大规模多模数据的数据导入方法是由董鸿毅;刘春成;杨思毅;石育山;陈群设计研发完成,并于2025-06-10向国家知识产权局提交的专利申请。
本一种基于关系型的面向大规模多模数据的数据导入方法在说明书摘要公布了:一种基于关系型的面向大规模多模数据的数据导入方法,属于计算机技术领域;获取原始数据文件、存储格式和数据模型;通过数据转换模块对进行解析、读取并结构化获取原始数据文件数据信息;通过分块并行写入方法将数据信息生成统一关系数据模型文件,并存储为同一文件存储格式CSV;通过数据关联模块进行预处理;提取模式信息,将模式信息发送给模式转换模块,模式转换模块自动生成关系表并建立DDL语句;将DDL语句和CSV文件发送至SQL处理终端,通过数据库的COPY语句和DDL语句将多模数据统一转换为关系数据,并存储到关系数据库的底层存储结构中。本发明将多模数据统一存储在同一存储层中,使查询能直接从数据库存储层调用,加快了数据转换效率。
本发明授权一种基于关系型的面向大规模多模数据的数据导入方法在权利要求书中公布了:1.一种基于关系型的面向大规模多模数据的数据导入方法,其特征在于:所述数据导入方法包括以下步骤: 步骤1,获取含大规模数据的原始数据文件、原始数据文件存储格式和原始数据文件中存储的数据模型;所述原始数据文件包括关系数据、文档数据、向量数据和属性图数据四种数据模型文件,存储关系数据、文档数据、向量数据和属性图数据四种数据模型,原始数据文件中的每种数据模型均有各自固定的存储格式; 步骤2,通过数据转换模块对原始数据文件进行解析、读取并结构化,从而获取原始数据文件的数据信息;所述数据信息包括字段信息、数据值和数据关系;所述数据转换模块包括文档数据转换子模块、图数据转换子模块和向量数据转换子模块; 步骤3,通过分块并行写入方法将步骤2得到的数据信息生成统一关系数据模型文件,并存储为同一文件存储格式CSV; 步骤4,通过数据关联模块对不同数据模型中的数据进行预处理,将不同数据模型中的数据融合成嵌套结构,并与经过步骤3得到的统一关系数据模型文件一起存储为同一文件存储格式CSV; 步骤5,提取CSV格式文件的模式信息,将模式信息发送给模式转换模块,模式转换模块按模式转换规则自动生成关系表并建立DDL语句; 所述模式转换规则分为字段名称解析规则、字段值类型推断规则、字段类型优先级规则和DDL语言生成规则; 所述DDL语句生成规则建立过程如下: 首先,字段名称解析规则从CSV文件的第一行中提取字段名称作为表的列名; 然后,字段值类型推断规则通过对前100行的每个字段值,依次应用预设的类型判断isBoolean函数和isInteger函数,推断字段的最适合数据类型; 接着,字段类型优先级规则通过预设数据类型的优先级从而在推断字段类型时,选择出符合推断字段类型优先级规则的数据类型; 最后,DDL生成规则将确定的字段名称和推断的数据类型组装为SQL的DDL语句; 步骤6,将DDL语句和CSV文件发送至数据库管理系统的SQL处理终端,通过数据库的COPY语句和DDL语句将多模数据统一转换为关系数据,并存储到关系数据库的底层存储结构中。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人西北工业大学,其通讯地址为:710072 陕西省西安市友谊西路127号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励