北京科技大学张晓彤获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉北京科技大学申请的专利混合结构的多模态数据查询语言的方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119149561B 。
龙图腾网通过国家知识产权局官网在2025-09-12发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411109001.X,技术领域涉及:G06F16/242;该发明授权混合结构的多模态数据查询语言的方法及系统是由张晓彤;庄雨;何杰;陈梦阳;陈方熠;陈文聪;方宇设计研发完成,并于2024-08-13向国家知识产权局提交的专利申请。
本混合结构的多模态数据查询语言的方法及系统在说明书摘要公布了:本发明公开了一种混合结构的多模态数据查询语言的方法和系统,涉及数据处理技术领域。包括:用户自主创建多模态数据集的数据模式,获取不同类型数据元素之间的嵌套关系;选择一个关键数据结构或辅以算法作为整个数据模式的第一层结构,其他数据元素可作为嵌套其中的子结构,并辅以算法形成新的数据结构;根据数据结构所形成的嵌套关系,建立数据元素对象;根据定义的数据模式表示规则、属性表示规则、值变换规则以及表达式过滤条件,完成多模态数据集查询语言动态自主构建;获取用户输入的查询语句,根据查询语句以及构建的多模态数据集查询语言,得到查询结果。本发明解决了传统SQL语言与多模态数据兼容度低的问题。
本发明授权混合结构的多模态数据查询语言的方法及系统在权利要求书中公布了:1.一种混合结构的多模态数据查询语言的方法,其特征在于,所述方法包括: S1、用户将已有的数据整理后,自主创建多模态数据集的数据模式,获取数据模式中不同类型数据元素之间的嵌套关系;其中,多模态数据是指融合了结构化、半结构化和非结构化的数据; S2、选择一个关键数据结构或辅以算法作为整个数据模式的第一层数据结构,将不同类型的数据元素作为第一层数据结构或第一层数据结构下的元素或子结构,并辅以算法形成单层或多层数据结构; S3、根据S2中所述的单层或多层数据结构所形成的嵌套关系以及构建的查询语言,建立数据元素对象; S4、根据所述数据元素对象、定义的数据模式表示规则、定义的属性表示规则、定义的值变换规则以及定义的普通的表达式过滤条件和针对嵌套类型数据元素的复杂过滤条件,完成多模态数据集查询语言动态自主构建; S5、获取用户输入的声明式的查询语句,根据所述查询语句以及构建的多模态数据集查询语言,得到查询结果; 其中,当数据元素对象为原子性的源数据类型时,每一个属性就是单纯的字段名称,不包含结构信息,当数据元素对象是非原子类型时,第一层级的非原子数据元素的属性是自身的名称,其他层级数据元素的属性需要包含其父数据元素的数据元素的结构,递归直至第一层级数据元素; 所述定义的数据模式表示规则,包括: 采用多种表达方式,对所有数据元素以及对不同类型数据元素之间的嵌套关系进行表示; 所述多种表达方式包括多维立体化表达方式和二维扁平化表达方式; 所述多维立体化表达方式包括显式的表达数据元素的类型以及数据元素包含的子数据元素的属性、类型和特征,将处于同一层级的数据元素间用逗号分隔,将处于不同层级的数据元素间用缩进的位置进行区分; 所述二维扁平化表达方式包括对数据元素的嵌套关系进行平铺展开,将平铺展开后的所有数据元素放到同一层级,用符号连接数据元素中的父数据元素和子数据元素,对每一个除第一层级外的其他层级的数据元素,将所述层级的上层级的所有数据元素作为前缀; 所述定义的属性表示规则,包括: 对第一层级的数据元素的属性进行表示,以及当第一层级的数据元素的数据类型为非原子类型时,对非原子类型的数据元素包含的子数据元素的属性进行表示; 其中,所述对第一层级的数据元素的属性进行表示,包括: 当第一层级的数据元素的数据类型为原子类型时,数据元素的属性为原子类型的数据元素的字段名称; 当第一层级的数据元素的数据类型为非原子类型时,第一层级的非原子类型的数据元素的属性为非原子类型的数据元素的名称,其他层级的非原子类型的数据元素的属性为其他层级的父层级数据元素的结构递归直至第一层级的非原子类型的数据元素的结构; 属性表示规则的三个核心符号分别是“.”,“[n]”,“[]”;“.”用来连接两个相邻层级的数据元素的属性,左侧是父数据元素的属性,右侧是子数据元素的属性;“[n]”用来描述数组类型的属性的第n个子属性或者用来表示表格类型的属性的第n行;“[]”用来表示数组类型的属性的所有子属性,通常后面会接“.”或“[n]”指定所有子属性的下一级属性; 所述定义的值变换规则,包括: 对根据属性表示规则描述的属性,进行数据内容的提取和变换; 值变换规则面向数据类型为数组型,属性嵌套数据类型为表格型属性的情况,该类嵌套属性可以单独存在,也可以嵌套在其他数据类型中;具体的规则是:可以灵活地应用属性表示规则,将数组型属性中每一个表格型属性的相同位置点或位置区域的值,抽取出来,形成一个新的数组;如果抽取的是相同位置点,值变换的结果应该是一个一维数组,每个元素都是抽取出来的单个值;如果抽取的是相同位置区域,值变换的结果是一个二维数组,每个元素都是抽取出来的一组值,并各自形成一个子数组,嵌套在值变换结果的数组中,从而形成一个二维数组; 所述定义的普通的表达式过滤条件,包括: 对原子类型的数据元素,设计普通的表达式过滤条件; 表格型的数据元素过滤条件包括位置点和位置区域两种,其中位置点是指某行某列的某个值,该值属于原子类型,可复用原子类型的数据元素过滤条件,位置区域是指某行或某列的一组值,其中某列的一组值被视为一个数组,并且该数组中的数据类型是原子类型,可复用数组型的数据元素过滤条件,某行的一组值被视为一个容器,并且该容器中的数据类型都是原子类型,可复用容器型的数据元素过滤条件; 数组型的数据元素过滤条件包括存在满足和全部满足这两个前缀,加上数组内包含的数据类型的过滤条件; 容器型的数据元素过滤条件包括容器内包含的所有类型的数据元素过滤条件的总和; 生成器型的数据元素过滤条件包括生成器内包含的所有类型的数据元素过滤条件的总和。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人北京科技大学,其通讯地址为:100083 北京市海淀区学院路30号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。
请提出您的宝贵建议,有机会获取IP积分或其他奖励