北京滴普科技有限公司张挺杰获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉北京滴普科技有限公司申请的专利一种通过自然语言做数据探索分析的算法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN114416780B 。
龙图腾网通过国家知识产权局官网在2026-01-23发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202111496828.7,技术领域涉及:G06F16/2453;该发明授权一种通过自然语言做数据探索分析的算法是由张挺杰;黄建达;黄洪;董嘉诚;杨磊设计研发完成,并于2021-12-08向国家知识产权局提交的专利申请。
本一种通过自然语言做数据探索分析的算法在说明书摘要公布了:本发明公开了一种通过自然语言做数据探索分析的算法,包括nl2sql,nl2sql包括数据层、APP层和后处理模块;数据层用于支撑APP层的各个任务模块且包括分词模型,文本相似度模型,word2vec模块,关键词库;APP层用于进行语义分析,具体为根据报表sql语句所需的信息进行模块划分;后处理模块用于将APP层各模块所得信息进行结果组装和结果拓展、兜底;本发明适应数据拓展,逻辑性强,结果返回多数是基于特定规则,提高查询效率;支持自定义规则拓展,在自定义规则库中可以添加关键字和表达方式。
本发明授权一种通过自然语言做数据探索分析的算法在权利要求书中公布了:1.一种通过自然语言做数据探索分析的方法,其特征在于:包括nl2sql,所述nl2sql包括数据层、APP层和后处理模块;所述数据层用于支撑APP层的各个任务模块且包括分词模型,文本相似度模型,word2vec模块,关键词库;所述APP层用于进行语义分析,具体为根据报表sql语句所需的信息进行模块划分,划分为:表名识别、图表类型识别、limit识别、指标和聚合函数识别、维度识别、where条件识别;所述后处理模块用于将APP层各模块所得信息进行结果组装和结果拓展、兜底; 所述关键词库具体为基于用户定义的表结构和上传的数据抽取生成两个自定义数据结构,一个是用户自定义的表结构,另一个是根据用户自定义的表结构和数据反向生成的检索字典;所述用户自定义的表结构和检索字典通过pickle库对二者进行序列化和反序列化,用于保证多个进程之间数据的一致性; 所述结果组装具体为三种情况: a:除了指标外,其余结果采用有结果则填写,没有则空着; b:根据有多少个指标则组合生成多少个结果;根据各个结果复用query中词语的情况,当其中一个关键词被复用超过2的话,则该结果会被舍弃; c:指标列结果为空的情况下,只填写指标列为空的一个结果; 所述结果拓展、兜底具体包括以下策略: 时间兜底策略:针对用户没有明确时间的情况下,采用本月,本周,今日和今年四个默认时间段进行补全;补全策略为针对单个表下所有的结果先补全本月时间段,再进行本周时间段的补全,依此类推; 维度、图表类型修正策略:程序导入需求的列表,对所存在于结果的维度和指标做匹配,找出最合适的图表类型;待选定图表类型后,根据图表类型中若有缺失或多余维度或者指标,则按照特定规则补全;该规则是根据视图初始化时生成的交叉相关性矩阵,和维度与视图表名的相关性加权得出的;特定的图表类型也会补全特定的列,趋势线图则会补全类型为date的列作为维度,其函数会根据预计的数据点个数进行自动调整; 排序兜底策略:当orderby的列跟指标列一样时,需将指标列的聚合函数填写到orderby的列上; 图表类型兜底策略:当数据为单行单列时,即维度为空的情况,更改图表类型为翻牌器,即放大展示单个指标情况。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人北京滴普科技有限公司,其通讯地址为:100000 北京市海淀区彩和坊路8号4层406;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励