Document
拖动滑块完成拼图
个人中心

预订订单
服务订单
发布专利 发布成果 人才入驻 发布商标 发布需求

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 杭州观远数据有限公司陈铭洲获国家专利权

杭州观远数据有限公司陈铭洲获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉杭州观远数据有限公司申请的专利基于BI多源数据集的知识库冷启动方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119226488B

龙图腾网通过国家知识产权局官网在2025-07-04发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411745692.2,技术领域涉及:G06F16/3329;该发明授权基于BI多源数据集的知识库冷启动方法是由陈铭洲;姚军勇;张羽设计研发完成,并于2024-12-02向国家知识产权局提交的专利申请。

基于BI多源数据集的知识库冷启动方法在说明书摘要公布了:本发明提供一种基于BI多源数据集的知识库冷启动方法,基于LLM对BI配置元数据进行指标口径挖掘,获取所定义的指标口径并生成指标定义列表;基于LLM对BI配置元数据进行数据筛选逻辑挖掘,获取所定义的数据筛选逻辑并生成通用逻辑列表;基于LLM对所述指标定义列表和所述通用逻辑列表进行整合,得到用于构建ChatBI知识库的知识列表。能够利用LLM对平台上已有的数据资产的元数据进行挖掘,从而构建出ChatBI知识库,实现自动化、高效地数据分析场景知识库冷启动,大大降低了对资产知识的梳理难度和知识整合时间,降低冷启动技术门槛,大大加快BI智能问答产品的应用落地进度,缩短开发周期。

本发明授权基于BI多源数据集的知识库冷启动方法在权利要求书中公布了:1.一种基于BI多源数据集的知识库冷启动方法,其特征在于,所述方法包括: S1、输入BI配置元数据; S2、基于LLM对所述BI配置元数据进行指标口径挖掘,获取所定义的指标口径并生成指标定义列表,包括: 获取若干所述BI配置元数据并进行预处理; 按照预设的指标过滤规则,对预处理后的所述BI配置元数据进行指标过滤处理,生成降噪配置元数据; 调用LLM,批量识别并挖掘各个所述降噪配置元数据中的指标口径,得到批量生成的指标口径,包括: 根据待挖掘的所述指标口径,配置对应的挖掘关键词和第一挖掘逻辑,其中,所述挖掘关键词至少包括如下关键词:指标名称、别称、类型、来源和或时间段; 根据所述挖掘关键词和所述第一挖掘逻辑,构建第一LLM提示词,并将所述第一LLM提示词输入预设的LLM中; 通过所述LLM,基于所述第一LLM提示词遍历识别各个所述降噪配置元数据中的指标口径,并批量输出对应的指标口径,得到所述批量生成的指标口径; 对批量生成的所述指标口径进行指标总结,生成所述指标口径列表; S3、基于LLM对所述BI配置元数据进行数据筛选逻辑挖掘,获取所定义的数据筛选逻辑并生成通用逻辑列表,包括: 获取若干所述BI配置元数据并进行预处理; 按照预设的分组规则,对预处理后的所述BI配置元数据进行分组处理,生成若干元数据分组数据;分组规则,包括:使用LLMembedding模型,对所述BI配置元数据中的各个指标进行指标名称向量化处理;计算不同指标名称的向量相似度;按照所述向量相似度对所述BI配置元数据进行聚类分组,再将每组数据分别给到LLM; 对于每类相似指标,如果其计算是依赖了相似但不同的字段,则可以再交由LLM更准确地判断总结出关于如何选字段的知识;具体的,对于指标,先基于指标名称信息,使用LLMembedding模型生成向量后进行聚类; 对于筛选条件,一是基于元数据统计筛选出高频条件,每个高频条件所在的图表卡片分别作为一组,用于逻辑归纳;二是基于元数据统计筛选出高频选用但条件不总是一致的字段,将不同条件所在图表卡片归总作为一组,用于辨析区别并进行归纳,最终得出各种筛选逻辑应起效的场景范围; 对于排序,需将排序条件进行分组,每组保留若干图表卡片,每次将同个字段的升序及降序卡片元数据一起给到LLM,进行判断总结; 调用LLM,批量识别并挖掘各个所述元数据分组数据中的数据筛选逻辑,得到批量生成的数据筛选逻辑,包括: 根据待挖掘的所述数据筛选逻辑,配置对应的逻辑关键词和第二挖掘逻辑,其中,所述逻辑关键词至少包括如下关键词:指标占比、指标等级、指标额度和或指标计算式; 根据所述逻辑关键词和所述第二挖掘逻辑,构建第二LLM提示词,并将所述第二LLM提示词输入预设的LLM中; 通过所述LLM,基于所述第二LLM提示词遍历识别各个所述元数据分组数据中的数据筛选逻辑,并批量输出对应的数据筛选逻辑,得到所述批量生成的数据筛选逻辑; 对批量生成的所述数据筛选逻辑进行逻辑归纳,生成所述通用逻辑列表; S4、基于LLM对所述指标定义列表和所述通用逻辑列表进行整合,得到用于构建ChatBI知识库的知识列表; 单次调用LLM生成方法时,将传入同一张表的多张图表卡片的元数据信息,并要求对LLMAgent对重复出现或高度相似的指标进行总结;最终将每一次调用后总结的结果合并得到最终完整的指标定义列表。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人杭州观远数据有限公司,其通讯地址为:311100 浙江省杭州市余杭区五常街道文一西路998号18幢708室;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。