中国石油大学(华东)刘昕获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉中国石油大学(华东)申请的专利一种面向增量式数据集的知识发现方法与发现装置获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN112925839B 。
龙图腾网通过国家知识产权局官网在2025-07-18发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202110107823.4,技术领域涉及:G06F16/25;该发明授权一种面向增量式数据集的知识发现方法与发现装置是由刘昕;郑亮;席永轲;曹帅;于绍文;石祥沛设计研发完成,并于2021-01-27向国家知识产权局提交的专利申请。
本一种面向增量式数据集的知识发现方法与发现装置在说明书摘要公布了:本发明实施例提供一种用于增量式数据集上的知识发现方法。本发明的面向增量式数据集的知识发现方法与发现装置,使用EFPT‑IKD算法,设计了一种可以随数据量不断增长而不断演化的树形数据结构—频繁模式树,设置增量窗口IW发现新增频繁事务项,频繁模式树主要用于对数据集中的频繁模式信息进行存储,通过增量窗口与新发现的频繁模式,挖掘增量数据集中的新知识,并将新增频繁模式动态更新到原有频繁模式树中,使频繁模式树随着数据集增加不断演化。本发明实施例提供的技术方案能够适应数据量不断扩大的应用场景,解决增量式数据计算所面临的高时间复杂度、高空间复杂度问题,对于需要对增量数据进行分析的应用场景具有较强的适用性。
本发明授权一种面向增量式数据集的知识发现方法与发现装置在权利要求书中公布了:1.一种面向增量式数据集的知识发现方法与发现装置,包括以下几个部分: A.基于原始数据集DB中数据的频繁事务项集合DB_FI构建原始数据集频繁模式树DB_FP-tree,并根据最小支持度min_conf计算DB中的关联规则集合 ARDB_FP-Tree,令总关联关系集合ARSET=ARDB_FP-Tree,初始化增量滑动窗口IW,设置窗口长度上限为m,初始化用于维护增量数据集的频繁模式树Idb0_FP-tree; B.当第i次增量数据集Idbi的数据到来时,将本次数据增量数据集Idbi存储在增量数据库IDB中,初始化增量数据集的频繁事务集Idbi_FI,扫描Idbi中的数据,计算Idbi中每一个数据项I的支持度,并根据支持度分为4种情况进行不同操作,在B的基础上,将Idbi_FP-tree更新为Idbi+1_FP-tree; C.在增量滑动窗口IW内的队列末尾追加本次增量数据的主键信息,此时增量滑动窗口IW内的队列长度LenIW加1,若LenIWm,则读取增量滑动窗口IW内的队首信息,根据主键信息将增量数据库IDB中的数据转移至原始数据库DB中,删除IW的队首节点,同时将这些数据的信息更新到原始数据的频繁模式树DB_FP-Tree中,并更新Idbi_FP-Tree中涉及到的节点信息,将计数信息减1,若计数减为0,则删除节点,将该节点的父节点与子节点相连,基于Idbi_FP-tree与min_conf计算第i次数据增量后的关联关系集合ARIdbi_FP-Tree,并令总关联关系集合 ARSET=ARSET∪ARIdbi_FP-Tree; D.步骤B完成后,根据最终得到的增量频繁事务集Idbi_FI构建更新增量频繁模式树Idbi-1_FP-tree,在更新时,将Idbi_FI中的事务按照出现次数降序排序,并再次扫描本次增量数据集Idbi,并将Idbi_FI中的事务信息按照构建频繁模式树的方法更新到Idbi-1_FP-Tree中,此时Idbi-1_FP-tree被更新为Idbi_FP-tree。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人中国石油大学(华东),其通讯地址为:266580 山东省青岛市黄岛区长江西路66号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。