哈尔滨工业大学(威海)万晓珑获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉哈尔滨工业大学(威海)申请的专利大规模数据中非支配的频繁-效用项集的高效挖掘方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN116484320B 。
龙图腾网通过国家知识产权局官网在2026-01-06发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202310420433.1,技术领域涉及:G06F18/26;该发明授权大规模数据中非支配的频繁-效用项集的高效挖掘方法是由万晓珑;何京璇;韩希先;王金宝设计研发完成,并于2023-04-19向国家知识产权局提交的专利申请。
本大规模数据中非支配的频繁-效用项集的高效挖掘方法在说明书摘要公布了:本发明提供了一种大规模数据中非支配的频繁‑效用项集的高效挖掘方法,包括:根据前缀对数据集进行划分和网格存储;根据网格中存储的项的属性值,初始化多层索引链表结构,并按反对角线序读取网格;对于每个网格,将多层索引链表中存储的最大效用值作为条件约束,依次读取网格中满足约束的项所对应的前缀分片;在每个分片中,将满足条件约束的项加入到拓展集合中;依次拓展集合中的项,获得在支持度和效用值两个属性上具有支配能力的项集并将其加入到结果项集中。本发明提出了基于前缀划分策略、网格存储方式以及三组剪枝策略,能在大规模的海量数据上进行高效计算,有效剪枝掉大量无希望的项集,极大地节省了方法的空间开销和时间开销。
本发明授权大规模数据中非支配的频繁-效用项集的高效挖掘方法在权利要求书中公布了:1.大规模数据中非支配的频繁-效用项集的高效挖掘方法,其特征在于,包括: 阶段一、对数据集进行划分和存储;将数据集的每条事务划分为若干个子事务,每个子事务的第一个项作为其前缀,然后根据前缀将多个子事务放入对应的前缀分区中;利用二维平面网格记录并存储分片及其项集的信息;网格文件以支持度为X轴,高估效用值为Y轴,根据项的支持度和最大效用值将其存入网格中的对应位置; 阶段二、以阶段一得到的网格为基础,根据网格中存储的项的属性值初始化多层索引的链表结构M-list,首先取出网格最右上角的元素,根据其支持度对应的效用值对M-lsit初始赋值,利用网格最上方行和最右列的元素对M-list进行一轮更新;以网格的右上角开始至左下角结束,按反对角线序读取网格;对于每个网格,将多层索引链表中存储的最大效用值作为条件约束,依次读取网格中满足约束的项所对应的前缀分片;在每个分片中,将满足最大效用值条件约束的项加入到拓展集合中;依次拓展集合中的项,获得在支持度和效用值两个属性上具有支配能力的项集并将其加入到结果项集中,M-list的原始链表层对数据进行压缩存储,每个效用值仅存1次,避免对最大效用值的重复存储,大大节省了内存空间;在原始链表层之上,根据效用值构建多层索引,每一层索引结点的数量都是低层索引的一半;当结点数量很多时,可以抽出更多的索引层级,直到最高层索引的节点数量不大于2; 当需要对M-list进行修改时,从高层索引向底层遍历,若需要修改的节点是索引节点,也要对应修改索引,最后在原始链表层找到对应的节点进行修改。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人哈尔滨工业大学(威海),其通讯地址为:264200 山东省威海市环翠区文化西路2号哈尔滨工业大学(威海);或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励