齐鲁工业大学(山东省科学院)董祥军获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉齐鲁工业大学(山东省科学院)申请的专利一种基于重复负序列模式的数据分析方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN117112555B 。
龙图腾网通过国家知识产权局官网在2026-03-10发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202310947032.1,技术领域涉及:G06F16/22;该发明授权一种基于重复负序列模式的数据分析方法是由董祥军;孙传后;赵龙;鹿文鹏设计研发完成,并于2023-07-31向国家知识产权局提交的专利申请。
本一种基于重复负序列模式的数据分析方法在说明书摘要公布了:本发明属于数据挖掘技术领域,涉及一种基于重复负序列模式的数据分析方法,能够应用于顾客购买行为分析等任务。无重叠要求每个元素不能在出现的相同位置处重复使用,该条件比现有方法所用出现约束条件更加宽松,能够获得更多有价值的模式。本发明首先,提出一个自适应无重叠重复正序列模式挖掘方法,该方法使用位图存储模式出现的信息并通过位图之间的操作计算模式出现次数。其次,提出一个自适应无重叠重复负序列模式挖掘方法,该方法基于重复正序列模式生成负序列候选并通过相应重复正序列模式的位图计算支持度。在自适应无重叠条件下,能够于事务序列中获得更多有价值的重复负序列模式。
本发明授权一种基于重复负序列模式的数据分析方法在权利要求书中公布了:1.一种基于重复负序列模式的数据分析方法,其特征在于,步骤如下: 1对相关参数进行定义 A.定义正序列a1a2...am在正序列b1b2...bn中的一次出现l1,l2,...,lm,其中,要求正整数1≤l1<l2<...<lm≤n,使得各元素满足如下条件:; B.定义自适应间隙约束的序列模式p=e1*e2*...en,*表示任意数量的通配符,一个通配符可以匹配序列中任意元素;用e1e2...en简单表示自适应序列模式p;若任意元素ek为正元素,则p是正序列模式;若存在元素ek为负元素且不允许两个或多个负元素相邻,则p是负序列模式,1≤k≤n; C.对于正序列模式p=e1e2...en,如果p第k个元素在任意一条序列中的两个出现满足,1≤k≤n,则相应地,p在任意一条序列中的两个出现和无重叠,两个出现分别用α和β标识; D.设置支持度阈值用于筛选频繁模式,p的支持度记为supp,要求supp不小于指定的最小支持度min_sup; 2遍历序列数据库DB,序列数据库DB中包含的项用字母进行表示,并按照英文字母顺序排列;为每个项构建记录了项在每个数据库序列中出现位置的位图;若某个项被数据库序列e1e2...en的第k个元素ek包含,1≤k≤n,则该项所对应该数据库序列的位图中第k个位置为1,否则位置为0; 3通过项集扩展和序列扩展深度优先向下生成正序列候选:为每个频繁正序列模式设置项集扩展集I和序列扩展集S,项集扩展集I由能够添加到最后元素中的频繁项组成,序列扩展集S由能够附加到最后元素后的频繁项组成;对于频繁正序列模式e1e2...en,项集扩展在最后一个元素en中添加一个来自项集扩展集I的频繁项i,获得扩展元素eni,从而生成序列候选e1e2...eni;序列扩展在最后一个元素en后添加一个来自序列扩展集S的频繁项i,从而生成序列候选e1e2...eni; 4对于正序列模式e1e2...en使用位图e1e2...en.bitmap记录模式在每条数据库序列中的出现位置,位图中1值的个数记为正序列模式支持度大小;在步骤3的项集扩展过程中,首先使用位图eni.bitmap记录候选e1e2...eni最后一个元素出现信息以用于下一次项集扩展,通过对e1e2...en最后元素和添加项的位图,en.bitmap和i.bitmap,执行按位与操作得到:eni.bitmap=en.bitmapamp;i.bitmap; e1e2...eni的位图e1e2...eni.bitmap构造方法如下: 设定e1e2...en.bitmap第一个1值的索引是k;定义函数clearindex表示将位图index处的位设为0,函数setindex表示将位图index处的位设为1;生成位图nb,其中,采用并且;执行e1e2...eni.bitmap.setq,其中q是nbamp;eni.bitmap中第一个1值的索引;同时执行eni.bitmap.clearq操作,以满足无重叠条件;重复执行,处理e1e2...en.bitmap中值为1的其他位; 在步骤3的序列扩展过程中,e1e2...eni的位图e1e2...eni.bitmap构造方法如下: 设定e1e2...en.bitmap第一个1值的索引是k;生成位图nb;若,采用,若采用;然后,执行e1e2...eni.bitmap.setq,其中q是nbamp;i.bitmap中第一个1值的索引;执行i.bitmap.clearq操作,以满足无重叠条件;重复执行以处理e1e2...en.bitmap中值为1的其他位; 5统计步骤4中正序列候选出现位图1值的个数,若个数不小于min_sup,则该候选是频繁正序列模式; 6只关注对应正序列频繁的负序列候选ns,其中负序列候选ns=e1e2...en的对应正序列是pns=pe1pe2...pen,p¬e=e表示负元素¬e的对应正元素是e;改变频繁正序列模式非连续的元素以生成负序列候选; 7计算负序列候选ns的支持度; 若ns仅含有一个元素,通过如下公式计算ns的支持度: , 其中sj表示数据库DB中第j条序列; 若ns所含元素数大于1,首先通过如下公式获取一组包含ns的数据库序列: ,其中,n是ns中负元素的个数,MPSns表示ns的最大正子序列,是ns中所有正元素的有序列表;1-negMSv表示ns的一个1-负最大子序列,是由MPSns和第v个负元素构成的子序列,1≤v≤n;然后通过如下公式计算ns的支持度: , 其中RtpTimesMPSns,sj表示ns最大正子序列在数据库序列sj中出现的次数; 8若负序列候选的支持度满足supns≥min_sup,则该候选是频繁负序列模式,不仅考虑了负序列模式在不同数据库序列中的重复出现情况,而且考虑了在某一数据库序列中的重复出现情况;通过所得频繁负序列模式分析事务行为,根据事务行为预测接下来的行为,从而为平台提供个性化推荐展示。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人齐鲁工业大学(山东省科学院),其通讯地址为:250000 山东省济南市长清区西部新城大学科技园;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励