Document
拖动滑块完成拼图
个人中心

预订订单
商城订单
发布专利 发布成果 人才入驻 发布商标 发布需求

请提出您的宝贵建议,有机会获取IP积分或其他奖励

投诉建议

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 积分商城 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 北京蜂创科技有限公司郭伟峰获国家专利权

北京蜂创科技有限公司郭伟峰获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉北京蜂创科技有限公司申请的专利一种基于预聚合存储表的用户分类方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120336604B

龙图腾网通过国家知识产权局官网在2026-02-10发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510426529.8,技术领域涉及:G06F16/906;该发明授权一种基于预聚合存储表的用户分类方法是由郭伟峰设计研发完成,并于2025-04-07向国家知识产权局提交的专利申请。

一种基于预聚合存储表的用户分类方法在说明书摘要公布了:本发明公开了一种基于预聚合存储表的用户分类方法,涉及数据处理技术领域,包括S1、数据收集,S2、数据预处理:将S1步骤中收集的客户数据进行全方位清洗,采用基于统计学方法的3σ原则识别和去除噪声数据和异常值,S3、特征提取:将S2步骤中预处理的客户数据进行深度提取特征,S4、构建预聚合存储表,S5、数据分析。本发明通过数据收集阶段,综合运用网络爬虫技术、日志分析工具和第三方数据接口,全面收集客户行为和基本信息数据,且严格遵循法律法规与网站协议,确保数据合法合规,同时在数据预处理时采用3σ原则、多种缺失值处理方法以及数据平滑、归一化技术,有效去除噪声、填补缺失值,提升数据质量,使分类结果能真实反映客户特征。

本发明授权一种基于预聚合存储表的用户分类方法在权利要求书中公布了:1.一种基于预聚合存储表的用户分类方法,其特征在于:包括以下分类方法: S1、数据收集:首先运用多样化的技术手段和渠道,以及基于历史数据和浏览情况,全面收集客户行为数据与基本信息数据,并通过网络爬虫技术,依据设定的规则和策略,从指定的网页、电商平台和社交媒体网络资源中精准抓取客户的浏览记录,详细记录客户访问的页面URL、访问时间、浏览顺序信息; S2、数据预处理:将S1步骤中收集的客户数据进行全方位清洗,采用基于统计学方法的3σ原则识别和去除噪声数据和异常值,3σ原则基于数据的正态分布假设,若数据点距离均值超过3倍标准差,则判定为异常值; S3、特征提取:将S2步骤中预处理的客户数据进行深度提取特征,从预处理后的客户行为数据中深度提取特征,通过对客户一段时间内的登录次数及操作频率数据进行统计分析,得到客户的活跃度和使用时间;通过计算客户在周期内的购买次数,得到购买频率;通过累加客户每次的购买金额,得出购买金额;通过分析客户购买商品所属的品类,确定偏好品类;并运用特征选择算法,从提取的特征中筛选出具代表性和区分度的特征; S4、构建预聚合存储表:将S3步骤中预处理的客户数据,根据提取的特征构建预聚合存储表,并按照时间维度和属性维度对数据进行聚合存储和分类聚合,同时按行为类型维度聚合存储相应数据,采用分布式存储技术对预聚合存储表进行存储,针对不同的特征维度设计高效的数据索引结构,对时间维度的范围查询采用B树索引方法;对属性和行为维度范围查询采用哈希索引方法; B树的每个节点存储多个键值对和指向子节点的指针,通过比较键值来确定数据的存储位置和查询路径,快速定位到指定时间区间的数据;哈希索引对客户唯一标识的快速查找,通过哈希函数将客户唯一标识映射为一个固定长度的哈希值,根据哈希值直接定位存储数据的位置; S5、数据分析:利用大数据分析技术,基于S4步骤中构建的预聚合存储表对客户行为数据进行深入分析,具体包括以下实施步骤: T1、聚类分析:采用聚类算法对客户进行聚类,将客户分为不同的客群,利用K-Means算法并结合肘部法则,计算不同K值下的聚类误差;采用轮廓系数法,计算每个样本的轮廓系数; T2、关联规则挖掘:将T1步骤中聚类分析的客户数据,使用Apriori算法和FP-Growth算法挖掘不同客群内客户行为之间的关联规则;Apriori算法基于先验原理,通过生成候选频繁项集并在数据集中进行验证,逐步挖掘出频繁项集和关联规则;FP-Growth算法通过构建FP树,压缩数据存储空间并提高挖掘效率,直接从FP树中挖掘频繁项集,避免Apriori算法中大量的候选集生成过程; T3、客群分析:将T2步骤中关联规则挖掘的客户行为结果,对客户进行客群分类,确定每个客户所属的客群类别,同时结合业务经验和领域知识,对分类结果进行人工审核与调整; 所述T1的聚类分析步骤中,具体包括以下实施方式: 利用K-Means算法时,通过多次随机初始化聚类中心,并结合肘部法则或轮廓系数法确定最优的K值,进行K-Means聚类计算,得到不同的聚类结果; 肘部法通过绘制聚类误差与K值的关系曲线,观察曲线的变化趋势,当K值小时,随着K值的增加,聚类误差急剧下降,当K值增加的程度加深后,聚类误差下降趋势变缓,曲线形状呈肘部时,选择肘部对应的K值作为最优值; 轮廓系数法为每个样本计算轮廓系数,轮廓系数的计算公式为:si=bi-aimaxai,bi,其中ai表示样本i与同簇内其他样本的平均距离;bi表示样本i与其他簇中最近样本的平均距离;轮廓系数取值范围为[-1,1],值越接近1,表示样本聚类效果越好,遍历不同K值,选择轮廓系数最大时的K值作为最优K值。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人北京蜂创科技有限公司,其通讯地址为:100020 北京市朝阳区半壁店(齿轮总厂车桥分厂)36幢平房01(A-503);或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。