上海数鸣人工智能科技有限公司项亮获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉上海数鸣人工智能科技有限公司申请的专利基于遗传算法进行特征交互和伪标签学习的点击预测方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115271784B 。
龙图腾网通过国家知识产权局官网在2025-10-31发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202210666490.3,技术领域涉及:G06Q30/0241;该发明授权基于遗传算法进行特征交互和伪标签学习的点击预测方法是由项亮;裴智晖设计研发完成,并于2022-06-13向国家知识产权局提交的专利申请。
本基于遗传算法进行特征交互和伪标签学习的点击预测方法在说明书摘要公布了:一种基于遗传算法进行特征交互和伪标签学习的点击预测方法,包括数据预处理步骤、特征交互步骤和预测模型建立步骤和营销活动预测步骤;本发明通过基于遗传算法的思想对特征进行交互构造新特征,并结合伪标签技术对无标签数据和有标签数据联合建模,得到最终的预测用户点击的二分类学习器;通过本方法,可以有效利用遗传算法迭代产生优质的新特征,并结合伪标签学习,有效利用了无标签数据,显著提升了对用户点击行为预测的准确性和鲁棒性。
本发明授权基于遗传算法进行特征交互和伪标签学习的点击预测方法在权利要求书中公布了:1.一种基于遗传算法进行特征交互和伪标签学习的点击预测方法,其特征在于,包括数据预处理步骤S1、特征交互步骤S2和预测模型建立步骤S3; 所述数据预处理步骤S1包括如下步骤: 步骤S11:获取M个用户的原始信息,并从所述用户的原始信息提取第一原始特征信息,所述第一原始特征信息包括Y个特征;其中,所述第一原始特征信息包括用户ID、用户手机号码归属地、用户访问DPI、用户访问时间和或用户是否点击特征;并且,在数据收集过程中,既包含了有标签数据,又包含无标签数据,所述M大于等于2; 步骤S12:对所述用户的原第一始特征信息进行异常检测与处理步骤; 步骤S13:通过独热编码对类别特征进行处理,利用RankGauss方法对连续特征进行处理; 有标签数据训练集的生成步骤S2包括: 基于遗传算法对所述第一原始特征信息的特征交互,筛选出X个优质的第二原始特征信息;其中,第三原始特征信息的特征数量等于所述第一原始特征信息数量Y加上所述第二原始特征信息数量X; 所述预测模型建立步骤S3包括: 步骤S31:提供初始神经网络模型;并将具有所述第三原始特征信息的有标签数据和无标签数据整理后区分开; 步骤S32:从所述有标签数据中切分出80%作为第一训练集,20%作为第一验证集; 步骤S33:采用所述第一训练集的数据训练所述初始神经网络模型,并用所述第一验证集进行验证,得到优化后的中间神经网络模型; 步骤S34:基于所述中间神经网络模型对每一个所述无标签数据进行预测,输出预测分类的概率,如果所述预测分类的概率大于设定的某一个阈值,则所述无标签数据的标签为1,否则所述无标签数据的标签为0,这样,每个无标签数据标上了预测的伪标签; 步骤S35:将从所述有标签数据中再重新切分出80%作为第二训练集,20%作为第二验证集;所述第二训练集的所述有标签数据与步骤S34得到的伪标签数据混合作为新的训练集; 步骤S36:将所述新的训练集中的每一个样本对所述初始化神经网络模型进行训练和验证,得到参数优化后的神经网络模型,并使用所述验证集进行验证,得到最终的预测网络模型。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人上海数鸣人工智能科技有限公司,其通讯地址为:200436 上海市静安区万荣路1256、1258号406室;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励