天津大学杨泽获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉天津大学申请的专利一种在线社交网络垃圾评论用户检测方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN116304311B 。
龙图腾网通过国家知识产权局官网在2026-04-03发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202310148077.2,技术领域涉及:G06F16/9535;该发明授权一种在线社交网络垃圾评论用户检测方法是由杨泽;戴维迪;邵明来;李天鹏设计研发完成,并于2023-02-22向国家知识产权局提交的专利申请。
本一种在线社交网络垃圾评论用户检测方法在说明书摘要公布了:本发明涉及一种在线社交网络垃圾评论用户检测方法,包括下列步骤:步骤一,图构建和预处理:以在线社交平台用户为节点,用户间的交互关系为边建立图结构,构建邻接矩阵;人工标注部分数据,给出被标注的节点的编号及标签,1代表垃圾评论发送者,0代表正常用户;建立置信度向量;步骤二,图神经网络构建:图神经网络共包含两层,最后一层的输出维度为2,第1维代表神经网络将节点判定为垃圾评论发送者的置信度,第2维代表神经网络将节点判定为正常用户的置信度,图神经网络通过聚合节点邻居的特征来获取节点自己的特征,在提取节点特征时考虑其邻居的类别信息,对于不同类型的邻居执行不同的特征聚合策略;步骤三,迭代优化。
本发明授权一种在线社交网络垃圾评论用户检测方法在权利要求书中公布了:1.一种在线社交网络垃圾评论用户检测方法,包括下列步骤: 步骤一,图构建和预处理 1以在线社交平台用户为节点,用户间的交互关系为边建立图结构,构建邻接矩阵; 2将用户属性数值化,构建属性矩阵,属性矩阵每行代表对应的用户的属性; 3人工标注部分数据,给出被标注的节点的编号及标签,1代表垃圾评论发送者,0代表正常用户,并划分训练集和测试集; 4建立一个置信度向量其中N代表节点个数,第i位为0时代表节点i更可能为正常用户,第i位为1时代表节点i更可能为垃圾评论发送者;初始化该置信度向量,使训练集中标签为0的节点在B中对应的位置为0,使训练集中标签为1的节点在B中对应的位置为1,其余位置均为0; 步骤二,图神经网络构建 图神经网络共包含两层,最后一层的输出维度为2,第1维代表神经网络将节点判定为垃圾评论发送者的置信度,第2维代表神经网络将节点判定为正常用户的置信度,图神经网络通过聚合节点邻居的特征来获取节点自己的特征,在提取节点特征时考虑其邻居的类别信息,对于不同类型的邻居执行不同的特征聚合策略; 对于每一层图神经网络均包含以下过程: 1使用全连接层将用户u的特征hu降维得到降维后的用户特征zu,公式如下: zu=Wthu 其中,为全连接层的权重矩阵,din为该层输入维度,dout为该层输出维度; 2将节点v视为中心节点,对于节点v在关系r下的每一个邻居u,按照其与中心节点的关系计算其重要性系数公式如下: 其中,为可训练的权重向量; 3根据置信度向量B判断节点的邻居是否与其同类,将关系r下的节点v的同类邻居放到集合中,异类邻居放到集合中; 4将两类邻居的重要性系数分别进行归一化操作,得到用以聚合的注意力分数;对于节点v在关系r下的邻居u,如果节点u与节点v同类,则其注意力分数由以下公式求得: 其中,为节点v的同类邻居的集合;exp为自然指数函数;σ为非线性激活函数;同理,如果该邻居节点与节点v异类,则其注意力分数由以下公式求得: 其中,为节点v的异类邻居的集合; 5根据上一步计算得到的注意力分数分别计算关系r下中心节点v的同类邻居的嵌入和中心节点v的异类邻居的嵌入其计算公式如下: 6对于每个节点v,以其特征zv与其他节点特征的欧式距离为依据获取其k近邻节点构成k近邻图 7按照进行一次聚合操作获取到每个节点v的k近邻嵌入hknn,v,公式如下: 其中,K为k近邻选取的邻居数;为权重矩阵;为节点v的k近邻集合; 8对于每一个节点v,将其同类邻居嵌入异类邻居嵌入和k近邻嵌入hknn,v融合得到关系r下节点v的综合嵌入 9引入多头注意力机制,重复步骤1到步骤8共H次,并将这些拼接得到关系r下的多头注意力后节点v的特征 10采用拼接和线性变换操作将多关系下的整合为h′v; 堆叠两个图神经网络层后得到最后一层的输出hv,out,该输出是一个二维向量;第1维代表节点v为垃圾评论发送者的置信度,第2维代表节点v为正常用户的置信度;对hv,out取softmax操作后即可表示节点属于正常节点和异常节点的概率值;当hv,out的第0维的值大于第1维的值时,该节点被判定为正常节点;当hv,out的第1维的值大于第0维的值时,该节点被判定为异常节点; 步骤三,迭代优化 1将整个图输入到图神经网络中,获取输出结果hout,是全部的hv,out的纵向拼接; 2对训练标签进行欠采样得到参与损失计算的节点集合使得参与损失计算的正常节点数量与异常节点数量相近,以避免标签0、1不均衡的影响; 3按以下公式计算的损失 其中,yv代表节点v的标签; 4根据模型输出hout更新置信度向量B,使hout中第1维大于第2维的行在B中对应的位置为1,其余为0; 5根据损失执行梯度下降算法; 6当损失收敛时停止训练; 步骤四,无标签用户类别输出 1获取模型输出hout,取出未标标签的节点对应的行; 2如果节点i在hout中对应行的第1维的值大于第2维,则该节点为垃圾评论发送者,反之为正常用户。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人天津大学,其通讯地址为:300072 天津市南开区卫津路92号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励