Document
拖动滑块完成拼图
个人中心

预订订单
商城订单
发布专利 发布成果 人才入驻 发布商标 发布需求

请提出您的宝贵建议,有机会获取IP积分或其他奖励

投诉建议

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 积分商城 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 四川大学王海舟获国家专利权

四川大学王海舟获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉四川大学申请的专利一种基于多任务学习的社交网络攻击性言论检测方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN116244441B

龙图腾网通过国家知识产权局官网在2026-01-23发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202310255795.X,技术领域涉及:G06F16/35;该发明授权一种基于多任务学习的社交网络攻击性言论检测方法是由王海舟;金地;陈雅宁;杨菲;周罡;王文贤;陈兴蜀设计研发完成,并于2023-03-16向国家知识产权局提交的专利申请。

一种基于多任务学习的社交网络攻击性言论检测方法在说明书摘要公布了:本发明公开了一种基于多任务学习的社交网络攻击性言论检测方法,通过构建攻击性言论词典,采集微博平台中大量的推文数据,并依据制定的标注规则对部分数据进行了严格的人工标注,构建一个较为完善的中文攻击性言论数据集;并通过对收集到的样本数据进行分析,提取包括情感特征、内容特征、传播特征三个类别在内的统计特征;且构建基于多任务学习的攻击性言论检测模型,引入辅助任务情感分析,利用两个任务之间的高度相关性提升攻击性言论检测模型的检测效果。本发明提出的模型在攻击性言论检测问题上的效果优于其他常用的检测方法,为将来面向社交网络的攻击性言论检测提供了方法和思路。

本发明授权一种基于多任务学习的社交网络攻击性言论检测方法在权利要求书中公布了:1.一种基于多任务学习的社交网络攻击性言论检测方法,其特征在于,包括以下步骤: 步骤1:数据收集与标注 选取特定社交网络平台作为数据来源,使用攻击性相关词语构建攻击性词典,根据词典中的关键词利用Web爬虫来获取数据,并完成数据的标注; 步骤2:特征提取 分析并提取攻击性言论的特征,并为每一条攻击性言论生成特征向量,包括语义特征向量和统计特征向量;推文对应的上下文相关的语义特征向量是采用BERT中文预训练模型训练生成;统计特征向量是通过提取情感特征、内容特征和传播特征三个类别的统计特征,并进行拼接而生成; 步骤3:构建检测模型 采用MMoE多任务学习框架,将攻击性言论检测作为主任务,情感分析作为辅助任务同时进行学习,并利用BERT、Bi-LSTM和注意力机制,对所述社交网络平台的攻击性言论进行检测; 所述步骤3中对攻击性言论检测的过程包括: 步骤3.1:经过预处理的推文文本经过令牌化处理后得到向量,如下式所示: 1; 步骤3.2:将向量E输入至BERT模型,从而得到词嵌入表示;其中,为维度为的向量,为词序列长度,为词向量维度,如下式所示: 2; 步骤3.3:将提取到的词嵌入输入到基于Bi-LSTM的特征提取单元中,得到专家网络的输出结果,,为网络中隐含节点的个数,的计算方式为: 3; 4; 5; 其中,表示双向LSTM第个单元产生的隐向量,为词嵌入表示中的元素,是前向LSTM上一个状态产生的隐含向量,是后向LSTM上一个状态产生的隐含向量,表示向量拼接; 步骤3.4:门控网络利用输入的词嵌入和Softmax激活函数生成不同的专家组合权重,从而允许不同的任务以不同的权重利用专家网络的结果,如下式所示: 6; 其中,表示可更新的参数矩阵,表示对应不同任务的特定门,表示特定任务利用专家网络的权重; 步骤3.5:将生成的权重应用到专家网络的输出结果上,如下式所示: 7; 其中,表示专家网络的个数,即特征提取单元的个数;表示特定任务对应的语义特征向量;表示特定任务通过专家网络后的输出;表示特定任务利用专家网络不同特征提取单元的权重;表示专家网络中不同特征提取单元的输出; 步骤3.6:将从推文中提取出的统计特征向量化,并对其做正则化和归一化处理,将其拼接成一维向量,如下式所示: 8; 9; 其中,表示情感特征,表示内容特征,表示传播特征,表示拼接特征,表示正则化和归一化,表示将拼接特征经过正则化和归一化之后的结果; 将处理得到的统计特征送入BP神经网络,通过其全连接层转化为与语义特征具有相同维度的统计特征向量,如下式所示: 10; 其中,表示参数矩阵,表示偏置项,表示激活函数,S为统计特征向量; 步骤3.7:拼接语义特征向量与统计特征向量得到目标推文的特征向量,如下式所示: 11; 步骤3.8:计算查询与键的相关性得到注意力分数,如下式所示: 12; 其中,表示参数矩阵;表示注意力分数,表示特定任务的特征向量; 再利用Softmax函数将注意力分数做归一化处理得到权重系数,如下式所示: 13; 其中,表示的中间隐藏层向量,即上文所提到的注意力分数,是随机初始化的向量,在训练中自动更新,表示的转置; 最后根据权重系数对值进行加权求和,作为最终输出的特征表示,如下式所示: 14; 其中,键与值相同,均为;表示最终输出的特征表示; 步骤3.9:对于攻击性言论检测任务,将语义特征与统计特征拼接起来并经过注意力机制对其分配权重后,通过Sigmoid激活函数得到目标推文是攻击性言论的概率,并作为最终的分类结果,如下式所示: 15; 其中,为目标推文是攻击性言论的概率; 对于情感分析任务直接通过Sigmoid激活函数得到最终的分类结果,如下式所示: 16; 其中,表示情感分析任务中目标推文通过Sigmoid激活函数得到的最终分类结果,表示情感分析任务中目标推文的语义特征向量。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人四川大学,其通讯地址为:610065 四川省成都市武侯区一环路南一段24号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。