中国科学技术大学胡郅昊获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉中国科学技术大学申请的专利自适应加权的短文本情感分类方法、电子设备和存储介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN116028625B 。
龙图腾网通过国家知识产权局官网在2025-07-18发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202310052234.X,技术领域涉及:G06F16/353;该发明授权自适应加权的短文本情感分类方法、电子设备和存储介质是由胡郅昊;田新梅设计研发完成,并于2023-02-02向国家知识产权局提交的专利申请。
本自适应加权的短文本情感分类方法、电子设备和存储介质在说明书摘要公布了:本发明公开了一种自适应加权的短文本情感分类方法、电子设备和存储介质,该短文本情感分类方法步骤包括:1获取短文本集合并进行预处理,使用DeepMoji模型提取特征向量;2利用短文本情感标签和步骤1中提取到的短文本特征向量预训练分类模型;3自适应地为不同年龄阶段的样本赋予权重,并基于加权后的损失函数更新分类模型参数;4重复步骤3,直至样本权重和模型参数收敛为止,并得到更新后的分类模型;4利用更新后的分类模型对短文本进行情感分类。本发明能去除情感分类模型对年龄的偏见,从而完成更加精准和公平的情感分类。
本发明授权自适应加权的短文本情感分类方法、电子设备和存储介质在权利要求书中公布了:1.一种自适应加权的短文本情感分类方法,其特征在于,包括以下步骤: S1、获取评论数据中带有表情包的短文本并作为语料库,根据任意一条短文本的评论者年龄和其包含的表情包种类进行分类和数据清洗的预处理操作,得到相应带标签的短文本集合,记为其中,表示第k个年龄阶评论者的第i条短文本,表示第k个年龄阶评论者的第i条短文本的情感标签,取值为{0,1};i=1,2,…,Nk,Nk表示第k个年龄段评论者的短文本总数;k=1,2,…,K,K表示年龄阶段总数; 采用训练好的特征提取模型DeepMoji对短文本集合提取文本特征,得到短文本特征集合其中,表示第k个年龄段评论者的第i条短文本的特征向量; S2、构建一个由全连接网络组成的分类模型,并将短文本特征集合输入所述分类模型中进行处理,输出第k个年龄段评论者的第i条短文本特征的情感预测值 S3、利用式1构建分类模型的交叉熵损失L: S4、利用梯度下降法对所述分类模型进行预训练,并计算所述交叉熵损失L以更新模型参数,直到交叉熵损失L收敛为止,从而得到预训练后的分类模型; S5、对预训练后的分类模型的更新: S5.1、定义当前迭代次数为t,并初始化t=1;将预训练后的分类模型作为第t-1次迭代的分类模型; S5.2、利用式2计算第t次迭代中第k个年龄段评论者的第i条短文本的权重 式2中,α是一个取值范围在[0,100]之间的参数,η是一个取值范围在[0,3]之间的参数,exp是自然底数,表示第t-1次迭代中第k个年龄段评论者的第i条短文本的权重,当t=1时,令表示第t次迭代中分类模型对第k个年龄段评论者的第i条短文本预测的情感标签,取值范围为[0,1],当t=1时,令第t-1次迭代中分类模型对第t条短文本预测的情感标签第t-2次迭代中分类模型对第i条短文本预测的情感标签 利用式3构建第t次迭代的加权损失函数Lt: S5.2、利用梯度下降法对第t次迭代的分类模型进行训练,并最小化加权损失函数Lt以更新第t次迭代的分类模型的参数,从而得到第t+1次迭代的分类模型; S5.3、将t+1赋值给t后,返回步骤S5.1顺序执行,直至t达到最大迭代次数tmax为止,从而得到更新后的分类模型; S6、将任一短文本特征向量输入更新后的分类模型中,并输出相应短文本预测的情感类别。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人中国科学技术大学,其通讯地址为:230026 安徽省合肥市包河区金寨路96号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。