四川大学廖虎昌获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉四川大学申请的专利一种融合词嵌入关键词提取和基于深度学习的情感分析的在线评论多属性决策方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN117521637B 。
龙图腾网通过国家知识产权局官网在2025-09-05发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202311284490.8,技术领域涉及:G06F40/211;该发明授权一种融合词嵌入关键词提取和基于深度学习的情感分析的在线评论多属性决策方法是由廖虎昌;杨珊珊设计研发完成,并于2023-10-07向国家知识产权局提交的专利申请。
本一种融合词嵌入关键词提取和基于深度学习的情感分析的在线评论多属性决策方法在说明书摘要公布了:本发明公开了一种融合词嵌入关键词提取和基于深度学习的情感分析的在线评论多属性决策方法,包括步骤:1确定属性和关键词;2基于Vader和MHA‑BiLSTM模型的情感分析方法;3情感分类预测;4属性权重确定;5方案排序,与现有技术相比,本发明解决了:1.在属性已知的情况下,如何基于词嵌入模型和相似度计算找到特定领域下如酒店或电商产品各属性最相关的关键词;2.情感分析过程中人工标注困难以及无法识别多层次、多角度语义关系的问题;3.如何从在线评论中提取客观属性权重,以及从潜在消费者的偏好信息中提取主观属性权重的问题。
本发明授权一种融合词嵌入关键词提取和基于深度学习的情感分析的在线评论多属性决策方法在权利要求书中公布了:1.一种融合词嵌入关键词提取和基于深度学习的情感分析的在线评论多属性决策方法,其特征在于,包括如下步骤: 1确定属性和关键词 首先进行情感短语提取,提取情感短语的目的是获取消费者表达过情感的关键词,通过分析文本的依存句法结构,运用Python包spacy分析词语之间的依存句法关系,当前单词是名词,则搜索当前单词的左侧,如果左侧单词是形容词修饰语,则提取形容词和名词的情感短语,如果当前单词是动词,则查找当前单词的右侧;如果右侧单词是动词的状语修饰语,则构成动词和状语短语,按照相同的规则查找当前单词的左侧,如果名词、助动词、形容词与连词的组合时,则从助动词开始,分别从左右搜索,得到形容词和名词的短语,如果存在连词,就会得到多组情感短语; 从情感短语中提取高频词作为候选关键词,基于Glove模型和相似度计算,从高频数据集中确定各属性下的关键词;如公式1所示,在高频数据集中,βj表示第jth个属性的词向量,βθ表示高频词数据集中第θth个词汇的词向量,表示高频词的个数,我们选择与每个属性相似程度最高的单词作为该属性的关键词; 2基于Vader和MHA-BiLSTM模型的情感分析方法 在确定了属性和相应的关键词后,采用Vader和MHA-BiLSTM相结合的情感分析方法来分析包含这些关键词的句子的情感; 首先,从评论中删除日期、时间、地址和标点符号,并将单词转换为小写,接下来,对句子进行分词,将每个句子划分为单词,然后,删除经常使用但毫无意义的停用词; 采用Vader分析训练数据集并生成情感分数,根据复合得分,细粒度情感极性由公式2确定; 然后运用MHA-BiLSTM模型对基于Vader标记的数据集进行多标签情感分类,在BiLSTM完成上下文语义特征提取后,MHA和BiLSTM的结合旨在通过MHA机制分配权重来突出关键特征,该模型由嵌入层、双向LSTM层、MHA层、全连接层和输出层组成,首先,嵌入层通过Glove模型将句子映射为词向量,然后,双向LSTM层将词向量转换为高维特征向量,这一层通过前向和后向学习文本中的语义关系,接着,MHA层生成注意权重矩阵,利用注意度对BiLSTM输出向量进行加权,从不同的角度增强对重要特征的关注,提高分类的准确性,全连接层使用校正的线性单元Relu作为激活函数来对高维特征降维,并将其传递给输出Softmax层,最后,输出层预测输入数据的标签,运用Softmax函数实现多分类任务,Softmax层将根据类别数输出多个概率值,概率值越高,属于相应类别的可能性越大; 3情感分类预测 利用训练后的MHA-BiLSTM模型对未标记数据集进行情感预测,MHA-BiLSTM模型的输出分别表示句子属于“非常消极”“消极”“中性”“积极”和“非常积极”的概率,概率最大的类别是句子的情感分类,然后,将所有标记好的数据集作为原始数据集,用于识别关于各属性的情感; 首先,确定每个句子中包含的关键词和对应的属性,然后,根据MHA-BiLSTM的分类结果确定句子的情感,接着计算各属性下每种情感的频率分布,情感表达为语言术语,频率表示为概率,采用语言术语集{s-2=verynegative,s-1=negative,s0=neutral,s1=positive,s2=verypositive}来描述消费者群体的意见,情感分析的结果被表示为其中代表方案u在属性j下的情感类别r,p*r表示属于情感类别r的概率,最后将每个方案下的概率语言术语作为评价信息输入到决策方法中; 4属性权重确定 属性的客观权重与相应关键词的表现密切相关,关键字的频率越高,说明相应的属性被提及的频率越高,这表明消费者群体对该属性的重视程度更高,从这个意义上讲,第j个属性的客观权重由公式3确定,其中,ηkj表示jth属性下的kth关键词被不同的词修饰的数量占所有关键词被不同的词修饰的数量的比率,q表示第j个属性下的关键词个数, 接下来确定主观权重,潜在客户主观地评估属性的重要性,并生成关于属性重要性的成对比较矩阵,采用BWM方法计算主观权重,计算属性主观权重的步骤如下:第一,潜在客户确定最佳属性cB和最差属性cW,然后,确定最佳属性比其他属性的偏好度lBj∈{1,2,…,9}j=1,2,...n,其中不同的数字代表不同的重要级别,同样,确定其他属性相对于最差属性的偏好度ljW∈{1,2,…,9} j=1,2,...n,通过求解模型1求出主观属性权重wj sj=1,2,...n; 模型1 minξ s.t. |wB s-lBjwj s|≤ξwj s |wj s-ljWwW s|≤ξwW s wj s≥0 采用一致性指标来衡量成对比较的可靠性,通过将lBW∈{1,2...9}引入公式4,可以得到不同lBW下的一致性指标,在此基础上,利用公式5求出一致性比率,将主观权重和客观权重结合起来,通过公式6求出属性的最终权重, ξ2-2lBW+1ξ+lBW 2-lBW=04 5方案排序 假设对备选方案u和备选方案v的评价被分别表示为和设: 其中,F为语义标度函数,是备选方案u和备选方案v之间的正向语义差异,αujr和αvjr是和的下标,则au在属性cj下相对于av的优势可以被表示为: 在此基础上,利用公式9对优势进行归一化处理,au在属性cj下的获得优势分数通过公式10获得,净获得优势得分通过公式11获得,损失优势分数被表示为公式12,净损失优势分数用公式13来计算, 在此基础上,得到基于DS1au的降序集R1={ra1a1,ra1a2,...ra1am}和基于DS2au升序集R2={ra2a1,ra2a2,...ra2am},然后,运用公式14对DS1au和DS2au归一化处理,根据两个等级集和优势分数,通过公式15计算集体得分,最后的排序R={raa1,raa2,...raam}由BSauu=1,2,...m的降序排列得到,
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人四川大学,其通讯地址为:610065 四川省成都市武侯区一环路南一段24号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。