南京大学吴震获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉南京大学申请的专利一种基于环结构网格标记的隐式情感三元组抽取方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN116244436B 。
龙图腾网通过国家知识产权局官网在2025-11-07发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202310177676.7,技术领域涉及:G06F16/353;该发明授权一种基于环结构网格标记的隐式情感三元组抽取方法是由吴震;王仁杰;戴新宇;何亮;张建兵;黄书剑;陈家骏设计研发完成,并于2023-02-24向国家知识产权局提交的专利申请。
本一种基于环结构网格标记的隐式情感三元组抽取方法在说明书摘要公布了:本发明提出了一种基于环结构网格标记的隐式情感三元组抽取方法,包括:构建人工标注的情感三元组数据集,包含待抽取的文本以及情感三元组信息;划分训练集、验证集和测试集;使用基于环的网格标签标注方法,结合情感三元组信息对文本进行网格标签标注,得到实体标签和网格标签;对环结构网格标记模型进行训练;验证评估模型,预测出实体标签与网格标签,并抽取对应的情感三元组;重复上述两个步骤直至模型收敛,保留验证集中最优模型作为最终模型,使用最终模型进行测试集上的F1分数评估;利用最终模型,对网络上的真实文本数据进行隐式情感三元组抽取。
本发明授权一种基于环结构网格标记的隐式情感三元组抽取方法在权利要求书中公布了:1.一种基于环结构网格标记的隐式情感三元组抽取方法,其特征在于,包括以下步骤: 步骤1,构建人工标注的情感三元组数据集,所述数据集中包含待抽取的文本以及情感三元组信息;对所述数据集进行划分,分为:训练集、验证集和测试集; 步骤2,使用基于环的网格标签标注方法,结合情感三元组信息对步骤1中所述的数据集中的文本进行网格标签标注,得到实体标签和网格标签; 步骤3,结合训练集中得到的实体标签与网格标签对环结构网格标记模型进行训练; 步骤4,验证评估环结构网格标记模型,使用验证集中的数据输入至环结构网格标记模型,预测出实体标签与网格标签,并抽取对应的情感三元组; 步骤5,重复步骤3和步骤4直至模型收敛,使用验证集对模型进行验证,保留验证集中最优模型作为最终模型,使用最终模型进行测试集上的F1分数评估; 步骤6,利用最终模型,对网络上的真实文本数据进行隐式情感三元组抽取; 其中,步骤2中所述的进行网格标签标注,具体方法包括: 步骤2-1,一维实体标签构造; 步骤2-2,二维网格标签构造; 步骤2-1中所述的一维实体标签构造,具体包括: 将方面项和评价项作为一维实体标签构造的依据,在抽取文本中所有词时,若当前词属于某项方面项中,则当前词的标签为1,若当前词属于评价项,则标签为2,否则标签为0;一维实体标签集合为{0,1,2}; 步骤2-2中所述的二维网格标签构造,具体包括: 将文本中的每个词看成一个节点构成二维网格,所述网格中Ri,j表示第i个词与第j个词存在的有向边关系,在方面项和评价项构成的顺序索引列表间建立有向边,方法如下: 当长度为n的方面项Aspect位于长度为m的评价项Opinion前面时,其中Aspect={A1,A2,…,An},An为Aspect中第n个词,Opinion={O1,O2,…,Om},Om为Opinion中第m个词,构建顺序索引列表{A1,A2,…,An,O1,O2,…,Om};从左到右依次在A1与A2,A2与A3,…,An与O1,O1与O2,…建立有向边,即实体关联有向边;根据上述实体关联有向边构造网格标签,所述实体关联有向边标签分为四类:{A-A,A-O,O-O,O-A},其中,A-A表示是一个方面项中的词指向方面项中的词,A-O表示是一个方面项词指向评价项词,O-A标签以及O-A标签同理; 将顺序索引列表中最后一个词与第一个词建立一条有向边,即情感关联有向边,根据上述情感关联有向边构造网格标签,所述情感关联有向边标签分为三类:{Pos,Neg,Neu},表示三元组蕴含的情感极性,Neg为消极的,Neu为中性的,Pos为积极的,顺序索引列表若只存在唯一项,则只建立情感极性的有向边; 当方面项Aspect位于评价项Opinion后,或三元组中存在隐式表达,三元组同理可以表示成唯一的有向环; 网格标签中对于无有向边的标记为None; 得到网格标签集合为{A-A,A-O,O-O,O-A,Pos,Neg,Neu,None}; 步骤4中所述的根据得到的标签预测结果抽取对应的情感三元组,即采用基于环的网格标签解码方法,具体包括: 步骤4-1,若所述二维网格中不含对角线的右上三角中存在Ri,j预测结果属于{A-A,A-O,O-O,O-A},则表示存在第i个词到第j个词的有向边,得到有向边集合E;所述二维网格不含对角线的左下三角中存在Rj,i预测结果属于{Pos,Neg,Neu},则表示存在起始为第i个词,终止为第j个词的情感三元组,在有向边集合E构成的图G中使用深度优先算法或广度优先算法寻找所有第i个词指向第j个词的路径,将每条搜索到的路径与其对应的情感极性信息组成环,供下一步校验;所述二维网格对角线中存在Ri,i预测结果属于{Pos,Neg,Neu},则表示为仅含有一个词的隐式情感三元组,根据预测的实体标签结果判断为方面项或评价项或不合法项; 步骤4-2,环校验:对于搜索到的所有的环进行校验,判断环是否为合法的情感三元组,进行过滤,最终将所有合法的情感三元组返回。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人南京大学,其通讯地址为:210023 江苏省南京市栖霞区仙林大道163号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励