浙江大学覃博获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉浙江大学申请的专利一种多价值链问题文本分类方法和装置获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115757773B 。
龙图腾网通过国家知识产权局官网在2026-01-13发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202211355585.X,技术领域涉及:G06F16/353;该发明授权一种多价值链问题文本分类方法和装置是由覃博;王宏伟;马祖扬;张和明设计研发完成,并于2022-11-01向国家知识产权局提交的专利申请。
本一种多价值链问题文本分类方法和装置在说明书摘要公布了:本发明公开了一种多价值链问题文本分类方法,包括:对企业里各业务检索平台中用户检索的问句进行收集与文本类别标签标注,得到多价值链问题文本的数据集;将数据集进行预处理并划分为训练文本集与测试文本集,并进行词向量提取,基于训练文本集,用提取后的词向量与标注的文本类别标签,构建全连接网络图,并对初始标签图注意力模型进行训练,得到训练完毕的标签图注意力模型;基于训练文本集提取的词向量,对初始文本语义抽取模型进行训练得到训练完毕的文本语义抽取模型;根据训练完毕的文本语义抽取模型对测试文本集进行语义抽取,根据训练完毕的标签图注意力模型对测试文本集进行分类。采用本发明可以实现多价值链问题文本的智能分类。
本发明授权一种多价值链问题文本分类方法和装置在权利要求书中公布了:1.一种多价值链问题文本分类方法,其特征在于,所述方法包括: S1、对企业里各业务检索平台中用户检索的问句进行收集与文本类别标签标注,得到多价值链问题文本的数据集; S2、将所述问题文本数据集进行预处理,将预处理后的问题文本数据集划分为训练文本集与测试文本集; S3、对所述训练文本集与所述测试文本集进行词向量提取,基于所述训练文本集,用提取后的词向量与标注的文本类别标签,构建全连接网络图; S4、基于所述全连接网络图,对初始标签图注意力模型进行训练,得到训练完毕的标签图注意力模型; S5、基于所述训练文本集提取的词向量,对初始文本语义抽取模型进行训练,得到训练完毕的文本语义抽取模型; S6、根据训练完毕的文本语义抽取模型,对所述测试文本集进行语义抽取,根据训练完毕的标签图注意力模型,对所述测试文本集进行分类; 所述S4中基于全连接网络图,训练初始标签图注意力模型为GNN-Attention模型,所述GNN-Attention模型包括GNN子模型与Attention子模型; 所述GNN子模型用于得到每个类别标签节点的输出特征; 所述Attention子模型用于控制在GNN子模型中的节点间的注意力权重分配; 所述GNN-Attention模型的训练过程包括: 根据下述公式2对GNN-Attention模型中节点的特征向量进行迭代更新; 其中,σ0表示sigmoid激活函数,Wk表示GNN第k次迭代时的参数矩阵,k∈[1,K],其中K∈R+,K1,为预设的常数,Nv表示节点v的所有邻居节点,|Nv|表示Nv的大小,表示第k-1次迭代时节点u的特征向量,是节点v在第k-1次迭代时的特征向量,是第k次迭代时节点v的输出向量,Bk是第k次迭代时的偏置参数,k为1表示第一次迭代,所有参数都随机初始化,αvu表示节点u和节点v之间的注意力权重,定义如下述公式3表示; 其中,evu定义如下述公式4得到; 其中,a表示一种计算注意力权重的函数; 所定义损失函数为类均衡标签相似度损失函数,如下述公式5: 其中m表示将整个训练文本集分成的批次的数量,b表示批次的下标,nb表示下标为b的批次里训练文本的数量,i表示某一批次内训练文本的下标,L表示类别标签的总个数,sj表示第j个标签出现在整个训练文本集里的频次,gbi表示在下标为b的批次里下标为i的训练文本对应的类别标签,zbi表示在下标为b的批次里下标为i的训练文本在全连接图中对应的节点下标,zbgbi表示类别标签gbi在全连接图中所对应的节点下标,Wc表示对训练文本节点进行线性变换的参数矩阵,Wl表示对标签节点进行线性变换的参数矩阵,K为前述的迭代的总次数; 根据上述类均衡标签相似度损失函数,采用批量梯度下降算法对GNN-Attention模型中的参数进行更新,得到训练完毕的标签图注意力模型。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人浙江大学,其通讯地址为:310012 浙江省杭州市西湖区余杭塘路866号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励