江苏大学李丽莎获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉江苏大学申请的专利一种基于遗传算法的极大多标签分类方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN114138971B 。
龙图腾网通过国家知识产权局官网在2025-10-14发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202111435071.0,技术领域涉及:G06F16/35;该发明授权一种基于遗传算法的极大多标签分类方法是由李丽莎;马忠臣;毛启容;成鑫;陈松灿设计研发完成,并于2021-11-29向国家知识产权局提交的专利申请。
本一种基于遗传算法的极大多标签分类方法在说明书摘要公布了:本发明公开了一种基于遗传算法的极大多标签分类方法,将文本转化为词向量并计算各样本文本的平均词向量;接着使用k‑means算法对文本词向量空间中的样本文本聚类,在各样本对应的簇内选择若干邻居标签;然后提取样本与语义标签的联合特征表示,即将样本邻居标签向量投影到低维空间中获得其邻居标签的低维特征表示,再结合卷积神经网络提取的样本文本特征从而获得样本与语义标签的联合特征表达;继而设计网络学习度量样本与语义标签联合特征表达的损失值;最后将该损失值创造性地指导遗传算法寻找与新样本最佳匹配的语义标签,并作为该样本的预测标签。本方法通过回归样本预测标签与真实标签的汉明距离间接的还原样本的真实标签,避免了在极大多标签分类问题中巨大计算资源与时间资源消耗。
本发明授权一种基于遗传算法的极大多标签分类方法在权利要求书中公布了:1.一种基于遗传算法的极大多标签分类方法,其特征在于,包括下列步骤: 步骤1,训练词向量:除去训练文本中的特殊字符,构造连续词袋模型,利用连续词袋模型训练文本将单词转换为对应词向量; 步骤2,计算文本平均词向量:基于转换得到的单词词向量,计算每一条文本对应的平均词向量; 步骤3,基于平均词向量通过k-means算法寻找邻居标签:初始化聚类中心,以文本的标签类数为分类个数,训练得到聚类模型;在样本对应簇内为样本寻找若干邻居标签; 步骤4,训练损失值函数模型:以one-hot编码形式表示样本标签,将文本词向量与邻居标签向量作为输入,通过卷积神经网络提取文本的语义特征,通过全连接网络将邻居标签向量投影到低维空间,将提取的文本语义特征与投影到低维空间的标签信息通过全连接层回归样本邻居标签与真实标签的汉明距离,从而得到损失值函数模型;所述步骤4中训练损失值函数模型的过程如下: 步骤4.1,卷积神经网络包括卷积和池化两个部分;卷积获得的新特征ci表示为: ci=gcvTei:j16 其中,e1:j表示第i个字到第j个字的文本区域,记为ei:j∈[e1,…,em],m为文档含有的单词数;v表示卷积过滤器;gc表示卷积层的非线性激活函数; 池化获得的新特征Pc表示为: 其中,m表示一个文档含有的单词数;p表示获得的最大特征数量;max{}表示取最大值; 步骤4.2,通过一个全连接层将one-hot形式标签投影到低维空间,得到的新特征表示为: ai=Wnli18 其中,ai为邻居标签投影到低维空间的特征表示;li表示当前one-hot编码形式标签中第i个位置的元素值;Wn表示投影标签的权重矩阵; 步骤4.3,通过两层全连接层得到输出结果,表示为: y=WoghWh[Pc1,…,Pct,a1,…,aq]19 其中,Wh表示隐藏层的权重矩阵,Wo表示输出层的权重矩阵;gh表示隐藏层的非线性激活函数;Pc1,…,Pct为由卷积神经网络提取的所有文本语义特征;a1,…,aq为向低维空间投影得到的所有标签信息; 步骤4.4,选取均方误差为损失函数,通过最小化损失函数优化模型参数,其损失函数表示为: 其中,yi为模型输出的标签向量;表示样本邻居标签与样本真实标签的汉明距离;n表示样本的数量; 步骤5,通过遗传算法预测样本标签:以样本的文本词向量与样本的邻居标签向量作为解空间,在解空间中通过遗传算法得到损失值最小的若干邻居标签,将这些邻居标签的概率经过平均后得到分类概率,通过变换得到样本的预测标签;所述步骤5中通过遗传算法寻找样本最近标签的过程如下: 步骤5.1,在文本词向量与邻居标签向量空间中选择若干样本,随机产生单个交叉点,令若干样本在交叉点前后的向量序列交换;同时在文本词向量与邻居标签向量空间中再选择若干样本,随机产生单个变异点,令若干样本的变异点对应值发生改变; 步骤5.2,通过损失值函数模型计算得到各个样本的损失值,损失值越小的样本被选择概率越大,依选择概率挑选样本,从而更新种群; 步骤5.3,依照种群个体损失值的大小选择损失值最低的若干个体对应的邻居标签,对选择的邻居标签进行概率平均得到样本的分类概率,样本的分类概率表示为: 其中,k表示挑选的样本个数;q表示标签的维度;为预测样本第i个邻居标签向量第j位的值。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人江苏大学,其通讯地址为:212013 江苏省镇江市京口区学府路301号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励