东南大学杨鹏获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉东南大学申请的专利一种基于最优传输理论的关键词生成方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115774995B 。
龙图腾网通过国家知识产权局官网在2026-02-27发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202211538484.6,技术领域涉及:G06F40/284;该发明授权一种基于最优传输理论的关键词生成方法是由杨鹏;殷国顺;姚雨;赵广振设计研发完成,并于2022-12-02向国家知识产权局提交的专利申请。
本一种基于最优传输理论的关键词生成方法在说明书摘要公布了:本发明公开了一种基于最优传输理论的关键词生成方法,如图1所示,方法包括以下步骤:步骤1:数据预处理;步骤2:损失函数构建;步骤3:模型训练;步骤4:模型测试与评估。本发明基于最优传输理论构建损失函数,加强模型捕获文本语义信息的能力,进而使得模型能够生成更加贴合文本语义的关键词,降低与文本语义无关甚至相悖的缺失关键词的出现,提升关键词的质量。
本发明授权一种基于最优传输理论的关键词生成方法在权利要求书中公布了:1.一种基于最优传输理论的关键词生成方法,其特征在于,所述方法包括如下步骤: 步骤1:数据预处理, 步骤2:损失函数构建, 步骤3:模型训练, 步骤4:模型测试与评估, 其中,步骤2:损失函数构建,具体如下:其实施分为以下子步骤: 子步骤2-1:最优传输模型构建,最优传输问题是用来计算将一个位置集合上的可切分的“货物”运输到另一个位置集合上上的最低运输费用的开销,中每个位置需要运输的“货物”数量记,中每个位置上接受的“货物”数量记为,记为从位置传输一个单位质量的“货物”到位置的开销,且,在给定、与,可以计算出最小开销的分配矩阵:, 将关键词生成问题抽象成最优传输问题,为文本的序列,为模型预测的关键词序列分别对应P与Q,需要将中每个token的语义转移到中的token,如果预测的关键词与文本语义上越一致,那么该转移的最优传输费用就会越小, 子步骤2-2:结合Attention的和的动态生成,当被送入BART的编码器中,得到中间向量表示: 其中是向量的维度,然后BART的解码器根据与之前的预测输出,得到第t步的token的概率与最后一层的Attention的权重: 其中是AttentionHead的数量, 接着收集所有解码步骤的Attention权重,记为: 其中,,A可以看成每个token之间的关注度,根据来动态的赋予和的值: 子步骤2-3:单位传输代价矩阵C的定义,使用token的词向量之间的余弦相似度计算单位代价: 其中代表token的词向量表示,预测出来的token的词向量表示为,代表所有的词向量矩阵,最终,可以获得单位传输代价矩阵: 子步骤2-4:计算最优传输距离,在获取到,以及代价矩阵之后,采用IPOT算法得到最优传输矩阵并得到相应的损失函数: 子步骤2-5:传统的最大似然估计损失函数的计算,计算最大似然估计MLE损失函数: 子步骤2-6:整合损失函数,在得到和之后,将他们加权相加得到最终的损失函数:
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人东南大学,其通讯地址为:210096 江苏省南京市玄武区四牌楼2号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励