桂林电子科技大学林乐平获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉桂林电子科技大学申请的专利一种文本匹配方法、装置、系统以及存储介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN117131153B 。
龙图腾网通过国家知识产权局官网在2025-11-25发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202310928224.8,技术领域涉及:G06F16/334;该发明授权一种文本匹配方法、装置、系统以及存储介质是由林乐平;石玉博;蔡晓东设计研发完成,并于2023-07-26向国家知识产权局提交的专利申请。
本一种文本匹配方法、装置、系统以及存储介质在说明书摘要公布了:本发明提供一种文本匹配方法、装置、系统以及存储介质,属于文本匹配领域,方法包括:导入原始文本数据集,对原始文本数据集进行分词处理得到多个分词后文本句子;将所有分词后文本句子两两分为一组得到多个分词后文本句子组;分别对各个分词后文本句子组进行更新得到目标文本句子组;分别对各个目标文本句子组进行预测,得到文本匹配结果。本发明提高了特征提取的效果,增强了数据效率以及模型的泛化能力,同时,减少了计算量,较好的节省了训练成本,能够更好的获取句子的全局信息,解决了长文本匹配中的长程依赖等问题。
本发明授权一种文本匹配方法、装置、系统以及存储介质在权利要求书中公布了:1.一种文本匹配方法,其特征在于,包括如下步骤: 导入原始文本数据集,对所述原始文本数据集进行分词处理,得到多个分词后文本句子; 将所有所述分词后文本句子两两分为一组,得到多个分词后文本句子组; 分别对各个所述分词后文本句子组进行更新,得到与各个所述分词后文本句子组对应的目标文本句子组; 分别对各个所述目标文本句子组进行预测,得到与各个所述目标文本句子组对应的预测分数,并将所有所述预测分数作为文本匹配结果; 所述分别对各个所述分词后文本句子组进行更新,得到与各个所述分词后文本句子组对应的目标文本句子组的过程包括: 通过预训练模型SimBERT分别对各个所述分词后文本句子组进行向量化处理,得到与各个所述分词后文本句子组对应的隐藏层文本向量; 分别对各个所述隐藏层文本向量进行向量更新,得到与各个所述分词后文本句子组对应的更新后文本向量; 分别对各个所述隐藏层文本向量以及与各个所述分词后文本句子组对应的更新后文本向量进行拼接,得到与各个所述分词后文本句子组对应的目标文本句子组; 所述分别对各个所述隐藏层文本向量进行向量更新,得到与各个所述分词后文本句子组对应的更新后文本向量的过程包括: 通过Bi-LSTM模型分别对各个所述隐藏层文本向量进行全局词义的提取,得到与各个所述分词后文本句子组对应的全局词义向量,所述全局词义向量包括多个全局词义节点; 分别对与各个所述分词后文本句子组对应的多个全局词义节点进行节点更新,得到与各个所述分词后文本句子组对应的多个更新后全局词义节点; 通过第一式分别对与各个所述分词后文本句子组对应的多个更新后全局词义节点进行最大池化处理,得到与各个所述分词后文本句子组对应的更新后文本向量,所述第一式为: 其中,convx为第x个分词后文本句子组对应的更新后文本向量,maxpool为最大池化函数,ReLU为激活函数,为第x个分词后文本句子组对应的第i个更新后全局词义节点,U为权重矩阵,b为偏置; 所述分别对与各个所述分词后文本句子组对应的多个全局词义节点进行节点更新,得到与各个所述分词后文本句子组对应的多个更新后全局词义节点的过程包括: 通过第二式分别计算各个所述全局词义节点与剩下的全局词义节点的注意力系数,得到与各个所述分词后文本句子组对应的多个注意力系数,所述第二式为: 其中,αijx为第x个分词后文本句子组对应的第i个全局词义节点与第j个全局词义节点的注意力系数,LeakyReLU为激活函数,为自注意力矩阵,W为权值矩阵,为第x个分词后文本句子组对应的第i个全局词义节点,为第x个分词后文本句子组对应的第j个全局词义节点,为第x个分词后文本句子组对应的第k个全局词义节点,为第x个分词后文本句子组对应的除了第i个全局词义节点之外的全局词义节点; 通过第三式分别对与各个所述分词后文本句子组对应的多个注意力系数以及与各个所述分词后文本句子组对应的多个全局词义节点进行节点更新的计算,得到与各个所述分词后文本句子组对应的多个更新后全局词义节点,所述第三式为: 其中,为第x个分词后文本句子组对应的第i个更新后全局词义节点,αijx为第x个分词后文本句子组对应的第i个全局词义节点与第j个全局词义节点的注意力系数,为第x个分词后文本句子组对应的第j个全局词义节点,为第x个分词后文本句子组对应的第j个全局词义节点,σ为激活函数,为第x个分词后文本句子组对应的除了第i个全局词义节点之外的全局词义节点,W为权值矩阵。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人桂林电子科技大学,其通讯地址为:541004 广西壮族自治区桂林市七星区金鸡路1号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励