中国电信股份有限公司马娜获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉中国电信股份有限公司申请的专利文本相似度的确定方法、装置和计算机可读存储介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN113935387B 。
龙图腾网通过国家知识产权局官网在2026-01-27发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202010603116.X,技术领域涉及:G06F16/353;该发明授权文本相似度的确定方法、装置和计算机可读存储介质是由马娜;蔡志平;王学聪;程帅设计研发完成,并于2020-06-29向国家知识产权局提交的专利申请。
本文本相似度的确定方法、装置和计算机可读存储介质在说明书摘要公布了:本公开涉及一种文本相似度的确定方法、装置和计算机可读存储介质,涉及计算机技术领域。本公开的方法包括:根据第一文本的第一词袋特征和第二文本的第二词袋特征,确定第一文本和第二文本的相似度,作为初步相似度;根据第一文本中各个词语的重要程度确定第一文本的第一语义特征,根据第二文本中各个词语的重要程度确定第二文本的第二语义特征;将初步相似度,第一语义特征和第二语义特征,以及第一文本和第二文本的对比统计特征输入预先训练的分类模型,得到第一文本和第二文本的相似度;其中,对比统计特征包括:第一文本和第二文本的距离、第一文本和第二文本的词语的比对结果,以及第一文本和第二文本的字符比对结果中至少一项。
本发明授权文本相似度的确定方法、装置和计算机可读存储介质在权利要求书中公布了:1.一种文本相似度的确定方法,包括: 根据第一文本的第一词袋特征和第二文本的第二词袋特征,确定所述第一文本和所述第二文本的相似度,作为初步相似度; 根据所述第一文本中各个词语的重要程度确定所述第一文本的第一语义特征,包括:确定所述第一文本中各个词语的重要程度,生成第一重要度矩阵;对所述第一重要度矩阵进行奇异值分解,得到降维后的第一重要度矩阵,作为所述第一语义特征,根据所述第二文本中各个词语的重要程度确定所述第二文本的第二语义特征,包括:确定所述第二文本中各个词语的重要程度,生成第二重要度矩阵;对所述第二重要度矩阵进行奇异值分解,得到降维后的第二重要度矩阵,作为所述第二语义特征; 将所述初步相似度,所述第一语义特征和所述第二语义特征,以及所述第一文本和第二文本的对比统计特征输入预先训练的分类模型,得到所述第一文本和第二文本的相似度; 其中,所述对比统计特征包括:所述第一文本和所述第二文本的距离、所述第一文本和所述第二文本的词语的比对结果,以及所述第一文本和所述第二文本的字符比对结果中至少一项。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人中国电信股份有限公司,其通讯地址为:100033 北京市西城区金融大街31号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励