北京海卓飞网络科技有限公司洪丰获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉北京海卓飞网络科技有限公司申请的专利文本语义相似度计算方法、装置、设备及存储介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN116701574B 。
龙图腾网通过国家知识产权局官网在2025-09-12发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202310686371.9,技术领域涉及:G06F16/334;该发明授权文本语义相似度计算方法、装置、设备及存储介质是由洪丰设计研发完成,并于2023-06-09向国家知识产权局提交的专利申请。
本文本语义相似度计算方法、装置、设备及存储介质在说明书摘要公布了:本发明涉及文本分析技术领域,揭露了一种文本语义相似度计算方法,包括:获取待比较文本对,分别提取待比较文本对中每个文本的文本结构特征;对每个文本结构特征进行特征缩放和特征标准化处理,得到每个文本的优化文本结构特征;获取待比较文本对中每个文本的文本平面特征,将每个文本的优化文本结构特征和对应的文本平面特征结合,得到每个文本的结构‑平面特征;利用核函数,在预设的支持向量回归模型中对每个文本的结构‑平面特征进行学习,得到待比较文本对的文本相似度,并通过评分系统对文本相似度进行评分,得到文本相似度得分。本发明还提出文本语义相似度计算装置、电子设备以及存储介质。本发明可以提高文本相似度计算的准确率。
本发明授权文本语义相似度计算方法、装置、设备及存储介质在权利要求书中公布了:1.一种文本语义相似度计算方法,其特征在于,所述方法包括: 获取待比较文本对,提取所述待比较文本对中的第一文本和第二文本,对所述第一文本的第一文本分词集中的单词和所述第二文本的第二文本分词集中的单词进行配对,得到单词对应关系,分别分析所述第一文本和所述第二文本的依存关系,根据所述依存关系构建所述第一文本的第一依存关系树和所述第二文本的第二依存关系树,根据所述第一依存关系树和所述第二依存关系树,以及所述单词对应关系,得到所述第一文本的文本结构特征及所述第二文本的文本结构特征; 对每个所述文本的文本结构特征进行特征缩放和特征标准化处理,得到每个所述文本的优化文本结构特征; 将所述第一文本的字符串特征和文本扩展特征进行组合,得到所述第一文本的文本平面特征,将所述第二文本的字符串特征和文本扩展特征进行组合,得到所述第二文本的文本平面特征,将所述第一文本的优化文本结构特征和文本平面特征结合,得到所述第一文本的结构-平面特征,将所述第二文本的优化文本结构特征和文本平面特征结合,得到所述第二文本的结构-平面特征; 利用核函数,在预设的支持向量回归模型中对所述第一文本的结构-平面特征和所述第二文本的结构-平面特征进行学习,得到所述待比较文本对的文本相似度,并通过预设的评分系统对所述文本相似度进行评分,得到文本相似度得分。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人北京海卓飞网络科技有限公司,其通讯地址为:102300 北京市门头沟区石龙经济开发区永安路20号3号楼B1-3636室;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。