中移(苏州)软件技术有限公司;中国移动通信集团有限公司丁辰晖获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉中移(苏州)软件技术有限公司;中国移动通信集团有限公司申请的专利一种文本分类方法、装置、设备及存储介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN116263783B 。
龙图腾网通过国家知识产权局官网在2026-01-27发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202111506316.4,技术领域涉及:G06F16/35;该发明授权一种文本分类方法、装置、设备及存储介质是由丁辰晖设计研发完成,并于2021-12-10向国家知识产权局提交的专利申请。
本一种文本分类方法、装置、设备及存储介质在说明书摘要公布了:本申请公开了一种文本分类方法、装置、设备及存储介质,该方法包括:获取文本数据;基于文本数据,确定文本数据对应的文档节点、概念节点以及单词节点的特征向量;基于文档节点、概念节点及单词节点的特征向量构建文本异构图;确定文本异构图中节点之间边的权重;基于文本异构图,得到文本数据对应的文本特征向量;使用分类函数对文本特征向量进行分类,确定文本类别。如此,通过获取概念节点的特征向量,获得了文本中的先验知识;在构建文本异构图时,融合了概念节点,可以在一定程度上缓解短文本缺乏上下文导致的特征稀疏问题,使得基于该文本异构图提取的文本特征向量可以更准确的表征文本的特征,进而提高文本分类的准确性。
本发明授权一种文本分类方法、装置、设备及存储介质在权利要求书中公布了:1.一种文本分类方法,其特征在于,所述方法包括: 获取文本数据; 基于所述文本数据,确定所述文本数据对应的文档节点的特征向量、概念节点的特征向量以及单词节点的特征向量; 基于所述文档节点的特征向量、所述概念节点的特征向量及所述单词节点的特征向量构建文本异构图; 基于概念图谱,获取文档节点对应的至少一个概念节点,以及所述文档节点与所述至少一个概念节点之间的相关性值; 基于所述相关性值确定所述文档节点与所述至少一个概念节点之间边的权重; 基于词频-逆文档频率TF-IDF算法确定所述文档节点与至少一个单词节点之间边的权重; 基于单词之间的点互信息确定单词节点与单词节点之间边的权重; 基于所述文本异构图,确定每个节点的至少一个类型注意力权重;其中,所述类型注意力权重为文档型注意力权重、概念型注意力权重或单词型注意力权重; 基于所述至少一个类型注意力权重,每个节点的特征向量,以及至少一种类型的相邻节点的特征向量,确定每个节点与相邻节点之间的节点间注意力权重; 基于所有节点与相邻节点之间的节点间注意力权重,及所有节点的特征向量,确定文本特征向量; 使用分类函数对所述文本特征向量进行分类,确定文本类别。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人中移(苏州)软件技术有限公司;中国移动通信集团有限公司,其通讯地址为:215163 江苏省苏州市高新区昆仑山路58号1幢中移软件园;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励