广东工业大学李荣臻获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉广东工业大学申请的专利基于多模态特征融合和图卷积的短文本分类方法与系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115982361B 。
龙图腾网通过国家知识产权局官网在2025-07-29发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202310007806.2,技术领域涉及:G06F16/353;该发明授权基于多模态特征融合和图卷积的短文本分类方法与系统是由李荣臻;张灵设计研发完成,并于2023-01-04向国家知识产权局提交的专利申请。
本基于多模态特征融合和图卷积的短文本分类方法与系统在说明书摘要公布了:本发明公开一种基于多模态特征融合和图卷积的短文本分类方法与系统,涉及计算机自然语言处理的技术领域,包括:获取短文本数据和对应标签,将预处理后的短文本数据转化为文本图,包括文档节点、单词节点、文档‑单词的边和单词‑单词的边;将单词节点与对应标签输入文本向量子模型,获得文档节点初始特征和文本特征,将文档节点初始特征嵌入到文本图中;将优化后的文本图输入图卷积网络子模型,获得文本图最终特征,与文本特征融合,获得最终分类特征,计算预测分类概率;设置交叉熵损失函数,对分类模型进行优化,利用优化后的短文本分类模型进行分类,获得待分类短文本数据的类别。本发明能够有效提升短文本分类的准确性和分类模型的泛化能力。
本发明授权基于多模态特征融合和图卷积的短文本分类方法与系统在权利要求书中公布了:1.一种基于多模态特征融合和图卷积的短文本分类方法,其特征在于,包括: S1:获取短文本数据和对应的标签,对短文本数据进行预处理,获得预处理后的短文本数据; S2:将预处理后的短文本数据转化为文本图,所述文本图包括文档节点、单词节点、文档-单词的边和单词-单词的边; 将预处理后的短文本数据转化为文本图的具体方法为: 将预处理后的短文本数据中的所有文档作为文档节点,将预处理后的短文本数据中的所有单词作为单词节点;利用PMI算法计算单词间的边权,实现单词间连边,获得单词-单词的边;利用改进的词频统计算法计算单词与文档间的边权,实现单词与文档的连边,获得文档-单词的边; 利用改进的词频统计算法计算单词与文档间的边权,实现单词与文档的连边,获得文档-单词的边的具体方法为: 式中,TF_IDF_Proti,dj表示单词ti和文档dj的边权,表示单词ti在文档dj中出现的次数,表示文档dj中所有单词的频数;|D|表示预处理后的短文本数据中的文档数,|{j:ti∈dj}|表示包含文档dj中单词ti的文档数;N表示预处理后的短文本数据中的单词总数,表示单词ti在预处理后的短文本数据中出现的总次数; S3:构建短文本分类模型,包括文本向量子模型和图卷积网络子模型; S4:将单词节点及其对应的标签输入文本向量子模型,获得文档节点初始特征和文本特征;并将文档节点初始特征嵌入到文本图中,获得优化后的文本图; S5:将优化后的文本图输入图卷积网络子模型,获得文本图最终特征; S6:对文本特征和文本图最终特征进行融合,获得最终分类特征,并计算短文本数据的预测分类概率; S7:设置交叉熵损失函数,对短文本分类模型进行优化,调整短文本分类模型的模型参数,获得优化后的短文本分类模型; S8:获取待分类短文本数据,输入优化后的短文本分类模型,获得待分类短文本数据的预测分类概率,确定待分类短文本数据的类别。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人广东工业大学,其通讯地址为:510060 广东省广州市越秀区东风东路729号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。