Document
拖动滑块完成拼图
个人中心

预订订单
服务订单
发布专利 发布成果 人才入驻 发布商标 发布需求

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 数据空间研究院林传文获国家专利权

数据空间研究院林传文获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉数据空间研究院申请的专利一种基于知识增强注意力网络的文本多标签分类方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119646633B

龙图腾网通过国家知识产权局官网在2025-08-01发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510169341.X,技术领域涉及:G06F18/241;该发明授权一种基于知识增强注意力网络的文本多标签分类方法是由林传文;王佐成设计研发完成,并于2025-02-17向国家知识产权局提交的专利申请。

一种基于知识增强注意力网络的文本多标签分类方法在说明书摘要公布了:本发明涉及自然语言处理技术领域,具体地说,涉及一种基于知识增强注意力网络的文本多标签分类方法。该基于知识增强注意力网络的文本多标签分类方法,包括以下步骤:输入文本数据:获取待处理的文本数据;数据预处理:清理和标准化文本数据;特征提取:为了保留文本中对分类任务有意义的信息,同时减少冗余,使用BERT预训练模型将文本转换为向量表示;创建文本分类模型,构建基于知识增强的注意力机制模型;模型训练与验证。本发明一方面通过引入外部知识库增强文本语义表示,另一方面利用改进的注意力机制提高多标签分类精度,进一步结合标签间依赖关系优化分类结果,同时本发明具有提升分类性能、适应复杂多标签场景的技术效果。

本发明授权一种基于知识增强注意力网络的文本多标签分类方法在权利要求书中公布了:1.一种基于知识增强注意力网络的文本多标签分类方法,其特征在于,包括以下步骤: S1、输入文本数据:获取待处理的文本数据; S2、数据预处理:清理和标准化文本数据; 基于实体链接技术检索外部知识,对文本中的关键实体进行语义扩展,具体操作步骤为: S241、文本实体识别,从输入文本中提取关键实体,作为与知识库关联的基础,使用预训练的模型进行实体识别,提取实体; S242、对实体进行链接,对于每个识别出的实体,在线爬取其在线知识库中的文本并选择置信度最高的,如果该文本中有不止一个实体,对每个实体都检索它们的知识库中的文本,并按该输入文本的实体顺序组合,这些组合文本被视为该文本的外部知识库,将提取的实体与外部知识库中的节点进行对齐,使用实体链接算法找到与实体对应的知识库节点,表达式如下: ,其中,表示外部知识库; S243、知识扩展,从外部知识库中提取与实体相关的关系和邻居节点,构建知识子图,设是外部知识库中的某个实体节点,其邻居节点集合为: ,则知识扩展表示为: ,其中,表示提取的知识子图,为节点的邻居节点集合; S244、知识表示嵌入,利用知识图谱嵌入方法将扩展的知识子图转换为低维嵌入向量,通过训练过程,得到实体集合的知识表示; S245、外部知识增强文本表示,将外部知识表示与输入文本嵌入结合,生成知识增强的文本表示,设输入文本嵌入为I,外部知识嵌入为,结合方式可以采用加权拼接:,其中,是对外部知识嵌入的聚合操作,和为超参数,用于平衡输入文本和外部知识的贡献,最终的知识增强文本表示可直接用于下述的多标签分类任务; S3、特征提取:为了保留文本中对分类任务有意义的信息,同时减少冗余,使用BERT预训练模型将文本转换为向量表示; S4、创建文本分类模型,构建基于知识增强的注意力机制模型; S5、模型训练与验证; S6、结果输出:输出分类结果并评估模型性能。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人数据空间研究院,其通讯地址为:230094 安徽省合肥市高新区柏堰科技园创新大道288号工投高新智谷B区;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。