中国科学院文献情报中心王猛获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉中国科学院文献情报中心申请的专利嵌入科技文本语义特征编码的两阶段分类方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120873193B 。
龙图腾网通过国家知识产权局官网在2026-02-24发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510973914.4,技术领域涉及:G06F16/355;该发明授权嵌入科技文本语义特征编码的两阶段分类方法及系统是由王猛;李涵昱;谢靖;张智雄;李东阳;李婕;于改红设计研发完成,并于2025-07-15向国家知识产权局提交的专利申请。
本嵌入科技文本语义特征编码的两阶段分类方法及系统在说明书摘要公布了:本发明公开了嵌入科技文本语义特征编码的两阶段分类方法及系统,涉及自然语言处理技术领域,该方法包括:提取局部和全局主题特征构建主题语义特征,基于词项依存关系进行分层聚合构建结构语义特征;将二者嵌入LLMs编码层,生成融合特征序列;通过解码器提取分类特征并进行二分类判断,得到价值句序列;构建类别特征模板并计算子类语义特征;通过语义感知路由机制和混合专家模型进行多分类。本发明解决了现有文本分类无法充分利用深层语义信息,导致分类精度不足,且在类别不平衡和细粒度分类中表现不佳的技术问题,达到了通过引入双重语义特征编码和混合专家模型,显著提升分类精度,以及类别不平衡和细粒度分类能力的技术效果。
本发明授权嵌入科技文本语义特征编码的两阶段分类方法及系统在权利要求书中公布了:1.嵌入科技文本语义特征编码的两阶段分类方法,其特征在于,所述方法包括: 输入源文本序列,对所述源文本序列进行局部主题特征提取和全局主题相关性计算,构建主题语义特征; 提取获得所述源文本序列中每个词项的基础特征表示,并基于词项依存关系对所述基础特征表示进行分层特征聚合,得到聚合层析结构,根据所述聚合层析结构进行句间关系表示,构建结构语义特征; 将所述主题语义特征和所述结构语义特征嵌入至LLMs的编码层中,将所述主题语义特征替换CLS特征表示,所述结构语义特征替换SEP特征表示,生成融合特征序列; 通过LLMs的解码器对所述融合特征序列进行分类特征提取,输出分类特征向量,并基于分类器对所述分类特征向量进行二分类判断,得到价值句序列集合; 输入所述价值句序列集合和对应的类别标签,构建类别特征模板,根据所述类别特征模板的类别原型特征,计算得到子类语义特征; 基于所述子类语义特征,设计语义感知路由机制和混合专家模型,通过所述语义感知路由机制将所述价值句序列集合动态分配至所述混合专家模型进行二阶段多分类,输出文本分类结果。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人中国科学院文献情报中心,其通讯地址为:100190 北京市海淀区中关村北四环西路33号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励