浙江理工大学罗志一获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉浙江理工大学申请的专利基于领域文本分类的知识抽取和融合方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119538934B 。
龙图腾网通过国家知识产权局官网在2025-12-16发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411428929.4,技术领域涉及:G06F40/30;该发明授权基于领域文本分类的知识抽取和融合方法及系统是由罗志一;颜思瑞;骆淑云设计研发完成,并于2024-10-14向国家知识产权局提交的专利申请。
本基于领域文本分类的知识抽取和融合方法及系统在说明书摘要公布了:本发明公开了一种基于领域文本分类的知识抽取和知识融合方法及系统,方法按如下步骤:S1.构建领域知识文本数据集;S2.构建基于ChatGPT的领域知识抽取框架,抽取步骤S1中领域知识文本数据集所蕴含的领域知识;S3.构建基于对比学习和词分类的多任务学习知识融合框架,将步骤S2中获取的领域知识与深度语言模型进行融合。本发明降低了高质量领域知识的获取难度,同时提高语言模型与领域知识的融合程度。
本发明授权基于领域文本分类的知识抽取和融合方法及系统在权利要求书中公布了:1.基于领域文本分类的知识抽取和知识融合方法,其特征在于,包括按如下步骤: S1.构建领域知识文本数据集; S2.构建基于ChatGPT的领域知识抽取框架,抽取步骤S1中领域知识文本数据集所蕴含的领域知识; S3.构建基于对比学习和词分类的多任务学习知识融合框架,将步骤S2中获取的领域知识与深度语言模型进行融合; 步骤S3中,根据步骤S2获取的领域知识的格式,构建基于对比学习和词分类的多任务学习知识融合框架,该框架包含三个学习任务:全词掩码任务、词对比学习任务以及词分类任务;全词掩码任务将随机掩码任务的掩码单位由字改为词; 步骤S3中,词对比学习任务的具体如下: 在全词掩码任务的基础上,给出句子A{x1,x2,x3,x4,x5,x6,x7},将x4与x5掩码掉得到句子A1{x1,x2,x3,[MASK],x6,x7},将词汇{x4,x5}的模型输出向量作为A1句子对应掩码输出向量的正样本,将同一个批次数据中的其他词汇作为A1句子对应掩码输出向量的负样本;其中,对比学习损失函数的计算公式如下: 式中:为,表示训练同一个批次中[MASK]的数量,表示第i个[MASK]通过模型表示的文本表征向量;为,表示第i个[MASK]对应的真实标签通过模型表示的文本表征向量,即的正样本向量表示;为设置的超参数;表示计算和两个向量的余弦相似度,计算公式如下: ; 步骤S3中,词分类任务的具体如下: 在全词掩码任务的基础上,给出句子A{x1,x2,x3,x4,x5,x6,x7},将x4与x5掩码掉得到句子A1{x1,x2,x3,[MASK],x6,x7},将[MASK]的输出向量作为分类层的输入,同时将步骤S2得到的{x4,x5}分类类别信息作为分类标签计算词分类任务损失;其中,词分类任务损失函数的计算公式如下: 式中,表示分类的类别数量,表示当前数据的真实标签向量,维度为1×,表示该数据第i个维度的真实标签值,表示当前数据的预测标签向量,即该数据通过模型以及分类层之后的分类向量,表示该数据第i个维度的预测标签值。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人浙江理工大学,其通讯地址为:310018 浙江省杭州市钱塘区白杨街道2号大街928号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励