科大国创云网科技有限公司王颜颜获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉科大国创云网科技有限公司申请的专利一种基于知识对比增强提示的小样本文本分类方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN116881457B 。
龙图腾网通过国家知识产权局官网在2026-02-27发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202310864622.8,技术领域涉及:G06F16/353;该发明授权一种基于知识对比增强提示的小样本文本分类方法是由王颜颜;黄友志;陈政伊;许银设计研发完成,并于2023-07-13向国家知识产权局提交的专利申请。
本一种基于知识对比增强提示的小样本文本分类方法在说明书摘要公布了:本发明公开了一种基于知识对比增强提示的小样本文本分类方法,属于自然语言处理技术领域,包括以下步骤:S1:初始化连续提示;S2:知识模板生成;S3:联合训练优化;S4:掩码预测。本发明首先利用BiLSTM初始化一个可学习且具有关联性的连续提示向量,然后将预训练语言模型作为知识库,自动生成一组正、负提示模板,在此基础上结合对比学习和掩码语言模型进行联合训练,最终得到有效的连续提示嵌入进行准确的掩码预测,并提供了一种可以自动构造连续提示模板的有效方法,并在14个数据集上进行广泛的实验,结果表明该方法的准确率较最优对比模型平均提升了3.5%以上,解决小样本环境下连续提示对初始参数敏感且容易过拟合的两大问题。
本发明授权一种基于知识对比增强提示的小样本文本分类方法在权利要求书中公布了:1.一种基于知识对比增强提示的小样本文本分类方法,其特征在于,包括以下步骤: S1:初始化连续提示 使用双向长短期记忆网络初始化可学习且具有关联性的连续提示嵌入; S2:知识模板生成 将预训练的语言模型作为知识库,通过设定一组对立标签,自动生成对比学习所需要的正、负提示模板; S3:联合训练优化 利用生成的正、负提示模板,结合对比学习和掩码语言模型对连续提示嵌入进行联合训练,得到训练后的连续提示; S4:掩码预测 利用步骤S3中训练后的连续提示嵌入对输入句子进行掩码预测,得到填充掩码标记位置的标签词概率,进而完成文本分类任务; 在所述步骤S1中,具体过程如下: S11:给定一组输入x,y,通过设计模板函数T·和标签映射函数M·将文本分类任务转换为完型填空任务,其中T·用于将句子x转换为一个具有掩码标记的模型输入Tx,M·用于将标签映射为模型词表中对应的标签词My; S12:利用掩码语言模型得到掩码标记位置标签词的概率pMLM,计算公式如下: py|x=pMLM[MASK]=My|Tx 其中,pMLM表示掩码语言模型的输出概率,py|x表示给定x条件下,输出标签y的概率; S13:使用带有多层感知器的双向长短期记忆网络作为提示编码器对虚拟标记进行初始化,公式如下: 其中,和分别表示前向LSTM网络和后向LSTM网络对第i个虚拟标记ti的输出,hi表示每个虚拟标记经过提示编码器后得到的提示嵌入; S14:经过连续提示嵌入初始化后的模型输入Tx表示为: Tx={ex,h1,…,hi,e[MASK],hi+1,…,hm+1} 其中,ex和e[MASK]是句子x和[MASK]在MLM中的原始嵌入向量。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人科大国创云网科技有限公司,其通讯地址为:230088 安徽省合肥市文曲路355号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励