成都索贝数码科技股份有限公司杨瀚获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉成都索贝数码科技股份有限公司申请的专利基于提示学习的可扩展文本信息联合抽取方法及设备获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN116578665B 。
龙图腾网通过国家知识产权局官网在2026-01-23发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202211705277.5,技术领域涉及:G06F16/31;该发明授权基于提示学习的可扩展文本信息联合抽取方法及设备是由杨瀚;朱婷婷;温序铭设计研发完成,并于2022-12-29向国家知识产权局提交的专利申请。
本基于提示学习的可扩展文本信息联合抽取方法及设备在说明书摘要公布了:本发明公开了一种基于提示学习的可扩展文本信息联合抽取方法及设备,属于自然语言处理中文本信息抽取技术领域,包括以下步骤:构建文本信息抽取标注信息的统一表示框架;基于原始数据集与扩展数据集构建统一的提示模板;构建并训练基于提示学习文本信息联合抽取模型;使用训练后的模型对输入文本进行联合信息抽取。本发明解决了数据扩展或跨领域带来的技术瓶颈,提升了联合信息抽取的准确性和鲁棒性。
本发明授权基于提示学习的可扩展文本信息联合抽取方法及设备在权利要求书中公布了:1.一种基于提示学习的可扩展文本信息联合抽取方法,其特征在于,包括以下步骤: A、构建文本信息抽取标注信息的统一表示框架; B、基于原始数据集与扩展数据集构建统一的提示模板; C、构建并训练基于提示学习文本信息联合抽取模型; D、使用训练后的模型对输入文本进行联合信息抽取; 步骤C中,所述构建并训练基于提示学习文本信息联合抽取模型包括如下子步骤: C1.设置基于Transformer网络架构的编码器,输出维度为,记为; C2.构建针对文本片段起始位置的全连接层网络模块,记为,构建针对文本片段终止位置的全连接层网络模块,记为,与的输入维度均为,输出维度均为1; C3.对指定输入三元组数据,按照进行提示与文本拼接,拼接后文本长度记为;其中,表示文本,表示提示,表示结果; C4.对拼接后的文本进行空字符补全,即在拼接文本后增加无意义空字符序列,使得的字符长度达到; C5.构建掩码向量,其中, C6.使用对进行编码,编码后的特征矩阵记为; C7.基于在中的起始位置和终止位置,构建基准结果向量,其中,除在中起始位置为1外,其余均为0,除在中终止位置为1外,其余均为0; C8.设置最大迭代次数,记录当前已完成迭代次数为; C9.计算当前迭代次数下,模型可接受的最低信息熵阈值; C10.将分别输入和,并采用sigmoid进行激活,分别得到预测向量和; C11.分别计算和的信息熵,记为和; C12.若且,则基于和分别与和计算交叉熵损失并采用反向传播进行模型训练;否则,跳过当前数据; C13.对所有组数据执行步骤C3至C12,完成一轮次组数据的训练后,令数值增加1;为数据集所有三元数据组的数量; C14.重复执行C13直到为止,得到训练后的文本信息联合抽取模型记为。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人成都索贝数码科技股份有限公司,其通讯地址为:610041 四川省成都市高新区新园南二路2号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励