Document
拖动滑块完成拼图
个人中心

预订订单
商城订单
发布专利 发布成果 人才入驻 发布商标 发布需求

请提出您的宝贵建议,有机会获取IP积分或其他奖励

投诉建议

在线咨询

联系我们

龙图腾公众号
专利交易 商标交易 积分商城 国际服务 IP管家助手 科技果 科技人才 会员权益 需求市场 关于龙图腾 更多
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 北京中科闻歌科技股份有限公司郑召获国家专利权

北京中科闻歌科技股份有限公司郑召获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉北京中科闻歌科技股份有限公司申请的专利基于大模型数据增强的文本实体识别模型构建方法和设备获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120995985B

龙图腾网通过国家知识产权局官网在2026-04-10发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202511306223.5,技术领域涉及:G06F40/14;该发明授权基于大模型数据增强的文本实体识别模型构建方法和设备是由郑召;郝艳妮;柳力多;曹家;罗引;王磊设计研发完成,并于2025-09-12向国家知识产权局提交的专利申请。

基于大模型数据增强的文本实体识别模型构建方法和设备在说明书摘要公布了:本发明提供了一种基于大模型数据增强的文本实体识别模型构建方法和设备:先构建含预处理、句法依存分析、数据修正增强、上下文编码、句法增强、表示融合及序列解码处理单元的初始模型;训练样本经预处理得预处理文本,句法分析建初步依存图;大语言模型修正并增强文本与依存图,获后续用的文本序列和依存图;编码文本序列得初始表示向量,结合依存图增强向量;融合后解码输出含词元实体标注的预测标签;用含条件随机场结构损失的函数算损失,判断收敛,未收敛则更新参数继续训练,直至得目标模型。该方法借大语言模型优化扩充数据,结合句法依存强化特征,提升复杂文本命名实体识别能力。

本发明授权基于大模型数据增强的文本实体识别模型构建方法和设备在权利要求书中公布了:1.一种基于大模型数据增强的文本实体识别模型构建方法,其特征在于,包括如下步骤: S100,构建初始的文本命名实体识别模型,所述模型包括文本预处理单元、句法依存分析处理单元、数据修正和增强处理单元、上下文表示编码处理单元、句法依存增强处理单元、表示融合处理单元及序列解码处理单元; S200,将训练样本数据输入文本命名实体识别模型,通过预处理单元进行文本预处理,生成预处理文本; S300,通过句法依存分析处理单元对预处理文本进行句法依存分析,构建初步依存图; S400,通过数据修正和增强处理单元,利用大语言模型对预处理文本和初步依存图进行修正,得到修正文本和修正依存图,以及基于修正结果,生成增强文本和增强依存图;得到用于后续处理的最终文本序列和最终依存图,所述最终文本序列包括修正文本和增强文本,最终依存图包括修正依存图和增强依存图; S500,通过上下文表示编码处理单元对所述最终文本序列进行编码,得到初始表示向量序列; S600,通过句法依存增强处理单元,基于所述最终依存图和初始表示向量序列,对初始表示向量序列进行结构增强,得到增强表示向量序列;其中,对于每个词元,该词元的增强表示向量通过聚合自身初始表示向量与依存关系关联的一阶邻居词元向量生成; S700,通过表示融合处理单元对初始表示向量序列和增强表示向量序列进行融合,得到融合表示向量序列; S800,通过序列解码处理单元对融合表示向量序列进行序列解码,输出包含词元实体类别标注的预测标签序列; S900,基于预测标签序列和真实标签序列,利用预设损失函数计算模型损失;若损失满足收敛条件,将当前模型作为目标模型;否则,更新模型参数并返回S200继续训练;其中,所述预设损失函数包括条件随机场结构损失。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人北京中科闻歌科技股份有限公司,其通讯地址为:100190 北京市海淀区北四环西路9号楼7层717室;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。