Document
拖动滑块完成拼图
个人中心

预订订单
服务订单
发布专利 发布成果 人才入驻 发布商标 发布需求

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 北京中景华智科技有限公司秦永辉获国家专利权

北京中景华智科技有限公司秦永辉获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉北京中景华智科技有限公司申请的专利一种基于证据深度学习的命名实体识别方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN118114673B

龙图腾网通过国家知识产权局官网在2025-07-29发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202410392962.X,技术领域涉及:G06F40/295;该发明授权一种基于证据深度学习的命名实体识别方法及系统是由秦永辉;胡梦婷设计研发完成,并于2024-04-02向国家知识产权局提交的专利申请。

一种基于证据深度学习的命名实体识别方法及系统在说明书摘要公布了:本发明公开一种基于证据深度学习的命名实体识别方法及系统。该方法包括:获取命名实体识别数据集;对命名实体识别数据集进行预处理,得到处理后的命名实体识别数据集;对处理后的命名实体识别数据集进行特征提取,得到特征数据;构建基于迪利克雷模型的证据深度学习模型;根据所述特征数据和用于不确定性质量优化的不确定性引导的损失函数对所述基于迪利克雷模型的证据深度学习模型进行训练,得到命名实体识别模型;根据命名实体识别模型进行命名实体识别。本发明能够克服现有命名实体识别技术中的局限性。

本发明授权一种基于证据深度学习的命名实体识别方法及系统在权利要求书中公布了:1.一种基于证据深度学习的命名实体识别方法,用于从文本中识别并分类特定类型的实体,其特征在于,所述方法包括: 获取命名实体识别数据集; 对所述命名实体识别数据集进行预处理,得到处理后的命名实体识别数据集; 对所述处理后的命名实体识别数据集进行特征提取,得到特征数据; 构建基于迪利克雷模型的证据深度学习模型; 根据所述特征数据和用于不确定性质量优化的不确定性引导的损失函数对所述基于迪利克雷模型的证据深度学习模型进行训练,得到命名实体识别模型; 根据所述命名实体识别模型进行命名实体识别; 对于Seq2Seq模型,选择一个基于指针的模型,因此不需要学习整个词汇表; 对于第i个样本,隐藏表示h被送入全连接层以输出logits,然后将logits转换为狄利克雷参数α;最后,只需要进行一次前向计算即可计算出不确定性; 所述基于迪利克雷模型的证据深度学习模型包括置信度和不确定度,其中所述置信度伟分配给每个类别的证据的概率,所述不确定度用于提供不确定性估计,所述不确定度使用基准类别的信念质量来计算每个实例的类别级别不确定性,以调整损失; 其中,构建基于迪利克雷模型的证据深度学习模型;具体步骤如下: 对于C类分类任务中的第i个样本xi,DBM用激活函数层,替换神经网络的Softmax层,以确保网络输出非负值,这些值被认为是支持分类的证据ei是整个网络的输出; 分类证据根据ei构建迪利克雷分布,该分布建模了不同类别的分布,通过这个分布获得具体的类别信息,即分类证据; 然后,使用这些证据构建一个迪利克雷分布,该分布建模了不同类别的分布;为此,Dirichlet分布的参数通过以下方式获得:αi=ei+1,其中1表示由C个元素为1的向量;最后,Dirichlet分布的密度函数为: 其中Bαi是C维多项式beta函数,pc是每个类别的概率;为了学习模型参数,给定样本xi,yi,其中yi是样本xi的C维独热标签,通过组合交叉熵分类损失和KL惩罚损失来构建优化目标; 其中ψ·是digamma函数,Si表示Dirichlet强度,λ1是平衡因子,Dirpi|1是等效于均匀分布的特殊情况,表示掩码参数,⊙表示Hadamard乘积,ai表示预测参数,KL代表KL散度; 将输入送给模型后,模型产生预测,将预测的结果与标签进行对比,计算损失,利用该损失进行反向传播,从而优化模型; 为OOVOOD实体分配较高的不确定性有助于实现OOVOOD实体的检测,然而,在训练期间没有真实的OOVOOD样本可用将困难样本视为经过充分模型训练后仍然发生错误预测的OOVOOD样本,这些样本通常是离群点,通过这种方式,使模型能够检测OOVOOD数据,具体而言,不确定性质量优化UNM通过将一个不确定性质量惩罚项添加到错误预测的样本中,将更高的不确定性分配给容易产生错误的样本,以表达缺乏证据的情况,计算如下: y^i是预测类别,yi是真实类别,λ2是一个递减系数,计算如下:λ2=λ0exp{-lnλ0Tt},其中λ2∈[λ0,1],λ01是一个小的正常数,t是当前训练时期,T是训练epoch的总数;随着训练epocht向T增加,因子λ2将从λ0单调增加到1.0,这允许网络最初专注于优化分类,并随着训练的进行逐渐将其重点转移到优化UNM,exp是以常数e为底数的指数函数,ln是以e为底的对数函数; u是不确定性质量,计算如下: C是类别总数。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人北京中景华智科技有限公司,其通讯地址为:102100 北京市延庆区中关村延庆园东环路2号楼2363室;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。