鼎富智能科技有限公司穆晶晶获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉鼎富智能科技有限公司申请的专利一种实体识别模型训练方法及装置、实体识别方法及装置获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115496067B 。
龙图腾网通过国家知识产权局官网在2026-02-03发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202211067513.5,技术领域涉及:G06F40/295;该发明授权一种实体识别模型训练方法及装置、实体识别方法及装置是由穆晶晶;李健铨;胡加明设计研发完成,并于2022-09-01向国家知识产权局提交的专利申请。
本一种实体识别模型训练方法及装置、实体识别方法及装置在说明书摘要公布了:本申请提供一种实体识别模型训练方法及装置、实体识别方法及装置,应用于数据处理技术领域,其中,实体识别模型训练方法包括:获取本轮迭代对应的样本实体集;其中,本轮迭代对应的样本实体集根据第一文本表示以及第二文本表示对上轮迭代对应的样本实体集更新得到,第一文本表示为本轮迭代对应的初始实体集中的各个初始实体的文本表示,第二文本表示为上轮迭代对应的样本实体集中的各个样本实体的文本表示;根据本轮迭代对应的样本实体集对上轮迭代对应的实体识别模型进行训练,得到本轮迭代对应的实体识别模型。因此,在本申请实施例中,训练使用的样本数据无需人工标注便可以自动得到,从而可以减少训练过程中人工标注造成的成本。
本发明授权一种实体识别模型训练方法及装置、实体识别方法及装置在权利要求书中公布了:1.一种实体识别模型训练方法,其特征在于,包括: 获取本轮迭代对应的样本实体集;其中,所述本轮迭代对应的样本实体集根据第一文本表示以及第二文本表示对上轮迭代对应的样本实体集更新得到,所述第一文本表示为所述本轮迭代对应的初始实体集中的各个初始实体的文本表示,所述第二文本表示为所述上轮迭代对应的样本实体集中的各个样本实体的文本表示; 根据所述本轮迭代对应的样本实体集对上轮迭代对应的实体识别模型进行训练,得到本轮迭代对应的实体识别模型; 所述获取本轮迭代对应的样本实体集,包括:获取所述本轮迭代对应的初始实体集;将所述本轮迭代对应的初始实体集以及所述上轮迭代对应的样本实体集输入上轮迭代对应的文本表示模型中,分别得到所述本轮迭代对应的初始实体集中各个初始实体对应的第一文本表示以及所述上轮迭代对应的样本实体集中各个样本实体对应的第二文本表示;根据所述第一文本表示以及所述第二文本表示对所述上轮迭代对应的样本实体集进行更新,得到所述本轮迭代对应的样本实体集; 所述根据所述第一文本表示以及所述第二文本表示对所述上轮迭代对应的样本实体集进行更新,得到所述本轮迭代对应的样本实体集,包括:针对所述本轮迭代对应的初始实体集中的一个初始实体以及所述上轮迭代对应的样本实体集中与该初始实体的类别相同的样本实体子集,根据该初始实体对应的第一文本表示与该样本实体子集对应的第二文本表示计算该初始实体对应的实体置信度;若所述实体置信度大于实体阈值,将该初始实体加入所述上轮迭代对应的样本实体集中; 所述根据该初始实体对应的第一文本表示与该样本实体子集对应的第二文本表示计算该初始实体对应的实体置信度,包括:计算该初始实体对应的第一文本表示与该样本实体子集中的各个样本实体对应的第二文本表示之间的多个余弦相似度;将多个余弦相似度中的最大值确定为该初始实体对应的局部分数;计算该初始实体对应的第一文本表示与该样本实体子集中的各个样本实体对应的第二文本表示之间的全局分数;根据所述局部分数以及所述全局分数计算所述实体置信度; 所述计算该初始实体对应的第一文本表示与该样本实体子集中的各个样本实体对应的第二文本表示之间的全局分数,包括:计算该样本实体子集中部分样本实体对应的第二文本表示的文本表示平均值;计算所述文本表示平均值与该初始实体对应的第一文本表示之间的余弦相似度,得到所述全局分数。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人鼎富智能科技有限公司,其通讯地址为:230000 安徽省合肥市高新区习友路3333号A1楼19层-B区;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励