南京大学杨登峰获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉南京大学申请的专利一种基于人工智能大模型的快速标注方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119848549B 。
龙图腾网通过国家知识产权局官网在2025-09-16发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510047610.5,技术领域涉及:G06F18/214;该发明授权一种基于人工智能大模型的快速标注方法是由杨登峰;杨采灵;王静怡设计研发完成,并于2025-01-13向国家知识产权局提交的专利申请。
本一种基于人工智能大模型的快速标注方法在说明书摘要公布了:本发明涉及人工智能技术领域,公开一种基于人工智能大模型的快速标注方法,包括:步骤1、通过目标领域的文档集合提取特定领域的实体集合和关系集合,其中,使用实体识别技术识别文档中领域相关的名词、术语和关键词,形成实体集合,且利用关系抽取技术分析实体间的逻辑和语义关联性,生成关系集合,将实体集合与关系集合结合构建知识三元组,知识三元组包含实体与实体间的关联关系。通过引入领域知识图谱,将目标领域文档中提取的实体和关系信息结构化为知识三元组,且与待标注数据匹配优化标注的语义信息,实现标注结果的领域适配性和语义一致性,得到标注数据在专业领域中更高的准确性和一致性效果。
本发明授权一种基于人工智能大模型的快速标注方法在权利要求书中公布了:1.一种基于人工智能大模型的快速标注方法,其特征在于,包括: 步骤1、通过目标领域的文档集合提取特定领域的实体集合和关系集合,其中,使用实体识别技术识别文档中领域相关的名词、术语和关键词,形成实体集合,且利用关系抽取技术分析实体间的逻辑和语义关联性,生成关系集合,将实体集合与关系集合结合构建知识三元组,知识三元组包含实体与实体间的关联关系,将构建的知识三元组存储在图数据库中,形成领域知识图谱; 步骤2、在知识图谱的基础上,对待标注数据进行知识增强标注,将待标注数据与领域知识图谱进行匹配,根据待标注数据中出现的实体,与知识图谱中对应的实体进行关联匹配,通过查询知识图谱中实体的上下文关联关系来优化标注的语义信息,匹配过程中,依据知识三元组中的实体和关系构建的逻辑,为步骤3提供领域信息背景; 步骤3、基于知识增强标注的结果,设计动态提示模板进行优化,结合标注任务的历史数据,通过分析历史标注结果,动态调整提示模板的内容和结构,在动态提示模板中,结合知识增强标注提供的领域信息,生成特定标注任务的提示内容,以供人工智能大模型在标注任务中使用; 步骤4、利用动态提示模板和大模型对待标注数据进行初步标注,且通过主动学习的方式对未标注数据中的样本进行筛选,在筛选过程中,结合标注结果中的分类概率分布计算样本的不确定性评分,根据不确定性评分的高低对样本进行排序,依据设置的不确定性阈值挑选部分样本进行人工复核,对人工复核后的样本,将修正后的数据回传到模型训练集中,更新模型参数; 步骤5、针对多模态标注任务,利用优化的大模型对多模态数据进行标注,且在文本和图像的多模态数据中,提取文本特征向量和视觉特征向量,通过特征向量的对齐匹配实现多模态数据的协同标注,同时,针对标签的层级化结构,构建包含不同粒度的标签体系,根据标注任务的需求对标签进行优化,通过计算标签层级间的关联关系调整标注概率,生成标注结果且输出至自动化标注工作流中,完成整体的快速标注任务流程。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人南京大学,其通讯地址为:210000 江苏省南京市栖霞区仙林大道163号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。