北京科杰科技有限公司高海玲获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉北京科杰科技有限公司申请的专利用于AI智能标注与纠错平台的分析系统及方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120910490B 。
龙图腾网通过国家知识产权局官网在2026-01-27发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202511453965.0,技术领域涉及:G06F18/20;该发明授权用于AI智能标注与纠错平台的分析系统及方法是由高海玲;高经郡;祝建辉设计研发完成,并于2025-10-13向国家知识产权局提交的专利申请。
本用于AI智能标注与纠错平台的分析系统及方法在说明书摘要公布了:本发明公开了用于AI智能标注与纠错平台的分析系统及方法,属于人工智能技术领域。本发明拆分图像集合和文本集合,选取种子样本执行融合标注,得到初始标注样本;基于初始标注样本,以图像集合和文本集合为拓扑节点,建立初始关联映射,形成拓扑结构;在拓扑结构节点范围内,对新进入场景的文本或图像,执行多对多匹配;对每一个成功匹配的关联对,累计其匹配频次;对每一次新的图像和文本的匹配请求,判断是否触发免标注;当触发免标注时,通过卷积神经网络进行异常判定,得到标注异常集合;构建纠错训练数据集,训练随机森林模型;随机森林模型输出特征重要性列表,基于特征重要性定位错误根源;基于错误根源生成纠错方案并执行。
本发明授权用于AI智能标注与纠错平台的分析系统及方法在权利要求书中公布了:1.用于AI智能标注与纠错平台的分析方法,其特征在于,包括以下步骤: 按场景内图像的固定功能,拆分出图像集合,按场景内文本的语义,拆分出文本集合;从场景数据中选取种子样本执行融合标注,得到初始标注样本;基于初始标注样本,以图像集合和文本集合为拓扑节点,建立初始关联映射,形成拓扑结构; 根据实际应用需求,定义场景特征,包括图像类型、文本类型和图像与文本的业务关联逻辑;收集场景特征下的历史标注数据与未标注数据,形成初始数据集;对初始数据集中的所有图像,提取功能特征,包括:空间位置特征、视觉属性特征和业务关联特征,其中,空间位置特征包括图像中各区域的坐标范围和相对位置关系,视觉属性特征包括区域的尺寸比例、色彩分布和纹理特征,业务关联特征表示该图像区域在场景业务中的作用;计算任意两个图像区域的功能特征相似度,对满足相似度阈值的图像区域,聚合形成功能同类组;为每个功能同类组赋予唯一标识,定义为图像集合;对初始数据集中的所有文本,提取语义特征,包括:表层语义特征、深层语义特征和业务语义特征,其中,表层语义特征包括关键词、词性组合和句式,深层语义特征包括语义向量和语义角色,业务语义特征表示文本在场景业务中的含义;计算任意两个文本的语义特征相似度,对满足相似度阈值的文本,聚合形成语义同类组;为每个语义同类组赋予唯一标识,定义为文本集合; 从初始数据集的历史标注数据中选取包含图像与文本的样本作为种子样本,由专业人员对种子样本进行标注操作,并通过交叉校验的方式验证标注一致性;剔除标注模糊的种子样本,将剩余符合标准的样本作为初始标注样本; 基于图像与文本的业务关联逻辑,为每个图像集合节点匹配潜在关联文本集合节点,为每个文本集合节点匹配潜在关联图像集合节点,形成候选对;从初始标注样本中调用融合标注的种子样本,提取每个种子样本中图像与文本的实际关联关系;统计每个候选对在种子样本中的实际关联频次,当实际关联频次不小于种子样本总数的A%时,确认该候选对为有效初始关联对,否则剔除该候选对,A是根据场景定义的正整数;记录有效初始关联对的种子样本关联置信度CC,公式为CC=AAFt,其中,AAF是实际关联频次,t是种子样本总数; 选择有向加权图作为拓扑结构类型,节点是标准化后的图像集合节点与文本集合节点,节点属性包含ID、类型、功能或语义特征摘要和种子样本数量,边连接有效初始关联对的节点,边的属性包含关联方向、种子样本关联置信度和关联类型;制定允许关联范围的规则,具体为:仅允许存在拓扑边的节点间进行关联,无拓扑边的节点间禁止关联;对存在拓扑边的节点对,基于CC将允许关联范围的优先级划分为高、中和低;仅允许场景适配标签完全一致的节点间关联;对每个节点,根据规则生成图像集合节点清单和文本集合节点清单; 在拓扑结构节点范围内,对新进入场景的文本或图像,执行多对多匹配;对每一个成功匹配的关联对,累计其匹配频次; 基于场景数据规模与标注精度要求,设定图像免标注阈值和文本免标注阈值;对每一次新的图像和文本的匹配请求,获取其匹配频次,判断是否触发免标注;当触发免标注时,构建正常样本特征库,进行特征提取与异常度计算,通过卷积神经网络进行异常判定,得到标注异常集合; 从历史已确认无标注异常的免标注关联对中,提取图像样本作为正常基准集;将所述正常基准集中的图像输入预训练卷积神经网络,提取深层视觉特征向量,通过K-means聚类算法生成正常特征集群,记录集群中心与特征分布范围;对触发免标注的关联对中的图像样本进行标准化处理,与卷积神经网络的输入格式一致;将图像样本输入卷积神经网络,提取其深层视觉特征向量,计算该特征向量与正常特征集群中心的距离,作为异常度评分;设定异常判定阈值,当图像样本的异常度评分超过阈值时,标记该图像对应的免标注关联对为潜在异常;对所有潜在异常关联对,通过卷积神经网络反向传播分析其异常激活区域,当异常区域与图像核心功能特征区域重叠度大于设定阈值时,确认该关联对为标注异常,加入标注异常集合; 基于标注异常集合,构建纠错训练数据集,训练随机森林模型;随机森林模型输出特征重要性列表,基于特征重要性定位错误根源;基于错误根源生成纠错方案并执行; 从标注异常集合中提取所有关联对,标记为错误关联,从历史正常关联数据中筛选正确关联的样本,通过随机过采样,使正负样本比例控制在1:1,进行特征工程,获取关联强度特征、特征匹配度特征、异常相关特征和集合属性特征,进行预处理,得到训练集特征矩阵与标签;对随机森林模型进行模型初始化与超参数设置,输入训练集特征矩阵与标签,通过bootstrap抽样为每棵决策树生成独立训练子集,每棵树基于随机特征子集递归分裂,进行模型训练,训练完成后进行模型评估与调优。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人北京科杰科技有限公司,其通讯地址为:100000 北京市海淀区东升科技园北街6号院10号楼11层101;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励