Document
拖动滑块完成拼图
个人中心

预订订单
商城订单
发布专利 发布成果 人才入驻 发布商标 发布需求

请提出您的宝贵建议,有机会获取IP积分或其他奖励

投诉建议

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 积分商城 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 东南大学张敏灵获国家专利权

东南大学张敏灵获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉东南大学申请的专利一种基于主动查询和分组标注的多义数据标注方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN116881713B

龙图腾网通过国家知识产权局官网在2025-09-30发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202310816049.3,技术领域涉及:G06F18/214;该发明授权一种基于主动查询和分组标注的多义数据标注方法是由张敏灵;刘冰清设计研发完成,并于2023-07-05向国家知识产权局提交的专利申请。

一种基于主动查询和分组标注的多义数据标注方法在说明书摘要公布了:本发明公开一种基于主动查询和分组标注的多义数据标注方法,具体包括以下步骤:1用户初始时选择小部分多义数据进行精确标注;2利用深度神经网络在小部分已标注数据上训练多标记分类网络;3利用多标记分类网络对未标注数据的标记向量进行预测;4对该被查询示例的标记空间分组,小部分组发送给领域专家进行精确标注;5将该样本加入已标注集,更新多标记分类网络参数,在测试集上测试效果;6如果用户对当前模型性能满意,则结束,否则转步骤3。本发明能够在多义数据标注的质量和成本之间达到一定平衡,在减少标注成本的同时提高标注质量。

本发明授权一种基于主动查询和分组标注的多义数据标注方法在权利要求书中公布了:1.一种基于主动查询和分组标注的多义数据标注方法,其特征在于:包括以下步骤: 步骤1:获取一定数量的多义数据集表示d维特征空间,表示C个类别的标记空间;初始时选择小部分多义示例进行精确标注,称之为已标注集其中Yi∈{0,1}C是xi的标记向量,yij=1表示第j个标记是xi的正标记相关标记,yij=0表示第j个标记是xi的负标记无关标记;剩余的u=n‑l个未标注示例称之为未标注集步骤2:利用深度神经网络在已标注集训练多标记分类网络N,建立起输入空间到输出空间的映射; 步骤3:利用分类网络N预测未标注集中所有示例xu的概率向量和标记向量利用不确定性准则在中主动查询对当前分类网络N的性能最有价值的一个未标注示例xq; 所述步骤3具体为: 步骤3.1:将未标注集中的所有示例输入到分类网络N中进行预测,对于每一个示例xu而言,分类网络N可以输出其标记向量中每一个标记是正标记的概率,组成长度为C概率向量puj∈0,1; 步骤3.2:通过设置一个阈值thr一般为0.5,将标记空间划分为正标记集合和负标记集合两个部分,puj≥thr的标记被认为是正标记,pujthr的标记被认为是负标记,由此得到N为每个未标注示例预测的标记向量形式化表述如下;其中表示当π为真时返回1否则返回0; 步骤3.3:对于未标注集中的所有示例,计算其中最小的概率值和中最大的概率值之间的差值Δu,查询Δu值最小的未标注示例,作为被查询示例xq,该示例被认为是当前分类网络N最“不确定”的示例,其预测概率向量为标注并训练该示例最有希望提升分类网络的性能; 步骤4:对被查询示例xq的标记向量按照进行分组,小部分组发送给领域专家进行精确标注,大部分组发送给多个众包标注者进行非精确的众包标注;返回的标记向量与示例xq共同组成一个样本xq,Yq; 步骤5:将xq,Yq加入已标注集更新分类网络N的参数,在测试集上测试性能; 步骤6:如果用户对当前模型性能满意,则结束,否则转步骤3。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人东南大学,其通讯地址为:210096 江苏省南京市玄武区四牌楼2号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。