Document
拖动滑块完成拼图
个人中心

预订订单
商城订单
发布专利 发布成果 人才入驻 发布商标 发布需求

请提出您的宝贵建议,有机会获取IP积分或其他奖励

投诉建议

在线咨询

联系我们

龙图腾公众号
专利交易 积分商城 国际服务 IP管家助手 科技果 科技人才 商标交易 会员权益 需求市场 关于龙图腾 更多
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 南京行者易智能交通科技有限公司王乾宇获国家专利权

南京行者易智能交通科技有限公司王乾宇获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉南京行者易智能交通科技有限公司申请的专利一种结合人类反馈的强化学习的目标检测方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN117115582B

龙图腾网通过国家知识产权局官网在2026-03-10发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202310927323.4,技术领域涉及:G06V10/774;该发明授权一种结合人类反馈的强化学习的目标检测方法是由王乾宇;周金明设计研发完成,并于2023-07-27向国家知识产权局提交的专利申请。

一种结合人类反馈的强化学习的目标检测方法在说明书摘要公布了:本发明公开了一种结合人类反馈的强化学习的目标检测方法,包括以下步骤:收集现场图像数据,使用通用的预训练的目标检测模型进行预测,得到预测结果集合;对于每个预测,进行人工标注,得到反馈数据集,包含检测框的类别标签;使用反馈数据集训练强化学习模型;使用目标检测模型对未标注的现场数据图像进行预测,并用强化学习模型把预测结果中好目标提取出来,对检测模型进行微调,使用梯度下降算法,利用损失函数更新的参数,以最小化损失;重复之前步骤,最终训练出针对目标场景的检测模型。该方法使用通用的预训练模型来降低训练时间,使用基于人类反馈的强化学习来减少标注数量,提高了目标检测效率。

本发明授权一种结合人类反馈的强化学习的目标检测方法在权利要求书中公布了:1.一种结合人类反馈的强化学习的目标检测方法,其特征在于,该方法包括以下步骤: 步骤1,收集n张现场图像数据,记为xi,i∈[1,2,3,…,n],使用通用的预训练的目标检测模型D进行预测,得到预测结果集合P; 步骤2,对于每个预测pi∈P,进行人工标注,得到反馈数据集H,H包含检测框的类别标签,其中1表示好目标,-1表示坏目标; 步骤3,使用反馈数据集H训练强化学习模型R; 步骤4,使用D对未标注的现场数据第i张图像进行预测,并用R把预测结果中好目标提取出来,然后对D进行微调,使用梯度下降算法,利用损失函数L更新D的参数,以最小化损失; 步骤5,重复步骤4,最终训练出针对目标场景的检测模型D’; 所述微调训练的损失函数L为: , 其中,λ1、λ2、λ3是权重参数; , 其中zi为文本特征,zi+为对应图像块的特征,sim为计算余弦相似度函数,τ为可学习的温度参数; , 其中f为图像编码函数,xiaug为数据增强后的图像xi, , 其中g为分类头,yi为图像i的标签,CE为交叉熵损失函数。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人南京行者易智能交通科技有限公司,其通讯地址为:210004 江苏省南京市秦淮区永智路6号南京白下高新技术产业开发区四号楼A栋102室;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。