Document
拖动滑块完成拼图
个人中心

预订订单
商城订单
发布专利 发布成果 人才入驻 发布商标 发布需求

请提出您的宝贵建议,有机会获取IP积分或其他奖励

投诉建议

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 积分商城 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 厦门大学王菡子获国家专利权

厦门大学王菡子获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉厦门大学申请的专利一种基于有效特征表示的无偏场景图生成方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115861779B

龙图腾网通过国家知识产权局官网在2025-10-14发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202211506846.3,技术领域涉及:G06V20/00;该发明授权一种基于有效特征表示的无偏场景图生成方法是由王菡子;马文熙设计研发完成,并于2022-11-29向国家知识产权局提交的专利申请。

一种基于有效特征表示的无偏场景图生成方法在说明书摘要公布了:一种基于有效特征表示的无偏场景图生成方法,涉及计算机视觉技术。采用特征提取网络和分类网络解耦的训练策略,利用预训练好的骨干网络提取物体的视觉特征;进行目标检测,利用提取到的物体的视觉特征、物体的位置编码以及物体的类别编码两两配对再次组合编码,得到适用于谓词分类的编码特征;通过一个全连接层进行谓词分类;训练特征提取网络,在推理时不采用全连接层形式的分类网络,通过计算每一类谓词的用于谓词分类的编码特征的均值,根据待分类样本的编码特征与每一类谓词特征均值的余弦相似度进行谓词分类。摒弃全连接层分类器,直接基于谓词特征进行分类,可排除全连接层参数易受长尾数据影响的问题,从而提升场景图生成任务的性能。

本发明授权一种基于有效特征表示的无偏场景图生成方法在权利要求书中公布了:1.一种基于有效特征表示的无偏场景图生成方法,其特征在于包括以下步骤: A.收集场景图生成数据集,划分为训练集、验证集和测试集,进行图像预处理; B.用预训练好的骨干网络,提取物体的视觉特征,送入目标检测分支,得到物体的位置和类别; 所述骨干网络采用的是ResNeXt-101-FPN网络,所述目标检测分支采用FasterR-CNN网络;所述物体的视觉特征为神经网络学到的一个4096维的向量;所述物体的位置为一个四维向量,代表物体框的左上角和右下角的横纵坐标,所述物体的类别为[0,CO范围内的整数,CO表示数据集中物体类别数量; C.将步骤B得到的物体位置和类别分别进行编码,得到物体位置编码特征和物体类别编码特征; D.将步骤B得到的物体视觉特征和步骤C得到的物体位置编码特征和物体类别编码特征拼接,得到物体的有效特征表示; E.将每一幅图中所有物体的由步骤D得到的有效特征表示传入关系融合特征编码器,并将编码结果两两配对,得到一系列关系的有效特征表示; 所述得到一系列关系的有效特征表示包括: E1.所述关系融合编码器由一系列Transformer编码器组成,并增加两个融合策略; 所述两个融合策略的第一部分为对Transformer编码器的输入进行的融合操作;具体的,第1个Transformer编码器的输入为步骤D得到的物体的有效特征表示,后续的除了第M+1个Transformer编码器的输入为前一个Transformer编码器的输出;为了防止物体的有效特征表示在编码过程中被遗忘,将第M+1个Transformer编码器的输入改为第M个Transformer编码器的输出和物体的有效特征表示的融合结果,融合方式如下: XM+1=x1+YMWin+bin 其中,XM+1为第M+1个Transformer编码器的输入;X1为第1个Transformer编码器的输入,即物体的有效特征表示;YM为第M个Transformer编码器的输出,Win和bin为线性变换所需的矩阵和向量; 所述两个融合策略的第二部分为对各个Transformer编码器的输出进行的融合操作,这能使编码结果包含有多层次的特征,计算方式如下: 其中,Y表示各个Transformer编码器编码结果的融合结果,M+N为Transformer编码器的数量; E2.对每个物体都去计算其Transformer编码器的融合编码结果,两两拼接得到一系列关系的有效特征表示,具体的,对于一对物体s,o,这两个物体之间的关系的有效特征表示Fs,o由如下公式计算得到: Fs,o=catYsWout+bout,YoWout+bout 其中,cat·,·表示向量的拼接操作,Ys和Yo分别表示Transformer编码器对于物体s和物体o的融合编码结果,Wout和bout为线性变化所需的矩阵和向量,最终得到的关系的有效特征表示Fs,o为768维向量; F.将步骤E得到的关系的有效特征表示传入全连接层网络进行分类,计算分类损失从而进行网络的参数更新; G.训练收敛后对于每一类谓词,利用步骤A-E计算训练集中包含该类谓词的样本的关系的有效特征的平均值,在推理时计算待分类样本的关系的有效特征与计算好的每一类关系的有效特征均值的余弦相似度,取相似度最大的类别作为分类结果。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人厦门大学,其通讯地址为:361005 福建省厦门市思明区思明南路422号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。