Document
拖动滑块完成拼图
个人中心

预订订单
商城订单
发布专利 发布成果 人才入驻 发布商标 发布需求

请提出您的宝贵建议,有机会获取IP积分或其他奖励

投诉建议

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 积分商城 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 杭州电子科技大学王华涛获国家专利权

杭州电子科技大学王华涛获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉杭州电子科技大学申请的专利一种姿态驱动的基于注意力机制的人物图像合成方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119131174B

龙图腾网通过国家知识产权局官网在2025-10-14发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411264576.9,技术领域涉及:G06T11/00;该发明授权一种姿态驱动的基于注意力机制的人物图像合成方法是由王华涛;颜成钢;刘一秀;张继勇;殷俊;王鸿奎设计研发完成,并于2024-09-10向国家知识产权局提交的专利申请。

一种姿态驱动的基于注意力机制的人物图像合成方法在说明书摘要公布了:本发明公开了一种姿态驱动的基于注意力机制的人物图像合成方法。首先通过骨架编码器将目标骨架转换为特征映射,通过外观编码器将原图像转换为特征映射;利用多尺度图像细化网络对提取的特征进行多尺度图像细化,获得最终目标人物图像;最后以端到端方式训练模型,同时学习特征融合和目标图像生成。本发明提出了一种姿态驱动的注意力机制,能够有效提取外观特征和姿态特征,通过通道注意力机制的自适应权重获取不同关注度的特征图。最终按权重相加输出,有利于在姿态变换中不丢失原始特征最大程度保留了原图像的信息。

本发明授权一种姿态驱动的基于注意力机制的人物图像合成方法在权利要求书中公布了:1.一种姿态驱动的基于注意力机制的人物图像合成方法,其特征在于,包括步骤如下: 步骤1:通过骨架编码器将目标骨架转换为特征映射; 步骤2:通过外观编码器将原图像转换为特征映射; 步骤3:在获取到骨架编码器和外观编码器提取的特征后,利用多尺度图像细化网络对提取的特征进行多尺度图像细化; 多尺度图像细化网络以骨架编码器和外观编码器生成的特征映射作为输入;对于不同的尺度的特征映射分别使用姿势驱动注意力来生成目标特征;最后,通过上采样和“ToRGB”每个尺度的特征输出来逐级生成不同分辨率下的人物图像,获得最终目标人物图像; 姿势驱动注意力具体实现如下: 对于16×16层级下的姿态驱动注意力,采用外观编码器和骨架编码器产生的特征作为输入,而对于其他层级,采用上一层级姿态驱动注意力获得的特征与外观编码器输出的特征作为输入;它利用卷积滤波和归一化函数来提取外观和结构特征;然后通过多通道矩阵乘法将外观信息广播到人物姿态上; 首先进行外观特征的提取: 令Fr代表外观编码器从人物外观中提取的特征,将Fr输入像素分析滤波器中,计算像素分析滤波器Wb和Fr之间的注意力关联矩阵Cb: Cb=Wb×Fr 其中,Cb的每一行包含每个外观编码器编码的特征对本层级输出外观特征的贡献;以卷积滤波器作为像素分析滤波器Wb,使用具有空间大小的二维卷积滤波器来获得准确的纹理特征; 通过softmax函数对得到的注意力关联矩阵进行归一化,得到归一化矩阵此外通过映射函数f,将得到的特征值映射到潜在空间中,与归一化矩阵进行乘法得到处理完毕后的外观特征Fe,公式表示如下: 之后进行结构特征的提取,采用Ft代表骨架编码器从人物骨架中提取的结构信息或姿态驱动注意力输出的特征;将Ft输入姿态估计滤波器中,计算姿态估计滤波器Wd和Ft之间的注意力关联矩阵Cd: Cd=Wd×Ft 同样使用具有空间大小的二维卷积滤波器作为姿态估计滤波器Wd进行特征提取;通过softmax函数进行归一化,得到归一化矩阵其中的每一列包含了每个骨架编码器提取的特征或姿态驱动注意力输出的特征对合成本层级输出结构特征时的贡献; 最后通过一个包含通道注意力的,多通道矩阵乘法将得到的外观特征分配到目标人物姿态上,公式表示如下: 其中MCM表示多通道矩阵乘法,表示第N个输出的具有不同关注区域的特征图; MCM利用通道注意力,能够生成具有不同关注区域的特征图,并且通过通道注意力,他们将被赋予不同的权重值; 其中,Linear表示将生成的N个不同关注度的特征图根据不同权重相加得到一张特征图后输出,Fo代表最终的目标特征; 步骤4:以端到端方式训练模型,同时学习特征融合和目标图像生成;利用了注意力重建损失、感知损失、风格损失和对抗性损失来训练模型: 总体损失如下: Lall=λattenLatten+λstyleLstyle+λpercLperc+λadvLadv 其中λatten,λstyle,λperc,λadv分别为代表注意力重建损失Latten、感知损失Lperc、风格损失Lstyle和对抗性损失Ladv的权重。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人杭州电子科技大学,其通讯地址为:310018 浙江省杭州市下沙高教园区2号大街;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。