深圳乐木骆科技有限公司解宇飞获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉深圳乐木骆科技有限公司申请的专利宠物视觉数据生成方法、装置、计算机设备及存储介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120953421B 。
龙图腾网通过国家知识产权局官网在2026-01-30发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202511453924.1,技术领域涉及:G06T11/60;该发明授权宠物视觉数据生成方法、装置、计算机设备及存储介质是由解宇飞;蒋帆;王宇设计研发完成,并于2025-10-13向国家知识产权局提交的专利申请。
本宠物视觉数据生成方法、装置、计算机设备及存储介质在说明书摘要公布了:本申请实施例提供了一种宠物视觉数据生成方法、装置、计算机设备及存储介质。方法包括接收数据生成请求,数据生成请求包括视觉提示文本和目标宠物的参考视觉数据;根据数据生成请求调用预训练的生成模型,其中,生成模型包括数据融合子模型和视觉处理子模型;调用数据融合子模型基于视觉提示文本和参考视觉数据进行数据融合,得到视觉潜在向量;调用视觉处理子模型基于视觉潜在向量进行视觉数据生成,得到与视觉提示文本对应的目标视觉数据,目标视觉数据包括目标宠物图像和或目标宠物视频。该方法可以提高宠物视觉数据生成的一致性。
本发明授权宠物视觉数据生成方法、装置、计算机设备及存储介质在权利要求书中公布了:1.一种宠物视觉数据生成方法,其特征在于,所述方法包括: 接收数据生成请求,所述数据生成请求包括视觉提示文本和目标宠物的参考视觉数据;其中,参考视觉数据从宠物媒体数据库中确定; 根据所述数据生成请求调用预训练的生成模型,其中,所述生成模型包括数据融合子模型和视觉处理子模型,所述数据融合子模型包括文本编码器和自回归编码器,所述视觉处理子模型包括图像编码器和视觉处理网络;所述视觉处理网络包括自回归视觉解码器和流匹配解码器; 调用所述图像编码器对所述参考视觉数据进行视觉特征提取,得到目标图像向量; 调用所述数据融合子模型基于所述视觉提示文本和所述参考视觉数据进行数据融合,得到视觉潜在向量,包括:调用所述文本编码器对所述视觉提示文本进行语义特征提取,得到目标文本向量;调用所述自回归编码器对所述目标文本向量和所述目标图像向量进行注意力融合,得到所述视觉潜在向量; 调用所述视觉处理子模型基于所述视觉潜在向量进行视觉数据生成,得到与所述视觉提示文本对应的目标视觉数据,所述目标视觉数据包括目标宠物图像和或目标宠物视频,包括:调用所述自回归视觉解码器对所述视觉潜在向量进行解码,得到初步视觉数据;调用所述流匹配解码器对所述初步视觉数据进行去噪处理,得到所述目标视觉数据,其中,所述目标视觉数据的分辨率大于所述初步视觉数据; 其中,所述生成模型的训练过程,包括: 获取样本宠物的多模态训练样本,所述多模态训练样本包括样本宠物图像和样本宠物视频; 基于所述样本宠物图像对所述视觉处理子模型进行图像预训练; 在图像预训练完成后,基于所述样本宠物图像和所述样本宠物视频对所述视觉处理子模型进行视觉联合训练,其中,所述视觉联合训练包括三个阶段的图像-视频联合训练,图像-视频联合训练指基于图像和视频并行混合构建训练集,三个阶段逐步增加视频生成的时长和分辨率。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人深圳乐木骆科技有限公司,其通讯地址为:518129 广东省深圳市龙岗区坂田街道南坑社区雅星路8号星河WORLD双子塔.西塔501;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励