天津艺点意创科技有限公司巩书凯获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉天津艺点意创科技有限公司申请的专利一种基于人工智能的图片生成方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120707699B 。
龙图腾网通过国家知识产权局官网在2026-01-27发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510642379.4,技术领域涉及:G06T11/60;该发明授权一种基于人工智能的图片生成方法及系统是由巩书凯;王永悦;高瑞设计研发完成,并于2025-05-19向国家知识产权局提交的专利申请。
本一种基于人工智能的图片生成方法及系统在说明书摘要公布了:本发明属图像处理技术领域,具体的说是一种基于人工智能的图片生成方法及系统,包括S1、上传阶段;S2、定位分割阶段;S3、指令解析与区域绑定阶段;S4、冲突检测与协商阶段;S5、备份与加密阶段。通过上述结构配合,可实现多人同步进行修图,通过分割掩膜的方式,将图片分割成若干份,然后合照中参与修图的人分别选择对应的一个掩膜进行修图,与传统的轮流修图的方式相较,更为方便快捷,并基于此提高图片的生成效率,同时当多人对同一区域掩膜进行编辑时,采用冲突分类与优先级规则以及实时交互协商的方式解决冲突,确保了多人协作编辑的顺利进行。
本发明授权一种基于人工智能的图片生成方法及系统在权利要求书中公布了:1.一种基于人工智能的图片生成方法,其特征在于,包括以下步骤: S1、上传阶段:将待处理的图片进行标准化处理后,将其通过系统支持的格式上传,同时保存原始图片; S2、定位分割阶段:通过模型自动识别图片中的人物、物体、背景,并生成能交互的掩膜,模型公式为: ; 其中,M为分割掩膜集合,即对输入图像进行分割后得到的各个区域的掩膜,每个掩膜对应图像中的一个独立区域其包括人物、物体和背景;SAM为语义分割模型,用于对输入图像进行分割操作的模型;I为输入的原始图像; S3、指令解析与区域绑定阶段:用户输入自然语言指令,指令解析通过多模态指令解析和上下文关联的方式实现,其中多模态指令解析结合自然语言处理模型与目标检测,识别指令中的区域关键词和操作关键词,通过神经网络解析指令中的位置关键词; 多模态指令解析公式为: ; 其中,为绑定到特定区域的编辑指令,即根据用户指令解析出的针对图像特定区域的操作指令;是一个函数,用于将解析后的文字指令与图像中的特定区域进行绑定;代表自然语言处理模型,用于解析用户输入的自然语言指令,提取其中的区域关键词和操作关键词;为用户输入的自然语言指令;M为分割掩膜集合,即之前通过语义分割模型得到的图像区域掩膜; 上下文关联的实现方式包括历史指令分析和图像内容关联: 历史指令分析体现为记录用户的历史指令,结合当前指令进行上下文关联; 图像内容关联体现为结合图像的分割掩膜和目标检测结果,分析指令与图像内容的关联; 其中历史指令分析通过语义相似度计算找到与当前指令相关的历史指令; 图像内容关联通过目标跟踪技术保持对目标区域的持续关注,根据上下文推断目标区域的属性,优化指令解析,并通过长短期记忆网络处理序列指令,捕捉上下文依赖关系; 上下文关联公式为: ; 其中,为经过上下文关联优化后的编辑指令,即在考虑历史指令和当前图像内容的基础上,对原始编辑指令进行优化后的结果; 是一个函数,用于结合当前指令历史指令分析结果和分割掩膜集合,进行上下文关联和指令优化; 为当前用户输入的自然语言指令; 为对历史指令进行语义分析后的结果,包含了历史指令中的关键信息和上下文关系; 为分割掩膜集合,即图像的区域掩膜; S4、冲突检测与协商阶段:根据解析并优化后的编辑指令,多个用户分别对分割后的图片中对应掩膜区域进行修改操作,当出现多人对同一掩膜的修改冲突时,使用算法平衡不同用户的指令优先级,其原理为:通过非支配排序和拥挤度距离来选择优良个体,从而在多个目标之间找到一组平衡解,在处理不同用户的指令优先级时,将每个用户的指令及其优先级视为一个目标,通过算法找到一组平衡不同用户需求的解,其操作流程包括: 目标函数:将每个用户的指令及其优先级视为目标函数,假设有个用户,每个用户提出指令及对应优先级,决策变量是每个用户指令的执行程度或资源分配比例; 编码方案:用染色体表示个体,每个个体为向量,元素对应每个用户指令的执行程度; 适应度函数:针对每个用户i定义目标函数,衡量指令执行效果或满意度,目标是最大化所有用户满意度; 算法流程: 初始化:随机生成初始种群,每个个体表示为一个可能的指令执行方案; 非支配排序:对种群中的所有个体进行非支配排序,将个体分为不同的非支配层; 拥挤度距离计算:对每个非支配层中的个体计算拥挤度距离; 选择、交叉和变异:通过锦标赛选择、交叉和变异操作生成下一代个体; 迭代:重复上述步骤,直到达到最大迭代次数; S5、备份与加密阶段:对生成的图片进行备份,并在存储图片时验证身份信息。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人天津艺点意创科技有限公司,其通讯地址为:300131 天津市红桥区区咸阳路19号中投保大厦三层;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励