徐州高新区安全应急装备产业技术研究院;中国矿业大学刘兵获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉徐州高新区安全应急装备产业技术研究院;中国矿业大学申请的专利基于语法结构嵌入学习的多样可控图像描述方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN118862959B 。
龙图腾网通过国家知识产权局官网在2025-08-26发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202410882080.1,技术领域涉及:G06N3/0455;该发明授权基于语法结构嵌入学习的多样可控图像描述方法是由刘兵;刘鹏;汤争争设计研发完成,并于2024-07-03向国家知识产权局提交的专利申请。
本基于语法结构嵌入学习的多样可控图像描述方法在说明书摘要公布了:本发明提供了一种基于语法结构嵌入学习的多样可控图像描述方法,包括以下步骤:步骤S100,获取图像的视觉特征和文本的语义特征;步骤S200,对视觉特征和文本语义特征分别进行先验近似子网络和后验近似子网络的学习获得先验潜在变量和后验潜在变量,获取先验潜在变量和后验潜在变量之间的KL散度;步骤S300,利用视觉特征、先验潜在变量和后验潜在变量和一系列[MASK]作为输入,采用非自回归目标函数预测词性标注;步骤S400,利用视觉特征先验潜在变量和后验潜在变量和文本生成描述,获取图像描述生成优化目标;步骤S500,对非自回归目标、图像描述生成优化目标和KL散度所构成的损失函数进行优化,得到生成最优图像描述的神经网络。
本发明授权基于语法结构嵌入学习的多样可控图像描述方法在权利要求书中公布了:1.一种基于语法结构嵌入学习的多样可控图像描述方法,其特征在于,包括以下步骤: 步骤S100,获取图像I的视觉特征和文本的语义特征; 步骤S200,对视觉特征和文本语义特征分别进行先验近似子网络和后验近似子网络的学习获得先验潜在变量z和后验潜在变量获取先验潜在变量z和后验潜在变量之间的KL散度; 步骤S300,利用视觉特征、先验潜在变量z、后验潜在变量和一系列[MASK]作为输入,采用非自回归目标函数预测词性标注; 步骤S400,利用视觉特征、先验潜在变量z、后验潜在变量和文本生成描述,获取图像描述生成优化目标; 步骤S500,对非自回归目标函数、图像描述生成优化目标和KL散度所构成的损失函数进行优化,得到生成最优图像描述的神经网络; 步骤S300中非自回归目标函数L1为 其中,t为时间步,Ψ为后验网络参数,s为词性标注序列,表示数据对数似然; 步骤S400中优化目标L2为 其中,表示数据对数似然,wt为第t步生成的单词; 步骤S500中对式10求最优解,保证L1、L2、LKL均最小 L=L1+L2+αLKL10 其中,α是精确性和多样性之间的权衡参数。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人徐州高新区安全应急装备产业技术研究院;中国矿业大学,其通讯地址为:221000 江苏省徐州市铜山区漓江路徐州国家安全科技产业园A19、A20栋;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。