西北工业大学张艳宁获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉西北工业大学申请的专利一种基于一致性自评价策略的推理链自进化视觉推理方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN117076621B 。
龙图腾网通过国家知识产权局官网在2025-07-15发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202310832818.9,技术领域涉及:G06F16/3329;该发明授权一种基于一致性自评价策略的推理链自进化视觉推理方法是由张艳宁;王鹏;索伟;孙梦阳;马骥设计研发完成,并于2023-07-09向国家知识产权局提交的专利申请。
本一种基于一致性自评价策略的推理链自进化视觉推理方法在说明书摘要公布了:本发明公开了一种基于一致性自评价策略的推理链自进化视觉推理方法,包括两个部分,第一部分为回答‑解释提示模块,第二部分为自我批判强化模块;在第一部分中,首先建立一个基本答案模板来获取基本答案分数,然后构建一个解释生成模板。第二部分中,通过引入序列采样算法来扩展搜索空间,并生成一组候选解释。同时,将答案视作奖励,以鼓励模型输出更详细的解释。本发明框架可以受益于大量的问答对,而无需人工标注解释,从而进一步提高模型的自我解释能力。
本发明授权一种基于一致性自评价策略的推理链自进化视觉推理方法在权利要求书中公布了:1.一种基于一致性自评价策略的推理链自进化视觉推理方法,其特征在于,包括如下步骤: 步骤1:给定一张图片和一个自然语言问题,其中表示第个词,是问题的长度,表示图片的尺寸; 采用CLIP视觉编码器的分类标记获取图片的图像特征;然后,利用一组多层感知器将图像特征转换为,其中维度大小,图像序列长度,计算公式如下: 对于问题,每个词将通过预训练的图像说明模型映射到相应的词嵌入; 最后,得到图像和问题序列: 步骤2:对于给定的图像和问题序列,用自然语言标记“答案是”来激发模型生成正确的答案通过连接语言提示,得到基本答案模板,其中和分别表示拼接操作和具体的语言提示; 在训练过程中,基本答案模板和真实答案标签被送入VL模型,其中是第个答案标记,表示答案标签的长度; 以自回归方式计算以为条件的答案损失: 其中表示VL模型的参数;获取平均概率作为基本答案分数; 利用自然语言标记“原因是”来激励模型生成自由文本解释,解释生成模板 被构建,其中是自然语言标记; 对于标记样本,遵循公式,以自回归方式和交叉熵损失计算解释损失; 步骤3:利用集束搜索在每个时间步从VL模型概率分布中采样前个词,并以最高概率保持这些序列;然后,这些生成的句子被集成到每个QA对的候选解释中,没有人工标注的解释,其中和分别表示第个基本原理和波束搜索的大小; 对于标记样本,同样构建相应的解释集;最后,由于标记和未标记样本在训练过程中会被整合到一个小批量中,将和简化为以指示每个样本的候选解释; 步骤4:采用强化学习方法来实现端到端的训练,给定样本和相应的候选解释,设计一个新的输入模板: 其中表示添加了可能的根本解释的模板;然后,将该模板反馈到模型中,得到关于答案的平均概率,即解释性答案分数,其中是样本的真实答案; 同时,使用基础答案模板输出的平均概率作为基础分数,通过应用强化学习计算强化损失,梯度计算如下: 其中是第个解释的概率; 基于上述计算,当答案得分高于基本答案模板的得分时,该梯度将倾向于增加第个根本解释的概率;最后,对于标记样本,将人工标注的根本解释附加到候选解释中,并通过交叉熵损失预测答案,即; 在训练过程中,整体损失函数表示如下: 其中用于平衡交叉熵损失和强化损失; 在推理时,模型将首先生成关于QA对的基本原理,然后使用解释模板获得相应的答案。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人西北工业大学,其通讯地址为:710072 陕西省西安市友谊西路127号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。