河北工业大学;北京市新技术应用研究所有限公司孔任龙获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉河北工业大学;北京市新技术应用研究所有限公司申请的专利图像描述文本的生成方法、装置、电子设备及存储介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN116844011B 。
龙图腾网通过国家知识产权局官网在2026-04-03发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202310823910.9,技术领域涉及:G06V10/80;该发明授权图像描述文本的生成方法、装置、电子设备及存储介质是由孔任龙;曲寒冰;王鑫轩;朱成博;阎刚设计研发完成,并于2023-07-06向国家知识产权局提交的专利申请。
本图像描述文本的生成方法、装置、电子设备及存储介质在说明书摘要公布了:本公开提供了一种图像描述文本的生成方法,包括:对目标图像的网格特征进行处理,构建关于目标图像的多个伪区域特征,其中伪区域特征用于表征目标图像的局部视觉信息;分别对网格特征和伪区域特征进行编码增强处理,获得融合有多层图像编码结果的网格增强特征和融合有多层局部编码结果的伪区域增强特征;以及对网格增强特征和伪区域增强特征进行语义解析,生成用于表征目标图像中视觉信息的图像描述文本。本公开还提供了一种图像描述文本的生成装置、电子设备及存储介质。
本发明授权图像描述文本的生成方法、装置、电子设备及存储介质在权利要求书中公布了:1.一种图像描述文本的生成方法,其特征在于,包括: 对目标图像的网格特征进行处理,构建关于所述目标图像的多个伪区域特征,所述伪区域特征用于表征所述目标图像的局部视觉信息; 分别对所述网格特征和所述伪区域特征进行编码增强处理,获得融合有多层图像编码结果的网格增强特征和融合有多层局部编码结果的伪区域增强特征;以及 对所述网格增强特征和所述伪区域增强特征进行语义解析,生成用于表征所述目标图像中视觉信息的图像描述文本; 所述对目标图像的网格特征进行处理,构建关于所述目标图像的多个伪区域特征,包括:预先设定多种特征聚类;计算各个所述网格特征与所述特征聚类之间的相似度,以将各个所述网格特征分别映射至与自身相似度最高的特征聚类中,其中处于同一所述特征聚类的网格特征表征同一视觉信息;以及对同一所述特征聚类中的多个所述网格特征进行归一化处理,以获得用于表征各个所述特征聚类的多个伪区域特征; 所述分别对所述网格特征和所述伪区域特征进行编码增强处理,获得融合有多层图像编码结果的网格增强特征和融合有多层局部编码结果的伪区域增强特征,包括:调用网格编码器对所述网格特征进行编码,获得所述网格编码器中各编码层生成的层级特征以及所述网格编码器输出的初始网格特征;将所述网格编码器中各编码层生成的层级特征进行连接,构建多层网格特征;以及将所述初始网格特征和所述多层网格特征按照比例融合,以构建所述网格增强特征; 所述分别对所述网格特征和所述伪区域特征进行编码增强处理,获得融合有多层图像编码结果的网格增强特征和融合有多层局部编码结果的伪区域增强特征,包括:调用伪区域编码器对所述伪区域特征进行编码,获得所述伪区域编码器中各编码层生成的层级特征以及所述伪区域编码器输出的初始伪区域特征;将所述伪区域编码器中各编码层生成的层级特征进行连接,构建多层伪区域特征;以及将所述初始伪区域特征和所述多层伪区域特征按照比例融合,以构建所述伪区域增强特征。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人河北工业大学;北京市新技术应用研究所有限公司,其通讯地址为:300130 天津市红桥区光荣道8号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励