Document
拖动滑块完成拼图
个人中心

预订订单
商城订单
发布专利 发布成果 人才入驻 发布商标 发布需求

请提出您的宝贵建议,有机会获取IP积分或其他奖励

投诉建议

在线咨询

联系我们

龙图腾公众号
专利交易 商标交易 积分商城 国际服务 IP管家助手 科技果 科技人才 会员权益 需求市场 关于龙图腾 更多
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 北京中科辰极系统有限公司韩天亮获国家专利权

北京中科辰极系统有限公司韩天亮获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉北京中科辰极系统有限公司申请的专利融合大模型和视觉模型的视觉识别的方法、系统、介质及产品获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN121561835B

龙图腾网通过国家知识产权局官网在2026-04-14发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202610099685.2,技术领域涉及:G06F18/25;该发明授权融合大模型和视觉模型的视觉识别的方法、系统、介质及产品是由韩天亮设计研发完成,并于2026-01-26向国家知识产权局提交的专利申请。

融合大模型和视觉模型的视觉识别的方法、系统、介质及产品在说明书摘要公布了:一种融合大模型和视觉模型的视觉识别的方法、系统、介质及产品,涉及视觉识别技术领域。方法包括:获取目标识别类别的预设数量张初始样本图像,将初始样本图像输入目标多模态大模型,生成每一张初始样本图像对应的细粒度结构化文本描述,构建增强数据集;利用增强数据集训练得到目标视觉模型;响应于接收到新输入图像,并行获取目标视觉模型输出的第一类别概率分布,以及目标多模态大模型基于语义相似性匹配输出的第二类别概率分布,根据第一类别概率分布与第二类别概率分布确定最终识别结果。实施上述技术方案,在少样本的非结构化视觉识别场景中,能够提升特殊视觉识别场景下的识别精度。

本发明授权融合大模型和视觉模型的视觉识别的方法、系统、介质及产品在权利要求书中公布了:1.一种融合大模型和视觉模型的视觉识别的方法,其特征在于,包括: 收集目标领域的文本信息构成领域知识集,所述文本信息包括结构化知识文本与非结构化描述文本,将所述领域知识集与对应的领域图像作为训练对,对预训练的视觉-语言多模态大模型进行对比学习,并同步采用弹性权重巩固策略,以获得目标多模态大模型; 获取目标识别类别的预设数量张初始样本图像,将所述初始样本图像输入所述目标多模态大模型,生成每一张所述初始样本图像对应的细粒度结构化文本描述,得到初始样本-描述对,所述细粒度结构化文本描述包括对象类别、部件构成、属性状态及场景上下文,基于所述初始样本-描述对通过语义解耦与重组生成合成图像-组合描述对,根据所述初始样本-描述对以及所述合成图像-组合描述对构建增强数据集; 利用所述增强数据集通过最小化协同损失函数对初始视觉模型进行训练,以得到目标视觉模型,所述协同损失函数包括第一损失、第二损失和第三损失,所述第一损失为基于所述增强数据集中所述初始样本图像的类别标注,计算所述初始视觉模型的标准分类损失,所述第二损失为计算所述初始视觉模型从所述增强数据集的所述初始样本图像中提取的视觉特征与所述目标多模态大模型从所述增强数据集对应的细粒度结构化文本描述中提取的文本特征之间的距离,第三损失为计算所述初始视觉模型在特征空间中类别间的相对关系与所述目标多模态大模型所构建的领域认知图谱之间的差异; 响应于接收到新输入图像,并行获取所述目标视觉模型输出的第一类别概率分布,以及所述目标多模态大模型基于语义相似性匹配输出的第二类别概率分布,采用预设的证据理论对所述第一类别概率分布与所述第二类别概率分布进行融合,得到每个候选类别的融合置信度,若最高融合置信度高于或等于当前动态置信度阈值,则将所述最高融合置信度对应的类别作为最终识别结果输出。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人北京中科辰极系统有限公司,其通讯地址为:102299 北京市昌平区城南街道中兴路21号院4号楼6层608;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。