Document
拖动滑块完成拼图
个人中心

预订订单
商城订单
发布专利 发布成果 人才入驻 发布商标 发布需求

请提出您的宝贵建议,有机会获取IP积分或其他奖励

投诉建议

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 积分商城 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 浙江大学冯尊磊获国家专利权

浙江大学冯尊磊获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉浙江大学申请的专利基于视觉大模型的移动端定向分割方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN116958549B

龙图腾网通过国家知识产权局官网在2025-09-23发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202310908027.X,技术领域涉及:G06V10/26;该发明授权基于视觉大模型的移动端定向分割方法是由冯尊磊;陈天浩;宋杰;宋明黎设计研发完成,并于2023-07-24向国家知识产权局提交的专利申请。

基于视觉大模型的移动端定向分割方法在说明书摘要公布了:基于视觉大模型的移动端定向分割方法,首先利用现有遥感数据集标注正样本点标注数据集;其次,利用梯度寻优技术,以正样本点和语义特征向量为输入,目标遮罩为输出,获取特定类别语义特征;再次,经过关联模块筛选和位置语义融合再优化后,得到一个精简的定向分割大模型;最后,任选若干张遥感影像,输入模型得到指定类别的遮罩。通过上述4个步骤,可以识别出任意一种遮罩。

本发明授权基于视觉大模型的移动端定向分割方法在权利要求书中公布了:1.基于视觉大模型的移动端定向分割方法,包括下列步骤: 1获取基于梯度寻优的特定类别语义表征; 首先,初始化一个语义表征矩阵在带有正向标注和目标遮罩的数据集上梯度优化Tout;在梯度优化过程中,优化目标如下: 其中为FocalLoss函数,为公式1中预测的目标遮罩,y为标注的真实遮罩,为DiceLoss函数,为MeanStandardErrorLoss函数,PIoU为遮罩解码器中的预测交并比,PGIoU为最高分数对应的预测遮罩与真实遮罩的交并比; 其次,固定SAM中的参与图像编码的图像编码器与参与遮罩生成的遮罩解码器,只对Tout进行梯度下降;采用AdamW优化目标函数,等到目标函数收敛后,固定Tout,微调遮罩解码器,直到目标函数再次收敛; 2筛选图像编码器中特定类别语义关联模块; 采用筛选多头自注意力机制Multiple-HeadSelf-Attention,MHSA中的图像分块、减少查询词矩阵Query和关键词矩阵Key中的重要维度的方式来实现压缩SAM; 首先,给每一个图像分块分配一个重要性系数并且通过再次训练并排序;根据压缩比例Budget剔除不重要的图像块;在剔除过程中,一旦浅层图像块Patch被过滤掉,则立即把深层对应的图像块也剔除,以防止同一个位置的图像块的歧义现象;另外,在cp,l与图像分块嵌入做点积运算之前,先施加一次tanh函数,用以防止cp,l过大;总结公式如下: z′l=Ftanhcl⊙zl,2 其中为某一层MHSA的重要性系数,Ftanh为tanh函数,为某一层MHSA的图像块嵌入,而为重要性过滤后的图像块嵌入层; 其次,对MHSA中的查询词矩阵和关键词矩阵的特征维度DQ分配重要性系数cl,h来进行分头压缩;每一层压缩后的MHSA计算公式如下: 其中Ai为为每一个头的注意力权重矩阵,Fsoftmax为softmax函数,为每一个头的Query矩阵,为每一个头的重要性系数向量,为每一个头的Key矩阵,dq为每一个头的维度数目,为每一头的Value矩阵,为每一个头的输出子矩阵;projection函数按分头顺序重组整合输出子矩阵得到最后的输出矩阵 再次,优化如下的目标函数,得到所有重要性系数参数c; 其中c代表所有的重要性系数参数,为Cross-EntropyLoss函数,f代表修改过后的网络,W为模型的所有权重,y为标记好的遮罩; 最后,对所有的重要性系数参数其进行统计,得到0.2百分位点;筛选掉0.2百分位点之前的参数,再次训练得到最后的精简模型; 3再优化基于位置语义融合的精简模型; 首先,逐Patch采点来获得与图像块嵌入向量一一对应的点状提示,再根据步骤1学到的Tout与遮罩解码器中的交并比预测头来确定筛选出的语义向量; 其次,利用余弦相似度匹配的形式计算出输入到遮罩解码器中的提示点嵌入;总结公式如下: PE=coss,z×PEpos+1-coss,z×PEneg,5 其中代表最终的提示点嵌入,cos表示余弦函数,代表语义向量,代表图像块嵌入向量,PEpos代表正样本点嵌入信息,PEneg代表负样本点嵌入信息; 最后,将各个PE代入精简的SAM的模型,再次训练遮罩解码器;这样就得到一个能够在移动端实现快速定向分割的大模型。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人浙江大学,其通讯地址为:310058 浙江省杭州市西湖区余杭塘路866号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。