浙江大学李光获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉浙江大学申请的专利一种基于多模态扩散模型从大脑活动重建图像的方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119722846B 。
龙图腾网通过国家知识产权局官网在2025-09-23发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510221653.0,技术领域涉及:G06T11/00;该发明授权一种基于多模态扩散模型从大脑活动重建图像的方法是由李光;李旭冉;赵朔;王酉设计研发完成,并于2025-02-27向国家知识产权局提交的专利申请。
本一种基于多模态扩散模型从大脑活动重建图像的方法在说明书摘要公布了:本发明公开了一种基于多模态扩散模型从大脑活动重建图像的方法,其包括以下步骤:A1、对采集到的脑电图数据进行预处理;A2、将预处理后的脑电图数据输入脑电特征提取网络,得到脑电数据特征;A3、将脑电数据特征分别输入到图像编码回归模型、图像嵌入回归模型和文本嵌入回归模型,得到图像编码结果、CLIP图像嵌入向量和CLIP文本嵌入向量;A4、将图像编码结果作为多模态扩散模型的图像输入,CLIP图像嵌入向量作为图像隐变量,CLIP文本嵌入向量作为提示词隐变量,进行去噪扩散解码,得到重建的图像。本发明可以从脑电信号生成可辨识度较高、比较清晰的图片。
本发明授权一种基于多模态扩散模型从大脑活动重建图像的方法在权利要求书中公布了:1.一种基于多模态扩散模型从大脑活动重建图像的方法,其特征在于,包括以下步骤: A1、对采集到的脑电图数据进行预处理; A2、将预处理后的脑电图数据输入脑电特征提取网络,得到脑电数据特征; A3、将脑电数据特征分别输入到图像编码回归模型、图像嵌入回归模型和文本嵌入回归模型,得到图像编码结果、CLIP图像嵌入向量和CLIP文本嵌入向量; A4、将图像编码结果作为多模态扩散模型的图像输入,CLIP图像嵌入向量作为多模态扩散模型的图像隐变量输入,CLIP文本嵌入向量作为多模态扩散模型的提示词隐变量输入,进行去噪扩散解码,得到重建的图像; 所述多模态扩散模型包括图像编码器、图像解码器、若干个残差块、若干个全连接残差块、若干个图像交叉注意力层和若干个文本交叉注意力层;所述图像编码器的输入为图像编码结果,输出到第一残差块,第一残差块的输出进入第一图像交叉注意力层和第一文本交叉注意力层,第一图像交叉注意力层和第一文本交叉注意力层的输出进入第二残差块,同时第一文本交叉注意力层的输出还进入第一全连接残差块,第一全连接残差块和第二残差块的输出进入第二文本交叉注意力层,同时第二残差块的输出还进入第二图像交叉注意力层,第二图像交叉注意力层和第二文本交叉注意力层的输出进入第三残差块,同时第二文本交叉注意力层的输出还进入第二全连接残差块,第二全连接残差块和第三残差块的输出进入第三文本交叉注意力层,同时第三残差块的输出还进入第三图像交叉注意力层,第三图像交叉注意力层和第三文本交叉注意力层的输出进入第四残差块,第四残差块的输出进入图像解码器,图像解码器输出最终重建的图像;所有的图像交叉注意力层均输入CLIP图像嵌入向量,所有的文本交叉注意力层均输入CLIP文本嵌入向量; 所述多模态扩散模型训练时目标函数为: ; 其中,x0为原始图像,q为中间过程添加噪声后的图像,p为每次正向扩散添加的噪声;空心E表示期望,用于计算随机变量的平均值,θ表示可学习的模型参数,T表示第T个添加噪声的时刻,即x1:T表示从第1次添加噪声到T时刻添加噪声的联合概率分布,x0:T表示从原始数据到T时刻添加噪声的联合概率分布。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人浙江大学,其通讯地址为:310000 浙江省杭州市西湖区余杭塘路866号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。