Document
拖动滑块完成拼图
个人中心

预订订单
服务订单
发布专利 发布成果 人才入驻 发布商标 发布需求

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 西北工业大学夏召强获国家专利权

西北工业大学夏召强获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉西北工业大学申请的专利一种基于空频域融合的书画文字作品识别方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN117315278B

龙图腾网通过国家知识产权局官网在2025-07-18发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202311196354.3,技术领域涉及:G06V10/44;该发明授权一种基于空频域融合的书画文字作品识别方法是由夏召强;黄鹤翔;王煜寒;蒋晓悦;冯晓毅设计研发完成,并于2023-09-18向国家知识产权局提交的专利申请。

一种基于空频域融合的书画文字作品识别方法在说明书摘要公布了:面向书画文字作品识别任务,本发明提出了一种基于时频域融合的智能识别算法,以准确识别书画作品的作家。在该算法中,空域下特征提取网络采用只有6层的极简网络VanillaNet‑6作为Backbone,网络结构中未使用残差块、通道注意力、自注意力机制以及多分支结构,而是只含卷积计算的极简直筒结构;频域下通过离散余弦变换DiscreteCosineTransform,DCT,将变换后的特征的维度与原始特征维度拼接后,再通过集成学习EnsembleLearning将空域与频域的识别结果进行融合,以此来提高算法对于中国书画文字作品的识别准确率。

本发明授权一种基于空频域融合的书画文字作品识别方法在权利要求书中公布了:1.一种基于空频域融合的书画文字作品识别方法,包括三个部分:空域特征提取网络的设计、频域特征提取网络的设计和空频域集成学习; 1空域特征提取网络的设计 网络训练时通过使用带有激活函数的两个卷积层来增加模型的非线性表现能力,并在训练结束时将其合并为一个简单卷积层,以降低推理时间,其中激活函数可以表示为: A′x=1-λAx+λx1 其中,Ax代表卷积层的激活函数,使用超参数λ=epochEpochs,在训练开始的时候A′x=Ax,训练结束时A′x=x,以此将其合并为一个恒等变换的卷积层来提高推理速度; 采用并行堆叠激活函数可以提供更多的非线性表示和特征组合能力,以增强神经网络的性能和适应性,这种方法可以增加网络的灵活性,并且适用于一些需要更多非线性操作的任务,并行堆叠激活函数可以表示为: 其中,ai和bi分别为每个激活函数的尺度与偏置,n代表用于堆叠的激活函数的数量; 为了进一步丰富近似能力,通过改变邻近值的输入来学习全局的信息,给定一个输入x∈其中H,W和C分别代表x的高、宽和通道数,因此激活函数可以表示为: 其中,h∈{1,2,...,H},w∈{1,2,...,W},c∈{1,2,...,C},激活函数Asxh,w,c随着不同的n值获取邻近值的激活函数,从而得到全局的信息; 2频域特征提取网络的设计 频域特征网络与空域特征网络结构相似,仅是每层的输入维度相较于空域特征网络扩大了一倍,为了保持最后的特征输出mOut与空域特征网络的特征输出Out大小一致,将最后一个合并卷积层中的卷积核的个数保持为4096; 给定一个224×224的图像矩阵Fu,v,其中u,v分别代表着两个方向上的离散频率变量,则DCT系数矩阵Gu,v可以表示为: 其中,Cu和Cv时DCT系数矩阵中位置u和v的缩放因子,根据位置不同取值为或1; 在网络的输入端,对于给定的输入对其RGB三个通道独立的二维矩阵进行二维离散余弦变换,将图像从空域转换为频域,把DCT的结果拼接后获得对应的输入 将所获得的输入x,经过Backbone网络卷积层后得到对应的频域特征fspatial,将xDCT经过修正卷积核个数的Backbone网络卷积层后得到的空域特征ffreq与频域特征fspatial进行维度上的拼接后,继续在修正的Backbone网络中进行特征提取得到最终的Out输出,具体可由下式表示: 其中,Conv0代表Backbone网络的第一个卷积层,用于以下采样的方式将输入图像从3个通道转换为多个通道来学习有用的信息;mConv代表修正卷积核个数的Backbone网络,用于匹配维度拼接后的输入;第n-1个卷积层的空域输出和频域输出分别用与代表; 为了匹配输入维度拼接的空频特征,在前5层的mConv卷积核中输入维度为Conv卷积核的2倍,并在之后的每一个卷积层后继续将空域输出特征与频域输出特征维度融合; 3空频域集成学习 集成学习是一种通过组合多个分类器或模型的预测结果,来获得更准确、更稳定的预测结果的机器学习方法,通过将空域Backbone网络的输出Out与修正后的频域Backbone网络的输出mOut按照一定的比例γ进行组合,具体预测结果可以由公式8表达; Prediction=Softmaxγ*Out+1-γ*mOut8。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人西北工业大学,其通讯地址为:710072 陕西省西安市碑林区友谊西路127号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。