Document
拖动滑块完成拼图
个人中心

预订订单
商城订单
发布专利 发布成果 人才入驻 发布商标 发布需求

请提出您的宝贵建议,有机会获取IP积分或其他奖励

投诉建议

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 积分商城 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 浙江工业大学张繁获国家专利权

浙江工业大学张繁获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉浙江工业大学申请的专利一种基于Transformer的中文环境数学公式提取及识别方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115512378B

龙图腾网通过国家知识产权局官网在2026-01-09发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202210772362.7,技术领域涉及:G06V30/414;该发明授权一种基于Transformer的中文环境数学公式提取及识别方法是由张繁;张煜辉设计研发完成,并于2022-06-30向国家知识产权局提交的专利申请。

一种基于Transformer的中文环境数学公式提取及识别方法在说明书摘要公布了:本发明公开了一种基于Transformer的中文环境数学公式提取以及识别方法。该方法包括在中文环境下将含有数学公式的图片输入数学公式掩模提取模块,提取获得含有数学公式的掩模,在该掩模中仅保留了数学公式部分而剔除了其他位置的文字部分;再输入进入数学公式图片提取模块,该模块通过形态学方法对掩模中的数学公式位置进行进一步的修补以及完善,根据修复后的掩模生成数学公式图片;再输入进入转换展示模块,经过该模块处理得到该公式的Latex,并通过Katex再生成数学公式图片进行展示和对比。本发明方法基于Transformer技术提高了公式提取以及公式识别的准确率。不同于现有技术,本发明可以自动对输入图片的公式区域进行推断,使用起来更加方便。

本发明授权一种基于Transformer的中文环境数学公式提取及识别方法在权利要求书中公布了:1.一种基于Transformer的中文环境数学公式提取及识别方法,其特征在于,包括以下步骤: 1在中文环境下将含有数学公式的图片输入数学公式掩模提取模块,经过该模块的提取获得含有数学公式的掩模,在该掩模中仅保留了数学公式部分而剔除了其他位置的文字部分; 2经过步骤1处理后得到的含有数学公式的掩模输入进入数学公式图片提取模块,该模块通过形态学方法对掩模中的数学公式位置进行进一步的修补以及完善,最后再根据修复后的掩模生成数学公式图片; 3将步骤2处理后的数学公式图片输入进入转换展示模块,经过该模块处理得到该公式的Latex,并通过Katex再生成数学公式图片进行展示和对比; 所述的步骤1为: 1.1将一组含有数学公式的中文环境图片作为输入,经过数据强化保证每个图片的大小是512512,并且是灰度图像,输入的通道数是1; 1.2构建数学公式提取模型,模型结构分成两部分,一部分是卷积下采样的部分,通过下采样提取出图片的高维特征,另一部分是以提取出的高维特征为基础进行上采样对图片进行重建;经过损失函数的向导,该模型能够滤去文字信息,但又保留公式; 1.3下采样把输入图像输入进若干个卷积层,每一个卷积层是由卷积计算、激活函数、BatchNormaliztion归一化三步骤组成,每通过一次卷积层得到的特征图,是能代表图片特征的高维特征向量,经过一个个卷积层最后得到大小11的特征图,通道数; 1.4对1.3得到的高维特征向量转换为二维矩阵,维度转换成,即得到1的矩阵,将这个通道值看做一个长为的序列,并把这个序列输入进入自然语言处理模型Transformer中进行编码,进一步提取特征; 1.5Transformer对输入的序列先进行位置编码,得到的数据再进行多头注意力机制计算,以多个注意力进行单独计算,然后将各个注意力机制获取的结果进行拼接处理,得到结果;再对多头注意力机制的输入和输出进行相加和LayerNorm的归一化处理,然后输入进前馈神经网络,得到结果再与前馈神经网络的输入相加并进行LayerNorm的归一化处理; 1.61.5的操作是Transformer编码器中的一个Block模块,依次经过多个Block模块,对特征进行进一步提取得到1的特征矩阵,再将该特征矩阵再转换为高维特征向量,即11大小; 1.7进行上采样重建,把从1.6得到的高维特征数据以及下采样时各个卷积层得到的特征图都输入反卷积层中,反卷积层的数量与卷积层一样并且层层对应,结构是由转置卷积、激活函数、BatchNormaliztion归一化组成;在输入每个反卷积层之前,通过跳连接把该反卷积层对应的卷积层所得到的下采样特征图进行拼接并输入,最终通过上采样把特征矩阵11恢复成512512的灰度图像; 1.8经过1.1到1.7模型的计算,需要得到含有数学公式位置的mask,采用由TverskyLoss及改进focalloss两部分构成的损失函数 ; 其中TP指的是模型判断正确并且预测的位置中是真实数学公式的像素点数量,FN指的是模型判断错误但是预测的位置是真实数学公式的像素点数量,FP指的是模型判断错误但是预测的位置也不是真实数学公式的像素点数量,IOU指的是模型预测的数学公式面积和真实数学公式面积的交集除以并集;、、γ为超参数; 1.9根据1.8的损失函数训练过模型后,在输入含有数学公式的中文图片后,通过模型计算可以得到一张大小与原图一样的掩模,该掩模中仅保留了数学公式部分而剔除了其他位置的文字部分。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人浙江工业大学,其通讯地址为:310014 浙江省杭州市下城区潮王路18号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。