Document
拖动滑块完成拼图
个人中心

预订订单
商城订单
发布专利 发布成果 人才入驻 发布商标 发布需求

请提出您的宝贵建议,有机会获取IP积分或其他奖励

投诉建议

在线咨询

联系我们

龙图腾公众号
专利交易 积分商城 国际服务 IP管家助手 科技果 科技人才 商标交易 会员权益 需求市场 关于龙图腾 更多
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 华南理工大学金连文获国家专利权

华南理工大学金连文获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉华南理工大学申请的专利一种基于动态采样的端到端文字识别方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN116935403B

龙图腾网通过国家知识产权局官网在2026-01-02发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202311015384.X,技术领域涉及:G06V30/18;该发明授权一种基于动态采样的端到端文字识别方法是由金连文;黄明鑫;刘禹良设计研发完成,并于2023-08-14向国家知识产权局提交的专利申请。

一种基于动态采样的端到端文字识别方法在说明书摘要公布了:本发明公开了一种基于动态采样的端到端文字识别方法,包括以下步骤:获取待处理的文本图像;将所述待处理的文本图像输入文本检测模型,获取待处理图像中的文字区域;将所述文字区域输入动态采样模型,获取与所述文字区域对应的文字视觉特征;将所述文字视觉特征输入识别模型,获取识别结果。本发明利用动态采样网络来连接文本检测和文本识别网络,能够识别各种场景下复杂多样的文字,适用于不同机制的端到端文字识别方法,并在各个公开的数据集上达到了较高的准确率,具有极高的实用性和应用价值。

本发明授权一种基于动态采样的端到端文字识别方法在权利要求书中公布了:1.一种基于动态采样的端到端文字识别方法,其特征在于,包括以下步骤: 获取待处理的文本图像; 将所述待处理的文本图像输入文本检测模型,获取待处理图像中的文字区域;其中,所述文本检测模型采用稀疏的RCNN模型,基于所述稀疏的RCNN模型,利用视觉特征对若干个候选区域进行校正,获取所述待处理图像中的文字区域:对若干个所述候选区域进行随机初始化,获取若干个候选特征,若干个所述候选区域和若干个所述候选特征一一对应;若干个所述候选特征通过多头注意力机制后与若干个所述候选特征进行相加并进行LayerNorm归一化,再通过全连接层,获取卷积核的权重;基于所述卷积核的权重对所述视觉特征进行卷积操作、LayerNorm归一化和激活操作,并利用所述全连接层输出若干个偏移量;利用若干个所述偏移量对若干个所述候选区域进行校正,获取校正候选区域及校正候选特征;所述校正候选区域利用ROIAlign进行特征提取,并输入下一层所述稀疏的RCNN模型,直至获取所述待处理图像中的文字区域; 将所述文字区域输入动态采样模型,获取与所述文字区域对应的文字视觉特征,所述动态采样模型包括低层次注意力模型、高层次注意力模型、可形变卷积采样模型、识别转换模型,将所述文字区域分别输入所述低层次注意力模型和所述高层次注意力模型,获取低层次语义级别的特征和高层次语义级别的特征;将所述低层次语义级别的特征和所述高层次语义级别的特征进行拼接操作,并输入所述可形变卷积采样模型进行特征提取,获取动态采样特征:将所述低层次语义级别的特征和所述高层次语义级别的特征进行拼接,获取拼接后的特征;可形变卷积层利用所述拼接后的特征进行预测,获取偏移量;基于所述偏移量,所述可形变卷积层对所述拼接后的特征进行采样,获取采样后的特征;利用BatchNorm归一化层和GELU激活层对所述采样后的特征进行归一化和激活,获取归一化和激活后的特征;利用所述卷积层对所述归一化和激活后的特征进行下采样,获取所述动态采样特征:将所述低层次语义级别的特征和所述高层次语义级别的特征进行拼接,获取拼接后的特征;所述可形变卷积层利用所述拼接后的特征进行预测,获取偏移量;基于所述偏移量,所述可形变卷积层对所述拼接后的特征进行采样,获取采样后的特征;利用所述BatchNorm归一化层和所述GELU激活层对所述采样后的特征进行归一化和激活,获取归一化和激活后的特征;利用所述卷积层对所述归一化和激活后的特征进行下采样,获取所述动态采样特征; 将所述动态采样特征和所述校正候选特征输入所述识别转换模型进行融合,获取与所述文字区域对应的文字视觉特征; 将所述文字视觉特征输入识别模型,获取识别结果。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人华南理工大学,其通讯地址为:510641 广东省广州市天河区五山路381号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。