Document
拖动滑块完成拼图
个人中心

预订订单
服务订单
发布专利 发布成果 人才入驻 发布商标 发布需求

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 四川极速动力科技有限公司张小刚获国家专利权

四川极速动力科技有限公司张小刚获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉四川极速动力科技有限公司申请的专利一种基于深度学习的复杂场景文本检测方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN118968491B

龙图腾网通过国家知识产权局官网在2025-07-11发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411172626.0,技术领域涉及:G06V20/62;该发明授权一种基于深度学习的复杂场景文本检测方法是由张小刚;钟剑丹;祖艺航;詹裕浩设计研发完成,并于2024-08-26向国家知识产权局提交的专利申请。

一种基于深度学习的复杂场景文本检测方法在说明书摘要公布了:本发明公开了一种基于深度学习的复杂场景文本检测方法,属于特定计算机模型技术领域,包括获取文本检测数据集;构造GCCM模块;基于2个Comodule模块、3个GCCM模块、拆分单元和Conca单元构造多层全局上下文卷积模块,基于MaskR‑CNN的骨干网络和多层全局上下文卷积模块构造ResNet50‑TransGC网络,并用文本检测数据集训练至收敛,得到文本检测模型;S6,获取待识别文本图像,用文本检测模型进行目标识别,输出预测文本框。本发明能更轻松的区分复杂背景下的文本和非文本区域,应对多变的文本形状和方向,提高小文本实例的检测精度,增强对长距离依赖的建模能力,从而实现复杂场景下的文本精确检测。

本发明授权一种基于深度学习的复杂场景文本检测方法在权利要求书中公布了:1.一种基于深度学习的复杂场景文本检测方法,其特征在于:包括以下步骤; S1,获取文本检测数据集,所述文本检测数据集内样本为包含文本框标注的文本图像; S2,构造一GCCM模块,包括从上到下依次连接的全局平均池化层、第一1×1卷积层、1×11深度可分离卷积层、11×1深度可分离卷积层、第二1×1卷积层和sigmoid激活函数层; S3,构造一多层全局上下文卷积模块,包括2个ConvModule模块、3个GCCM模块、拆分单元和Concat单元,2个ConvModule模块分别标记为ConvModule1、ConvModule2、3个GCCM模块分别标记为GCCM1、GCCM2、GCCM3; 对输入多层全局上下文卷积模块的特征F,经ConvModule1、拆分单元后拆分为第一特征、第二特征,依次经GCCM1、GCCM2、GCCM3输出第一全局上下文特征、第二全局上下文特征、第三全局上下文特征、依次经GCCM2、GCCM3得到第四全局上下文特征、第五全局上下文特征,且与相加得到第六全局上下文特征;、和经Concat单元拼接为拼接特征,再经ConvModule1输出多层全局上下文特征; S4,构造一ResNet50-TransGC网络; 选取一MaskR-CNN网络,其骨干网络为Resnet50,所述Resnet50的阶段4包括依次连接的BTNK1和2个BTNK2,用Transformer编码器替换BTNK1、多层全局上下文卷积模块替换第一个BTNK2,得到ResNet50-TransGC网络; S5,用文本检测数据集训练ResNet50-TransGC网络至收敛,得到文本检测模型; S6,获取待识别文本图像,用文本检测模型进行目标识别,输出预测文本框。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人四川极速动力科技有限公司,其通讯地址为:610000 四川省成都市高新区中和府滨中路85号1层;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由AI智能生成
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。