Document
拖动滑块完成拼图
个人中心

预订订单
商城订单
发布专利 发布成果 人才入驻 发布商标 发布需求

请提出您的宝贵建议,有机会获取IP积分或其他奖励

投诉建议

在线咨询

联系我们

龙图腾公众号
专利交易 商标交易 积分商城 国际服务 IP管家助手 科技果 科技人才 会员权益 需求市场 关于龙图腾 更多
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 中汽信息科技(天津)有限公司张帆获国家专利权

中汽信息科技(天津)有限公司张帆获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉中汽信息科技(天津)有限公司申请的专利一种基于大模型的多场景文本识别方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN121392880B

龙图腾网通过国家知识产权局官网在2026-03-27发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202511971196.3,技术领域涉及:G06V30/418;该发明授权一种基于大模型的多场景文本识别方法及系统是由张帆;王海洋;邵丽青;韩胜强;冯乾隆;郭雅鑫;刘磊;智云胜;刘倩设计研发完成,并于2025-12-25向国家知识产权局提交的专利申请。

一种基于大模型的多场景文本识别方法及系统在说明书摘要公布了:本发明提供一种基于大模型的多场景文本识别方法及系统,属于多场景文本识别技术领域;该方法包括基于多场景图像样本构建训练数据集;利用训练数据集对提示引擎进行训练,获取待识别图像,提取待识别图像的图像视觉特征向量并输入至训练后的提示引擎,得到待识别图像的提示词模板标识符;将目标提示词与待识别图像输入至文本识别模型,文本识别模型输出文本识别结果。本发明通过引入可训练的提示引擎,本发明通过可训练的提示引擎,利用输入图像的视觉特征来筛选出与当前场景最相关的提示词,并利用该提示词为文本识别模型提供场景化、针对性的识别指引,有效破解了单一文本识别模型在多样场景下泛化能力薄弱的技术难题。

本发明授权一种基于大模型的多场景文本识别方法及系统在权利要求书中公布了:1.一种基于大模型的多场景文本识别方法,其特征在于,包括: 采集多场景图像样本,并基于所述多场景图像样本构建训练数据集,包括:为每个图像样本标注一个提示词模板标识符,所述提示词模板标识符关联一个该图像样本所属场景的预定义的提示词模板;采用预训练的视觉特征提取模型,对所有已标注的所述图像样本执行视觉特征提取运算,得到各图像样本分别对应的图像视觉特征向量;将每个所述图像样本的所述图像视觉特征向量与其标注的所述提示词模板标识符组合为键值对,由全部所述键值对构成训练数据集; 利用所述训练数据集对提示引擎进行训练,使所述提示引擎能够根据输入图像的图像视觉特征向量输出对应的提示词模板标识符; 所述利用所述训练数据集对提示引擎进行训练包括: 构建分类器网络,并将所述分类器网络作为所述提示引擎,所述分类器网络包括一个输入层、至少一个全连接隐藏层和一个输出层; 所述输入层的神经元数量与所述图像视觉特征向量的维度一致,所述输出层的神经元数量与预定义的提示词模板的类别总数相同; 所述输出层采用归一化指数激活函数,以输出对应各提示词模板类别的概率分布; 按预设比例将所述训练数据集划分为训练子集与验证子集,使用所述训练子集迭代训练所述分类器网络,并以所述验证子集的性能指标作为早停机制的触发判断条件; 当满足早停机制的触发判断条件或达到预设的最大迭代次数时,训练终止,得到训练后的提示引擎; 所述使用所述训练子集迭代训练所述分类器网络包括: 将所述训练子集中一个数据批次的图像视觉特征向量输入所述分类器网络; 所述分类器网络依次通过输入层、至少一个全连接隐藏层、输出层,对输入的图像视觉特征向量执行非线性变换,并由输出层生成预测概率分布向量; 计算所述预测概率分布向量与真实提示词模板标识符对应的独热编码向量之间的偏离度,并将此偏离度作为当前数据批次的损失值; 利用误差反向传播算法,计算得到所述损失值相对于分类器网络参数的梯度; 采用基于梯度下降的优化器,根据计算的所述梯度对所述分类器网络的各参数进行调整; 重复上述步骤,遍历所述训练子集中的全部数据批次,完成一个训练周期; 重复执行多个所述训练周期,直至触发基于验证子集性能的早停机制或达到预设的最大迭代次数; 获取待识别图像,提取所述待识别图像的图像视觉特征向量并输入至训练后的所述提示引擎,得到待识别图像的提示词模板标识符; 根据待识别图像的提示词模板标识符,从提示词模板库中查询得到目标提示词; 将所述目标提示词与所述待识别图像输入至文本识别模型,所述文本识别模型输出文本识别结果,完成对应场景的文本识别。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人中汽信息科技(天津)有限公司,其通讯地址为:300300 天津市东丽区先锋东路68号科研楼416室;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。