阿里巴巴(中国)有限公司达铖获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉阿里巴巴(中国)有限公司申请的专利模型训练和文本识别方法、装置以及存储介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN114495087B 。
龙图腾网通过国家知识产权局官网在2026-03-31发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202210138219.2,技术领域涉及:G06V20/62;该发明授权模型训练和文本识别方法、装置以及存储介质是由达铖;王鹏;姚聪设计研发完成,并于2022-02-15向国家知识产权局提交的专利申请。
本模型训练和文本识别方法、装置以及存储介质在说明书摘要公布了:本发明实施例提供了一种模型训练和文本识别方法、装置以及存储介质。所述模型训练方法包括:获取目标图像的图像特征和文本特征;融合所述图像特征和文本特征,得到所述目标图像的图文特征;基于所述图文特征和所述文本特征的校正文本标签,对文本校正模型进行训练,所述文本校正模型用于对所述文本特征进行校正。在本发明实施例的方案中,图文特征中融合了图像特征和文本特征,使得融合特征中包括了更多的图像特征所表征的上下文语义因素,因此,基于融合特征,对文本特征校正,提高了文本校正模型的校正能力,进而提高了文本识别效果。
本发明授权模型训练和文本识别方法、装置以及存储介质在权利要求书中公布了:1.一种模型训练方法,包括: 获取目标图像的图像特征和文本特征; 融合所述图像特征和文本特征,得到所述目标图像的图文特征,所述融合用于表示对所述图像特征和所述文本特征进行拼接; 基于所述图文特征和所述文本特征的校正文本标签,对文本校正模型进行训练,直至满足预设迭代条件,所述文本校正模型用于对所述文本特征进行校正,其中,所述预设迭代条件包括如下之一:所述文本校正模型的前一次输出与当前输出相同、所述文本校正模型的前一次输出与当前输出之间的差异小于预定条件; 所述文本校正模型包括上下文融合层和校正层,所述上下文融合层的输出连接到所述校正层的输入,所述校正层包括删除操作模块和插入操作模块,所述删除操作模块的输出连接到所述插入操作模块的输入,所述删除操作模块的输入作为所述校正层的输入,所述插入操作模块的输出作为所述校正层的输出; 所述删除操作模块用于根据所述文本校正标签对上下文融合后的图文特征进行字符删除,所述插入操作模块用于根据所述文本校正标签对删除字符的图文特征进行字符插入。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人阿里巴巴(中国)有限公司,其通讯地址为:310051 浙江省杭州市滨江区长河街道网商路699号4号楼5楼508室;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励