Document
拖动滑块完成拼图
首页 专利交易 IP管家助手 科技果 科技人才 积分商城 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
最新专利技术
  • 本发明公开了一种基于CLIP驱动的查询分解历史文档图像分割方法,包括如下步骤:1)将历史文档图像作为输入,生成特征图;2)生成最终的融合特征;3)为了使文本特征与图像特征充分交互,需要使用层次解码器对、、和多尺度图像特征进行计算;4)前馈网...
  • 本发明涉及一种基于多模态文档布局分析的试卷解析方法,包括以下步骤:基于从网络教育站点获取的docx格式的试卷文档,通过自动化标注技术进行数据集构建;提出了一种双流Transformer框架来学习文档的文本‑视觉多模态信息;通过引入新的预训练...
  • 本发明涉及图像识别技术领域,公开了一种多语言图像文字识别及翻译的智能数据处理方法,包括:获取包含文字内容的初始图像进行预处理;对预处理后的初始图像采用DB文本检测器进行文本位置检测,得到多个文本区域;对每个文本区域中的文本进行几何矫正,得到...
  • 本发明提供一种基于“图形‑布局”解耦的风格化手写数学公式生成方法,包括:以参考风格的手写公式样本和目标的打印体公式作为输入,编码打印体公式中数学符号的类别信息和对应数学符号的位置信息,提取标准数学公式局部数学符号的类别特征和整体的布局特征;...
  • 一种基于边界GCN的任意形状东巴文字符检测方法,包括以下步骤:步骤一:收集并整理东巴文手稿经书图像;步骤二:构建东巴文字符检测数据集,并分为训练集和测试集;步骤三:构建基于GCN的任意形状东巴文字符检测模型;步骤四:将训练集输入步骤三中的东...
  • 本发明提供一种基于“图像‑结构”多模态互学习的手写文本识别方法及系统,包括:根据手写文本图像构建图结构,采用结构特征提取网络和图像特征提取网络分别对图结构进行特征突起,得到结构特征和图像特征;采用结构引导的图像解码器对结构特征将进行解码处理...
  • 本发明属于人工智能与图像识别交叉技术领域,公开了一种融合笔画结构建模的草书图像序列识别方法,该方法包括:草书图像的预处理与规范化,清除干扰信息并规范草书图像形态,确保后续处理流程的稳定性与有效性;基于结构分析的笔画分解与特征编码,通过字符骨...
  • 本发明公开了一种最大池化增强的多标签印刷汉字属性识别方法,包括:根据印刷汉字图像构建训练数据集;构建属性识别模型和全局损失函数;其中,下采样模块包括依次连接的第二卷积层和第一最大池化层;多标签分类模块包括:第三卷积层、与第三卷积层并行连接的...
  • 本申请提供了一种光学字符识别模型的训练方法、图片处理方法及装置,该光学字符识别模型的训练方法包括:获取样本数据;样本数据包括图片以及图片对应的真实标签;利用第一光学字符识别模型对图片进行处理,得到第一预测结果,以及利用待训练的第二光学字符识...
  • 本申请实施例提供一种测试回单的方法、装置、存储介质及处理器,该方法包括:获取目标回单的图片文件和凭证配置信息;获取所述图片文件中的文本信息;根据字符位置与凭证配置信息中位置坐标范围的重叠度和/或距离关系确定映射关系,将字符内容与所述凭证配置...
  • 本发明涉及图片识别技术领域,具体涉及一种敏感图片文件智能识别方法及系统。方法包括获取待检测图片,对获取的待检测图片进行标准化预处理,从预处理后的待检测图片中分别提取视觉特征、文本特征及光谱特征并进行融合得到多维特征向量,将多维特征向量映射为...
  • 本申请涉及数据处理技术领域,公开了一种汽车故障码标注方法、装置、计算机设备及存储介质,本申请的汽车故障码标注方法,通过对故障维修数据进行识别处理,生成结构化数据,对结构化数据进行标准化处理,生成文本校验数据;基于文本校验数据提取故障码字段及...
  • 本发明公开了一种基于深度学习的建筑设计图纸智能尺寸审查方法,包括如下步骤:S1、数据集与模型准备;S2、线段检测,对图纸中带尺寸标注的线段进行检测;S3、尺寸处理,对图纸中的尺寸标注要素进行处理;S4、匹配引擎:对图纸中的线段与线段进行匹配...
  • 本发明实施例提供了一种文本提取方法、装置、电子设备及介质,涉及计算机领域。该方法包括:对视频帧序列进行文字识别处理,确定文字方向为竖直方向的第一类视频帧;将第一类视频帧输入视觉‑语言模型,获取其输出的第二文本数据及其第二位置信息;根据第二文...
  • 本申请实施例提供的一种基于视觉大模型SAM的特检设备软件自动识别方法及系统,该方法包括:获取特检设备软件的实时桌面图像,并对实时桌面图像按照固定比例进行裁剪,得到只包含软件图标的核心区域图像;将核心区域图像输入至视觉大模型SAM中,经过自动...
  • 本发明属于盲文识别技术领域,涉及一种盲文点字识别方法、系统及手套;该方法利用压阻传感器阵列按压数据集中的各个盲文点阵,基于压阻传感器阵列中各个压阻传感器输出的电阻信号,得到各个盲文点阵对应的电阻信号矩阵;对各个电阻信号矩阵中的各个电阻信号进...
  • 本发明涉及数据处理技术领域,尤其涉及一种电力海量复杂版面文档的图像关键区域信息提取方法。本发明包括步骤S1:将文档图像数据,通过OCR技术获取文档图像数据中的文本框与所有文本内容A,步骤S2:根据OCR识别结果,得到文本图像中的文本区域界限...
  • 本发明属于化学反应OCR识别技术领域,具体涉及一种基于多模型协同的化学反应OCR识别方法及系统。所述识别方法包括如下步骤:(1)反应图像数据,(2)化学反应检测模型,(3)反应角色检测模型,(4)化合物识别模型,(5)文本识别模型,(6)方...
  • 本申请涉及一种证件图像信息提取方法、装置、电子装置和存储介质,应用于图像处理领域,该方法包括:基于预设的初始提取指令调用目标视觉语言模型,对待处理证件图像进行首次信息提取,得到初始的提取结果;根据预设的结果有效性判断标准,对初始的提取结果进...
  • 本发明公开一种互动式汉字溯源与书写矫正系统,属汉字教育技术领域。针对现有工具溯源静态化、矫正单一化、路径固化问题,其技术方案包括:构建甲骨文至楷书七类字体演变数据库,结合3D建模与AR渲染动态展示字形演化;通过压力传感笔、红外摄像头等采集多...
技术分类