Document
拖动滑块完成拼图
专利交易 商标交易 积分商城 国际服务 IP管家助手 科技果 科技人才 会员权益 需求市场 关于龙图腾 更多
 /  免费注册
到顶部 到底部
清空 搜索
最新专利技术
  • 本发明公开了一种基于多模态大模型的光学字符识别方法及系统,属于光学字符识别技术领域,采用强化学习对模型进行后训练,并针对SFT训练不足的情况进行补充训练;包括:建立表格知识数据库:搜集图片格式的表格数据,同时基于表格内容,构建相应的结构化数...
  • 本申请公开了一种文档结构提取及模型训练方法、装置、设备及介质,涉及人工智能与计算机视觉技术领域。该方法包括:构建含至少两种文档理解任务(包括光学字符识别、布局分析、文本定位、区域文本提取、图像描述和图表标题生成)数据的专项训练数据集,及用于...
  • 本发明属于计算机视觉领域,公开了一种基于注意力机制的上下文优化提示算法、系统、计算机设备及其应用,旨在通过提示微调提升视觉‑语言模型的性能与泛化能力。该方法首先获取待处理的文本提示和对应的图像数据,利用上下文优化机制生成多样化的提示词,并将...
  • 本申请公开了一种图像处理方法及相关装置,所述方法包括:根据多个图像的图像差异和/或当前次图像分类任务的分类标签的数量确定每个图像的文本信息类别;提取所述每个图像的文本信息类别对应的文本信息;根据所述每个图像的文本信息确定所述每个图像的文本编...
  • 本申请实施例提供的一种特检设备软件启动状态识别与信息自动录入方法及系统,包括获取特检设备软件在历史启动状态下的软件界面截图,并以此构建相对位置文件以及标准化图像库;将特检设备软件的实时桌面图像输入至图像分割模型中,处理得到面积最大的目标掩码...
  • 本发明涉及建筑工程技术领域,公开了基于深度学习的图框信息智能识别方法及装置,包括获取工程图中数据作为原始数据;对所述原始数据进行图框范围提取与过滤处理,得到目标图框范围;采用深度学习模型对所述目标图框范围进行图签区域与单元格识别,得到图签区...
  • 本发明涉及图像识别处理技术领域,特别涉及一种签收照片水印识别方法、装置、设备及存储介质。所述签收照片水印识别方法包括如下步骤:获取多张快递员上门签收时拍摄的照片样本,对照片样本中的水印文字进行标注,以获得标注数据集;构建GOT‑OCR2模型...
  • 本申请提供的一种基于字符识别网络的车辆识别代号照片比对方法,其构建了噪声预测网络,通过噪声预测网络学习现有的所有VIN码的图像特征,将训练好的噪声预测网络设置在扩散模型中;在扩散模型中,使用预设的标准高斯噪声图片输入到训练好的噪声预测网络中...
  • 本申请涉及一种解耦双速自适应测试方法、装置、设备、介质和产品。所述方法包括:获取测试的图像样本和模板提示词;其中,模板提示词是基于已训练任务的类别设置的;获取预训练的目标解耦双速自适应模型,并根据目标解耦双速自适应模型对图像样本和模板提示词...
  • 本申请公开了一种错别字识别方法、装置、设备及计算机可读取存储介质,该方法包括:采集手写文本图像;通过文本检测模型和文本识别模型对手写文本图像进行检测与识别,确定手写文本图像包括的每个字符所对应的置信度,并根据每个字符所对应的置信度,在手写文...
  • 本说明书实施例提供了一种识别图像内容的方法、装置、设备及介质。方案包括:获取包括用户手写的英文文本的目标图像;将目标图像输入文本检测模型,得到文本检测模型输出的英文文本内容中各个单词的边界框的位置信息和尺寸信息;基于各个单词对应的边界框的位...
  • 本发明公开了一种基于语义理解的多模态数据自动标注方法,包括如下步骤:步骤一:采集并预处理原始图像数据和原始文本数据;步骤二:将图像数据集输入至Inception网络提取视觉特征;步骤三:将文本数据集中的每个词语转换为词向量表示,并进行位置编...
  • 本发明实施例涉及一种螺杆泵工况监测方法、装置、电子设备及存储介质,通过获取螺杆泵的工况曲线图,所述工况曲线图包括压力曲线、震动曲线以及电流曲线中的至少一种;将所述工况曲线图输入到宽卷积核深度卷积神经网络中,识别出有效特征;将所述有效特征输入...
  • 本发明公开了一种基于双分支Transformer的彝文字古籍图像检测方法,包括:获取彝文字古籍图像数据集;构建彝文字古籍图像检测模型,所述彝文字古籍图像检测模型包括特征提取主干网络、双分支特征提取与融合模块、文本核拉伸模块与预测和文本后处理...
  • 本申请公开了一种文档图像解析方法、装置、电子设备及存储介质。文档图像解析方法包括:利用编码器对目标文档图像进行编码,得到所述目标文档图像的目标全局特征图信息;利用联合解码器,根据所述目标全局特征图信息进行空间和内容的联合解码,得到所述目标文...
  • 本申请涉及计算机视觉领域,具体提供一种表格识别重构方法、系统、终端及介质,首先将大尺寸表格图像分解为多个重叠子图,采用并行识别对各子图进行表格结构检测和OCR文字识别;然后通过坐标映射与置信度加权融合算法整合子图识别结果,消除边界误差;接着...
  • 本发明涉及文档图像理解与信息抽取技术领域,提出一种面向表格条款的多模态结构化抽取与答案聚合方法及系统。该方法通过表格检测与结构重建、语义角色标注、语义对齐与跨表聚合、条件裁剪、一致性校核及答案生成步骤,实现规章类表格中参数‑单位‑阈值‑条件...
  • 本申请涉及一种表格识别方法及装置。其中,表格识别方法包括:获取待识别表格图像;对表格图像进行线段检测,得到多个横线段和多个竖线段;基于多个横线段中每一横线段的横向投影信息,从多个横线段中确定出处于不同纵向位置范围的多个单元格横线段集;基于多...
  • 本发明公开一种工程图纸明细表识别并生成BOM表方法,属于自动化技术与图像处理交叉领域,该方法包括:获取工程图纸的扫描或电子图像;通过预设基准线定位,递归检测符合面积差阈值的嵌套矩形区域,确定标题栏、明细表区域坐标及表格图像;识别线条与交叉点...
  • 本发明提供了一种复杂表格识别方法和系统,涉及计算机视觉领域,包括:基于多种检测方法对表格图像中的表格轮廓进行识别,得到多个识别结果,基于预设规则融合识别结果,得到表格边界框;基于多种图像处理方法检测能够对表格内容进行分割的主干分隔元素,综合...
技术分类