Document
拖动滑块完成拼图
专利交易 商标交易 积分商城 国际服务 IP管家助手 科技果 科技人才 会员权益 需求市场 关于龙图腾 更多
 /  免费注册
到顶部 到底部
清空 搜索
最新专利技术
  • 本申请涉及计算机视觉领域,具体提供一种表格识别重构方法、系统、终端及介质,首先将大尺寸表格图像分解为多个重叠子图,采用并行识别对各子图进行表格结构检测和OCR文字识别;然后通过坐标映射与置信度加权融合算法整合子图识别结果,消除边界误差;接着...
  • 本申请公开了一种文档图像解析方法、装置、电子设备及存储介质。文档图像解析方法包括:利用编码器对目标文档图像进行编码,得到所述目标文档图像的目标全局特征图信息;利用联合解码器,根据所述目标全局特征图信息进行空间和内容的联合解码,得到所述目标文...
  • 本发明公开了一种基于双分支Transformer的彝文字古籍图像检测方法,包括:获取彝文字古籍图像数据集;构建彝文字古籍图像检测模型,所述彝文字古籍图像检测模型包括特征提取主干网络、双分支特征提取与融合模块、文本核拉伸模块与预测和文本后处理...
  • 本发明实施例涉及一种螺杆泵工况监测方法、装置、电子设备及存储介质,通过获取螺杆泵的工况曲线图,所述工况曲线图包括压力曲线、震动曲线以及电流曲线中的至少一种;将所述工况曲线图输入到宽卷积核深度卷积神经网络中,识别出有效特征;将所述有效特征输入...
  • 本发明公开了一种基于语义理解的多模态数据自动标注方法,包括如下步骤:步骤一:采集并预处理原始图像数据和原始文本数据;步骤二:将图像数据集输入至Inception网络提取视觉特征;步骤三:将文本数据集中的每个词语转换为词向量表示,并进行位置编...
  • 本说明书实施例提供了一种识别图像内容的方法、装置、设备及介质。方案包括:获取包括用户手写的英文文本的目标图像;将目标图像输入文本检测模型,得到文本检测模型输出的英文文本内容中各个单词的边界框的位置信息和尺寸信息;基于各个单词对应的边界框的位...
  • 本申请公开了一种错别字识别方法、装置、设备及计算机可读取存储介质,该方法包括:采集手写文本图像;通过文本检测模型和文本识别模型对手写文本图像进行检测与识别,确定手写文本图像包括的每个字符所对应的置信度,并根据每个字符所对应的置信度,在手写文...
  • 本申请涉及一种解耦双速自适应测试方法、装置、设备、介质和产品。所述方法包括:获取测试的图像样本和模板提示词;其中,模板提示词是基于已训练任务的类别设置的;获取预训练的目标解耦双速自适应模型,并根据目标解耦双速自适应模型对图像样本和模板提示词...
  • 本申请提供的一种基于字符识别网络的车辆识别代号照片比对方法,其构建了噪声预测网络,通过噪声预测网络学习现有的所有VIN码的图像特征,将训练好的噪声预测网络设置在扩散模型中;在扩散模型中,使用预设的标准高斯噪声图片输入到训练好的噪声预测网络中...
  • 本发明涉及图像识别处理技术领域,特别涉及一种签收照片水印识别方法、装置、设备及存储介质。所述签收照片水印识别方法包括如下步骤:获取多张快递员上门签收时拍摄的照片样本,对照片样本中的水印文字进行标注,以获得标注数据集;构建GOT‑OCR2模型...
  • 本发明涉及建筑工程技术领域,公开了基于深度学习的图框信息智能识别方法及装置,包括获取工程图中数据作为原始数据;对所述原始数据进行图框范围提取与过滤处理,得到目标图框范围;采用深度学习模型对所述目标图框范围进行图签区域与单元格识别,得到图签区...
  • 本申请实施例提供的一种特检设备软件启动状态识别与信息自动录入方法及系统,包括获取特检设备软件在历史启动状态下的软件界面截图,并以此构建相对位置文件以及标准化图像库;将特检设备软件的实时桌面图像输入至图像分割模型中,处理得到面积最大的目标掩码...
  • 本申请公开了一种图像处理方法及相关装置,所述方法包括:根据多个图像的图像差异和/或当前次图像分类任务的分类标签的数量确定每个图像的文本信息类别;提取所述每个图像的文本信息类别对应的文本信息;根据所述每个图像的文本信息确定所述每个图像的文本编...
  • 本发明属于计算机视觉领域,公开了一种基于注意力机制的上下文优化提示算法、系统、计算机设备及其应用,旨在通过提示微调提升视觉‑语言模型的性能与泛化能力。该方法首先获取待处理的文本提示和对应的图像数据,利用上下文优化机制生成多样化的提示词,并将...
  • 本申请公开了一种文档结构提取及模型训练方法、装置、设备及介质,涉及人工智能与计算机视觉技术领域。该方法包括:构建含至少两种文档理解任务(包括光学字符识别、布局分析、文本定位、区域文本提取、图像描述和图表标题生成)数据的专项训练数据集,及用于...
  • 本发明公开了一种基于多模态大模型的光学字符识别方法及系统,属于光学字符识别技术领域,采用强化学习对模型进行后训练,并针对SFT训练不足的情况进行补充训练;包括:建立表格知识数据库:搜集图片格式的表格数据,同时基于表格内容,构建相应的结构化数...
  • 本发明涉及一种面向电气柜压板实现细小倾斜文字标签高精度识别的方法,包括以下步骤:执行颜色归一化、亮度均衡化和畸变校正的操作;进行文字区域检测,自动定位细小文字标签区域;进行多尺度特征提取;自动区分正常文本与倾斜文本;进行旋转、仿射或透视变换...
  • 本发明公开了一种基于深度学习的多类型仪表图像分类与读数识别方法,该方法使用深度学习方法训练仪表图像分类与读数识别模型对多类型仪表图像进行分类与识别;该模型设计基于YOLOv11结合Swin Transformer的多尺度仪表检测网络、基于Y...
  • 本发明提供的基于几何推理引导的遥感道路图像分割方法、装置及设备,涉及遥感图像分割技术领域。本发明通过获取遥感道路图像, 将所述遥感道路图像输入编码器进行空间特征提取与调制,得到特征调制后的多尺度特征;对特征调制后的多尺度特征进行道路几何形状...
  • 本发明公开一种基于语义‑视觉双记忆融合的SAM2小样本分割方法,通过构建语义查询记忆、视觉查询记忆及查询相关支持视觉记忆,经查询相关支持视觉记忆引导的记忆细化模块融合语义查询记忆和视觉查询记忆,结合SAM2密集匹配与解码模块端到端训练。解决...
技术分类