Document
拖动滑块完成拼图
专利交易 商标交易 积分商城 国际服务 IP管家助手 科技果 科技人才 会员权益 需求市场 关于龙图腾 更多
 /  免费注册
到顶部 到底部
清空 搜索
最新专利技术
  • 本申请公开了一种文字识别方法及装置、存储介质、电子装置,其中,上述文字识别方法包括:通过确定待处理的媒体数据,并进行特征提取,能够快速准确地分析媒体数据的特性,确定媒体数据的媒体特征数据,进一步地,将媒体特征数据输入至算子匹配模型,以通过算...
  • 本发明公开了一种利用Excel模板的表格图片OCR识别方法及工具,包括以下步骤:S1、获取目标Excel模板文件,并解析其中的打印信息,包括页眉、页脚、页码、边距;S2、将Excel文件导出的打印图像与待识别图像进行版式比对,确定打印信息在...
  • 本发明揭示了一种基于多模态大模型的视频字幕智能分割与3D化处理方法、系统、电子设备及存储介质,所述智能分割与3D化处理方法包括:步骤S1、多模态语义定位初始化步骤;步骤S2、语义驱动字幕定位步骤;步骤S3、笔画结构感知分割步骤;步骤S4、动...
  • 本发明公开了一种改进轻量化网络与多尺度特征增强的PDF文档公式检测方法,属于文档图像处理与计算机视觉技术领域。本发明旨在解决现有方法在面对PDF复杂版面中公式尺寸多变、与文本图表密集混杂时,出现的检测漏检率高、定位框不准确及计算冗余大的问题...
  • 本发明公开了一种数学公式识别编码方法,具体涉及公式编码技术领域;是通过获取待识别的数学公式图像数据,并进行符号边界提取与预处理,生成符号特征表达数据;基于符号特征表达数据执行视觉空间布局解析和符号类型语义分类,生成公式布局结构数据和符号语义...
  • 本发明公开一种移动机器人视觉图书盘点方法及系统,方法包括:获取书脊图像,识别书脊图像中的书名文本,得到书名识别结果;基于书名识别结果与预构建的候选词库,确定至少一个待纠错词;对待纠错词执行召回操作,得到候选集;对候选集中的每个候选词,计算其...
  • 本申请提供了一种图像处理方法、图像评估模型的训练方法及电子设备,涉及计算机技术、人工智能领域。其中,该方法包括:获取图像数据和询问文本数据,其中,图像数据由图像生成模型生成,询问文本数据用于采用自然语言描述对图像数据进行质量评估的需求;将图...
  • 本发明公开了一种史料交叉验证推理方法、装置、设备及存储介质,方法包括:对图像数据进行识别生成风格因子;将风格因子转化为风格向量并将风格向量嵌入至风格自适应视觉模型中;将图像数据输入至风格自适应视觉模型内,得到语义向量;从图像数据中提取多个实...
  • 本发明提供一种基于分裂循环策略的多目标分离方法及装置,涉及图像处理技术领域,所述方法包括:获取语义分割模型输出的二值化栅格掩膜图像;对所述二值化栅格掩膜图像中的连通区域进行矢量化转换,生成初始矢量要素队列;对所述初始矢量要素队列进行更新,获...
  • 本发明公开一种基于3D空间关系与多智能体辩论的图像描述方法;将图像分别输入对象理解模型、深度估计模型,获取对象描述及相对/绝对位置;将获取的数据输入空间图模块进行处理,得到位置关系文本描述;构建实体关系库,从库中提取实体间的语义关系,将提取...
  • 本申请在图像处理技术领域,公开了一种图像替换方法、系统、设备及可读存储介质,该方法包括:获取目标图像,利用训练好的天空分割模型确定目标图像的天空区域;对目标图像进行频段分解,得到第一频层和第二频层;在第一频层中对天空区域进行替换,得到替换后...
  • 一种基于SESUNet的CT扫描图像矿物智能分割方法,步骤包括构建矿物质CT图像数据集;构建基于SESUNet的分割模型;对构建的基于SESUNet的分割模型进行训练与优化。本发明在通过网络优化阶段采用加权交叉熵损失函数替代标准损失函数,为...
  • 本发明涉及一种面向焊点质量检测的基于要素级变换的数据合成与标注优化方法,包括:获取总样本集和训练好的焊核目标检测模型;基于总样本集,进行双源协同筛选,再利用焊核目标检测模型,采用扩散生图‑图像融合协同驱动方法实现标注优化,并加入到总样本集中...
  • 本发明涉及图像分割技术领域,提供了一种肠胃道内窥镜图像分割方法,包括:对获取的肠道视频进行时序预处理,剔除存在模糊和遮挡的无效帧,基于多尺度时序视觉特征构建节律信号,并估计蠕动相位,输出视频的相位时间序列及相位标签;选取代表性的相位关键帧,...
  • 一种基于Haar小波增强的在线LiDAR运动目标分割方法,它属于目标分割技术领域。本发明解决了现有运动目标在线分割方法的精度低的问题。本发明采用了残差多层感知机结构,残差多层感知机结构通过引入残差机制可以减少深度降低带来的信息损失,提高点云...
  • 本发明提供一种基于3D语义高斯建模的全景语义场景理解方法及系统,属于3D语义场景理解技术领域。本发明利用3D高斯抛雪球技术,并通过SAM模型和自编码器嵌入潜在CLIP语义信息,实现在全景视角下对三维场景的重建和语义理解。与现有技术不同,本发...
  • 本发明公开了一种图像的标注方法及装置、程序产品、存储介质,其中,该方法包括:确定第一图像与第二图像之间的目标差异信息,其中,第一图像和第二图像是在不同时间对目标区域进行拍摄得到的,目标差异信息用于表示第一图像中第一对象与第二图像中第二对象之...
  • 本申请提供了一种图像处理方法、设备、存储介质及计算机程序产品,该方法包括:将第一图像转换成图像标记特征;图像标记特征表征第一图像中的视觉内容;确定对第一图像进行描述的文本特征;识别第一图像中的第一感兴趣区域,并对第一感兴趣区域进行标记,得到...
  • 为具有开放词汇的经训练的机器学习模型生成预给定文本描述集的方法:提供图像和初始文本描述,每个初始文本描述被分配给相关联图像区域并说明区域显示内容;通过用机器学习模型的文本编码器为每个词典文本描述生成经编码的词典文本描述确定经编码的词典文本描...
  • 根据本公开的实施例,提供了一种图像标注方法、装置、设备和存储介质。该方法包括:接收用户的至少一个标注输入,每个标注输入指示用户在图像上执行标注操作的位置信息和标注操作所标注的对象的类别信息;将至少一个标注输入转换为至少一个热力图,每个热力图...
技术分类