Document
拖动滑块完成拼图
专利交易 商标交易 积分商城 国际服务 IP管家助手 科技果 科技人才 会员权益 需求市场 关于龙图腾 更多
 /  免费注册
到顶部 到底部
清空 搜索
最新专利技术
  • 本申请实施例提供一种票据信息提取方法、装置、设备、介质及程序产品,涉及人工智能领域。该方法包括:获取目标票据的票据图像;识别票据图像中的文本,得到票据文本信息;将票据图像和票据文本信息输入预先训练的多模态信息提取模型,以使多模态信息提取模型...
  • 本发明涉及一种基于四元数超图的图文试题知识点标注方法及系统,属于智能教育技术领域,以解决现有技术忽略隐性知识特征、模态间多级交互不足导致知识点标注准确性不高的问题。技术方案包括:获取图文试题的文本和视觉两种模态的显隐性四维特征;构建跨模态交...
  • 本发明涉及一种视觉语言模型的训练方法和系统,该方法包括:提供多模态几何训练数据集,所述几何训练数据集包含多个数据单元,每个数据单元包含一个编码几何图形的数字图像数据、一段描述对该几何图形提问的文本数据以及一个以支持机器解析的标记语言格式编码...
  • 本发明公开了一种通信基础设施的标签识别结果校准方法、装置及设备,包括:获取待校准的通信基础设施的标签文本的识别结果;对识别结果进行地址信息分离处理,获得地址信息和非地址信息;对识别结果进行向量化处理,获得识别结果的向量表征;根据识别结果、地...
  • 本申请实施例提供了一种数据处理方法、模型训练方法及对应的装置,可涉及人工智能、多模态情感分析等领域,该方法包括:获取包含图像及相关联文本的图文信息,分别提取图像中各图像块的图像特征,以及文本中各分词的文本特征,基于图文信息对应的第一距离矩阵...
  • 本公开提供一种印章提取及文字识别方法及相关设备。所述方法包括:对包括印章的输入图像进行边界增强,得到边界增强图像;对所述边界增强图像进行处理,提取所述印章所在区域的圆形和/或椭圆的边缘信息,并基于联合投票及轮廓拟合对所述边缘信息进行处理,得...
  • 本发明提供一种票据结构化区域分割方法、系统、电子设备及存储介质,获取票据图像,并对票据图像进行预处理,得到目标票据图像;采用改进的编码器从目标票据图像中提取多尺度语义特征图;基于多尺度语义特征图生成空间注意力增强特征图和通道注意力增强特征图...
  • 本发明属于手写文本识别领域,公开了一种面向批改场景的手写文本识别方法与系统,所述方法包括如下步骤:输入考生提交的答题卡图像;利用预设定位点或深度学习检测算法按行检测定位,裁切得到考生的手写作答图像;对考生的作答图像进行预处理,得到处理之后的...
  • 本申请公开了一种文字识别方法及装置、存储介质、电子装置,其中,上述文字识别方法包括:通过确定待处理的媒体数据,并进行特征提取,能够快速准确地分析媒体数据的特性,确定媒体数据的媒体特征数据,进一步地,将媒体特征数据输入至算子匹配模型,以通过算...
  • 本发明公开了一种利用Excel模板的表格图片OCR识别方法及工具,包括以下步骤:S1、获取目标Excel模板文件,并解析其中的打印信息,包括页眉、页脚、页码、边距;S2、将Excel文件导出的打印图像与待识别图像进行版式比对,确定打印信息在...
  • 本发明揭示了一种基于多模态大模型的视频字幕智能分割与3D化处理方法、系统、电子设备及存储介质,所述智能分割与3D化处理方法包括:步骤S1、多模态语义定位初始化步骤;步骤S2、语义驱动字幕定位步骤;步骤S3、笔画结构感知分割步骤;步骤S4、动...
  • 本发明公开了一种改进轻量化网络与多尺度特征增强的PDF文档公式检测方法,属于文档图像处理与计算机视觉技术领域。本发明旨在解决现有方法在面对PDF复杂版面中公式尺寸多变、与文本图表密集混杂时,出现的检测漏检率高、定位框不准确及计算冗余大的问题...
  • 本发明公开了一种数学公式识别编码方法,具体涉及公式编码技术领域;是通过获取待识别的数学公式图像数据,并进行符号边界提取与预处理,生成符号特征表达数据;基于符号特征表达数据执行视觉空间布局解析和符号类型语义分类,生成公式布局结构数据和符号语义...
  • 本发明公开一种移动机器人视觉图书盘点方法及系统,方法包括:获取书脊图像,识别书脊图像中的书名文本,得到书名识别结果;基于书名识别结果与预构建的候选词库,确定至少一个待纠错词;对待纠错词执行召回操作,得到候选集;对候选集中的每个候选词,计算其...
  • 本申请提供了一种图像处理方法、图像评估模型的训练方法及电子设备,涉及计算机技术、人工智能领域。其中,该方法包括:获取图像数据和询问文本数据,其中,图像数据由图像生成模型生成,询问文本数据用于采用自然语言描述对图像数据进行质量评估的需求;将图...
  • 本发明公开了一种史料交叉验证推理方法、装置、设备及存储介质,方法包括:对图像数据进行识别生成风格因子;将风格因子转化为风格向量并将风格向量嵌入至风格自适应视觉模型中;将图像数据输入至风格自适应视觉模型内,得到语义向量;从图像数据中提取多个实...
  • 本发明提供一种基于分裂循环策略的多目标分离方法及装置,涉及图像处理技术领域,所述方法包括:获取语义分割模型输出的二值化栅格掩膜图像;对所述二值化栅格掩膜图像中的连通区域进行矢量化转换,生成初始矢量要素队列;对所述初始矢量要素队列进行更新,获...
  • 本发明公开一种基于3D空间关系与多智能体辩论的图像描述方法;将图像分别输入对象理解模型、深度估计模型,获取对象描述及相对/绝对位置;将获取的数据输入空间图模块进行处理,得到位置关系文本描述;构建实体关系库,从库中提取实体间的语义关系,将提取...
  • 本申请在图像处理技术领域,公开了一种图像替换方法、系统、设备及可读存储介质,该方法包括:获取目标图像,利用训练好的天空分割模型确定目标图像的天空区域;对目标图像进行频段分解,得到第一频层和第二频层;在第一频层中对天空区域进行替换,得到替换后...
  • 一种基于SESUNet的CT扫描图像矿物智能分割方法,步骤包括构建矿物质CT图像数据集;构建基于SESUNet的分割模型;对构建的基于SESUNet的分割模型进行训练与优化。本发明在通过网络优化阶段采用加权交叉熵损失函数替代标准损失函数,为...
技术分类