Document
拖动滑块完成拼图
专利交易 商标交易 积分商城 国际服务 IP管家助手 科技果 科技人才 会员权益 需求市场 关于龙图腾 更多
 /  免费注册
到顶部 到底部
清空 搜索
最新专利技术
  • 本发明公开了一种档案印章、印章文字及其排布类型的获取方法,包括以下步骤:将带有印章的档案图像输入到印章检测模型,获得印章图像和印章类型;采用印章类型对应的中心点获取方法确定印章图像的中心点;以印章图像的中心点为旋转中心对印章图像进行旋转,获...
  • 本发明公开了基于深度学习的多文种混合文字识别方法及系统,方法包括文本图像采集、数据初步处理、文本检测模型构建、文本识别模型构建和多文种混合文字识别。本发明通过文本图像采集得到原始图像数据;采用色彩归一化、随机视觉混淆、几何空间形变、多尺度图...
  • 本发明涉及工业设备控制技术领域,具体涉及一种非侵入式屏幕监测图文动态识别系统及方法,系统包括区域配置模块、视觉感知模块、智能决策模块、控制执行模块,基于该系统,识别方法包括:响应用户的配置操作,确定待检测的屏幕区域;通过运行于主机操作系统的...
  • 本申请公开了一种信息提取方法、装置及电子设备,属于人工智能技术领域。该信息提取方法包括:获取与第一图像的图像类别对应的配置文件,第一图像包括多个信息字段,配置文件包括任务提示词,任务提示词用于提示提取第一图像中所有信息字段的字段信息;根据信...
  • 本发明涉及信件信息识别技术领域,特别涉及一种基于OCR技术的信件信息识别方法及系统,系统包括图像采集模块、OCR引擎模块、数字校正模块、汉字校正模块、路由控制模块和结果输出模块。本方案中,通过构建智能路由与分路处理机制,有效提升了混合字符序...
  • 本发明涉及医疗信息处理领域,公开一种基于多尺度稳定扩散的医疗屏幕文本合成方法。首先构建并训练多尺度U‑Net架构的稳定扩散模型,用于医疗屏幕图像生成;然后设计并实现医学文本提示的语义嵌入机制,将特定医学指标与唯一标识符令牌相关联;最后采用自...
  • 本发明提供一种基于视觉语言模型和条件推理的情感分类方法,首先获取文本图片对并对文本图片对标注情感标签,形成情感标签集合;然后使用视觉语言模型作为策略模型,对所述文本图片对分别进行一般推理和条件推理,生成推理表征、情感预测标签及条件推理结果,...
  • 本发明公开了一种基于改进DBNet与SATRN的工件编码图像文本检测与识别方法,属于计算机视觉技术领域。该方法包括:采用改进的DBNet模型进行文本区域检测与定位,其中在特征融合模块引入高效上采样卷积模块EUCB,并将激活函数替换为参数化整...
  • 本发明提供一种基于卷积神经网络的玻璃瓶瓶底空心模具号识别方法,涉及工业产品质量检测领域,解决了现有技术难以在工业现场有效追溯并剔除故障模具产品的问题。方法首先采集训练用玻璃瓶瓶底图像,经预处理与数据优化增强后得到训练数据;选择基础模型并对其...
  • 一种基于孪生网络的验证码识别方法、系统、介质及设备,涉及计算机视觉技术领域,方法包括:获取验证码图像及对应的提示信息,生成或提取目标图像序列;从验证码图像中提取多个候选子图,形成候选子图序列及位置序列;使用预训练的孪生网络模型,计算目标图像...
  • 本申请提出一种基于图像识别的字符校验方法及相关装置,涉及计算机技术领域。所述方法包括:获取目标图像,并将所述目标图像输入至预先训练好的第一字符提取模型,获得第一字符提取结果;基于所述第一字符提取结果以及与所述目标图像匹配的校验任务对应的预设...
  • 本发明涉及多模态数据预测技术领域,公开了一种时尚偏好预测方法及装置,包括获取包括图像、文本与用户行为时序序列的多模态数据,进行特征提取,获取图像特征、文本特征与时序特征;基于城市嵌入表及其对应的区域文化标签编码,构建空间特征;将空间特征与时...
  • 本申请公开了一种多模态目标重识别方法和相关设备,方法包括:基于多模态统一文本生成策略,根据多模态图像生成全局文本特征;通过分割引导特征调制模块根据多模态图像生成多模态图像令牌;通过语义令牌重分配模块将多模态语义查询令牌与全局文本特征进行融合...
  • 本申请公开了一种视线估计方法及其相关设备,该方法包括:获取待处理图像数据;通过预设视线估计模型中的预设视线估计分支,对待处理图像数据进行视线方向的预测,得到目标视线方向;预设视线估计模型包括预设视线估计分支和模态对齐分支,模态对齐分支在训练...
  • 本发明提供了一种轻量化多模态融合的文档信息结构化提取方法及系统,涉及数据处理技术领域,方法包括:获取文档图像;对文档图像进行预处理,得到优化图像;通过MobileNetV3,提取优化图像的文本特征;对多种文本特征进行多尺度特征融合,得到融合...
  • 本申请提供了基于多模态大语言模型的遥感开放词汇目标检测方法,涉及遥感图像检测技术领域,该方法包括:获取用户选择的目标区域的遥感影像,进行遥感目标识别,获得目标词汇集和目标词汇匹配度集;配置环境遥感影像划分范围,划分获取目标区域所处环境内的环...
  • 本发明公开了一种多模态数据图纸逻辑关系解析方法、电子设备和介质,方法包括:基于图纸图像数据与文字数据,生成节点集合;基于节点集合之间的空间邻近关系、视觉特征相似性与语义相关性生成跨模态超边集合;基于节点集合与跨模态超边集合生成超图嵌入输入表...
  • 本发明涉及计算机视觉与图像识别技术领域,公开了一种双阶段双分支的手写中文公式混排图像识别方法,包括如下步骤:利用改进的YOLOv8s目标检测网络对输入图像中的所有字符进行精准检测与类型分类,获取字符的边界框与初始类别信息;根据字符类别将裁剪...
  • 本发明提供了信息处理装置、信息处理方法、计算机可读存储介质和计算机程序产品。获得数据中包括的多个字符串。从用户接收字符的输入。在显示单元上显示与输入的字符对应的一个或更多个字符串。通过使用从显示的一个或更多个字符串中选择的字符串来设置要与基...
  • 本发明提供一种基于深度学习的试卷内容模糊方法。所述基于深度学习的试卷内容模糊方法包括以下步骤:S1.收集考研试卷扫描件的图像数据并标注;S2.通过文本检测模型自动获取考研试卷扫描件图片中所有文本的坐标;S3.通过文字识别模型识别到考研试卷扫...
技术分类