Document
拖动滑块完成拼图
专利交易 商标交易 积分商城 国际服务 IP管家助手 科技果 科技人才 会员权益 需求市场 关于龙图腾 更多
 /  免费注册
到顶部 到底部
清空 搜索
最新专利技术
  • 本发明涉及医疗信息处理领域,公开一种基于多尺度稳定扩散的医疗屏幕文本合成方法。首先构建并训练多尺度U‑Net架构的稳定扩散模型,用于医疗屏幕图像生成;然后设计并实现医学文本提示的语义嵌入机制,将特定医学指标与唯一标识符令牌相关联;最后采用自...
  • 本发明提供一种基于视觉语言模型和条件推理的情感分类方法,首先获取文本图片对并对文本图片对标注情感标签,形成情感标签集合;然后使用视觉语言模型作为策略模型,对所述文本图片对分别进行一般推理和条件推理,生成推理表征、情感预测标签及条件推理结果,...
  • 本发明公开了一种基于改进DBNet与SATRN的工件编码图像文本检测与识别方法,属于计算机视觉技术领域。该方法包括:采用改进的DBNet模型进行文本区域检测与定位,其中在特征融合模块引入高效上采样卷积模块EUCB,并将激活函数替换为参数化整...
  • 本发明提供一种基于卷积神经网络的玻璃瓶瓶底空心模具号识别方法,涉及工业产品质量检测领域,解决了现有技术难以在工业现场有效追溯并剔除故障模具产品的问题。方法首先采集训练用玻璃瓶瓶底图像,经预处理与数据优化增强后得到训练数据;选择基础模型并对其...
  • 一种基于孪生网络的验证码识别方法、系统、介质及设备,涉及计算机视觉技术领域,方法包括:获取验证码图像及对应的提示信息,生成或提取目标图像序列;从验证码图像中提取多个候选子图,形成候选子图序列及位置序列;使用预训练的孪生网络模型,计算目标图像...
  • 本申请提出一种基于图像识别的字符校验方法及相关装置,涉及计算机技术领域。所述方法包括:获取目标图像,并将所述目标图像输入至预先训练好的第一字符提取模型,获得第一字符提取结果;基于所述第一字符提取结果以及与所述目标图像匹配的校验任务对应的预设...
  • 本发明涉及多模态数据预测技术领域,公开了一种时尚偏好预测方法及装置,包括获取包括图像、文本与用户行为时序序列的多模态数据,进行特征提取,获取图像特征、文本特征与时序特征;基于城市嵌入表及其对应的区域文化标签编码,构建空间特征;将空间特征与时...
  • 本申请公开了一种多模态目标重识别方法和相关设备,方法包括:基于多模态统一文本生成策略,根据多模态图像生成全局文本特征;通过分割引导特征调制模块根据多模态图像生成多模态图像令牌;通过语义令牌重分配模块将多模态语义查询令牌与全局文本特征进行融合...
  • 本申请公开了一种视线估计方法及其相关设备,该方法包括:获取待处理图像数据;通过预设视线估计模型中的预设视线估计分支,对待处理图像数据进行视线方向的预测,得到目标视线方向;预设视线估计模型包括预设视线估计分支和模态对齐分支,模态对齐分支在训练...
  • 本发明提供了一种轻量化多模态融合的文档信息结构化提取方法及系统,涉及数据处理技术领域,方法包括:获取文档图像;对文档图像进行预处理,得到优化图像;通过MobileNetV3,提取优化图像的文本特征;对多种文本特征进行多尺度特征融合,得到融合...
  • 本申请提供了基于多模态大语言模型的遥感开放词汇目标检测方法,涉及遥感图像检测技术领域,该方法包括:获取用户选择的目标区域的遥感影像,进行遥感目标识别,获得目标词汇集和目标词汇匹配度集;配置环境遥感影像划分范围,划分获取目标区域所处环境内的环...
  • 本发明公开了一种多模态数据图纸逻辑关系解析方法、电子设备和介质,方法包括:基于图纸图像数据与文字数据,生成节点集合;基于节点集合之间的空间邻近关系、视觉特征相似性与语义相关性生成跨模态超边集合;基于节点集合与跨模态超边集合生成超图嵌入输入表...
  • 本发明涉及计算机视觉与图像识别技术领域,公开了一种双阶段双分支的手写中文公式混排图像识别方法,包括如下步骤:利用改进的YOLOv8s目标检测网络对输入图像中的所有字符进行精准检测与类型分类,获取字符的边界框与初始类别信息;根据字符类别将裁剪...
  • 本发明提供了信息处理装置、信息处理方法、计算机可读存储介质和计算机程序产品。获得数据中包括的多个字符串。从用户接收字符的输入。在显示单元上显示与输入的字符对应的一个或更多个字符串。通过使用从显示的一个或更多个字符串中选择的字符串来设置要与基...
  • 本发明提供一种基于深度学习的试卷内容模糊方法。所述基于深度学习的试卷内容模糊方法包括以下步骤:S1.收集考研试卷扫描件的图像数据并标注;S2.通过文本检测模型自动获取考研试卷扫描件图片中所有文本的坐标;S3.通过文字识别模型识别到考研试卷扫...
  • 本发明公开了一种二阶段变电站指针型表计无标定识别方法与系统,具体包括:采集并制作表计区域检测数据,进行膨胀‑裁剪构建刻度及指针关键点检测数据集;利用两种数据集训练表计区域目标检测模型、关键点检测模型;将待测表计图像送入检测模型,获得表计的数...
  • 本公开实施例公开了一种元素定位方法、装置、设备及介质,所述方法包括:响应于用户在当前应用界面的选择操作,从所述当前应用界面的布局文件中确定目标元素,并获取所述目标元素的元素属性和所述目标元素在所述当前应用界面中的第一截图图片;在检测到所述当...
  • 本说明书实施例提供视觉任务处理方法、图像处理方法、任务处理模型训练方法、基于任务处理模型的信息处理方法及任务平台,其中所述视觉任务处理方法包括:获取目标视觉任务的任务图像和任务描述信息;将任务图像和任务描述信息输入任务处理模型,获得多模态特...
  • 光柱数字显示仪读数校验方法、系统、设备及存储介质,方法包括:先获取仪表区域的初始图像,并对初始图像进行预处理;然后对预处理后的初始图像进行图像分割,以生成数字显示区域和光柱显示区域;对数字显示区域进行识别以获取第一目标参数,和/或,对光柱显...
  • 本发明属于食品检测领域,主要涉及一种烘焙食品生产的质量检测系统,该系统通过订单解析模块将客户提交的文字、图片等自由格式需求转化为结构化的生产指令;通过可旋转摄像头采集蛋糕图像,运用深度学习模型进行图像对齐,并综合运用边缘检测、特征点提取与O...
技术分类