Document
拖动滑块完成拼图
专利交易 商标交易 积分商城 国际服务 IP管家助手 科技果 科技人才 会员权益 需求市场 关于龙图腾 更多
 /  免费注册
到顶部 到底部
清空 搜索
最新专利技术
  • 本申请公开了一种图像处理方法及相关装置,所述方法包括:根据多个图像的图像差异和/或当前次图像分类任务的分类标签的数量确定每个图像的文本信息类别;提取所述每个图像的文本信息类别对应的文本信息;根据所述每个图像的文本信息确定所述每个图像的文本编...
  • 本发明属于计算机视觉领域,公开了一种基于注意力机制的上下文优化提示算法、系统、计算机设备及其应用,旨在通过提示微调提升视觉‑语言模型的性能与泛化能力。该方法首先获取待处理的文本提示和对应的图像数据,利用上下文优化机制生成多样化的提示词,并将...
  • 本申请公开了一种文档结构提取及模型训练方法、装置、设备及介质,涉及人工智能与计算机视觉技术领域。该方法包括:构建含至少两种文档理解任务(包括光学字符识别、布局分析、文本定位、区域文本提取、图像描述和图表标题生成)数据的专项训练数据集,及用于...
  • 本发明公开了一种基于多模态大模型的光学字符识别方法及系统,属于光学字符识别技术领域,采用强化学习对模型进行后训练,并针对SFT训练不足的情况进行补充训练;包括:建立表格知识数据库:搜集图片格式的表格数据,同时基于表格内容,构建相应的结构化数...
  • 本发明涉及一种面向电气柜压板实现细小倾斜文字标签高精度识别的方法,包括以下步骤:执行颜色归一化、亮度均衡化和畸变校正的操作;进行文字区域检测,自动定位细小文字标签区域;进行多尺度特征提取;自动区分正常文本与倾斜文本;进行旋转、仿射或透视变换...
  • 本发明公开了一种基于深度学习的多类型仪表图像分类与读数识别方法,该方法使用深度学习方法训练仪表图像分类与读数识别模型对多类型仪表图像进行分类与识别;该模型设计基于YOLOv11结合Swin Transformer的多尺度仪表检测网络、基于Y...
  • 本发明提供的基于几何推理引导的遥感道路图像分割方法、装置及设备,涉及遥感图像分割技术领域。本发明通过获取遥感道路图像, 将所述遥感道路图像输入编码器进行空间特征提取与调制,得到特征调制后的多尺度特征;对特征调制后的多尺度特征进行道路几何形状...
  • 本发明公开一种基于语义‑视觉双记忆融合的SAM2小样本分割方法,通过构建语义查询记忆、视觉查询记忆及查询相关支持视觉记忆,经查询相关支持视觉记忆引导的记忆细化模块融合语义查询记忆和视觉查询记忆,结合SAM2密集匹配与解码模块端到端训练。解决...
  • 本发明涉及智慧城市领域,尤其涉及一种基于大模型的城市景观语义分割方法及系统,获取目标地理区域的街景图像数据;将街景图像数据输入预设的图像语义分割模型中,通过图像语义分割模型对街景图像数据进行解析,识别出每张图像中包含的多种预定义的环境要素类...
  • 本发明公开了一种半监督颅内出血图像分割方法、装置、设备及介质,涉及医学图像处理技术领域,本发明首先通过注意力图显式引导模型关注边界变化剧烈的体素区域,实现了特征在边界区域的二次聚焦,抵消了分割结果在细小血管和不规则出血轮廓处的边界模糊、细节...
  • 本发明公开了一种基于多模态大模型的提示词自动生成模型训练方法及系统。主要过程是:通过提示词自动生成模型生成待评估提示词,并将其分别输入至第一和第二多模态模型,以获取包含答案和分析过程的输出结果;基于所述输出结果和预设的标注数据计算复合损失值...
  • 本发明涉及数字营销领域,公开了一种面向视频理解的层次化时空语义抽取方法,该方法通过三级渐进式分析框架解析视频内容:首先在关键帧序列中检测物体实例并构建时空轨迹,确保物体身份连续性;继而利用递归神经网络建模物体状态演化规律,量化物体间交互关系...
  • 本发明涉及一种用于借助系统为至少一个图像(1)自动生成标注指示(11)的方法,该系统具有指令模型和标注模型(11、13)。在步骤a)中,将图像(1)连同手动标注(5)提供给指令模型(9)。在步骤b)中,为多个图像(1)生成指令模型(9)和标...
  • 本申请涉及图像处理技术领域,尤其涉及一种基于大模型的目标物体轮廓标注方法及显示设备。由于在本申请实施例中,获取待处理图像,确定待处理图像中的目标物体,再基于大模型确定待处理图像中目标物体的轮廓,并根据保存的标注点的稀疏程度标注出目标物体的轮...
  • 本发明属于图像处理技术领域,具体涉及基于显微图像的预浸料树脂浸润均匀性分析方法及系统,其方法包括:对预浸料显微横截面图像进行分割,识别增强纤维单丝;基于增强纤维单丝的质心进行Voronoi剖分,生成纤维辖域多边形;根据增强纤维单丝及纤维辖域...
  • 本发明涉及图像处理技术领域,具体涉及一种基于多特征数据融合的宠物体表寄生虫种类识别方法,首先通过协同触发机制同步采集宠物体表区域的静态图像与短时视频流,随后,并行执行三个特征提取通道:基于深度学习的静态形态特征提取通道、基于运动轨迹分析的动...
  • 本发明公开一种基于显微高光谱成像与多特征融合的油茶果成熟机理解析方法,包括:采集油茶果样本;制作果壳切片,采集显微高光谱图像;选取细胞壁、细胞内部作为ROI;提取细胞壁光谱特征波长、细胞内部光谱特征波长和纹理特征;分别构建基于细胞壁光谱特征...
  • 提供一种能够简便地进行通过体外受精得到的胚胎的评价的数据处理装置、数据处理方法以及程序。数据处理装置具备:获取部,所述获取部获取通过体外受精得到的胚胎的显微镜图像数据、和请求语句数据,所述请求语句数据表示在所述显微镜图像数据中映现的胚胎的评...
  • 本申请涉及一种三维多边形几何体模型切片信息确定方法及相关装置。所述方法包括:从多边形几何体彩色图像中提取出包含多边形几何体的感兴趣区域图像,基于感兴趣区域图像,创建网格坐标系,基于感兴趣区域图像和网格坐标系,构建三维多边形几何体模型的表面三...
  • 本发明涉及人工智能与智能识别技术领域,具体为一种智能工作牌的多模态识别系统,该系统旨在解决现有技术中因多模态信息处理割裂与串行补偿导致的识别精度低和环境适应性差的问题。系统包括多模态感知子系统、跨模态预处理与同步单元、协同推理引擎及系统控制...
技术分类