Document
拖动滑块完成拼图
首页 专利交易 IP管家助手 科技果 科技人才 积分商城 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
最新专利技术
  • 本申请涉及一种文本比对方法及装置,所述方法包括:获取第一文本图像,并提取所述第一文本图像的第一文本风格特征矩阵以及第一文本内容特征矩阵;获取第二文本图像,并提取所述第二文本图像的第二文本风格特征矩阵以及第二文本内容特征矩阵;根据所述第一文本...
  • 本发明实施例公开了一种单目深度估计方法、装置、电子设备及存储介质,涉及多模态计算机视觉与自然语言处理技术领域,其中,所述方法包括:利用视觉编码器提取多尺度视觉特征,结合图像与文本描述生成场景语义描述;通过大语言模型提取场景语义描述中的语义类...
  • 本发明公开了一种基于三重感知学习增强视觉语言模型的零样本异常检测方法及系统,涉及计算机视觉领域,方法包括:从输入图像提取全局与局部视觉特征;视觉编码过程通过空间感知注意力增强模块校正深层网络中局部特征,针对异常视觉特征生成细粒度属性文本描述...
  • 本发明公开了大数据处理用文字识别分析系统,包括预处理模块、双层识别处理模块、文档修正模块和上链存证模块;本发明涉及大数据处理技术领域。该大数据处理用文字识别分析系统,通过文档类型与算法映射,结合峰值信噪比和噪声方差触发降噪,以针对性的预处理...
  • 本发明涉及图像识别领域,公开了一种图像识别方法及识别系统,通过光学‑拓扑融合处理和动态资源分配机制,系统性解决了传统文档识别的核心痛点。所述图像识别方法由获取、网格、相位、设置及分配五大模块构成,基于文档RGB数据,计算像素亮度并编码,生成...
  • 本发明公开了一种车牌字符分割与比对识别方法,涉及车牌字符分割与比对识别技术领域,包括:基于车牌图像四角坐标进行透视变换,得到车牌展平图像;在展平图像上按行读取灰度百分位位置,计算亮侧半宽与暗侧半宽,并结合梯度方向标记确定无偏边界与字符分割缝...
  • 本发明涉及图像处理与模式识别技术领域,本发明提供了一种基于物理干扰逆向建模的OCR识别的方法、装置及设备,所述方法包括:在模型训练阶段,将原始清晰图像通过墨水晕染建模机制及纸张折痕建模机制生成第一干扰图像,将原始清晰图像和第一干扰图像作为训...
  • 本发明涉及OCR识别技术领域,尤其涉及一种基于推理大模型的光学字符识别优化方法;通过在推理大模型中引入不确定性奖励机制,有效解决了小目标文本因特征表达不足而导致的识别精度低下这一核心技术难题,该机制通过动态评估模型输出与真值标签在空间位置(...
  • 本申请实施例公开了一种票据关键字段识别方法及装置,方法包括:获取票据图像;定义所述关键字段,关键字段包括发票号、金额和日期中的至少一种;对所述票据图像进行分数阶微分计算,生成增强图像和分数阶微分特征,所述分数阶微分特征包括分数阶梯度场和多尺...
  • 本申请公开了一种内容处理方法、装置、电子设备和计算机可读存储介质,本申请实施例通过获取待识别的目标内容中的文本和至少一张图像;对各图像分别进行局部特征提取,得到至少一个局部图像的局部图像特征;对上述文本进行实体词特征提取,得到至少一个实体词...
  • 本申请公开了一种面额识别方法、装置、电子设备、存储介质和程序产品,属于纸币面额识别领域。所述面额识别方法,包括:获取待识别纸币对应的ROI图像;ROI图像包括待识别纸币中面额数值所在的区域;对ROI图像进行比特平面分层处理,获取ROI图像对...
  • 本发明公开了手持式档案图像采集与实时增强系统,属于档案数字化和图像处理技术领域,该系统包括图像采集模块、轻量级增强引擎、文档特征分析模块、局部自适应增强单元、元数据识别引擎和实时输出接口,通过嵌入式轻量级神经网络实现手持设备上的实时图像预处...
  • 本发明属于文本定位领域,尤其涉及基于点阵坐标标定的动态定位方法及系统,获取目标页面的点阵空间;扫描目标页面,提取其点阵特征空间,包括点阵间隔、排列规则、预置点相对坐标关系及点阵本征熵;融合点阵本征熵、排列规则与目标点阵空间,确定目标文本信息...
  • 本发明涉及内容提取技术领域,具体为多模态混合文档OCR识别与结构化提取方法,包括以下步骤,获取图像文字区域边界框并分类样式,提取字形或笔画序列生成字符定位结构,划分段落句群归类语义字段,计算字段匹配关系生成结构映射,依据模板插入字段并建立映...
  • 本申请公开了一种非侵入式污损机读答题卡的虚拟修复方法、装置及系统,方法包括:处理设备获取机读答题卡的原始扫描图像;对原始扫描图像进行答题识别,确定识别失败的目标机读答题卡,将其目标原始扫描图像发送至终端设备;接收终端设备返回的携带有污损标注...
  • 本发明属于文物艺术品数据资产登记领域,主要涉及一种基于AI D鉴证技术的文物艺术品数据资产登记方法,包括安装集成多模态成像头采集图像信息并进行预处理;根据预处理后的图像构建多维图像数据立方;调用图像的特征提取算法,提取多波段特征向量;将多维...
  • 本申请提供了一种基于细分数据库及人类反馈的遥感大语言模型精度提升方法、装置及电子设备,涉及遥感图像大语言模型技术领域。该方法构建初始遥感大语言模型,并在初始遥感大语言模型中增加预处理层、审核层、反馈优化层,具体在预处理层对多源遥感图像数据与...
  • 本发明公开了一种基于多帧时空关联的环视鱼眼图像鸟瞰图分割方法,包括:获取环视RGB图像;利用特征提取网络提取图像特征,构建图像特征集;采用时空同步编码器将多时刻图像特征聚合至统一的鸟瞰图空间中,生成当前时刻的BEV特征;通过与地面真值的区域...
  • 本公开提供了训练状态识别模型、识别营业状态的方法、相关装置及程序产品,涉及大语言模型、深度学习和计算机视觉等人工智能技术领域。训练状态识别模型包括:获取样本店铺图像和用于指示店铺营业状态的样本店铺状态标签和用于指示样本关联对象的对象状态的样...
  • 本发明涉及图像处理技术领域,具体涉及一种图像标注方法,包括以下步骤:通过采集图像建立待标注图像数据集;通过采集专业知识构建向量化知识库;利用预训练视觉语言模型对待标注图像数据集的图像进行处理生成图像描述文本;对图像描述文本进行摘要提取得到摘...
技术分类