Document
拖动滑块完成拼图
专利交易 积分商城 国际服务 IP管家助手 科技果 科技人才 商标交易 会员权益 需求市场 关于龙图腾 更多
 /  免费注册
到顶部 到底部
清空 搜索
最新专利技术
  • 本发明公开了一种工业复杂背景下抗干扰、多功能及轻量化OCR文本识别方法、系统及存储介质。方法包括:采用CUDA加速的CLAHE算法对输入图像进行预处理,以增强文本特征并抑制噪声;通过轻量化的CNN骨干网络提取多尺度特征图;将多尺度特征图输入...
  • 本申请公开了一种基于图像的抽样铭牌识别方法及相关装置,该方法包括:获取目标抽样单对应的抽样任务编码和目标设备铭牌;确定抽样任务编码对应的物资品类码和合同设备信息;基于物资品类码采集目标设备铭牌的图像,得到初始铭牌图像;对初始铭牌图像进行预处...
  • 本申请公开了一种基于融合动态扩散模型的跨模态多图协同生成方法、装置、设备及存储介质,包括:获取社交媒体平台的待发布文字描述、场景信息以及用户提示词;构建融合动态扩散模型;将待发布文字描述、场景信息以及用户提示词输入至融合动态扩散模型中,进行...
  • 本申请公开了一种关键信息提取方法、装置、设备、介质及产品,方法包括:接收待测试文档图像和待测试文档图像的问题文本序列;获取目标关键信息提取模型;将待测试文档图像和待测试文档图像的问题文本序列输入目标关键信息提取模型,生成待测试文档图像的答案...
  • 本发明涉及计算机视觉、图像识别与智能药品管理技术领域,尤其涉及一种基于多摄像头和YOLOv8的药瓶标签内容识别方法。至少包括如下步骤:S1,药瓶标签生成系统部署、标签生成;S2,多摄像头图像采集与预处理;S3,棋盘标定与空间定位;S4,药瓶...
  • 本发明涉及图像识别处理技术领域,公开了基于图像识别处理的直注英语翻读卡分类方法,包括:获取破损英语翻读卡图像和用户历史学习记录,识别破损区域并提取个体遗忘模式特征;基于改进的艾宾浩斯遗忘曲线拟合算法计算记忆衰减程度和可信度系数;利用记忆引导...
  • 本发明涉及计算机视觉与人工智能领域,具体涉及一种基于多分支深度卷积与层级语义建模的多模态融合文档图像分类方法。该方法通过双流架构协同处理文档的视觉与文本信息:视觉流采用轻量级卷积操作与多尺度特征融合机制高效提取文档图像的视觉语义特征;文本流...
  • 本公开提出了一种字符练习方法、装置、电子设备、存储介质及产品。所述的方法包括:实时拍摄获取用户练习本图像;识别练习本图像中的方格并确定待练习区域;将待练习区域与字符动作模型中的标准方格进行适配,以确定虚拟动作模型在待练习区域中的显示位置,字...
  • 本申请涉及一种基于脑机接口的连续书写轨迹生成方法、系统、设备及介质。所述方法包括:通过脑电采集设备获取用户想象书写时的脑电信号及真实书写轨迹;利用带通滤波器提取与手部书写运动相关的神经活动数据;基于预设时空深度学习网络提取书写意图时空特征;...
  • 本发明公开了一种图文设计页面识别整理方法,具体涉及图文设计页面数字化处理领域,包括以下步骤:S1、获取图文设计页面的多源输入数据,包括静态图像、设计工程文件及关联的A/B测试数据集;S2、通过多模态深度学习模型解析输入数据,同步提取视觉特征...
  • 本发明公开一种基于SAM模型与K‑D树掩码融合的简牍文本检测方法,包括以下步骤:获取简牍图像,进行预处理和简牍图像文本区域的图像增强;基于SAM模型对文本区域的掩码进行自动分割;对文本区域的掩码进行筛选,通过重叠抑制机制抑制文本区域重叠;基...
  • 本申请属于多模态学习领域,公开了一种基于多层次相似度推理的多模态虚假信息检测方法,包括:步骤1、获取多模态虚假信息数据集,获得文本局部特征和视觉局部特征;步骤2、利用文本局部特征和视觉局部特征进行自注意力机制,获得文本全局特征和视觉全局特征...
  • 本发明涉及信息处理与知识图谱构建技术领域,尤其涉及一种古籍中数学的语义增强识别系统,包括:扫描识别模块,联网搜索模块、文本生成模块和文本标注模块;文本生成模块在转录文本中标注全部数学用语的所在位置,并根据各数学实体的所在段落是否存在数学关系...
  • 本申请涉及一种文档识别方法及装置,所述方法包括:解析待识别的目标文档页面,获取所述目标文档页面内的多个目标文本对象;确定每个所述目标文本对象在预设的标准页面坐标系下的旋转角度;根据多个所述目标文本对象的旋转角度,确定所述目标文档页面在所述标...
  • 本发明属于古籍数字化与人工智能交叉技术领域,公开了一种基于元学习的复杂古籍文档结构化识别方法,本发明通过引入基于元学习的少样本快速适应机制,显著降低了古籍版面识别对大规模标注数据的依赖,解决了传统方法难以处理竖排文本、图文混排及藏汉双语混排...
  • 本申请提供了一种票据信息识别方法及系统,属于图像处理技术领域,该方法包括:识别第一图像,得到识别结果,识别结果中包括目标票据类型以及第一图像中是否存在遮挡区域;基于目标票据类型和预存的目标模版确定目标票据的待识别区域;响应于第一图像中存在遮...
  • 本申请提供了一种表格识别方法、装置、计算机设备及存储介质,属于图片处理领域。本申请实施例提供的技术方案,基于不同表格图片的特性,通过不同表格结构预测模型来得到预测的表格结构,并且还结合了文本识别技术得到的文字识别结果,综合了多种表格识别方式...
  • 一种多模态医疗票据信息端到端抽取系统及方法,其中系统包括:输入模块、OCR模块、多模态特征提取模块、多模态特征融合模块和息解码与结构化输出模块;方法包括:一、图像输入;二、图像预处理;三、多模态特征提取;四、多模态融合;五、信息解码与结构化...
  • 本发明涉及图像处理技术领域,可应用于金融科技、医疗健康等业务系统平台中,公开了一种发票信息录入方法、装置、设备及介质,包括:对目标发票的发票图像进行去噪增强处理,得到增强发票图像,增强发票图像进行倾斜矫正,对矫正后的发票图像进行图像格式转换...
  • 本发明公开了一种证件图像识别模型的训练方法、电子设备和介质,涉及证件图像识别技术领域,方法包括:利用闭源大模型对多个证件图像进行识别,得到各个证件图像所对应的识别结果,每个证件图像的识别结果都包括多个关键信息;利用所述识别结果对相应的证件图...
技术分类