Document
拖动滑块完成拼图
专利交易 商标交易 积分商城 国际服务 IP管家助手 科技果 科技人才 会员权益 需求市场 关于龙图腾 更多
 /  免费注册
到顶部 到底部
清空 搜索
最新专利技术
  • 本发明属于文档智能处理技术领域,特别是涉及一种基于多模态模型的文档质检方法及系统,能够解决现有文档质检中漏检误检偏高、可解释性弱、适配性不足的问题,该方法包括以下步骤:将输入的目标文档进行分页处理以得到分页图像;对所述分页图像进行文本区域检...
  • 本发明公开一种基于AI大模型技术的文档要素抽取方法,包括如下步骤:接收用户输入的各类单据;通过视觉语言模型或文本解析技术对文档进行解析与版面分析,生成统一中间表示;采用动态分级模块从格式、结构、变异度三个维度评估文档复杂度,将其分为简单规整...
  • 本发明公开了一种处理PDF中跨页表格的内容提取方法及系统,涉及PDF文件处理技术领域,将PDF文档中的每一页转换为图像,提取图像的正文区域;检测正文区域中不同页面的表格区域,记录其位置信息与边界框;检测跨页表格关键词,并识别相邻页中是否具备...
  • 本发明公开了一种表格提取方法、装置、设备、介质及产品。该方法包括:获取待处理文档中的表格对应的图像、第一提示文本和第二提示文本;将待处理文档中的表格对应的图像和第一提示文本输入第一多模态大模型,得到待处理文档中的表格的逗号分隔值csv文本;...
  • 本说明书实施例提供一种文本生成模型训练方法、装置、设备、介质和产品,该方案可以包括,获取包含题目的图像以及该图像的HTML文档,从该HTML文档中识别出针对题目中的选择题的作答区域、填空题的作答区域、插图、化学结构、虚线框以及针对汉字标注的...
  • 本申请涉及一种物料盘信息录入方法、系统、设备及存储介质,涉及物料盘领域。物料盘包括刻有物料盘信息的信息区域和用于承装芯片的槽位区域,其中方法包括:采集堆叠的若干物料盘在俯视状态下的物料盘图像;分割物料盘图像得到与信息区域对应的信息图像;分割...
  • 本发明公开一种文档识别方法、装置、电子设备和存储介质,涉及计算机技术领域。方法包括:获取待处理的目标扫描件,并加载与目标扫描件相关的多维度先验知识;对目标扫描件进行版面区域划分与识别,得到多个版面元素区域位置和类型;基于多维度先验知识,确定...
  • 本发明公开了面向电子工业的SOP智能解析与分析方法及系统,方法包括获取SOP原始文档并提取文本、图像、表格信息划分目标模块;通过专业预训练语言模型提取文本语义特征,结合图像、表格特征生成对应向量;经多模态特征融合编码器对齐维度并分配权重得到...
  • 本公开提供了一种电子证件真伪识别方法、装置、设备、介质及程序产品,涉及图像处理技术领域。该方法包括:获取待检测图像,对待检测图像进行有效性检测;若待检测图像为有效证件,则对待检测图像进行频域特征提取,得到待检测图像的频域特征向量;对待检测图...
  • 本发明涉及文字识别技术领域,具体涉及一种应用于企业影像资料的文字识别方法及系统。本发明根据关键信息匹配区域内的文字信息特征,获得对应区域的关键信息程度;根据企业资料影像的关键信息匹配区域和每个标准影像的关键信息区域的位置分布,以及关键信息匹...
  • 本发明公开了一种变电站继电保护施工图纸审核方法及系统,将继电保护施工图纸输入基于自注意力机制的深度学习模型,输出审查业务类型,对继电保护施工图纸进行连通区域分析,得到中小目标区域,并基于审查业务类型对每一中小目标区域中的图元进行识别,得到图...
  • 本发明涉及地质图智能理解技术领域,具体公开了一种基于多模态大模型的图片格式地质图增强理解方法,包括以下步骤:地学知识图谱构建:对地质语料进行抽取,利用大语言模型识别,最终形成地质知识图谱,基于地学知识图谱构建知识图谱索引与社区;地质图元数据...
  • 本发明公开了基于自然语言描述的跨模态厂站主接线蓝图图元特征提取与表征设计方法、系统、设备及介质,属于电气工程数字化与电力系统自动化技术领域,包括:分别提取蓝图图像的多尺度视觉特征和文本提示的语义特征;通过特征增强层实现跨模态特征交互融合,并...
  • 本发明涉及电力领域,公开了变电站控制设备端子排图纸识别方法、装置及设备,该方法用于将端子排图纸转换为标准化中间体文件。该方法包括:获取端子排图纸电子图像,解析识别出连接点的空间坐标、连接线的空间坐标、线型、线宽、短接符号的空间坐标;识别提取...
  • 本发明涉及姿态估计技术领域,尤其是一种面向人体姿态估计的多层级关键点可见性分类算法,包括以下步骤:步骤1:准备人体姿态估计图像数据集,包含多个人物或单个人物,每个人物都具有相应的关键点标注;步骤2:采用RTMpose模型作为姿态估计的基础模...
  • 本公开关于数据处理与模型训练方法、装置、电子设备及介质,涉及互联网应用技术领域,数据处理方法包括:将第一视频样本输入至目标大模型,得到第一视频样本对应的多粒度特征数据;将第一视频样本对应的多粒度特征数据输入至目标大模型,得到第一视频样本对应...
  • 本申请涉及图像分析领域,具体公开了一种蚯蚓稳态体尺参数量化方法,提出了基于计算机视觉与深度学习融合的动态体尺参数量化体系。首先,通过高帧率连续图像采集系统获取蚯蚓运动状态下的时序图像序列;其次,运用深度神经网络实现形态学特征的智能识别与跟踪...
  • 本发明公开一种基于变倍球机动态适应距离的水鸟种类识别方法及系统,涉及水鸟监测技术领域。方法包括根据水鸟监测场景需求与目标水鸟体型特征,配置变倍球机硬件及监测控制参数,计算有效监测范围并划分监测层;动态调整球机云台水平旋转角度、垂直俯仰角度及...
  • 本发明公开了一种配电房智能鼠窜AI识别系统,涉及配电房管理技术领域,其包括控制模块和连接于控制模块的红外感应模块、视觉模块和报警模块,所述红外感应模块包括若干个红外传感器,所述视觉模块包括若干个摄像头,所述控制模块无线连接有远程管理平台,所...
  • 本发明涉及视频行人重识别技术领域,尤其是指一种基于时空仿射子空间的视频行人重识别方法,通过视觉Transformer提取视频帧的深层特征,并引入自适应时空信息耦合模块,利用三维卷积在局部区域协同融合时空特征,增强模型对视频整体上下文的理解;...
技术分类