Document
拖动滑块完成拼图
专利交易 积分商城 国际服务 IP管家助手 科技果 科技人才 商标交易 会员权益 需求市场 关于龙图腾 更多
 /  免费注册
到顶部 到底部
清空 搜索
最新专利技术
  • 本发明涉及文档处理技术领域,公开了一种文档目录识别方法、系统、电子设备及存储介质,包括获取待处理的文档按页码顺序逐页转换为图像集合;对每页图像并行执行多模型分析,输出语义块集合;进行融合处理,生成语义块全集,从语义块全集中提取目录相关语义块...
  • 本发明提供了一种手写数学表达式的识别方法、系统、设备及介质,该方法包括:将获取的手写数学表达式图像输入编码器进行预处理后输出灰度图像,通过在主干网络自定义的卷积层和学习偏移量的过程中引入空洞率对灰度图像进行处理输出多尺度特征图;根据三支注意...
  • 本发明公开一种融合知识图谱与多目标优化的书法练习推荐方法及系统,方法包括:将用户手写汉字图像分割为笔画和部首,与知识图谱节点对应,并生成手写部件数据集;构建汉字知识图谱,定义其结构关系;通过计算笔迹与标准范本的特征相似度,量化评估用户对各笔...
  • 本说明书实施例提供文档审核方法以及文档审核模型训练方法,其中文档审核方法包括:响应于针对目标文档的文档审核请求,获取目标文档的审核辅助信息,其中,目标文档包括至少一个待审核内容,审核辅助信息用于提供待审核内容的审核依据;将目标文档和审核辅助...
  • 本发明涉及档案信息管理技术领域,提供了基于图像识别与智能计数的档案自动识别分类盘点系统,包括:采集整合各模态数据,多角度自动拍摄与曝光序列采集,利用标定数据自动校正,同时融合图像与标识信息,输出带尺度标注的采集数据;采用实例分割方法区分重叠...
  • 本发明提出了一种免训练式图像和谐化补全方法,涉及计算机视觉技术领域,获取带掩码的输入图像、对应的补全掩码和文本提示词;将输入图像、补全掩码和文本提示词输入到预训练的稳定扩散模型中;基于补全掩码将自注意力图划分为掩码区域内交互、未掩码区域内交...
  • 本发明涉及光学字符识别技术领域,具体涉及一种基于检测和字符切分的大模型答题卡OCR识别方法及系统。方法包括:获取答题卡图像并构建微调数据集;基于该数据集微调多模态大模型;将微调后的模型部署至边端设备;执行轻量化文本检测获取每行文本框区域;对...
  • 本发明属于文档处理技术领域,并公开了一种基于GNN和OCR系统的表格识别方法及系统,包括:获取待识别表格图像;提取所述待识别表格图像的图像视觉特征和文本语义特征,将提取的图像视觉特征和文本语义特征进行融合,得到融合特征图;将融合特征图输入基...
  • 本发明涉及票据文本识别技术领域,公开了基于深度学习的票据文本识别系统及方法。该方法包括获取含多通道像素矩阵及空间分辨率信息的目标票据原始图像数据;基于票据边缘特征与预设模板的匹配结果,对原始图像执行几何畸变校正,生成校正后票据图像;将校正图...
  • 一种高精度实时盲汉翻译方法,包括如下步骤:使用配置有特定侧向平行光源的摄像头采集盲文图像,并对盲文图像进行预处理,获取得到第一图像;将第一图像输入到模型,获取所有检测到的盲文凸点的边界框信息,并提取盲文坐标及尺寸;利用所有检测到的盲点坐标,...
  • 本发明提供了一种基于聚类与概率算法相结合的手键拍报识别方法,包括以下步骤:步骤1,采集手键输入;步骤2,聚类分析;步骤3,单集合影响因子排除;步骤4,交叉集合影响因子排除;步骤5,根据概率权重表估算标准长度;步骤6,根据标准长度及概率权重表...
  • 本发明涉及古乐谱智能处理技术领域,公开了一种古乐谱智能识别及可视化演奏系统,其包括图像预处理、笔画增强、符号分割、符号识别、语义解析、可视化和声学合成等模块。本申请能够通过专门设计的图像处理与符号解析方法,精准修复古乐谱老化问题,分离粘连符...
  • 本申请实施例提供一种识别方法和装置,涉及终端技术领域。该方法包括:响应于启动相机应用的操作,显示第一界面,并在第一时长内通过摄像头获取图像数据,通过麦克风获取第一音频数据,以及从图像数据中重建出光谱数据;将由图像特征、音频特征以及光谱特征构...
  • 本发明公开了一种基于时空关系的人体图图像聚档方法,具体包括:获取n张待聚档的原始摄像头图像,对所述图像进行人体图像提取和图像数据预处理,得到处理后的人体特征向量;利用所述人体特征向量计算相似度,结合人体特征属性和人体图片时空信息得到多组先决...
  • 本发明公开了一种基于轻量化网络的安全帽佩戴自动检测方法和系统,包括以下步骤:S1:建立并扩充安全帽佩戴规范数据集;S2:建立基于YOLOv8的目标检测模型;S3:对模型进行优化;S4:通过扩充后的安全帽佩戴规范数据集对改进的模型进行训练。提...
  • 本发明公开了一种基于机器视觉的X射线机宠物类型识别方法,涉及机器视觉和深度学习技术领域,本发明通过机器视觉技术重构了X射线宠物识别的技术路径,基于高斯核平滑的肋骨倾角分布曲线与颅骨极坐标采样,将离散解剖标记转化为连续函数描述;该机制捕获了品...
  • 本发明公开了一种基于多尺度双分支联合训练网络的鱼群计数方法,属于计算机视觉技术领域。通过密度图估计分支和多尺度感受野融合模块(MRFSE)增强特征提取能力,结合改进的SAM‑DETR++检测框架提升目标定位精度,有效解决鱼体尺度变化大、遮挡...
  • 本发明属于鱼类行为学分析和水产养殖智能化技术领域,涉及一种基于行为学和人工智能融合的鱼类分级筛选方法,包括以下步骤:拍摄获取鱼类运动轨迹图像,分别提取1分钟时间段内鱼类的128个行为特征,生成每尾鱼在不同时间的行为学特征;建立数据矩阵Lm+...
  • 一种面向外景综艺的跨视角融合多人检测与跟踪方法,涉及图像处理、目标追踪技术领域,先把多视角画面在统一世界坐标下重建为三维/BEV空间先验,再用空间增强注意把这一先验反哺到各机位特征,获得一致、稳健的多人检测结果;随后以跟踪式注意对人物三维位...
  • 本发明公开一种基于黎曼流形二阶关系建模的视频行人重识别方法及系统,涉及视频行人重识别技术领域。针对现有方法依赖一阶特征、难以捕捉高阶时空关联的问题,本方法通过预处理视频数据、生成块特征表示并编码为帧级特征,拼接块特征计算通道间协方差矩阵并优...
技术分类