Document
拖动滑块完成拼图
首页 专利交易 IP管家助手 科技果 科技人才 积分商城 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
最新专利技术
  • 本发明提供了一种基于语音控制的AI智能眼镜和语音控制方法,包含声纹动态加密系统、环境声场建模系统及定向音频增强系统。方法包含动态生物密钥驱动压电陶瓷阵列改变声波传导路径曲率,形成实时变轨加密通道;通过衰减模式匹配构建三维空间材质拓扑图;将声...
  • 本发明公开了一种基于语音AI交互驱动的作业AR智能辅助管理系统,应用于智能仓储领域,包括:环境感知型语音交互模块、AR多模态交互补偿模块、动态噪声鲁棒性数据处理模块、作业管理模块和数据库模块;所述环境感知型语音交互模块用于采集作业人员语音信...
  • 本发明属于水电站管理技术领域,具体提供一种利用语音指令展示水电站水轮机设备运行状态数据的方法及系统,包括:获取实时设备数据及三维地图展示数据;将语音信号按设定采样率进行采样,转换为时序波形数据,然后对语音信号进行去噪处理;采用CNN‑LST...
  • 本申请涉及一种物流客服机器人语音交互方法、装置、计算机设备、计算机可读存储介质和计算机程序产品。方法包括:响应于语音交互请求,获取请求端的身份标识信息和语音交互信息;根据语音交互信息调用工单查询接口,查询与身份标识信息相匹配的历史工单信息;...
  • 本发明提供了一种基于骨传导的智能语音助手唤醒方法,其中方法包括以下步骤:获取骨传导信号;获取骨传导信号;确定所述骨传导信号为语音段,则获取原始声音信号;对所述原始声音信号进行特征提取,获取声音特征数组;基于所述声音特征数组计算一次后验概率,...
  • 本发明涉及防干扰的屏幕用语音控制技术领域,具体为一种可声纹识别防干扰的屏幕用语音控制装置,包括语音控制装置主体以及显示屏,改变了传统的语音控制装置主体外侧没有保护结构的方式,从而能够避免影响核心功能声纹识别、防干扰、结构稳定性及使用寿命,同...
  • 本申请公开了用于测试的语音控制装置及方法,属于测试设备领域。本申请通过音频输入单元接收第一音频信号,并将所述第一音频信号转换为电信号;采用识别单元将所述电信号转换为数字指令;利用控制单元根据所述数字指令输出控制指令;通过测试单元根据所述控制...
  • 本申请实施例公开了一种无源语音遥控交互方法、系统及电子设备,属于智能家居与物联网技术领域。其中,无源语音遥控交互方法包括:获取用户的语音,并将所述语音转换为所述用户的语音信号;对所述语音信号进行关键词检测和信息压缩,得到所述用户的指令信息;...
  • 本申请涉及语音信号处理技术领域,尤其是涉及一种用于噪声鲁棒性语音识别的动态特征增强方法。该方法包括:获取多维度声学上下文信息集,基于多维度声学上下文信息集,分析灾害现场噪声动态特性与救援人员语音关键特征的掩蔽与干扰关系,得到语音特征动态损伤...
  • 本发明公开了一种语音及手势混合识别方法及装置,所述方法包括:获取语音信号及手势信号;根据预设多阶段划分配置模式,生成语音序列及手势序列;建立语音时间序列;建立手势时间序列;根据语音识别算法及手势识别算法,分别对语音序列及手势序列进行语义识别...
  • 本发明公开了一种基于人工智能的语音识别方法及系统,本发明采用多种语音去噪方式分别对语音信号进行去噪处理;然后,对得到的各个去噪语音信号进行分帧,得到多个信号帧序列,并确定出每个帧时刻的去噪门限值;接着,根据每个帧时刻的去噪门限值,来对各个信...
  • 本发明公开了一种提升大型语音模型公式朗读能力的训练系统及方法,涉及机器学习技术领域,系统包括:公式结构表征单元:用于对输入的公式文本进行结构解析,生成符号序列,构建结构感知矩阵,获得整体公式表征,并基于符号序列和结构感知矩阵,生成融合符号语...
  • 本发明涉及信号处理领域,尤其涉及一种基于非线性子空间表示学习的环境声音识别方法。本发明目的是现有的环境声音识别存在准确率低下的问题。提供了一种基于非线性子空间表示学习的环境声音识别方法。通过兼顾环境声音信号的内容与时序信息,来完整刻画其抽象...
  • 本发明提供了一种老年人模糊语音识别方法及系统,涉及语音数据处理技术领域,方法包括:构建清晰‑含混平行语料库;通过基于U‑Net架构的Diffusion模型,将含混语音数据转换为清晰语音数据;对Diffusion模型进行初步训练,得到初步Di...
  • 本发明公开了基于语音识别的智能老人语音助手系统及方法,涉及智能语音识别技术领域,用于解决当前现有系统缺乏动态适应机制,传统语音识别系统采用统一模型训练,往往无法考虑不同老年人的语音生理特征,如声带老化、发音模糊等问题;采用了基于MFCC(梅...
  • 本申请实施例公开通用音频大模型的改进方法、电子设备和存储介质,其中,一种通用音频大模型的改进方法,其中,所述通用音频大模型包括声学编码器和大语言模型基座,输入的音频经过频谱转换或提取特征后送入所述声学编码器中,提取高维的隐层表征,然后和文本...
  • 本申请公开了一种流式语音识别方法、设备、存储介质和程序产品,涉及语音处理技术领域,包括:对语音流逐语音片段进行编码;每得到一个语音片段的编码特征,获得当前解码时刻的解码状态对至少一个已编码语音片段的编码特征的注意力系数,得到注意力系数序列;...
  • 本申请实施例提供了一种语音的生成方法、装置、计算机设备、计算机可读存储介质、计算机程序产品,属于多媒体领域。该语音的生成方法包括:获取视频片段和基于视频片段语音识别得到的目标文本;将目标文本和视频片段作为模型输入,通过预先训练好的目标视觉语...
  • 本发明公开了一种多对话语音合成上下文韵律保持方法、装置、设备及介质,涉及金融、医疗、保险及银行等领域中的语音合成技术领域,包括:获取当前轮次的输入文本;从历史韵律缓存中获取历史韵律上下文信息,所述历史韵律上下文信息基于至少一轮历史对话的韵律...
  • 本申请公开了一种电子书音频生成方法、音频播放方法及相关装置,涉及电子书音频生成及播放技术领域,电子书音频生成方法包括:获取EPub电子书;从EPub电子书中找到spine元素,读取spine元素的目录属性;从资源清单中获取以目录属性为id的...
技术分类