Document
拖动滑块完成拼图
专利交易 商标交易 积分商城 国际服务 IP管家助手 科技果 科技人才 会员权益 需求市场 关于龙图腾 更多
 /  免费注册
到顶部 到底部
清空 搜索
最新专利技术
  • 本说明书实施例提供信号时延对齐方法及装置,其中所述方法包括:确定麦克风信号对应的信号查询特征和参考信号对应的信号键特征;根据所述信号键特征构建包含多个时延候选特征的时延候选特征集,其中,每个时延候选特征对应一个时延假设值;计算所述信号查询特...
  • 本发明公开了一种电力设备的局部放电声音信号去噪处理方法及电子设备。涉及智能电网领域,该方法包括:获取麦克风阵列中多个通道各自对应的原始局部放电声音信号;基于多个通道各自对应的原始局部放电声音信号,得到多个通道各自对应的初始复小波系数;对多个...
  • 本申请提供一种干扰音抑制方法、模数转换器和可穿戴设备,涉及音频处理领域。所述干扰音抑制方法包括:调整数模转换器的配置,以使sigma‑delta调制器基于目标校准信号对音频输入信号进行调制后,得到的音频输出信号中的干扰音在预设频率范围内;目...
  • 本发明提供了一种基于稀缺样本的氦语音关键信息提取方法,属于语音处理和人工智能技术领域。解决了饱和潜水等高压氦氧环境中语音信号因声速变化导致的频谱畸变、共振峰上移和音色失真的技术问题。其技术方案为:包括以下步骤:S1、在内容编码模块之后引入目...
  • 本发明涉及基于虚拟歌手的个性化音色迁移与合成方法,通过获取目标虚拟歌手参考演唱音频,经音色编码提取用于表征音色身份稳定性的音色身份基准特征;获取针对所述虚拟歌手的个性化音色迁移需求信息,所述需求信息包括待迁移的音色属性以及对应的目标变化幅度...
  • 本公开是关于一种音频转换方法、装置、电子设备及存储介质。其中,音频转换方法,包括:提取目标对象音频以及参考音频的音频特征以及音色特征,并在所述音频特征中映射所述参考音频的音色特征,得到映射后音频特征;基于所述目标对象音频中的基频特征以及所述...
  • 本申请涉及一种音频修复模型处理方法、音频修复方法、装置、设备、存储介质和程序产品,涉及音频及人工智能技术领域。根据第二采样频率对第一采样频率的第一音频样本进行处理得到第二采样频率的第二音频样本,对第二音频样本进行失真模拟处理得到第二采样频率...
  • 一种基于矢量量化变分自编码器的水声信号压缩方法,它属于水声信号处理与深度学习技术领域。本发明解决了现有方法的压缩率低、信号重构质量差的问题。本发明构建了包括编码器、量化器和解码器的矢量量化变分自编码器,编码器用于对水声信号的声学特征进行编码...
  • 本发明公开了一种基于声源分离与语义保留的生成式音频匿名化重构方法、装置、设备及程序产品,涉及语音隐私保护与音频信号处理技术领域。该方法包括:获取原始音频,并对所述原始音频进行声源分离,得到至少一个说话人声轨和环境背景音轨;对各所述说话人声轨...
  • 本发明公开了基于声音事件的动物识别与定位方法及系统,涉及生物声学监测技术领域,包括采集多路原始音频数据构成目标声音事件集合。对集合执行动物种类识别处理,提取并融合各路音频的声学特征,生成动物种类判定结果。同时,执行声源空间定位处理,基于声波...
  • 本发明涉及语音识别技术领域,具体涉及基于声纹分析的智慧家居声控用户识别方法及系统。方法包括:获取原始参考信号对应的频域参考谱和麦克风采集信号对应的频域残差谱;基于频域参考谱确定非线性激发强度;基于频域参考谱和频域残差谱确定线性相干度;根据低...
  • 本申请公开了一种基于混合模型的声纹数据处理方法、装置及相关设备,涉及人工智能与声纹识别交叉的技术领域,将预设规模数据集和增强后的声纹训练数据的大数据集上训练的卷积神经网络作为底层与中层特征提取器,以充分利用其强大的特征学习能力。为了克服传统...
  • 本发明涉及声音检测设备技术领域,尤其涉及一种一体化嵌入式声纹分析总端装置及其适用方法。其包括声纹分析模块、安装基座模组及可快换治具组件;声纹分析模块集成IEPE麦克风与加速度计,通过FPGA实现多模态信号时间同步,结合多轴机械手自适应调整采...
  • 本申请实施例公开了一种车辆唤醒方法、装置、电子设备及计算机可读存储介质,涉及语音识别技术领域;该方法包括:监测环境音频,在所述环境音频包括唤醒词音频时,对所述唤醒词音频进行声源定位;在所述唤醒词音频来自车外时,获取所述唤醒词音频的目标声纹特...
  • 本发明涉及人工智能的技术领域,特别涉及具备情绪动态演化记忆的交互系统、方法、介质及处理器。提出了具备情绪动态演化记忆的交互系统和方法,包括感知层、处理层和决策层;感知层包括语义文本的编码模块和融合处理模块;语义文本的编码模块,将获取的音频输...
  • 本发明涉及音频处理领域,具体涉及一种交互状态的分析方法、设备及介质。本申请提供的方法通过获取历史音频关联的历史文本内容与设备交互状态,生成当前音频对应的提示文本,为交互意图识别提供上下文依据,解决现有技术缺乏上下文支撑的问题;其次,同步分析...
  • 本发明提供一种音频唤醒方法、智能穿戴设备及存储介质,音频唤醒方法包括:在音频处理系统处于低功耗监听状态下,通过硬件语音活动检测模块实时检测环境声压;在环境声压大于预设声压阈值时,硬件语音活动检测模块产生硬件中断信号以触发逻辑处理模块退出低功...
  • 本申请实施例提供了一种语音的文本数据校正方法、装置、电子设备及介质。该方法包括:获取语音数据对应的多个第一文本数据、第一置信度,第一置信度从语义上表示第一文本数据的置信度;根据第一文本数据预测语音数据的目标长度,并根据目标长度和第一文本数据...
  • 本发明涉及虚拟数字人及深度学习领域,具体是一种基于多模态时序建模的音频驱动数字人唇形生成方法。依托多模态融合与时序建模能力,通过分层音频编码器提取深度时序特征,拓扑无关人脸编码器适配任意网格,动态时序对齐模块实现语音‑唇动精准映射,搭配局部...
  • 本发明涉及人工智能技术领域,且公开了基于车载高噪环境下的语音指令识别的BCM模块协同控制方法,方法包括如下步骤:采集车载高噪环境下的原始语音指令数据和车辆状态参数数据;基于所述原始语音指令数据进行噪声环境下的语音信号预处理,生成去噪语音指令...
技术分类