Document
拖动滑块完成拼图
专利交易 积分商城 国际服务 IP管家助手 科技果 科技人才 商标交易 会员权益 需求市场 关于龙图腾 更多
 /  免费注册
到顶部 到底部
清空 搜索
最新专利技术
  • 本发明涉及信号处理技术领域,尤其涉及一种电力专业带口音普通话的流式语音识别方法。本发明包括以下步骤:步骤S1:获取会议语音语料库,将电力专有词汇转化为普通话语音和口音语音并进行拼接;步骤S2:采提取拼接后的语音的频谱特征;步骤S3:对频谱特...
  • 本发明涉及声纹识别与信息安全技术领域,具体为一种基于本地闭集声纹识别的防诈骗方法。包括:S1、获取输入语音信号,并基于预存的注册模板特征向量,计算输入语音信号的声学相似度得分;S2、对输入语音信号进行生理活性特征甄别,以计算生理活性指数;S...
  • 本申请公开了一种基于声学信号多特征表示的鱼类摄食行为识别方法、装置、设备、介质及产品,涉及水声信号处理与机器学习技术领域。本申请首先获取鱼类摄食声音样本信号,并按照预设时间窗进行划分,获得多个时间窗的声音样本信号;分别提取每个时间窗的声音样...
  • 本公开涉及一种无线音频传输方法、传输装置及其系统,应用于无线音频发送设备的无线传输方法,包括:基于第一物理层对应的至少一条主传输链路,在一个或多个第一等时间隔内发送主音频数据包;基于第二物理层对应的至少一条辅传输链路,在一个或多个第二等时间...
  • 本发明涉及信号处理与人工智能交叉技术领域,具体涉及一种基于DAE的多源噪声去除方法及系统,步骤一.多源噪声与纯净信号的数据采集与特征提取;步骤二.基于特征分析的去噪识别知识库构建;步骤三.基于知识库的深度去噪自编码器模型构建;步骤四.深度去...
  • 本文描述了用于处理时变输入数据的流以实时或近实时地生成/预测时变输出数据的流的实现方式。在各种实现方式中,在接收诸如音频输入帧的流的输入帧的流的同时,可以(例如,在中流)对到当前时间步为止接收到的音频输入帧进行词元化以生成音频输入词元的流。...
  • 本申请涉及具有减少后处理延迟的高频重建技术的集成,并具体揭示一种用于解码经编码音频位流的方法。所述方法包含接收所述经编码音频位流且解码音频数据以产生经解码低频带音频信号。所述方法进一步包含提取高频重建元数据且使用分析滤波器组来对所述经解码低...
  • 本发明公开了基于多模态流式学习的普通话发音实时矫治方法及其系统,属于语音处理技术领域,该方法采集用户语音信号和面部图像信息,对语音信号进行预处理和切分获得语音帧序列,利用人脸图像识别技术提取唇形及舌位特征,创新性地构建多模态拓扑特征空间,通...
  • 本申请公开了一种音频信号的处理方法、回声消除模型的训练方法和语音识别方法。其中,该方法包括:获取待处理音频信号和参考音频信号,其中,参考音频信号与待处理音频信号中的回声成分相对应;基于参考音频信号对待处理音频信号中的线性回声成分进行回声消除...
  • 本申请涉及音频降噪技术领域,具体公开了一种基于深度学习的实时音频降噪方法及装置,此方法包括音频采集与转换、实时分帧与加窗、时频变换、轻量化神经网络模型输出、纯净语音幅度谱重构、时频逆变换与重叠相加和输出降噪音频等步骤,轻量化神经网络模型与实...
  • 本发明公开了一种基于生成对抗网络的语音增强降噪系统,包括:时频对齐模块,用于采集原始噪声语音并预处理;三分量编码模块,用于提取语音内容特征、声纹特征与噪声表征;双域协同生成模块,用于生成候选增强波形频谱并协同校正;多头判别模块,用于通过时域...
  • 本发明公开了一种多人场景的语音降噪方法、装置、电子设备及存储介质,涉及语音信号处理技术领域。该方法包括:获取目标空间场景的音频信号和视频图像;确定与音频信号匹配的音频感知信息,以及与视频图像对应的视觉语音活动检测结果;将音频感知信息以及视觉...
  • 本说明书实施例提供信号处理方法及装置,其中所述方法包括:确定麦克风信号对应的目标麦克风信号频谱,以及参考信号对应的目标参考信号频谱,其中,目标麦克风信号频谱与目标参考信号频谱具有时间对齐关系;通过步长预测模型基于目标麦克风信号频谱和目标参考...
  • 本申请公开了一种音频处理方法、装置、电子设备及存储介质。方法包括:对采集到的多通道音频进行音频信号分析,得到多通道音频对应的实数谱和虚数谱;对实数谱和虚数谱分别进行掩膜处理,得到实数谱对应的掩膜实数谱和虚数谱对应的掩膜虚数谱;通过融合网络分...
  • 本发明涉及降噪领域,具体为一种环境噪声智能感知及剔除系统。其包括:声音采集模块,用来捕捉不同方向的声音信号,声音采集模块由多个麦克风组成;环境参数采集模块,用来采集语音设备的周围环境参数,包括语音设备的运动状态,周围环境中的障碍物以及障碍物...
  • 本发明涉及座舱语音调节技术领域,公开了一种语音通话的优化方法、装置、车辆及存储介质,本发明通过获取车内音频信号,对车内音频信号进行信号分离处理,提取出语音通话信号和至少一种干扰信号,再对语音通话信号和干扰信号进行频域分析,计算语音通话信号和...
  • 本发明涉及自然语言处理技术领域,公开了基于自然语言处理的AI智能会议系统及其多语言转换技术,其包括多模态声波与振动采集单元、信号滤波与特征提取模块、深度学习驱动的多源分离与混响消除单元、发言人身份识别与位置解析模块、自然语言处理与跨语种翻译...
  • 本说明书实施例提供一种音频播放方法、系统、装置及介质,所述方法包括:基于目标对象的声纹特征,从目标场景的混合音频中获取目标对象的初始声音数据;对初始声音数据进行声学处理,生成目标声音数据;控制目标播放设备播放目标声音数据。
  • 本申请提供了一种语音克隆方法及电子设备,应用于语音克隆系统,方法包括:分别对被克隆者的第一语音和目标人的指示语音进行特征提取,得到第一语音的第一特征集合和指示语音的第二特征集合;将第一特征集合和第二特征集合分别输入训练好的语音克隆模型中;由...
  • 本申请提供了一种多方对话翻译方法及装置、电子设备、存储介质,属于语音处理技术领域,该方法包括:获取当前时间窗口内的语音对话信息;对语音对话信息进行说话人身份识别,基于语音信息的时长选取当前时间窗口内的第一主讲人;将第一主讲人的第一语音特征划...
技术分类