Document
拖动滑块完成拼图
专利交易 积分商城 国际服务 IP管家助手 科技果 科技人才 商标交易 会员权益 需求市场 关于龙图腾 更多
 /  免费注册
到顶部 到底部
清空 搜索
最新专利技术
  • 本申请涉及一种高性能语音处理方法,处理方法包括获取经网络传输的语音数据,生成对应的场景指纹信息,确定轻量化多场景适配框架的框架参数,以及对应的处理参数,若丢失片段的持续时间小于预设门限值,则根据声学补偿参数生成对应的第一补偿结果;若持续时间...
  • 本发明公开了一种复杂噪声背景条件下的漏损在线识别工艺,属于管道泄漏监测与智能信号处理技术领域,包括以下步骤:S1、多阶段去噪;针对传统管网声音信号检测方法中存在的噪声干扰大、特征提取质量不高、适应性弱等问题,通过一种“多阶段去噪”的预处理策...
  • 本申请提供了一种音频数据处理方法及系统,其中,音频获取模块获取原始音频数据,根据原始音频数据得到脉冲编码调制格式的第一目标音频数据,将第一目标音频数据传输至音频工作线程模块,音频工作线程模块对第一目标音频数据进行对应处理,得到第二目标音频数...
  • 本发明公开了一种基于韵律信息的按摩设备的智能控制方法及系统,涉及语音识别处理技术领域。本发明通过韵律信息对按摩设备进行智能控制,实现了音乐节奏、用户呼吸及语音信号的同步匹配,使按摩动作更加自然协调,能够显著提升舒适度与沉浸感;同时,本发明结...
  • 本发明公开了一种基于双阶段自适应聚类的课堂音频分析与识别方法,包括以下步骤:S10,进行音频采集与预处理:将原始课堂录音,进行处理进而输出标准化音频波形及音频质量参数;S20,进行语音检测;S30,进行嵌入提取:针对每个语音段,输出每个语音...
  • 本公开提供一种唇形数据生成方法、唇形动画生成方法、装置、电子设备及程序产品,该唇形数据生成方法包括:从语音信号中逐帧提取音频特征;根据音频特征确定各帧对应的音素标识,对具有相同或相似音素标识的连续帧进行合并处理从而获得音素数据序列;确定音素...
  • 本发明公开了一种基于音子驱动的数字人口型同步方法、装置、设备及介质。该基于音子驱动的数字人口型同步方法包括:利用训练好的音子识别模型,对音频数据进行计算推理,得到音子流数据;加载音子参数字典、数字人形象模型和数字人贴图;基于所述音频数据进行...
  • 本发明涉及语音信号处理技术领域,公开了一种基于轻量化注意力驱动网络ADNet的语音增强方法。该方法首先构建多噪声语音数据集,并对语音信号执行短时傅立叶变换(STFT),提取幅度谱与相位谱作为输入特征。随后设计轻量化ADNet网络结构,包括编...
  • 本发明提供了一种基于时频域特征和域自适应的无人水下航行器自噪声分离方法,涉及无人水下航行器自噪声分离领域,包括:获取待分离自噪声信号,进行短时傅里叶变换和编码处理,得到时频特征图;从时频特征图中提取时域特征和频域特征,基于先验噪声的时频特性...
  • 本发明公开了一种全域声源定位下的多轨音频处理系统,该系统采用双阶段融合架构:通过传统延迟求和波束形成算法与轻量化U‑Net深度学习模型相结合,实现对360度空间内声源的快速、高精度定位,将声源定位转化为对极坐标能量谱图的语义分割任务,具有低...
  • 本发明涉及声音处理领域,具体为一种回音消除的尾音处理系统及方法,其中系统包括:近端麦克风模块、近端扬声器模块、线性回音消除模块、回声返回损耗增益估计模块、估计非线性回音消除模块、远端非线性回音消除模块、混合消除模块、远端音频发模块和远端音频...
  • 本发明公开了一种基于噪声融合的语音增强方法,涉及语音增强技术领域。本发明语音增强模型以频带划分循环神经网络为核心架构,输入含噪混合语音和附加噪声信号,经过噪声融合模块处理后,输出生成的增强语音。噪声输入由多个真实录制的噪声片段构成,模型能够...
  • 本申请公开了一种音色转换方法、设备、存储介质和程序产品,涉及人工智能技术领域,包括:获得原语音的原语音识别特征和参考语音的参考音色识别特征,对原语音识别特征进行音色去除处理,得到目标原语音识别特征,至少基于目标原语音识别特征和参考音色识别特...
  • 本申请涉及一种智能音频优化方法,一种智能音频优化方法包括将语音信号和网络状态参数输入至深度学习模型进行联合分析,生成对应的环境评估结果;动态生成语音活动检测阈值,并利用语音活动检测阈值对语音信号进行检测,以确定用户是否处于语音状态;若用户未...
  • 本申请公开了音频通路校验的方法、装置、设备、存储介质及程序产品,涉及通信技术领域。该方法在数据下发接口接收到上层应用发送的音频算法数据的情况下,封装为RTAC格式得到实时音频校准数据;通过实时音频校准模块获取数字音频处理器的音频链路状态,在...
  • 本申请公开了一种音频压缩模型的处理方法及系统、设备、程序产品,所述方法包括:通过初始音频压缩模型对样本音频进行压缩,得到预测音频;分别将样本音频和预测音频划分为敏感频段和非敏感频段;基于第一听觉掩蔽阈值将样本音频和预测音频的敏感频段划分为四...
  • 本发明公开了一种噪声信号生成方法,包括:获得随机相位数据和频率映射数据,所述频率映射数据表征频域索引与其对应的实际频率之间的关系;基于所述频率映射数据,根据相邻频域索引对应实际频率之间的倍频关系,对初始衰减系数数据进行迭代更新,得到衰减系数...
  • 本申请公开了一种音频数据增强方法、设备及存储介质,涉及数据处理技术领域。上述方法基于不同的窗长对音频信号进行傅里叶变换得到频域特征后,对频域特征编码得到编码特征序列;通过注意力机制确定编码特征序列的注意力分数矩阵,将预设下三角矩阵与注意力分...
  • 本发明提供了一种语音模型架构融合RAG与用户标签回流的智能推荐交互系统及方法,涉及智能语音技术领域。本发明集成设备唤醒AAR到语音APK实现语音唤醒与采集;语音流经ASR引擎转文本后由文本纠正模型优化;NLP引擎识别意图并分发至垂类智能体,...
  • 本发明涉及声纹识别与语音转写领域,公开了一种多人重叠语音实时声纹识别方法与系统。该方法包括:获取多源音频流并进行标准化与分帧处理,生成流式音频帧序列;基于该序列,通过循环缓冲、降噪、端点检测和重叠检测模型处理,得到重叠区间标注;进而进行任务...
技术分类