Document
拖动滑块完成拼图
首页 专利交易 IP管家助手 科技果 科技人才 积分商城 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
最新专利技术
  • 本发明公开了一种基于人工智能的黑广播语义自动识别系统及方法,涉及智能信号处理技术领域,本发明通过专用设备捕获广播信号,利用FFT技术分析频谱特征,生成异常得分,标记可疑片段;通过VAD算法提取语音片段,经ASR技术转写为文本,提取声学和背景...
  • 本发明涉及故障检测领域,公开了一种基于小样本学习与声学特征迁移的设备故障检测方法、设备及介质,方法包括:获取目标设备声学信号;提取融合特征向量;基于DANN网络生成与设备无关特征;利用Mel‑CGAN生成合成的故障声学信号;将合成的故障声学...
  • 本发明提供了一种基于机器学习的黑叶猴鸣声监测方法、介质及系统,属于鸣声监测技术领域,首先构建监测网络拓扑图,基于音频采集设备的地理位置和环境噪声确定采集路径。将音频信号经分解得到单体和叠加鸣声信号分量,建立时序关系矩阵和稳定系数矩阵后进行信...
  • 本发明公开了一种基于小波风格增强原型网络的跨域变压器异常声音检测方法,属于异常声音检测技术领域。该方法包括:获取源域音频与少量目标域音频样本;对源域音频进行小波分解,提取其低频与高频分量;利用目标域样本的低频统计特征对源域低频分量进行风格增...
  • 本发明是一种基于对抗神经网络生成音频深度学习训练数据的方法,是一种基于生成对抗网络(GAN)的数据合成技术,用于生成稀缺类别的音频训练样本,以有效扩展数据集的多样性。该方法利用GAN模型的生成能力,模拟出稀有类别的音频样本,可弥补传统数据集...
  • 本申请提供了一种模型训练方法、装置、电子设备及存储介质,涉及人工智能领域。该模型训练方法,包括:获取训练样本集,包括至少一个图像样本;将图像样本输入学生模型,得到图像样本的第一特征;将图像样本输入教师模型,得到图像样本的第二特征;将图像样本...
  • 本发明公开了基于语音同步的嘴形动作生成方法,属于语音同步技术领域,该生成方法具体步骤如下:Ⅰ:采集并预处理多组视频语料数据,同时建立包含生成模型与判别模型的对抗网络;Ⅱ:依据预处理后的视频语料数据,构造生成模型的输入,并通过生成模型获取各输...
  • 本公开实施例中提供了一种基于双支路双流注意力机制的语音增强方法,属于数据处理技术领域,具体包括:步骤1,通过幅度谱支路估计干净语音信号的幅度谱,其中,所述幅度谱支路包括依次连接的两层编码器、四层时频双流Transformer模块、融合模块及...
  • 本申请实施例公开一种音轨切换方法及电子设备,该方法包括:在播放第一音轨对应的第一音频流时,通过检测装置采集多模态数据;利用卷积神经网络模型对多模态数据进行归一化处理,得到多模态特征向量并输入至上下文预测模型,由上下文预测模型预测匹配于多模态...
  • 本发明涉及飞行汽车技术领域,具体涉及一种复合噪声源分离方法。包括对采集到的噪声信号进行短时傅里叶变换处理,获得时频域信号;采用改进的FastICA算法进行初步分离,利用旋翼转速初始化旋翼噪声分量,利用发动机工况初始化发动机噪声分量;采用基于...
  • 本发明涉及电梯安防技术领域,尤其涉及一种电梯远程报警对讲降噪方法及系统,其方法包括对带噪语音信号进行处理,提取40维语音特征,所述40维语音特征包括20个梅尔倒谱系数、按照顺序取前10个梅尔倒谱系数的第一导数和第二导数;将所述40维语音特征...
  • 本发明实施例提供的语音降噪方法、模型训练方法和电子设备的技术方案中,语音降噪方法包括:将第一语音信号输入目标模型,目标模型为小型化的语音降噪模型;在目标模型中,第一频带采样模块对第一语音信号在预设多个频带上进行下采样得到第二语音信号;第一编...
  • 本发明涉及智能通讯的技术领域,特别涉及一种基于AI的通讯语音降噪方法,包括以下步骤:步骤一:通过采集多场景噪声,经过麦克风阵列收录带噪语音,覆盖交通、餐厅、会议等复杂环境;步骤二:构建方言语音数据库,添加噪声混合层(如突发性鸣笛、键盘敲击)...
  • 本申请实施例提供了一种语音增强及语音增强模型训练方法、计算机程序产品,其中,语音增强方法包括:获取目标说话人的语音数据样本,并基于双向长短期记忆网络层和注意力统计池化层对所述语音数据样本进行频谱特征提取,以获得所述目标说话人的频谱特征;将所...
  • 本申请提供一种音频修复方法、系统、介质和设备,包括:获取目标待处理音频;利用预训练多模态模型的文本编码器提取目标待处理音频对应的语义向量;通过跨模态适配层将语义向量映射至音频特征空间,生成目标声源的参考音频令牌;调用条件分离网络对齐混合音频...
  • 本公开提供了用于增强劣化音频信号的系统和方法。本公开涉及音频增强领域,尤其涉及用于机器学习模型MLM的监督训练的方法、设备和软件,MLM被训练成通过计算要被应用于劣化音频信号的频带的增益来增强劣化音频信号。本公开还涉及用于这种被训练的MLM...
  • 本发明公开了一种基于多分辨率判别器组生成对抗网络的汉语语音增强方法。所述方法包括以下步骤:训练数据预处理:对训练数据进行短时傅里叶变换,获取训练数据的频谱特征,然后通过幂律压缩获得压缩后的频谱特征;模型构建与训练:根据听感知理论,构建语音增...
  • 本申请公开了一种自动均衡幅频响应方法、装置、设备及存储介质,涉及音频信号处理技术领域,本申请的方法包括:根据预设采样频率获取扫频信号,并对所述扫频信号进行快速傅里叶变换得到实际幅频响应;根据所述实际幅频响应进行窄带补偿与优化得到峰值滤波器系...
  • 本申请公开了一种音频处理方法、装置、非易失性存储介质及电子设备。其中,该方法包括:确定目标发声对象的第一声音特征,以及待处理音频的第一语义信息,其中,待处理音频为目标发声对象发出的音频;确定待处理音频的待处理音频特征图,其中,待处理音频特征...
  • 跨语言语音转换系统和方法,包括语音特征提取器,该语音特征提取器被配置为接收第一语言的第一语音音频段和第二语言的第二语音音频段,并分别提取包括第一语音的与说话者相关的声学特征和第二语音的与说话者无关的语言特征的音频特征。一个或多个生成器被配置...
技术分类