Document
拖动滑块完成拼图
首页 专利交易 IP管家助手 科技果 科技人才 积分商城 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
最新专利技术
  • 本发明涉及智能通讯的技术领域,特别涉及一种基于AI的通讯语音降噪方法,包括以下步骤:步骤一:通过采集多场景噪声,经过麦克风阵列收录带噪语音,覆盖交通、餐厅、会议等复杂环境;步骤二:构建方言语音数据库,添加噪声混合层(如突发性鸣笛、键盘敲击)...
  • 本发明实施例提供的语音降噪方法、模型训练方法和电子设备的技术方案中,语音降噪方法包括:将第一语音信号输入目标模型,目标模型为小型化的语音降噪模型;在目标模型中,第一频带采样模块对第一语音信号在预设多个频带上进行下采样得到第二语音信号;第一编...
  • 本发明涉及电梯安防技术领域,尤其涉及一种电梯远程报警对讲降噪方法及系统,其方法包括对带噪语音信号进行处理,提取40维语音特征,所述40维语音特征包括20个梅尔倒谱系数、按照顺序取前10个梅尔倒谱系数的第一导数和第二导数;将所述40维语音特征...
  • 本发明涉及飞行汽车技术领域,具体涉及一种复合噪声源分离方法。包括对采集到的噪声信号进行短时傅里叶变换处理,获得时频域信号;采用改进的FastICA算法进行初步分离,利用旋翼转速初始化旋翼噪声分量,利用发动机工况初始化发动机噪声分量;采用基于...
  • 本申请实施例公开一种音轨切换方法及电子设备,该方法包括:在播放第一音轨对应的第一音频流时,通过检测装置采集多模态数据;利用卷积神经网络模型对多模态数据进行归一化处理,得到多模态特征向量并输入至上下文预测模型,由上下文预测模型预测匹配于多模态...
  • 本公开实施例中提供了一种基于双支路双流注意力机制的语音增强方法,属于数据处理技术领域,具体包括:步骤1,通过幅度谱支路估计干净语音信号的幅度谱,其中,所述幅度谱支路包括依次连接的两层编码器、四层时频双流Transformer模块、融合模块及...
  • 本发明公开了基于语音同步的嘴形动作生成方法,属于语音同步技术领域,该生成方法具体步骤如下:Ⅰ:采集并预处理多组视频语料数据,同时建立包含生成模型与判别模型的对抗网络;Ⅱ:依据预处理后的视频语料数据,构造生成模型的输入,并通过生成模型获取各输...
  • 本申请提供了一种模型训练方法、装置、电子设备及存储介质,涉及人工智能领域。该模型训练方法,包括:获取训练样本集,包括至少一个图像样本;将图像样本输入学生模型,得到图像样本的第一特征;将图像样本输入教师模型,得到图像样本的第二特征;将图像样本...
  • 本发明是一种基于对抗神经网络生成音频深度学习训练数据的方法,是一种基于生成对抗网络(GAN)的数据合成技术,用于生成稀缺类别的音频训练样本,以有效扩展数据集的多样性。该方法利用GAN模型的生成能力,模拟出稀有类别的音频样本,可弥补传统数据集...
  • 本发明公开了一种基于小波风格增强原型网络的跨域变压器异常声音检测方法,属于异常声音检测技术领域。该方法包括:获取源域音频与少量目标域音频样本;对源域音频进行小波分解,提取其低频与高频分量;利用目标域样本的低频统计特征对源域低频分量进行风格增...
  • 本发明提供了一种基于机器学习的黑叶猴鸣声监测方法、介质及系统,属于鸣声监测技术领域,首先构建监测网络拓扑图,基于音频采集设备的地理位置和环境噪声确定采集路径。将音频信号经分解得到单体和叠加鸣声信号分量,建立时序关系矩阵和稳定系数矩阵后进行信...
  • 本发明涉及故障检测领域,公开了一种基于小样本学习与声学特征迁移的设备故障检测方法、设备及介质,方法包括:获取目标设备声学信号;提取融合特征向量;基于DANN网络生成与设备无关特征;利用Mel‑CGAN生成合成的故障声学信号;将合成的故障声学...
  • 本发明公开了一种基于人工智能的黑广播语义自动识别系统及方法,涉及智能信号处理技术领域,本发明通过专用设备捕获广播信号,利用FFT技术分析频谱特征,生成异常得分,标记可疑片段;通过VAD算法提取语音片段,经ASR技术转写为文本,提取声学和背景...
  • 本申请公开了一种基于软硬件协同优化和数据交互的小型化水下目标实时监测系统,涉及海洋声学监测领域,该系统包括:检测装置、融合装置和识别装置;检测装置包括台架、声学阵列及数据采集模块;台架用于支撑各个部件;声学阵列用于实时采集水下声学信号;数据...
  • 本发明涉及语音处理技术领域,可应用于金融科技及医疗健康等业务场景中,公开了一种基于音频信息的状态确定方法、装置、设备及介质,包括:获取音频信号并进行降噪处理和端点检测,得到初始音频片段,统一为预设固定时长后进行语音转文本处理,得到文本信息,...
  • 本发明提供了一种机房噪声分析判断方法及噪声分析判断装置,该机房噪声分析判断方法包括:采集机房环境的原始音频,并对所采集的原始音频进行预处理;提取预处理后的音频的第一梅尔频谱图,作为时频特征;将提取的第一梅尔频谱图输入卷积神经网络模型,对卷积...
  • 本发明提供一种基于人工智能的外语发音纠正方法及系统,属于发音纠正领域,获取外语发音音频及标准音素序列,建立声学模型、音素混淆代价矩阵和时长高斯分布模型,通过强制对齐将音素与音频段匹配,计算对齐声学似然度,对每个音素段采用改进Viterbi算...
  • 本发明属于力学感知技术领域,公开了一种用于音频监控的语音信号边缘处理系统及方法;方法包括:采集声压偏振矢量流、振动信号和声压信号;对声压偏振矢量流、振动信号和声压信号进行特征提取与融合,获得声压偏振特征和声力耦合特征;将声压偏振特征和声力耦...
  • 本发明涉及燃气检测领域,公开了一种多任务Mamba‑CNN的掺氢天然气管道泄漏检测方法及系统。该方法先采集管道对应的音频数据,并将音频数据转换为Log‑Mel谱图(对数梅尔频谱图),之后通过泄漏检测模型对Log‑Mel谱图进行处理,以确定管...
  • 本申请实施例提供了一种代答复识别方法和装置、计算机设备及存储介质,属于人工智能技术领域。该方法包括:从第一音视频数据提取训练视频数据,从第二音视频数据提取训练音频数据;将训练视频数据和训练音频数据进行合并处理,得到初步音视频数据;根据预设随...
技术分类