Document
拖动滑块完成拼图
首页 专利交易 IP管家助手 科技果 科技人才 积分商城 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
最新专利技术
  • 本发明公开了基于语音同步的嘴形动作生成方法,属于语音同步技术领域,该生成方法具体步骤如下:Ⅰ:采集并预处理多组视频语料数据,同时建立包含生成模型与判别模型的对抗网络;Ⅱ:依据预处理后的视频语料数据,构造生成模型的输入,并通过生成模型获取各输...
  • 本公开实施例中提供了一种基于双支路双流注意力机制的语音增强方法,属于数据处理技术领域,具体包括:步骤1,通过幅度谱支路估计干净语音信号的幅度谱,其中,所述幅度谱支路包括依次连接的两层编码器、四层时频双流Transformer模块、融合模块及...
  • 本申请实施例公开一种音轨切换方法及电子设备,该方法包括:在播放第一音轨对应的第一音频流时,通过检测装置采集多模态数据;利用卷积神经网络模型对多模态数据进行归一化处理,得到多模态特征向量并输入至上下文预测模型,由上下文预测模型预测匹配于多模态...
  • 本发明涉及飞行汽车技术领域,具体涉及一种复合噪声源分离方法。包括对采集到的噪声信号进行短时傅里叶变换处理,获得时频域信号;采用改进的FastICA算法进行初步分离,利用旋翼转速初始化旋翼噪声分量,利用发动机工况初始化发动机噪声分量;采用基于...
  • 本发明涉及电梯安防技术领域,尤其涉及一种电梯远程报警对讲降噪方法及系统,其方法包括对带噪语音信号进行处理,提取40维语音特征,所述40维语音特征包括20个梅尔倒谱系数、按照顺序取前10个梅尔倒谱系数的第一导数和第二导数;将所述40维语音特征...
  • 本发明实施例提供的语音降噪方法、模型训练方法和电子设备的技术方案中,语音降噪方法包括:将第一语音信号输入目标模型,目标模型为小型化的语音降噪模型;在目标模型中,第一频带采样模块对第一语音信号在预设多个频带上进行下采样得到第二语音信号;第一编...
  • 本发明涉及智能通讯的技术领域,特别涉及一种基于AI的通讯语音降噪方法,包括以下步骤:步骤一:通过采集多场景噪声,经过麦克风阵列收录带噪语音,覆盖交通、餐厅、会议等复杂环境;步骤二:构建方言语音数据库,添加噪声混合层(如突发性鸣笛、键盘敲击)...
  • 本申请实施例提供了一种语音增强及语音增强模型训练方法、计算机程序产品,其中,语音增强方法包括:获取目标说话人的语音数据样本,并基于双向长短期记忆网络层和注意力统计池化层对所述语音数据样本进行频谱特征提取,以获得所述目标说话人的频谱特征;将所...
  • 本申请提供一种音频修复方法、系统、介质和设备,包括:获取目标待处理音频;利用预训练多模态模型的文本编码器提取目标待处理音频对应的语义向量;通过跨模态适配层将语义向量映射至音频特征空间,生成目标声源的参考音频令牌;调用条件分离网络对齐混合音频...
  • 本公开提供了用于增强劣化音频信号的系统和方法。本公开涉及音频增强领域,尤其涉及用于机器学习模型MLM的监督训练的方法、设备和软件,MLM被训练成通过计算要被应用于劣化音频信号的频带的增益来增强劣化音频信号。本公开还涉及用于这种被训练的MLM...
  • 本发明公开了一种基于多分辨率判别器组生成对抗网络的汉语语音增强方法。所述方法包括以下步骤:训练数据预处理:对训练数据进行短时傅里叶变换,获取训练数据的频谱特征,然后通过幂律压缩获得压缩后的频谱特征;模型构建与训练:根据听感知理论,构建语音增...
  • 本申请公开了一种自动均衡幅频响应方法、装置、设备及存储介质,涉及音频信号处理技术领域,本申请的方法包括:根据预设采样频率获取扫频信号,并对所述扫频信号进行快速傅里叶变换得到实际幅频响应;根据所述实际幅频响应进行窄带补偿与优化得到峰值滤波器系...
  • 本申请公开了一种音频处理方法、装置、非易失性存储介质及电子设备。其中,该方法包括:确定目标发声对象的第一声音特征,以及待处理音频的第一语义信息,其中,待处理音频为目标发声对象发出的音频;确定待处理音频的待处理音频特征图,其中,待处理音频特征...
  • 跨语言语音转换系统和方法,包括语音特征提取器,该语音特征提取器被配置为接收第一语言的第一语音音频段和第二语言的第二语音音频段,并分别提取包括第一语音的与说话者相关的声学特征和第二语音的与说话者无关的语言特征的音频特征。一个或多个生成器被配置...
  • 本发明涉及蓝牙耳机低延时音频处理方法技术领域,特别是一种基于边缘计算的蓝牙耳机低延时音频处理方法,包括以下步骤:(1)对音乐源文件进行采样和编码,得到音频源文件;(2)将音频源文件进行预处理,获得训练样本和测试样本;(3)将训练样本输入云端...
  • 本申请公开了一种音频水印生成方法及相关装置,涉及人工智能技术领域,包括:获取输入音频,对输入音频进行声学特征分块与隐空间编码,得到输入音频的多个声学特征块分别对应的隐空间表示向量,将多个声学特征块分别对应的隐空间表示向量分别与水印信息编码向...
  • 本发明公开了一种基于AI声纹识别的鸟类声纹采集系统及装置,涉及鸟类声纹采集技术领域,包括:声学与环境数据采集单元,用于获取原始声学信号并同步采集环境物理参数;环境状态量化单元,用于量化生成环境胁迫因子;声源信号解耦单元,被配置为应用可修正的...
  • 本发明公开了一种基于投影仪的声纹投影方法、系统、终端及存储介质,所述方法包括:获取用户声纹数据,并进行预处理和特征提取处理,得到声纹特征向量;确定第一预设模型,并通过第一预设模型对声纹特征向量进行声纹鉴定处理,得到预测声纹年龄;确定第二预设...
  • 本发明涉及声音识别技术领域,尤其涉及基于多频带分析的声纹识别方法及装置,包括有数据准备与预处理、动态频带划分与特征提取、模型训练与优化、实时推理与部署以及评估与迭代;本发明相对于现有技术采用固定频带划分进行声纹特征提取,存在频带划分僵化、无...
  • 本发明公开了一种面向语音交互的多智能体任务协同处理系统及处理方法。系统包括:语音输入模块,用于接收并预处理来自用户的原始音频信号;语音处理模块,用于基于所述音频信号,利用深度神经网络模型,生成一个结构化的任务表示;任务协调模块,用于基于所述...
技术分类