Document
拖动滑块完成拼图
首页 专利交易 IP管家助手 科技果 科技人才 积分商城 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
最新专利技术
  • 本申请提供了一种多模态融合语音降噪方法、装置、电子设备及存储介质,包括:采集多模态信号,并对多模态信号进行数据对齐,以得到同步数据流,其中,多模态信号包括AC麦克风信号、BC麦克风信号和IMU信号;通过对两路AC麦克风信号进行气导差分降噪,...
  • 本申请提供一种语音增强方法、神经网络训练方法、装置、设备及介质,涉及语音处理技术领域,通过进行语音环境复杂度分析,确定语音数据对应的噪声估计值,在噪声估计值大于目标阈值的情况下,采用图像辅助语音增强,能够根据语音环境复杂度,有针对性地确定是...
  • 本申请公开了一种语音增强方法及相关装置、设备和存储介质,其中,语音增强方法包括:获取语音交互过程中的麦克风信号和扬声器信号;基于麦克风信号进行特征编码,得到第一音频特征,并基于扬声器信号进行特征编码,得到第二音频特征;基于第一音频特征和第二...
  • 本发明提供了一种基于自适应聚类扩散的变源语音分离方法及系统,属于语音分离技术领域。其方法包括:获取混合语音信号,生成与混合语音信号嵌入维度相同的噪声源嵌入;将混合语音信号和噪声源嵌入输入预先构建的自适应聚类扩散模型,输出分离出的干净语音信号...
  • 本公开涉及音频处理领域,包括基于多支路SRU的轻量级因果音视频语音分离方法及装置。通过G路双向SRU和H路单向SRU构建第一因果分离单元来处理音频特征,并构建第二因果分离单元来提取融合特征,其中,每路双向SRU可以确定每帧特征数据在频率维度...
  • 本发明提出了一种基于AI的实时人声消除与伴奏提取系统,该系统包括音频输入接口模块;音频预处理模块;AI人声分离模块,包括有预训练的深度神经网络模型;实时音频处理引擎,包括有数字信号处理器;伴奏输出接口模块;系统控制模块;本发明通过采用基于U...
  • 本发明公开一种低复杂度的基于时频分离卷积的声学场景分类方法及装置,基于时频分离卷积的声学场景分类方法,包括:获取待分类声音信号的声学特征;将获取的声学特征输入构建的基于时频分离卷积的声学场景分类模型,输出声学场景分类结果。本发明能够独立捕获...
  • 本发明属于楼宇对讲领域,尤其是一种对讲系统中的音频补偿的方法,包括以下步骤:S1:先填充2个空的静音帧;S2:设置统计标志位,其是为了保证音频刚建立通话的时候进入S4记录起始时间;S3:判断统计标志是否置位,如果统计标志置位则进入S4,统计...
  • 本发明提供了一种基于正常样本频谱归一化的电机缺陷声学特征增强与可视化方法、系统及存储介质,方法包括:步骤1:建立标准合格样本数据库与计算归一化向量;采集同型号合格电机在标准工况下运行时的音频信号,经傅里叶变换后进行统计分析,得到频域强度归一...
  • 本公开的实施例提供一种用于音频合成的方法、装置、设备和介质。一种方法包括:向服务端设备发送针对目标文本的音频合成请求,音频合成请求至少包括第一片段合成请求,第一片段合成请求至少指示要请求的第一音频片段对应的起始位置;从服务端设备接收将目标文...
  • 一种基于声纹识别多用户智能场景响应和服务推送方法及系统,在该方法中,提取用户语音信息中的声纹特征数据;确定目标用户的身份信息;从预设用户关系数据库中获取关联用户信息;根据目标用户的身份信息、关联用户信息及环境参数信息建立动态场景模型;基于动...
  • 本公开提供了一种基于神经网络的风机叶片故障检测方法及系统,涉及风力发电机健康监测领域,包括:获取待检测风力发电机叶片的多通道声音信号,并进行预处理;将预处理后的多通道声音信号输入到训练后的故障检测模型中进行故障检测,得到故障等级信息;其中,...
  • 本申请提供一种基于人工智能的对话关键信息提取方法、装置、设备及介质,属于人工智能领域,该方法包括:获取待提取关键信息的语音数据和语音数据匹配的预设提示词库;通过预设的实体识别模型对语音数据和预设提示词库进行实体识别,得到实体信息;通过预设的...
  • 本发明涉及神经声学技术领域,具体来说是个性化脑波诱导音频生成方法及系统,包括:步骤S1、提取输入音频信号的多维特征,提取的维度至少包括时域特征、频域特征、音高特征、情感特征及复杂特征;步骤S2、基于S1步骤提取的所述多维特征,并行计算四种神...
  • 本发明提出了一种基于声纹特征与振动数据融合的电站辅机故障诊断方法,包括:提取样本数据集中的声纹和振动及运行工况参数的特征信息,并对特征信息进行增强,生成样本增强后特征集;拼接融合声纹与振动特征输入至初级故障诊断模型中,输出初级故障概率;将声...
  • 本发明公开一种基于空间坐标注意力机制的合成语音检测方法及装置,基于空间坐标注意力机制的合成语音检测方法,包括:获取待检测语料的声学特征;将获取的声学特征输入构建的基于空间坐标注意力的合成语音检测模型,输出合成语音检测结果。本发明可以捕获输入...
  • 本申请属于人工智能检测技术领域,涉及基于多维度解释的语音检测方法及其相关设备,通过获取待检测语音数据;输入到微调训练完成的语音检测模型;提取待检测语音数据包含的声学特征;对待检测语音数据进行文本化转换处理,得到语音文本数据;将声学特征和语音...
  • 本申请公开了一种语音和文本的匹配方法、系统、装置、介质和程序产品,语音和文本的匹配方法包括:获取用户的语音数据;将语音数据转换为文本数据;将文本数据与预设的文本库进行全文本适配;若未适配成功,则将文本数据与文本库进行文本模糊匹配;若全文本适...
  • 本申请实施例提供了一种基于声纹的唇同步检测方法和装置、电子设备及存储介质,属于人工智能技术领域,适用于金融科技场景。该方法包括:获取目标对象的声纹注册音频;基于声纹注册音频进行声纹提取,得到注册声纹数据;获取目标对象的面审音视频;对面审音视...
  • 本申请涉及语音识别技术领域,特别涉及一种基于通用对抗扰动的说话人验证模型对抗训练方法及系统,其中,方法包括:获取指示标签和固定长度的随机高斯噪声;根据指示标签,利用对抗扰动生成器将随机高斯噪声变换为通用对抗扰动,并将通用对抗扰动以不同方式添...
技术分类