Document
拖动滑块完成拼图
专利交易 积分商城 国际服务 IP管家助手 科技果 科技人才 商标交易 会员权益 需求市场 关于龙图腾 更多
 /  免费注册
到顶部 到底部
清空 搜索
最新专利技术
  • 本申请涉及一种基于端侧语音识别的特征提取方法、电子设备及可读介质,其中,方法包括:获取待识别的目标语音波形,并提取目标语音波形的FBank特征矩阵;通过注意力机制识别与FBank特征矩阵对应的音频内容特性,并确定与音频内容特性匹配的帧率压缩...
  • 本申请涉及车辆技术领域,公开了一种车载NLU控制方法、装置、电子设备、存储介质及车辆。方法包括:采集用户指令语音,并将用户指令语音转换为用户指令文本;根据用户指令文本、调用动态提示词工程生成意图域召回用提示词;依据意图域召回用提示词、调用预...
  • 本发明涉及语音识别领域,具体为一种基于深度残差卷积神经网络的语音精准识别方法,包括采集高噪声环境下的原始语音信号,先通过小波变换阈值算法对含噪语音信号进行降噪处理,再提取语音的Mel频率倒谱系数及归一化能量熵特征,最后利用深度残差卷积神经网...
  • 本发明公开了一种面向泵站控制的语音识别优化方法,涉及语音识别技术领域,包括采集泵站控制环境的特定词汇语音数据,并对所述特定词汇语音数据进行预处理,生成Fbank语音特征向量;基于迁移学习构建声学模型,使用所述Fbank语音特征向量对所述声学...
  • 本发明提供一种音频处理方法、装置、车机及介质,涉及车载音频技术领域,该方法包括对至少两路音频信号进行唤醒词检测;至少两路音频信号包括车外音频信号及车内音频信号;检测到唤醒词,对音频信号进行干扰消除,得到车外音频信号的第一目标音频信号及车内音...
  • 本公开提供一种编码器训练方法、视听语音识别方法及其装置、存储介质。编码器训练方法包括:提取音频样本的第一特征序列;将第一特征序列输入具有自注意力机制的编码器,以便编码器利用自注意力机制捕捉第一特征序列的长距离依赖关系,以生成第二特征序列;将...
  • 本发明提供一种基于自适应动态规划的语音识别优化方法及系统,涉及语音识别技术领域。该方法首先获取语音数据,并对获取的语音数据进行预处理,构建声学特征序列;然后构建声学状态转移模型,将语音识别过程建模为一个有限时域的最优控制问题,确定优化目标和...
  • 本发明公开了一种基于大语言模型的连续语音识别方法、系统与终端,所述方法包括:获取语音信号,并对所述语音信号进行分帧预处理和特征提取,得到短时能量和过零率;根据所述短时能量和所述过零率进行动态静音检测,得到触发音频流;确定端到端语音识别模型,...
  • 本申请涉及车辆测试技术领域,公开了一种车辆座舱语音测试方法、设备及存储介质,包括:获取语音测试用例,并对语音测试用例处理以得到编码向量序列;对编码向量序列进行解码处理,获取当前解码时间步的查询参数值,基于查询参数值得到注意力权重,并基于注意...
  • 本发明提供了一种车载语音泛化自动化测试方法、装置和电子设备。其中,该方法包括:配置规则数据;其中,规则数据的内容包括:测试场景手工动作和话术的对应关系;收集泛化数据样本;收集云端未识别的语义话术;通过自然语言处理的方式,基于规则数据、泛化数...
  • 本申请适用于语音检测技术领域,提供了一种语音检测方法、模型训练方法、终端设备及可读存储介质,包括:获取待检测的语音数据;获取第一语音检测模型;其中,所述第一语音检测模型为根据训练后的第二语音检测模型进行等效转换后的模型;所述第一语音检测模型...
  • 本发明公开了基于大模型驱动的方言识别与情感反馈多模态交互系统,涉及智能人机交互技术领域,系统包括方言情感交互引擎、物品情境分析模块及情境自适应响应模块,可解决现有技术中方言情感传递失真与情境理解割裂问题。方言情感交互引擎通过发音解耦架构生成...
  • 本发明涉及一种基于多语言自适应的听障语音转换与生成方法,属于语音处理与人工智能领域。本发明本发明将多种语言的听障语音转换为标准语音,方便与听障人士正常沟通。本发明提取听障语音声学特征并与目标语言音素对齐,将声学特征输入语音适配模型,生成标准...
  • 本发明涉及语音识别技术领域,具体公开了一种基于大模型的粤中英混合识别技术。用户通过小程序绑定设备,创建对话配置和呼出配置,推送至设备端。设备端按设定时间拨打电话给客户,播放预设问题并录制客户回答的语音。语音识别模型将粤语、普通话和英语的混合...
  • 本申请公开了一种语音处理方法、装置、电子设备和存储介质,通过基于在用户执行目标设备的维护任务过程中所采集到的任务关联数据,确定用户情绪;基于用户情绪以及任务关联数据,确定文本内容;基于用户情绪,确定用户所偏好的目标音色对应的目标语音模型与用...
  • 本申请提出一种语音合成方法及相关装置,涉及语音合成技术领域。所述语音合成方法包括:获取目标历史交互语音的第一情感特征;根据所述第一情感特征、历史交互文本以及目标文本,预测待生成的目标语音的第二情感特征;其中,所述历史交互文本为与所述目标历史...
  • 本发明涉及语音合成检测技术领域,尤其涉及一种基于多模态的语音合成检测方法,包括:提取语音音频信号以及视频模态信号在不同信号点的关键音频检测特征、关键视频检测特征,基于关键音频检测特征、关键视频检测特征分别将语音音频信号以及视频模态信号划分为...
  • 本公开涉及语音合成方法、装置、电子设备、存储介质和程序产品。该方法包括:获取目标文本;响应于确定目标文本的文本特征序列中存在目标文本单元,基于目标文本单元对应的发音标注单元对文本特征序列进行调整,目标文本单元为符合预设条件的文本单元;根据目...
  • 本发明公开了基于因果对齐的语音与场景声联合生成方法及系统,其方法包括:获取多模态输入信息;对多模态输入信息进行双流自回归处理,生成语音特征序列和场景声特征序列,语音特征序列中各语音特征单元由发声特征信息、语音内容信息及历史语音特征单元协同确...
  • 本申请涉及一种零样本语音合成方法、装置、计算机设备、存储介质和程序产品, 方法包括:根据参考语音以及目标文本,获得目标编码特征;将目标编码特征输入至流匹配模型,获得条件速度场和无条件速度场;将目标编码特征输入至先验模型,获得先验语音特征;根...
技术分类