Document
拖动滑块完成拼图
首页 专利交易 IP管家助手 科技果 科技人才 积分商城 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
最新专利技术
  • 本发明涉及信号处理领域,尤其涉及一种基于非线性子空间表示学习的环境声音识别方法。本发明目的是现有的环境声音识别存在准确率低下的问题。提供了一种基于非线性子空间表示学习的环境声音识别方法。通过兼顾环境声音信号的内容与时序信息,来完整刻画其抽象...
  • 本发明提供了一种老年人模糊语音识别方法及系统,涉及语音数据处理技术领域,方法包括:构建清晰‑含混平行语料库;通过基于U‑Net架构的Diffusion模型,将含混语音数据转换为清晰语音数据;对Diffusion模型进行初步训练,得到初步Di...
  • 本发明公开了基于语音识别的智能老人语音助手系统及方法,涉及智能语音识别技术领域,用于解决当前现有系统缺乏动态适应机制,传统语音识别系统采用统一模型训练,往往无法考虑不同老年人的语音生理特征,如声带老化、发音模糊等问题;采用了基于MFCC(梅...
  • 本申请实施例公开通用音频大模型的改进方法、电子设备和存储介质,其中,一种通用音频大模型的改进方法,其中,所述通用音频大模型包括声学编码器和大语言模型基座,输入的音频经过频谱转换或提取特征后送入所述声学编码器中,提取高维的隐层表征,然后和文本...
  • 本申请公开了一种流式语音识别方法、设备、存储介质和程序产品,涉及语音处理技术领域,包括:对语音流逐语音片段进行编码;每得到一个语音片段的编码特征,获得当前解码时刻的解码状态对至少一个已编码语音片段的编码特征的注意力系数,得到注意力系数序列;...
  • 本申请实施例提供了一种语音的生成方法、装置、计算机设备、计算机可读存储介质、计算机程序产品,属于多媒体领域。该语音的生成方法包括:获取视频片段和基于视频片段语音识别得到的目标文本;将目标文本和视频片段作为模型输入,通过预先训练好的目标视觉语...
  • 本发明公开了一种多对话语音合成上下文韵律保持方法、装置、设备及介质,涉及金融、医疗、保险及银行等领域中的语音合成技术领域,包括:获取当前轮次的输入文本;从历史韵律缓存中获取历史韵律上下文信息,所述历史韵律上下文信息基于至少一轮历史对话的韵律...
  • 本申请公开了一种电子书音频生成方法、音频播放方法及相关装置,涉及电子书音频生成及播放技术领域,电子书音频生成方法包括:获取EPub电子书;从EPub电子书中找到spine元素,读取spine元素的目录属性;从资源清单中获取以目录属性为id的...
  • 本公开是关于一种语音生成方法、装置、电子设备、存储介质及产品。语音生成方法包括:获取用于进行语音生成的目标文本,其中,所述目标文本中包括表征副语言的第一词元;基于所述目标文本,生成包括副语言语音数据的目标语音数据,其中,所述副语言语音数据基...
  • 本申请涉及智能语音合成技术领域,提供了一种TTS语音情感强化方法、电子设备及存储介质,该方法包括:利用大型语言模型分析待合成的目标文本,根据期望强化的目标情感,生成带有引导情感的引导文本,并将其拼接至目标文本内;将拼接后的完整文本输入至TT...
  • 本公开提供了一种数据处理方法、数据处理装置、电子设备和存储介质,涉及数据处理技术领域,尤其涉及音频生成技术。实现方案为:获取用于音乐生成的生成条件;对生成条件对应的条件向量进行自回归编解码,以得到要生成的音频的参考混音特征;对条件向量和参考...
  • 本发明涉及多模态数据处理技术领域,具体为一种具备多模态数据处理与人格模拟的智能系统及实现方法,系统包括:数据处理模块、识别分析模块、语音合成模块、一致性模块、人格模拟模块。本发明中,通过采集的语音、图像与文本数据经过标准化处理,提取关键信息...
  • 本发明涉及语音处理技术领域,可应用于金融科技及医疗健康等业务场景中,公开了一种基于自适应迭代的语音生成方法、装置、设备及介质,包括:接收输入文本并解析得到文本长度和文本复杂度,根据文本长度和文本复杂度确定自适应采样步长,获取基于流匹配训练的...
  • 本发明公开了一种基于语音提示降噪的TTS语音合成方法、装置、设备及介质,涉及金融、医疗、保险及银行等领域中的语言合成领域,包括:采集原始语音提示,所述原始语音提示包含背景噪声;对所述原始语音提示进行噪声抑制处理,得到初步纯净语音提示;对所述...
  • 本公开提供了一种用于音效生成的模型训练方法、音效生成方法、装置及设备,属于人工智能技术领域。在本公开中,用于音效生成的模型包括音频编解码器和TTA模型。在模型训练过程中,本方案通过联合训练机制实现了音频编解码器与TTA模型的协同优化。即,本...
  • 本发明所提供的基于深度神经网络的主动降噪方法、系统、终端及介质,属于主动降噪技术领域,所述方法包括:通过参考麦克风实时采集噪音信号;得到当前时刻的主通道估计信号;将当前时刻的噪音信号和主通道估计信号经预处理后输入已训练的深度神经网络中,经处...
  • 本发明提出了一种适用于智能眼镜的音质和主动降噪优化系统及方法,该系统包括有耳麦和智能眼镜腿主体,智能眼镜腿主体包括有前馈麦克风一、前馈麦克风二、磁铁一、扬声器出音口、导电焊盘和铰链,耳麦包括导音管,其入口端与智能眼镜腿主体的出音口相连,出口...
  • 本发明提供了一种基于动态自适应滤波的激光沉积声学信号在线降噪方法及系统,方法包括:采集激光定向能量沉积过程中的原始声学信号;根据激光沉积路径,确定路径风险系数;获取当前时刻粉末流量,计算动态粉末冲击噪声掩膜;当风险系数大于阈值时,设置基础权...
  • 本发明涉及变电站环境保护技术领域,公开了变电站噪声时滞反馈主动抑制系统及方法和介质。包括:时滞估算模块用于采集噪声信号与振动信号,对噪声信号进行频谱分析识别出噪声源的频率,估算噪声信号与振动信号之间的时滞;噪声抑制计算模块用于根据估算得到的...
  • 本申请提供一种降噪处理方法、头枕、座椅及车辆,涉及降噪技术领域,该方法包括:接收来自噪声源采集装置的至少一个参考信号,以及来自N+M个误差麦克风采集的信号,从N+M个误差麦克风中筛选出未被干扰的至少P个误差麦克风,基于至少P个误差麦克风采集...
技术分类