Document
拖动滑块完成拼图
专利交易 商标交易 积分商城 国际服务 IP管家助手 科技果 科技人才 会员权益 需求市场 关于龙图腾 更多
 /  免费注册
到顶部 到底部
清空 搜索
最新专利技术
  • 本申请提供了一种语音唤醒方法、电子设备、计算机存储介质,语音唤醒方法包括:获取语音帧序列中唤醒标志帧的唤醒置信度;获取预设阈值组中的最大阈值;响应于唤醒置信度大于或等于最大阈值,唤醒成功;响应于唤醒置信度小于最大阈值,基于唤醒置信度、预设阈...
  • 本发明涉及语音识别技术领域,具体涉及一种学习机待机关键词识别方法及系统,方法包括:将音频信号经多通道二阶带通滤波分解为不同频带,通道输出整流获得包络信号;在预定帧长内对包络信号积分累加并取平均能量作为模拟特征,经模数转换得到按帧数字特征序列...
  • 本公开涉及一种用于语音增强的方法、训练神经网络模型的方法、用于语音增强的装置、电子设备及计算机可读存储介质。本公开基于编码向量和解码辅助向量来编码向量进行解码,其中,解码辅助向量融合有指示语音增强任务类型的任务提示信息和能够在信号级别实现语...
  • 本发明公开了一种基于语音识别的多语种全语音处理方法、设备及介质,涉及语音识别技术领域,包括,基于多语种语音特征集,计算语种显式轨迹,并通过历史会话中的语种偏好信息与语音片段进行关联构建语种隐式轨迹,整合生成语种权重轨迹;将语种权重轨迹划分为...
  • 本发明公开了基于Transformer自注意力机制的多方言语音识别方法,属于语音识别技术领域,该方法包括:获取多方言音频数据集并进行预处理和特征提取;利用方言拓扑空间映射模块构建方言特征的拓扑空间表示;将拓扑映射特征输入Transforme...
  • 本发明公开了一种韵律表现力语音合成方法,该方法设计了以改进VQVAE和改进UNet扩散网络为核心构建的韵律编码网络,以及对去噪扩散概率模型进行改进的去噪扩散概率模型(称为HarmoVDiff),使用了文本编码器、持续时间预测器、VAE编码器...
  • 本申请提出的语音合成方法、语音合成装置、电子设备及存储介质,涉及人工智能技术领域,适用于金融领域及医疗领域。该方法包括:获取目标文本,并确定目标文本所属的目标语言;获取样本语音集和属于目标语言的样本文本;通过初始语义建模器对样本文本和目标语...
  • 本申请公开了一种语音合成方法、装置、设备、存储介质及程序产品,属于人工智能技术领域。该方法包括:对文本单元序列进行分块处理,得到N个文本块;文本单元序列基于文本信息编码得到,每个文本块包括P个文本单元和L个占位符,N、P、L为正整数;针对每...
  • 本申请涉及一种语音播报方法及装置、智能设备与介质,所述方法包括:根据当前智能设备确定的待播报文本生成音素控制数据,其中包括待播报文本相对应的音素序列;将音素控制数据输入语音合成模型,由其中预设的声学模型以非自回归的并行处理方式,生成对应的梅...
  • 本申请提供了一种语音合成的方法,该方法包括:获取用户输入的目标文本,目标文本包括目标语种的至少一个单词,每个单词由辅音字母组成;根据目标文本,通过第一模型确定目标文本中至少一个单词的上下文语义信息;根据至少一个单词的上下文语义信息,通过第二...
  • 本申请公开了音频数据归档方法及相关设备,该方法包括:对第一音频进行切分,得到至少一个第二音频,第二音频为第一音频中包含人声的音频片段;将第二音频的音频特征与特征对比库中的音频特征进行匹配,得到第二音频对应的特征编号,特征对比库中包括音频特征...
  • 本发明涉及语音合成技术领域,公开了一种语音合成方法、装置、设备及存储介质。语音合成方法包括:获取待处理的文本数据与语音数据;将所述文本数据转换为文本分词序列,并提取所述语音数据的说话人嵌入特征和情感嵌入特征; 将所述文本分词序列、所述说话人...
  • 本发明公开一种基于多变量参数的个性化语音生成系统及方法,所述系统包括:接收模块,任务模块根据多变量参数和多变量参数取值生成参数映射表并合成话术任务;调度模块根据批次待合成话术任务所需达到的算力资源指标值以及算力资源投入选取并调度目标算力资源...
  • 本发明公开了一种基于零样本文本转语音模型的情绪控制增量微调方法、系统、设备及介质,该方法包括以下步骤:选择数据集,进行标准化预处理;对数据集的情绪标签进行扩展;调整文本的embedding层和head层的权重矩阵维度;初始化新增情绪标签权重...
  • 本申请提供一种语音合成、同声传译处理方法、设备及产品,该方法包括:获取待进行语音合成的包括多个文本特征帧的文本特征块;对多个文本特征帧中每个文本特征帧,基于当前文本特征帧对应的文本特征块及当前文本特征帧之前的历史文本特征帧对应的拼接语义编码...
  • 本申请提供一种语音合成方法、装置、设备及程序产品。方法包括:基于音频编解码模型的编码模块,对目标对象发音的参考语音样本进行编码处理,得到目标对象的音色特征。基于目标对象的音色特征和待合成文本的语义特征,生成待合成文本的语音token序列。基...
  • 本发明公开了一种电力语音生成方法、系统、存储介质及设备,涉及语音技术领域,该方法包括:采集电力行业的电力术语,根据电力行业的电力术语构建包含标准发音与语境标签的电力术语词典;根据电力术语词典,对输入文本进行术语优先的音素序列转换与语音生成,...
  • 本公开提供了一种导航语音在线生成方法、装置、电子设备及存储介质,涉及人工智能技术领域,具体涉及自然语言处理、文本到语音技术以及语音播报等技术领域。该方法包括获取待生成导航语音的播报文本,播报文本中包含至少一个整句;识别播报文本中整句的所属类...
  • 本发明涉及一种电动车辆低速提示音自定义混音方法、装置、设备及介质,方法包括:从预先构建的音源库中获取至少一个基础音源和至少一个自定义音源,基于至少一个基础音源生成基础音轨,并基于至少一个自定义音源生成多个独立音轨,通过预设的音源调整方法库中...
  • 本发明公开了一种船舶智能噪音控制的中央空调系统,包括声学数据采集系统、声学数据传输单元、中控计算管理中枢、声波重构与处理装置以及动态执行机构,声学数据采集系统、声学数据传输单元、中控计算管理中枢、声波重构与处理装置和动态执行机构依次连接。本...
技术分类