Document
拖动滑块完成拼图
专利交易 积分商城 国际服务 IP管家助手 科技果 科技人才 商标交易 会员权益 需求市场 关于龙图腾 更多
 /  免费注册
到顶部 到底部
清空 搜索
最新专利技术
  • 本申请公开了一种语音合成方法及相关装置、设备和介质,其中语音合成方法包括:基于待合成的第一子文本,提取得到第一子文本的第一文本词元特征,并获取第二子文本的第二文本词元特征和预测语音词元特征;基于各个第二子文本的第二文本词元特征和预测语音词元...
  • 本申请公开了一种词元推理方法、文本转语音的生成方法及其设备,设备包括文本转语音系统、计算机可读存储介质及计算机程序产品。该词元推理方法包括:在流匹配模型完成对词元的每次迭代推理之后,获取当前迭代推理的推理结果对应的当前特征值;基于当前特征值...
  • 本发明公开了一种安全加密的语音克隆方法、装置、设备和介质。所述语音克隆方法通过在先在客户端进行声纹提取,以发送声纹特征的形式向云端服务器发送用户语音信息,相比直接发送采集的用户语音数据更不容易造成用户声音信息的泄露。此外,在发送用户声纹特征...
  • 本公开提供了基于大模型的语音数据生成方法及训练大模型的方法,涉及人工智能技术领域,尤其涉及语音生成、智慧客服、视频制作等技术领域。基于大模型的语音数据生成方法包括:接收韵律描述文本和语音文本,韵律描述文本描述了对于语音文本中多个文本字的发音...
  • 本发明公开了一种基于共享潜空间语音编解码器的语音合成方法及系统,包括共享潜空间语音编解码器训练、语音合成模型训练和语音合成。本发明通过构建共享潜空间的统一编码框架,使用同一个语言编解码器可以得到离散语音编码和连续语音编码两种不同类型的语音编...
  • 本发明提供一种元音恢复方法、装置、电子设备和存储介质,属于自然语言处理技术领域,包括:获取第一待处理文本,第一待处理文本包括需要恢复元音的第一文本;将第一待处理文本输入至元音恢复模型进行多变音符标签同步预测,得到元音恢复模型输出的预测标签,...
  • 本申请公开了一种声音复刻方法及相关装置,涉及语音合成技术领域,包括:获取音频合成文本、目标参考音频和属性控制信息,获取属性控制信息中的至少一个属性对应的韵律特性信息,根据韵律特性信息和音频合成文本进行表征融合处理,得到韵律增强文本表征,根据...
  • 本申请公开了一种方言语音识别方法、存储介质及电子装置,涉及语音识别技术领域,该方言语音识别方法包括:对接收到的语音识别请求进行解析,得到语音识别请求对应的语音信号、方言标签以及预期响应时间;对语音信号和方言标签进行编码,得到编码序列;根据编...
  • 本发明公开了一种音频的声纹质检方法,该质检方法包括语音数据集构建、构建声纹质检网络、模型训练和声纹质检,语音数据集构建包括:基于已有的语音数据库,构建声纹质检数据集,此数据集包括多条的语音数据,以及对每条语音的多个维度评价,以及是否声纹质检...
  • 本申请实施例公开了一种语音数据处理方法、装置、设备及存储介质,应用于人工智能技术,该方法包括:获取N种空间的配置数据;根据N种空间的配置数据和单通道语音数据,生成N种第一模拟多音区语音数据;N种第一模拟多音区语音数据用于训练得到语音唤醒网络...
  • 本发明提供一种语音交互方法、装置、电子设备和存储介质,方法包括:获取实时语音流;在从实时语音流中检出唤醒词的情况下,从唤醒词在实时语音流中对应的语音片段中提取目标说话人的声纹特征;基于声纹特征与实时语音流的语音特征之间的相关性,对实时语音流...
  • 本申请公开了一种音频处理方法及相关装置,方法包括:对获取的第一音频片段进行语音活动检测;若第一音频片段为非语音数据,根据第一音频片段的时长确定第一连续非语音时长;若第一连续非语音时长大于或等于第一动态时长阈值,获取第一文本集合;根据第一文本...
  • 本发明的实施例提供了一种语音会话模型训练方法、语音会话处理方法及计算机程序产品,涉及大语言模型技术领域。通过构建待训练语音会话模型,待训练语音会话模型包括音频编码层、特征投影层、大语言模型以及工具调用解码头;工具调用解码头用于生成结构化的外...
  • 本申请属于语音处理技术领域,具体公开了一种基于多模态和窗口注意力机制的语言不流畅检测方法,该方法包括:构建检测模型,所述检测模型用于:将输入音频转化为文本和时间戳信息;提取输入音频的声学特征和文本的语义特征,并将所述时间戳信息转化为停顿向量...
  • 本发明提供了一种多说话人的对话分析方法,涉及人工智能领域。本发明提供的方法包括:基于轻量级与高精度语言模型的协作对原始数据集进行标注以生成训练集,并利用该训练集训练自然语言处理模型;对目标音频进行说话人日志分析以获得初步转录稿,从中提取核心...
  • 本申请实施例公开了一种意图识别方法、装置以及电子设备。该方法包括:获取待识别信息;基于待识别信息和多个自然语言理解模型,得到多个预测意图和多个预测意图各自对应的槽位数量;若多个预测意图存在不同,基于多个预测意图各自对应的槽位数量,得到意图识...
  • 本申请提供了一种多模态语音交互方法、装置及智能设备,适用于智能语音交互技术领域,应用于智能设备,方法包括:响应于检测到的语音活动,提取语音活动中的第一语音数据,并获取与第一语音数据同步拍摄的视频数据,视频数据中拍摄有多个不同用户。从视频数据...
  • 本申请提供了一种语音识别方法、装置、电子设备和计算机可读存储介质,可以应用于语音识别技术领域。该方法包括:响应于接收到来自电力施工现场的语音信号,通过对降噪后的语音信号进行能量分布特征与谱熵特征的联合分析,从降噪后的语音信号中提取目标语音信...
  • 本发明适用于语音识别与智能风控交互技术领域,提供了一种基于人工智能的语音数据识别方法及系统,所述方法包括:确定客服的未来用户的特定用户画像,并获取客服的历史语音沟通数据,以及针对未来用户生成的若干风险提示片段。本发明通过引入人工智能技术对历...
  • 本公开公开了一种内容生成方法、装置、存储介质及电子设备,涉及内容生成技术领域,包括:通过至少一个采集设备获取目标用户基于当前阅读内容的多维度输入数据,其中,目标用户是具有目标感知需求的用户;确定多维度输入数据对应的至少一个指令信息;对至少一...
技术分类