Document
拖动滑块完成拼图
专利交易 积分商城 国际服务 IP管家助手 科技果 科技人才 商标交易 会员权益 需求市场 关于龙图腾 更多
 /  免费注册
到顶部 到底部
清空 搜索
最新专利技术
  • 本发明公开了一种云端协同的语音克隆方法、装置、服务器和介质。所述语音克隆方法通过将客户端采集的用户语音数据基于加密传输协议发送至云端服务器,由云端服务器提取不同的用户声纹特征,然后根据各用户声纹特征训练语音克隆模型,并基于训练好的语音克隆模...
  • 本申请实施例提供了一种歌声合成方法、歌声合成模型的训练方法及相关设备,其中,歌声合成方法,基于预训练的歌声合成模型,通过获取目标MIDI文件对应的帧级序列特征和目标音色特征;将所述帧级序列特征和所述目标音色特征输入所述声学模型,以使所述声学...
  • 本申请公开了一种交互方法、设备、存储介质和程序产品,涉及人工智能技术领域,包括:在至少基于监护人和孩子的交互冲突数据与孩子交互的过程中,如果获得孩子输入的反馈信息,在反馈信息是与交互冲突数据关联的第一类反馈信息的情况下,将第一类反馈信息发送...
  • 本公开实施例提供了一种数据处理方法、装置、电子设备、存储介质和程序产品。该方法包括:获取原始数据和目标对象的参考音频数据;采用语音生成模型依据所述原始数据的数据类型和所述参考音频数据对所述原始数据进行处理,得到目标频谱数据,其中,所述语音生...
  • 本申请公开了一种流式语音同传方法、相关设备及计算机程序产品,本申请对于实时获取的流式文本,从中确定当前待合成文本,并确定待合成文本的语义情况,语义情况表示了文本的语义完整程度。当确定流式文本产生积压的情况下,可以根据流式文本的积压程度和当前...
  • 本申请公开了文本转语音方法、电子设备及系统,涉及终端技术领域,可以解决常规技术中需要预先制作合成电子书对应的音频带来的成本高、周期长、占用存储大以及维护复杂的问题,提供更加高效、可靠、准确、低成本、低存储的文本内容的音频播放效果。本申请可以...
  • 本申请公开了一种语音发音与韵律评测方法及相关装置,涉及语音评测技术领域,评测方法包括:获取目标用户的待评测语音;对待评测语音提取表征语音内容的隐藏状态特征;利用预先训练得到的生成式声学模型,根据隐藏状态特征和目标用户的音色表征向量,生成个性...
  • 本申请实施例提供音频处理方法和装置,涉及终端技术领域。该方法包括:在第一场景中,每隔N帧音频信号,对电子设备采集的第一音频信号进行特征提取,并基于提取的第一音频特征进行音频识别,N与第一场景中预先收集的第一关键字有关,N为大于0的整数;在第...
  • 本申请涉及语音识别技术领域,具体涉及基于语音识别的沉浸式人机交互方法及系统,该方法包括:语音数据采集与基频提取;方言干扰量化评估;语势失调趋势分析;自适应学习率调整与模型优化。本申请旨在通过动态调整在线学习模型中的固定学习率,以根据方言特点...
  • 本公开实施例提供了一种语音转换方法、装置、电子设备、存储介质和程序产品。该方法包括:接收语音转换指令,并获取第一对象的原始音频数据和第二对象的参考音频数据;根据所述原始音频数据和所述参考音频数据确定与所述语音转换指令对应的目标语音特征,所述...
  • 本发明提供一种基于改进BiLSTM‑CRF模型的语义识别方法、装置及设备,涉及语义识别技术领域。该方法包括:对待识别语音信息进行数据提取得到待识别语义文本,将待识别语音信息输入至预设的情感特征提取模型中,得到待识别语音信息的情感特征;对待识...
  • 本发明涉及人工智能与边缘语音交互技术领域,具体公开了一种基于拟人拟音表达的异步社交方法。该方法通过语音采集、语义解析、内容生成、角色调度、情绪设定、表达确认及指定播报等步骤,实现用户之间以拟人角色进行情绪化异步语音沟通。用户可选择表达角色及...
  • 本公开提供了一种对话消息分析方法、装置、电子设备及存储介质,获取待分析的对话消息文件,并筛选语音消息组,将语音消息组进行预处理后生成目标语音文件;提取目标语音文件对应的语种类别信息、说话人属性信息、说话人情绪信息以及文本内容信息;根据语种类...
  • 本发明涉及物联网与人工智能融合的智能交互领域,公开了一种物联网AI智能交互方法、系统、网关设备及存储介质,包括:接收语音指令并解析指令意图;将指令意图分类为确定性控制、意图推理或非控制交互三种类型;若为确定性控制类型,则直接生成动作指令;若...
  • 本申请涉及一种屏幕共享状态下的语音控制方法及系统、存储介质、车辆,属于车辆多屏互动技术领域,所述方法包括:响应于用户在第一音区唤醒语音功能且第一屏幕处于共享状态,对所述第一屏幕共享的界面进行热词注册,得到与虚拟音区对应第一语音热词,所述第一...
  • 本发明公开了基于智能代理和工具扩展的智能语音交互方法及系统,涉及人工智能技术领域,终端设备捕获用户请求后由云端评估为简单任务或复杂任务,对简单任务直接进行领域意图逻辑处理,将复杂任务标记为需要协同处理;云端结合终端封装的工具清单对复杂任务进...
  • 本申请提供一种语音调节指令的执行方法及终端设备,方法包括:响应于用户对终端设备的语音调节指令,将语音调节指令转换为文本指令;通过文本指令识别用户的意图信息;在目标调节程度不包含数值的情况下,在意图程度映射表中查找与目标调节程度对应的目标调节...
  • 本申请实施例涉及语音识别技术领域,公开了一种语音识别方法及电子设备,语音识别方法包括:基于分块时长对目标语音数据进行分块,以得到多个语音片段,其中,多个语音片段用于按时序进行语音识别处理;生成补充数据,补充数据为非声数据;对多个语音片段和补...
  • 本申请公开了一种智能设备控制方法、装置、设备、存储介质及程序产品。其方法包括:获取用户的语音信息和环境参数,环境参数为用户所处环境中智能设备的参数;对语音信息进行识别,生成目标音频特征和目标文本特征;对目标音频特征和目标文本特征进行分析,确...
  • 本发明属于航空飞行训练技术领域,具体涉及了一多模块协同的飞行模拟机操纵面板及方法,解决现有系统交互效率低、评估主观、预警滞后、讲评耗时的问题。本发明依托传统IOS硬件,并设置:智能语音交互模块通过ASR识别教员语音,经意图识别与三级槽位补全...
技术分类