Document
拖动滑块完成拼图
专利交易 积分商城 国际服务 IP管家助手 科技果 科技人才 商标交易 会员权益 需求市场 关于龙图腾 更多
 /  免费注册
到顶部 到底部
清空 搜索
最新专利技术
  • 本申请实施例公开了一种意图识别方法、装置以及电子设备。该方法包括:获取待识别信息;基于待识别信息和多个自然语言理解模型,得到多个预测意图和多个预测意图各自对应的槽位数量;若多个预测意图存在不同,基于多个预测意图各自对应的槽位数量,得到意图识...
  • 本发明提供了一种多说话人的对话分析方法,涉及人工智能领域。本发明提供的方法包括:基于轻量级与高精度语言模型的协作对原始数据集进行标注以生成训练集,并利用该训练集训练自然语言处理模型;对目标音频进行说话人日志分析以获得初步转录稿,从中提取核心...
  • 本申请属于语音处理技术领域,具体公开了一种基于多模态和窗口注意力机制的语言不流畅检测方法,该方法包括:构建检测模型,所述检测模型用于:将输入音频转化为文本和时间戳信息;提取输入音频的声学特征和文本的语义特征,并将所述时间戳信息转化为停顿向量...
  • 本发明的实施例提供了一种语音会话模型训练方法、语音会话处理方法及计算机程序产品,涉及大语言模型技术领域。通过构建待训练语音会话模型,待训练语音会话模型包括音频编码层、特征投影层、大语言模型以及工具调用解码头;工具调用解码头用于生成结构化的外...
  • 本申请公开了一种音频处理方法及相关装置,方法包括:对获取的第一音频片段进行语音活动检测;若第一音频片段为非语音数据,根据第一音频片段的时长确定第一连续非语音时长;若第一连续非语音时长大于或等于第一动态时长阈值,获取第一文本集合;根据第一文本...
  • 本发明提供一种语音交互方法、装置、电子设备和存储介质,方法包括:获取实时语音流;在从实时语音流中检出唤醒词的情况下,从唤醒词在实时语音流中对应的语音片段中提取目标说话人的声纹特征;基于声纹特征与实时语音流的语音特征之间的相关性,对实时语音流...
  • 本申请实施例公开了一种语音数据处理方法、装置、设备及存储介质,应用于人工智能技术,该方法包括:获取N种空间的配置数据;根据N种空间的配置数据和单通道语音数据,生成N种第一模拟多音区语音数据;N种第一模拟多音区语音数据用于训练得到语音唤醒网络...
  • 本发明公开了一种音频的声纹质检方法,该质检方法包括语音数据集构建、构建声纹质检网络、模型训练和声纹质检,语音数据集构建包括:基于已有的语音数据库,构建声纹质检数据集,此数据集包括多条的语音数据,以及对每条语音的多个维度评价,以及是否声纹质检...
  • 本申请公开了一种方言语音识别方法、存储介质及电子装置,涉及语音识别技术领域,该方言语音识别方法包括:对接收到的语音识别请求进行解析,得到语音识别请求对应的语音信号、方言标签以及预期响应时间;对语音信号和方言标签进行编码,得到编码序列;根据编...
  • 本申请公开了一种声音复刻方法及相关装置,涉及语音合成技术领域,包括:获取音频合成文本、目标参考音频和属性控制信息,获取属性控制信息中的至少一个属性对应的韵律特性信息,根据韵律特性信息和音频合成文本进行表征融合处理,得到韵律增强文本表征,根据...
  • 本发明提供一种元音恢复方法、装置、电子设备和存储介质,属于自然语言处理技术领域,包括:获取第一待处理文本,第一待处理文本包括需要恢复元音的第一文本;将第一待处理文本输入至元音恢复模型进行多变音符标签同步预测,得到元音恢复模型输出的预测标签,...
  • 本发明公开了一种基于共享潜空间语音编解码器的语音合成方法及系统,包括共享潜空间语音编解码器训练、语音合成模型训练和语音合成。本发明通过构建共享潜空间的统一编码框架,使用同一个语言编解码器可以得到离散语音编码和连续语音编码两种不同类型的语音编...
  • 本公开提供了基于大模型的语音数据生成方法及训练大模型的方法,涉及人工智能技术领域,尤其涉及语音生成、智慧客服、视频制作等技术领域。基于大模型的语音数据生成方法包括:接收韵律描述文本和语音文本,韵律描述文本描述了对于语音文本中多个文本字的发音...
  • 本发明公开了一种安全加密的语音克隆方法、装置、设备和介质。所述语音克隆方法通过在先在客户端进行声纹提取,以发送声纹特征的形式向云端服务器发送用户语音信息,相比直接发送采集的用户语音数据更不容易造成用户声音信息的泄露。此外,在发送用户声纹特征...
  • 本申请公开了一种词元推理方法、文本转语音的生成方法及其设备,设备包括文本转语音系统、计算机可读存储介质及计算机程序产品。该词元推理方法包括:在流匹配模型完成对词元的每次迭代推理之后,获取当前迭代推理的推理结果对应的当前特征值;基于当前特征值...
  • 本申请公开了一种语音合成方法及相关装置、设备和介质,其中语音合成方法包括:基于待合成的第一子文本,提取得到第一子文本的第一文本词元特征,并获取第二子文本的第二文本词元特征和预测语音词元特征;基于各个第二子文本的第二文本词元特征和预测语音词元...
  • 本发明涉及声学功能器件技术领域,公开了一种基于三维径向梯度折射率声子晶体结构的声学黑洞透镜及设计方法,构建具有中心汇聚特性的三维径向梯度折射率分布函数n(r),使入射声波在传播过程中被连续引导并高效聚焦至透镜中心;结合增材制造工艺的可行性约...
  • 本发明属于自动控制技术领域,具体涉及基于声场优化的大跨度椭球形玻璃结构空间降噪方法,所述方法包括:步骤1:在椭球形玻璃结构内通过声波发生器发送一个样本噪声,建立一个声波传播模型来描述样本噪声在椭球形结构中的行为,得到入射声场;步骤2:过分析...
  • 本发明提出一种变电站特定频率噪声主动控制方法及系统。属于变电站噪声控制技术领域。该方法包括:收集变电站的原始噪声信号;对变电站以50Hz基波及100Hz、150Hz等谐波为主的低频噪声信号中的多个目标频率进行专属增益调节;对调节后的各单频信...
  • 本发明涉及环境降噪技术领域,公开了一种电器设备的降噪方法、装置及电器设备,方法包括:获取电器设备所处外部空间内的环境声音信息;对环境声音信息进行分析,确定环境声音信息中噪声信息所对应的原始声波信号;根据原始声波信号生成反相声波信号,以使电器...
技术分类