Document
拖动滑块完成拼图
专利交易 商标交易 积分商城 国际服务 IP管家助手 科技果 科技人才 会员权益 需求市场 关于龙图腾 更多
 /  免费注册
到顶部 到底部
清空 搜索
最新专利技术
  • 本发明涉及会话处理技术领域,具体涉及会话处理方法、装置、电子设备及目标车辆。接收目标用户输入的当前目标会话;对当前目标会话进行语义解析,确定当前目标会话对应的目标会话处理模型;基于目标会话处理模型,对当前目标会话进行处理。根据确定的模型进行...
  • 本发明涉及语音处理技术以及人机交互技术领域,公开了一种人机交互装置、控制方法及人机交互系统,包括以下步骤:采集原始音频流;对采集的原始音频流进行分析;计算各声源的空间方位,并追踪原始音频流的能量梯度变化;执行声源分离操作获取独立语音流;提取...
  • 本申请涉及一种语音识别方法、装置、设备、介质和产品。方法包括:获取待识别的目标语音,将目标语音输入至训练完毕的语音识别模型中,通过语音识别模型中的语音音素模型,计算目标语音在各时刻下音素的概率分布,并对每一时刻的概率分布结合预设的宽度进行采...
  • 本发明涉及一种音频数据标记的生成方法及设备。本发明采用在大型数据集上预训练的深度卷积神经网络进行特征提取,能够自动学习并提取音频中鲁棒的、高层次的抽象特征,显著提升了标记的准确性和对复杂场景的泛化能力。通过引入置信度筛选机制,过滤掉不可靠的...
  • 本发明公开了一种基于语音任务的大模型训练方法、装置、介质及设备。属于语音模型领域,本申请通过获取语音任务的任务描述数据、基准模型参数及实验目标,利用检索增强生成技术在预设知识库中检索相关技术知识数据,并结合历史实验记录构建结构化提示词输入大...
  • 本公开涉及人工智能领域,尤其是提供了一种音频安全监控方法、装置、电子设备和计算机程序产品。方法包括:实时获取音频数据流;对音频数据流进行分段处理,生成多个采集时长对应的分段音频数据;基于预设规则,对多个采集时长对应的分段音频数据中的每一个进...
  • 本申请实施例公开了一种语音处理方法、智能手表、存储介质及程序产品,用于在和对方用户沟通时,可以在智能手表上显示对当前声音信息进行关键信息提取得到的当前关键内容信息,从而辅助当前用户理解对方用户的沟通内容。本申请实施例方法应用于智能手表,所述...
  • 本发明公开了一种基于强化学习与思维链的细粒度多维语音评估方法及系统,属于人工智能与语音信号处理技术领域。为预设的多个语音质量评估维度设计批量的结构化评估问题,得到包含语音‑问题对的训练集,采用预训练的大型语言模型进行思维链标注;采用训练集及...
  • 本发明涉及两级语音韵律迁移。一种方法包括:接收要合成为具有预期韵律和目标话音的表达性语音的输入文本话语;以及使用第一文本到语音模型来生成输入文本话语的中间合成语音表示。该中间合成语音表示拥有预期韵律。该方法还包括:将中间合成语音表示提供给第...
  • 本发明涉及语音处理技术领域,可应用于金融科技及医疗健康等业务场景中,公开了一种基于频段调整的语音生成方法、装置、设备及介质,包括:获取情感参考语音与中性参考语音并确定情感向量;获取输入文本,通过文本到语音模型生成中间声学特征;将中间声学特征...
  • 本发明提供一种基于字符组件建模的满语语音合成方法及装置,涉及语音合成技术领域。方法包括 : 将满文按转写规则转换为拉丁字符,生成字符嵌入序列,并基于满语发音声学特性生成含基频、音高带等维度的特征模板,将二者拼接为高维输入张量,送入预训练时长...
  • 一种基于多阶段空间想象的沉浸式语音生成方法,包括:对输入的不完整场景图像进行空间想象,生成包含声学相关属性的结构化文本描述;将结构化文本描述编码为文本空间特征,并将场景图像提取局部图像块特征,将二者线性映射并拼接,形成完整空间表示;对输入文...
  • 本申请实施例提供了一种文本转语音的方法及装置,涉及语音合成技术领域。包括:接收用户对视频编辑界面中的第一文本输入的语音转换操作,语音转换操作用于基于预配置语音合成参数对第一文本进行语音转换;根据预配置语音合成参数和所述第一文本确定第一存储空...
  • 本公开提供了一种人声定制模拟与歌曲生成方法及系统。应用于音频处理技术领域,所述方法包括获取不同歌手的声乐数据、声乐文本、评价指标作为样本集;将预处理后的样本集进行特征提取得到四象特征和语境特征;利用四象特征和语境特征对四象映射模型进行训练,...
  • 本申请实施例提供一种语音处理方法、装置、设备、存储介质及程序产品。该方法包括:获取语音信号;对语音信号进行信号处理,得到第一时频信号;对第一时频信号进行自适应化归一化处理,得到第一特征图;对第一特征图进行双维建模处理,得到第二特征图;对第二...
  • 本发明公开了一种语音合成方法、装置、设备及介质,包括:获取待进行语音合成的目标文本数据,对目标文本数据进行公式识别,得到包含公式的混合文本,针对任一混合文本,将混合文本输入目标文本转换模型中,通过目标文本转换模型对混合文本中的公式进行文本转...
  • 本公开涉及音频处理技术领域,具体提供了一种语音合成的方法、装置、电子设备、存储介质及程序产品。其中,该方法包括:基于低秩自适应技术构建以及训练音色克隆子模型,并将训练好的音色克隆子模型与本地基础子模型进行组合获得语音合成模型,以及通过语音合...
  • 本申请实施例提供一种车载降噪方法、装置、设备、存储介质及程序产品,涉及汽车降噪领域。该方法包括:获取目标车辆的动态参数、噪音数据及对象基准参数;基于动态参数及噪音数据,对预判噪声建模,得到预判噪音特征;基于基准参数及预判噪音特征,生成反向声...
  • 本发明公开了一种基于等离子体的阻抗匹配控制降噪装置及方法,属于降噪领域。该降噪装置包括电晕放电模块、阻抗终端、声压监测模块、高压电源模块和控制模块;电晕放电模块包括高压极、低压极和绝缘框架;阻抗终端与电晕放电模块紧密连接,共同形成吸声腔体;...
  • 本发明属于声学控制技术领域,涉及一种基于多级LMS滤波的分布式多路协同声学作动控制方法、系统及存储介质,旨在解决现有发声技术总级低、低频峰值响应不足、定量分析弱、无实时反馈的问题。系统包含实时控制计算机、多通道数据采集系统、自适应功率放大阵...
技术分类