Document
拖动滑块完成拼图
专利交易 积分商城 国际服务 IP管家助手 科技果 科技人才 商标交易 会员权益 需求市场 关于龙图腾 更多
 /  免费注册
到顶部 到底部
清空 搜索
最新专利技术
  • 本发明涉及语音识别技术领域,公开了一种基于自然语言处理的蓝牙耳机语音识别方法及系统,通过提取依据蓝牙耳机采集的语音信号的特征向量;将特征向量输入DTW‑ECAPA‑Transformer模型,通过轻量化前端卷积模块提取局部时频特征,经DTW...
  • 本申请提供一种会话分轨方法、装置、电子设备及存储介质,该方法包括:获取在多个对象说话时所录制的音视频数据,多个对象中包括具有构音障碍的目标对象;对音视频数据中的音频数据进行处理得到文本数据以及语音嵌入数据,文本数据中携带有构音状态信息;对音...
  • 本申请公开了一种语音个性化引导方法、系统及程序产品,涉及车辆技术领域,所述方法包括:将预处理后的数据作为大模型输入数据,让大模型给出用户痛点、原因以及用户行为习惯,并让大模型配套生成语音引导场景和策略;基于用户基本数据,结合大模型对用户行为...
  • 一种面向医学检查的实时语音流关键信息提取方法,属于人工智能与医疗信息技术领域,通过非敏感医疗语料与通用语料采集,结合风格导向的提示控制机制驱动大语言模型生成多样化仿真语料,构建医学检查领域扩展基础语料集;对语料进行规范化和筛选,形成高质量语...
  • 本发明属于人工智能技术领域,本发明公开了一种基于人工智能技术辅助的教育咨询服务方法,包括:获取教育咨询场景下的原始语音数据,通过时频掩蔽处理去除背景噪声,获得高质量的去噪语音数据;对去噪语音数据进行文字转录,利用预构建的术语索引库进行自适应...
  • 本申请公开了一种智能语音交互方法,包括:将用户语音输入语音自动识别ASR模型,提取语音文本;判断语音文本中是否存在自定义热词:在存在自定义热词的情况下,基于对比模型判断是否采用领域指令替换所述自定义热词;若采用领域指令替换所述自定义热词,则...
  • 本发明涉及一种基于深度集成安全会议系统的语音转写及纪要生成方法,属于语音转写与纪要生成技术领域,解决了传统语音转写与纪要生成技术效率低下、信息遗漏、存在安全隐患的问题。包括语音识别客户端采集音频,并通过音频发送线程将采集到的音频发送到语音识...
  • 本申请实施例适用于人工智能技术领域,提供了人工智能音频检测方法、电子设备及计算机程序产品,所述方法包括:获取待检测音频;提取所述待检测音频的多个音频特征向量;在任一所述音频特征向量与预设摩斯码匹配的情况下,确定所述待检测音频为人工智能音频;...
  • 本申请涉及语音关键词检测的技术领域,尤其涉及一种语音关键词的抗噪检测方法、装置、设备及存储介质。包括:将原始音频信号进行声学特征提取,得到声学特征序列;结合目标音素序列和声学特征序列计算注意力权重向量;基于注意力权重向量对声学特征序列进行加...
  • 本申请公开了一种多方言多模态数据智能化生成与全维度评估系统,所述系统包括:数据生成子系统,用于对用户输入的任务提示词分析,以获得对话指令,基于所述对话指令生成对话文本;并对所述对话文本进行方言转译,获得方言文本;基于所述方言文本生成方言语音...
  • 本发明涉及语音合成技术领域,可应用于金融科技、医疗健康等业务系统平台中,公开了一种语音合成方法、装置、设备及介质,包括:利用预设的自监督模型根据预先获取的带噪参考音频生成语义条件嵌入,对所述带噪参考音频进行语音增强处理,得到初步增强音频,利...
  • 本发明公开了个性化鼾声掩蔽音频合成系统及方法, 属于音频信号处理技术领域,该系统包括鼾声特征提取模块、心理声学分析模块、音频生成模块和动态调整模块。系统识别环境音频中的鼾声片段并提取频谱特征, 基于心理声学模型分析临界频带分布并计算掩蔽能量...
  • 本申请实施例涉及人工智能技术领域,尤其涉及一种音频生成模型的训练方法及音频生成方法。本申请提供一种音频生成模型的训练方法及音频生成方法,该音频生成模型的训练方法包括:通过预训练模型对音频样本集进行编码,获得编码特征;通过待训练模型对编码特征...
  • 本发明公开了基于多模态情感语音合成的站群文章智能播报系统及方法,涉及语音合成技术领域,包括:提取段落级语义与情绪特征,并对语义与情绪特征进行维度映射,生成情感补偿参数集合;基于情感补偿参数集合,将前序文本段落韵律预测阶段产生的隐层状态特征按...
  • 本发明涉及语音合成与人工智能语音生成领域,特别是一种基于一致性调优的语音合成方法。该方法针对扩散语音模型推理效率低、训练复杂且依赖教师模型的问题,在扩散建模框架中引入一致性调优机制,使模型在不同噪声时间步下输出保持一致,实现无需教师模型的一...
  • 本申请公开了一种歌声合成方法、歌声合成模型训练方法、设备及介质,涉及歌声合成领域,包括:对第一用户的参考音频进行特征提取,得到第一用户在参考音频中的演唱特征;演唱特征包括演唱情感特征和演唱技巧特征;对第二用户的目标音频进行特征提取,得到第二...
  • 本发明涉及语音合成领域,具体是基于深度学习的语音合成方法,本发明采用一种基于多维度的自适应注意力机制融合方法将语音特征融入待合成语音,通过注意力对齐解决了传统全局嵌入的平均化问题,引入可学习的门控单元,自适应、精细地平衡局部细节与全局韵律,...
  • 本发明公开了一种基于动态混合的注意力与专家架构的语音与音乐协同生成方法、系统、终端设备及介质,涉及音频生成技术领域。所述方法包括:获取含音频、文本、视觉中至少一种的多模态输入,对其进行嵌入处理并映射至统一空间得融合序列;设置若干注意力头,通...
  • 本申请公开一种在音频中添加声效的方法、装置、电子设备及存储介质,涉及音频制作与多媒体技术领域,包括通过原始音频转换得到带时间轴的原始文本,再由第一预训练语言模型自动嵌入预测声效标识,后续候选声效匹配、目标声效筛选及音频合成均自动完成,摆脱对...
  • 本公开提供了一种数据处理方法、音频生成方法和语音合成模型的训练方法、装置、设备、介质、程序产品,涉及人工智能技术领域,尤其涉及深度学习、大模型和音频处理等技术领域。数据处理方法的具体实现方案为:响应于接收到参考音频,提取参考音频的特征,得到...
技术分类