Document
拖动滑块完成拼图
首页 专利交易 IP管家助手 科技果 科技人才 积分商城 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
最新专利技术
  • 本申请涉及到语音识别技术领域, 公开了一种集外词的拒识别方法、装置、设备及介质, 其中方法包括:对当前语音段识别结果与目标命令词强制对齐得对齐路径, 此过程基于动态规划、维特比算法并结合CTC准则;依据对齐路径确定关键区间, 分blank音...
  • 本发明适用于语音关键词识别技术领域, 提供了一种语音关键词识别中多尺度时空编码建模系统及方法, 包括样本生成模块用于收集基础语音信息, 并增加具备扰动功能的语音样本;频域编码模块用于根据语音样本生成频域编码向量, 并据此学习训练, 训练过程...
  • 本发明涉及音频信号处理技术领域, 尤其涉及一种基于iOS平台的实时音频处理及梅尔谱图生成与分类方法及系统, 包括音频输入模块、信号处理模块、梅尔谱图生成模块、分类推理模块、文件存储模块和用户交互模块, 信号处理模块与音频输入模块连接, 梅尔...
  • 本申请涉及到语音识别技术领域, 公开了一种降低命令词误识别的语音识别方法、装置、设备及介质;其中方法先训练初始CTC语音识别模型至验证集收敛, 得到收敛模型;再基于收敛模型输出的原始输出值, 通过路径搜索算法筛选多条候选路径;随后计算参考路...
  • 本申请涉及端侧模型部署的技术领域, 尤其涉及一种端侧语音模型部署方法、装置、设备及存储介质。包括:端侧录制的参考音频;提取参考音频的参考语义令牌和嵌入向量;获取训练文本集, 将训练文本集中每一训练文本对应的训练文本编码、嵌入向量和参考语义令...
  • 一种语音识别模型的自进化方法及系统, 本身通过提取高价值文本片段, 结合多风格语音合成数据构建训练集, 在结合通用数据后, 采用参数微调技术对暂存模型进行参数优化, 同时通过将优化的参数存储在经验回放缓冲区, 并通过在经验回放缓冲区中对优化...
  • 一种基于多维度因素的口语评测系统及方法, 涉及数据处理技术领域, 包括:根据预训练的文本音素识别模型获得语音数据对应的音频文本、音素列表及音素时间边界列表;根据音素列表及音素时间边界列表计算得到流畅度得分;通过预训练语义模型获得音频文本的语...
  • 提供了一种用于恢复语音数据记录的转录中的词汇表外字词的方法, 包括:接收用于转录为语音数据记录的文本表示的语音数据记录;使用字词识别模型将所述语音数据记录转录为所述文本表示;标识所述文本表示中的未知字词;基于由子单元识别模型生成的所述未知字...
  • 本发明公开了面向远程会议场景的语音分离与段落归属方法及系统, 涉及语音识别技术领域。所述方法包括:会议平台触发目标会议窗口的语音记录, 生成会议音频;根据第一引擎, 对会议音频执行双程语音分离处理, 构建语音逻辑图谱;根据第二引擎, 匹配目...
  • 本申请公开了一种跨语种语音识别方法、系统、设备及存储介质, 本方法通过将训练语音进行预处理, 得到训练语音帧序列;从训练语音帧序列中提取内容表征、说话人表征以及音高表征;根据内容表征、说话人表征以及音高表征进行语音重构, 得到目标语种语音;...
  • 本发明公开了一种多语言语音翻译模型、训练方法及推理方法, 包括语音编码器、文本解码器和键值寄生推测模块;所述语音编码器包括堆叠的编码器层, 所述编码器层包括自注意力模块和前馈网络模块;所述文本解码器包括堆叠的解码器层, 所述解码器层包括自注...
  • 本发明涉及人工智能技术领域, 可应用于医疗健康及金融技术领域, 公开了语音合成方法、装置、计算机设备及存储介质。所述方法包括:获取待处理文本、插值后的噪音、未掩码的语音;将所述待处理文本、插值后的噪音、未掩码的语音输入至合成模型, 由所述合...
  • 本发明涉及语音信号处理与合成技术领域, 具体公开了一种语音转换的信息处理方法和系统, 对输入文本提取每个词语的语言特征向量;随后结合贝叶斯推理机制计算词语在不同语言下的后验概率, 生成语言归属置信度特征值;采用蒙特卡洛采样方法进行多次上下文...
  • 本申请公开了一种用于迁移语音风格的方法及装置。该方法包括:对源语音序列进行特征提取, 以获取源语音风格特征;将源语音风格特征输入隐式神经表示模块, 以获取目标语音风格特征, 其中, 隐式神经表示模块被配置为基于目标隐向量和源语言风格特征生成...
  • 本发明提供一种语音编辑处理方法、装置及电子设备, 获取待编辑语音, 以及获取与所述待编辑语音对应的初始语音特征属性;采用有监督方式和\或无监督方式确定扩散模型中的h空间的潜在语义方向;在基于扩散模型中的h空间对所述待编辑语音进行扩散处理的过...
  • 本发明涉及智能决策技术领域, 可应用于金融科技、医疗健康等业务系统平台中, 公开了一种基于优化策略算法的语音合成方法、装置、设备及介质, 包括:提取语音合成模型中的时序处理网络单元和数据采样调度单元;将时序处理网络单元中的去噪函数映射为多步...
  • 本申请提供了一种语音合成方法、系统、设备、存储介质及程序产品, 涉及人工智能与语音处理技术领域, 方法包括:获取与待合成语音文本数据相对应的梅尔频谱数据;将所述梅尔频谱数据输入基于选择性状态空间模型的神经声码器;基于所述神经声码器采用所述选...
  • 本发明涉及语音生成领域, 尤其涉及一种语音生成方法及装置, 该方法包括:获取待处理文本、待处理文本对应的初始语音和至少一个情绪类型;根据至少一个情绪类型获取对应的至少一个调整参数;将待处理文本和调整参数, 或初始语音和调整参数输入文字转语音...
  • 本申请公开了一种语音生成方法、装置、存储介质及电子设备, 涉及人工智能和语音合成领域。其中, 该方法包括:获取待处理文本;根据目标标记库将待处理文本转换为第一文本;对第一文本进行解析, 得到第一文本中S个子文本对应的控制参数列表;将待处理文...
  • 本发明涉及语音处理技术领域, 可应用于金融科技及医疗健康等业务场景中, 公开了一种非自回归优化的数据序列处理方法、装置、设备及介质, 包括:接收输入序列编码生成隐藏表示, 基于时间步长值和隐藏表示确定动态长度跨度, 在动态长度跨度内并行生成...
技术分类