Document
拖动滑块完成拼图
专利交易 商标交易 积分商城 国际服务 IP管家助手 科技果 科技人才 会员权益 需求市场 关于龙图腾 更多
 /  免费注册
到顶部 到底部
清空 搜索
最新专利技术
  • 本发明涉及智能家居与电竞设备技术领域,具体公开了一种电竞桌智能语音控制系统,系统:多模态信号采集模块、语音交互核心模块、用户意图解析与上下文管理模块、多设备协同控制模块以及自适应学习模块,其中:所述多模态信号采集模块,用于采集用户语音信号及...
  • 本发明实施例提供了一种智能设备的语音交互方法、装置、电子设备及介质,涉及语音处理技术领域。所述方法包括:在智能设备语音播报的过程中,采集用户音频;判断用户音频是否满足语音检测触发条件;若用户音频满足语音检测触发条件,获取用户状态信息以及设备...
  • 本发明公开了一种语音转码并发数自适应控制方法、装置及介质,应用于包含一组处理器的媒体网关,获取转码业务类型;对每一转码业务类型进行单处理器逻辑核的基准能力测量,得到并发支持能力参数;基于并发支持能力参数,计算每一转码业务类型的单位路核开销;...
  • 本发明涉及语音识别技术领域,具体为一种基于人工智能的多场景下用户语音交互语义识别方法,包括以下步骤,采集多场景语音流,提取特征并计算能量变化,生成清晰度参数,提取关键词与场景标签,融合上下文推理,输出语义识别结果。本发明中,通过多层次特征提...
  • 本发明涉及语音识别技术领域,具体为一种智能话务系统,系统包括信号校验模块、声纹分离模块、内容转写模块、意图链构建模块、优先判定模块。本发明中,在语音输入过程中,通过呼吸流速曲线与基频周期的比对实现稳定性校验,保证识别信号一致减少呼吸波动偏差...
  • 本发明公开了一种手语识别音响的装置、系统及方法,通过检测模块获取视觉图像信息和交互语音,并分别输出给特征提取单元、手语识别单元、文本转换单元及语音合成单元;数据处理模块的特征提取单元、手语识别单元、文本转换单元及语音合成单元分别接收检测模块...
  • 本发明涉及洽谈状态分析方法、信息处理装置及程序。一种方法,其课题在于对洽谈状态进行分析的技术进行改善。一种由信息处理装置执行的方法,其包括如下步骤:接受洽谈所涉及的语音数据的输入;根据语音数据,判定洽谈处于洽谈阶段中的哪个阶段;及根据所判定...
  • 本公开提出了一种同声传译系统及方法、通话设备、存储介质和程序产品,涉及音频处理技术领域,该装置包括:采集模块,用于采集的原始语音;翻译模块,用于翻译原始语音;发声模块,包括具有两个发声单元的第一副耳机,两个发声单元根据确定的目标语种播放对应...
  • 本发明公开了一种意图识别方法及装置,本发明涉及5G消息处理技术领域,其中,方法包括获取输入的语音信号或文本序列后调用本地部署的意图识别模型进行意图识别;基于意图识别结果匹配对应的业务;将预训练的流式语音识别初始模型和文本意图识别初始模型分别...
  • 本发明涉及会话处理技术领域,具体涉及会话处理方法、装置、电子设备及目标车辆。接收目标用户输入的当前目标会话;对当前目标会话进行语义解析,确定当前目标会话对应的目标会话处理模型;基于目标会话处理模型,对当前目标会话进行处理。根据确定的模型进行...
  • 本发明涉及语音处理技术以及人机交互技术领域,公开了一种人机交互装置、控制方法及人机交互系统,包括以下步骤:采集原始音频流;对采集的原始音频流进行分析;计算各声源的空间方位,并追踪原始音频流的能量梯度变化;执行声源分离操作获取独立语音流;提取...
  • 本申请涉及一种语音识别方法、装置、设备、介质和产品。方法包括:获取待识别的目标语音,将目标语音输入至训练完毕的语音识别模型中,通过语音识别模型中的语音音素模型,计算目标语音在各时刻下音素的概率分布,并对每一时刻的概率分布结合预设的宽度进行采...
  • 本发明涉及一种音频数据标记的生成方法及设备。本发明采用在大型数据集上预训练的深度卷积神经网络进行特征提取,能够自动学习并提取音频中鲁棒的、高层次的抽象特征,显著提升了标记的准确性和对复杂场景的泛化能力。通过引入置信度筛选机制,过滤掉不可靠的...
  • 本发明公开了一种基于语音任务的大模型训练方法、装置、介质及设备。属于语音模型领域,本申请通过获取语音任务的任务描述数据、基准模型参数及实验目标,利用检索增强生成技术在预设知识库中检索相关技术知识数据,并结合历史实验记录构建结构化提示词输入大...
  • 本公开涉及人工智能领域,尤其是提供了一种音频安全监控方法、装置、电子设备和计算机程序产品。方法包括:实时获取音频数据流;对音频数据流进行分段处理,生成多个采集时长对应的分段音频数据;基于预设规则,对多个采集时长对应的分段音频数据中的每一个进...
  • 本申请实施例公开了一种语音处理方法、智能手表、存储介质及程序产品,用于在和对方用户沟通时,可以在智能手表上显示对当前声音信息进行关键信息提取得到的当前关键内容信息,从而辅助当前用户理解对方用户的沟通内容。本申请实施例方法应用于智能手表,所述...
  • 本发明公开了一种基于强化学习与思维链的细粒度多维语音评估方法及系统,属于人工智能与语音信号处理技术领域。为预设的多个语音质量评估维度设计批量的结构化评估问题,得到包含语音‑问题对的训练集,采用预训练的大型语言模型进行思维链标注;采用训练集及...
  • 本发明涉及两级语音韵律迁移。一种方法包括:接收要合成为具有预期韵律和目标话音的表达性语音的输入文本话语;以及使用第一文本到语音模型来生成输入文本话语的中间合成语音表示。该中间合成语音表示拥有预期韵律。该方法还包括:将中间合成语音表示提供给第...
  • 本发明涉及语音处理技术领域,可应用于金融科技及医疗健康等业务场景中,公开了一种基于频段调整的语音生成方法、装置、设备及介质,包括:获取情感参考语音与中性参考语音并确定情感向量;获取输入文本,通过文本到语音模型生成中间声学特征;将中间声学特征...
  • 本发明提供一种基于字符组件建模的满语语音合成方法及装置,涉及语音合成技术领域。方法包括 : 将满文按转写规则转换为拉丁字符,生成字符嵌入序列,并基于满语发音声学特性生成含基频、音高带等维度的特征模板,将二者拼接为高维输入张量,送入预训练时长...
技术分类