Document
拖动滑块完成拼图
专利交易 商标交易 积分商城 国际服务 IP管家助手 科技果 科技人才 会员权益 需求市场 关于龙图腾 更多
 /  免费注册
到顶部 到底部
清空 搜索
最新专利技术
  • 本公开的实施例涉及语音交互的方法、交互设备、电子设备及存储介质。在此提出的方法包括:获取由部署在交互设备处的音频采集单元所采集的第一语音信号,交互设备适于佩戴于用户的手指;以及向终端设备发送第一语音信号,以触发终端设备或与终端设备连接的音频...
  • 本公开的实施例涉及语音交互的方法、交互设备、电子设备及存储介质。在此提出的方法包括:响应于针对交互设备的预设操作,控制交互设备的音频采集单元开始采集第一语音信号,交互设备适于佩戴于用户的手指;获取由音频采集单元所采集的第一语音信号;以及将第...
  • 本发明涉及一种模型训练方法、车辆控制方法、装置、设备、介质及产品,在该方法中,通过根据样本车辆的场景信息(样本行驶信息和样本用户信息)以及第一控制指令以及大模型强大的常识推理能力,生成多个第二控制指令。进而将场景信息以及第一控制指令作为训练...
  • 本发明公开了一种语音交互控制方法、装置、智能家居设备及存储介质,智能家居设备具有语音模组,该语音交互控制方法包括:响应于唤醒语音模组的语音指令,获取影响智能家居设备周围噪声大小的多维状态参数;根据多维状态参数确定出当前次语音播报所需的音频留...
  • 本申请提供了一种数字人生成方法、装置、设备、存储介质及程序产品,其中,所述方法包括:获得形象数据和语音数据,形象数据指示车辆上的乘员期望的数字人形象,语音数据指示乘员期望的数字人语音;通过数字人模型中的图像生成模块,根据形象数据生成包括数字...
  • 本发明涉及语音识别技术领域,公开了一种用于扫地机器人的语音指令识别及清洁控制方法,包括:在获取麦克风采集的音频信号的同时,同步读取扫地机器人的吸尘电机驱动脉宽调制值和滚刷电机负载电流值;依据上述非声学运行状态数据,在预置的工况噪声频谱映射表...
  • 本申请公开了一种基于柔性传感器信号的发声意图检测方法和系统,包括:实时获取柔性传感器输出信号,对所述信号进行预处理;对特定长度滑动窗口对实时获取的所述信号逐帧划分,对每一帧信号的计算短时能量、短时方差及短时谱熵;根据当前帧之前M帧的短时能量...
  • 本申请提供一种语音识别方法及电子设备,在该方法中,电子设备获取用户输入的音频;电子设备根据音频对用户输入音频时的语音环境进行检测,确定音频对应的语音交互模式;电子设备根据语音交互模式对应的语音识别方式对音频进行语音识别,得到语音识别结果。通...
  • 本申请实施例提供了一种基于对话的意图识别方法、装置、电子设备及存储介质,属于人工智能技术领域,应用于金融科技领域和健康医疗领域。该方法包括:获取目标对象与服务坐席之间的对话语音,对话语音包括至少一个语音片段;对语音片段进行语音特征提取,得到...
  • 本发明提供一种由语音识别系统处理输入的话语的方法和装置,该方法和装置由语音识别系统的计算机实现以处理接收到的作为输入的话语。该方法包括由基于规则的自然语言理解引擎处理话语。该方法还包括当基于规则的自然语言理解引擎无法处理话语时,利用大语言模...
  • 本申请提供一种语音识别方法及电子设备,涉及语音处理技术领域,可以解决语音识别时解码时间复杂度高,且解码速率慢、功耗高等问题;该方法包括:利用语音识别模型对T帧语音帧中的第t帧语音帧进行处理,得到第t帧语音帧对应的文本预测值;文本预测值包括空...
  • 本申请公开了一种语音模型训练数据集的生成方法、系统及电子设备。该方法包括:获取包含音频数据的初始数据集,音频数据是从作为公开数据源的网络爬取和/或已有数据库得到的音频数据。对初始数据集进行初步筛选得到第一目标数据集,并进行数据尺寸调整获得第...
  • 本申请提供一种基于对抗强化学习的车载语音意图识别系统,涉及车载语音识别技术领域,通过构建噪声生成器—意图判别器—强化学习训练器的动态对抗闭环,实现了车载语音意图识别鲁棒性的有效提升。该系统利用大语言模型作为环境,驱动噪声生成器智能生成语义相...
  • 本发明实施例提供了一种数据处理方法、装置和电子设备。所述方法包括:通过音频量化器接收第一训练集中的每条样本数据,并输出每条样本数据对应的量化序列;一条样本数据对应的量化序列包括该条样本数据分割得到的每个语音片段对应的分类结果;选择一条正样本...
  • 本公开的实施例涉及训练模型的方法、装置、设备和存储介质。在此提出的方法包括基于参考歌词内容,构建一组候选歌词内容,每项候选歌词内容包括参考歌词内容中的至少一个段落;基于一组候选歌词内容的评价信息,从一组候选歌词内容中确定满足预设要求的目标歌...
  • 本申请提供了一种音频编码器的训练方法、歌曲识别方法及设备,涉及音频技术领域,方法包括:获取多个第一训练样本对,其中,每个第一训练样本对包括第一带噪歌曲音频和第一带噪歌曲音频对应的标准歌词文本;带噪歌曲音频为带噪音频;针对每个第一训练样本对,...
  • 本申请实施例公开了一种外接声卡设备的识别方法以及相关设备,该相关设备可以包括声卡识别的装置、电子设备、计算机程序产品和计算机可读存储介质;本申请实施例在当检测到至少一个外部音频设备接入时,获取外部音频设备的设备接口信息后,在设备接口信息中识...
  • 本申请公开了一种同声传译方法、同声传译模型训练方法、装置及电子设备,属于人工智能技术领域。该同声传译方法包括:同步采集说话人的第一音频和面部视频;其中,所述第一音频为第一语种,所述第一音频包括P帧音频帧,所述面部视频包括P帧视频帧,所述P帧...
  • 本申请公开了一种文本转语音方法及装置,涉及人工智能语音技术领域。该方法包括:训练音频样本,生成音色特征模型权重及模型声码器;接收包含用户元数据、音色特征模型权重的路径及音频数据的新音色注册请求,为新音色分配唯一标识符并设置初始状态为非激活状...
  • 一种语音合成装置,包括:存储器,被配置为:存储用户配置的语言信息以及与用户选定的说话人信息对应的说话人的音频样本。语音合成装置还包括:处理器,被配置为:响应于用户的语音合成请求,通过将语音合成模型应用于输入文本、语言信息和音频样本,来生成与...
技术分类