Document
拖动滑块完成拼图
首页 专利交易 IP管家助手 科技果 科技人才 积分商城 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
最新专利技术
  • 本申请实施例应用于语音识别技术领域,提供了一种音频处理方法、模型训练方法及电子设备。在采集原始音频数据的过程中,电子设备按照预设时间长度,将该原始音频数据进行划分,得到多个候选音频数据块。之后,针对每个候选音频数据块,电子设备从候选音频数据...
  • 本申请实施例公开了一种页面操作的语音控制方法、装置、电子设备及介质。该方法包括:对用户的控制语音进行识别,并对识别出的文字进行解析得到目标操作指令;确定与所述目标操作指令对应的目标操作事件,并从目标页面的元素中查找所述目标操作事件对应的候选...
  • 本公开实施例提供了一种语音唤醒方法、装置、电子设备以及存储介质。该方法包括:确定目标设备获取的第一语音信号,所述第一语音信号中支持携带用于对所述目标设备或与目标设备相关联的目标应用进行唤醒的预设唤醒关键词;对所述第一语音信号进行语音幅度调整...
  • 本公开实施例提供了一种语音唤醒方法、装置、电子设备以及存储介质。该方法包括:确定目标设备获取的待处理语音信号;确定目标设备关联的参考语音特征提取子模型,并通过参考语音特征提取子模型从所述待处理语音信号中提取待处理语音特征信息,参考语音特征提...
  • 本发明公开了一种意图确定方法、装置、设备、介质及产品。该方法包括:获取音频数据;根据所述音频数据确定澄清类型;根据所述澄清类型确定用户意图信息。通过本发明的技术方案,能够根据获取到的音频数据确定出不同的澄清类型,进而根据不同的澄清类型确定出...
  • 本发明公开了一种人机对话方法、装置、车辆、介质及产品,该方法包括:响应于接收到第一对话指令,基于人机对话功能输出针对第一对话指令的第一答复内容;在人机对话功能中断状态下,响应于接收到第二对话指令,输出针对第二对话指令的第二答复内容;第二答复...
  • 本公开涉及数据处理技术领域,尤其是提供一种语音识别方法、装置、电子设备、存储介质及产品。方法包括:获取语音对照表;其中,语音对照表用于指示易混淆拼音音节;在接收到待识别语音文本的情况下,基于语音对照表确定待识别语音文本中的待校正词;其中,待...
  • 本发明公开了一种基于大模型的提升语音客服机器人效率的方法,包括如下步骤:步骤1:将客户呼叫经CTI语音网关转接到智能语音机器人坐席;步骤2:将客户语音通过ASR转换成文本;步骤3:对文本进行分词以及相似度匹配,相似行业标准问题时,选择对应的...
  • 本申请适用于智能控制技术领域,提供了一种科学仪器的控制方法、装置、电子设备和程序产品。其中,所述科学仪器的控制方法包括:响应于接收到对所述科学仪器的语音指令,根据所述语音指令,确定对所述科学仪器的当前控制意图及与所述当前控制意图对应的初始控...
  • 本发明涉及电力行业技术领域,具体为一种自监督学习的语音交互机器人对话方法,包括以下步骤,获取音频振幅序列,提取表达与显著性片段,标记跳转点分割语段,重构交互片段生成语义记录,构建自监督训练序列。本发明中,通过计算音量增长速率与持续时间长度相...
  • 本申请涉及语音识别技术领域,特别涉及一种双录客户端的语音识别方法、装置、电子设备及存储介质,其中,方法包括:在接收到双录开启指令时,控制目标客户端和应用程序端同时开启语音识别,并生成目标客户端的第一识别文本和应用程序端的第二识别文本,此时若...
  • 本发明涉及人工智能技术领域,揭露了一种基于多模态增强的蓝牙通信智能语音翻译方法及系统,所述方法包括:利用蓝牙设备内置的多麦克风阵列采集多通道音频信号,对多通道音频信号进行动态方向自适应波束形成,提取方向增强信号的梅尔频谱图特征,识别摄像头捕...
  • 本发明公开了一种基于CNN‑LSTM和在线知识蒸馏的语音关键词识别方法,涉及语音处理技术领域。所述方法在基于CNN‑LSTM的神经网络模型中引入了一个改进收缩残差注意力模块,用于发现并抑制特征中的冗余信息和噪声,增强了特征的表达能力。所述方...
  • 本申请提供了一种基于主动问询的智能语音对话方法,应用于矿山地质生态修复现场,包括步骤:通过可穿戴设备采集用户的多模态数据,所述多模态数据包括第一视角视频流、用户语音音频流及用户位姿数据;对所述第一视角视频流进行实时分析,识别预置于环境中的视...
  • 本发明实施例提供一种交互方法、交互系统和电子设备,其中,所述交互方法应用于一电子设备,所述电子设备用于接收用户输入的语音信号并基于所述用户输入的语音信号输出响应语音信号,所述方法包括:当识别到外部感应件的标识信息未与任何描述信息关联时,确认...
  • 本发明实施例提供一种交互方法、交互系统和电子设备,通过当电子设备上的非接触式传感器感应到外部感应件的信号时,获取所述外部感应件的标识信息;通过电子设备上的语音输入装置接收用户输入的语音信号;根据外部感应件的标识信息关联的描述信息和所述用户输...
  • 本发明实施例提供一种交互方法、交互系统和电子设备,通过当接收第一输入指令时,将所述电子设备设置为第一语音输入模式;当接收第二输入指令时,将所述电子设备设置为第二语音输入模式;其中,当所述电子设备处于第一语音输入模式或第二语音输入模式时,所述...
  • 本申请涉及基于语音识别的压裂施工方法、装置、设备、存储介质,该方法包括:获取压裂施工的语音指令和当前压裂作业数据;对语音指令进行指令识别,得到控制请求信息;基于当前压裂作业数据,得到当前压裂作业工况;基于控制请求信息和当前压裂作业工况,确定...
  • 本申请实施例提供了一种语音交互过程中识别语音指令的方法、装置、系统及服务器;该方法包括:接收包含目标唤醒词的当前唤醒音频信号,并提取第一声纹特征和第一信号强度,作为参考模板;持续接收后续的流式音频片段,并提取流式音频片段的第二声纹特征和第二...
  • 本申请公开了一种数字人实时交互方法及相关装置,涉及人机交互领域,通过对获取到的原始语音数据进行语音活动检测,得到包含语音活动的音频流数据。再对该音频流数据进行语音识别处理,得到第一文本流数据。在此基础之上调用大语言模型对第一文本流数据进行针...
技术分类