Document
拖动滑块完成拼图
首页 专利交易 IP管家助手 科技果 科技人才 积分商城 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
最新专利技术
  • 本发明公开了一种基于智能体的数字娱乐终端交互方法、装置及存储介质,包括:创建具有语义分析功能的智能体,将所述智能体设置为控制数字娱乐终端的大模型的接入点;所述数字娱乐终端获取语音指令,将所述语音指令识别为对应的播控文本,并将所述播控文本上传...
  • 本申请公开了一种交互方法、装置、设备、存储介质及车辆。其中,该方法包括:接收用户为使用应用程序的目标功能发出的第一语音指令;利用大语言模型调用与第一语音指令对应的多个第一应用程序接口执行第一语音指令,得到并输出第一中间执行结果;接收用户为实...
  • 本公开提供了用于提供车内数字助理服务的方法,用于服务器侧,包括:从车辆接收查询,查询基于来自用户的输入或来自车辆的传感器的感测数据;基于服务提供方的内部数据库,使用大语言模型来生成对查询的响应,其中内部数据库至少包括:语料库,语料库至少包括...
  • 本申请公开了一种语音关键词识别方法、系统、设备、存储介质、程序产品及芯片,其中方法包含以下步骤:输入阶段,包括特征提取步骤:接收音频数据,提取音频特征;模型推理阶段,包括线性变换步骤、ReLU激活步骤及CNN处理步骤:线性变换步骤包括,根据...
  • 本发明公开了一种适应PSTN通话的增量式ASR算法,包括S1):数据预处理;S2):特征提取与归一化,得到当前帧的输入;S3):将当前帧的输入与缓存中的历史帧拼接,并输入LSTM模型;S4):更新所有LSTM层的隐藏状态和细胞状态,更新解码...
  • 本申请公开了一种通话重点的确认方法、装置、设备、存储介质及程序产品,涉及语音交互的技术领域。在本申请中,获取多人语音通话的通话场景以及各语音通话参与者的语音内容,并将语音内容转换为文本内容;根据文本内容,确定在通话场景下各语音通话参与者的预...
  • 本公开涉及自然语言处理技术领域,提供一种意图识别方法、模型训练方法及电子设备。该方法包括:响应于接收到目标输入语音,获取预设的目标注册语音;将所述目标输入语音及所述目标注册语音输入至预先训练得到的意图识别模型,经由所述意图识别模型处理;其中...
  • 本申请提出的音唇同步检测方法和装置、电子设备、存储介质,涉及人工智能技术领域,适用于金融科技领域及医疗健康领域。该方法包括:获取目标音视频数据,目标音视频数据包括目标混合音频和目标人脸视频序列;对目标混合音频进行音频编码,得到目标混合音频特...
  • 本申请提供一种模型训练方法、语音检测方法、装置、设备、介质及产品,涉及云技术、人工智能、智慧交通、自动驾驶等技术领域。方法包括:通过获取属于非有效语音的第一样本集、属于有效语音的第二样本集,该第一样本集包括第一混响样本和噪音样本,该有效语音...
  • 本申请公开了一种语音识别模型的训练方法、语音识别方法及相关设备,能够准确识别各种场景中的热词,进而提高语音识别准确性。所述语音识别模型的训练方法包括:确定第一语音数据的参考词语以及参考词语的热词标签;对参考词语的词特征和第一语音数据的声学特...
  • 本发明公开一种智能座舱AI语音交互测试方法、计算机设备以及存储介质。测试方法是:基于智能座舱AI语音交互系统的功能分析,建立智能测试数据库;智能测试数据库存储交互测试用例,交互测试用例包含多条泛化语料文本,泛化语料文本被赋予难度系数值;测试...
  • 本发明提供了一种视频配音语言的转换方法、系统及相关设备,方法包括从待转换视频中获取音轨数据;对音轨数据进行人声提取并按角色分类,获得各角色的单说话人音频;对各角色的单说话人音频进行语音转文本,获得各角色的原始语言文案;对各角色的单说话人音频...
  • 本发明涉及人工智能技术领域,可应用于医疗健康及金融技术领域,公开了环境感知语音合成方法、装置、计算机设备及存储介质。所述方法包括:获取参考语音、目标环境音、目标文本以及环境感知值;将所述参考语音、所述目标环境音、所述目标文本以及所述环境感知...
  • 本申请公开了一种基于NPU的中英双语文本转语音方法及系统,属于语音处理技术领域,所述方法为:基于中英混合文本中各片段的语言类型,对中英混合文本进行分词处理和音素转换,得到文本输入序列;对音素ID序列和语言ID序列进行向量组合,从向量组合结果...
  • 本发明提供一种大模型跨模态协同理解方法及装置,可以提升多模态信息的融合效率和理解能力。大模型跨模态协同理解方法包括:对视觉数据、语言数据和声音数据进行预处理,获得预处理后的视觉数据、语言数据和声音数据;其中,预处理包括:对视觉数据进行自适应...
  • 本发明提供一种语音合成模型训练方法、语音合成方法及其装置。该语音合成模型训练方法包括:获取第一训练数据,其中,第一训练数据包括多个语音数据对和每个语音数据对分别对应的第一文本,每个语音数据对包括第一合成语音和第一自然语音,且对于每个语音数据...
  • 本发明公开了一种自适应物理声学环境的生成方法及系统,属于智能声学调控技术领域。该方法及系统构建“感知‑推断‑物理调节‑学习优化”的闭环体系,以解决现有技术中声场参数静态预设、无法实时响应用户状态的缺陷。该方法包括:通过多模态传感器网络(11...
  • 本发明公开了基于多源能量自供给的泵站分布式智能降噪系统及方法,系统包括:分布式噪声采集模块、多通道信号处理模块、阵列扬声器执行模块和能源回收模块;分布式噪声采集模块用于实时采集泵站的噪声信号;多通道信号处理模块用于对噪声信号进行处理,基于处...
  • 本公开提供一种语音数据的处理方法、装置、存储介质和电子设备,其中,所述方法包括:对原始语音数据进行降噪处理;依据降噪后的语音数据,确定第一噪声消除指标,其中,所述第一噪声消除指标用于表示所述原始语音数据降噪后的消除量;对所述原始语音数据进行...
  • 本申请涉及车辆技术领域,尤其设计一种降噪方法、装置、车辆及存储介质,能够降低车内噪声的同时,避免乘客的隐私泄露。该方法包括:获取第一麦克风阵列采集的车内的声音信号;获取第二麦克风阵列采集的车外的噪声信号;在声音信号包括语音信号的情况下,基于...
技术分类