Document
拖动滑块完成拼图
首页 专利交易 IP管家助手 科技果 科技人才 积分商城 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
最新专利技术
  • 本发明提供了一种视频配音语言的转换方法、系统及相关设备,方法包括从待转换视频中获取音轨数据;对音轨数据进行人声提取并按角色分类,获得各角色的单说话人音频;对各角色的单说话人音频进行语音转文本,获得各角色的原始语言文案;对各角色的单说话人音频...
  • 本发明公开一种智能座舱AI语音交互测试方法、计算机设备以及存储介质。测试方法是:基于智能座舱AI语音交互系统的功能分析,建立智能测试数据库;智能测试数据库存储交互测试用例,交互测试用例包含多条泛化语料文本,泛化语料文本被赋予难度系数值;测试...
  • 本申请公开了一种语音识别模型的训练方法、语音识别方法及相关设备,能够准确识别各种场景中的热词,进而提高语音识别准确性。所述语音识别模型的训练方法包括:确定第一语音数据的参考词语以及参考词语的热词标签;对参考词语的词特征和第一语音数据的声学特...
  • 本申请提供一种模型训练方法、语音检测方法、装置、设备、介质及产品,涉及云技术、人工智能、智慧交通、自动驾驶等技术领域。方法包括:通过获取属于非有效语音的第一样本集、属于有效语音的第二样本集,该第一样本集包括第一混响样本和噪音样本,该有效语音...
  • 本申请提出的音唇同步检测方法和装置、电子设备、存储介质,涉及人工智能技术领域,适用于金融科技领域及医疗健康领域。该方法包括:获取目标音视频数据,目标音视频数据包括目标混合音频和目标人脸视频序列;对目标混合音频进行音频编码,得到目标混合音频特...
  • 本公开涉及自然语言处理技术领域,提供一种意图识别方法、模型训练方法及电子设备。该方法包括:响应于接收到目标输入语音,获取预设的目标注册语音;将所述目标输入语音及所述目标注册语音输入至预先训练得到的意图识别模型,经由所述意图识别模型处理;其中...
  • 本申请公开了一种通话重点的确认方法、装置、设备、存储介质及程序产品,涉及语音交互的技术领域。在本申请中,获取多人语音通话的通话场景以及各语音通话参与者的语音内容,并将语音内容转换为文本内容;根据文本内容,确定在通话场景下各语音通话参与者的预...
  • 本发明公开了一种适应PSTN通话的增量式ASR算法,包括S1):数据预处理;S2):特征提取与归一化,得到当前帧的输入;S3):将当前帧的输入与缓存中的历史帧拼接,并输入LSTM模型;S4):更新所有LSTM层的隐藏状态和细胞状态,更新解码...
  • 本申请公开了一种语音关键词识别方法、系统、设备、存储介质、程序产品及芯片,其中方法包含以下步骤:输入阶段,包括特征提取步骤:接收音频数据,提取音频特征;模型推理阶段,包括线性变换步骤、ReLU激活步骤及CNN处理步骤:线性变换步骤包括,根据...
  • 本公开提供了用于提供车内数字助理服务的方法,用于服务器侧,包括:从车辆接收查询,查询基于来自用户的输入或来自车辆的传感器的感测数据;基于服务提供方的内部数据库,使用大语言模型来生成对查询的响应,其中内部数据库至少包括:语料库,语料库至少包括...
  • 本申请公开了一种交互方法、装置、设备、存储介质及车辆。其中,该方法包括:接收用户为使用应用程序的目标功能发出的第一语音指令;利用大语言模型调用与第一语音指令对应的多个第一应用程序接口执行第一语音指令,得到并输出第一中间执行结果;接收用户为实...
  • 本发明公开了一种基于智能体的数字娱乐终端交互方法、装置及存储介质,包括:创建具有语义分析功能的智能体,将所述智能体设置为控制数字娱乐终端的大模型的接入点;所述数字娱乐终端获取语音指令,将所述语音指令识别为对应的播控文本,并将所述播控文本上传...
  • 本发明属于智能医疗康复工程领域,具体涉及一种基于语音识别的语言障碍辅助治疗系统,解决现有技术病理语音误判率高、方言干扰大及反馈单一的问题;通过构建自适应语音识别引擎动态调节音素容错阈值,利用方言适配模块分离地域特征与病理特征,结合多模态反馈...
  • 本申请涉及语音控制技术领域,公开了一种语音控制方法、语音控制装置、电子设备以及计算机可读存储介质,该方法包括:响应于唤醒指令,获取第一视图中的第一控件位置信息,对第一控件位置信息进行标号,生成第一标号信息,根据第一视图、第一控件位置信息及第...
  • 本发明公开了一种面向青少年教育的无人机语音控制方法及系统。它包括A.语音采集:采用童声自适应ASR模型在高频增强梅尔谱上运行轻量Conformer‑CTC模型,B.采用语义降维网络完成从自然语言到26维动作令牌的降维映射,C.将降维后的映射...
  • 本发明涉及人工智能技术领域,公开了一种数字人交互方法、系统、存储介质及程序产品,本发明通过对第一语音请求添加目标会话标识,能够关联用户与交互进程,确保了多轮对话上下文连贯,实现了全双工交互。进一步,将语音信号转换为可处理的目标文本并对目标文...
  • 本申请提供了一种车辆功能执行方法、车机及存储介质,涉及车辆语音控制技术领域。该方法可以在语音助手被唤醒后监听到用户发出的语音数据的情况下,对语音数据进行语义识别,得到初步语义识别文本;在未找到初步语义识别文本对应的车辆功能控制命令的情况下,...
  • 本发明公开了一种面向低功耗设备的语音触发式远程控制方法,涉及物联网通信技术领域,用于解决低功耗设备在复杂无线环境下通信能耗与传输可靠性难以协同的问题;本发明通过构建动态协议优化与资源自适应机制,实现对设备剩余电量、信道状态及网络类型的多维感...
  • 本申请涉及一种语音控制方法、装置、系统、设备、存储介质及车辆,方法包括:基于对初始语音信号处理得到的第一掩蔽信号以及预设的第二掩蔽信号输出目标掩蔽信号,用于对初始语音信号进行掩蔽。本申请在能够有效保证对语音信号掩蔽效果的同时,目标掩蔽信号中...
  • 本申请公开了一种多模态生成式对话任务处理方法、装置及设备,包括:接收输入的文本内容、视觉内容和流式语音提问内容;当利用目标生成式对话任务处理模型中的全双工检测头检测到流式语音提问内容接收完成时,利用音频编码器对流式语音提问内容进行编码,并利...
技术分类