Document
拖动滑块完成拼图
首页 专利交易 IP管家助手 科技果 科技人才 积分商城 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
最新专利技术
  • 本申请提出的音唇同步检测方法和装置、电子设备、存储介质,涉及人工智能技术领域,适用于金融科技领域及医疗健康领域。该方法包括:获取目标音视频数据,目标音视频数据包括目标混合音频和目标人脸视频序列;对目标混合音频进行音频编码,得到目标混合音频特...
  • 本公开涉及自然语言处理技术领域,提供一种意图识别方法、模型训练方法及电子设备。该方法包括:响应于接收到目标输入语音,获取预设的目标注册语音;将所述目标输入语音及所述目标注册语音输入至预先训练得到的意图识别模型,经由所述意图识别模型处理;其中...
  • 本申请公开了一种通话重点的确认方法、装置、设备、存储介质及程序产品,涉及语音交互的技术领域。在本申请中,获取多人语音通话的通话场景以及各语音通话参与者的语音内容,并将语音内容转换为文本内容;根据文本内容,确定在通话场景下各语音通话参与者的预...
  • 本发明公开了一种适应PSTN通话的增量式ASR算法,包括S1):数据预处理;S2):特征提取与归一化,得到当前帧的输入;S3):将当前帧的输入与缓存中的历史帧拼接,并输入LSTM模型;S4):更新所有LSTM层的隐藏状态和细胞状态,更新解码...
  • 本申请公开了一种语音关键词识别方法、系统、设备、存储介质、程序产品及芯片,其中方法包含以下步骤:输入阶段,包括特征提取步骤:接收音频数据,提取音频特征;模型推理阶段,包括线性变换步骤、ReLU激活步骤及CNN处理步骤:线性变换步骤包括,根据...
  • 本公开提供了用于提供车内数字助理服务的方法,用于服务器侧,包括:从车辆接收查询,查询基于来自用户的输入或来自车辆的传感器的感测数据;基于服务提供方的内部数据库,使用大语言模型来生成对查询的响应,其中内部数据库至少包括:语料库,语料库至少包括...
  • 本申请公开了一种交互方法、装置、设备、存储介质及车辆。其中,该方法包括:接收用户为使用应用程序的目标功能发出的第一语音指令;利用大语言模型调用与第一语音指令对应的多个第一应用程序接口执行第一语音指令,得到并输出第一中间执行结果;接收用户为实...
  • 本发明公开了一种基于智能体的数字娱乐终端交互方法、装置及存储介质,包括:创建具有语义分析功能的智能体,将所述智能体设置为控制数字娱乐终端的大模型的接入点;所述数字娱乐终端获取语音指令,将所述语音指令识别为对应的播控文本,并将所述播控文本上传...
  • 本发明属于智能医疗康复工程领域,具体涉及一种基于语音识别的语言障碍辅助治疗系统,解决现有技术病理语音误判率高、方言干扰大及反馈单一的问题;通过构建自适应语音识别引擎动态调节音素容错阈值,利用方言适配模块分离地域特征与病理特征,结合多模态反馈...
  • 本申请涉及语音控制技术领域,公开了一种语音控制方法、语音控制装置、电子设备以及计算机可读存储介质,该方法包括:响应于唤醒指令,获取第一视图中的第一控件位置信息,对第一控件位置信息进行标号,生成第一标号信息,根据第一视图、第一控件位置信息及第...
  • 本发明公开了一种面向青少年教育的无人机语音控制方法及系统。它包括A.语音采集:采用童声自适应ASR模型在高频增强梅尔谱上运行轻量Conformer‑CTC模型,B.采用语义降维网络完成从自然语言到26维动作令牌的降维映射,C.将降维后的映射...
  • 本发明涉及人工智能技术领域,公开了一种数字人交互方法、系统、存储介质及程序产品,本发明通过对第一语音请求添加目标会话标识,能够关联用户与交互进程,确保了多轮对话上下文连贯,实现了全双工交互。进一步,将语音信号转换为可处理的目标文本并对目标文...
  • 本申请提供了一种车辆功能执行方法、车机及存储介质,涉及车辆语音控制技术领域。该方法可以在语音助手被唤醒后监听到用户发出的语音数据的情况下,对语音数据进行语义识别,得到初步语义识别文本;在未找到初步语义识别文本对应的车辆功能控制命令的情况下,...
  • 本发明公开了一种面向低功耗设备的语音触发式远程控制方法,涉及物联网通信技术领域,用于解决低功耗设备在复杂无线环境下通信能耗与传输可靠性难以协同的问题;本发明通过构建动态协议优化与资源自适应机制,实现对设备剩余电量、信道状态及网络类型的多维感...
  • 本申请涉及一种语音控制方法、装置、系统、设备、存储介质及车辆,方法包括:基于对初始语音信号处理得到的第一掩蔽信号以及预设的第二掩蔽信号输出目标掩蔽信号,用于对初始语音信号进行掩蔽。本申请在能够有效保证对语音信号掩蔽效果的同时,目标掩蔽信号中...
  • 本申请公开了一种多模态生成式对话任务处理方法、装置及设备,包括:接收输入的文本内容、视觉内容和流式语音提问内容;当利用目标生成式对话任务处理模型中的全双工检测头检测到流式语音提问内容接收完成时,利用音频编码器对流式语音提问内容进行编码,并利...
  • 本申请公开了一种物联网玩具管理方法及系统。一种物联网玩具管理方法,包括:获取物联网玩具发送的用户语音数据;在预设的智能模型库中动态匹配本轮对话采用的自动语音识别模型,并通过自动语音识别模型对用户语音数据进行语音识别,生成用户语音文本;在预设...
  • 本申请公开了一种音频处理方法、装置、存储介质及电子装置,涉及数据处理技术领域,该音频处理方法包括:获取原始音频数据的语音特征数据和语义特征数据;原始音频数据为目标音视频数据中提取的音频数据;根据语音特征数据和语义特征数据,生成分割位置数据;...
  • 本发明适用于语音识别处理技术领域,提供了一种基于多模态大数据模型的语音识别处理系统,包括演讲底座,演讲底座上设置有演讲台,演讲台上设置有麦克风,演讲台的顶部设置有用于采集面部图像的高清摄像头,所述演讲底座内部为中空,演讲底座的上表面开设有多...
  • 本发明公开了一种面向语音交互的多智能体任务协同处理系统及处理方法。系统包括:语音输入模块,用于接收并预处理来自用户的原始音频信号;语音处理模块,用于基于所述音频信号,利用深度神经网络模型,生成一个结构化的任务表示;任务协调模块,用于基于所述...
技术分类