Document
拖动滑块完成拼图
首页 专利交易 IP管家助手 科技果 科技人才 积分商城 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
最新专利技术
  • 本发明公开了一种适应PSTN通话的增量式ASR算法,包括S1):数据预处理;S2):特征提取与归一化,得到当前帧的输入;S3):将当前帧的输入与缓存中的历史帧拼接,并输入LSTM模型;S4):更新所有LSTM层的隐藏状态和细胞状态,更新解码...
  • 本申请公开了一种语音关键词识别方法、系统、设备、存储介质、程序产品及芯片,其中方法包含以下步骤:输入阶段,包括特征提取步骤:接收音频数据,提取音频特征;模型推理阶段,包括线性变换步骤、ReLU激活步骤及CNN处理步骤:线性变换步骤包括,根据...
  • 本公开提供了用于提供车内数字助理服务的方法,用于服务器侧,包括:从车辆接收查询,查询基于来自用户的输入或来自车辆的传感器的感测数据;基于服务提供方的内部数据库,使用大语言模型来生成对查询的响应,其中内部数据库至少包括:语料库,语料库至少包括...
  • 本申请公开了一种交互方法、装置、设备、存储介质及车辆。其中,该方法包括:接收用户为使用应用程序的目标功能发出的第一语音指令;利用大语言模型调用与第一语音指令对应的多个第一应用程序接口执行第一语音指令,得到并输出第一中间执行结果;接收用户为实...
  • 本发明公开了一种基于智能体的数字娱乐终端交互方法、装置及存储介质,包括:创建具有语义分析功能的智能体,将所述智能体设置为控制数字娱乐终端的大模型的接入点;所述数字娱乐终端获取语音指令,将所述语音指令识别为对应的播控文本,并将所述播控文本上传...
  • 本发明属于智能医疗康复工程领域,具体涉及一种基于语音识别的语言障碍辅助治疗系统,解决现有技术病理语音误判率高、方言干扰大及反馈单一的问题;通过构建自适应语音识别引擎动态调节音素容错阈值,利用方言适配模块分离地域特征与病理特征,结合多模态反馈...
  • 本申请涉及语音控制技术领域,公开了一种语音控制方法、语音控制装置、电子设备以及计算机可读存储介质,该方法包括:响应于唤醒指令,获取第一视图中的第一控件位置信息,对第一控件位置信息进行标号,生成第一标号信息,根据第一视图、第一控件位置信息及第...
  • 本发明公开了一种面向青少年教育的无人机语音控制方法及系统。它包括A.语音采集:采用童声自适应ASR模型在高频增强梅尔谱上运行轻量Conformer‑CTC模型,B.采用语义降维网络完成从自然语言到26维动作令牌的降维映射,C.将降维后的映射...
  • 本发明涉及人工智能技术领域,公开了一种数字人交互方法、系统、存储介质及程序产品,本发明通过对第一语音请求添加目标会话标识,能够关联用户与交互进程,确保了多轮对话上下文连贯,实现了全双工交互。进一步,将语音信号转换为可处理的目标文本并对目标文...
  • 本申请提供了一种车辆功能执行方法、车机及存储介质,涉及车辆语音控制技术领域。该方法可以在语音助手被唤醒后监听到用户发出的语音数据的情况下,对语音数据进行语义识别,得到初步语义识别文本;在未找到初步语义识别文本对应的车辆功能控制命令的情况下,...
  • 本发明公开了一种面向低功耗设备的语音触发式远程控制方法,涉及物联网通信技术领域,用于解决低功耗设备在复杂无线环境下通信能耗与传输可靠性难以协同的问题;本发明通过构建动态协议优化与资源自适应机制,实现对设备剩余电量、信道状态及网络类型的多维感...
  • 本申请涉及一种语音控制方法、装置、系统、设备、存储介质及车辆,方法包括:基于对初始语音信号处理得到的第一掩蔽信号以及预设的第二掩蔽信号输出目标掩蔽信号,用于对初始语音信号进行掩蔽。本申请在能够有效保证对语音信号掩蔽效果的同时,目标掩蔽信号中...
  • 本申请公开了一种多模态生成式对话任务处理方法、装置及设备,包括:接收输入的文本内容、视觉内容和流式语音提问内容;当利用目标生成式对话任务处理模型中的全双工检测头检测到流式语音提问内容接收完成时,利用音频编码器对流式语音提问内容进行编码,并利...
  • 本申请公开了一种物联网玩具管理方法及系统。一种物联网玩具管理方法,包括:获取物联网玩具发送的用户语音数据;在预设的智能模型库中动态匹配本轮对话采用的自动语音识别模型,并通过自动语音识别模型对用户语音数据进行语音识别,生成用户语音文本;在预设...
  • 本申请公开了一种音频处理方法、装置、存储介质及电子装置,涉及数据处理技术领域,该音频处理方法包括:获取原始音频数据的语音特征数据和语义特征数据;原始音频数据为目标音视频数据中提取的音频数据;根据语音特征数据和语义特征数据,生成分割位置数据;...
  • 本发明适用于语音识别处理技术领域,提供了一种基于多模态大数据模型的语音识别处理系统,包括演讲底座,演讲底座上设置有演讲台,演讲台上设置有麦克风,演讲台的顶部设置有用于采集面部图像的高清摄像头,所述演讲底座内部为中空,演讲底座的上表面开设有多...
  • 本发明公开了一种面向语音交互的多智能体任务协同处理系统及处理方法。系统包括:语音输入模块,用于接收并预处理来自用户的原始音频信号;语音处理模块,用于基于所述音频信号,利用深度神经网络模型,生成一个结构化的任务表示;任务协调模块,用于基于所述...
  • 本发明涉及声音识别技术领域,尤其涉及基于多频带分析的声纹识别方法及装置,包括有数据准备与预处理、动态频带划分与特征提取、模型训练与优化、实时推理与部署以及评估与迭代;本发明相对于现有技术采用固定频带划分进行声纹特征提取,存在频带划分僵化、无...
  • 本发明公开了一种基于投影仪的声纹投影方法、系统、终端及存储介质,所述方法包括:获取用户声纹数据,并进行预处理和特征提取处理,得到声纹特征向量;确定第一预设模型,并通过第一预设模型对声纹特征向量进行声纹鉴定处理,得到预测声纹年龄;确定第二预设...
  • 本发明公开了一种基于AI声纹识别的鸟类声纹采集系统及装置,涉及鸟类声纹采集技术领域,包括:声学与环境数据采集单元,用于获取原始声学信号并同步采集环境物理参数;环境状态量化单元,用于量化生成环境胁迫因子;声源信号解耦单元,被配置为应用可修正的...
技术分类