Document
拖动滑块完成拼图
专利交易 积分商城 国际服务 IP管家助手 科技果 科技人才 商标交易 会员权益 需求市场 关于龙图腾 更多
 /  免费注册
到顶部 到底部
清空 搜索
最新专利技术
  • 本发明提供一种语音转换文字的方法、装置、设备、存储介质和程序产品,涉及信息技术领域,所述语音转换文字的方法,包括:对待转换的语音帧数据的声学特征和所述语音帧数据的语义上下文进行融合处理,得到不同输入通道的融合特征;对所述不同输入通道的融合特...
  • 本发明提供了一种融合外部信息的唇语识别模型构建方法,该方法包括:构建初始唇语识别模型,初始唇语识别模型包含视觉模态数据处理模块、预训练的视觉编码器、视觉投影器、文本嵌入模块与第一大语言模型;构建数据集,所述初始数据集以每个视觉序列图像及其对...
  • 本申请公开了一种神经电生理信号解码自然连续语音的方法及相关装置,涉及神经信号处理及语音合成技术领域,该方法包括:获取用户阅读目标文本或听取对应音频时产生的神经电生理信号,打破单一信号模态限制,兼顾各种非侵入式应用场景;按预设时间窗切片得到连...
  • 本申请公开了语音驱动的智能绘本生成方法、装置、电子设备及存储介质,属于人工智能技术领域。所述方法包括:获取含主题采集、内容采集、风格选择、生成分镜的标准化创作步骤清单,该清单为结构化数据对象,经RESTful API接口下发,与用户会话ID...
  • 本申请公开了一种分布式语音交互设备的唤醒方法、存储介质及电子装置,涉及智慧家庭技术领域,该分布式语音交互设备的唤醒方法包括:通过仲裁模型基于唤醒音频的声源朝向的方向性增益对唤醒音频的声源位置与语音交互设备之间的等效距离进行仲裁,得到与等效距...
  • 本申请提供一种基于智能语音识别的信令跨网穿透方法、系统及计算机可读存储介质。方法包括通过连接于两个网络之间的物理音视频连接链路,接收来自第二网络侧的音频信号;对音频信号进行语音识别,转换为文本信息;解析文本信息,识别出其中包含的控制指令;根...
  • 本发明涉及数据处理技术领域,尤其涉及用于机器人的语音控制方法,通过从交互数据库中提取交互过程,对控制指令进行多源角度分析,识别所述控制指令中的指令模糊数据,计算指令模糊表征值,划分所述控制指令的指令执行倾向,确定指令执行方式,响应于弱指令执...
  • 本发明提供一种语音唤醒方法、装置、电子设备及存储介质,属于数据处理技术领域,包括:根据唤醒语音确定头转向角度,头转向角度为唤醒语音的直面方向与待唤醒设备之间的位置夹角;将头转向角度发送至控制终端;接收并响应唤醒指令,唤醒指令是控制终端确定头...
  • 本发明公开了一种基于离线语音唤醒的多场景定时器控制方法及系统,该方法包括以下步骤:S1、通过离线语音唤醒建立自然交互的触发起点;S2、通过语音识别与语义理解确定定时任务的内容和意图;S3、根据语音内容与环境条件确定适用场景并生成对应控制策略...
  • 本申请涉及一种梦话监测方法及装置、智能设备与介质,所述方法包括:侦听语音信号,确定其中属于梦话类型的说话片段;提取所述说话片段的语音数据,基于所述语音数据确定对应的说话人身份;采用预设的语音识别模型对所述说话片段的语音数据进行识别,获得对应...
  • 本发明提供了一种远场语音识别方法及系统。该方法包括:构建三维视觉的机器人室内场景语义地图;在所述三维视觉的机器人室内场景语义地图上标注各材质的材料声学属性以构建空间声学指纹;在不同方位上分别采集语音信号并确定声源信息;将所述空间声学指纹以及...
  • 本发明涉及数字人语音交互技术领域,公开了融合情感计算的数字人直播语音交互系统。系统通过获取用户语音输入数据流,构建情感响应时间窗口,其起点为用户语音输入数据流的结束时刻,终点为预设最大响应截止时刻减去语音响应合成必要时长。系统实时获取用户的...
  • 本发明的基于多智能体的老年人信息获取语音交互系统及方法,系统包括语音采集模块形成原始语音信号;语音识别模块接收原始语音信号,通过压缩与编码处理及后端语音识别服务将语音转换为文本,形成用户文本指令信号;智能体处理模块接收领域特定请求信号,通过...
  • 本发明提出了多场景适用的车辆远程语音控制方法及系统,涉及车辆控制技术领域。包括在车辆端预存储多场景适用的多种提示语并进行编号;建立手机端与车辆的远程通信,在手机端对车辆端存储的多种提示语及编号进行展示;通过多模态检测技术获取车辆内及车辆外异...
  • 本发明涉及一种跨应用NLP智能体指令系统及方法,属于人工智能技术领域,该系统包括:意图管理服务器、意图识别及预处理单元、IPC协议代理单元和语音识别模块;IPC协议代理单元用于接收终端应用的注册意图BotId及回调函数;IPC协议代理单元接...
  • 本公开公开了一种内容生成方法、装置、存储介质及电子设备,涉及内容生成技术领域,包括:通过至少一个采集设备获取目标用户基于当前阅读内容的多维度输入数据,其中,目标用户是具有目标感知需求的用户;确定多维度输入数据对应的至少一个指令信息;对至少一...
  • 本发明适用于语音识别与智能风控交互技术领域,提供了一种基于人工智能的语音数据识别方法及系统,所述方法包括:确定客服的未来用户的特定用户画像,并获取客服的历史语音沟通数据,以及针对未来用户生成的若干风险提示片段。本发明通过引入人工智能技术对历...
  • 本申请提供了一种语音识别方法、装置、电子设备和计算机可读存储介质,可以应用于语音识别技术领域。该方法包括:响应于接收到来自电力施工现场的语音信号,通过对降噪后的语音信号进行能量分布特征与谱熵特征的联合分析,从降噪后的语音信号中提取目标语音信...
  • 本申请提供了一种多模态语音交互方法、装置及智能设备,适用于智能语音交互技术领域,应用于智能设备,方法包括:响应于检测到的语音活动,提取语音活动中的第一语音数据,并获取与第一语音数据同步拍摄的视频数据,视频数据中拍摄有多个不同用户。从视频数据...
  • 本申请实施例公开了一种意图识别方法、装置以及电子设备。该方法包括:获取待识别信息;基于待识别信息和多个自然语言理解模型,得到多个预测意图和多个预测意图各自对应的槽位数量;若多个预测意图存在不同,基于多个预测意图各自对应的槽位数量,得到意图识...
技术分类