Document
拖动滑块完成拼图
专利交易 积分商城 国际服务 IP管家助手 科技果 科技人才 商标交易 会员权益 需求市场 关于龙图腾 更多
 /  免费注册
到顶部 到底部
清空 搜索
最新专利技术
  • 本申请公开了一种基于情景化理解的车辆设备控制方法、装置、设备及存储介质,涉及车辆设备控制技术领域,公开了基于情景化理解的车辆设备控制方法,包括:接收用户输入的语音信号并对所述语音信号进行语义解析,得到语义解析结果;基于所述语义解析结果更新对...
  • 本申请公开了一种智能催收方法、设备、存储介质及装置,包括:通过预设催收大模型对待催收用户属性数据进行催收策略定制,获得初始催收策略;基于初始催收策略从预设机器人中筛选目标机器人执行初始催收策略,并采集催收语音流;对催收语音流进行意图识别以及...
  • 本发明涉及语音识别领域,公开了基于大语言模型的同步语音识别系统及方法,用于提高同步语音识别的准确性和实时性。包括获取原始音频流,对原始音频流开展两级回声消除处理,快速移除主要线性回声反射信号,分析剔除残留非线性回声与环境混响,对消除回声后的...
  • 本发明提供了一种信息系统语音交互方法、装置、设备和存储介质,属于人工智能技术领域,包括:将信息系统的交互封装为SDK;将语音输入转换成文本;形成符合数据结构约定的系统提示词,以文本为用户提示词;基于大语言模型评分历史数据,动态选择一个大语言...
  • 本申请提供了一种音频处理方法、装置、服务器及存储介质,所述方法包括:接收待调整的原始音频以及对应的台词;将所述台词转换为对应的文本序列;将所述原始音频和文本序列执行对齐操作,得到音频‑文本的对应关系;接收目标文本;根据所述目标文本从所述文本...
  • 本申请提出一种语音交互方法及相关装置,涉及语音识别技术领域。所述语音交互方法包括:接收用户输入的第一语音,并将所述第一语音转换为第一文本;根据历史语音交互对应的历史交互文本和所述第一文本,确定所述第一语音是否具有纠错意图;在所述第一语音具有...
  • 本发明用于对话交互系统技术领域,具体公开了一种基于心理干预人工智能模型的诱导式对话交互系统,包括语音识别模块、深度语言模块、语音输出模块、闭合反馈模块和异常情况处理模块,所述语音识别模块通过无线信号与深度语言模块连接,所述深度语言模块连接通...
  • 本发明涉及智能语音交互技术领域,公开了一种AI语音故事盒及其交互系统,包括:故事盒本体、中央处理器、存储器、语音处理模块、按键处理模块、蓝牙通信模块、音频输出模块、情绪识别模块、状态指示单元、多个物理按键和扬声器单元,所述多个物理按键包括开...
  • 本申请提供了一种语音唤醒方法、装置、电子设备、存储介质及计算机程序产品,涉及技术领域为:机器人控制技术领域,方法包括:在通过语音预唤醒之后,获取预唤醒源对应位置的图像数据;确定图像数据中的目标兴趣部位的姿态信息和朝向信息;基于姿态信息和朝向...
  • 本申请涉及人工智能与语音对话技术领域,公开了基于检索增强生成与多模型协同的语音交互方法及其应用,方法包括:语音采集与预处理;本地多轮意图识别;本地RAG检索与候选聚合;决策与云端生成;反馈、合成与持久化;本发明还提供基于检索增强生成与多模型...
  • 本申请提供了一种语音控制方法、装置、电子设备、计算机可读存储介质及计算机程序产品、计算机程序产品及计算机可读存储介质;方法包括:响应于用户针对显示界面的指令生成请求,获取指令生成请求携带的控制语音流以及显示界面对应的界面截图;对控制语音流进...
  • 本申请提供一种语音交互方法、车辆及存储介质,涉及语音交互技术领域。该方法在与语音交互系统交互时,若满足预设条件,则获取目标人员在第一设定时段内的第一眼动数据集;其中,第一设定时段的计时起点为目标人员发出目标语音指令的结束时刻;基于第一眼动数...
  • 本申请涉及语音识别技术领域,公开了一种应用于报警器的通话全流程语音识别控制方法及系统,该方法包括:针对模拟生成的语音数据,应用控制器调用语音识别模块进行离线语音识别,若语音识别模块识别到语音指令后,则将识别成功的语音指令内容解析为加密通讯内...
  • 本申请公开了一种辅助电网调度的智能语音人机交互装置,与电网调度系统连接,包括:语音采集模块、核心处理单元、通信模块;所述语音采集模块用于采集语音数据;所述核心处理单元与所述语音采集模块连接,包括语音识别引擎、自然语言处理模块、逻辑控制模块,...
  • 本发明公开了一种宽带安装地址的推荐方法、装置、电子设备及存储介质。该方法包括:获取待进行宽带安装用户的通话语音;对所述待进行宽带安装用户的通话语音进行语音识别,得到通话语音文本;将所述待进行宽带安装用户的通话语音在多个地址的方言发音样本中进...
  • 本发明涉及语音识别技术领域,公开了一种基于蓝牙音频流的实时语音识别方法,包括:解析位分配参数以计算量化比特分布并生成频域置信度掩码,监测解码器丢包掩盖状态标志位,在算法激活时强制设定掩码为阻断阈值,并在恢复期控制掩码权重梯度回升,利用最终掩...
  • 本申请公开了一种显示设备和语音播报方法,该方法包括:接收用户输入的第一语音,将所述第一语音发送至服务器,以指示所述服务器生成所述第一语音对应的回复音频数据流;通过网络接收所述回复音频数据流,每接收到预设大小的数据生成一个数据包;若生成第n个...
  • 本申请公开了一种敏感信息识别方法、装置、电子设备和存储介质,属于语音检测技术领域。该方法包括:从含有敏感信息的车载音频中提取至少一个人声片段;分别对至少一个所述人声片段进行声纹识别,得到每个所述人声片段属于司机语音的第一置信度;根据每个所述...
  • 本发明公开了支持双向多模态交互的听障辅助智能眼镜及沟通方法,涉及语音识别与处理技术领域,包括以下步骤:采集声源的位置和面部检测的水平坐标,基于声源的位置和面部检测的水平坐标,计算得到声源的声源到达角;采集每个声源的短时声纹特征,基于每个声源...
  • 本发明提供一种声纹识别模型训练、声纹识别方法及装置,训练方法包括:利用由技术提供方授权的特征提取工具对用户端的领域语音数据进行声学特征提取,得到非完整声学特征,特征提取工具用于在完整声学特征提取流程的至少一个中间环节输出至少一种中间特征作为...
技术分类