Document
拖动滑块完成拼图
专利交易 积分商城 国际服务 IP管家助手 科技果 科技人才 商标交易 会员权益 需求市场 关于龙图腾 更多
 /  免费注册
到顶部 到底部
清空 搜索
最新专利技术
  • 本发明公开了基于语义分析的智能家居用户行为预测方法,涉及自然语言处理技术领域,该方法包括以下具体步骤:数据采集:通过语音采集设备、用户输入界面、智能家居网关及反馈接口分别采集用户交互数据、设备操作历史数据和用户交互反馈数据,经格式化处理后统...
  • 本发明涉及自动化测试技术领域,公开了一种车载语音测试方法、装置、车辆及介质,方法包括:获取语料测试集,语料测试集中的各条语料均基于预设规则生成,且每一语料对应设有预期领域和预期意图;解析语料测试集,生成包含多条语料及其对应的预期领域和预期意...
  • 本发明提供了一种云视频协同处理方法、系统及存储介质,该方法包括:提取待处理云视频中的语音数据;对语音数据进行音频分类,得到对白语音,对对白语音进行语音识别,得到语音识别结果;根据语音识别结果确定对白语音中的语音敏感词,将语音敏感词对应的视频...
  • 本发明公开了一种基于人工智能的英语口语实时纠错与反馈系统,包括语音识别模块、NLP与智能分析引擎、反馈发生器、用户界面、用户接收反馈和用于实时语音输入,所述语音识别模块、NLP与智能分析引擎、反馈发生器、用户界面、用户接收反馈和用于实时语音...
  • 本发明公开了一种基于文本预测的大模型实时语音文本意图识别方法及系统,包括:获取用户的实时语音数据,通过流式语音识别接口进行实时语音识别处理,得到部分转录文本;将部分转录文本输入掩码语言模型进行文本预测,生成若干个高可信度的完整句子候选;基于...
  • 本发明涉及基于语音识别生成影像的系统和方法。基于语音识别生成影像的系统包括:语音识别装置,其配置为获取用户的语音信息并且将获取的语音信息转换为文本形式的用户需求信息;语言理解装置,其与语音识别装置电连接,所述语言理解装置配置为对文本形式的用...
  • 本申请公开一种基于多模态融合的交互控制方法、系统、电子设备及存储介质,涉及车机交互领域,包括:采集交互数据与环境安全数据,交互数据包括用户语音指令、声纹特征、用户视觉信息以及方向盘压力数据;基于交互数据中的声纹特征进行声纹分级权限认证,划分...
  • 本申请公开了一种基于多模态的设备唤醒方法及装置、存储介质及电子装置,涉及智慧家庭技术领域,该基于多模态的设备唤醒方法包括:对声源信号进行定位,得到发出所述声源信号的声源在第一坐标系中的第一物理坐标,其中,所述第一坐标系为以语音交互设备的收音...
  • 本申请公开了一种数字虚拟对象的语音交互方法、装置及电子设备,应用于交互终端设备,所述方法包括:获取语音采集装置采集的第一语音数据;对第一语音数据进行特征提取,得到语音内容特征;根据语音内容特征,从多个预设数字虚拟对象中,确定与语音内容特征匹...
  • 本申请公开一种车载AR眼镜融合语音的交互方法、系统及电子设备,涉及车载交互领域,包括:设备连接的步骤S1、设备确认的步骤S2、设备执行的步骤S3;设备连接的步骤S1包括,通过车外语音助手,启动AR眼镜与车辆的数据连接;设备确认的步骤S2包括...
  • 本发明公开了一种语音交互方法、装置及设备,其中的方法包括:对本轮交互请求的语音进行识别,得到每个用户的语音;将每个用户的语音转换为文本;对每个用户的语音对应的文本进行语义解析,提取关键词,对每个用户的语音对应的文本进行主题分析,得到文本对应...
  • 本申请提供了一种智能设备的语音控制方法、装置、电子设备和存储介质,该方法包括:在得到语音控制指令时,确定语音控制指令中的目标声纹信息,以及语音控制指令对应的目标场景信息;确定与目标声纹信息匹配的目标设备指令集,并根据目标场景信息,从目标设备...
  • 本发明公开了一种基于动态推理标签的长记忆语音多轮对话方法、装置、终端及存储介质,涉及AI语音对话领域。方法包括:在与目标用户进行多轮语音交互时,当接收到目标语音交互内容,对当前对话的多轮语音交互数据进行意图话题推理,得到目标意图话题;获取所...
  • 本发明提供了一种室内物联控制方法、电子设备及介质。方法包括:获取语音信息和环境图像,语音信息包括属于控制者的控制语音,环境图像包括控制者的图像;从控制语音中识别待控制设备的设备名称、控制指令和待控制设备相对控制者的相对位置信息;根据相对位置...
  • 本发明创造涉及一种语音控制方法及相关设备。其中,该方法包括:获取音频片段;将音频片段发送至语音识别平台,获取语音识别平台对音频片段的语音识别结果,语音识别结果包括音频片段的语音识别文本以及基于语音识别文本提取的第一语义解析信息;将语音识别文...
  • 本发明创造涉及一种语音控制方法及相关设备。其中,该方法包括:获取音频片段;将音频片段发送至语音识别平台,从语音识别平台获取音频片段对应的控制指令;其中,语音识别平台用于对音频片段进行自动语音识别处理得到音频片段对应的语音识别文本,对语音识别...
  • 本公开实施例公开了一种语音交互芯片、方法和电子设备,该语音交互芯片包括:语音交互芯片包括处理器、VAD加速器、KWS加速器和神经网络加速器。其中,VAD加速器,用于在确定音频流数据为人声的情况下,唤醒KWS加速器;KWS加速器,用于在确定音...
  • 本申请涉及一种基于多风格提示词的语音识别方法。所述方法包括:基于目标语音信号和/或与所述目标语音信号关联的上下文信息,生成多风格提示词;将所述多风格提示词与所述目标语音信号的特征向量进行融合处理,得到语音增强特征;基于所述语音增强特征和所述...
  • 本发明属于语音交互与自然语言处理交叉技术领域,公开一种基于检索增强生成的语音大模型问答方法。通过 ASR 误差修正与场景化检索增强,答案的事实性准确率较传统方案提升,多轮对话的意图理解准确率提升,有效解决语音问答中事实性错误与上下文脱节问题...
  • 本申请涉及音频处理技术领域,公开了一种音频编辑方法、装置、设备、存储介质、程序产品。方法包括:检测目标音频的冗余词;确定冗余词的信息冗余度;根据信息冗余度,生成过渡时长;根据过渡时长,从目标音频中,获取第一音频片段和第二音频片段;基于所述第...
技术分类