Document
拖动滑块完成拼图
专利交易 积分商城 国际服务 IP管家助手 科技果 科技人才 商标交易 会员权益 需求市场 关于龙图腾 更多
 /  免费注册
到顶部 到底部
清空 搜索
最新专利技术
  • 本公开提供了一种语音交互方法、系统、教育辅助管理平台及设备。所述语音交互方法包括:响应于用户启动录入语音操作,跟随动态录入的语音内容同步提取出每个相邻采集时刻之间的若干个子文本;响应于用户结束录入语音操作,基于语音录入过程中的所有所述子文本...
  • 本发明涉及一种针对音频内部特殊信息的处理方法,包括从公开数据获取与目标任务相关的若干条语音文件,借助Python中自带的jons工具包对音频文件和标记打包成名为AlShell的数据集。使用python代码对AlShell中的音频文件进行分词...
  • 本发明涉及基于语料库构建的老人语义识别系统,包括:语音信号采集模块,用于采集语音信息;语义识别模块,识别所述语音信息并判断语义是否清楚,若不清楚则判断所述语音信息的模糊程度;问答输出模块,接收并输出若干问答语句与老人交互以获取实际意图;人工...
  • 本发明涉及超纯水仪控制技术领域,并公开了一种基于声学定位的超纯水仪免唤醒语音控制方法及系统。该方法通过至少一个主监测点与至少两个副监测点接收操作用户发出的语音信号,根据语音信号确定延时信息与声压值。对主监测点接收的语音信号进行识别以获得识别...
  • 本公开提出一种基于语言模型的设备控制优化方法及装置,涉及设备控制技术领域。其中,方法包括:在没有接收到用户控制指令的情况下,获取接入设备的更新信息和预先构建的初始正则表达式库;将初始正则表达式库中的正则表达式拆分为多个语义组件;利用语言模型...
  • 本申请涉及一种语音控制指令识别方法及装置、智能中控设备与介质,所述方法包括:侦听语音信号,基于所述语音信号确定对应的语音数据;利用预设的干扰规则库中的多个音源干扰规则识别所述语音数据是否属于干扰语音,当属于干扰语音时,停止执行后续流程;当所...
  • 本发明提供了一种车载语音交互方法、装置和电子设备。其中,该方法包括:通过车载内置的传感器获取用户的多模态信号;通过车辆总线或车载信息娱乐系统获取车辆场景信号;其中,车辆场景信号为表征当前车辆行驶场景的状态信号;将多模态信号和车辆场景信号输入...
  • 本申请涉及语音识别技术领域,公开了一种车内语音控制指令识别方法、电子设备及存储介质,方法包括:获取车内语音数据、车内乘员的面部图像数据以及辅助数据;其中,辅助数据包括乘员的生理特征数据与乘坐状态特征数据中的至少一种;基于车内语音数据、面部图...
  • 本发明提供了一种语音交互方法、装置、电子设备及计算机可读存储介质,能够在车载多屏幕的场景下,提高语音交互的操作准确性;方法包括:在指令语义表征对目标应用状态的应用进行操作的情况下,基于用户位置、目标应用状态、以及应用状态集合进行多级筛选,从...
  • 本申请实施例公开了一种基于大语言模型的教学笔记生成方法、设备及介质,属于人工智能技术领域,解决现有技术生成的课堂笔记缺乏内容结构化和知识关联性,可读性较差,难以用于有效复习的问题。通过拾音设备实时采集课堂教学环境中的教师语音信号,并通过预置...
  • 本发明涉及一种毛绒玩具的防误触发语音唤醒控制系统及其使用方法,属于智能玩具技术领域,包括设置在毛绒玩具本体内的语音采集模块、信号处理模块、特征比对模块、唤醒执行模块、环境采集模块、模式选择模块,所述语音采集模块包括主麦克风和次麦克风,所述信...
  • 本发明实施例涉及车辆语音控制技术领域,公开了一种车辆的语音交互方法、装置及计算机可读存储介质,该方法包括:对获取的第一语音信号进行语音识别,得到第一语音识别结果;基于大模型对第一语音识别结果和多个交互域分别对应的预设提示进行处理,得到意图结...
  • 本发明涉及一种基于铁路视频场景的智能体交互方法,包括:获取用户向智能体传达的自然语言指令;智能体根据所述自然语言指令,识别需要向铁路视频监控系统传输的事务操作指令,由铁路视频监控系统根据事务操作指令,控制系统中至少一个电子模块执行事务操作,...
  • 本发明涉及一种基于人形机器人的语音交互方法、系统及存储介质,涉及人形机器人技术领域;语音交互方法,包括:采集并判断预设的交互区间内的语音信号,结合预设的唤醒关键词确定目标角色位置,识别目标交互对象;提取所述目标交互对象的语音特征结合交互对象...
  • 本发明涉及语音信号处理技术领域,具体为基于人工智能的音视频语义增强处理方法,采样音视频变化幅度并构建对比序列,分析趋势识别主导模态,设定融合权重并标记增强区间,执行模态语义修复,对齐时间帧输出语义增强结果。本发明中,通过对音频频谱与视频帧边...
  • 本发明提供一种语音活动检测方法、装置、电子设备及存储介质,其中方法包括:将待识别语音和历史交互文本输入语音活动检测模型进行意图识别和语义完整性识别中的至少一种,语音活动检测模型能够直接从待识别语音中提取并理解丰富的声学特征和语义信息,由此语...
  • 本发明提出基于大模型的智能会议多模态交互优化方法及系统,方法包括:获取会议多模态数据,并构建基于图像内容快照锁定机制的锁定图像帧集合;将所述多模态数据流的每条模态数据输入预训练的大模型以生成对应模态数据的嵌入向量,利用每一对嵌入向量之间的相...
  • 本发明涉及语音识别技术领域,旨在解决重口音语音识别模型训练样本匮乏的问题。提供一种训练语音识别模型的样本集生成方法、装置和计算机设备,其中方法包括:将目标命令词解码为无声调原始拼音序列;基于常见非标准发音规律构建的重口音规则库(重口音指声母...
  • 本公开提供一种语音大模型的训练方法及装置、设备、介质,该语音大模型的训练方法包括:将训练语音数据子集输入语音大模型,获取语音大模型中大语言模型模块输出的、训练语音数据子集的预测概率分布;根据预测概率分布和所述真实概率分布,确定熵加权交叉熵损...
  • 本发明提供一种语音识别方法、装置、电子设备、存储介质和程序产品,涉及语音处理技术领域。该方法包括:将待识别语音输入至语音识别模型,得到语音识别模型输出的语音识别结果;语音识别模型是基于样本待识别语音对应的第一语音识别结果,与样本待识别语音对...
技术分类