Document
拖动滑块完成拼图
专利交易 积分商城 国际服务 IP管家助手 科技果 科技人才 商标交易 会员权益 需求市场 关于龙图腾 更多
 /  免费注册
到顶部 到底部
清空 搜索
最新专利技术
  • 本发明涉及语言识别技术领域,且公开了一种基于Ai辅助的语音转文字优化方法,本申请通过多尺度特征自适应提取、联合建模以及持续学习机制实现了全局协同优化。相较于现有技术中模块化处理流程导致的误识别放大问题,本申请通过动态调整特征提取参数和联合编...
  • 本公开涉及语音识别领域,关于一种基于多语种语音识别大模型的识别方法、装置及设备。基于多语种语音识别大模型的识别方法包括:获取待识别语音;基于所述待识别语音和多语种语音识别大模型,得到所述待识别语音的目标识别文本,其中,所述多语种语音识别大模...
  • 本申请涉及一种语音识别自适应优化方法及装置、智能设备与介质,所述方法包括:响应用户产生的语音数据,为本地部署的语音识别模型加载用户的个性化参数,由该模型识别语音数据携带的语音指令文本,根据语音指令文本控制目标智能设备执行操作;在预设时间窗口...
  • 本发明涉及智能医疗信息处理技术领域,公开了一种基于自然语言处理的智能语音交互机器人,其包括机器人本体及安装于机器人本体上的交互系统,交互系统包括语音接收模块、优化识别模块、语义解析模块、意图识别模块、任务执行模块和内容输出模块。本申请,通过...
  • 本公开实施例提供一种数据处理方法、装置、设备、计算机可读存储介质及产品,该方法包括:获取终端设备发送的提问请求,提问请求中包括提问内容以及播放进度,提问内容为基于用户在终端设备播放音频文件至播放进度时发起的,音频文件包括至少一个预设音色关联...
  • 本发明涉及音频数据分析领域,尤其涉及一种音频数据处理方法、装置、设备及存储介质。该方法包括以下步骤:通过环绕式麦克风阵列对会议室进行多角度音频持续采集及场景噪音抑制,生成滤波优化音频信号;根据滤波优化音频信号进行三维时间差定位计算,得到精准...
  • 本申请公开实时会议记录方法及电子设备,方法包括:对实时语音识别模型进行加载处理,并对设备运行环境进行离线环境校验处理,以使得实时语音识别模型可调用和离线环境校验结果;根据离线环境校验结果,若判定设备运行环境满足离线安全条件,则对会议语音进行...
  • 本发明公开了一种轨道交通语音识别辅助控制方法及系统,所述方法包括 : 采集驾驶室内的音频并进行降噪处理;分离出音频数据中的语音部分;对音频数据中的语音部分进行识别,将其转换为文本;对转换出的文本进行意图分析,获取其操作意图、控制对象和控制参...
  • 本公开提供了一种语音交互方法、系统、教育辅助管理平台及设备。所述语音交互方法包括:响应于用户启动录入语音操作,跟随动态录入的语音内容同步提取出每个相邻采集时刻之间的若干个子文本;响应于用户结束录入语音操作,基于语音录入过程中的所有所述子文本...
  • 本发明涉及一种针对音频内部特殊信息的处理方法,包括从公开数据获取与目标任务相关的若干条语音文件,借助Python中自带的jons工具包对音频文件和标记打包成名为AlShell的数据集。使用python代码对AlShell中的音频文件进行分词...
  • 本发明涉及基于语料库构建的老人语义识别系统,包括:语音信号采集模块,用于采集语音信息;语义识别模块,识别所述语音信息并判断语义是否清楚,若不清楚则判断所述语音信息的模糊程度;问答输出模块,接收并输出若干问答语句与老人交互以获取实际意图;人工...
  • 本发明涉及超纯水仪控制技术领域,并公开了一种基于声学定位的超纯水仪免唤醒语音控制方法及系统。该方法通过至少一个主监测点与至少两个副监测点接收操作用户发出的语音信号,根据语音信号确定延时信息与声压值。对主监测点接收的语音信号进行识别以获得识别...
  • 本公开提出一种基于语言模型的设备控制优化方法及装置,涉及设备控制技术领域。其中,方法包括:在没有接收到用户控制指令的情况下,获取接入设备的更新信息和预先构建的初始正则表达式库;将初始正则表达式库中的正则表达式拆分为多个语义组件;利用语言模型...
  • 本申请涉及一种语音控制指令识别方法及装置、智能中控设备与介质,所述方法包括:侦听语音信号,基于所述语音信号确定对应的语音数据;利用预设的干扰规则库中的多个音源干扰规则识别所述语音数据是否属于干扰语音,当属于干扰语音时,停止执行后续流程;当所...
  • 本发明提供了一种车载语音交互方法、装置和电子设备。其中,该方法包括:通过车载内置的传感器获取用户的多模态信号;通过车辆总线或车载信息娱乐系统获取车辆场景信号;其中,车辆场景信号为表征当前车辆行驶场景的状态信号;将多模态信号和车辆场景信号输入...
  • 本申请涉及语音识别技术领域,公开了一种车内语音控制指令识别方法、电子设备及存储介质,方法包括:获取车内语音数据、车内乘员的面部图像数据以及辅助数据;其中,辅助数据包括乘员的生理特征数据与乘坐状态特征数据中的至少一种;基于车内语音数据、面部图...
  • 本发明提供了一种语音交互方法、装置、电子设备及计算机可读存储介质,能够在车载多屏幕的场景下,提高语音交互的操作准确性;方法包括:在指令语义表征对目标应用状态的应用进行操作的情况下,基于用户位置、目标应用状态、以及应用状态集合进行多级筛选,从...
  • 本申请实施例公开了一种基于大语言模型的教学笔记生成方法、设备及介质,属于人工智能技术领域,解决现有技术生成的课堂笔记缺乏内容结构化和知识关联性,可读性较差,难以用于有效复习的问题。通过拾音设备实时采集课堂教学环境中的教师语音信号,并通过预置...
  • 本发明涉及一种毛绒玩具的防误触发语音唤醒控制系统及其使用方法,属于智能玩具技术领域,包括设置在毛绒玩具本体内的语音采集模块、信号处理模块、特征比对模块、唤醒执行模块、环境采集模块、模式选择模块,所述语音采集模块包括主麦克风和次麦克风,所述信...
  • 本发明实施例涉及车辆语音控制技术领域,公开了一种车辆的语音交互方法、装置及计算机可读存储介质,该方法包括:对获取的第一语音信号进行语音识别,得到第一语音识别结果;基于大模型对第一语音识别结果和多个交互域分别对应的预设提示进行处理,得到意图结...
技术分类