Document
拖动滑块完成拼图
专利交易 商标交易 积分商城 国际服务 IP管家助手 科技果 科技人才 会员权益 需求市场 关于龙图腾 更多
 /  免费注册
到顶部 到底部
清空 搜索
最新专利技术
  • 本发明公开了一种用于语音识别NPU的动态自适应精度切换方法,针对端侧语音识别NPU在多场景下面临的精度与能效无法兼顾、固定精度硬件资源浪费严重、软件切换效率低且误差累积的核心问题,通过构建4×4可重构MAC子单元阵列与开关矩阵的硬件架构,结...
  • 本申请提供了一种语音识别方法、系统和设备,可以应用于语音处理技术领域。该语音识别方法包括:响应于语音识别指令,获取原始音频数据,原始音频数据包括带有背景音乐噪声的语音信号;对语音信号进行时频变换,以得到初始频谱特征;将初始频谱特征输入预先训...
  • 本申请涉及一种基于人工智能的家暴风险识别方法、系统、设备及介质。所述方法包括:对音频数据进行预处理得到语音段;对语音段进行自动语音识别得到对话文本序列,并进行声学特征提取得到时序声学特征序列;对对话文本序列进行基于上下文语义与风险知识的关键...
  • 本发明提供基于大模型的通话速记方法及管理系统,涉及通话速记技术领域,方法包括:在接收到用户授予的速记权限后,采集该用户的语音,采集的各用户语音组成语音流;对语音流进行预处理,得到处理语音流;将处理语音流转换为包含发言内容、时间戳和用户标识的...
  • 本发明公开了一种基于语音活动检测和意图识别的全双工智能语音交互系统,所述系统包括:语音识别模块,用于将语音流转换为文本;语音活动检测模块,用于检测语音活动;意图识别模块,用于判断用户语音是否具有明确意图;打断控制模块,用于根据语音活动检测结...
  • 本发明涉及一种通过思维树的推理提示进行多语言语音翻译生成优化的方法,属于语音翻译技术领域。本发明包括步骤:构建包括自动语音识别模块、思维树推理模块、大模型微调模块;通过自动语音识别模块得到源语言对应的转录文本;通过思维树推理得到高质量的翻译...
  • 基于T形麦克风阵列动态降噪的车内语音定位系统及方法,属于声源定位与车载语音信号处理技术领域。本发明为解决车内语音定位技术因环境噪声复杂、混响严重、阵列尺寸受限以及传统降噪策略静态僵化导致定位精度低、鲁棒性差、实时性不足的问题,它包括:T形麦...
  • 本发明实施例公开了一种穿戴设备和对应的控制方法、系统和装置。通过获取预定时间段内麦克风采集的音频信号和惯性传感器采集的加速度信号,所述音频信号和加速度信号为与牙齿咬合相关的信号,根据音频信号和加速度信号获取输入特征,输入特征包括与牙齿咬合相...
  • 本发明公开了一种基于语音交互的智能充电宝控制系统,涉及语音交互技术领域,包括麦克风阵列模块,用以同步采集包含用户语音指令的多通道原始音频信号;噪声特征建模模块,其与所述麦克风阵列模块相连,用以在未检测到用户语音活动的时间段内,对所述多通道原...
  • 本发明提供了一种车外语音控制方法、装置及设备,所述方法包括:监测车辆的实时状态;判断所述实时状态是否满足车外语音开启条件;若满足,则开启车外语音功能;若不满足,则关闭车外语音功能。本发明通过监测车辆实时状态动态控制车外语音功能启停,仅在满足...
  • 本发明提供了一种语音对话任务的交接方法及装置、服务器、系统,其中,该方法包括:获取目标用户与第一语音设备之间的语音对话任务的历史对话数据;监测第一语音设备在预设邻域范围内的若干个第二语音设备的传感器数据;根据传感器数据在若干个第二语音设备中...
  • 本发明公开了一种铁路运输调度指挥工作录音的语义识别及风险评估系统,涉及人工智能与铁路交通运输安全交叉技术领域,包括语音采集与预处理模块、铁路调度专业语义识别模块、风险评估双引擎模块、实时预警与反馈优化模块,语音采集与预处理模块用于采集语音数...
  • 本申请提供一种语音交互方法、装置、设备、介质及程序产品,涉及人机交互技术领域,用于在大屏设备在语音交互时,降低响应的延迟时间,提高响应准确率。该方法包括:通过对指示用户语音指令内容的待识别文本正则识别,得到关于对大屏设备控制意图的目标关键词...
  • 本申请提供了一种语音唤醒方法、装置、设备及存储介质,该语音唤醒方法可以包括:在检测到用户输入唤醒音频的情况下,获取唤醒音频对应的音频感知信息,该音频感知信息用于表征用户与第一设备之间的空间关系;以及,获取用户的视觉信息,该视觉信息用于表征用...
  • 本发明公开了一种基于大语言模型的儿童问诊方法、设备、介质和程序产品,涉及智能辅助医疗领域,旨在解决智能问诊过程中存在的单通道降噪方法无法兼顾语音质量和空间信息,导致语音失真和定位不准的问题。本发明通过将问诊语音数据进行短时傅里叶变换获取问诊...
  • 本发明提供一种智能语音交互系统及方法,涉及电子信息技术领域,包括:采集校准模块,用于通过多通道声学传感器阵列实时采集环境中的混合音频信号,并在传感器阵列上设定四个位于角点的参考定位点,形成四边形结构;基于四边形的面积特性生成几何修正值,且同...
  • 本发明涉及电子烟控制与声纹识别技术领域,具体公开了基于自然语言理解的电子烟智能语音交互与控制系统,该系统包括语音采集与前端处理模块、多模态特征融合分析模块、动态语义理解与意图决策模块、主动健康干预策略生成模块及控制执行与反馈模块。通过从语音...
  • 本申请公开一种适配车机系统的可见即说控制方法、系统、电子设备及存储介质,涉及车辆安全预警领域,包括:监听应用页面的生命周期,获取页面核心信息;扫描应用页面控件的层级树结构,监听控件元素的变化,通过层级树结构获取控件核心信息并上报云端服务器,...
  • 本发明涉及一种人工智能心理治疗设备,属于人工智能技术领域,该设备包括:语音识别模块、语义理解与对话生成模块和TTS语音合成模块;语音识别模块,用于接收用户的语音信息,并将语音信息转换为文本信息;语义理解与对话生成模块,用于对语音信息和文本信...
  • 本发明提供一种基于发射端模型的语义适配层训练方法,涉及智能通信技术领域,包括:对于不匹配用户,基站构建语义适配层;对于各不匹配用户,基站使用发端模型对训练数据进行编码并传输,得到的第一接收信号经语义适配层后得到第三接收信号,同时使用与不匹配...
技术分类