Document
拖动滑块完成拼图
专利交易 商标交易 积分商城 国际服务 IP管家助手 科技果 科技人才 会员权益 需求市场 关于龙图腾 更多
 /  免费注册
到顶部 到底部
清空 搜索
最新专利技术
  • 本申请涉及家禽智慧养殖与农业信息感知技术领域,公开了基于音频的鸡只热应激等级划分方法,包括以下步骤:在预设温度梯度下采集包含鸡只活动声音及设备噪声的原始音频,利用记录的环境温度参数进行分类标记;对音频进行时域切分、带通滤波及幅度归一化处理,...
  • 本发明公开了一种基于视觉Transformer的鸟鸣声识别方法,包括:S1、对原始鸟类鸣声音频信号进行预处理,生成梅尔频谱图;S2、构建鸟鸣声识别模型并进行训练;S3、将梅尔频谱图输入至训练好的鸟鸣声识别模型中,提取特征并进行分类,输出鸟类...
  • 本申请提供了基于动态加权混合损失的说话人识别模型训练方法及装置,包括:使用第一损失函数对声纹特征提取网络进行训练;冻结声纹特征提取网络的网络参数,基于声纹特征提取网络提取训练集样本的嵌入向量,并基于嵌入向量训练生成式PLDA网络;基于生成式...
  • 本公开提供一种用于语音处理方法、电子设备、存储介质及程序产品。所述方法包括:获取第一语音;从所述第一语音中提取第一特征和至少一个第二特征;获取与所述第一特征同类别的第三特征;基于所述第三特征和所述至少一个第二特征生成第二语音。本公开所述用于...
  • 本发明公开了一种用于语音识别NPU的动态自适应精度切换方法,针对端侧语音识别NPU在多场景下面临的精度与能效无法兼顾、固定精度硬件资源浪费严重、软件切换效率低且误差累积的核心问题,通过构建4×4可重构MAC子单元阵列与开关矩阵的硬件架构,结...
  • 本申请提供了一种语音识别方法、系统和设备,可以应用于语音处理技术领域。该语音识别方法包括:响应于语音识别指令,获取原始音频数据,原始音频数据包括带有背景音乐噪声的语音信号;对语音信号进行时频变换,以得到初始频谱特征;将初始频谱特征输入预先训...
  • 本申请涉及一种基于人工智能的家暴风险识别方法、系统、设备及介质。所述方法包括:对音频数据进行预处理得到语音段;对语音段进行自动语音识别得到对话文本序列,并进行声学特征提取得到时序声学特征序列;对对话文本序列进行基于上下文语义与风险知识的关键...
  • 本发明提供基于大模型的通话速记方法及管理系统,涉及通话速记技术领域,方法包括:在接收到用户授予的速记权限后,采集该用户的语音,采集的各用户语音组成语音流;对语音流进行预处理,得到处理语音流;将处理语音流转换为包含发言内容、时间戳和用户标识的...
  • 本发明公开了一种基于语音活动检测和意图识别的全双工智能语音交互系统,所述系统包括:语音识别模块,用于将语音流转换为文本;语音活动检测模块,用于检测语音活动;意图识别模块,用于判断用户语音是否具有明确意图;打断控制模块,用于根据语音活动检测结...
  • 本发明涉及一种通过思维树的推理提示进行多语言语音翻译生成优化的方法,属于语音翻译技术领域。本发明包括步骤:构建包括自动语音识别模块、思维树推理模块、大模型微调模块;通过自动语音识别模块得到源语言对应的转录文本;通过思维树推理得到高质量的翻译...
  • 基于T形麦克风阵列动态降噪的车内语音定位系统及方法,属于声源定位与车载语音信号处理技术领域。本发明为解决车内语音定位技术因环境噪声复杂、混响严重、阵列尺寸受限以及传统降噪策略静态僵化导致定位精度低、鲁棒性差、实时性不足的问题,它包括:T形麦...
  • 本发明实施例公开了一种穿戴设备和对应的控制方法、系统和装置。通过获取预定时间段内麦克风采集的音频信号和惯性传感器采集的加速度信号,所述音频信号和加速度信号为与牙齿咬合相关的信号,根据音频信号和加速度信号获取输入特征,输入特征包括与牙齿咬合相...
  • 本发明公开了一种基于语音交互的智能充电宝控制系统,涉及语音交互技术领域,包括麦克风阵列模块,用以同步采集包含用户语音指令的多通道原始音频信号;噪声特征建模模块,其与所述麦克风阵列模块相连,用以在未检测到用户语音活动的时间段内,对所述多通道原...
  • 本发明提供了一种车外语音控制方法、装置及设备,所述方法包括:监测车辆的实时状态;判断所述实时状态是否满足车外语音开启条件;若满足,则开启车外语音功能;若不满足,则关闭车外语音功能。本发明通过监测车辆实时状态动态控制车外语音功能启停,仅在满足...
  • 本发明提供了一种语音对话任务的交接方法及装置、服务器、系统,其中,该方法包括:获取目标用户与第一语音设备之间的语音对话任务的历史对话数据;监测第一语音设备在预设邻域范围内的若干个第二语音设备的传感器数据;根据传感器数据在若干个第二语音设备中...
  • 本发明公开了一种铁路运输调度指挥工作录音的语义识别及风险评估系统,涉及人工智能与铁路交通运输安全交叉技术领域,包括语音采集与预处理模块、铁路调度专业语义识别模块、风险评估双引擎模块、实时预警与反馈优化模块,语音采集与预处理模块用于采集语音数...
  • 本申请提供一种语音交互方法、装置、设备、介质及程序产品,涉及人机交互技术领域,用于在大屏设备在语音交互时,降低响应的延迟时间,提高响应准确率。该方法包括:通过对指示用户语音指令内容的待识别文本正则识别,得到关于对大屏设备控制意图的目标关键词...
  • 本申请提供了一种语音唤醒方法、装置、设备及存储介质,该语音唤醒方法可以包括:在检测到用户输入唤醒音频的情况下,获取唤醒音频对应的音频感知信息,该音频感知信息用于表征用户与第一设备之间的空间关系;以及,获取用户的视觉信息,该视觉信息用于表征用...
  • 本发明公开了一种基于大语言模型的儿童问诊方法、设备、介质和程序产品,涉及智能辅助医疗领域,旨在解决智能问诊过程中存在的单通道降噪方法无法兼顾语音质量和空间信息,导致语音失真和定位不准的问题。本发明通过将问诊语音数据进行短时傅里叶变换获取问诊...
  • 本发明提供一种智能语音交互系统及方法,涉及电子信息技术领域,包括:采集校准模块,用于通过多通道声学传感器阵列实时采集环境中的混合音频信号,并在传感器阵列上设定四个位于角点的参考定位点,形成四边形结构;基于四边形的面积特性生成几何修正值,且同...
技术分类