Document
拖动滑块完成拼图
专利交易 商标交易 积分商城 国际服务 IP管家助手 科技果 科技人才 会员权益 需求市场 关于龙图腾 更多
 /  免费注册
到顶部 到底部
清空 搜索
最新专利技术
  • 本申请涉及一种音频分割系统性能评估方法、装置、设备和介质。所述方法包括:获取目标音频信号的参考分割结果和音频分割系统针对所述目标音频信号进行预测得到的预测分割结果;所述参考分割结果包括多个类别的参考音频片段,所述预测分割结果包括多个类别的预...
  • 本申请涉及一种噪声测量方法、装置、电子设备及存储介质,其中,方法包括:基于预录制噪声数据和待测量场地信息生成噪声测量任务;基于噪声测量任务布置多个噪声测量记录装置,以利用多个噪声测量记录装置采集音频数据;基于预录制噪声数据判断音频数据中是否...
  • 本发明的实施例提供了对话轮次检测方法及计算机程序产品,涉及语音处理领域,方法包括:提取音频数据中的声学特征以及对应于声学特征的时间戳特征,将音频数据转写为与之相对应的语义文本,将声学特征转写为与之相对应的声学特征文本,以及将时间戳特征转写为...
  • 本申请提供了一种基于NLP和ASR的投诉电话智能分析方法和装置,涉及人工智能领域。该方法包括:获取保险投诉电话数据,并将保险投诉电话数据分别输入声学模型和语义模型;基于声学模型输出与保险术语相关的发音特征,并基于语义模型输出与保险领域相关的...
  • 本发明公开了一种电力设备声纹故障诊断方法及系统,通过获取待诊断电力设备的第一声纹信号;基于设置的目标信噪比,向第一声纹信号注入带限高斯噪声,得到第二声纹信号;将第二声纹信号输入故障诊断模型中,先提取第二声纹信号的局部空间纹理特征,得到第一特...
  • 本发明提供一种网约车的乘客性别识别方法、服务器及介质,涉及数据处理技术领域,该方法包括:在网约车达到订单的上车点后,获取网约车内的目标音频;检测目标音频是否包含预设个数且连续的数字;若是,则从目标音频中获取声学特征,并获取影响性别判断的语境...
  • 本申请公开一种车辆场景下抗干扰声纹识别系统、方法及电子设备,涉及语音识别领域,包括:语音采集模块,通过麦克风阵列实现定向拾音;声纹注册模块,用于采集并存储多场景下的车主唤醒词语音样本;声纹建模模块,基于GMM‑UBM框架构建并训练声纹模型;...
  • 本发明公开了基于改进DAS波束的弱声源声压级标定方法,涉及声源定位技术领域,用于解决弱声源定位反复的问题;本发明基于阵列几何参数构建距离矩阵并结合近场传播模型,对多个目标频率分别计算互谱矩阵和导向矢量获得多频声像图;对各频率声像结果进行归一...
  • 本发明涉及轨道车辆噪音分析处理技术领域,具体公开了一种轨道车辆噪音区分提取装置及方法,该装置包括采集模块、处理模块和输出模块,采集模块用于采集轨道车辆运行过程中的车厢混合噪音;处理模块用于对所采集的车厢混合噪音进行频率分解、噪音分类和分类后...
  • 本发明属于模式识别领域,公开了一种用于水下目标识别的融合模型,包括:信号预处理工作;提取音频信号中的特征组成本发明的数据集;将数据集按照8:1:1的比例划分为训练集、验证集和测试集;基于改进的MobileViT主干网络和基于多频谱注意力机制...
  • 本发明提供一种电子装配体的啸叫识别装置、方法、系统和存储介质,涉及声学信号处理技术领域。该啸叫识别装置包括:麦克风阵列、参考麦克风和采集与传输装置,采集与传输装置还用于转发各声学信号和噪声信号至数据处理装置;数据处理装置用于基于噪声信号,分...
  • 本发明实施例公开了一种融合语义噪声控制与难度自适应的听觉言语康复训练方法,涉及听觉言语康复与人工智能辅助语言训练技术领域包括:获取用户在听觉言语康复训练中最近多轮训练中的多个细分指标,生成同一轮训练的综合训练分数,并确定用户的训练状态;以所...
  • 本发明适用于人工智能技术领域,提供了基于SSA‑LSTM的绝缘子运行状态声学识别及预测方法,其方法包括:获取待评估绝缘子在运行状态下的声发射信号时间序列、所在微气象环境的环境参数以及待评估绝缘子近期的历史风险分数序列;分别对获取的信号预处理...
  • 本公开涉及用于故障诊断中增强型数据生成的系统和方法。一种生成音频以获得经操纵的音频数据的方法包括:接收与设备的操作相关联的音频的文本描述;接收与设备的操作相关联的音频数据;基于文本描述,生成与设备的操作相关联的音频特征的描述性文本输入;基于...
  • 本公开提供信息处理装置。其目的在于,减轻处理所导致的负荷并且可靠且正确地解析异响。信息处理装置的控制部利用设置于对象车辆的麦克风取得对象录音数据。另外,信息处理装置的控制部取得对象录音数据中的以与对象车辆的行驶条件相同的条件行驶过的车辆中设...
  • 本发明涉及老人看护技术领域,解决了现有技术中对含噪且断续的老人语音缺乏稳健的句界识别与中断修复,导致呼救触发易误报、漏报且时延偏高的问题,提供了一种针对老人呼救的音频处理方法、装置、设备及介质。该方法包括:对老人语音信号进行预处理,得到预处...
  • 本申请提供一种语音生成图片方法、装置、处理器及存储介质,属于人工智能与计算机视觉领域,方法包括:响应于接收到用户的输入语音,从所述输入语音中提取文本信息和声纹特征信息;基于所述声纹特征信息,确定目标文生图模型,以及预测用户的图像风格偏好;将...
  • 本申请公开了一种音频渲染方法、装置、设备及存储介质,涉及音频信号处理技术领域,包括:获取目标2D音频,并从目标2D音频中分离出目标立体声;对目标立体声进行声源对象类型分析,以确定目标立体声对应的目标声源对象是否为点声源,若为点声源,则将目标...
  • 本申请涉及计算机领域,提供一种语音增强方法、装置、电子设备及存储介质。方法包括:基于语音帧的幅度谱进行复数掩码预测,得到复数谱掩码;基于所述语音帧的复数谱和所述复数谱掩码,确定所述语音帧的去噪复数谱;基于目标去噪程度对应的上限增益和下限增益...
  • 本发明提供一种基于河马优化与Mamba的阵列语音增强方法和系统,属于音频信号处理、麦克风阵列技术领域,本发明利用河马优化算法,以最大化白噪声增益为目标,对麦克风阵列的几何构型进行物理层面的鲁棒性优化,得到最优阵列布局;使用该最优阵列采集多通...
技术分类