Document
拖动滑块完成拼图
专利交易 商标交易 积分商城 国际服务 IP管家助手 科技果 科技人才 会员权益 需求市场 关于龙图腾 更多
 /  免费注册
到顶部 到底部
清空 搜索
最新专利技术
  • 本发明涉及一种基于声音特征的故障点定位方法及系统,涉及故障诊断的领域,其包括:采集故障设备的声音数据;根据声音数据提取得到声音密度和声音音量;依据声音密度和声音音量在预设的声音频率上分别生成对应的密度数据曲线和音量数据曲线;基于密度数据曲线...
  • 本公开涉及一种音频系统健康评估方法、电子设备及车辆,应用于音频处理技术应用领域。其中,音频系统健康评估方法包括:获取音频处理过程中记录的轨迹标签数据,基于轨迹标签数据计算多维度健康指标体系中的各个维度的健康指标评分,基于各个维度的健康指标评...
  • 本申请涉及汽车制造与用户体验优化技术领域,特别涉及一种基于深度学习的车门关门声音信号品质评价方法、系统和设备,包括:采集车门关门声音信号;从车门关门声音信号提取至少一个目标特征,对车门关门声音信号进行数据增强后得到增强后的车门关门声音信号;...
  • 本发明涉及供水管网泄漏监测领域,特别是关于一种基于时频跨域特征对齐的轻量化供水管网泄漏识别方法、系统、介质及设备,其包括:获取供水管网的无标注原始声学监测数据,对每一段原始声学监测数据分别构建时域波形视图和频域谱图视图;构建包含时域编码器和...
  • 本申请公开了一种场景化音频识别方法及其装置、电子设备和存储介质,涉及人工智能声音信号处理技术领域。其中该方法包括:将采集的原始音频波形输入至共享特征提取网络进行特征提取处理得到第一音频特征图;基于第一音频特征图、外部输入向量进行先验信息处理...
  • 本发明公开了一种乐器演奏评测方法、装置、设备、介质及产品。该方法包括:确定用户演奏的音频信号对应的声学特征序列;通过音频语义提取模型提取所述声学特征序列的音频语义特征序列;通过MIDI生成网络基于音频语义特征序列的上下文依赖关系,生成与所述...
  • 本发明公开了一种基于递归门控卷积和自注意力机制的声音事件检测方法,包括:采集待检测的音频信号,构建声音事件检测模型;将音频信号输入声音事件检测模型,通过预处理模块提取时频特征,获得对数梅尔频谱特征;将对数梅尔频谱特征输入卷积模块,通过递归门...
  • 本发明公开了一种基于音视频融合的房间声学特性多参数估计方法,以精准估计房间声学参数(RAPs)并提升抗干扰能力。该方法包括:采用音频前端对单通道语音信号执行STFT变换,拼接对数幅度谱与帧间相位差特征,得到音频预处理特征;视频前端经唇部RO...
  • 本发明涉及音频信号处理技术领域,公开了一种音量单位表显示优化方法、系统、存储介质及设备,方法包括:实时采集音频输入信号,并对采集到的音频输入信号进行预处理以得到适于分析的音频数据;基于预处理后的音频数据提取能够反映音频信号强度与动态特性的音...
  • 本发明提供一种基于骨传导和空气传导的目标人声分离系统,该系统包括:骨传导语音采集模块,用于采集佩戴者的骨传导语音信号;空气传导语音采集模块,用于采集佩戴者和周围其他人的空气传导语音信号以及背景噪声;空气传导输入信号处理模块,用于将空气传导语...
  • 本申请公开了一种声源定位方法及相关装置,涉及声源定位领域,包括:获取多个麦克风采集的原始混合语音信号,对原始混合语音信号进行语音分离处理得到多个个体语音信号,通过将每个个体语音信号输入至预训练的声源定位模型,得到个体语音信号的估计空间谱,并...
  • 本发明涉及音频信号处理技术领域,公开了一种基于过零率和能量值优化的实时静音检测方法,包括计算每帧音频信号的能量值和噪声平稳度值,将噪声分类后划分噪声强度等级;将输入信号分帧处理,计算当前帧信号峰值;并设定过零幅度阈值,得到优化过零率;根据动...
  • 本申请公开了一种语音处理方法及装置。其中,该方法包括:接收待处理的原始语音数据;对原始语音数据分别进行多种不同尺度的短时傅里叶变换,得到不同尺度的频域信号;分别对不同尺度的频域信号进行处理,得到不同尺度的掩膜矩阵,并将不同尺度的掩膜矩阵进行...
  • 本申请公开了一种语音降噪方法、装置、耳机、介质及程序产品,该方法包括:获得语音序列数据;对语音序列数据进行至少一次自注意力操作;获得自注意力机制的输出;根据自注意力机制的输出进行降噪;sg注意力操作包括:利用预设的查询‑键矩阵和值矩阵对输入...
  • 本公开提供了一种车载语音降噪多模态交互方法及系统,涉及汽车智能座舱领域技术领域,包括:实时获取外部环境噪声数据,通过V2X数据预判噪声类型,切换降噪模式;构建多模态输入模型,将外部环境噪声数据和V2X数据输入至多模态输入模型,分析外部环境噪...
  • 本发明提供一种基于音视多模态的语音增强方法,包括利用经训练的模型根据多模态数据得到增强音频序列,多模态数据包括对象的音频序列、人脸唇部视频序列和单帧人脸图像。模型训练包括:获取多个第一样本,其第一输入数据包括含噪声且部分音频被掩蔽的音频序列...
  • 本发明公开了一种应用于播出系统的音频波形生成方法,包括构建数据预处理模块进行数据预处理,显著减少数据量;构建基于深度学习的降噪模型,对经过预处理后的数据进行噪声的精准识别和滤除;将处理后的数据中的大规模音频数据分割为多个小块;基于强化学习理...
  • 本发明提供一种声学环境质量优化方法、装置、电子设备及存储介质,涉及声学信号处理技术领域,通过计算建筑声学参数,并以平衡多元声学指标为优化目标,确定电声与扩声联合控制策略,不仅能适应不同尺寸的目标建筑以及目标建筑内声学环境的动态变化,更能根据...
  • 本申请公开了一种音频转换方法、装置、设备及介质,包括:确定待转换文件对应的目标转换质量等级,其中,所述待转换文件的音频信号为二维音频信号;提取待转换文件的目标数据,其中,所述目标数据包括每个音轨对象的音频文件以及音频特征数据;确定所述目标转...
  • 本发明公开了一种轻量级无损音频编解码方法及系统,属于音频信号处理技术领域。方法包括:将原始音频波形通过由TConv单元、卷积单元、下采样单元及Local‑Transformer单元串联组成的编码器转换为紧凑编码表示;采用单一有限标量量化器对...
技术分类