Document
拖动滑块完成拼图
专利交易 商标交易 积分商城 国际服务 IP管家助手 科技果 科技人才 会员权益 需求市场 关于龙图腾 更多
 /  免费注册
到顶部 到底部
清空 搜索
最新专利技术
  • 本发明公开一种基于Mamba感知细粒度融合的多模态情感识别方法,步骤包括:首先提取语音和文本的特征向量;然后采用Bi‑GRU编码器进行上下文感知,捕捉情感演变的动态过程并获取语音和文本上下文特征;随后利用Mamba结构的状态空间模型实现高效...
  • 本发明公开了一种针对用户情绪波动的语音情感识别处理方法、装置、计算机设备及可读存储介质,旨在解决现有技术难以实时精准捕捉连续语音中动态情绪变化的问题。该方法接收目标用户连续音频流,经语音活动检测滤除静音段并幅度归一化;将处理后音频按预设窗长...
  • 本申请涉及一种广播音频质量判别方法及装置,属于广播音频监测技术领域,判别方法包括:接收广播音频信号流并进行预处理,输出分帧处理后的信号序列;对分帧处理后的信号序列并行提取多维度特征,生成包含信号强度特征、干扰特征、噪声特征和传播骚扰特征的多...
  • 本申请涉及音频信号处理与安全监控交叉技术领域,公开了一种基于音频的异常识别方法、系统及存储介质,方法包括:在目标区域部署音频采集系统,实时获取环境声音数据;对环境声音数据进行特征提取,构建含幅度谱分离特征和梅尔频率倒谱参数频域特征的多维度音...
  • 本申请涉及外墙空鼓检测技术领域,具体涉及一种建筑外墙饰面的快速检测方法和装置,该方法包括:采集建筑外墙饰面各采样点处的声信号;分析声信号的幅值波动程度,以及声音信号的频率成分和在频域能量分布的散乱性,确定各采样点声信号的耦合波动度;设定各采...
  • 本发明提出一种轻量化无监督异常检测方法,应用于换流阀声纹异常检测, 包括以下步骤 : 实时采集特高压换流阀运行的声纹数据进行标注并转换为梅尔频谱图;使用正常运行状态声纹数据的梅尔频谱图对轻量化无监督异常检测网络进行模型训练后输入测试样本,获...
  • 本发明公开了一种可见即可说短链路测试方法、装置、设备及介质,涉及车载语音功能测试技术领域,方法包括:获取当前车机界面中所有交互组件的类型信息与实体词信息;基于每个交互组件的类型信息,通过预设泛化规则为每个交互组件生成多条语音测试指令和每条语...
  • 本发明公开了一种多通道声学成像与特征增强的变压器故障识别方法及装置,涉及电力设备状态监测技术领域,本发明通过引入声纹导向的波束形成与ROI声纹反向重建,构建了从物理层面实现噪声分离的信号预处理流程,利用变压器故障声源在空间上的局部性和频谱上...
  • 本申请一些实施例提供一种终端设备和基于音频的事件检测方法。用户指示检测环境事件后,终端设备采集环境音频数据,并根据环境音频数据生成音频特征数据。终端设备将音频特征数据发送至服务器,服务器可以基于事件检测模型对音频特征数据执行推理预测,得到多...
  • 本发明公开一种基于多分辨率与表征正则化自监督音频预训练方法及系统,方法包含对原始音频信号进行预处理,生成时间‑频率频谱图;通过集成多分辨率卷积块的卷积音频Transformer编码器,分层同步提取频谱图的多尺度音频特征,融合为统一表征;引入...
  • 本发明涉及油烟机控制技术领域,具体公开了一种应用于油烟机控制的烹饪信噪参数监测方法、装置及油烟机,声音信息、烹饪当前食材过程中智能油烟机排除油烟过程中产生的声音信息,如气流声、电机声、设备振动声等,对烹饪当前食材过程中的当前烹饪信噪参数进行...
  • 本发明提供一种琵琶琴弦基频确定方法及系统,通过对音频信号进行时频变换,提取频谱峰值,并根据预设谐波衰减函数对峰值能量加权,设定候选基频集合,先基于初始非谐性系数构建初步谐波簇,选取能量最高簇计算实时非谐性系数,再以此系数重新构建候选谐波簇,...
  • 本申请公开了一种音频处理方法、装置、电子设备、存储介质及程序产品,涉及多媒体技术领域,该方法包括:获取待处理的初始音频文件以及初始音频文件对应的目标播放速度;基于播放速度与音频采样率之间的第一映射关系,确定目标播放速度对应的目标采样率;基于...
  • 本发明涉及人工智能与多媒体技术领域,尤其涉及一种基于双条件潜在扩散模型的音频图像转换生成方法,包括:构建视觉引导的图像编码器的音频编码器以提取声学特征,并在共享潜在空间中对齐音视频语义;利用深度波形变换器提取情感特征向量;在压缩潜在空间中通...
  • 本发明属于声音分离处理领域,公开了基于身份嵌入的个体感知多鸟声分离方法及系统,方法包括:S1,对包含鸟鸣的音频片段进行预处理,得到经过预处理的音频片段,获取音频片段对应的时域波形;S2,对时域波形进行分离处理,得到分离出的个体音频波形;S3...
  • 本发明提供一种音频处理方法、装置、电子设备及存储介质,该方法包括:对目标混合音频进行时频特征提取,得到目标时频特征;所述目标混合音频包括第一目标音频和第二目标音频;将所述目标时频特征输入至音频分离模型,得到所述第一目标音频的第一时频特征;将...
  • 本申请涉及机器学习技术领域,尤其涉及一种声源识别方法、装置、电子设备及存储介质,所述方法包括:获取目标声源;对所述目标声源进行声源分析,得到所述目标声源的目标声源定位特征、所述目标声源的目标噪声特征以及所述目标声源的目标传输物理特征;基于目...
  • 本申请实施例公开了一种基于多模态降噪与声源分离的音频处理方法、装置及系统。所述方法包括:获取至少两个麦克风组成的阵列采集到的原始音频信号;对原始音频信号进行波束成形处理,得到初始音频信号;将初始音频信号中的剩余的噪声分为稳态噪声和非稳态噪声...
  • 本发明公开了一种基于多核微处理器DSP的深度AI降噪算法,包括语音预处理模块、语音特征提取模块及基于深度学习的神经网络处理模块;通过分析语音信号提取特征数据,构建了包含3个全连接层和3个GRU层的神经网络模型;本发明与现有的技术相比的优点在...
  • 本发明公开了一种基于多核微处理器的低延时AI降噪优化算法,包括以下步骤:步骤一、对语音信号进行分帧加窗以及特征的提取;步骤二、将特征值送入训练好的神经网络中得到增益值;步骤三、将增益与原始信号的经过梳状滤波后的频谱做增益插值计算,使用傅里叶...
技术分类