Document
拖动滑块完成拼图
专利交易 商标交易 积分商城 国际服务 IP管家助手 科技果 科技人才 会员权益 需求市场 关于龙图腾 更多
 /  免费注册
到顶部 到底部
清空 搜索
最新专利技术
  • 本发明公开一种基于边缘计算语音识别的协同控制系统,包括语音采集设备、边缘服务器;语音采集设备包括麦克风阵列、音频处理模块、通信模块,分别用于语音采集获得音频信号、音频信号的预处理获得音频流及音频流的传输;边缘服务器与语音采集设备、协同运转设...
  • 本发明公开基于敲击峰对齐与小波散射的电缆肘型头积水识别方法,属于声纹识别技术领域;包括:接收电缆肘型终端敲击声信号,通过敲击峰值检测、窗口化处理与信号镜像填充实现基于敲击信号峰对齐算法,输出对齐声信号;从对齐后的声信号中提取小波散射系数作为...
  • 本发明公开一种多人语音交互视觉增益方法与装置,本方法通过智能终端的音频采集组件实时获取多人场景下的语音信号,同时通过智能终端的视觉采集组件同步采集可视范围内人员的面部图像及动嘴特征信息;对采集的语音信号进行初步声纹匹配,判断匹配结果是否明确...
  • 本发明提供一种基于声纹识别的数字化工厂设备异常检测方法及系统,通过获取数字化工厂设备的声纹信号流进行时频域联合分析处理,生成时频混合特征集合,将其进行特征映射处理,生成声纹嵌入向量,调取与声纹信号流对应的设备工况信息,将声纹嵌入向量与设备工...
  • 本发明涉及一种抵御去同步攻击的音频水印嵌入和提取方法,在嵌入端以三段中频平均能量承载嵌入比特,根据嵌入比特对三段平均能量实施三角调制策略,并在嵌入端引入缓冲补偿,对缓冲扩展区间以段为单位对所有频域系数统一按比例缩放并对整帧逆变换得到含水印帧...
  • 本发明公开了一种轻量级无损音频编解码方法及系统,属于音频信号处理技术领域。方法包括:将原始音频波形通过由TConv单元、卷积单元、下采样单元及Local‑Transformer单元串联组成的编码器转换为紧凑编码表示;采用单一有限标量量化器对...
  • 本申请公开了一种音频转换方法、装置、设备及介质,包括:确定待转换文件对应的目标转换质量等级,其中,所述待转换文件的音频信号为二维音频信号;提取待转换文件的目标数据,其中,所述目标数据包括每个音轨对象的音频文件以及音频特征数据;确定所述目标转...
  • 本发明提供一种声学环境质量优化方法、装置、电子设备及存储介质,涉及声学信号处理技术领域,通过计算建筑声学参数,并以平衡多元声学指标为优化目标,确定电声与扩声联合控制策略,不仅能适应不同尺寸的目标建筑以及目标建筑内声学环境的动态变化,更能根据...
  • 本发明公开了一种应用于播出系统的音频波形生成方法,包括构建数据预处理模块进行数据预处理,显著减少数据量;构建基于深度学习的降噪模型,对经过预处理后的数据进行噪声的精准识别和滤除;将处理后的数据中的大规模音频数据分割为多个小块;基于强化学习理...
  • 本发明提供一种基于音视多模态的语音增强方法,包括利用经训练的模型根据多模态数据得到增强音频序列,多模态数据包括对象的音频序列、人脸唇部视频序列和单帧人脸图像。模型训练包括:获取多个第一样本,其第一输入数据包括含噪声且部分音频被掩蔽的音频序列...
  • 本公开提供了一种车载语音降噪多模态交互方法及系统,涉及汽车智能座舱领域技术领域,包括:实时获取外部环境噪声数据,通过V2X数据预判噪声类型,切换降噪模式;构建多模态输入模型,将外部环境噪声数据和V2X数据输入至多模态输入模型,分析外部环境噪...
  • 本申请公开了一种语音降噪方法、装置、耳机、介质及程序产品,该方法包括:获得语音序列数据;对语音序列数据进行至少一次自注意力操作;获得自注意力机制的输出;根据自注意力机制的输出进行降噪;sg注意力操作包括:利用预设的查询‑键矩阵和值矩阵对输入...
  • 本申请公开了一种语音处理方法及装置。其中,该方法包括:接收待处理的原始语音数据;对原始语音数据分别进行多种不同尺度的短时傅里叶变换,得到不同尺度的频域信号;分别对不同尺度的频域信号进行处理,得到不同尺度的掩膜矩阵,并将不同尺度的掩膜矩阵进行...
  • 本发明涉及音频信号处理技术领域,公开了一种基于过零率和能量值优化的实时静音检测方法,包括计算每帧音频信号的能量值和噪声平稳度值,将噪声分类后划分噪声强度等级;将输入信号分帧处理,计算当前帧信号峰值;并设定过零幅度阈值,得到优化过零率;根据动...
  • 本申请公开了一种声源定位方法及相关装置,涉及声源定位领域,包括:获取多个麦克风采集的原始混合语音信号,对原始混合语音信号进行语音分离处理得到多个个体语音信号,通过将每个个体语音信号输入至预训练的声源定位模型,得到个体语音信号的估计空间谱,并...
  • 本发明提供一种基于骨传导和空气传导的目标人声分离系统,该系统包括:骨传导语音采集模块,用于采集佩戴者的骨传导语音信号;空气传导语音采集模块,用于采集佩戴者和周围其他人的空气传导语音信号以及背景噪声;空气传导输入信号处理模块,用于将空气传导语...
  • 本发明涉及音频信号处理技术领域,公开了一种音量单位表显示优化方法、系统、存储介质及设备,方法包括:实时采集音频输入信号,并对采集到的音频输入信号进行预处理以得到适于分析的音频数据;基于预处理后的音频数据提取能够反映音频信号强度与动态特性的音...
  • 本发明公开了一种基于音视频融合的房间声学特性多参数估计方法,以精准估计房间声学参数(RAPs)并提升抗干扰能力。该方法包括:采用音频前端对单通道语音信号执行STFT变换,拼接对数幅度谱与帧间相位差特征,得到音频预处理特征;视频前端经唇部RO...
  • 本发明公开了一种基于递归门控卷积和自注意力机制的声音事件检测方法,包括:采集待检测的音频信号,构建声音事件检测模型;将音频信号输入声音事件检测模型,通过预处理模块提取时频特征,获得对数梅尔频谱特征;将对数梅尔频谱特征输入卷积模块,通过递归门...
  • 本发明公开了一种乐器演奏评测方法、装置、设备、介质及产品。该方法包括:确定用户演奏的音频信号对应的声学特征序列;通过音频语义提取模型提取所述声学特征序列的音频语义特征序列;通过MIDI生成网络基于音频语义特征序列的上下文依赖关系,生成与所述...
技术分类