Document
拖动滑块完成拼图
专利交易 商标交易 积分商城 国际服务 IP管家助手 科技果 科技人才 会员权益 需求市场 关于龙图腾 更多
 /  免费注册
到顶部 到底部
清空 搜索
最新专利技术
  • 本发明涉及语音识别技术领域,尤其涉及一种基于声纹识别的生成式病历自动生成系统及方法,包括:声纹处理模块,包括用以采集诊室场景中医患对话语音的采集单元;病历生成模块,包括用以将所述身份绑定特征输入到初始模型进行训练以得到医疗对话识别模型的训练...
  • 本发明公开一种基于多模态融合算法的营销场景说话人区分方法,包括以下步骤:对待识别音频进行分割,得到若干个子音频和各所述子音频对应的说话人初分类结果;实时检测是否存在预设注册声纹库,并根据检测结果进行说话人角色判定;其中,所述注册声纹库中包括...
  • 本发明提供一种动物声音事件检测模型的训练方法、检测方法及装置,涉及智能音频信号处理技术领域。该训练方法包括:获取样本支持集和多类别训练集,样本支持集包括第一正、负样本和查询样本,多类别训练集包括第一正样本;提取样本帧级声学特征,包括样本Lo...
  • 本发明公开了基于深度学习的强鲁棒性无损高容量音频水印嵌入方法,涉及数字水印技术领域。该方法,包括以下步骤:音频‑水印信息预处理、水印信息嵌入和水印嵌入检测判定。本发明通过对原始音频和待嵌入的水印信息进行对应的预处理,有效提升了原始音频和水印...
  • 本申请涉及音频编码技术领域,具体公开了一种音频编码方法、装置、设备、介质及产品,方法包括:对输入音频帧进行频谱分析,判断是否存在满足预设条件的单频信号;若存在,确定单频信号所在比例因子带及其邻近的N个比例因子带构成目标比例因子带组合;将目标...
  • 本申请涉及一种音频处理模型的训练方法、音频处理方法、计算机设备、计算机可读存储介质和计算机程序产品。方法包括:获取第一干声音频样本,获取第一干声音频样本对应的参考干声音频样本,其中参考干声音频样本与第一干声音频样本符合预设的内容一致性条件;...
  • 本公开提供了一种音频处理方法、装置、设备及存储介质,涉及计算机技术领域。该方法包括:获取待播放音频,将所述待播放音频的时域数据转换为频域数据;基于所述频域数据检测所述待播放音频中包含的音色类型;响应于所述音色类型中存在目标音色,获取与所述目...
  • 本申请提供远场语音增强方法、装置、存储介质及计算机设备,方法包括:获取待增强远场语音;确定目标语音增强模型,目标语音增强模型为基于多维损失函数,采用模拟增强语音样本进行训练得到的,模拟增强语音样本为对干净语音数据进行环境模拟、外放损失模拟和...
  • 本申请实施例提供了一种音频处理方法、装置、电子设备及存储介质,可涉及音频处理等领域,该方法包括:获取目标多媒体数据,基于胶片播放风格对应的带宽范围,对目标多媒体数据的初始音频信号进行滤波处理,得到中间音频信号,确定胶片播放风格对应的目标噪声...
  • 本发明涉及麦克风降噪领域,公开了一种基于耳机的通话降噪方法、设备及存储介质。该方法包括:基于降噪麦克风采集音频信号;基于预设降噪算法,对音频信号进行降噪计算,得到抵消信号,以及基于降噪扬声器播放抵消信号;当接收通话来电时,触发通话麦克风采集...
  • 本申请公开了一种音频降噪方法及其装置,属于音频处理技术领域。该方法包括对第一音频信号进行等效矩形带宽变换处理,得到第一音频特征;将第一音频特征输入音频降噪模型,音频降噪模型包括编码器、处理器和解码器,其中,通过编码器对第一音频特征进行编码,...
  • 本发明涉及定向拾音技术领域,公开了一种定向拾音方法、装置、计算机设备和介质,其中方法包括:获取至少两个麦克风采集的时域语音信号并进行时频变换;计算各频率点的观测相位差,并根据用户指定的目标拾音方向及麦克风几何参数确定目标理论相位差;将所述目...
  • 本发明涉及声音处理技术领域,具体公开了一种喉部振动感知的通话降噪优化方法、系统及耳机。该系统通过采集喉部振动信号与环境声信号,经预处理与对齐后,从环境声中提取高频特征并生成补偿参数,结合深度神经网络模型重建语音波形,再经自适应后处理输出降噪...
  • 本发明公开了一种基于毫米波雷达的涉密空间多模态违规行为识别方法,涉及智能安防技术领域,旨在解决传统安防手段漏报误报率高、隐私泄露及环境适应性差的问题。该方法先通过毫米波雷达与分布式麦克风阵列实现硬件级同步,采集监测区域低密度点云序列与多通道...
  • 本发明公开了一种基于真空OLTC多维信息的在线感知方法及系统,其特征在于,其中方法包括:提取真空OLTC的声音信号和振动信号;基于SDICA盲源分离算法,滤除所述声音信号和所述振动信号中的干扰信号;基于Mel时频谱,分别计算滤除干扰信号后的...
  • 本发明属于深度学习技术领域,具体涉及一种面向音频的基于深度神经网络话者分离方法、设备和介质,能够提高音频处理和通信系统中各种应用的分离语音信号的质量和清晰度。涉及轻量化的人体姿态估计算法以及面向视频流的人体姿态关键点平滑方法,解决现有技术中...
  • 本实施例公开了一种音频信号的处理方法和会议设备,该方法包括:获取目标音频信号;基于所述目标音频信号确定对应的目标音源类别,所述目标音源类别是基于对多个通道的音频信号进行识别得到的;采用与所述目标音源类别对应的音频处理策略对所述目标音频信号进...
  • 本申请涉及一种前端数字均衡器实现方法、装置及计算机设备。方法包括:响应于接收到用户输入的均衡器参数,则基于前端执行约束对均衡器参数进行约束适配处理,得到前端适配均衡器参数,解析得到多个滤波段参数并生成多个数字滤波器系数,在预设的多个频率采样...
  • 本发明涉及人机交互技术领域,尤其为一种听录内容识别优化的控制系统及控制方法,用于将音频、文本、表情与肢体模态在帧级对齐并驱动3D数字人实时渲染,其特征在于,包括以下步骤:在采集端与服务端之间建立统一时间基准,使所有媒体事件均带有基于该时间基...
  • 本发明公开了一种基于时频双分支动态卷积与特征融合增强模块的声音事件检测模型,本模型采用了时频双分支动态卷积结构提取局部结构特征,时域分支仅沿时间维度卷积,频域分支仅沿频率维度卷积,两支路并行抽取多尺度特征并在通道维实施门控融合,得到紧凑且判...
技术分类