Document
拖动滑块完成拼图
首页 专利交易 IP管家助手 科技果 科技人才 积分商城 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
最新专利技术
  • 本发明提供一种基于自适应滤波器的古琴音频降噪方法,属于音频处理技术领域,其可至少部分解决现有的音频降噪方法在处理复杂环境噪声时效果不佳,在降噪过程中存在收敛不稳定或收敛速度过慢的问题。本发明包括以下步骤:通过音频采集单元获取含有噪声的古琴音...
  • 本发明公开了一种施工作业现场的语音噪声抑制识别方法、装置、终端设备及存储介质,属于语音识别技术领域,上述方法为:获取待识别施工现场的实时语音信号、环境噪声信号、作业进度,以及作业进度对应的区域声学信息;将作业进度和区域声学信息输入至预设声学...
  • 本发明涉及空中交通管制中的语音增强领域,特别是一种集成自监督特征的空管语音增强方法及装置。对空管数据集进行数据预处理,并划分为大规模数据子集与干净/带噪成对数据子集;基于深度神经网络结构搭建空管语音增强模型,所述空管语音增强模型包括编码器、...
  • 本发明公开了一种风机叶片音频信号降噪方法、系统、设备及存储介质,包括对风机叶片含噪音频信号进行变分模态分解,选取模态函数分量中的一部分作为待处理信号,剩余部分作为剩余量;对待处理信号随机排列后,与剩余量重构得到临时信号,并将临时信号累积叠加...
  • 本发明公开了一种基于Half‑UNet架构的超低计算资源语音增强方法。该方法通过简化UNet的解码器并在编码器与解码器之间设置递归神经网络模块构建Half‑UNet架构,结合特征融合、自适应频带划分及幂律压缩惩罚技术,在保证增强性能的同时大...
  • 本发明涉及语音处理技术领域,可应用于金融科技、医疗健康等业务系统平台中,公开了一种语音降噪方法、装置、设备及介质,获取音频文件的待处理语音信号,并按照预设时间窗口将待处理语音信号划分为多组短时帧信号;逐一对短时帧信号进行加窗处理,得到加窗语...
  • 本申请提供了一种数字音频会议系统的数据缺失补偿方法、系统、设备及介质,包括:获取数字音频会议系统中的实时音频数据流,通过动态缓存技术将实时音频数据流输入到动态缓存区,得到动态缓存区数据;对动态缓存区数据的采样点时序间隔进行缺失类型检测,得到...
  • 本申请公开说话人定位方法、设备及存储介质,该方法包括:采集目标区域的微多普勒特征,并从微多普勒特征中提取喉部振动频率信息,以识别目标区域是否存在有效声源;在检测到存在有效声源的情况下,采集针对目标区域的深度点云,通过执行关键点检测以至少提取...
  • 本申请提供了一种声音复刻方法及相关装置,涉及声音处理技术领域。对参考音频进行音频校验,得到第一音频,对所述第一音频进行语音增强操作,实现降噪、去混响、提升音频信噪比的目的,从而得到第二音频,对所述第二音频进行语音活动检测与片段分割操作,得到...
  • 本发明涉及音频压缩技术领域,尤其涉及一种音频流自适应压缩方法及系统。该方法包括以下步骤:识别输入的原始音频流,进行音频成分划分,得到多种音频成分;计算所述多种音频成分的信息熵值与动态范围分布,构建全局音频特性图谱;对所述原始音频流进行多层次...
  • 本发明公开了一种音频数据的量子编码方法,包括获取待处理的音频数据信息;进行音频的MFCC特征信息提取;对音频数据的时间信息和得到的MFCC特征信息进行量子音频编码得到具有音频特征信息和时序性的量子音频编码;对量子音频编码进行量子音频的制备以...
  • 本申请涉及一种时域噪声整形方法、装置、终端、基站和芯片。所述方法包括:根据预设采样率的待处理音频信号的近奈奎斯特频率波段能量和中低频波段能量,确定出所述待处理音频信号的信号检测结果;根据所述信号检测结果和所述待处理音频信号的高频波段频谱的预...
  • 本申请涉及虚拟化音频处理技术领域,提供了一种基于虚拟机的车机杜比音效渲染方法及相关设备,该方法包括:利用运行于车机中的虚拟机获取虚拟音频应用的杜比音效数据流;对杜比音效数据流进行预处理,得到预处理后的杜比音效数据流以及杜比音效数据流的元数据...
  • 本发明涉及鸟鸣声识别领域,具体涉及一种基于谐波增强与时频语义联合建模的鸟鸣声分类方法,包括:采集鸟鸣声样本并进行降噪、标准化预处理,利用分层声学编码器对Mel谱图进行多尺度卷积运算,结合通道注意力机制提取时频特征,减轻频带漂移影响,通过动态...
  • 本说明书实施例提供了一种基于深度学习的风机叶片声纹监测方法及装置,其中,方法包括:获取降噪语音信号数据,获取多尺度语音特征矩阵,将风机叶片旋转相位标签与初始高维声学嵌入向量进行融合,得到相位引导声学嵌入向量;得到局部增强声学嵌入向量,将其输...
  • 本发明涉及数据处理技术领域,具体地为一种老年人智能通话辅助系统,包括:采集模块,用于实时采集用户在通话过程中的语音数据流;处理模块,用于对语音数据流进行解析,以得到解析数据;对解析数据进行风险关键词识别处理,得到风险关键词识别结果;对解析数...
  • 本申请公开了一种语音识别方法、设备及计算机程序产品,该方法包括:首先利用预训练的卷积层提取出目标语音的第一声学特征;然后将第一声学特征输入预训练的Dynamic Mask模块,自适应生成目标语音在其所属识别模式(如实时识别模式或非实时识别模...
  • 本发明涉及人工智能技术领域,具体为一种语言文字的转录方法及系统,包括以下步骤:步骤一、提供自动语音识别模型;步骤二、提供元学习器,所述元学习器配置为用于基于上下文特征输出因子参数;步骤三、在目标设备上实时获取当前上下文特征;步骤四、将所述步...
  • 本发明涉及信息处理系统、信息处理装置、信息处理方法、计算机程序产品、以及计算机可读的存储介质。本发明的目的在于,提供一种能设定从交流内容提取的提取项目的技术。本发明的信息处理系统(1)包括:获取部(512),获取参加交流的参加者和其他参加者...
  • 本发明公开了使用检索增强生成的自动语音识别系统的领域适应。本文提出的方法提供了在音频数据中表示的语音的文本转录本的生成。特别地,自动语音识别(ASR)模型可以与检索增强生成(RAG)管线一起使用,以提供包括与特定知识领域相关或特定于特定知识...
技术分类