Document
拖动滑块完成拼图
专利交易 积分商城 国际服务 IP管家助手 科技果 科技人才 商标交易 会员权益 需求市场 关于龙图腾 更多
 /  免费注册
到顶部 到底部
清空 搜索
最新专利技术
  • 本申请公开了一种音频处理方法、装置、电子设备及存储介质。方法包括:对采集到的多通道音频进行音频信号分析,得到多通道音频对应的实数谱和虚数谱;对实数谱和虚数谱分别进行掩膜处理,得到实数谱对应的掩膜实数谱和虚数谱对应的掩膜虚数谱;通过融合网络分...
  • 本说明书实施例提供信号处理方法及装置,其中所述方法包括:确定麦克风信号对应的目标麦克风信号频谱,以及参考信号对应的目标参考信号频谱,其中,目标麦克风信号频谱与目标参考信号频谱具有时间对齐关系;通过步长预测模型基于目标麦克风信号频谱和目标参考...
  • 本发明公开了一种多人场景的语音降噪方法、装置、电子设备及存储介质,涉及语音信号处理技术领域。该方法包括:获取目标空间场景的音频信号和视频图像;确定与音频信号匹配的音频感知信息,以及与视频图像对应的视觉语音活动检测结果;将音频感知信息以及视觉...
  • 本发明公开了一种基于生成对抗网络的语音增强降噪系统,包括:时频对齐模块,用于采集原始噪声语音并预处理;三分量编码模块,用于提取语音内容特征、声纹特征与噪声表征;双域协同生成模块,用于生成候选增强波形频谱并协同校正;多头判别模块,用于通过时域...
  • 本申请涉及音频降噪技术领域,具体公开了一种基于深度学习的实时音频降噪方法及装置,此方法包括音频采集与转换、实时分帧与加窗、时频变换、轻量化神经网络模型输出、纯净语音幅度谱重构、时频逆变换与重叠相加和输出降噪音频等步骤,轻量化神经网络模型与实...
  • 本申请公开了一种音频信号的处理方法、回声消除模型的训练方法和语音识别方法。其中,该方法包括:获取待处理音频信号和参考音频信号,其中,参考音频信号与待处理音频信号中的回声成分相对应;基于参考音频信号对待处理音频信号中的线性回声成分进行回声消除...
  • 本发明公开了基于多模态流式学习的普通话发音实时矫治方法及其系统,属于语音处理技术领域,该方法采集用户语音信号和面部图像信息,对语音信号进行预处理和切分获得语音帧序列,利用人脸图像识别技术提取唇形及舌位特征,创新性地构建多模态拓扑特征空间,通...
  • 本申请涉及具有减少后处理延迟的高频重建技术的集成,并具体揭示一种用于解码经编码音频位流的方法。所述方法包含接收所述经编码音频位流且解码音频数据以产生经解码低频带音频信号。所述方法进一步包含提取高频重建元数据且使用分析滤波器组来对所述经解码低...
  • 本文描述了用于处理时变输入数据的流以实时或近实时地生成/预测时变输出数据的流的实现方式。在各种实现方式中,在接收诸如音频输入帧的流的输入帧的流的同时,可以(例如,在中流)对到当前时间步为止接收到的音频输入帧进行词元化以生成音频输入词元的流。...
  • 本发明涉及信号处理与人工智能交叉技术领域,具体涉及一种基于DAE的多源噪声去除方法及系统,步骤一.多源噪声与纯净信号的数据采集与特征提取;步骤二.基于特征分析的去噪识别知识库构建;步骤三.基于知识库的深度去噪自编码器模型构建;步骤四.深度去...
  • 本公开涉及一种无线音频传输方法、传输装置及其系统,应用于无线音频发送设备的无线传输方法,包括:基于第一物理层对应的至少一条主传输链路,在一个或多个第一等时间隔内发送主音频数据包;基于第二物理层对应的至少一条辅传输链路,在一个或多个第二等时间...
  • 本申请公开了一种基于声学信号多特征表示的鱼类摄食行为识别方法、装置、设备、介质及产品,涉及水声信号处理与机器学习技术领域。本申请首先获取鱼类摄食声音样本信号,并按照预设时间窗进行划分,获得多个时间窗的声音样本信号;分别提取每个时间窗的声音样...
  • 本发明涉及声纹识别与信息安全技术领域,具体为一种基于本地闭集声纹识别的防诈骗方法。包括:S1、获取输入语音信号,并基于预存的注册模板特征向量,计算输入语音信号的声学相似度得分;S2、对输入语音信号进行生理活性特征甄别,以计算生理活性指数;S...
  • 本发明涉及信号处理技术领域,尤其涉及一种电力专业带口音普通话的流式语音识别方法。本发明包括以下步骤:步骤S1:获取会议语音语料库,将电力专有词汇转化为普通话语音和口音语音并进行拼接;步骤S2:采提取拼接后的语音的频谱特征;步骤S3:对频谱特...
  • 本公开涉及一种语音识别方法及装置、电子设备和存储介质,所述方法包括:获取转写文本,所述转写文本是基于语言预测标签对待处理语音进行转写后得到的;调用大语言模型对所述转写文本进行语义判断,得到第一判断结果;基于所述第一判断结果对所述语言预测标签...
  • 本发明提供一种语音转换文字的方法、装置、设备、存储介质和程序产品,涉及信息技术领域,所述语音转换文字的方法,包括:对待转换的语音帧数据的声学特征和所述语音帧数据的语义上下文进行融合处理,得到不同输入通道的融合特征;对所述不同输入通道的融合特...
  • 本发明提供了一种融合外部信息的唇语识别模型构建方法,该方法包括:构建初始唇语识别模型,初始唇语识别模型包含视觉模态数据处理模块、预训练的视觉编码器、视觉投影器、文本嵌入模块与第一大语言模型;构建数据集,所述初始数据集以每个视觉序列图像及其对...
  • 本申请公开了一种神经电生理信号解码自然连续语音的方法及相关装置,涉及神经信号处理及语音合成技术领域,该方法包括:获取用户阅读目标文本或听取对应音频时产生的神经电生理信号,打破单一信号模态限制,兼顾各种非侵入式应用场景;按预设时间窗切片得到连...
  • 本申请公开了语音驱动的智能绘本生成方法、装置、电子设备及存储介质,属于人工智能技术领域。所述方法包括:获取含主题采集、内容采集、风格选择、生成分镜的标准化创作步骤清单,该清单为结构化数据对象,经RESTful API接口下发,与用户会话ID...
  • 本申请公开了一种分布式语音交互设备的唤醒方法、存储介质及电子装置,涉及智慧家庭技术领域,该分布式语音交互设备的唤醒方法包括:通过仲裁模型基于唤醒音频的声源朝向的方向性增益对唤醒音频的声源位置与语音交互设备之间的等效距离进行仲裁,得到与等效距...
技术分类