Document
拖动滑块完成拼图
专利交易 积分商城 国际服务 IP管家助手 科技果 科技人才 商标交易 会员权益 需求市场 关于龙图腾 更多
 /  免费注册
到顶部 到底部
清空 搜索
最新专利技术
  • 本发明提供了一种设备故障检测方法及装置,所述方法包括:获得目标设备工作时产生的声音信号序列;对声音信号序列进行分段处理、梅尔倒谱系数提取,得到由对应每段声音信号的梅尔倒谱系数组成的向量矩阵;利用时序特征融合模型对向量矩阵进行特征提取,得到由...
  • 本发明提供一种同声传译的延迟消除方法、装置、设备、介质和程序产品,涉及同声传译技术领域。方法包括:获取包括至少一个说话人的原始语言语音的混合音频;从混合音频中分离出目标说话人的原始语言语音,得到屏蔽目标说话人的原始语言语音的背景音频;对目标...
  • 本发明涉及一种基于联合交叉注意力机制和迭代建模的视听语音分离系统及方法,系统包括:视听编码模块,用于采集视听数据,利用视听数据,获取音频特征和视觉特征;特征精细化模块,用于对音频特征和视觉特征分别进行优化,获取音频嵌入和视觉嵌入;多模态信息...
  • 本发明涉及一种数字会议语音处理方法、系统、设备及存储介质,包括以下步骤,对会议语音进行拾音,得到混合语音信号并分帧采样,形成语音采样序列;基于该序列进行声源方向估计,获取多声源位置信息,并据此对语音采样序列进行波束成形与空间滤波,得到声源分...
  • 本发明适用于数据识别的技术领域,提供了一种环境音频的降噪方法、装置及终端设备,所述环境音频的降噪方法包括:获取耳机设备采集的原始环境音频数据,将所述原始环境音频数据按照固定时长切分为多个当前音频数据段;计算多个当前音频数据段之间的第一音频相...
  • 本发明涉及声信号处理领域,公开了一种中继网关的回音消除方法、设备及介质,包括:通过TDM总线接口获取近端语音指令数字信号XX(nn)和远端参考信号YY(nn),其中nn为时域采样点序号;将YY(nn)输入自适应滤波器组,通过最小均方误差准则...
  • 本发明涉及数字音频处理技术领域,公开了一种音响音效增强处理方法、系统及存储介质,其中,一种音响音效增强处理方法包括:实时采集环境声学特征,构建环境特征向量;深度分析音频内容,生成内容特征函数;在联合特征空间中融合环境与内容特征;基于频谱注意...
  • 本申请涉及语音通信技术领域,提供一种音频信号的编码及解码方法、芯片和终端。所述音频信号的编码方法包括:根据待编码音频信号的目标频率和目标幅值中的至少一种,得到目标音频参数;根据目标音频参数以及预先构建的映射关系集,确定目标步长参数;映射关系...
  • 本发明属于通信技术领域,具体涉及一种基于低速波形的语义在短波上的集成系统及使用方法。本发明通过将语义通信技术与短波通信深度融合,利用语义信息对信道噪声、失真的强鲁棒性,以及语义压缩、智能编码、语义重构的技术能力,实现直接传递信息语义内容的传...
  • 本公开涉及用于统一语音和音频解码改进的方法和装置。本文描述了用于对编码的MPEG‑D USAC比特流进行解码的方法、装置和计算机产品。本文描述了降低计算复杂度的这种方法、装置和计算机产品。
  • 本申请提供了一种音频数据的水印添加方法、装置、设备、介质及程序产品,涉及人工智能技术领域,方法包括:获取待添加的水印标识数据;将所述水印标识数据与第一生成器输出的音频数据进行融合处理,得到融合数据;所述第一生成器为目标两级音频生成器中的第一...
  • 用于生成基于对象的音频节目的方法,该基于对象的音频节目是以可个性化的方式可渲染的,并且包括在不选择其他节目内容的情况下可渲染的扬声器通道声床(例如,以提供默认的全范围音频体验)。其他实施方式包括递送、解码和/或渲染这样的节目的步骤。声床的内...
  • 用于生成基于对象的音频节目的方法,该基于对象的音频节目是以可个性化的方式可渲染的,并且包括在不选择其他节目内容的情况下可渲染的扬声器通道声床(例如,以提供默认的全范围音频体验)。其他实施方式包括递送、解码和/或渲染这样的节目的步骤。声床的内...
  • 用于生成基于对象的音频节目的方法,该基于对象的音频节目是以可个性化的方式可渲染的,并且包括在不选择其他节目内容的情况下可渲染的扬声器通道声床(例如,以提供默认的全范围音频体验)。其他实施方式包括递送、解码和/或渲染这样的节目的步骤。声床的内...
  • 本发明涉及信息处理技术领域,具体公开了一种用于生猪养殖场的抗干扰声音分析系统及方法,系统包括:声音采集模块用于实时采集养殖场内的声音,监测分贝值是否超过声音阈值;声纹分析模块用于在接收到启动指令后,对声音进行生猪叫声的识别与分析;还包括:图...
  • 本发明公开了基于声纹建模与偏离度量化的口头传统活态监测及评估方法,涉及非物质文化遗产保护技术领域。该方法先获取至少两组代表性传承人的口头传统音频样本,经预处理后通过分层特征提取得到声纹核心特征集和语义关联特征集;构建声纹与语义双分支融合模型...
  • 本发明公开了基于声纹识别的眼镜翻译系统,涉及声纹识别技术领域;本发明通过对用户的唤醒频率、交互时长、联网翻译占比进行综合分析,从而反映了用户在上一设定电池评估时间间隔内的使用行为习惯,结合硬件静态功耗,计算预估眼镜剩余电池可用时长,降低了预...
  • 本发明公开了一种基于MCP协议和大型语言模型的噪声智能处理系统,属于噪声处理技术领域。包括感知层、边缘‑云协同层和应用层;所述感知层包括多个噪声监测终端,每个噪声监测终端内置轻量级MCP Server,用于将噪声监测终端的各种功能封装为符合...
  • 本发明公开了智能玩具技术领域的一种基于多智能体协调的玩具交互系统及方法,包括步骤S1:设置智能玩具端和云端协调服务器;步骤S2:获取待交互用户的用户交互文本;步骤S3:设置智能玩具终端的玩具角色配置;步骤S4:依据用户交互文本分析得到待交互...
  • 本发明涉及语言识别技术领域,且公开了一种基于Ai辅助的语音转文字优化方法,本申请通过多尺度特征自适应提取、联合建模以及持续学习机制实现了全局协同优化。相较于现有技术中模块化处理流程导致的误识别放大问题,本申请通过动态调整特征提取参数和联合编...
技术分类