Document
拖动滑块完成拼图
专利交易 商标交易 积分商城 国际服务 IP管家助手 科技果 科技人才 会员权益 需求市场 关于龙图腾 更多
 /  免费注册
到顶部 到底部
清空 搜索
最新专利技术
  • 本申请属于语音信号处理领域,提供了一种基于平面四元麦克风阵的语音增强方法及电子设备。方法包括:对平面四元麦克风阵的四个麦克风接收的信号进行采集,得到四路含噪语音信号;两两进行语音差分波束形成,获得四路增强的差分语音信号;对四路增强的差分语音...
  • 本申请涉及语音处理技术领域,具体涉及一种语音增强方法及会议系统,旨在解决如何及时准确地判断目标语音方向,提升波束成形的语音增强效果的技术问题。为此目的,本申请包括:基于语音阵列数据通过AI模型获取目标语音方向和目标增强MASK特征;基于目标...
  • 本申请公开了一种自适应波束成形方法、设备、存储介质及计算机程序产品,涉及声学处理技术领域,方法包括:获取麦克风阵列信号;采用神经网络模型基于麦克风阵列信号进行预测,得到各时频单元分别对应的第一掩模,第一掩模越大表征麦克风阵列信号中对应时频单...
  • 本发明公开了一种多噪声场景下的自适应语音降噪方法及系统,涉及语音降噪技术领域;包括S1,对输入语音数据、运行控制训练支撑数据和小波分析配置数据进行预处理;S2,进行跨尺度结构拆解与方向纹理分解分析,进行先验质量约束;S3,构建具备与深度网络...
  • 本申请涉及音频处理技术领域,公开一种语音增强的方法,该方法应用于电子设备,在电子设备利用部署的语音增强模型,对用户输入的含噪语音信号进行语音增强时,提取声学特征向量和语义特征向量,并根据语音增强模型历史时间输出的语音token构建上下文提示...
  • 本申请涉及媒体数据处理技术领域,公开了音频处理方法、装置、电子设备、存储介质及程序产品。该方法包括获取第一参考音频、第二参考音频以及源内容;对第一参考音频进行风格编码,得到第一风格表征;对第二参考音频进行音色提取,得到第一音色表征;对源内容...
  • 本发明提供一种基于滑动窗口的实时音频特征提取方法及系统,属于音频特征提取技术领域;该方法包括基于音频缓冲区中最新一帧数据的音频内容特性,确定当前特征提取周期的滑动步长;执行缓存索引对齐操作,查询预设的特征缓存区中是否存在与重叠数据段对应的可...
  • 本申请涉及基于多阶频率调节的音频处理技术领域,揭示了一种基于多阶频率调节的音频处理方法、系统、设备及介质,其中方法包括:获取初始音频;对所述初始音频进行分频,得到初始频段数据,其中,所述初始频段数据包括:低频数据、中频数据和高频数据;对所述...
  • 本申请公开了一种兼容低码率编码器的解码方法、AI声码器及相关装置,其中方法包括编码器前添加降噪,从低码率的比特流中提取的音频编码参数进行预处理和归一化操作,依次经过卷积、上采样处理、特征提取与非线性变换处理,并将进行特征提取与非线性变换处理...
  • 本发明涉及设备运行状态监测技术领域,具体为基于声纹识别的变电站主变压器设备运行状态监测系统;包括声纹采集模块、数据预处理模块、声纹分析模块、状态评估模块、协同监测模块、交互预警模块、区块链存证模块和运维优化模块。本发明通过定向声传感器采集关...
  • 本发明公开了一种动物声纹识别和对话系统的实现方法及平台,包括主控模块,所述主控模块双向信号连接有野外监测单元、识别分析系统以及动物保护系统,所述主控模块作为系统的核心控制单元,负责协调各模块之间的交互,同时执行包括系统初始化、任务调度、资源...
  • 本发明属于模式识别领域,公开了一种基于MutiHead‑Jamba大模型的水下目标识别方法,包括:音频数据预处理工作;提取水下目标中的代表性特征,融合所得的代表性特征形成本文的数据集;按照8:1:1的比例将数据集划分为训练集、验证集和测试集...
  • 本发明公开了一种基于声纹识别的实时对话分析方法及系统,涉及声纹识别的技术领域,包括生成二维音频频谱图;构建知识指针增强的双流声纹网络模型,并行提取声纹特征向量和声学特征向量,获取融合特征向量;将融合特征向量输入至并行的分类头,同步输出包括说...
  • 本发明公开了边界感知与预训练增强的低资源藏语识别方法及系统,包括以下步骤:步骤一:对数据与文本进行规范化处理,该语言知识与预训练模型增强的低资源藏文语音转文本方法与系统,通过在低资源条件下实现对藏语边界、正字法与语素的统一建模:通过tshe...
  • 本申请涉及车辆控制技术领域,特别是涉及一种车辆的控制方法、车辆及电子设备。其中,该控制方法包括:获取车上人员的语音指令,并将语音指令转换为文本指令,解析文本指令中的用户意图,提取用户意图中的功能对象、功能意图及关联主体;在座舱人员关系图谱中...
  • 本发明提供一种基于过渡话术动态注入的实时AI智能客服交互方法及系统,接收客户语音流,并将其转换为文本;将当前文本映射到预设业务场景集合,并从预设业务场景对应的过渡话术子库中选取一条未在最近N轮使用的过渡话术;从过渡话术音频库读取该过度话术对...
  • 本发明公开了一种智能歌词人声识别方法、装置、设备及介质,包括:接收原始音频信号,对所述原始音频信号进行预处理;将预处理后的音频输入基于深度学习的音频源分离模型并生成用于分离的时频掩码,利用所述掩码分离目标人声频谱与背景伴奏频谱;对分离得到的...
  • 本申请实施例提供了一种语音交互方法、装置、介质及设备,方法包括:通过响应输入语音并识别其对应的输入文本,通过大语言模型生成与输入文本适配的交互文本和交互情感标签,进而基于音色编码提取器,从用户指定的目标音色音频中提取目标音色特征。从预设情感...
  • 本发明实施例公开一种语音信号处理方法、装置、电子设备及存储介质,该方法包括:获取并将待增强语音频谱特征以及对应的实时信道质量特征输入至预训练的去噪识别联合模型,去噪识别联合模型包括去噪子模型和语音识别子模型;基于待增强语音频谱特征以及对应的...
  • 本发明公开了基于语音识别的云游戏交互方法和系统,属于语音识别和交互技术领域,包括:步骤1,预定义多个离散的非语义交互音令,并为每个交互音令预设基于时频谱上的共振峰位置、能量包络形状和持续时长的声学指纹模板;步骤2,在客户端,将实时音频流与声...
技术分类