Document
拖动滑块完成拼图
首页 专利交易 IP管家助手 科技果 科技人才 积分商城 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
最新专利技术
  • 本发明公开了一种AI增强型全频谱声音规律挖掘与分析系统,包括数据采集模块,用于采集外部声音;预处理模块,所述预处理模块包括降噪处理、对比鉴别模块、标准化处理以及分帧加窗处理,所述降噪处理包括传统降噪和智能降噪两种方法,所述传统降噪和智能降噪...
  • 本发明公开了一种基于大语言模型的零样本ASMR生成方法与系统,旨在解决现有技术无法零样本生成个性化ASMR语音、缺乏高质量ASMR专用数据集的问题,该方法包括如下步骤:获取待合成文本、正常或ASMR风格语音的说话人提示及任务信号;基于说话人...
  • 本发明涉及音频处理技术领域,提供一种用于语音克隆的提示音获取方法,通过获取包括用于语音克隆的第一提示音的初始待检测对话音频,对初始待检测对话音频进行预设处理,获取目标待检测对话音频,以此减少待检测对话音频中包含的回声、噪声以及背景音乐的干扰...
  • 本发明涉及音频处理技术领域,公开一种多路音频处理方法、系统、设备及介质,包括接收多路音频源的音频帧数据,每个音频源对应一个环形缓冲区;环形缓冲区的容量为预设数量个音频帧数据;在检测到主路音频帧数据在当前混音周期到达环形缓冲区时,获取副路音频...
  • 本发明公开了一种基于混合专家自注意力网络的音乐源分离方法及系统,属于音频信号处理与深度学习技术领域。该方法包括:接收时域混合音频信号,经短时傅里叶变换得到复数频谱;通过改进的分离器网络MoEFormer估计复数理想比例掩码,所述分离器网络采...
  • 本发明涉及一种端侧音视频质检的轻量化声学特征提取方法。其中,该方法包括:端侧设备通过双时序锚点对齐法分离音视频流数据,采集独立音频数据;将所述独立音频数据进行分级预处理,获取降噪后的独立音频数据;基于所述分段音频采用时域与频域协同提取算法,...
  • 本发明涉及语音增强技术领域,具体涉及一种基于KAN通道注意力的时频域语音增强方法,包括:对语音数据集进行处理得到频域表示;通过编码器提取频域表示中的局部特征,得到输出特征;将输出特征输入TF‑Transformer块中,识别并抑制噪声成分,...
  • 本发明公开了一种支持蓝牙音频交互的实时降噪方法及系统,采集环境音频信号和蓝牙交互音频信号再对其进行时间戳对齐和空间校准,基于预处理后的环境音频信号,采用改进的多元变分模态分解算法分解提取噪声特征结合用户历史噪声数据,通过长短期记忆网络构建动...
  • 本申请公开了一种音频处理方法及装置,属于数据处理技术领域。其中,该方法包括:采集演唱者演唱的混合音频数据;根据混合音频数据,识别演唱者演唱的第一歌曲信息;将混合音频数据和与第一歌曲信息对应的参考音频数据输入至降噪模型,对混合音频数据进行降噪...
  • 本发明涉及语音信号处理技术领域,公开了基于深度学习的语音分段智能剪辑系统。该系统包含语音特征提取模块、分段边界检测模块、语义内容分析模块、剪辑策略生成模块和实时质量评估模块。语音特征提取模块采集多维度语音特征与时间戳信息,校验特征完整性与时...
  • 本申请提供了一种音频处理方法、电子设备、存储介质和芯片。该方法可以获取第一距离,基于第一距离确定第一距离滤波器,基于第一距离滤波器对中置声道音频信号进行处理,可以使用户感知到的音频距离为第一距离,由于第一距离小于第一阈值(该第一阈值可以认为...
  • 本申请实施例提供一种音频特征的生成方法、电子设备、服务器和存储介质,方法包括:获取语音信息;将语音信息输入声码器,通过声码器依次解耦语音信息包含的多个因素特征,得到语音信息对应的音频特征;声码器为根据训练数据中的第一语音信息进行训练得到的模...
  • 本发明提供一种语音解码方法、装置、电子设备及存储介质,其中方法包括:基于待解码语音中上一语音帧的解码路径及其路径分数,对当前语音帧进行解码,得到所述当前语音帧的当前解码路径及其路径分数;对所述当前解码路径中的目标路径的路径分数进行抑制调整,...
  • 本发明涉及通信技术领域,具体涉及一种适用于窄带信道通信的混合语音数据压缩编码方法;将发送端VoIP话机设置G.729语音编码格式,VoIP话机将接收的模拟语音信号编码为G.729格式的语音数据发送至综合通信控制设备;将语音数据解码成G.71...
  • 本申请公开了一种陪伴机器人的智能交互方法、装置、设备以及存储介质,涉及人工智能技术领域,所述陪伴机器人的智能交互方法包括:当接收到用户的交互指令时,进行语音信息采集与识别,得到身份信息与语义内容;根据所述身份信息获取历史交互摘要;通过预设人...
  • 本发明公开了一种具有环境感知能力的巡逻机器人语音交互系统,其特征在于,包括环境声纹建模模块、声学干扰识别模块、指令双重确认模块、语义耦合验证模块、置信度动态调节模块以及指令行为一致性过滤模块:环境声纹建模模块,构建具有频域冗余分析机制的环境...
  • 本发明涉及一种基于发声振动信号多模态感知的VR用户身份认证方法,包括:步骤S1:基于时间轴对齐后得到原始加速度信号和原始语音信号;步骤S2:识别得到发声片段,并将发声片段截取作为第一语音信号;步骤S3:从原始加速度信号中截取得到与各第一语音...
  • 本发明实施例提供了一种说话人识别方法、装置、电子设备及可读存储介质,该方法包括:获取待分析视频的音频数据和视频帧序列;提取视频帧序列中的目标台词和对应的时间区间;对时间区间内的视频帧序列进行视觉分析,得到目标台词对应的第一候选说话人的人脸信...
  • 本发明公开了一种会议纪要丰富度自适应控制方法、系统、设备及介质,所述方法具体包括:将会议音频数据转换为会议原始文本,对会议原始文本中的关键内容类型进行识别,计算关键内容权重;根据会议元数据确定基础压缩比,并结合关键内容权重进行动态调整,获得...
  • 本发明公开了一种实验解说实时生成方法,包括构建训练数据库,对知识增强语言模型进行训练,所述训练数据库包括实验标题、视频、音频、语音转录文本信息及传感器时序数据;所述训练过程具体为:将数据库中的数据进行拼接融合得到结构化输入序列,输入知识增强...
技术分类