Document
拖动滑块完成拼图
首页 专利交易 IP管家助手 科技果 科技人才 积分商城 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
最新专利技术
  • 本发明提供基于语音交互与智能计算的门店运营优化系统及方法,获取门店的音频流信号并进行声源定位和波束成形操作,获取方向增强语音信号,根据方向增强语音信号生成纯净目标语音信号,将纯净目标语音信号输入因果BERT模型,获取零售因果图,将纯净目标语...
  • 本申请公开了一种语音降噪方法、装置、设备和存储介质,该方法包括:获取麦克风阵列采集的历史帧目标语音信号和当前帧目标语音信号之间的声源方向角差异;基于声源方向角差异,对历史帧目标语音信号的历史导向信息和当前帧目标语音信号的预测导向信息进行融合...
  • 本公开的实施例涉及一种用于编辑语音的方法、装置、设备和存储介质。在此提出的方法包括:获取第一谱特征矩阵以及第一掩码向量,第一谱特征矩阵中的第一组谱特征元素基于待替换的第一语音片段所生成,第一谱特征矩阵中的第二组谱特征元素基于待保留的第二语音...
  • 本申请涉及具有减少后处理延迟的高频重建技术的集成,并具体揭示一种用于解码经编码音频位流的方法。所述方法包含接收所述经编码音频位流且解码音频数据以产生经解码低频带音频信号。所述方法进一步包含提取高频重建元数据且使用分析滤波器组来对所述经解码低...
  • 本申请涉及具有减少后处理延迟的高频重建技术的集成,并具体揭示一种用于解码经编码音频位流的方法。所述方法包含接收所述经编码音频位流且解码音频数据以产生经解码低频带音频信号。所述方法进一步包含提取高频重建元数据且使用分析滤波器组来对所述经解码低...
  • 本发明公开了一种基于语音识别模型的音频对抗样本隐写方法。本发明利用语音识别模型通过优化过程生成密钥音频,并在其引导下自适应地构造针对秘密信息的对抗扰动;随后结合实际信道环境对扰动进行增强,以有效抵御噪声与失真干扰。最终,通过将对抗扰动注入封...
  • 本发明涉及智能家电及人机交互技术领域,公开了基于多模态感知的电饭煲抗噪语音交互系统及控制方法,包括多模态感知与采集单元,同步采集毫米波雷达回波信号和声学信号;信号预处理与特征提取单元,从雷达信号中提取用户生理振动信号和三维空间位置向量,从声...
  • 本发明涉及声音处理领域,具体为一种大容量会议桥系统及方法,其中系统包括:接收模块1、人声检测模块2、声纹检测模块3、声音活动检测模块4、会议桥选路模块5、混音模块6、分发模块7方法包括:一、音频获取和初步处理;二、人声检测;三、声纹检测;四...
  • 本发明提供一种陆空通话声源身份识别方法、空管系统和可读存储介质,陆空通话声源身份识别方法包括:按照预设采集频率获取甚高频台站的甚高频接收机对应的RSSI值;判断RSSI值是否大于第一阈值,若是,记录当前时间戳为开始时间戳;在记录开始时间戳后...
  • 本发明属于声音识别技术领域,提供了一种声纹识别方法、系统、应用、设备及存储介质,其中方法包括获取目标对象的声纹原始数据;调用本地算法库,对声纹原始数据进行特征提取,得到高维声纹特征数据;对高维声纹特征数据进行压缩处理,得到数据量处于预设范围...
  • 本发明公开了一种说话人识别模型频率调制触发注入方法,具体涉及语音信号处理与人工智能安全技术领域,用于解决现有说话人识别模型后门注入方法存在的隐蔽性不足、黑盒环境适应性差、物理传输过程中触发特征易失真,以及难以抵抗模型微调、剪枝和频谱检测等主...
  • 本申请实施例公开了一种基于大语言模型的家政需求识别方法、设备及介质,属于家政信息处理技术领域,解决现有语音识别技术输出的家政需求数据准确率较低的问题。包括,获取家政呼叫中心产生的家政服务相关录音文件,将其输入语音转译模型,得到家政相关文本数...
  • 本发明实施例提供一种目标会议记录语音处理方法、装置及设备,方法包括:获取通过麦克风阵列采集得到的目标会议记录语音的声音信号数据和方位信号数据;根据所述方位信号数据,确定目标会议记录语音的相对位置;根据所述相对位置,确定目标会议记录语音的显示...
  • 本公开提供了一种音频生成模型的训练方法、音频生成方法、装置及设备,属于计算机技术领域。该方法包括:通过音频生成模型中的多种编码器,分别对多模态样本数据进行编码,得到多个模态的样本特征;通过音频生成模型中的多个多模态变换器层,对多个模态的样本...
  • 本申请公开了一种基于大小模型协同的语音翻译方法、系统及设备,语音翻译方法包括:获取源语言语音,根据所述源语言语音得到源语言文本、第一翻译难度分数以及若干不同翻译难度的子数据集;根据所述源语言语音、所述源语言文本以及所述第一翻译难度分数训练预...
  • 本申请涉及一种音频处理方法、装置、电子设备和存储介质,应用于计算机技术领域,其中,方法包括:获取原始音频数据,所述原始音频数据为基于多个发言人生成的音频数据;基于所述原始音频数据,生成每一所述发言人的第一发言文本信息,所述第一发言文本信息包...
  • 本申请公开了一种基于多模态融合的发音识别方法及相关设备,方法包括获取待处理的毫米波雷达信号和三维视觉数据,对获取的毫米波雷达信号进行预处理,确定雷达数据集;对三维视觉数据进行预处理,得到三维数据集;对雷达数据集进行特征提取,得到雷达时空特征...
  • 本发明公开了一种基于双大模型协同的四足机器人语音交互方法及系统,属于语音信号处理与人机交互技术领域。将用户语音输入转换为自然语言文本,本并行输入至通用大模型和领域专用大模型生成候选响应文本及置信度;通过动态语义决策引擎进行融合决策:若两置信...
  • 本申请提供了一种基于人形机器人的情感语音交互方法和装置,涉及机器人交互领域。该方法包括:通过人形机器人获取目标用户的语音数据,并提取语音数据中的声学特征和语义特征;将声学特征和语义特征输入跨模态融合情感分类模型,并输出目标用户对应的情绪识别...
  • 本发明涉及智能控制与语音交互技术领域,且公开了AI智能设备控制器,包括电路板主体、继电器主体、系统主机连接线、麦克风连接线、音频功率放大器、扬声器连接线、LED指示灯和智能控制系统,所述智能控制系统包括语音采集模块、核心控制模块、执行模块、...
技术分类