Document
拖动滑块完成拼图
首页 专利交易 IP管家助手 科技果 科技人才 积分商城 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
最新专利技术
  • 本发明涉及智能家电及人机交互技术领域,公开了基于多模态感知的电饭煲抗噪语音交互系统及控制方法,包括多模态感知与采集单元,同步采集毫米波雷达回波信号和声学信号;信号预处理与特征提取单元,从雷达信号中提取用户生理振动信号和三维空间位置向量,从声...
  • 本发明涉及声音处理领域,具体为一种大容量会议桥系统及方法,其中系统包括:接收模块1、人声检测模块2、声纹检测模块3、声音活动检测模块4、会议桥选路模块5、混音模块6、分发模块7方法包括:一、音频获取和初步处理;二、人声检测;三、声纹检测;四...
  • 本发明提供一种陆空通话声源身份识别方法、空管系统和可读存储介质,陆空通话声源身份识别方法包括:按照预设采集频率获取甚高频台站的甚高频接收机对应的RSSI值;判断RSSI值是否大于第一阈值,若是,记录当前时间戳为开始时间戳;在记录开始时间戳后...
  • 本发明属于声音识别技术领域,提供了一种声纹识别方法、系统、应用、设备及存储介质,其中方法包括获取目标对象的声纹原始数据;调用本地算法库,对声纹原始数据进行特征提取,得到高维声纹特征数据;对高维声纹特征数据进行压缩处理,得到数据量处于预设范围...
  • 本发明公开了一种说话人识别模型频率调制触发注入方法,具体涉及语音信号处理与人工智能安全技术领域,用于解决现有说话人识别模型后门注入方法存在的隐蔽性不足、黑盒环境适应性差、物理传输过程中触发特征易失真,以及难以抵抗模型微调、剪枝和频谱检测等主...
  • 本申请实施例公开了一种基于大语言模型的家政需求识别方法、设备及介质,属于家政信息处理技术领域,解决现有语音识别技术输出的家政需求数据准确率较低的问题。包括,获取家政呼叫中心产生的家政服务相关录音文件,将其输入语音转译模型,得到家政相关文本数...
  • 本发明实施例提供一种目标会议记录语音处理方法、装置及设备,方法包括:获取通过麦克风阵列采集得到的目标会议记录语音的声音信号数据和方位信号数据;根据所述方位信号数据,确定目标会议记录语音的相对位置;根据所述相对位置,确定目标会议记录语音的显示...
  • 本公开提供了一种音频生成模型的训练方法、音频生成方法、装置及设备,属于计算机技术领域。该方法包括:通过音频生成模型中的多种编码器,分别对多模态样本数据进行编码,得到多个模态的样本特征;通过音频生成模型中的多个多模态变换器层,对多个模态的样本...
  • 本申请公开了一种基于大小模型协同的语音翻译方法、系统及设备,语音翻译方法包括:获取源语言语音,根据所述源语言语音得到源语言文本、第一翻译难度分数以及若干不同翻译难度的子数据集;根据所述源语言语音、所述源语言文本以及所述第一翻译难度分数训练预...
  • 本申请涉及一种音频处理方法、装置、电子设备和存储介质,应用于计算机技术领域,其中,方法包括:获取原始音频数据,所述原始音频数据为基于多个发言人生成的音频数据;基于所述原始音频数据,生成每一所述发言人的第一发言文本信息,所述第一发言文本信息包...
  • 本申请公开了一种基于多模态融合的发音识别方法及相关设备,方法包括获取待处理的毫米波雷达信号和三维视觉数据,对获取的毫米波雷达信号进行预处理,确定雷达数据集;对三维视觉数据进行预处理,得到三维数据集;对雷达数据集进行特征提取,得到雷达时空特征...
  • 本发明公开了一种基于双大模型协同的四足机器人语音交互方法及系统,属于语音信号处理与人机交互技术领域。将用户语音输入转换为自然语言文本,本并行输入至通用大模型和领域专用大模型生成候选响应文本及置信度;通过动态语义决策引擎进行融合决策:若两置信...
  • 本申请提供了一种基于人形机器人的情感语音交互方法和装置,涉及机器人交互领域。该方法包括:通过人形机器人获取目标用户的语音数据,并提取语音数据中的声学特征和语义特征;将声学特征和语义特征输入跨模态融合情感分类模型,并输出目标用户对应的情绪识别...
  • 本发明涉及智能控制与语音交互技术领域,且公开了AI智能设备控制器,包括电路板主体、继电器主体、系统主机连接线、麦克风连接线、音频功率放大器、扬声器连接线、LED指示灯和智能控制系统,所述智能控制系统包括语音采集模块、核心控制模块、执行模块、...
  • 本申请公开了一种语音识别方法、装置和电子设备,属于语音识别技术领域。由服务器执行,该方法包括:接收电子设备发送的第一语音信息,第一语音信息中包括第一实体词对应的语音信息;对第一语音信息进行识别,得到第一识别文本,并向电子设备发送第一识别文本...
  • 本发明公开了一种基于智能助手的跨应用语音指令处理方法,包括:接收用户输入的语音指令,转换为指令文本,当识别出指令文本中包含用于指定第三方应用的标识符时,判定为跨应用指令;响应于判定,向用户发起针对执行跨应用指令的确认请求;在获得用户对确认请...
  • 本申请提供了一种语音唤醒方法、装置、电子设备及存储介质,涉及语音控制技术。该语音唤醒方法通过采集实时音频数据;在所述实时音频数据中检测到第一语音片段的情况下,控制语音交互系统进入预唤醒状态;在所述预唤醒状态下,控制所述语音交互系统启动对所述...
  • 本申请公开了唤醒词识别方法、装置及设备。其中所述方法通过唤醒词识别模型中的多个编码层,获取最后一个编码层输出的目标语音的第一特征数据、至少一个中间编码层输出的至少一个第二特征数据;通过与最后一个编码层对应的解码器,根据第一特征数据,获取第一...
  • 公开一种双路语音流实时识别方法、系统和应用,包括对采集到的VOIP通话双通道音频进行预处理,并保持时序同步;提取经预处理音频的梅尔频率倒谱系数特征与语音谱图特征,将拼接后的特征输入Transformer深度神经网络模型进行流式语音识别,获得...
  • 本发明提供一种模仿人类情绪的智能文本语音转换系统,通过双智能体协作实现用户情绪识别与情感语音的精准匹配,使AI回复具备“共情”能力,避免机械感,让人机交互更贴近人类自然交流模式,预制情感声音库支持多情感类别与多场景参数配置,可灵活适配不同场...
技术分类