Document
拖动滑块完成拼图
首页 专利交易 IP管家助手 科技果 科技人才 积分商城 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
最新专利技术
  • 本公开的实施例涉及用于检测语音的方法、装置、设备、介质和程序产品。该方法包括获取待检测音频和针对目标对象的目标语音特征,待检测音频包括目标对象的语音信息。该方法还包括基于待检测音频,确定针对待检测音频的音频特征。该方法还包括基于音频特征和目...
  • 本发明公开了一种多模态对话情绪识别方法,对获得的文本、音频、视觉三个模态的输入,分别进行特征提取;根据情绪转移标签对情绪转变组件进行预训练,捕获连续话语之间的情绪转变信号;在模态编码器中引入模态内和模态间Transformer来捕获模态内和...
  • 本发明提供一种抑郁症患者情绪干预方法,涉及人工智能技术领域。包括接收用户语音输入,通过自动语音识别将语音转换为文本;通过自然语言处理对语音转换的文本进行语义分析,识别用户的情绪状态和心理需求;根据用户的情绪状态和心理需求,通过专家系统生成干...
  • 本发明涉及人工智能技术领域,公开了一种应用于智能宠物的用户情绪识别方法、装置及设备,方法包括:采集用户的多个音频信号和智能宠物的多个传感器数据;确定每一音频信号对应的声音特征;建立用户的情绪基线;基于用户的所有声音特征和情绪基线,提取用户情...
  • 本申请公开了一种数据处理方法、设备、介质及程序产品。其中,方法包括:确定音频样本数据的第一特征序列和视频样本数据的第二特征序列,第一特征序列表征音频样本数据中N个音频片段的情绪变化,第二特征序列表征视频样本数据中N个视频片段的情绪变化;对第...
  • 本申请涉及一种基于多阶训练策略的多模态情感识别系统及方法。该方法包括:通过初始自动语音识别骨干模型、初始多模态融合模块、初始跨模态注意力模块搭建初始多模态情感识别模型;通过语音文本配对数据对所述初始多模态情感识别模型中的初始自动语音识别骨干...
  • 本发明涉及语音识别领域,具体为一种基于地方普通话发音模型的语音质量评测方法。包括从公开语料库中获取参考普通话语料库和地方普通话口音语料库,训练包含共享编码器、口音识别头和音素评估头的多任务学习模型;通过参考普通话语料库的标准语音样本构建标准...
  • 本发明涉及智能家居技术领域,尤其涉及一种基于动态场景建模的语音模型评估方法及计算机程序产品,该方法包括:接收输入的烹饪指令文本,并基于烹饪指令文本生成合成语音;将合成语音与从厨房噪声特征库中提取的噪声进行动态混合,以构建模拟真实厨房环境的测...
  • 本发明公开了一种基于集成学习的工业设备声学故障智能诊断方法,具体涉及工业互联网及智能制造技术领域。基于集成学习的工业设备声学故障智能诊断方法,包括:数据预处理步骤:对采集的原始工业设备声学信号进行质量评估和噪声抑制,获得预处理后的声学信号;...
  • 本发明提供一种基于深度学习神经网络的颞下颌关节音信号识别分类方法,通过采集双侧颞颌关节活动时的三轴关节振动信号,并将采集的三轴关节振动信号作标签处理分别标注正常信号或异常信号,得到训练数据集;构建基于深度学习神经网络的颞下颌关节音信号识别分...
  • 本申请公开了一种麦克风阵列导向矢量估计方法、装置、设备及介质。针对唤醒词音频段的每帧数据,结合唤醒词音频段的第一特征信息和非唤醒词音频段的第二特征信息来确定各频点对应的语音概率值。通过对比唤醒词和非唤醒词的特征差异,可以更精确地判断每个频点...
  • 本发明涉及异音检测领域,公开了一种家用电器全方位异音检测系统,包括:数据采集模块,用于通过多模态传感器采集家用电器的声音和振动信号;环境参数获取模块,用于实时获取环境参数包括温度、湿度、气压、PM2.5浓度、风速和臭氧浓度;信号处理模块,采...
  • 本发明涉及一种语音集控系统中设备的自检方法、装置、终端设备和介质,方法包括响应自检指令,语音集控系统的控制主站基于静态IP对所有从站设备进行IP检验,并在校验过程中获取所有从站设备的实际IP;当每个从站设备校验完成后,控制主站与对应的从站设...
  • 本申请提供了一种客户行为识别方法、装置、计算机设备和可读存储介质,涉及声音处理、金融科技以及医疗健康领域。该方法包括:获取多个第一通话录音,并针对每个所述第一通话录音,提取客户人声的声纹特征;对提取出的所述声纹特征进行聚类处理,得到若干聚类...
  • 本发明公开了一种跟踪用户演唱速度的方法及终端,接收用户的演唱曲目后,为演唱曲目的歌谱中每一句歌词标记第一时间戳,并接收用户对每一句歌词的演唱音频,对演唱音频进行语音识别以得到对应的音频文本,为音频文本对应的歌词标记第二时间戳;进而通过对比每...
  • 本申请提供一种语音特征处理方法及语音处理方法,涉及语音token提取技术领域,处理方法包括获取音频数据,对音频数据进行预处理,得到频域特征;将频域特征导入语音token抽取模型进行语音token提取,得到若干组语音token;语音token...
  • 本公开的实施例涉及用于生成音乐的方法、装置、设备、介质及程序产品。该方法包括:基于针对音乐媒体项的演示音乐,确定用于音乐媒体项的第一音色和音乐媒体项的基准音高,演示音乐至少包括歌词和旋律;利用第一机器学习模型对以第二音色演唱歌词的参考音频执...
  • 本发明提供了一种基于语音识别的茶叶智能秤数据管理系统,系统包括前端处理模块、语音增强模块、语义识别模块以及称重管理模块,其中:前端处理模块,用于采集原始语音信号,生成原始语音信号的初始噪声模型,并基于初始噪声模型对原始语音信号进行自适应除噪...
  • 本发明公开了一种多形态齿音动态感知与自适应抑制方法,涉及语音信号处理领域;具体为:首先,输入实时的音频或语音流的语音信号,并按帧进行预处理;然后进行频谱分析,得到各帧对应的高低频齿音感知频段,并确定每帧语音信号中各频段的分频点。接着,FIR...
  • 本申请实施例公开了一种信息确定方法,方法包括:获取待处理音乐片段的第一音频文件、待处理音乐片段的歌词文本和目标用户针对待处理音乐片段的情感信息,并对第一音频文件、歌词文本和情感信息进行处理,得到待处理音乐片段的旋律特征信息、歌词文本的语义特...
技术分类