Document
拖动滑块完成拼图
专利交易 商标交易 积分商城 国际服务 IP管家助手 科技果 科技人才 会员权益 需求市场 关于龙图腾 更多
 /  免费注册
到顶部 到底部
清空 搜索
最新专利技术
  • 本发明涉及一种抵御去同步攻击的音频水印嵌入和提取方法,在嵌入端以三段中频平均能量承载嵌入比特,根据嵌入比特对三段平均能量实施三角调制策略,并在嵌入端引入缓冲补偿,对缓冲扩展区间以段为单位对所有频域系数统一按比例缩放并对整帧逆变换得到含水印帧...
  • 本发明提供一种基于声纹识别的数字化工厂设备异常检测方法及系统,通过获取数字化工厂设备的声纹信号流进行时频域联合分析处理,生成时频混合特征集合,将其进行特征映射处理,生成声纹嵌入向量,调取与声纹信号流对应的设备工况信息,将声纹嵌入向量与设备工...
  • 本发明公开一种多人语音交互视觉增益方法与装置,本方法通过智能终端的音频采集组件实时获取多人场景下的语音信号,同时通过智能终端的视觉采集组件同步采集可视范围内人员的面部图像及动嘴特征信息;对采集的语音信号进行初步声纹匹配,判断匹配结果是否明确...
  • 本发明公开基于敲击峰对齐与小波散射的电缆肘型头积水识别方法,属于声纹识别技术领域;包括:接收电缆肘型终端敲击声信号,通过敲击峰值检测、窗口化处理与信号镜像填充实现基于敲击信号峰对齐算法,输出对齐声信号;从对齐后的声信号中提取小波散射系数作为...
  • 本发明公开一种基于边缘计算语音识别的协同控制系统,包括语音采集设备、边缘服务器;语音采集设备包括麦克风阵列、音频处理模块、通信模块,分别用于语音采集获得音频信号、音频信号的预处理获得音频流及音频流的传输;边缘服务器与语音采集设备、协同运转设...
  • 本发明公开了一种多模态情感语音交互方法及系统,属于人工智能交互技术领域。本发明致力于解决现有智能终端(如具身机器人、虚拟数字人)语音交互机械化、情感表达与环境割裂的问题。本系统作为独立于硬件本体与通用大模型的中间件引擎,通过标准接口接收智能...
  • 本申请公开了一种语音数据的处理方法、车辆、处理器和程序产品。其中,该方法包括:获取待转换语音数据,且将待转换语音数据转换为初始文本数据;对初始文本数据进行切分,得到多个子文本数据;将子文本数据从文本格式,转换为拼音格式,得到第一拼音数据;基...
  • 本发明涉及语音识别技术领域,提供了一种语音识别方法、装置、电子设备和存储介质,其中方法包括:对待识别的语音信号进行特征提取,将提取得到的声学特征序列输入至语音识别模型,得到经过文本优化的目标识别文本;其中,语音识别模型包括编码器和解码器,编...
  • 本发明实施例提供一种心理访谈语言交互结构化分析方法及系统,属于自然语言处理技术领域。所述方法包括:对语言交互数据执行语音识别处理,生成对应的文本数据;提取学员语言交互的语义意图信息,并基于所述语义意图信息构建访谈过程中的对话状态序列;提取表...
  • 本发明公开了一种基于人工智能的心电监护仪语音控制方法,为解决多床位、多设备环境中目标设备难以唯一识别绑定、易误绑定及易遭重放攻击的问题,本发明通过在唤醒窗口内触发各监护仪发射携带设备标识与基于时间的一次性随机数的近超声挑战水印,结合共享编码...
  • 本发明提供了一种油烟机的控制方法、装置及油烟机,涉及厨房电器的技术领域,该方法包括:响应第一麦克风和第二麦克风采集到语音信息;判断语音信息是否来自于预设的目标区域;其中,目标区域为实施烹饪的区域;如果是,识别语音信息包含的语音指令,以基于语...
  • 本发明涉及人工智能领域中的自然语言处理与语音识别领域,公开了深度语义解析语音答疑方法、系统、电子设备及存储介质,包括以下步骤:离线预处理图书内容以构建包含物理空间和语义信息的知识图谱;实时采集用户的语音和眼动数据流;通过融合语音中的指示代词...
  • 本说明书公开了一种语音交互系统的响应耗时测量方法、系统、介质、车载设备及车辆,包括:在语音交互系统启动时,控制语音交互系统中的Audio模块同步接收首帧音频数据;当语音交互系统中的语音检测模块收到首帧音频数据时,在设备日志中标记起始时间锚点...
  • 本发明公开了一种结合自适应特征提取的离线语音识别方法,涉及智能语音识别技术领域,包括通过声学传感器阵列采集泵站运行环境中的语音指令信号并进行噪声抑制处理,获得预处理语音数据;基于所述预处理语音数据进行多尺度时频分析构建语音特征图谱,根据泵站...
  • 本发明涉及早教终端交互技术领域,尤其涉及基于语音采集识别的早教终端交互系统,包括终端交互中心、语音采集模块、语音处理模块、控制授权模块、语音识别模块、历史体验模块以及内容输出模块;本发明是通过时长、信噪比、失真帧占比的三级校验,过滤无效、失...
  • 本发明提供一种语音交互方法、装置、电子设备和存储介质,方法包括:利用语音识别模型的编码器得到连续语音表征,以及利用语音识别模型的解码器得到识别文本;利用适配器模块,将连续语音表征映射至大语言模型的语义空间,得到目标语音表征;目标语音表征保留...
  • 本发明涉及一种复杂环境下的自动语音识别方法,首先对采集的语音数据进行可用性标注分类,将不可用语音数据首先进行排除。然后寻找综合最优VAD模型进行语音数据过滤,滤掉无语音部分,留下有效语音数据。通过基础语音识别模型进行初步的自动识别和说话人标...
  • 本申请提出一种任务计划生成方法、装置及设备,应用于人工智能领域。其中,任务计划生成方法包括:在车载语音交互场景中,获取当前车辆中的语音指令和车载语音交互场景的上下文信息;对语音指令和上下文信息进行多模态信息融合,得到多模态融合结果;通过大语...
  • 本申请公开了一种基于环境噪声增强的语音识别方法、设备和介质,对待识别的目标语音信号进行分帧处理,得到至少一帧语音信号;确定至少一帧语音信号各自的第一功率谱,进而确定至少一帧语音信号各自的梅尔频谱;基于噪声感知模型确定至少一帧语音信号各自的噪...
  • 基于扩散式语音增强与视觉手势编码的导演意图识别方法,涉及模式识别、图像识别技术领域,本发明通过生成式扩散先验与观测一致性引导提升语音可懂度,通过ROI对齐与骨架关键点将手势显式结构化,通过块级对齐、注意力汇聚与门控加权自适应整合异步且噪声水...
技术分类