Document
拖动滑块完成拼图
专利交易 商标交易 积分商城 国际服务 IP管家助手 科技果 科技人才 会员权益 需求市场 关于龙图腾 更多
 /  免费注册
到顶部 到底部
清空 搜索
最新专利技术
  • 本发明实施例提供一种心理访谈语言交互结构化分析方法及系统,属于自然语言处理技术领域。所述方法包括:对语言交互数据执行语音识别处理,生成对应的文本数据;提取学员语言交互的语义意图信息,并基于所述语义意图信息构建访谈过程中的对话状态序列;提取表...
  • 本发明公开了一种基于人工智能的心电监护仪语音控制方法,为解决多床位、多设备环境中目标设备难以唯一识别绑定、易误绑定及易遭重放攻击的问题,本发明通过在唤醒窗口内触发各监护仪发射携带设备标识与基于时间的一次性随机数的近超声挑战水印,结合共享编码...
  • 本发明提供了一种油烟机的控制方法、装置及油烟机,涉及厨房电器的技术领域,该方法包括:响应第一麦克风和第二麦克风采集到语音信息;判断语音信息是否来自于预设的目标区域;其中,目标区域为实施烹饪的区域;如果是,识别语音信息包含的语音指令,以基于语...
  • 本发明涉及人工智能领域中的自然语言处理与语音识别领域,公开了深度语义解析语音答疑方法、系统、电子设备及存储介质,包括以下步骤:离线预处理图书内容以构建包含物理空间和语义信息的知识图谱;实时采集用户的语音和眼动数据流;通过融合语音中的指示代词...
  • 本说明书公开了一种语音交互系统的响应耗时测量方法、系统、介质、车载设备及车辆,包括:在语音交互系统启动时,控制语音交互系统中的Audio模块同步接收首帧音频数据;当语音交互系统中的语音检测模块收到首帧音频数据时,在设备日志中标记起始时间锚点...
  • 本发明公开了一种结合自适应特征提取的离线语音识别方法,涉及智能语音识别技术领域,包括通过声学传感器阵列采集泵站运行环境中的语音指令信号并进行噪声抑制处理,获得预处理语音数据;基于所述预处理语音数据进行多尺度时频分析构建语音特征图谱,根据泵站...
  • 本发明涉及早教终端交互技术领域,尤其涉及基于语音采集识别的早教终端交互系统,包括终端交互中心、语音采集模块、语音处理模块、控制授权模块、语音识别模块、历史体验模块以及内容输出模块;本发明是通过时长、信噪比、失真帧占比的三级校验,过滤无效、失...
  • 本发明提供一种语音交互方法、装置、电子设备和存储介质,方法包括:利用语音识别模型的编码器得到连续语音表征,以及利用语音识别模型的解码器得到识别文本;利用适配器模块,将连续语音表征映射至大语言模型的语义空间,得到目标语音表征;目标语音表征保留...
  • 本发明涉及一种复杂环境下的自动语音识别方法,首先对采集的语音数据进行可用性标注分类,将不可用语音数据首先进行排除。然后寻找综合最优VAD模型进行语音数据过滤,滤掉无语音部分,留下有效语音数据。通过基础语音识别模型进行初步的自动识别和说话人标...
  • 本申请提出一种任务计划生成方法、装置及设备,应用于人工智能领域。其中,任务计划生成方法包括:在车载语音交互场景中,获取当前车辆中的语音指令和车载语音交互场景的上下文信息;对语音指令和上下文信息进行多模态信息融合,得到多模态融合结果;通过大语...
  • 本申请公开了一种基于环境噪声增强的语音识别方法、设备和介质,对待识别的目标语音信号进行分帧处理,得到至少一帧语音信号;确定至少一帧语音信号各自的第一功率谱,进而确定至少一帧语音信号各自的梅尔频谱;基于噪声感知模型确定至少一帧语音信号各自的噪...
  • 基于扩散式语音增强与视觉手势编码的导演意图识别方法,涉及模式识别、图像识别技术领域,本发明通过生成式扩散先验与观测一致性引导提升语音可懂度,通过ROI对齐与骨架关键点将手势显式结构化,通过块级对齐、注意力汇聚与门控加权自适应整合异步且噪声水...
  • 本发明提供一种均衡器参数调整方法及装置,涉及数据处理技术领域,包括:在接收到车端设备发送的均衡器调音指令的情况下,向所述车端设备发送状态获取请求,接收所述车端设备响应于所述状态获取请求返回的音频场景信息及当前均衡器参数;对所述均衡器调音指令...
  • 本发明公开了一种语音识别咒语计数系统,包括:语音识别咒语计数系统、登录模块、数据反馈处理模块和电源模块;语音自动记录模块,语音自动记录模块与语音识别咒语计数系统实现双向连接,语音自动记录模块用于记录咒语念诵的次数,综合场景管理模块,综合场景...
  • 本发明提供一种医疗语音识别系统,属于医疗语音识别技术领域,包括:声学特征提取模块、改进型Transformer模型和融合推理模块;改进型Transformer模型采用旋转位置编码多头注意力,对高级声学特征中帧与帧之间的相对时序关系进行建模,...
  • 本发明提供了一种语音关键词识别方法、系统、设备及介质,属于语音识别技术领域,语音关键词识别方法包括:获取待处理语音中的候选关键词;根据候选关键词在待处理语音中的上下文信息,确定候选关键词是否为误识别的关键词;响应于确定候选关键词为误识别的关...
  • 本发明涉及语音合成技术领域,可应用于医疗健康及金融科技等业务系统平台中,公开了一种基于伪自回归的文本转语音方法,包括:获取输入信息和语义令牌,构建伪自回归文本转语义模块;根据输入信息和语义令牌生成第一阶段输入序列;伪自回归文本转语义模块对第...
  • 本发明公开了一种文本驱动的数字人音视频生成方法,涉及智能虚拟数字人生成技术领域,现提出如下方案,其包括获取驱动文本及参考图片,对所述驱动文本进行预处理以生成包含发音时序信息的音素序列,通过人脸特征点定位技术提取所述参考图片中的关键人脸特征点...
  • 本申请提出一种模型训练方法、书面语口语化方法、设备及产品,应用于自然语言处理领域。其中,模型训练方法包括:基于第一训练数据以及指示将书面语转写为口语的任务提示词,对大语言模型进行有监督训练,得到有监督训练模型,第一训练数据包括由书面语文本和...
  • 本发明公开一种基于视觉振动分析的音频信息重建系统及方法,包括通过线性顺序连接的:高速信号采集模块,用于通过高速相机采集目标物体的振动视频;振动预处理模块,用于对视频序列进行灰度化、稳定化和感兴趣区域选择;光流计算模块,用于计算连续帧之间的运...
技术分类