Document
拖动滑块完成拼图
首页 专利交易 IP管家助手 科技果 科技人才 积分商城 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
最新专利技术
  • 本申请公开了一种交互方法、装置、设备及存储介质,用于提升交互效率。本申请采集用户输入的音频流;采用语音识别技术对音频流进行语音识别处理,得到文本信息;采用预先训练好的流式指令模型确定文本信息是否为流式指令;若确定文本信息为流式指令,则对文本...
  • 本发明公开了一种语音识别标注方法及装置,属于语音识别技术领域,该方法为:将待处理语音分离为多个单声道语音;对于每一单声道语音,基于各语音帧的音量幅度计算平均音量能量,并结合预设阈限确定动态能量阈值;基于动态能量阈值,分别计算单声道语音所有语...
  • 本申请涉及语音信号处理技术领域。本申请公开了一种基于声音事件的人体活动的识别方法、装置、终端及存储介质,其能够减少对人工标注数据的依赖,降低人工标记的成本,同时,提高人体活动模型识别人体活动的准确度。所述基于声音事件的人体活动的识别方法包括...
  • 本申请涉及一种嵌入式语音系统中私有语义模型的训练与部署方法,该方法包括对语义模型训练数据进行语义复杂度分析,确定对应的语义模型结构和训练参数配置;基于语义模型结构和训练参数配置执行语义识别模型训练操作,生成初始语义识别模型,并对初始语义识别...
  • 本发明提供一种语音识别纠错方法及装置,涉及数据处理技术领域,包括:将待识别用户音频中的当前音频帧输入语音识别模型,得到当前音频帧的声学特征和第一文本字符;将当前音频帧的声学特征和第一文本字符,以及历史修正文本序列,输入语音识别纠错模型,得到...
  • 本发明公开了一种模型部署方法、装置、电子设备及计算机程序产品。该方法包括:获取模型部署设备支持的模型训练参数;依据模型训练参数,在预设语音模型的语音增强流式神经网络中截取语音子模型,语音增强流式神经网络中每个残差模块至少包括:可伸缩线性层、...
  • 本公开提供了一种语音识别方法、模型训练方法、装置、电子设备以及介质,涉及人工智能技术领域,尤其涉及大模型、语音识别和自然语言处理领域。具体实现方案为:将待处理音频的音频特征、目标文本的文本特征和待处理音频的语义特征进行语义融合,得到目标融合...
  • 本发明提供了一种基于轻量化Conformer与方言嵌入的多方言语音识别方法及系统,该方法包括:对输入的方言语音数据进行预处理,提取Fbank特征并进行标准化;为每个语音样本附加方言ID标签,并输入到轻量级Conformer编码器中;轻量级C...
  • 本申请涉及一种数据处理方法及服务器,涉及大模型技术领域。该方法应用于计算机设备,计算机设备中集成有包括至少两个级联的特征提取模块和一个KV压缩模块的目标大语言模型,该方法包括:将目标提示文本分别输入每一特征提取模块,得到每一特征提取模块输出...
  • 本公开的实施例公开了语音识别方法、装置、设备、计算机可读介质和程序产品。该方法的一具体实施方式包括:将获取的目标语音输入至预训练的语音大模型包括的语音编码层,得到语音编码信息,语音大模型还包括:特征处理层、初步语音识别层和识别决策层;将语音...
  • 本申请实施例提供一种基于语音指令的车辆控制方法、装置及设备。该方法包括:接收用户发出的目标语音指令;根据所述目标语音指令和预设的指令库,得到与所述目标语音指令匹配的目标语义解析模型;其中,所述指令库用于表征语音指令与语义解析模型之间的对应关...
  • 本申请实施例提供一种基于语音指令的车辆控制方法、装置及设备。该方法包括:在用户发起语音指令时,若确定接收到首个目标字符单元,则基于预设的指令库和所述首个目标字符单元,确定目标语义解析模型;其中,所述指令库用于表征语义解析模型与字符单元之间的...
  • 本发明公开了一种电力作业高精度语音识别与安全监测系统及方法,系统包括:语音采集模块、识别处理模块、实时评估模块、反馈输出模块和远程交互监测模块;所述语音采集模块,用于采集作业人员语音指令并利用改进GAN模型进行语音增强,获取增强语音指令;所...
  • 本申请提供了一种智能设备的语音控制方法、装置、电子设备和存储介质,该方法包括:在接收到第一语音数据时,确定第一语音数据所属的目标声学场景;确定为目标声学场景设置的目标过滤策略;其中,不同的声学场景设置有不同的过滤策略;根据目标过滤策略,对第...
  • 本公开实施例提供一种语音处理方法、装置、设备、存储介质及产品,该方法包括:在与第二终端处于连接状态的情况下,接收第二终端发送的第一语音信号,第一语音信号是指第二终端对目标用户发出的声音采集获得的语音信号;通过语音交互模型,获得与第一语音信号...
  • 本申请公开了语音交互方法、系统、计算机设备及计算机可读存储介质,包括:基于诊断功能的实现步骤数量,将诊断功能划分为第一类型和第二类型,其中,第一类型的诊断功能标记为第一标签,第二类型的诊断功能标记为第二标签;为进入诊断功能所关联的菜单页面添...
  • 本发明实施例提供一种语音唤醒的阈值自适应方法、系统、电子设备和存储介质。该方法包括:检测到有实时的语音输入时,进行预唤醒判断,若达到预唤醒条件时,进入预唤醒阶段;在预唤醒阶段中,实时对语音进行语音属性分析,得到语音的多个语音属性,基于多个语...
  • 本申请实施例提供一种风险防控规则配置方法、装置、设备、介质及程序产品。该方法包括:响应于用户在银行系统的目标金融业务的配置页面的语音输入操作,获取用户输入的语音数据;所述语音数据用于描述所述用户针对所述目标金融业务的风险防控规则相关的配置需...
  • 本发明提供了一种智能马桶的控制方法及存储介质,所述控制方法包括马桶本体,设置于马桶本体内的语音识别模块、马桶动作控制模块和探头,控制方法包括以下步骤:S1,当探头检测到用户的预设交互行为时,触发唤起语音识别模块;S2,语音识别模块接收用户输...
  • 本发明提出一种储能设备及其语音控制方法和装置。语音控制方法应用于储能设备,储能设备与语音设备通过双向供电接口连接,且与语音设备通信连接;方法包括:检测电网的供电状态;在电网供电的情况下,不向语音设备供电,并接收语音设备发送的工作控制指令,根...
技术分类