Document
拖动滑块完成拼图
专利交易 商标交易 积分商城 国际服务 IP管家助手 科技果 科技人才 会员权益 需求市场 关于龙图腾 更多
 /  免费注册
到顶部 到底部
清空 搜索
最新专利技术
  • 本发明涉及语音翻译技术领域,特别涉及一种基于自适应最优传输的跨式联运混淆方法及装置。方法包括:构建多任务通用框架的最优传输模型;对语音和文本序列进行基于注意力增强的最优传输对齐;基于动态窗口策略,对基于注意力增强的最优传输对齐进行优化,获得...
  • 本发明涉及语音服务技术领域,更具体的说,涉及一种用于咖啡机器人的多语言自然语音交互方法及系统,采集用户的语音信号,并对语音信号进行语言类型的识别,得到语音信号的类型信息,根据类型信息激活相应的语言识别模型,以对语音信号进行语义分析处理,生成...
  • 本申请公开了一种多语言混合语音识别方法及相关装置,涉及语音识别技术领域,本申请多语言混合语音识别模型不再依赖blank符号解决输入声学特征序列与输出文本建模单元长度不一致的问题,不同专家子模型具备预测不同语言的文本建模单元及其持续时间的能力...
  • 本发明涉及人工智能技术领域,提供了一种智能客服语音交互模型训练方法及系统,该方法包括:S1、采集历史客服通话录音、文本对话记录、工单数据及用户反馈数据,对数据进行预处理;S2、构建分层多任务训练框架。本发明通过统一的分层多任务训练框架实现智...
  • 本申请涉及一种免发音词典的基于音素的语音识别方法、装置、计算机设备和存储介质。所述方法包括:方法应用于服务器,服务器中部署有语音识别框架,语音识别框架包括音素识别模型、音字转换模型和辅助字音转换模型,方法包括:基于音素识别模型对待识别语音信...
  • 本发明公开了一种基于RAG的垂直领域语音识别优化方法、装置及介质,所述方法包括:将语音信号转为文本,提取其中置信度低于阈值的低置信度片段,以及文本的上下文语义特征;从垂直领域术语知识库中筛选出语义匹配的候选术语;用候选术语替换初始文本中的低...
  • 本发明公开了基于长音频的语音标注方法,包括以下步骤:S1:音频统一化与自适应质量过滤:接收多种格式的原始音频流,通过解码重采样,统一为预设标准格式的长音频文件;对长音频文件执行自适应质量过滤;S2:长音频场景解析与智能粗分割:对通过质量过滤...
  • 本发明涉及人工智能与嵌入式系统融合技术领域,提出了一种智能语音交互系统,包括:语音采集模块、边缘计算模块和云端处理模块;语音采集模块用于采集用户输入的语音数据;边缘计算模块用于对语音数据进行文本识别,得到文本信息;云端处理模块用于通过部署的...
  • 本发明涉及车辆控制技术领域,公开了一种自适应语音控车方法、装置、车辆及存储介质,方法包括:获取第一负载信息,第一负载信息用于反映车辆中多维硬件的负载高低;根据第一负载信息匹配对应的当前性能等级,并根据当前性能等级压缩大语言模型的推理能力,推...
  • 本发明涉及智能家居控制领域,尤其涉及一种基于语音识别的智能家居控制方法及系统。该方法包括以下步骤:基于室内分布式麦克风阵列采集用户语音信号;对用户语音信号进行干扰校正,得到待解析语音序列;对待解析语音序列深度语义解析,得到语音意图信息;对语...
  • 本发明公开了一种面向语音交互的端云协同大模型推理调度方法及装置,涉及人工智能与人机交互技术领域,方法响应用户语音指令后,先通过获取终端网络状态参数与终端运行状态参数构建环境状态向量,再解析语音指令并预处理得到任务特征向量,基于这两个向量进行...
  • 本发明公开一种基于人工智能的古诗词教学方法,涉及教学信息化技术领域。所述方法包括:获取诗词朗读时的语音信号,对语音信号通过汉明窗进行交叠分帧,并通过短时傅里叶变换得到频谱图;根据频谱图提取功率谱,使用Mel滤波器组处理后取对数,得到Filt...
  • 本发明公开了一种基于微调大语言模型的语音指令系统及工作方法,该系统包括语音采集模块、语音转文字模块、指令过滤模块、语义解析与指令生成模块、工业协议适配模块、指令发送模块、操作反馈模块;其工作方法步骤为:S1、语音采集模块捕获操作人员的音频信...
  • 本发明提供的一种基于语音编程与AI决策的全主动智能底盘控制系统及方法,涉及智能车辆底盘控制技术领域,包括以下模块:语音采集识别模块,将采集的用户语音进行语义解析;需求编程模块,用于设定底盘各模块的控制逻辑和参数;娱乐功能模块,包含音乐节奏提...
  • 本申请涉及一种车辆控制方法、装置、计算机设备以及存储介质。方法包括:获取用户对车辆输入的语音控制指令,将语音控制指令转换为控制指令文本;执行第一线程,以通过预设的控制指令数据库,对控制指令文本进行意图识别,获得第一意图识别结果;执行第二线程...
  • 一种基于儿童虚拟宠物的交互方法、系统及存储介质,其包括接收多模态输入数据;基于多模态输入数据的类型,调用并执行对应的处理逻辑;对于用户语音指令,执行语音交互逻辑,包括识别用户语音指令,基于儿童意图分类模型对识别结果进行分析,生成目标文本;为...
  • 本发明涉及语音识别技术领域,公开了一种医疗术语识别方法、装置、设备及介质,方法包括获取混合语音数据;对所述混合语音数据进行语种标注,确定所述混合语音数据中包含的粤语、普通话及英语语音片段的语种边界标签;并行运行粤语、普通话和英语对应的专用语...
  • 本发明涉及智能家居与电竞设备技术领域,具体公开了一种电竞桌智能语音控制系统,系统:多模态信号采集模块、语音交互核心模块、用户意图解析与上下文管理模块、多设备协同控制模块以及自适应学习模块,其中:所述多模态信号采集模块,用于采集用户语音信号及...
  • 本发明实施例提供了一种智能设备的语音交互方法、装置、电子设备及介质,涉及语音处理技术领域。所述方法包括:在智能设备语音播报的过程中,采集用户音频;判断用户音频是否满足语音检测触发条件;若用户音频满足语音检测触发条件,获取用户状态信息以及设备...
  • 本发明公开了一种语音转码并发数自适应控制方法、装置及介质,应用于包含一组处理器的媒体网关,获取转码业务类型;对每一转码业务类型进行单处理器逻辑核的基准能力测量,得到并发支持能力参数;基于并发支持能力参数,计算每一转码业务类型的单位路核开销;...
技术分类