Document
拖动滑块完成拼图
专利交易 商标交易 积分商城 国际服务 IP管家助手 科技果 科技人才 会员权益 需求市场 关于龙图腾 更多
 /  免费注册
到顶部 到底部
清空 搜索
最新专利技术
  • 本发明涉及天然气锅炉技术领域的一种天然气锅炉降噪方法与振动抑制装置,其降噪方法包括S1‑S5个步骤,其振动抑制装置包括传感与诊断模块、主动控制模块、被动治理模块、中央处理与闭环优化单元,本发明改进现有系统性的不足,通过基于数据模型和协同技术...
  • 本申请涉及一种三维可调谐的声涡旋反射超构光栅及声涡旋调控装置。包括:深度调节机构以及对刚性圆柱体基底进行刻蚀形成的两个周期性超级晶胞;每个周期性超级晶胞包括m个扇形单元,一个扇形单元的内部刻蚀为呈扇环状的管道作为深度调节扇形单元,另外的m‑...
  • 本说明书提供了一种基于LLM构建的语音生成网络,包括:基于LLM构建的推理网络,用于对输入的语音数据进行推理计算,以按照自回归的方式生成与所述语音数据对应的文本词元序列;采用多通道的网络架构的生成网络,用于生成与所述文本词元序列中的文本词元...
  • 本发明公开了一种语音生成方法及电子设备,包括:获取虚拟对象的特征信息,所述特征信息包括所述虚拟对象的基本信息以及医学信息,其中所述医学信息包括诊断结果、病历记录、心理评估结果中的至少一种;基于所述特征信息确定目标语音参数;获取输出文本信息;...
  • 本说明书公开了一种基于多模态扩散模型的视觉引导情感语音合成方法,涉及人工智能与语音合成交叉领域。该方法旨在解决现有视觉引导语音合成中多模态融合不充分、频谱质量不佳、风格相似度不足等问题,核心方案包括:构建以音素特征为核心的多模态融合机制,通...
  • 本申请提供一种语音合成方法、装置、设备、介质及程序产品,涉及数据处理技术领域,用于提高合成音频的效果和推理效率。该方法包括:对目标输入文本进行分句处理得到句子列表;对每个句子的文本相关数据进行多模态向量嵌入及融合,得到每个句子的融合嵌入向量...
  • 本申请涉及语音识别技术领域,公开了一种语音识别模型的测试方法、装置及电子设备,该测试方法包括:获取待测音频文件,待测音频文件指示待测文本的音频数据;根据待测音频文件,生成噪声环境下的第二待测音频文件;基于第二待测音频文件,通过语音识别模型识...
  • 本发明公开了一种融合声韵分析的古典诗文吟诵辅助方法,涉及数字教育技术领域,该辅助方法步骤包括:基于对吟诵音频信号的结构化采集与分析,实现对吟诵节奏与押韵状态的智能判断与提示;通过语音识别技术采集并划分吟诵音频为各字片段,并结合诗文结构生成对...
  • 本发明提出了一种基于智慧中屏语音交互系统的未知意图识别方法、介质及设备,属于语音交互系统领域。方法包括:对用户语音转换后的文本进行特征提取,得到深层语义特征;基于深层语义特征,计算分类概率和语义相似度两类指标;根据分类概率和语义相似度,综合...
  • 本发明实施例公开了一种银行客服的服务调用方法、装置、设备及介质,适用与金融科技领域,该方法包括:获取用户针对目标业务的语音信息;根据所述语音信息对应的文本信息及音频特征,确定所述用户的目标特征值;在所述目标特征值满足预设阈值的情况下,基于预...
  • 本发明公开了一种基于多模态语料分析的医患言语沟通模型训练方法及系统,属于人工智能与医疗的交叉领域,方法为:根据OpenPose算法提取得到动作特征,进行肌肉活动强度检测得到表情特征,进行语音识别得到文本特征,基于时域能量参数进行语音分割,对...
  • 本发明公开了一种用于优化语音交互延迟的双触发处理方法及系统,系统包括客户端、服务端和通信三个子系统,客户端子系统实时获取用户语音处理得到语音帧后由通信子系统发给服务端子系统;服务端子系统拼接语音帧序列;对语音帧序列和语音识别模块反馈的中间文...
  • 本发明公开了音唇同步误报过滤方法、装置、计算机设备及存储介质,所述方法包括:获取音频流数据;对音频流数据进行分离处理,以得到提问语音片段和候选语音片段;对提问语音片段和候选语音片段分别进行语音识别,以得到提问文本和候选文本;对提问文本和候选...
  • 本申请公开了一种语音识别系统、方法、计算机设备及计算机可读存储介质,系统包括数据接收模块、数据预处理模块、任务队列、语音识别模块,数据接收模块被配置为接收不同用户的请求数据包,以得到第一语音数据表示,数据预处理模块被配置为对第一语音数据表示...
  • 本发明公开一种无人机地面站智能语音控制方法及系统。所述无人机地面站智能语音控制方法包括:无人机语音操控步骤和无人机通侦语音转写步骤。本发明的有益效果在于:能够接收飞行员端和无人机端的指令语音数据和通侦语音数据并且完成指令识别和语音转写,满足...
  • 本申请提供了一种音频识别方法、装置、设备、存储介质及计算机程序产品;方法包括:对待识别音频数据进行音频编码处理,得到音频编码特征;对音频编码特征进行第一解码处理,得到第一解码特征;对预设的词文本以及第一解码特征进行第一文本编码处理,得到第一...
  • 本案是一种电子装置与其语音控制方法。此方法适用于包括显示器与麦克风装置的电子装置,并包括下列步骤。运行开机固件的上电自我测试程序。于上电自我测试程序期间,对麦克风装置接收的语音输入进行语音识别处理,以获取第一语音指令。于上电自我测试程序期间...
  • 本发明涉及一种基于大模型知识库的智能座舱语音问答系统及方法,包括:知识边界决策器对用户指令文本进行语义编码,基于参数化知识置信度计算模型计算实时接收的用户指令文本的参数化知识置信度,判断参数化知识置信度大于设定阈值时,通过大模型对用户指令文...
  • 本公开涉及上下文数字助理响应。本文公开了用于基于非言语输入和低功率上下文采集来提供动作辅助的示例过程。例如,基于上下文来选择非言语音频事件,并且响应于检测到活动非言语音频事件,基于所检测到的音频向用户提供动作辅助;或者检测到活动音频事件触发...
  • 本发明提供一种融合车载实时状态的车辆交互方法、装置、系统与电子设备。该方法包括:接收用户的语音指令;调取与语音指令相关的车辆状态信息;车辆状态信息包括车辆当前状态信息以及长期状态信息;将语音指令以及车辆状态信息上传至云端服务器,以供云端服务...
技术分类