Document
拖动滑块完成拼图
专利交易 积分商城 国际服务 IP管家助手 科技果 科技人才 商标交易 会员权益 需求市场 关于龙图腾 更多
 /  免费注册
到顶部 到底部
清空 搜索
最新专利技术
  • 本公开提供了一种四足机器人降噪方法及四足机器人,其中,该方法包括:在四足机器人移动过程中,利用部署于所述四足机器人不同部位的麦克风阵列,采集所述四足机器人产生的噪声信号;在所述噪声信号满足降噪条件的情况下,根据所述四足机器人当前的运行场景信...
  • 本发明公开了一种基于反射型声学超表面的水下高频多功能聚焦透镜,所述聚焦透镜间距设置于平面声源前方,所述声学透镜包括:第一透镜、第二透镜、第三透镜、第四透镜和第五透镜,所述各透镜分别置于前一透镜的外侧,透镜整体由五个独立透镜组成。由此,本发明...
  • 本发明涉及一种基于全通孔和盲孔耦合的声学全息成像装置和方法,输出端形成有全息成像平面,装置包括点声源和全息平板结构,全息平板结构内分布有沿全息平板结构厚度方向延伸的多个全通孔和盲孔,盲孔位于全息平板结构的透射端,该透射端靠近全息成像平面;装...
  • 本发明公开整车车内噪声复现系统及整车车内噪声复现方法。整车车内噪声复现系统,其特征在于,包括:多个车外扬声器、一个或多个车内扬声器、传声器阵列以及控制器,车外扬声器、车内扬声器、传声器阵列分别与控制器连接,其中:车外扬声器布置在半消声室内且...
  • 本发明提供了一种连铸生产过程信息智能语音播报装置及播报方法;该装置包括语音播报工控机、语音合成播报器、语音文件SD存储卡、连铸生产控制PLC设备和语音播放扬声器。语音播报工控机的第一网卡通过以太网线与连铸生产控制PLC系统连接,第二网卡通过...
  • 本发明涉及一种基于毫米波雷达的多物体振动融合语音感知与重建方法,包括:步骤S1:对毫米波雷达接收信号进行距离频率变换得到多个离散的物体振动信号;步骤S2:基于物体振动信号,利用训练好的特征提取网络得到各物体的频率响应函数;步骤S3:将各物体...
  • 本发明公开了基于深度学习的个性化声纹模拟语音合成系统及方法,涉及声纹模拟语音合成技术领域。该基于深度学习的个性化声纹模拟语音合成系统,包括:语音目标声纹特征提取模块;声纹特征训练模块;目标声纹语音生成模块。本发明通过接收声纹模拟指令后,获取...
  • 本发明提供了一种文本转语音方法及相关装置,属于语音合成技术领域。本发明获取拟发音原始文本;获取预训练文本转语音模型输入文本和输出音频对,得到风格文本和风格音频;基于预训练文本转语音模型、风格文本和风格音频,构建三元组库;从三元组库的音频中选...
  • 本发明公开了一种基于动态语音合成的工业监控智能报警方法、装置、系统及存储介质,包括:接收前端的结构化报警事件数据;根据数据与预置模板生成待合成语音文本;调用本地部署的语音合成引擎处理语音文本生成语音音频数据;将音频数据流式传输至前端播放。其...
  • 本发明提供一种将自然语调转化为旋律的方法、系统、终端及介质,通过提取语音样本的基频和音长信息,区分声韵母并计算各韵母的基频参数,确定其在语句中的调音范围。并利用这些调音范围匹配音乐符号,生成初步旋律,并最终将旋律与语音样本的音节对齐,生成带...
  • 本发明公开了一种面向小微企业的全语种语音交互法务智能体系统及方法,该系统核心包括全语种语音输入模块、语种识别模块、语音识别引擎路由模块、专用语音识别引擎集群、企业级多语言自然语言处理模块、企业法务智能体核心、多模态输出模块和反馈优化模块,各...
  • 本发明公开了一种基于大模型的同声传译方法、系统及电子设备,包括基于标准化专业词典,从专业资源中抽取术语相关的双语平行语料,经过数据增强处理和人工筛选获得合格语料后,按照词、句、段落层级构建多层次语料库;实时接收输入的音频流,通过预处理提取声...
  • 本发明涉及一种端云翻译系统的语音翻译方法、装置、设备以及介质,涉及智能语音翻译技术领域,端云翻译系统包括音频接收端以及云端,该方法应用于音频接收端,包括:获取音频接收端的第一语言音频;将所述第一语言音频发送到云端;接收并播放第二语言音频,所...
  • 本申请提出一种语音指令的修正方法及相关装置,方法包括:获取第一指令信息,基于第一指令信息确定目标任务信息;基于目标任务信息确定指令置信度;基于指令置信度和多级指令确认操作得到第二指令信息,第二指令信息包括第三指令信息或第一指令信息,第三指令...
  • 本发明公开一种基于片段感知学习的语音伪造定位方法及系统,旨在解决现有语音篡改定位技术过度依赖边界伪影、长篡改片段定位不准及泛化性差的问题。所述方法包括:获取待处理音频数据,构建集成片段位置标注与跨片段混合技术的片段感知学习框架;通过预训练自...
  • 本申请提供一种去除非线性回声的模型训练方法及显示设备,通过获取第一音频信号,并消除第一音频信号中的线性回声信号,得到第二音频信号,提取第二音频信号的非线性失真特征、时频判别特征、卷积特征和时序动态特征,并执行特征融合,得到第一融合特征,再将...
  • 本发明提供一种语音识别方法、装置、电子设备、存储介质和程序产品,涉及语音处理技术领域。该方法包括:将待识别语音输入至语音识别模型,得到语音识别模型输出的语音识别结果;语音识别模型是基于样本待识别语音对应的第一语音识别结果,与样本待识别语音对...
  • 本公开提供一种语音大模型的训练方法及装置、设备、介质,该语音大模型的训练方法包括:将训练语音数据子集输入语音大模型,获取语音大模型中大语言模型模块输出的、训练语音数据子集的预测概率分布;根据预测概率分布和所述真实概率分布,确定熵加权交叉熵损...
  • 本发明涉及语音识别技术领域,旨在解决重口音语音识别模型训练样本匮乏的问题。提供一种训练语音识别模型的样本集生成方法、装置和计算机设备,其中方法包括:将目标命令词解码为无声调原始拼音序列;基于常见非标准发音规律构建的重口音规则库(重口音指声母...
  • 本发明提出基于大模型的智能会议多模态交互优化方法及系统,方法包括:获取会议多模态数据,并构建基于图像内容快照锁定机制的锁定图像帧集合;将所述多模态数据流的每条模态数据输入预训练的大模型以生成对应模态数据的嵌入向量,利用每一对嵌入向量之间的相...
技术分类