Document
拖动滑块完成拼图
首页 专利交易 IP管家助手 科技果 科技人才 积分商城 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
最新专利技术
  • 本发明提供一种基于语音指令的跨网络交互方法及系统,涉及网络通信技术领域,包括:接收语音指令提取关键词,进行语义理解和意图匹配,上下文关联分析,确定交互目标范围并划分优先级子任务,建立网络通道传输指令,部署执行状态追踪并实现故障恢复,反馈指令...
  • 本发明公开了一种端到端流式语音识别与自然语言理解联合优化方法及系统,该方法包括获取基于原始语音信号所提取得到的声学特征序列,并将声学特征序列输入至预训练好的共享编码器中;通过共享编码器对输入的声学特征序列进行深度编码,生成用于同时服务于语音...
  • 本发明涉及语音处理技术领域,可应用于金融科技及医疗健康等业务场景中,公开了一种语音驱动的信息记录与校验方法、装置、设备及介质,包括:接收语音输入生成带时间信息的待处理语音数据,应用语义解析策略提取关键字段形成初步结构化数据,连接独立数据系统...
  • 本发明提供的一种基于智能传感的城市噪声污染的噪声监测系统,涉及数据处理技术领域。在本发明中,首先,对第一噪声音频和第二噪声音频分别进行语义挖掘,形成第一噪声语义向量和第二噪声语义向量;其次,挖掘出噪声类型语义向量;然后,对噪声类型语义向量和...
  • 本发明涉及一种面向语音重构与分类的数字语义通信方法及系统,该方法包括:对语音数据进行预处理,将预处理后的数据输入基于双注意力残差机制网络构成的语义编码器;语义编码器输出的语义特征经信道编码器处理后,由采用软量化方法的调制器映射为数字星座符号...
  • 本发明涉及语言开关技术领域,尤其涉及一种基于离在线双模切换的语音开关响应优化方法及系统,该方法获取语音开关的离在线双模切换参数和性能参数,建立两者间的非线性映射关系,并通过优化算法求解最佳切换参数组合,得到目标性能指标下的目标参数下发至语音...
  • 本申请涉及一种分割模型的构建方法、装置及存储介质,该方法将语音识别大模型分割为编码器模型和解码器模型;其中,所述解码器模型包括多层Transformer解码模块;将所述解码器模型的多层Transformer解码模块按照预设分组规则分组,得到...
  • 本申请提供一种语音模型的建立方法、语音输出方法、语音模型的建立系统以及语音输出系统。语音模型的建立方法透过处理器执行并包括:取得多笔训练数据以及对应多笔训练数据的多个预设输出结果,其中,每一笔训练数据包括多个感测参数;输入多笔训练数据至人工...
  • 本发明提供一种复杂场景的两阶段音视频说话人提取方法及系统,其方法包括:提取音频特征和视频特征,并将音频特征和视频特征对齐后拼接,得到融合特征,其中,音频特征自包含待提取说话人语音的场景音频提取得到,视频特征自与场景音频对应的场景视频中提取得...
  • 本申请公开了一种音频分割方法、装置、设备、介质及产品,方法包括:先构造初始意群分割预测模型,然后获取意群分割音频数据,再利用意群分割音频数据训练初始意群分割预测模型,得到目标意群分割预测模型,从而将待预测音频数据输入目标意群分割预测模型,获...
  • 本申请实施例提供了一种多任务语音大语言模型的训练方法、装置、设备及介质,涉及人工智能技术领域。该方法包括:在多任务语音大模型新增第一语音任务的情况下,根据第一损失函数和已有的多任务数据训练多任务语音大语言模型,获得训练后的多任务语音大语言模...
  • 本申请公开了一种语音交互方法、装置、设备及存储介质,涉及人工智能技术领域,包括:采集发音对象在不同情绪下的语音数据;对所述语音数据进行语气特征提取,得到定制化语音库;所述定制化语音库包括多种语气特征;通过所述定制化语音库训练深度学习模型,得...
  • 本申请属于人工智能技术领域,具体涉及一种语音识别方法,该方法包括:通过编码器对样本序列中的第一音频样本进行编码处理,得到音频编码特征;分别通过第一解码器和第二解码器对音频编码特征进行解码处理,得到第一预测文本特征和第二预测文本特征,第一预测...
  • 本申请公开了一种实时语音识别方法、相关设备及计算机程序产品,本申请对待识别的实时语音流数据进行音频编码,得到音频编码特征,作为后续语音识别的基础。通过实时语音编码模块对音频编码特征进行编码处理,能够得到当前解码时刻所要解码token的声学向...
  • 本发明公开了一种基于语音识别的跨语言无障碍辅助诊疗方法,涉及语言识别技术领域,包括,构建医学知识图谱,并与初始识别文本进行匹配后,计算初始识别文本的医学上下文置信度序列,基于医学上下文置信度序列,预设医学阈值进行比较,根据比较结果对初始识别...
  • 本申请实施例涉及语音识别技术领域,公开了一种语音识别方法、装置、终端及可读存储介质,方法包括:基于待识别的语音信息进行语音特征提取,得到语音特征片段;根据语音特征片段获取候选字符,并获取候选字符的第一置信度结果;根据第一置信度结果,确定语音...
  • 本申请公开了一种语音识别纠错方法、相关设备及计算机程序产品,本申请在得到语音识别模型对目标音频的候选识别结果集合后,增加了纠错判断机制,根据语音识别模型对目标音频识别过程所提取的声学特征和候选识别结果集合,判断是否需要进行语音识别错误纠正,...
  • 本申请公开一种车载多语言语音识别方法、系统、电子设备及存储介质,涉及座舱语音控制领域,方法包括:采集驾驶舱内不同声学环境的多语言音频数据;将所述多语音音频数据进行预处理,提取语音特征,输出特征向量;获取多语言语音识别引擎,根据特征向量训练所...
  • 本公开实施例提供了一种音频生成方法、装置和相关产品,其中方法包括:响应于根据文本生成音频的指令,确定第一文本;所述第一文本用于生成第一音频;显示所述第一音频对应的至少一个音频配置信息;所述音频配置信息用于表示所述第一音频中的虚拟角色的数量和...
  • 本申请提供一种多音字发音标签的预测方法,将包括多音字的待处理文本转换成待处理文本顺向字符特征序列和待处理文本逆向字符特征序列,截取待处理文本顺向/逆向字符特征序列中部分序列作为多音字的顺向局部融合特征向量和多音字逆向局部融合特征向量,并根据...
技术分类