Document
拖动滑块完成拼图
首页 专利交易 IP管家助手 科技果 科技人才 积分商城 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
最新专利技术
  • 本发明公开了一种基于语音识别的跨语言无障碍辅助诊疗方法,涉及语言识别技术领域,包括,构建医学知识图谱,并与初始识别文本进行匹配后,计算初始识别文本的医学上下文置信度序列,基于医学上下文置信度序列,预设医学阈值进行比较,根据比较结果对初始识别...
  • 本申请公开了一种实时语音识别方法、相关设备及计算机程序产品,本申请对待识别的实时语音流数据进行音频编码,得到音频编码特征,作为后续语音识别的基础。通过实时语音编码模块对音频编码特征进行编码处理,能够得到当前解码时刻所要解码token的声学向...
  • 本申请属于人工智能技术领域,具体涉及一种语音识别方法,该方法包括:通过编码器对样本序列中的第一音频样本进行编码处理,得到音频编码特征;分别通过第一解码器和第二解码器对音频编码特征进行解码处理,得到第一预测文本特征和第二预测文本特征,第一预测...
  • 本申请公开了一种语音交互方法、装置、设备及存储介质,涉及人工智能技术领域,包括:采集发音对象在不同情绪下的语音数据;对所述语音数据进行语气特征提取,得到定制化语音库;所述定制化语音库包括多种语气特征;通过所述定制化语音库训练深度学习模型,得...
  • 本申请实施例提供了一种多任务语音大语言模型的训练方法、装置、设备及介质,涉及人工智能技术领域。该方法包括:在多任务语音大模型新增第一语音任务的情况下,根据第一损失函数和已有的多任务数据训练多任务语音大语言模型,获得训练后的多任务语音大语言模...
  • 本申请公开了一种音频分割方法、装置、设备、介质及产品,方法包括:先构造初始意群分割预测模型,然后获取意群分割音频数据,再利用意群分割音频数据训练初始意群分割预测模型,得到目标意群分割预测模型,从而将待预测音频数据输入目标意群分割预测模型,获...
  • 本发明提供一种复杂场景的两阶段音视频说话人提取方法及系统,其方法包括:提取音频特征和视频特征,并将音频特征和视频特征对齐后拼接,得到融合特征,其中,音频特征自包含待提取说话人语音的场景音频提取得到,视频特征自与场景音频对应的场景视频中提取得...
  • 本申请提供一种语音模型的建立方法、语音输出方法、语音模型的建立系统以及语音输出系统。语音模型的建立方法透过处理器执行并包括:取得多笔训练数据以及对应多笔训练数据的多个预设输出结果,其中,每一笔训练数据包括多个感测参数;输入多笔训练数据至人工...
  • 本申请涉及一种分割模型的构建方法、装置及存储介质,该方法将语音识别大模型分割为编码器模型和解码器模型;其中,所述解码器模型包括多层Transformer解码模块;将所述解码器模型的多层Transformer解码模块按照预设分组规则分组,得到...
  • 本发明涉及语言开关技术领域,尤其涉及一种基于离在线双模切换的语音开关响应优化方法及系统,该方法获取语音开关的离在线双模切换参数和性能参数,建立两者间的非线性映射关系,并通过优化算法求解最佳切换参数组合,得到目标性能指标下的目标参数下发至语音...
  • 本发明涉及一种面向语音重构与分类的数字语义通信方法及系统,该方法包括:对语音数据进行预处理,将预处理后的数据输入基于双注意力残差机制网络构成的语义编码器;语义编码器输出的语义特征经信道编码器处理后,由采用软量化方法的调制器映射为数字星座符号...
  • 本发明提供的一种基于智能传感的城市噪声污染的噪声监测系统,涉及数据处理技术领域。在本发明中,首先,对第一噪声音频和第二噪声音频分别进行语义挖掘,形成第一噪声语义向量和第二噪声语义向量;其次,挖掘出噪声类型语义向量;然后,对噪声类型语义向量和...
  • 本发明涉及语音处理技术领域,可应用于金融科技及医疗健康等业务场景中,公开了一种语音驱动的信息记录与校验方法、装置、设备及介质,包括:接收语音输入生成带时间信息的待处理语音数据,应用语义解析策略提取关键字段形成初步结构化数据,连接独立数据系统...
  • 本发明公开了一种端到端流式语音识别与自然语言理解联合优化方法及系统,该方法包括获取基于原始语音信号所提取得到的声学特征序列,并将声学特征序列输入至预训练好的共享编码器中;通过共享编码器对输入的声学特征序列进行深度编码,生成用于同时服务于语音...
  • 本发明提供一种基于语音指令的跨网络交互方法及系统,涉及网络通信技术领域,包括:接收语音指令提取关键词,进行语义理解和意图匹配,上下文关联分析,确定交互目标范围并划分优先级子任务,建立网络通道传输指令,部署执行状态追踪并实现故障恢复,反馈指令...
  • 本申请涉及语言交互技术领域,提供了一种自适应量化的语言交互方法及相关设备,该方法包括:获取大语言模型中每个模型层的输入数据和输出数据;分别针对每个模型层,基于模型层的输入数据和输出数据计算输入输出差异值,并基于模型层的所有权重参数计算权重分...
  • 本发明涉及车载语音交互及功能安全控制技术领域,具体为基于语音交互的仪表控制方法及系统,包括:响应于采集的原始音频流信号,执行控制流程,通过梅尔频率倒谱系数特征提取,生成声学特征向量序列;解算出瞬时干扰得分;基于声学特征向量序列,通过离线语音...
  • 本申请实施例提供一种通信系统、通信方法及相关装置,其中方法包括:接收第一信息,所述第一信息包括所述终端设备收集的用户意图;从第二网元获取所述终端设备的媒体向量信息,所述媒体向量信息与所述终端设备收集用户的行为信息相关联;根据所述媒体向量信息...
  • 本申请实施例提供了一种语音任务的处理方法、装置、存储介质及计算机程序产品,该方法包括:获取待识别语音任务;其中,待识别语音任务包括待识别数据,待识别数据包括待识别语音数据或者待识别文本数据;基于待识别数据、待识别语音任务对应的任务标签以及第...
  • 本发明涉及一种基于特征向量迭代优化的唤醒词识别方法,包括步骤1:构建模板库,包括基础文件夹和迭代文件夹;步骤2:定制过程中,将用户录入的基础音频样本存入基础文件夹;步骤3:基于基础音频样本生成初始特征向量库;步骤4:每次唤醒尝试中,将实时语...
技术分类