Document
拖动滑块完成拼图
首页 专利交易 IP管家助手 科技果 科技人才 积分商城 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
最新专利技术
  • 本申请提供一种客服语音智能质检方法,包括:数据存储步骤:接收客服通话录音文件并通过输入输出层接口存储至原始录音库;语音转写及语义增强步骤:调用定制化ASR模型解码音频,生成带时间戳的初步转写文本并增强处理;分层因果推理步骤:检索预设的规则知...
  • 本申请公开了一种语音识别及模型蒸馏方法、相关设备及程序产品,本申请在教师模型和学生模型之间设置至少一级的助教模型(尺寸介于教师和学生模型之间),采用知识蒸馏方法逐级向下训练,直至利用最后一级的助教模型对学生模型进行训练,得到训练后的学生模型...
  • 本发明涉及地质信息技术领域,具体涉及基于工程地质术语模型的AI语音转写录入方法及系统,方法含:以双麦克风降噪结合声学回声消除处理野外环境,获取含岩性、参数的纯净语音源数据;调用专业术语库与模型,转写为带标注文本并修正易混淆表述;借字段关联度...
  • 本公开提供了一种语音识别方法、装置、设备、存储介质及程序产品,涉及图像处理技术领域。其中,本公开中的语音识别方法包括:获取待识别语音,并基于待识别语音提取语音特征;获取待识别语音对应的视频内容,并基于视频内容提取视频特征;获取待识别语音的历...
  • 本申请实施例公开了一种语音识别方法、装置、设备及介质,应用于互联网技术领域。其中方法包括:在会话互动页面显示目标语音会话内容;响应于针对目标语音会话内容的文本转换操作,对目标语音会话内容进行识别;响应于目标语音会话内容的识别结果与目标事件匹...
  • 本申请提供一种样本数据构建方法、装置、设备、介质及产品,涉及自然语言处理技术领域,包括:获取种子语音数据及种子语音数据的多维度属性标签;根据提示信息,利用大语言模型,生成文本问题;提示信息包括多维度属性标签中的至少一种属性标签;根据文本问题...
  • 本公开涉及检测对话式AI系统和应用的语音中断。在各种示例中,本文描述了用于对话式AI系统和应用的语音中断检测。本文公开的系统和方法使用与文本中的单词(例如,标记)相关联的句子结尾检测和话语结尾检测二者来确定何时进一步处理文本的各个部分。例如...
  • 本申请公开了一种大模型训练、语音识别文本处理方法、装置、设备及介质,涉及通信技术领域,以提高后处理任务获得的文本输出的准确性。该方法包括:获取用于模型训练的文本数据集,其中,所述文本数据集包括第一文本数据集和第二文本数据集,所述第一文本数据...
  • 本公开的实施例提供了信息处理方法、设备、存储介质和产品。该方法包括:响应于对语音转文本的第一请求和/或文本转语音的第二请求,检测客户端与服务端之间的网络通信能力;如果网络通信能力超过第一能力等级,向服务端发送第一请求对应的第一语音和/或第二...
  • 本发明公开了一种智能陪伴系统、方法及智能终端,涉及到智能家居技术领域。本发明包括平台、终端和移动应用,平台包括语音克隆模块和留言储存模块;终端与平台通信连接,终端包括环境感知模块;移动应用与平台通信连接,移动应用被配置为供用户提交语音消息;...
  • 本发明属于语音识别技术领域,公开一种数字的语音识别方法、设备和介质,应用于端侧离线语音识别模组及带语音交互功能的家电、消费电子设备。其中方法包括:获取待识别语音;通过语音识别模型解码待识别语音,得到初步识别结果;回看 N(N 为大于 1 的...
  • 本申请公开了一种语音控制方法、装置、电子设备及存储介质,属于电子设备技术领域。所述方法应用于智能设备系统中的第一设备,方法包括:在接收到第二设备发送的第一任务信息的情况下,根据所述第一任务信息执行第一执行指令对应的任务;其中,所述第一任务信...
  • 本申请实施例提供一种语音大模型对话的打断管理方法、设备、介质及程序产品,涉及智能对话技术领域。所述方法包括:在AI语音播报期间,实时确定与当前语音播报进度相匹配的当前灵敏度等级;其中,所述当前灵敏度等级为至少两个预设灵敏度等级中的其中一个等...
  • 本发明提供了一种车载语音交互方法、系统、电子设备及介质,属于车载语音技术领域,该方法包括:获取语音信号;基于语音信号对语音合成模型进行自适应语音特征学习,得到调整后的语音合成模型;根据环境数据与语音信号进行联动处理,得到调整后的语音反馈策略...
  • 本发明涉及一种基于特征向量迭代优化的唤醒词识别方法,包括步骤1:构建模板库,包括基础文件夹和迭代文件夹;步骤2:定制过程中,将用户录入的基础音频样本存入基础文件夹;步骤3:基于基础音频样本生成初始特征向量库;步骤4:每次唤醒尝试中,将实时语...
  • 本申请实施例提供了一种语音任务的处理方法、装置、存储介质及计算机程序产品,该方法包括:获取待识别语音任务;其中,待识别语音任务包括待识别数据,待识别数据包括待识别语音数据或者待识别文本数据;基于待识别数据、待识别语音任务对应的任务标签以及第...
  • 本申请实施例提供一种通信系统、通信方法及相关装置,其中方法包括:接收第一信息,所述第一信息包括所述终端设备收集的用户意图;从第二网元获取所述终端设备的媒体向量信息,所述媒体向量信息与所述终端设备收集用户的行为信息相关联;根据所述媒体向量信息...
  • 本发明涉及车载语音交互及功能安全控制技术领域,具体为基于语音交互的仪表控制方法及系统,包括:响应于采集的原始音频流信号,执行控制流程,通过梅尔频率倒谱系数特征提取,生成声学特征向量序列;解算出瞬时干扰得分;基于声学特征向量序列,通过离线语音...
  • 本申请涉及语言交互技术领域,提供了一种自适应量化的语言交互方法及相关设备,该方法包括:获取大语言模型中每个模型层的输入数据和输出数据;分别针对每个模型层,基于模型层的输入数据和输出数据计算输入输出差异值,并基于模型层的所有权重参数计算权重分...
  • 本发明提供一种基于语音指令的跨网络交互方法及系统,涉及网络通信技术领域,包括:接收语音指令提取关键词,进行语义理解和意图匹配,上下文关联分析,确定交互目标范围并划分优先级子任务,建立网络通道传输指令,部署执行状态追踪并实现故障恢复,反馈指令...
技术分类