Document
拖动滑块完成拼图
首页 专利交易 IP管家助手 科技果 科技人才 积分商城 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
最新专利技术
  • 本申请实施例提供一种语音大模型对话的打断管理方法、设备、介质及程序产品,涉及智能对话技术领域。所述方法包括:在AI语音播报期间,实时确定与当前语音播报进度相匹配的当前灵敏度等级;其中,所述当前灵敏度等级为至少两个预设灵敏度等级中的其中一个等...
  • 本申请公开了一种语音控制方法、装置、电子设备及存储介质,属于电子设备技术领域。所述方法应用于智能设备系统中的第一设备,方法包括:在接收到第二设备发送的第一任务信息的情况下,根据所述第一任务信息执行第一执行指令对应的任务;其中,所述第一任务信...
  • 本发明属于语音识别技术领域,公开一种数字的语音识别方法、设备和介质,应用于端侧离线语音识别模组及带语音交互功能的家电、消费电子设备。其中方法包括:获取待识别语音;通过语音识别模型解码待识别语音,得到初步识别结果;回看 N(N 为大于 1 的...
  • 本发明公开了一种智能陪伴系统、方法及智能终端,涉及到智能家居技术领域。本发明包括平台、终端和移动应用,平台包括语音克隆模块和留言储存模块;终端与平台通信连接,终端包括环境感知模块;移动应用与平台通信连接,移动应用被配置为供用户提交语音消息;...
  • 本公开的实施例提供了信息处理方法、设备、存储介质和产品。该方法包括:响应于对语音转文本的第一请求和/或文本转语音的第二请求,检测客户端与服务端之间的网络通信能力;如果网络通信能力超过第一能力等级,向服务端发送第一请求对应的第一语音和/或第二...
  • 本申请公开了一种大模型训练、语音识别文本处理方法、装置、设备及介质,涉及通信技术领域,以提高后处理任务获得的文本输出的准确性。该方法包括:获取用于模型训练的文本数据集,其中,所述文本数据集包括第一文本数据集和第二文本数据集,所述第一文本数据...
  • 本公开涉及检测对话式AI系统和应用的语音中断。在各种示例中,本文描述了用于对话式AI系统和应用的语音中断检测。本文公开的系统和方法使用与文本中的单词(例如,标记)相关联的句子结尾检测和话语结尾检测二者来确定何时进一步处理文本的各个部分。例如...
  • 本申请提供一种样本数据构建方法、装置、设备、介质及产品,涉及自然语言处理技术领域,包括:获取种子语音数据及种子语音数据的多维度属性标签;根据提示信息,利用大语言模型,生成文本问题;提示信息包括多维度属性标签中的至少一种属性标签;根据文本问题...
  • 本申请实施例公开了一种语音识别方法、装置、设备及介质,应用于互联网技术领域。其中方法包括:在会话互动页面显示目标语音会话内容;响应于针对目标语音会话内容的文本转换操作,对目标语音会话内容进行识别;响应于目标语音会话内容的识别结果与目标事件匹...
  • 本公开提供了一种语音识别方法、装置、设备、存储介质及程序产品,涉及图像处理技术领域。其中,本公开中的语音识别方法包括:获取待识别语音,并基于待识别语音提取语音特征;获取待识别语音对应的视频内容,并基于视频内容提取视频特征;获取待识别语音的历...
  • 本发明涉及地质信息技术领域,具体涉及基于工程地质术语模型的AI语音转写录入方法及系统,方法含:以双麦克风降噪结合声学回声消除处理野外环境,获取含岩性、参数的纯净语音源数据;调用专业术语库与模型,转写为带标注文本并修正易混淆表述;借字段关联度...
  • 本申请公开了一种语音识别及模型蒸馏方法、相关设备及程序产品,本申请在教师模型和学生模型之间设置至少一级的助教模型(尺寸介于教师和学生模型之间),采用知识蒸馏方法逐级向下训练,直至利用最后一级的助教模型对学生模型进行训练,得到训练后的学生模型...
  • 本申请提供一种客服语音智能质检方法,包括:数据存储步骤:接收客服通话录音文件并通过输入输出层接口存储至原始录音库;语音转写及语义增强步骤:调用定制化ASR模型解码音频,生成带时间戳的初步转写文本并增强处理;分层因果推理步骤:检索预设的规则知...
  • 本申请提供一种超大规模声纹识别模型的训练方法及训练设备,所述超大规模声纹识别模型包括:说话人特征提取器和全连接层;该方法包括:将说话人特征提取器的训练参数载入GPU,将全连接层的第一参数矩阵载入CPU;对第一参数矩阵进行聚类,将第一参数矩阵...
  • 本申请提供了一种基于声纹识别的水泵故障诊断方法、设备及介质,根据本申请的方法包括:获取水泵声纹信号,采用基于麻雀搜索算法优化的VMD分解方法对所述声纹信号进行分解获取初步分解信号;对初步分解信号进行处理获取FBANK能量谱以及GTFB优化频...
  • 本申请涉及一种在音频解码器处执行的方法,其中音频解码器接收包括元数据的压缩音频数据的比特流。在元数据中,确定至少一个音频参数,所述至少一个音频参数影响基于比特流生成并由多个扬声器播放的音频信号的感知。修正所述至少一个音频参数以便生成修正的比...
  • 本申请提供了一种基于文本语义信息保真的超低码率语音编解码系统,涉及语音编解码技术领域。该系统包括:通过多模态文本‑语音联合编码器,对原始语音进行语音特征提取和文本特征提取,得语音特征和文本特征,并将文本特征嵌入到语音特征中,得到原始语音的文...
  • 一种设备包括存储器,其被配置为存储在不同时间段处的未经变换的全景声系数。该设备还包括一个或多个处理器,其被配置为:获得在不同时间段处的未经变换的全景声系数,其中,在不同时间段处的未经变换的全景声系数表示在不同时间段处的声场。一个或多个处理器...
  • 本申请涉及具有减少后处理延迟的高频重建技术的集成,并具体揭示一种用于解码经编码音频位流的方法。所述方法包含接收所述经编码音频位流且解码音频数据以产生经解码低频带音频信号。所述方法进一步包含提取高频重建元数据且使用分析滤波器组来对所述经解码低...
  • 本申请涉及一种音频处理方法、装置、计算机设备、计算机可读存储介质和计算机程序产品。所述方法包括:获取各音频通路对应的音频数据,根据目标采样率对各音频数据分别进行转采样处理,得到各音频通路对应的转采样音频,对各转采样音频进行混音处理,得到混音...
技术分类