Document
拖动滑块完成拼图
首页 专利交易 IP管家助手 科技果 科技人才 积分商城 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
最新专利技术
  • 本申请提出一种语种识别方法、装置及设备,应用于语音处理领域。其中,语种识别方法包括:获取语音数据;对语音数据进行语种识别,得到识别结果,识别结果包括第一语种;将语音数据转换为第一语种下的文本数据,得到第一文本数据;对第一文本数据进行质量检查...
  • 本发明提供一种低资源方言识别的课程强化学习方法、装置及设备,涉及人工智能技术领域,旨在解决低资源方言语音识别场景下,现有强化学习使得模型无法进行有效学习、性能提升有限的问题。该方法包括:采用低资源方言语音数据集对初始语音识别模型进行有监督微...
  • 本申请公开了一种用于语音测试的人声动态标定方法、装置及存储介质,涉及语音测试技术领域,包括:在当前人声音频播放过程中,获取车辆上的录音设备采集的录音音频,并根据录音音频确定外部功放增益;基于当前人声音频以及外部功放增益确定初始软件增益;根据...
  • 本公开实施例公开了一种汉语语音信号的切分方法、装置、设备及存储介质,其中,方法包括:对包含目标汉语文本对应语音的目标音频信号进行采样,得到多个采样点对应的信号幅值;基于多个采样点对应的信号幅值,对目标音频数据进行语音端点检测,得到目标音频数...
  • 本发明公开了一种基于母语触发的目标语言沉浸式听力反馈系统。该系统包括:母语语音输入模块,用于采集用户输入的母语语音并识别母语语音对应的语种;语义解析模块,用于对母语语音进行断句处理、关键词提取、语法结构分析和语义抽取,得到解析结果;目标语言...
  • 本申请公开了一种语音识别方法、装置及电子设备,属于数据处理技术领域。该语音识别方法包括:按照第一用户说话的起始时间点和结束时间点,从麦克风采集的音频数据中,截取语音片段;语音片段包括第一用户在第一时间段内说话的声音,第一时间段为起始时间点至...
  • 本申请公开了一种语音端点检测方法及相关装置、设备和介质,其中语音端点检测方法包括:基于流式音频进行持续预测,得到流式音频中音频帧分别属于若干帧类型的概率值;其中,若干帧类型包括人声、首噪声、中间噪声、尾噪声;基于音频帧分别属于若干帧类型的概...
  • 一种音频处理模型的训练方法、装置、设备及存储介质,涉及计算机与互联网技术领域。该方法包括:获取样本音频数据对应的N个数据块;通过音频处理模型的特征提取网络、说话人识别网络,得到N个数据块各自的第一嵌入表示以及N个数据块对应的预测说话人结果;...
  • 本发明公开了一种结合大语言模型纠错的语言识别系统、方法、设备及介质,系统中第一分支包括编码器和解码器;第二分支包括适配器和大语言模型;获取待识别语音信号的声学特征及热词列表;将声学特征和热词列表以及送入编码器,获取声学信息高位表征、热词偏置...
  • 本发明涉及语音识别技术领域,提出一种基于大模型和语音合成引擎的语音识别方法及系统,通过采用大语言模型语言结合新一代的语音合成引擎,大幅提升了识别ASR的识别准确率。其中,利用大语言模型生成大批量的高质量语料,利用语音合成引擎获得大量且高质量...
  • 本申请公开了一种误唤醒语料获取方法及相关方法、装置、设备和存储介质,其中误唤醒语料获取方法包括:基于唤醒模型的产品需求,构造模型指令;基于生成式模型响应模型指令而输出的误唤醒文本进行语音合成,得到误唤醒语音;基于唤醒模型对误唤醒语音的响应结...
  • 本公开提供了基于语音识别和文本生成模型的文本创作方法及系统,涉及自然语言处理与人工智能技术领域。对语音数据通过声学特征分析进行赘词过滤,利用音素映射表进行方言音素校正,得到规整语音数据;通过编码器‑解码器语音识别模型将规整语音数据转换为文本...
  • 本公开是关于一种视频中确定语音关键词的方法、装置、设备及存储介质。视频中确定语音关键词的方法包括:获取视频,视频中包括人声以及发出人声对应用户的人脸图像;识别视频内各视频帧所包括人脸图像的唇部关键点;对人声进行语音识别,响应于识别到目标语音...
  • 本发明公开了一种基于电力语义理解的变电站运维语音识别操控方法,包括接收语音数据,并将其转化为结构化的操作语义信息;将结构化的操作语义信息中的目标设备映射至SVG图形元素,实现操作目标可视化与状态标注,构建电力知识增强型大模型,基于操作语义信...
  • 本申请公开了语义识别方法及装置,其中,语义识别方法可应用于集成灶技术领域,该方法包括:对目标语音中的词向量进行语义特征编码,得到第一语义特征向量;第一语义特征向量包括词向量对应的第一单词级意图向量;以词向量、第一语义特征向量中的标签、功能组...
  • 本实施方式所涉及的系统的目的在于,解析语音及表情数据,并提供高置信度的解释结果。本实施方式所涉及的系统,具备语音采集部、表情采集部、解析部、解释部、置信度评价部、提示部及语音引导部。语音采集部用于采集语音数据。表情采集部用于采集表情数据。解...
  • 本发明提供了一种基于大模型的热词识别方法、系统及存储介质,该方法包括:获取目标热词表,并将所述目标热词表输入预训练后的第一文本大模型进行语义提取,得到热词语义向量;获取待识别语音,并将所述待识别语音输入预训练后的语音编码器进行特征编码,得到...
  • 本发明提供基于上下文的智能语音语义理解分析方法及系统,涉及语音交互技术领域,包括获取输入语音信号,提取声学特征并解码得到候选文本;构建上下文语义表征进行消歧处理;建立语义依存图并进行多层级关联分析;传播上下文约束信息进行多跳推理;最终生成意...
  • 本申请提出一种基于大模型的多场景的问答方法、装置及通信设备,其中,基于大模型的多场景的问答方法包括:接收终端发送的第一音频信号;对所述第一音频信号进行噪声抑制处理和特征增强处理,获取所述第一音频信号对应的特征向量;采用第一自动语音识别模型对...
  • 本发明提供了一种语音指令识别方法、装置、智能音箱和计算机存储介质,应用于智能音箱的控制器,涉及语音识别技术领域。其中,该方法包括:基于麦克风阵列获取多个声音信号;基于波束成形算法对声音信号进行增强,得到音频信号;基于预设的声纹模板筛选音频信...
技术分类