Document
拖动滑块完成拼图
专利交易 积分商城 国际服务 IP管家助手 科技果 科技人才 商标交易 会员权益 需求市场 关于龙图腾 更多
 /  免费注册
到顶部 到底部
清空 搜索
最新专利技术
  • 本申请公开了一种音频压缩模型的处理方法及系统、设备、程序产品,所述方法包括:通过初始音频压缩模型对样本音频进行压缩,得到预测音频;分别将样本音频和预测音频划分为敏感频段和非敏感频段;基于第一听觉掩蔽阈值将样本音频和预测音频的敏感频段划分为四...
  • 本发明公开了一种噪声信号生成方法,包括:获得随机相位数据和频率映射数据,所述频率映射数据表征频域索引与其对应的实际频率之间的关系;基于所述频率映射数据,根据相邻频域索引对应实际频率之间的倍频关系,对初始衰减系数数据进行迭代更新,得到衰减系数...
  • 本申请公开了一种音频数据增强方法、设备及存储介质,涉及数据处理技术领域。上述方法基于不同的窗长对音频信号进行傅里叶变换得到频域特征后,对频域特征编码得到编码特征序列;通过注意力机制确定编码特征序列的注意力分数矩阵,将预设下三角矩阵与注意力分...
  • 本发明提供了一种语音模型架构融合RAG与用户标签回流的智能推荐交互系统及方法,涉及智能语音技术领域。本发明集成设备唤醒AAR到语音APK实现语音唤醒与采集;语音流经ASR引擎转文本后由文本纠正模型优化;NLP引擎识别意图并分发至垂类智能体,...
  • 本发明涉及声纹识别与语音转写领域,公开了一种多人重叠语音实时声纹识别方法与系统。该方法包括:获取多源音频流并进行标准化与分帧处理,生成流式音频帧序列;基于该序列,通过循环缓冲、降噪、端点检测和重叠检测模型处理,得到重叠区间标注;进而进行任务...
  • 本发明提供一种声纹识别模型训练、声纹识别方法及装置,训练方法包括:利用由技术提供方授权的特征提取工具对用户端的领域语音数据进行声学特征提取,得到非完整声学特征,特征提取工具用于在完整声学特征提取流程的至少一个中间环节输出至少一种中间特征作为...
  • 本发明公开了支持双向多模态交互的听障辅助智能眼镜及沟通方法,涉及语音识别与处理技术领域,包括以下步骤:采集声源的位置和面部检测的水平坐标,基于声源的位置和面部检测的水平坐标,计算得到声源的声源到达角;采集每个声源的短时声纹特征,基于每个声源...
  • 本申请公开了一种敏感信息识别方法、装置、电子设备和存储介质,属于语音检测技术领域。该方法包括:从含有敏感信息的车载音频中提取至少一个人声片段;分别对至少一个所述人声片段进行声纹识别,得到每个所述人声片段属于司机语音的第一置信度;根据每个所述...
  • 本申请公开了一种显示设备和语音播报方法,该方法包括:接收用户输入的第一语音,将所述第一语音发送至服务器,以指示所述服务器生成所述第一语音对应的回复音频数据流;通过网络接收所述回复音频数据流,每接收到预设大小的数据生成一个数据包;若生成第n个...
  • 本发明涉及语音识别技术领域,公开了一种基于蓝牙音频流的实时语音识别方法,包括:解析位分配参数以计算量化比特分布并生成频域置信度掩码,监测解码器丢包掩盖状态标志位,在算法激活时强制设定掩码为阻断阈值,并在恢复期控制掩码权重梯度回升,利用最终掩...
  • 本发明公开了一种宽带安装地址的推荐方法、装置、电子设备及存储介质。该方法包括:获取待进行宽带安装用户的通话语音;对所述待进行宽带安装用户的通话语音进行语音识别,得到通话语音文本;将所述待进行宽带安装用户的通话语音在多个地址的方言发音样本中进...
  • 本申请公开了一种辅助电网调度的智能语音人机交互装置,与电网调度系统连接,包括:语音采集模块、核心处理单元、通信模块;所述语音采集模块用于采集语音数据;所述核心处理单元与所述语音采集模块连接,包括语音识别引擎、自然语言处理模块、逻辑控制模块,...
  • 本申请涉及语音识别技术领域,公开了一种应用于报警器的通话全流程语音识别控制方法及系统,该方法包括:针对模拟生成的语音数据,应用控制器调用语音识别模块进行离线语音识别,若语音识别模块识别到语音指令后,则将识别成功的语音指令内容解析为加密通讯内...
  • 本申请提供一种语音交互方法、车辆及存储介质,涉及语音交互技术领域。该方法在与语音交互系统交互时,若满足预设条件,则获取目标人员在第一设定时段内的第一眼动数据集;其中,第一设定时段的计时起点为目标人员发出目标语音指令的结束时刻;基于第一眼动数...
  • 本申请提供了一种语音控制方法、装置、电子设备、计算机可读存储介质及计算机程序产品、计算机程序产品及计算机可读存储介质;方法包括:响应于用户针对显示界面的指令生成请求,获取指令生成请求携带的控制语音流以及显示界面对应的界面截图;对控制语音流进...
  • 本申请涉及人工智能与语音对话技术领域,公开了基于检索增强生成与多模型协同的语音交互方法及其应用,方法包括:语音采集与预处理;本地多轮意图识别;本地RAG检索与候选聚合;决策与云端生成;反馈、合成与持久化;本发明还提供基于检索增强生成与多模型...
  • 本申请提供了一种语音唤醒方法、装置、电子设备、存储介质及计算机程序产品,涉及技术领域为:机器人控制技术领域,方法包括:在通过语音预唤醒之后,获取预唤醒源对应位置的图像数据;确定图像数据中的目标兴趣部位的姿态信息和朝向信息;基于姿态信息和朝向...
  • 本发明涉及智能语音交互技术领域,公开了一种AI语音故事盒及其交互系统,包括:故事盒本体、中央处理器、存储器、语音处理模块、按键处理模块、蓝牙通信模块、音频输出模块、情绪识别模块、状态指示单元、多个物理按键和扬声器单元,所述多个物理按键包括开...
  • 本发明用于对话交互系统技术领域,具体公开了一种基于心理干预人工智能模型的诱导式对话交互系统,包括语音识别模块、深度语言模块、语音输出模块、闭合反馈模块和异常情况处理模块,所述语音识别模块通过无线信号与深度语言模块连接,所述深度语言模块连接通...
  • 本申请提出一种语音交互方法及相关装置,涉及语音识别技术领域。所述语音交互方法包括:接收用户输入的第一语音,并将所述第一语音转换为第一文本;根据历史语音交互对应的历史交互文本和所述第一文本,确定所述第一语音是否具有纠错意图;在所述第一语音具有...
技术分类