Document
拖动滑块完成拼图
专利交易 积分商城 国际服务 IP管家助手 科技果 科技人才 商标交易 会员权益 需求市场 关于龙图腾 更多
 /  免费注册
到顶部 到底部
清空 搜索
最新专利技术
  • 本申请提供了一种音频处理方法、装置、服务器及存储介质,所述方法包括:接收待调整的原始音频以及对应的台词;将所述台词转换为对应的文本序列;将所述原始音频和文本序列执行对齐操作,得到音频‑文本的对应关系;接收目标文本;根据所述目标文本从所述文本...
  • 本发明提供了一种信息系统语音交互方法、装置、设备和存储介质,属于人工智能技术领域,包括:将信息系统的交互封装为SDK;将语音输入转换成文本;形成符合数据结构约定的系统提示词,以文本为用户提示词;基于大语言模型评分历史数据,动态选择一个大语言...
  • 本发明涉及语音识别领域,公开了基于大语言模型的同步语音识别系统及方法,用于提高同步语音识别的准确性和实时性。包括获取原始音频流,对原始音频流开展两级回声消除处理,快速移除主要线性回声反射信号,分析剔除残留非线性回声与环境混响,对消除回声后的...
  • 本申请公开了一种智能催收方法、设备、存储介质及装置,包括:通过预设催收大模型对待催收用户属性数据进行催收策略定制,获得初始催收策略;基于初始催收策略从预设机器人中筛选目标机器人执行初始催收策略,并采集催收语音流;对催收语音流进行意图识别以及...
  • 本申请公开了一种基于情景化理解的车辆设备控制方法、装置、设备及存储介质,涉及车辆设备控制技术领域,公开了基于情景化理解的车辆设备控制方法,包括:接收用户输入的语音信号并对所述语音信号进行语义解析,得到语义解析结果;基于所述语义解析结果更新对...
  • 本申请涉及一种终端设备及其控制方法。该终端设备包括用户输入接口,被配置为采集语音数据;控制器,与用户输入接口连接,被配置为获取用户输入接口采集的语音数据;基于语义识别模型,根据终端设备的关联标识和语音数据,确定待响应设备的响应设备信息和语音...
  • 本发明涉及语音识别技术领域,公开了一种基于自然语言处理的蓝牙耳机语音识别方法及系统,通过提取依据蓝牙耳机采集的语音信号的特征向量;将特征向量输入DTW‑ECAPA‑Transformer模型,通过轻量化前端卷积模块提取局部时频特征,经DTW...
  • 本申请提供一种会话分轨方法、装置、电子设备及存储介质,该方法包括:获取在多个对象说话时所录制的音视频数据,多个对象中包括具有构音障碍的目标对象;对音视频数据中的音频数据进行处理得到文本数据以及语音嵌入数据,文本数据中携带有构音状态信息;对音...
  • 本申请公开了一种语音个性化引导方法、系统及程序产品,涉及车辆技术领域,所述方法包括:将预处理后的数据作为大模型输入数据,让大模型给出用户痛点、原因以及用户行为习惯,并让大模型配套生成语音引导场景和策略;基于用户基本数据,结合大模型对用户行为...
  • 一种面向医学检查的实时语音流关键信息提取方法,属于人工智能与医疗信息技术领域,通过非敏感医疗语料与通用语料采集,结合风格导向的提示控制机制驱动大语言模型生成多样化仿真语料,构建医学检查领域扩展基础语料集;对语料进行规范化和筛选,形成高质量语...
  • 本发明属于人工智能技术领域,本发明公开了一种基于人工智能技术辅助的教育咨询服务方法,包括:获取教育咨询场景下的原始语音数据,通过时频掩蔽处理去除背景噪声,获得高质量的去噪语音数据;对去噪语音数据进行文字转录,利用预构建的术语索引库进行自适应...
  • 本申请公开了一种智能语音交互方法,包括:将用户语音输入语音自动识别ASR模型,提取语音文本;判断语音文本中是否存在自定义热词:在存在自定义热词的情况下,基于对比模型判断是否采用领域指令替换所述自定义热词;若采用领域指令替换所述自定义热词,则...
  • 本发明涉及一种基于深度集成安全会议系统的语音转写及纪要生成方法,属于语音转写与纪要生成技术领域,解决了传统语音转写与纪要生成技术效率低下、信息遗漏、存在安全隐患的问题。包括语音识别客户端采集音频,并通过音频发送线程将采集到的音频发送到语音识...
  • 本申请实施例适用于人工智能技术领域,提供了人工智能音频检测方法、电子设备及计算机程序产品,所述方法包括:获取待检测音频;提取所述待检测音频的多个音频特征向量;在任一所述音频特征向量与预设摩斯码匹配的情况下,确定所述待检测音频为人工智能音频;...
  • 本申请涉及语音关键词检测的技术领域,尤其涉及一种语音关键词的抗噪检测方法、装置、设备及存储介质。包括:将原始音频信号进行声学特征提取,得到声学特征序列;结合目标音素序列和声学特征序列计算注意力权重向量;基于注意力权重向量对声学特征序列进行加...
  • 本申请公开了一种多方言多模态数据智能化生成与全维度评估系统,所述系统包括:数据生成子系统,用于对用户输入的任务提示词分析,以获得对话指令,基于所述对话指令生成对话文本;并对所述对话文本进行方言转译,获得方言文本;基于所述方言文本生成方言语音...
  • 本发明涉及语音合成技术领域,可应用于金融科技、医疗健康等业务系统平台中,公开了一种语音合成方法、装置、设备及介质,包括:利用预设的自监督模型根据预先获取的带噪参考音频生成语义条件嵌入,对所述带噪参考音频进行语音增强处理,得到初步增强音频,利...
  • 本发明公开了个性化鼾声掩蔽音频合成系统及方法, 属于音频信号处理技术领域,该系统包括鼾声特征提取模块、心理声学分析模块、音频生成模块和动态调整模块。系统识别环境音频中的鼾声片段并提取频谱特征, 基于心理声学模型分析临界频带分布并计算掩蔽能量...
  • 本申请实施例涉及人工智能技术领域,尤其涉及一种音频生成模型的训练方法及音频生成方法。本申请提供一种音频生成模型的训练方法及音频生成方法,该音频生成模型的训练方法包括:通过预训练模型对音频样本集进行编码,获得编码特征;通过待训练模型对编码特征...
  • 本发明公开了基于多模态情感语音合成的站群文章智能播报系统及方法,涉及语音合成技术领域,包括:提取段落级语义与情绪特征,并对语义与情绪特征进行维度映射,生成情感补偿参数集合;基于情感补偿参数集合,将前序文本段落韵律预测阶段产生的隐层状态特征按...
技术分类