Document
拖动滑块完成拼图
首页 专利交易 IP管家助手 科技果 科技人才 积分商城 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
最新专利技术
  • 本公开涉及一种语音转录模型构建方法、装置、电子设备及存储介质。其中,语音转录模型构建方法包括:获取医疗问诊对话文本数据集和目标语音数据集;对每个医疗问诊对话文本数据进行角色分割处理,得到医生问诊对话文本数据和患者问诊对话文本数据;基于各个目...
  • 本发明提供了一种基于AI的脚本音频生成方法及系统,包括:获取目标产品的描述信息,并对描述信息进行读取并筛选,提取目标产品的卖点信息;构建智能文本编辑模型,并将目标产品的卖点信息输入至智能文本编辑模型中对目标产品的卖点信息进行文本编辑,生成基...
  • 本公开涉及一种演示文稿智能配音方法、装置、计算机设备和存储介质。所述方法包括:获取演示文稿数据;根据预设页面角色类别,分析所述演示文稿数据,确定每页演示文稿的页面角色,得到页面角色数据;利用AI分析所述演示文稿数据,生成文稿框架,得到文稿框...
  • 本申请公开了一种评估语音识别准确性的方法和装置,涉及智能家居/智慧家庭技术领域,该方法包括:获取语料测试集和基于所述语料测试集进行人工标注的标准语料文本集表格,调用语言转文字模型对所述语料测试集中的语音进行识别转换,得到第一语料文本集;基于...
  • 本发明公开了一种基于大语言模型提升小语种语音互译质量的方法及系统,属于智能语音翻译服务技术领域。其中,方法包括以下步骤:语种信息输入、语音检测与采集、语义特征和声学特征提取、自动语音识别(ASR)模型识别、大语言模型(LLM)翻译与纠错、多...
  • 本公开实施例提供一种测试方法、装置、系统、设备及存储介质,通过根据终端设备发送的第一控制信息中包含的目标时长,生成模拟用户操作的第一控制指令并发送给终端设备,来指示终端设备进行相应时长的语音采集动作,之后通过预采集的目标语音片段对语音采集动...
  • 本发明公开了一种基于人工智能的人机交互语音识别方法及系统,该方法包括:采集用户的语音信号数据并进行预处理;通过深度残差卷积网络对预处理后的语音信号数据进行多层次特征提取,生成语音信号的特征表示;采用改进的注意力机制模块对特征表示进行加权处理...
  • 本发明涉及语音检测技术领域,具体涉及一种语音检测方法、设备及存储介质。语音检测方法应用于语音识别设备上电过程中,包括:通过第一模数转换器获取第二模数转换器的工作电压,所述第一模数转换器为逐次逼近模数转换器;判断所述工作电压是否处于稳定状态,...
  • 本发明提供一种语音关键词识别方法、装置、电子设备及可读存储介质,涉及数据处理技术领域,该方法包括:对待识别的语音数据进行特征提取,得到语音特征;对语音特征进行编码,得到语音数据对应的音频特征向量;获取多个关键词特征向量;基于预设分类器模型计...
  • 本申请公开了一种语音翻页方法、装置、计算设备、存储介质以及程序产品,所述方法应用于电子设备,包括:在所述电子设备显示可视内容时,按照初始轮询间隔获取用户输入的语音指令;根据所述初始轮询间隔、所述语音指令的指令频率、用户的阅读节奏和所述电子设...
  • 本申请提供一种指挥大厅的语音指令解析方法、装置及指挥大厅系统,包括:根据连续语音信息、连续语音信息的第一起止时间戳、席位标识以及通道标识生成第一口令片段;对第一口令片段进行宣告识别处理,确定第一口令片段的宣告候选对象;根据第一口令片段的第一...
  • 本申请提供了一种基于AI语音的车辆故障处理方法及相关装置,应用于诊断设备,所述方法包括:获取目标用户的用户语音和目标车辆的车辆信息,将用户语音输入至预设的语音识别模型,得到用户意图信息,其中,用户意图信息用于表征目标用户针对目标车辆的诊断方...
  • 本申请涉及语音生成领域,其具体地公开了一种基于老年人语言表达特性感知的语音大模型系统,其通过实时捕捉并量化老年用户语音流中的语速、停顿等节奏特征,并结合对话历史,生成一个全面反映用户当前状态的向量。此状态向量被输入到策略网络中,该网络的核心...
  • 用户(202)可以指定针对数字助理(12)的唤醒词以触发数字助理对该唤醒词响应,其中该用户提供(204)该唤醒词的一个或多个初始发音。该唤醒词可以是唯一的,或者至少不是由所述数字助理的装置制造商或开发商事先确定的。然后可以用将来可能提供的唤...
  • 本发明公开了一种适老化语音交互方法、系统、智能手环及存储介质,属于智能设备技术领域。本发明通过控制声音采集装置采集声音数据,并根据所述声音数据确定语义信息;根据所述声音数据识别用户信息,并根据用户信息确定确定用户信息知识库;根据预设大型语言...
  • 本申请公开了一种语音处理方法、相关设备及计算机程序产品,涉及语音识别和说话人日志技术领域。本申请将待处理语音输入配置的语音识别模型进行语义分析,得到语音识别结果和说话人转折点;将每两个说话人转折点之间的语音片段依次输入声纹模型,得到每个语音...
  • 本申请涉及一种语音识别方法、装置、设备及计算机可读介质。该方法包括:接收目标对象输入的语音数据;对语音数据进行语义识别,得到语音数据的初始语义文本,并提取语音数据的声纹特征;基于声纹特征对初始语义文本进行纠正,得到目标语义文本;对目标语义文...
  • 本发明公开了一种融合行业知识库的拾音笔语音内容语义分析方法,属于计算机数据处理技术领域,其包括获取通过拾音笔采集的原始语音流转写成转写文本并提取声学情境信息和交互角色信息得到多维情境信息;将转写文本和多维情境信息输入动态知识网络进行语义融合...
  • 本申请实施例提出了一种对话处理方法、装置、系统、存储介质及程序产品。该方法可以通过用户输入的语音的言语特征,来调节电子设备的播报语音的言语特征,也就是电子设备播报的语音能够随着用户输入的语音的变化而变化,这样,可以提高人机对话中的对话应答的...
  • 本发明公开了一种基于多模态状态管理的机器人动态语音交互方法,属于智能机器人的技术领域,该方法包括:S1:采集用户输入的多模态指令数据;S2:对多模态指令数据进行数据处理后,生成带有环境上下文标记的输入文本包;S3:对输入文本包进行意图解析后...
技术分类