Document
拖动滑块完成拼图
首页 专利交易 IP管家助手 科技果 科技人才 积分商城 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
最新专利技术
  • 本申请实施例提供了一种音频处理方法和电子设备,该方法应用于电子设备,电子设备包括麦克风和音频编解码模型,音频编解码模型包括编码器和量化器模组,量化器模组包括m个并联的量化器,m为大于1的整数,该方法包括:响应于用户的第一操作,通过麦克风接收...
  • 本发明公开了数字工牌驱动的营业窗口多源录音数据融合智能分析系统,具体涉及语音处理技术领域,该系统基于佩戴式数字工牌、阵列麦克风与环境拾音设备所采集的异步音频流,采用锚点检测、事件图构建、跨源匹配、弹性时间扭曲对齐等步骤,实现多源录音数据的结...
  • 本发明涉及语音合成技术领域,具体涉及一种基于包装元素映射的SSML可视化编辑方法及安全验证系统,其包括:步骤S1,将SSML原生标签封装为自定义的DOM包装元素;步骤S2,捕获用户交互时的光标位置,并在所述光标位置动态插入所述DOM包装元素...
  • 本发明公开了一种多模态情感融合的机器人语音风格转换方法及设备。该方法通过多模态情感特征融合提取网络提取文本、音频及图像输入的情感特征向量;构建以高斯噪声为起点、目标梅尔频谱为终端的概率路径,以前述情感特征为条件引导向量,利用时间条件U‑Ne...
  • 本公开涉及一种语音转录模型构建方法、装置、电子设备及存储介质。其中,语音转录模型构建方法包括:获取医疗问诊对话文本数据集和目标语音数据集;对每个医疗问诊对话文本数据进行角色分割处理,得到医生问诊对话文本数据和患者问诊对话文本数据;基于各个目...
  • 本发明提供了一种基于AI的脚本音频生成方法及系统,包括:获取目标产品的描述信息,并对描述信息进行读取并筛选,提取目标产品的卖点信息;构建智能文本编辑模型,并将目标产品的卖点信息输入至智能文本编辑模型中对目标产品的卖点信息进行文本编辑,生成基...
  • 本公开涉及一种演示文稿智能配音方法、装置、计算机设备和存储介质。所述方法包括:获取演示文稿数据;根据预设页面角色类别,分析所述演示文稿数据,确定每页演示文稿的页面角色,得到页面角色数据;利用AI分析所述演示文稿数据,生成文稿框架,得到文稿框...
  • 本申请公开了一种评估语音识别准确性的方法和装置,涉及智能家居/智慧家庭技术领域,该方法包括:获取语料测试集和基于所述语料测试集进行人工标注的标准语料文本集表格,调用语言转文字模型对所述语料测试集中的语音进行识别转换,得到第一语料文本集;基于...
  • 本发明公开了一种基于大语言模型提升小语种语音互译质量的方法及系统,属于智能语音翻译服务技术领域。其中,方法包括以下步骤:语种信息输入、语音检测与采集、语义特征和声学特征提取、自动语音识别(ASR)模型识别、大语言模型(LLM)翻译与纠错、多...
  • 本公开实施例提供一种测试方法、装置、系统、设备及存储介质,通过根据终端设备发送的第一控制信息中包含的目标时长,生成模拟用户操作的第一控制指令并发送给终端设备,来指示终端设备进行相应时长的语音采集动作,之后通过预采集的目标语音片段对语音采集动...
  • 本发明公开了一种基于人工智能的人机交互语音识别方法及系统,该方法包括:采集用户的语音信号数据并进行预处理;通过深度残差卷积网络对预处理后的语音信号数据进行多层次特征提取,生成语音信号的特征表示;采用改进的注意力机制模块对特征表示进行加权处理...
  • 本发明涉及语音检测技术领域,具体涉及一种语音检测方法、设备及存储介质。语音检测方法应用于语音识别设备上电过程中,包括:通过第一模数转换器获取第二模数转换器的工作电压,所述第一模数转换器为逐次逼近模数转换器;判断所述工作电压是否处于稳定状态,...
  • 本发明提供一种语音关键词识别方法、装置、电子设备及可读存储介质,涉及数据处理技术领域,该方法包括:对待识别的语音数据进行特征提取,得到语音特征;对语音特征进行编码,得到语音数据对应的音频特征向量;获取多个关键词特征向量;基于预设分类器模型计...
  • 本申请公开了一种语音翻页方法、装置、计算设备、存储介质以及程序产品,所述方法应用于电子设备,包括:在所述电子设备显示可视内容时,按照初始轮询间隔获取用户输入的语音指令;根据所述初始轮询间隔、所述语音指令的指令频率、用户的阅读节奏和所述电子设...
  • 本申请提供一种指挥大厅的语音指令解析方法、装置及指挥大厅系统,包括:根据连续语音信息、连续语音信息的第一起止时间戳、席位标识以及通道标识生成第一口令片段;对第一口令片段进行宣告识别处理,确定第一口令片段的宣告候选对象;根据第一口令片段的第一...
  • 本申请提供了一种基于AI语音的车辆故障处理方法及相关装置,应用于诊断设备,所述方法包括:获取目标用户的用户语音和目标车辆的车辆信息,将用户语音输入至预设的语音识别模型,得到用户意图信息,其中,用户意图信息用于表征目标用户针对目标车辆的诊断方...
  • 本申请涉及语音生成领域,其具体地公开了一种基于老年人语言表达特性感知的语音大模型系统,其通过实时捕捉并量化老年用户语音流中的语速、停顿等节奏特征,并结合对话历史,生成一个全面反映用户当前状态的向量。此状态向量被输入到策略网络中,该网络的核心...
  • 用户(202)可以指定针对数字助理(12)的唤醒词以触发数字助理对该唤醒词响应,其中该用户提供(204)该唤醒词的一个或多个初始发音。该唤醒词可以是唯一的,或者至少不是由所述数字助理的装置制造商或开发商事先确定的。然后可以用将来可能提供的唤...
  • 本发明公开了一种适老化语音交互方法、系统、智能手环及存储介质,属于智能设备技术领域。本发明通过控制声音采集装置采集声音数据,并根据所述声音数据确定语义信息;根据所述声音数据识别用户信息,并根据用户信息确定确定用户信息知识库;根据预设大型语言...
  • 本申请公开了一种语音处理方法、相关设备及计算机程序产品,涉及语音识别和说话人日志技术领域。本申请将待处理语音输入配置的语音识别模型进行语义分析,得到语音识别结果和说话人转折点;将每两个说话人转折点之间的语音片段依次输入声纹模型,得到每个语音...
技术分类