Document
拖动滑块完成拼图
首页 专利交易 IP管家助手 科技果 科技人才 积分商城 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
最新专利技术
  • 本申请公开了一种词元推理方法、文本转语音的生成方法及其设备,设备包括文本转语音系统、计算机可读存储介质及计算机程序产品。该词元推理方法包括:在每一次流匹配推理之前确定队列中多个流匹配请求的优先级顺序,其中,每个流匹配请求中包括一个词元分块,...
  • 本发明公开了一种拟音表达风格适配与角色调度的方法,旨在解决现有语音合成技术中缺乏情绪驱动、表达风格统一控制与个性化播报能力的问题。本方法包括:对用户输入的语音或文本进行语义意图与情绪状态识别;基于识别结果构建表达标签组;根据标签组与拟人角色...
  • 本申请提供了一种基于大模型的标签生成方法、电子设备以及存储介质,方法包括:获取待标注的单人语音数据;对单人语音数据进行自动化标注,得到多个基础标签,根据多个基础标签以及场景特征信息生成第一提示词,并将多个基础标签以及第一提示词输入标注模型中...
  • 本发明涉及模型参数优化技术领域,尤其涉及一种自然语言转低秩适配模型参数优化方法,该方法包括以下步骤:S1、根据用户输入文本获取自然语言指令P;S2、将自然语言指令P输入推理大模型,得到指令理解文本U;S3、将指令理解文本U输入向量化模型,得...
  • 本申请提供了一种语音合成模型的训练方法、设备、存储介质以及程序产品,涉及人工智能技术领域,方法包括:获取模型训练数据;所述模型训练数据包括文本数据和所述文本数据对应的音频数据;对所述文本数据进行文本与国际音标混合编码处理,得到所述文本数据的...
  • 本申请公开了一种音频处理方法、数据处理方法及相关装置,涉及语音合成技术领域,音频处理方法包括:获取若干音频样本;采用两个不同的语音识别模型分别对每个音频样本进行识别,得到每个音频样本的两个识别文本;按每个音频样本所属语种的最小语义单元,确定...
  • 本发明公开了一种多模态情感语音识别与合成方法及系统,涉及语音合成技术领域,方法包括:采集信号数据并进行预处理;构建模态可信度评估模型,量化生成可信度评估值,并动态分配各模态的权重系数;当检测到模态冲突时,基于模态‑情感关联数据库动态调整得到...
  • 本申请公开了一种流式文本转语音方法、装置和设备,涉及文本转语音技术领域,流式文本转语音方法包括:将已生成的历史流式文本的词元和当前流式文本对应的当前词元输入至预设的对话上下文融合模型,确定当前流式文本对应的上下文隐状态;将当前词元对应的词嵌...
  • 本公开实施例提供一种语音通信方法、装置及存储介质,涉及通信技术领域,至少可以提升语音通信体验。该方法包括:接收第二节点发送的第一语音的语义信息,第一语音为第一语言的通信语音,第一语音的语义信息是基于语音转换规则对第一语音进行转换得到;根据语...
  • 本发明提供一种带发音纠错功能的语言记忆卡片系统,涉及语言训练技术领域。该带发音纠错功能的语言记忆卡片系统,包括用户画像与配置系统、核心学习与交互系统、后台管理与优化系统,所述三大系统双向联动实现方言与人群发音的精细化适配及记忆‑发音协同强化...
  • 本申请提供一种显示设备及声源音频提取方法,所述方法通过声音采集器获取待提取音频,并获取待提取音频的音频音质,若音频音质为第一音质,将待提取音频输入语音提取模型,以通过第一提取模块计算待提取音频的嵌入系数,以及,通过嵌入系数和目标声源声纹提取...
  • 本发明涉及语音识别及翻译技术领域,尤其涉及基于人工智能的语音识别与机器翻译系统,该系统包括:量子适配语音处理模块,用于获取源语言语音信号,提取声学特征得到初始语义特征,并执行量子适配压缩,形成符合量子编码要求的特征表示;量子语义构建模块,用...
  • 本发明公开了一种数据处理模型的训练方法、数据处理方法、视频处理方法。其中,该方法包括:获取第一训练数据;利用第一训练数据中同一模态的训练数据对初始处理模型进行对比学习,并利用第一训练数据中不同模态的训练数据对初始处理模型进行对比学习,得到目...
  • 本公开的实施例涉及一种用于语音识别的方法、装置、设备和存储介质。在此提出的方法包括:基于目标语音的内容,从经训练的机器学习模型的第一组识别网络中确定出用于识别目标语音中的目标语音片段的第二组识别网络,其中在机器学习模型的第一组识别网络中,至...
  • 本发明实施例提供一种面向语音信息保留的匿名化隐私保护方法和系统。该方法包括:提取原始音频的说话人嵌入以及消除说话人音调、保留语义、韵律的说话人无关特征;将说话人嵌入输入至基于U‑Net架构的三阶段流匹配的说话人匿名模块,得到匿名嵌入;利用预...
  • 本发明公开一种智能语音交互方法及装置,应用于数据处理技术领域,本发明通过获取用户图像、语音、文本多模态原始数据,经特定模型与工具处理:以RetinaFace检测裁剪人脸后用ResNet‑50网络模型提取图像情绪特征,torchaudio库提...
  • 本发明提供多路语音流实时分离与内容检索方法,包括:利用注册语音样本构建本地声纹库,通过深度声纹编码器提取并归一化目标说话人声纹特征;对混合语音信号进行帧级特征分析,计算当前语音帧与目标声纹的语义距离并生成动态置信度分数;结合置信度阈值与去抖...
  • 本申请提供了通信方法及通信装置,应用于通信领域。本申请的技术方案中,意图驱动管理服务生产者向意图驱动管理服务消费者指示支持的意图处理功能是否支持自然语言意图,以便于意图驱动管理服务消费者在意图驱动管理服务生产者支持自然语言意图的情况下能够通...
  • 一种提供与用户话语的意图匹配的颜色的方法和装置。该方法包括:为预先创建的表中的一个或多个第一颜色代码生成一个或多个第二自然语言表达,每个第二自然语言表达对应于由每个第一颜色代码表示的颜色;以及基于解释与颜色相关的用户话语的结果来生成响应。
  • 本申请公开了一种语音的交互方法、装置、电子设备以及计算机程序产品。涉及软件与平台技术领域,该方法包括:接收目标客户的待识别语音,提取待识别语音中的语音特征,其中,语音特征包括声学特征和韵律特征;将语音特征输入情绪分类模型,输出情绪分布结果,...
技术分类