Document
拖动滑块完成拼图
首页 专利交易 IP管家助手 科技果 科技人才 积分商城 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
最新专利技术
  • 本发明涉及人工智能技术领域, 可应用于医疗健康及金融技术领域, 公开了语音合成方法、装置、计算机设备及存储介质。所述方法包括:获取待处理文本、插值后的噪音、未掩码的语音;将所述待处理文本、插值后的噪音、未掩码的语音输入至合成模型, 由所述合...
  • 本发明公开了一种多语言语音翻译模型、训练方法及推理方法, 包括语音编码器、文本解码器和键值寄生推测模块;所述语音编码器包括堆叠的编码器层, 所述编码器层包括自注意力模块和前馈网络模块;所述文本解码器包括堆叠的解码器层, 所述解码器层包括自注...
  • 本申请公开了一种跨语种语音识别方法、系统、设备及存储介质, 本方法通过将训练语音进行预处理, 得到训练语音帧序列;从训练语音帧序列中提取内容表征、说话人表征以及音高表征;根据内容表征、说话人表征以及音高表征进行语音重构, 得到目标语种语音;...
  • 本发明公开了面向远程会议场景的语音分离与段落归属方法及系统, 涉及语音识别技术领域。所述方法包括:会议平台触发目标会议窗口的语音记录, 生成会议音频;根据第一引擎, 对会议音频执行双程语音分离处理, 构建语音逻辑图谱;根据第二引擎, 匹配目...
  • 提供了一种用于恢复语音数据记录的转录中的词汇表外字词的方法, 包括:接收用于转录为语音数据记录的文本表示的语音数据记录;使用字词识别模型将所述语音数据记录转录为所述文本表示;标识所述文本表示中的未知字词;基于由子单元识别模型生成的所述未知字...
  • 一种基于多维度因素的口语评测系统及方法, 涉及数据处理技术领域, 包括:根据预训练的文本音素识别模型获得语音数据对应的音频文本、音素列表及音素时间边界列表;根据音素列表及音素时间边界列表计算得到流畅度得分;通过预训练语义模型获得音频文本的语...
  • 一种语音识别模型的自进化方法及系统, 本身通过提取高价值文本片段, 结合多风格语音合成数据构建训练集, 在结合通用数据后, 采用参数微调技术对暂存模型进行参数优化, 同时通过将优化的参数存储在经验回放缓冲区, 并通过在经验回放缓冲区中对优化...
  • 本申请涉及端侧模型部署的技术领域, 尤其涉及一种端侧语音模型部署方法、装置、设备及存储介质。包括:端侧录制的参考音频;提取参考音频的参考语义令牌和嵌入向量;获取训练文本集, 将训练文本集中每一训练文本对应的训练文本编码、嵌入向量和参考语义令...
  • 本申请涉及到语音识别技术领域, 公开了一种降低命令词误识别的语音识别方法、装置、设备及介质;其中方法先训练初始CTC语音识别模型至验证集收敛, 得到收敛模型;再基于收敛模型输出的原始输出值, 通过路径搜索算法筛选多条候选路径;随后计算参考路...
  • 本发明涉及音频信号处理技术领域, 尤其涉及一种基于iOS平台的实时音频处理及梅尔谱图生成与分类方法及系统, 包括音频输入模块、信号处理模块、梅尔谱图生成模块、分类推理模块、文件存储模块和用户交互模块, 信号处理模块与音频输入模块连接, 梅尔...
  • 本发明适用于语音关键词识别技术领域, 提供了一种语音关键词识别中多尺度时空编码建模系统及方法, 包括样本生成模块用于收集基础语音信息, 并增加具备扰动功能的语音样本;频域编码模块用于根据语音样本生成频域编码向量, 并据此学习训练, 训练过程...
  • 本申请涉及到语音识别技术领域, 公开了一种集外词的拒识别方法、装置、设备及介质, 其中方法包括:对当前语音段识别结果与目标命令词强制对齐得对齐路径, 此过程基于动态规划、维特比算法并结合CTC准则;依据对齐路径确定关键区间, 分blank音...
  • 本发明公开了一种基于深度学习的语音上下文语义提取方法, 包括如下步骤:S1、采集语音信号并进行预加重、分帧、加窗处理, 得到帧级语音信号;S2、提取MFCC和差分特征, 归一化后构建输入特征张量;S3、将特征张量输入由多层Transform...
  • 本申请涉及电动轮椅的语音指令识别技术, 具体涉及一种电动轮椅语音指令识别方法及系统。方法包括:接收用户的语音指令, 识别语音指令中的模糊指令;基于模糊指令, 获取与电动轮椅当前环境相关的感知数据;识别感知数据中的物理目标, 以及物理目标与电...
  • 本申请提供一种用于老年人护理的辅助翻身设备及其语音控制方法, 通过老年人的专属声学特征向量确定不同护理动作场景下语音信号的鲁棒性权重;根据老年人的护理语音指令结合专属声学特征向量确定老年人在当前护理动作场景下的语义状态特征, 依据语义状态特...
  • 本公开涉及一种使用智能穿戴设备拣货方法、用于仓库拣货的设备及装置。该方法包括:获取智能穿戴设备采集的环境数据, 环境数据包括与配送员的分拣订单货品相关联的语音数据, 以及与配送员的分拣订单货品相关联的图像数据, 解析语音数据确定配送员的关于...
  • 本发明公开了一种无人机语音控制方法及系统, 涉及无人机控制的技术领域, 包括步骤S1, 采集用户的实时语音数据, 预处理得到骨导振动信号和气导振动信号;步骤S2, 进行双模态声纹认证得到声纹认证结果, 确认实时语音数据来源用户;步骤S3, ...
  • 本申请公开了一种基于模拟语音数据的车辆智能场景的实现方法及设备, 属于车辆场景开发技术领域, 该方法包括:根据车辆的环境数据、用户状态数据和设备状态数据, 生成场景控制指令;基于预设规则库将场景控制指令转化为模拟语音数据;将模拟语音数据发送...
  • 本发明提供一种支持语音交互的LED显示屏互动方法及系统, 通过获取用户发出的连续语音数据流进行语音特征提取处理, 得到语音片段的声学特征序列和语义关联特征集合, 调用预训练的语音语义理解模型对声学特征序列和语义关联特征集合进行联合语义解析处...
  • 本申请涉及洗衣机技术领域, 尤其涉及基于语音识别的洗衣机数据分析系统及方法, 该方法的步骤包括:获取用户语音数据、待清洗衣物特征数据以及历史清洗记录数据;基于历史清洗记录数据分析用户的衣物清洗周期以及清洗程序指令偏好并结合待清洗衣物特征数据...
技术分类