Document
拖动滑块完成拼图
专利交易 商标交易 积分商城 国际服务 IP管家助手 科技果 科技人才 会员权益 需求市场 关于龙图腾 更多
 /  免费注册
到顶部 到底部
清空 搜索
最新专利技术
  • 本申请实施例公开面向人机语音对话的语音识别自学习方法、语音识别自学习系统、电子设备和存储介质,其中,方法包括:记录人机对话日志,所述日志至少包含用户标识、输入文本、输入类型及对话任务完成状态;根据所述用户标识对所述日志分类,筛选任务完成状态...
  • 本申请公开了一种实时语音对话方法、装置、设备以及存储介质,涉及语音对话领域,包括:获取纳税用户端输入的初始音频片段,基于初始音频片段确定动态幅度阈值;若初始音频片段中的预设尾部片段的音频幅度不大于动态幅度阈值,则在初始音频片段中,确定音频幅...
  • 本申请公开了一种音频数据的脱敏方法、装置、设备及存储介质,涉及隐私计算技术领域。该方法包括基于自动语音识别引擎,对接收到的待处理音频数据进行文本转换和时间戳划分,得到至少两个待处理文本数据和待处理文本数据的时间戳数据;基于预设滑动窗口,根据...
  • 本发明涉及语音交互技术领域,具体涉及一种基于语义分析的对话式AI低延迟响应控制方法及系统。本发明首先根据CAN总线数据的变化,生成当前时窗的驾驶强度关联因子;进一步监测NLU的输出,并分析声学语调上扬特征,结合驾驶强度关联因子,获取交互抑制...
  • 本发明公开了一种语音标注方法、设备、介质和产品,其中,方法包括:获取待识别语音信息和同步采集到的视频信息、文本信息和生理信号数据中的至少一种模态数据;分别对待识别语音信息和至少一种模态数据进行数据预处理和特征提取,得到每个模态数据的模态数据...
  • 本发明公开的属于语音识别与声学建模技术领域,具体为一种结合语音可懂度重构与自回归反馈优化的高保真端到端声学建模方法,首先基于人类语音可懂度模型建立可懂度损失函数;接着通过频谱重建网络重建语音的主观清晰度特征,结合感知加权滤波器组提取可懂度相...
  • 本发明涉及人工智能语音分析技术领域,公开了一种基于AI的语音分析方法及装置,所述方法包括采集用户的语音数据,分离语音中发音和噪声,生成第一语音特征集合;提取语音特征,形成第二特征向量;对第二特征向量进行维度调整,得到第三特征向量;计算初始权...
  • 本申请提出一种语音转写方法、语音转写装置,语音转写设备以及计算机存储介质。所述语音转写方法包括:确定原始音频信号的标注文本的标注时间戳区间,和识别文本的识别时间戳区间;其中,所述标注文本和所述识别文本建立时间戳的对应关系;根据所述标注时间戳...
  • 本发明公开了一种智能电视语音声纹识别三要素测试方法及自动化测试系统,涉及智能语音识别测试技术领域,包括:1)声纹识别重复测试法:采用同一人单条音频多次反复连续的测试方法,检查其多次声纹识别的稳定性;2)环境适应性测试法:增加居家场景、偏角度...
  • 本发明公开了基于Transformer的电力方言识别方法、系统及介质,涉及语音识别与人工智能技术领域;从电力方言语音数据中提取多尺度声学特征使Transformer识别模型能够同时利用低频和高频信息,提高模型对方言和术语的区分能力;基于通用...
  • 本发明公开的属于人工智能与语音识别技术领域,具体为一种基于多层自适应特征分离与语言迁移的低资源方言端到端语音识别方法,首先通过卷积‑Transformer混合网络将特征映射至多层语音特征子空间,分别捕获短时声学模式与全局时序相关性,接着结合...
  • 本申请公开了一种基于多信号修正的媒资播放意图类型判定方法及系统,涉及人工智能技术领域,方法包括:通过第一大型语言模型根据用户输入的文本生成初始播放意图指令;从初始播放意图指令中识别得到具有目标语义的关键实体;通过第二大型语言模型根据初始播放...
  • 本发明公开了一种基于并发优化调度的大规模语音合成任务处理方法,包括如下步骤:S1、接收来自外部系统的多个语音合成任务请求,构建待调度任务集合;S2、采集当前语音合成平台的系统运行状态,构建系统状态信息集合;S3、将系统状态信息集合输入至结构...
  • 本发明公开了一种融合情感增强机制的语音克隆方法、系统及存储介质,涉及语音合成技术领域。该一种融合情感增强机制的语音克隆方法、系统及存储介质,包括以下步骤:S1,构建迁移学习框架和多源语音数据集,进行归一化处理;S2,基于预处理后的多源语音数...
  • 本发明公开了一种基于深度神经网络架构的音标生成方法、装置及存储介质,包括预定义基于汉语拼音的泛用型汉语音标体系作为统一输出标准,构建含并行文本编码器、声学编码器及单解码器的建模架构;双编码器分别处理文本与音频输入,生成维度格式一致的发音细节...
  • 本申请涉及语音处理领域,具体涉及一种语音合成方法、装置、电子设备及存储介质,包括:分别提取待合成文本和情感强度指令的待合成文本特征和情感指令特征;通过情感文本处理模型处理待合成文本特征和情感指令特征得到情感文本特征;选取与情感强度指令的情感...
  • 本申请涉及车辆控制技术领域,特别是涉及一种车辆的控制方法、车辆电子设备。其中,该控制方法包括:检测到紧急救助系统触发紧急呼叫时,获取车上人员的能力特征;实时获取救援方语音数据,并调用预训练的多模态大模型,利用多模态大模型响应救援方语音数据,...
  • 本发明公开了一种文本分段语音流式处理方法、系统、设备、介质及程序产品,方法包括:首先,根据长文本的语义结构进行分段处理,得到语义完整的有序文本片段;再对首个文本片段进行语音合成,得到首个音频片段,并在合成首个音频片段的同时建立与客户端的SS...
  • 本发明公开了一种文本语音实时流式转换方法、系统、设备、介质及程序产品,方法包括:首先接收用户输入的请求,再基于用户请求生成文本内容块;通过监听思考状态识别文本内容块类型,并写入对应的推理队列和回答队列。推理队列中的推理内容满足第一预设条件后...
  • 公开了一种渐开线式的多臂螺旋声阵列及方法,阵列中,中心支撑件为正七边形板状结构,其七个侧边分别通过焊接方式连接七根基圆螺旋臂连接件,每根基圆螺旋臂连接件的另一端连接一根内部螺旋臂结构,每根内部螺旋臂结构的另一端连接一根中部螺旋臂结构,每根中...
技术分类