Document
拖动滑块完成拼图
专利交易 商标交易 积分商城 国际服务 IP管家助手 科技果 科技人才 会员权益 需求市场 关于龙图腾 更多
 /  免费注册
到顶部 到底部
清空 搜索
最新专利技术
  • 本发明公开了基于长音频的语音标注方法,包括以下步骤:S1:音频统一化与自适应质量过滤:接收多种格式的原始音频流,通过解码重采样,统一为预设标准格式的长音频文件;对长音频文件执行自适应质量过滤;S2:长音频场景解析与智能粗分割:对通过质量过滤...
  • 本发明公开了一种基于RAG的垂直领域语音识别优化方法、装置及介质,所述方法包括:将语音信号转为文本,提取其中置信度低于阈值的低置信度片段,以及文本的上下文语义特征;从垂直领域术语知识库中筛选出语义匹配的候选术语;用候选术语替换初始文本中的低...
  • 本申请涉及一种免发音词典的基于音素的语音识别方法、装置、计算机设备和存储介质。所述方法包括:方法应用于服务器,服务器中部署有语音识别框架,语音识别框架包括音素识别模型、音字转换模型和辅助字音转换模型,方法包括:基于音素识别模型对待识别语音信...
  • 本发明涉及人工智能技术领域,提供了一种智能客服语音交互模型训练方法及系统,该方法包括:S1、采集历史客服通话录音、文本对话记录、工单数据及用户反馈数据,对数据进行预处理;S2、构建分层多任务训练框架。本发明通过统一的分层多任务训练框架实现智...
  • 本申请公开了一种多语言混合语音识别方法及相关装置,涉及语音识别技术领域,本申请多语言混合语音识别模型不再依赖blank符号解决输入声学特征序列与输出文本建模单元长度不一致的问题,不同专家子模型具备预测不同语言的文本建模单元及其持续时间的能力...
  • 本发明涉及语音服务技术领域,更具体的说,涉及一种用于咖啡机器人的多语言自然语音交互方法及系统,采集用户的语音信号,并对语音信号进行语言类型的识别,得到语音信号的类型信息,根据类型信息激活相应的语言识别模型,以对语音信号进行语义分析处理,生成...
  • 本发明涉及语音翻译技术领域,特别涉及一种基于自适应最优传输的跨式联运混淆方法及装置。方法包括:构建多任务通用框架的最优传输模型;对语音和文本序列进行基于注意力增强的最优传输对齐;基于动态窗口策略,对基于注意力增强的最优传输对齐进行优化,获得...
  • 本公开的实施例提供了用于数据处理的方法、主处理单元、芯片系统、装置、设备、存储介质和程序产品。该方法包括:在主处理单元处,响应于接收到针对数字助手的第一语音数据,将第一语音数据发送至与数字助手相关联的第一协处理单元以对第一语音数据执行处理,...
  • 本申请涉及一种用于智能管家设备的声纹识别方法和智能管家设备,属于智能设备领域,所述方法包括:提取待识别语音声纹特征;根据待识别语音声纹特征与用户注册声纹库每个注册声纹特征的相似度,判断待识别语音的第一用户身份;用户注册声纹库包括至少一个用户...
  • 本公开公开了一种音频识别方法、装置、设备、介质和产品,涉及人工智能领域,尤其涉及语音技术、深度学习、智能体领域。具体实现方案为:采用不同的声纹特征提取方式,分别对目标音频数据中的多个音频片段进行声纹特征提取,得到多个声纹特征集;基于多个声纹...
  • 本发明涉及语音识别技术领域,尤其涉及一种基于声纹识别的生成式病历自动生成系统及方法,包括:声纹处理模块,包括用以采集诊室场景中医患对话语音的采集单元;病历生成模块,包括用以将所述身份绑定特征输入到初始模型进行训练以得到医疗对话识别模型的训练...
  • 本发明公开一种基于多模态融合算法的营销场景说话人区分方法,包括以下步骤:对待识别音频进行分割,得到若干个子音频和各所述子音频对应的说话人初分类结果;实时检测是否存在预设注册声纹库,并根据检测结果进行说话人角色判定;其中,所述注册声纹库中包括...
  • 本发明提供一种动物声音事件检测模型的训练方法、检测方法及装置,涉及智能音频信号处理技术领域。该训练方法包括:获取样本支持集和多类别训练集,样本支持集包括第一正、负样本和查询样本,多类别训练集包括第一正样本;提取样本帧级声学特征,包括样本Lo...
  • 本发明公开了基于深度学习的强鲁棒性无损高容量音频水印嵌入方法,涉及数字水印技术领域。该方法,包括以下步骤:音频‑水印信息预处理、水印信息嵌入和水印嵌入检测判定。本发明通过对原始音频和待嵌入的水印信息进行对应的预处理,有效提升了原始音频和水印...
  • 本申请涉及音频编码技术领域,具体公开了一种音频编码方法、装置、设备、介质及产品,方法包括:对输入音频帧进行频谱分析,判断是否存在满足预设条件的单频信号;若存在,确定单频信号所在比例因子带及其邻近的N个比例因子带构成目标比例因子带组合;将目标...
  • 本申请涉及一种音频处理模型的训练方法、音频处理方法、计算机设备、计算机可读存储介质和计算机程序产品。方法包括:获取第一干声音频样本,获取第一干声音频样本对应的参考干声音频样本,其中参考干声音频样本与第一干声音频样本符合预设的内容一致性条件;...
  • 本公开提供了一种音频处理方法、装置、设备及存储介质,涉及计算机技术领域。该方法包括:获取待播放音频,将所述待播放音频的时域数据转换为频域数据;基于所述频域数据检测所述待播放音频中包含的音色类型;响应于所述音色类型中存在目标音色,获取与所述目...
  • 本申请提供远场语音增强方法、装置、存储介质及计算机设备,方法包括:获取待增强远场语音;确定目标语音增强模型,目标语音增强模型为基于多维损失函数,采用模拟增强语音样本进行训练得到的,模拟增强语音样本为对干净语音数据进行环境模拟、外放损失模拟和...
  • 本申请实施例提供了一种音频处理方法、装置、电子设备及存储介质,可涉及音频处理等领域,该方法包括:获取目标多媒体数据,基于胶片播放风格对应的带宽范围,对目标多媒体数据的初始音频信号进行滤波处理,得到中间音频信号,确定胶片播放风格对应的目标噪声...
  • 本发明涉及麦克风降噪领域,公开了一种基于耳机的通话降噪方法、设备及存储介质。该方法包括:基于降噪麦克风采集音频信号;基于预设降噪算法,对音频信号进行降噪计算,得到抵消信号,以及基于降噪扬声器播放抵消信号;当接收通话来电时,触发通话麦克风采集...
技术分类