Document
拖动滑块完成拼图
首页 专利交易 IP管家助手 科技果 科技人才 积分商城 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
最新专利技术
  • 本公开涉及一种智能座舱语音交互方法、系统、电子设备、存储介质及车辆,其中,该方法包括:通过KWS检测到语音输入,触发ASR将语音输入转换为文本信息;从本地RAG知识库中获取与文本信息相关的知识信息,其中,知识信息包括:与文本信息相关的背景信...
  • 一种基于人工智能的声音环境分析及监测方法,属于人工智能领域,包括:声音信号采集与预处理;声音特征提取与参数分析;声音转文本;利用具备声音事件分析的多模态大语言模型将声音事件转换为文本描述形式并输出文本信息;对输出的文本信息加上时间戳,分类整...
  • 本发明为一种基于准实时语音转写和说话人识别分类的会议记录智能化管理方法及系统。会议前采集说话人语音样本,经信噪比校验后提取声纹嵌入向量,结合姓名、照片等构建注册特征库;会议中采用非流式语音识别模型分段转写并合并文本,通过滑动窗口动态计算语音...
  • 本发明涉及语音信号处理技术领域,具体涉及一种实时对话双向语音转写和翻译方法及装置,所述方法包括:响应于用户输入的第一语言的第一语音信号,将第一语音信号传输至预设语音识别模型以输出得到第一语言文本信息;将第一语言文本信息输入至预设文本翻译模型...
  • 本发明公开了一种基于语音输入的智能应答互动方法及装置,本公开涉及人工智能技术领域。本公开主要的技术方案为:该方法适用于通过智能设备实现的智能互动系统,在预先向服务端配置的业务内容相对应的“目标业务场景”下,客户端采集声音数据,服务端从中确定...
  • 一种语音处理方法,包括:获取语音数据,语音数据包括至少一个说话人的语音,语音数据通过至少一个语音通道拾取得到;对语音数据进行编码,得到基础语音特征;确定至少一个说话人中每个说话人的说话人特征;根据每个说话人的说话人特征和基础语音特征,得到每...
  • 一种自动语者注册方法与系统,在方法中,以摄影机拍摄影像,产生影像数据,从中辨识人的脸部位置,以麦克风阵列进行收音,产生语音数据,运用声音定位技术估测声源方向,之后根据人的脸部位置与声源方向匹配出目标语者,特别是确认是否是在有效几何范围内的目...
  • 本发明公开了一种恶意语音检测方法及装置。其中,方法包括:获取待检测语音数据集;对语音数据集中每个语音数据进行特征维度提取,确定每个语音数据的维度特征集;从每个语音数据的维度特征集中选取出预先训练选取的最优维度特征组合,确定每个语音数据的检测...
  • 本发明公开了一种基于声纹识别与行为分析的信贷身份验证增强技术,包括数据采集模块、数据预处理模块、特征提取模块、身份验证模型模块、反馈与更新模块和系统管理模块。数据采集模块利用麦克风阵列采集语音数据,通过触摸屏传感器、加速度传感器等采集用户行...
  • 本发明公开了一种基于对话特征的机器人识别方法及装置、电子设备,涉及金融科技领域,该方法包括:在金融客服服务过程中,获取通话对象的对象信息以及双方对话语音内容,将双方对话语音内容输入至身份识别模型,由身份识别模型提取对话特征,输出通话对象属于...
  • 本发明公开了一种基于语音的业务执行方法、装置以及设备。包括:在用户进行语音交互时,持续地采集当前环境中的语音;从所述语音中采集声纹特征,并相应持续地检测所述声纹特征是否对应于指定的合法用户;在持续检测到所述声纹特征是对应于指定的合法用户的情...
  • 本发明公开了一种声纹识别方法及系统,包括以下步骤:获取语音信号并进行预处理;生成对应的目标声学特征序列;通获取对应的帧级隐藏表示序列;采用连续积分触发机制进行处理,生成标记单元和标记级对齐信息;根据对齐置信度对标记级特征向量进行融合得到对齐...
  • 本申请公开了一种小样本注册的区域性鸟类鸣声分类方法和相关设备,方法包括:将第一待分类Fbank特征输入鸟声声纹特征提取模型,生成待分类鸟类声纹模板特征,根据待分类鸟类声纹模板特征对小样本注册模板库进行更新;将第二待分类Fbank特征输入鸟声...
  • 本申请公开了一种音频编解码方法和音频编解码模型的训练方法及设备,属于音频处理领域。音频编码方法包括:获取原始音频信号;将原始音频信号输入音频编码器,音频编码器包括级联的n个深度可分离卷积网络;通过第i个深度可分离卷积网络的通道升维层对第i‑...
  • 本发明提供一种音频水印嵌入方法、装置、电子设备及存储介质,属于音频处理技术领域,包括:获取原始音频信号的幅度谱特征并确定水印嵌入能量掩码;将幅度谱特征输入至多个掩码预测网络模型获取水印嵌入风险掩码;根据水印嵌入风险掩码确定目标水印嵌入风险掩...
  • 本申请公开一种语音增强方法与相关方法、装置、设备及存储介质。包括:在语音通话状态下获取目标对象的参考语音,提取参考语音对应每帧语音信号的参考音频特征;基于训练后的声纹提取网络提取每个参考音频特征对应的帧级声纹特征;将获取的待增强语音的待增强...
  • 本发明公开了基于算法的轻量级鲁棒无监督特征选择的音频去噪方法,包括采集实时场景下含噪声音频信号,作为待去噪音频数据;基于上述待去噪音频数据,构建基于联合子空间学习的鲁棒无监督特征选择模型,并通过多任务互补学习构建目标优化函数;采用交替优化方...
  • 本发明涉及一种基于二分法策略的自适应多变量变分模态分解去噪方法,属于声音信号处理领域。解决MVMD算法在高噪声条件下因参数选择不当导致虚假模态估计或真实模态遗漏的技术问题。技术方案包括:研究初始中心频率收敛特性以确定频率区间;采用二分法策略...
  • 本发明公开了一种车载环境下基于时频交互的单通道语音增强方法,属于语音信号处理技术领域,所述方法包括:根据车载场景采集语音信号并执行预处理操作,得到预处理后的语音数据集;将预处理后的语音数据集进行短时傅里叶变换转换成复数谱,将复数谱分解为实部...
  • 本发明公开了一种焊接噪声环境下的语音增强方法、系统及电子设备,属于语音增强技术领域,方法包括以下步骤:采集焊接噪声环境下的语音信号,并进行预处理;对预处理后的语音进行小波分解,获取不同频段的小波系数;对小波系数进行阈值化处理;其中,设计具有...
技术分类