Document
拖动滑块完成拼图
首页 专利交易 IP管家助手 科技果 科技人才 积分商城 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
最新专利技术
  • 本发明提供一种音频水印嵌入方法、装置、电子设备及存储介质,属于音频处理技术领域,包括:获取原始音频信号的幅度谱特征并确定水印嵌入能量掩码;将幅度谱特征输入至多个掩码预测网络模型获取水印嵌入风险掩码;根据水印嵌入风险掩码确定目标水印嵌入风险掩...
  • 本申请公开了一种音频编解码方法和音频编解码模型的训练方法及设备,属于音频处理领域。音频编码方法包括:获取原始音频信号;将原始音频信号输入音频编码器,音频编码器包括级联的n个深度可分离卷积网络;通过第i个深度可分离卷积网络的通道升维层对第i‑...
  • 本申请公开了一种小样本注册的区域性鸟类鸣声分类方法和相关设备,方法包括:将第一待分类Fbank特征输入鸟声声纹特征提取模型,生成待分类鸟类声纹模板特征,根据待分类鸟类声纹模板特征对小样本注册模板库进行更新;将第二待分类Fbank特征输入鸟声...
  • 本发明公开了一种声纹识别方法及系统,包括以下步骤:获取语音信号并进行预处理;生成对应的目标声学特征序列;通获取对应的帧级隐藏表示序列;采用连续积分触发机制进行处理,生成标记单元和标记级对齐信息;根据对齐置信度对标记级特征向量进行融合得到对齐...
  • 本发明公开了一种基于语音的业务执行方法、装置以及设备。包括:在用户进行语音交互时,持续地采集当前环境中的语音;从所述语音中采集声纹特征,并相应持续地检测所述声纹特征是否对应于指定的合法用户;在持续检测到所述声纹特征是对应于指定的合法用户的情...
  • 本发明公开了一种基于对话特征的机器人识别方法及装置、电子设备,涉及金融科技领域,该方法包括:在金融客服服务过程中,获取通话对象的对象信息以及双方对话语音内容,将双方对话语音内容输入至身份识别模型,由身份识别模型提取对话特征,输出通话对象属于...
  • 本发明公开了一种基于声纹识别与行为分析的信贷身份验证增强技术,包括数据采集模块、数据预处理模块、特征提取模块、身份验证模型模块、反馈与更新模块和系统管理模块。数据采集模块利用麦克风阵列采集语音数据,通过触摸屏传感器、加速度传感器等采集用户行...
  • 本发明公开了一种恶意语音检测方法及装置。其中,方法包括:获取待检测语音数据集;对语音数据集中每个语音数据进行特征维度提取,确定每个语音数据的维度特征集;从每个语音数据的维度特征集中选取出预先训练选取的最优维度特征组合,确定每个语音数据的检测...
  • 一种自动语者注册方法与系统,在方法中,以摄影机拍摄影像,产生影像数据,从中辨识人的脸部位置,以麦克风阵列进行收音,产生语音数据,运用声音定位技术估测声源方向,之后根据人的脸部位置与声源方向匹配出目标语者,特别是确认是否是在有效几何范围内的目...
  • 一种语音处理方法,包括:获取语音数据,语音数据包括至少一个说话人的语音,语音数据通过至少一个语音通道拾取得到;对语音数据进行编码,得到基础语音特征;确定至少一个说话人中每个说话人的说话人特征;根据每个说话人的说话人特征和基础语音特征,得到每...
  • 本发明公开了一种基于语音输入的智能应答互动方法及装置,本公开涉及人工智能技术领域。本公开主要的技术方案为:该方法适用于通过智能设备实现的智能互动系统,在预先向服务端配置的业务内容相对应的“目标业务场景”下,客户端采集声音数据,服务端从中确定...
  • 本发明涉及语音信号处理技术领域,具体涉及一种实时对话双向语音转写和翻译方法及装置,所述方法包括:响应于用户输入的第一语言的第一语音信号,将第一语音信号传输至预设语音识别模型以输出得到第一语言文本信息;将第一语言文本信息输入至预设文本翻译模型...
  • 本发明为一种基于准实时语音转写和说话人识别分类的会议记录智能化管理方法及系统。会议前采集说话人语音样本,经信噪比校验后提取声纹嵌入向量,结合姓名、照片等构建注册特征库;会议中采用非流式语音识别模型分段转写并合并文本,通过滑动窗口动态计算语音...
  • 一种基于人工智能的声音环境分析及监测方法,属于人工智能领域,包括:声音信号采集与预处理;声音特征提取与参数分析;声音转文本;利用具备声音事件分析的多模态大语言模型将声音事件转换为文本描述形式并输出文本信息;对输出的文本信息加上时间戳,分类整...
  • 本公开涉及一种智能座舱语音交互方法、系统、电子设备、存储介质及车辆,其中,该方法包括:通过KWS检测到语音输入,触发ASR将语音输入转换为文本信息;从本地RAG知识库中获取与文本信息相关的知识信息,其中,知识信息包括:与文本信息相关的背景信...
  • 本发明公开了一种基于检索增强生成的语音识别方法、设备及介质,属于语音识别技术领域,用于解决现有语音识别系统在噪声环境下关键词识别准确率低,且对特定领域下的术语识别能力不足的技术问题。方法包括:将预处理后的音频信号进行有关语音编码器的核心特征...
  • 本发明公开了一种用户语音服务评价信息生成方法、装置、设备、介质及产品。可应用于金融科技领域,该方法包括:在监测到与目标用户的语音通话服务结束后,向目标用户发送服务评价请求,以供目标用户基于服务评价请求,生成并反馈服务评价响应结果;生成各服务...
  • 本公开提供的一种语音检查方法,包括:获取待检查语音文件及其对应的台词文本;基于台词文本作为先验知识输入语音识别模型,执行语音文件的转录以获得转录文本;检测转录文本是否包含幻觉内容;当检测到幻觉内容时,调整语音识别模型的参数并重新执行转录。这...
  • 广播电视历史节目语音转译系统,涉及人工智能技术领域,解决现有大模型因价格昂贵,成本偏高而难于广泛应用的问题。通过在计算机上回放节目历史录制文件,利用一种接口电路把音频信号送给人工智能系统转译为文字,再通过接口电路回送到计算机保存。系统支持一...
  • 本公开涉及用于生成音乐的方法、装置、设备、车辆和产品。该方法包括基于车辆的座舱内的人声内容,生成与人声内容对应的歌词文本内容。该方法还包括基于车辆的车身音频数据、车外音频数据中的至少一项音频数据对应的音频特征以及歌词文本内容,生成音乐。通过...
技术分类