Document
拖动滑块完成拼图
首页 专利交易 IP管家助手 科技果 科技人才 积分商城 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
最新专利技术
  • 本申请公开了一种线性回声消除方法、设备及存储介质,该方法包括:基于当前帧的麦克风采集信号和回采信号对线性回声信号进行粗估计,得到粗参考信号;将当前帧的麦克风采集信号、粗参考信号、前序帧计算得到的滤波器参数输入至频域滤波器,得到频域残差信号;...
  • 本发明提供一种回声延时的估计方法及其系统,其中方法包括:获取远端发来的远端连续语音数据以及近端语音数据;通过快速傅里叶变换将远端连续语音数据分帧保存到先入先出队列中,对近端语音数据进行分帧处理以及快速傅里叶变换,得到M组远端频率向量和一组近...
  • 本发明涉及音效数据修复技术领域,具体涉及一种基于人工智能的游戏音效数据修复方法,首先通过集成动态路径选择机制的生成对抗网络对原始游戏音效数据进行扩充,以解决传统生成对抗网络因固定结构导致的样本单一性问题;进而采用基于量子态稀疏约束的自编码器...
  • 本申请公开了一种故事音频音色处理方法及相关装置,涉及音频处理技术领域,本申请在利用参考音频对待处理故事音频进行音色处理之前,先从待处理故事音频中提取得到故事人声,然后再基于参考音频对故事人声进行音色转换处理,得到与参考音频对应音色的目标故事...
  • 本发明提供音频水印嵌入方法、装置、设备、存储介质及程序产品,其中方法包括:获取针对待处理音频的保护信息,采用安全散列算法将所述保护信息映射为预设长度的哈希值;对所述待处理音频进行填充处理,得到填充音频,所述填充音频的字节数量为预设数量;将所...
  • 本发明公开了一种语音处理方法、装置、设备、介质和产品,通过对语音信号进行特征提取,输出编码后的特征,并对编码后的特征进行压缩;根据预设的动态码本分配策略对压缩后的特征进行量化,生成量化特征;对量化特征进行解压缩,生成高维度特征;对高维度特征...
  • 本发明涉及水下噪声实时检测与声呐生物识别集成系统,通过在水下布置音频采集阵列采集多个文字的音频数据,然后进行分频,以将不同音源的物体进行粗划分,为了将混合了相似频率的音频数据剔除,本申请还利用能量的分布特征来保留音频能量稳定的时间段作为有效...
  • 本公开提供一种宠物情绪识别模型的训练方法、装置、电子设备,该方法涉及人工智能领域。包括:确定训练数据集,其中,训练数据集包括源数据和目标数据,源数据包括多个第一宠物语音信号以及每个第一宠物语音信号的一个或多个情绪标签,一个或多个情绪标签与第...
  • 本发明属于音频信号处理技术领域,具体公开了一种基于轻量化残差网络与RK3568的无人机音频识别方法、系统、设备及介质。本发明公开的方法包括:首先,使用RK3568芯片的CPU对麦克风采集到的原始音频信号进行预处理,提取梅尔频谱图作为时频特征...
  • 本发明公开了一种基于声纹识别的家庭成员权限管理系统及其管理方法,其系统包括语言采集模块、智能语音识别模块、身份验证模块、权限校验模块以及设备控制模块。本发明通过声纹识别技术和多模态融合识别技术相结合,能够准确的识别指令发出者的身份,提高识别...
  • 本发明公开了基于语音识别与大模型的智能会议纪要自动生成方法,包括如下步骤:S1、对音频数据流执行语音活动检测操作;S2、提取连续有效的语音片段的嵌入向量,生成发言人归属语音片段集合;S3、将发言人归属语音片段集合输入至改进型Whisper模...
  • 本发明属于语音调度技术领域,公开了一种基于语义识别技术的防汛排涝语音指挥调度系统及方法。该方法包括:语音采集模块捕获环境中的声音信号,基于所述声音信号生成音频文件;语义识别模块调用语义识别服务对所述音频文件进行语义解析,得到所述音频文件中的...
  • 本发明公开了一种客服呼叫平台中语音通话的ASR实时转写文字方法,属于语音通话实时转写技术领域。本发明适用于呼叫平台中所有场景的通话语音识别,能够快速启动或暂停实时语音识别;能够适应现有基于freeswitch的呼叫平台,通过加载自研语音获取...
  • 本申请提供一种电梯上用新型语音交互方法及装置,涉及电梯交互的领域,解决了多人混合语音识别失效的技术问题。该方法包括:获取与电梯关联的目标人员的人脸信息、声纹信息、个人信息。基于进入电梯时的人脸对比结果,确定电梯停靠在目标人员的个人信息的对应...
  • 本申请公开了一种语音识别方法、设备、存储介质及计算机程序产品,涉及语音识别技术领域,公开了语音识别方法,包括:确定经过模态对齐处理的音频数据和视频数据;对音频数据的时间序列和频率特征进行提取得到第一音频特征,对视频数据的空间特征进行提取得到...
  • 本申请提供了一种显示设备和语音控制方法,该显示设备包括显示器、声音采集器,以及显示器、声音采集器分别连接的控制器;其中,显示器被配置为显示图像画面和用户界面;声音采集器被配置为采集用户的语音控制指令,控制器被配置为:确定当前显示界面中包含的...
  • 本申请公开了一种语音交互方法及相关装置,涉及语音交互技术领域,语音交互方法包括:获取当前对话轮的用户语音;利用语音交互模型中的语义回复生成模型,生成用户语音对应的回复文本;利用语音交互模型中的语音回复生成模型,根据回复文本,同时结合辅助生成...
  • 本发明涉及蓝牙耳机控制技术领域,公开了一种基于AI的蓝牙耳机语音控制方法、系统及设备,所述方法包括获取实时音频与语音信号,经傅里叶变换得到频率分布特征。通过多层卷积运算和峰值检测获匹配的峰值位置集合。据此提取单一声源特征子集并聚类,得到分类...
  • 本发明涉及一种基于语音识别的设备控制方法及系统,属于语音识别控制技术领域。方法包括步骤:通过采集的用户语音数据,经过本地部署的声学模板库匹配对应的声学模板生成音素概率分布,从而将语音数据转化为文本输出;根据语音识别文本进行意图分层,并分析延...
  • 本公开提供了一种语音交互方法、装置、电子设备、介质和程序产品,可以应用于人工智能及计算机技术领域。该方法包括:响应于获取与用户语音流对应的语音应答请求,接收由对话管理系统发送的候选应答信息,候选应答信息是通过自然语言处理系统实时发送至对话管...
技术分类