Document
拖动滑块完成拼图
专利交易 积分商城 国际服务 IP管家助手 科技果 科技人才 商标交易 会员权益 需求市场 关于龙图腾 更多
 /  免费注册
到顶部 到底部
清空 搜索
最新专利技术
  • 本申请提出了一种车辆声学预警方法、计算机程序产品、存储介质、控制器及车辆,根据本申请提出的车辆声学预警方法,可以在本车运行过程中,结合本车的车辆运行数据,去利用香农插值算法对原始预警音频数据进行音调偏移处理,得到能够用于反映本车运行情况的预...
  • 本申请涉及一种语义通信方法、系统、装置、通信设备和存储介质。所述方法包括:通过感知获得语义信息,提取所述语义信息的语义特征;根据语义通信的通信目的,确定所述语义特征对应的重要性参数;根据所述重要性参数对所述语义特征进行编码,得到待传输的数据...
  • 本申请公开了一种基于载波控制的人工耳蜗信号编码系统、方法和设备,其中系统包括:数据处理模块,用于通过收音设备采集原始音频数据,并将经过预加重处理后的原始音频数据转换为电流刺激数据;场景分类模块,用于通过预先训练的场景分类模型处理原始音频数据...
  • 本发明提供一种不可学习的音频数据生成方法,通过最小化音频扰动与对应标签之间的误差,有效促使模型在训练过程中优先学习这些噪声模式,从而难以学习到原始数据中的知识。此外,为提升音频扰动的质量,本发明将STOI分数和L2范数作为扰动约束条件。ST...
  • 本发明涉及飞行动物声音识别技术领域,公开了基于特征融合的飞行动物声音智能识别方法。该方法包括采集目标飞行动物的声音信号并进行时频变换,获取时频特征矩阵。从矩阵中提取局部特征向量,计算其梯度场,定位局部极值点并编码其方向连接关系形成局部拓扑结...
  • 本发明公开了一种基于语音交互行为的个性化客户画像标签生成与更新系统,涉及人工智能、大数据分析及人机交互技术领域。本发明旨在解决现有客户画像技术依赖单一文本模态导致无法感知副语言信息、情绪标签缺乏业务指向性以及标签更新滞后的问题。其技术方案包...
  • 本申请提供一种声纹识别方法、系统、介质、设备和程序产品,方法包括:获取待识别音频数据;将待识别音频数据输入预训练卷积神经网络编码器,进行下采样并提取低层声学特征;将低层声学特征经多层变换器提取得到不同层级的通用特征,各层通用特征输入至混合专...
  • 公开了一种基于伪标签信号生成的弱监督目标说话人提取方法和系统,包括获取待处理的远场多通道混合音频以及对应的目标说话人时间戳;将远场多通道混合音频的幅度谱沿通道维度拼接,映射为语音编码隐特征;根据目标说话人时间戳,从远场多通道混合音频的参考通...
  • 本发明公开了换流变压器故障声纹识别模型训练方法,同时还公开了采用该方法得到的模型进行检测的故障诊断方法。该训练方法首先采集换流变压器在不同运行状态下的声纹信号,将其转化为Gammatone时频谱以增强故障特征表征能力;随后通过卷积神经网络提...
  • 本申请公开了一种基于声纹识别的通话质量优化方法、设备和存储介质,涉及人工智能技术领域,所述方法包括:响应服务请求,获取通话中客户的初始语音数据,并提取其中的客户声纹特征;将客户声纹特征与身份信息库中的客户声纹模板比对,确定客户声纹特征对应的...
  • 本发明提供了一种基于可解释性评分的语言学习闭环方法及系统,涉及人工智能及在线教育技术领域。该方法包括:获取待评估的语音数据并解析,以生成包含语言内容信息和声学特征信息的结构化数据;基于该结构化数据对口语表现进行多维度评分,并建立评分结果与数...
  • 本申请涉及音频处理技术领域,公开了一种音频编辑方法、装置、设备、存储介质、程序产品。方法包括:检测目标音频的冗余词;确定冗余词的信息冗余度;根据信息冗余度,生成过渡时长;根据过渡时长,从目标音频中,获取第一音频片段和第二音频片段;基于所述第...
  • 本发明属于语音交互与自然语言处理交叉技术领域,公开一种基于检索增强生成的语音大模型问答方法。通过 ASR 误差修正与场景化检索增强,答案的事实性准确率较传统方案提升,多轮对话的意图理解准确率提升,有效解决语音问答中事实性错误与上下文脱节问题...
  • 本申请涉及一种基于多风格提示词的语音识别方法。所述方法包括:基于目标语音信号和/或与所述目标语音信号关联的上下文信息,生成多风格提示词;将所述多风格提示词与所述目标语音信号的特征向量进行融合处理,得到语音增强特征;基于所述语音增强特征和所述...
  • 本公开实施例公开了一种语音交互芯片、方法和电子设备,该语音交互芯片包括:语音交互芯片包括处理器、VAD加速器、KWS加速器和神经网络加速器。其中,VAD加速器,用于在确定音频流数据为人声的情况下,唤醒KWS加速器;KWS加速器,用于在确定音...
  • 本发明创造涉及一种语音控制方法及相关设备。其中,该方法包括:获取音频片段;将音频片段发送至语音识别平台,从语音识别平台获取音频片段对应的控制指令;其中,语音识别平台用于对音频片段进行自动语音识别处理得到音频片段对应的语音识别文本,对语音识别...
  • 本发明创造涉及一种语音控制方法及相关设备。其中,该方法包括:获取音频片段;将音频片段发送至语音识别平台,获取语音识别平台对音频片段的语音识别结果,语音识别结果包括音频片段的语音识别文本以及基于语音识别文本提取的第一语义解析信息;将语音识别文...
  • 本发明提供了一种室内物联控制方法、电子设备及介质。方法包括:获取语音信息和环境图像,语音信息包括属于控制者的控制语音,环境图像包括控制者的图像;从控制语音中识别待控制设备的设备名称、控制指令和待控制设备相对控制者的相对位置信息;根据相对位置...
  • 本发明公开了一种基于动态推理标签的长记忆语音多轮对话方法、装置、终端及存储介质,涉及AI语音对话领域。方法包括:在与目标用户进行多轮语音交互时,当接收到目标语音交互内容,对当前对话的多轮语音交互数据进行意图话题推理,得到目标意图话题;获取所...
  • 本申请提供了一种智能设备的语音控制方法、装置、电子设备和存储介质,该方法包括:在得到语音控制指令时,确定语音控制指令中的目标声纹信息,以及语音控制指令对应的目标场景信息;确定与目标声纹信息匹配的目标设备指令集,并根据目标场景信息,从目标设备...
技术分类