Document
拖动滑块完成拼图
首页 专利交易 IP管家助手 科技果 科技人才 积分商城 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
最新专利技术
  • 本发明公开了一种基于Taylor模型的单通道非实时语音增强方法、计算机存储介质及产品,该方法包括如下步骤:S1、采集并预处理含噪语音数据;S2、构建新型TaylorSENet神经网络模型,该模型包括零阶块、高阶块和自适应阶数选择模块;S3:...
  • 本申请提供了对话数据在线传输方法及装置、设备、存储介质,属于数据传输技术领域,该方法包括:获取智能可穿戴设备的环境噪音、移动速度和通信带宽;智能可穿戴设备与第一设备通信连接;第一设备用于接收第二设备发送的语音数据,并将语音数据传输到智能可穿...
  • 本发明公开了基于解耦扩散模型的通用语音增强系统及方法,包括以下步骤:通过短时傅里叶变换对语音信号进行特征提取,语音信号包括干净语音信号和混合语音信号,定义并获取失真语音残差信号;对提取的干净语音进行加噪,通过马尔可夫链将失真语音残差信号和高...
  • 本发明公开了一种软件无线电智能语音降噪系统设计方法,通过所模数转换/数模转换模块采集射频信号,进行下变频和数字化后,输入预处理模块进行抗混叠滤波和语音分帧处理后,输入到DCNN硬件加速器进行卷积、激活、池化操作,输入到DQPSK调制解调模块...
  • 本发明提供了一种音频调整方法、装置、油烟机和计算机可读存储介质,应用于油烟机的控制器,涉及音频处理技术领域。方法包括:响应控制信号,确定播放模式;其中,播放模式与目标调制频率一一对应;将待播放音频转换为频域信号,在频域信号中确定目标调制频率...
  • 本公开涉及用于维持与参数音频编码器相关联的可逆动态范围控制信息的系统。以比特流(P)为基础,通过从比特流导出m通道核心信号(Y)和多通道编码参数(α)重构n通道音频信号(X),此处1≤m<n。从比特流还导出量化核心信号的编码器侧动态范围限制...
  • 本发明公开了一种语音编码方法、电子设备、程序产品及存储介质,语音编码方法包括:提取待编码语音数据中的人声语音信息;确定人声语音信息的语言类型;根据语言类型确定对应的音素编解码规则;根据音素编解码规则对人声语音信息中的音素特征信息进行编码,得...
  • 本发明涉及声纹识别技术领域,具体涉及一种借助声纹识别技术的珍稀鸟类识别方法,包括:获取若干种鸟类的录音数据,基于任意珍稀鸟类和非珍稀鸟类之间的空间分布在时间上的变化和重叠情况,计算非珍稀鸟类的参照系数,根据参照系数筛选出珍稀鸟类的参照鸟类;...
  • 本发明公开了一种在线监测仪自然声识别装置,涉及自然声识别技术领域,包括:采集模块,用于同步采集双监测点的声信号;分解模块,用于对声信号进行分解,得到各频带的能量分布以及跨点相干;核心窄带确定模块,用于确定跨点相干的核心窄带;能量关系判定模块...
  • 本发明公开一种基于声音识别的害虫检测并驱逐的方法,包括:通过采集害虫原始声音信号,经预处理后得到梅尔频谱特征图,并进行归一化处理以减少环境干扰;将归一化特征图输入经迁移学习优化的AST模型,输出害虫类别概率分布,取概率最大值作为置信度判定目...
  • 本发明属于语音识别技术领域,具体涉及一种语音唤醒词自定义设置方法、系统、装置及语音唤醒设备,所述方法包括:接收用户输入的唤醒词文字信息,提示用户录制与文字信息对应的语音信息并进行存储,对录制的语音信息进行数据分析与优化,然后进行多维声学特征...
  • 本发明涉及一种提升压缩编码语音声纹识别准确性的方法,属于声纹识别技术领域,方法包括:分别提取未压缩语音和经语音编码压缩后语音的语音特征;基于通用背景模型,分别利用未压缩语音特征和压缩语音特征进行自适应训练,得到对应的未压缩语音模型和压缩语音...
  • 本发明公开了一种说话人识别、说话人特征向量提取方法和装置,属于音频处理技术领域,该方法包括:将音频数据划分为多个音频块,每间隔固定数量的音频块提取一次说话人特征向量,得到说话人特征向量序列;根据说话人判定规则对说话人特征向量序列进行处理,以...
  • 本说明书提供的声纹识别模型的训练方法、系统以及声纹识别方法和系统,提出了一种区分相似说话人的方案,在声纹识别模型训练过程中,通过自适应调整与目标样本声纹特征相近的相似类别的余量取值,使得训练过程中相似类别所占的权重加大,加重训练过程中相似说...
  • 本发明涉及语音识别技术领域,公开了一种融合多任务学习的变分自编码器的发音逆推方法和装置,包括:采集同步的语音信号和发音运动数据;基于语音信号训练声学域变分自编码器,声学域变分自编码器将第一说话人特征输入说话人识别器以识别说话人;最终将第一内...
  • 本发明涉及音频语义理解的技术领域,公开了一种多源音频语义理解的电力应急指挥处理方法及系统,所述方法包括:利用语音分离模型分离得到规范化处理后多源音频信号中的纯净人声音频信号;利用基于电力领域热词优化的流式声学模型对纯净人声音频信号的流式特征...
  • 本申请公开了一种音频流处理方法以及装置,方法包括:对接收的音频流进行语音活动检测得到断句结果,基于断句结果从音频流切分出目标音频片段;将目标音频片段输入预训练好的语言翻译大模型执行翻译操作以得到翻译结果;输出翻译结果;如此,本申请通过语音活...
  • 本公开的实施例提供了一种语音数据处理方法、装置、系统、电子设备及计算机可读存储介质,涉及计算机技术领域,具体涉及语音识别、语音转写、云存储等技术领域,该方法应用于业务服务端,包括:接收浏览器端发送的音频数据块;响应于音频数据块未被标记为重传...
  • 本发明公开了5G新通话智能体中实时交互功能的实现方法,涉及5G通信技术领域,包括以下步骤:基于5G网络环境,获取用户实时交互需求数据,所述需求数据包括但不限于通话过程中的信息交互指令、对特定功能的调用请求;对获取到的需求数据进行解析与分类,...
  • 本申请涉及人工智能技术领域,揭示了一种医患语音记录方法、装置、设备及存储介质,其中,方法包括:采集医生和患者的综合语音数据;识别所述综合语音数据,以得到特定语音特征,根据所述特定语音特征所在的位置设定语音分隔符;基于所述语音分隔符对所述综合...
技术分类