Document
拖动滑块完成拼图
个人中心

预订订单
商城订单
发布专利 发布成果 人才入驻 发布商标 发布需求

请提出您的宝贵建议,有机会获取IP积分或其他奖励

投诉建议

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 积分商城 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 山东大学许信顺获国家专利权

山东大学许信顺获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉山东大学申请的专利一种英语口语识别方法、系统、设备、介质及程序产品获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119360827B

龙图腾网通过国家知识产权局官网在2026-01-02发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411285109.4,技术领域涉及:G10L15/00;该发明授权一种英语口语识别方法、系统、设备、介质及程序产品是由许信顺;郑文瑞;罗昕;陈振铎设计研发完成,并于2024-09-13向国家知识产权局提交的专利申请。

一种英语口语识别方法、系统、设备、介质及程序产品在说明书摘要公布了:本发明公开一种英语口语识别方法、系统、设备、介质及程序产品,涉及语音识别技术领域,包括:对音频特征提取时间特征和频率特征;对时间特征和频率特征通过维度变换并行计算时间维度和频率维度的依赖性,对时间依赖性特征和频率依赖性特征通过交叉注意力模块进行融合,采用三阶段编码器进行渐进式下采样处理,且第一阶段采用分组多头自注意力机制沿时间维度进行分组计算,最后经解码得到语音识别结果,关注语音特征的时频特性,提高模型计算效率。

本发明授权一种英语口语识别方法、系统、设备、介质及程序产品在权利要求书中公布了:1.一种英语口语识别方法,其特征在于,包括: 获取语音信号并提取音频特征,对音频特征提取时间特征和频率特征;其中,音频特征维度为;为样本数,为时间维度,为频率维度; 对时间特征经维度变换后计算时间依赖性,并与维度变换后的时间特征进行残差连接得到时间依赖性特征,对频率特征经维度变换后计算频率依赖性,并与维度变换后的频率特征进行残差连接得到频率依赖性特征,对时间依赖性特征和频率依赖性特征采用交叉注意力机制融合和残差连接后,得到融合特征;计算过程如下: 同时包含时间特征和频率特征的音频特征的维度为,为通道维度;对融合特征的计算过程如下: ; ; ; ; 其中,为时间依赖性特征;为频率依赖性特征;表示时间特征维度重塑操作;表示频率特征维度重塑操作;表示时域模块的操作;表示频域模块的操作;表示线性投影层的操作;表示交叉注意力特征融合操作;表示融合特征维度重塑操作; 输入的的维度分别通过被重塑为,再将其分别通过时域模块和频域模块分别计算包含时间依赖性和频率依赖性的特征,同时把输入和输出进行残差连接,再经过一个线性层把输出统一到相同的维度,分别得到时间依赖性特征和频率依赖性特征 通过两个线性投影层对时间依赖性特征和频率依赖性特征的维度进行向下调整,将和的维度均重塑为;然后通过交叉注意力模块将时间依赖性特征和频率依赖性特征进行融合,得到特征,维度为,特征不仅包含时间依赖性信息,同时包含频率依赖性信息;把特征通过线性投影层,将维度重新投影到最初的大小,之后将维度重塑到与相同的维度后,再与输入的进行残差连接操作得到最终输出的融合特征; 对融合特征采用三阶段编码器进行渐进式下采样处理;其中,第一阶段中,对融合特征采用分组多头自注意力机制沿时间维度进行分组,每组单独计算注意力; 对三阶段编码器的输出特征进行解码得到字符概率分布,并以此得到语音识别结果。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人山东大学,其通讯地址为:250101 山东省济南市高新区舜华路1500号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。