Document
拖动滑块完成拼图
个人中心

预订订单
服务订单
发布专利 发布成果 人才入驻 发布商标 发布需求

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 南京普塔科技有限公司张露获国家专利权

南京普塔科技有限公司张露获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉南京普塔科技有限公司申请的专利一种用于汽车座舱控制的智能语音互联方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120048262B

龙图腾网通过国家知识产权局官网在2025-08-01发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510496272.3,技术领域涉及:G10L15/22;该发明授权一种用于汽车座舱控制的智能语音互联方法是由张露设计研发完成,并于2025-04-21向国家知识产权局提交的专利申请。

一种用于汽车座舱控制的智能语音互联方法在说明书摘要公布了:本发明公开了一种用于汽车座舱控制的智能语音互联方法,涉及智能语音技术领域,包括:对数字信号进行去噪、回声消除和语音增强处理;利用线性预测倒谱系数算法提取数字信号中的语音特征;基于声学模型对数字信号进行解码,将输入的语音特征映射到相应的音素或单词上;对文本内容进行词法分析;基于对话历史的模糊指令解析,对文本内容进行句法分析和语义分析处理;解析具体指令和操作,将自然语言理解结果转化为车辆控制指令;通过语音合成技术将相关信息或结果反馈给用户。通过对文本内容进行词法分析、句法分析和语义分析处理,解析出用户的意图和需求,增强用户与汽车之间的交互体验,提高系统的可用性和可靠性。

本发明授权一种用于汽车座舱控制的智能语音互联方法在权利要求书中公布了:1.一种用于汽车座舱控制的智能语音互联方法,其特征在于,包括: 通过汽车座舱麦克风阵列技术捕捉用户的语音信号,并将其转换为数字信号,智能语音互联系统对数字信号进行去噪、回声消除和语音增强处理; 经过预处理后的数字信号输入特征提取模块,利用线性预测倒谱系数算法提取数字信号中的语音特征; 将提取出的语音特征输入到语音识别模型中,基于声学模型对数字信号进行解码,将输入的语音特征映射到相应的音素或单词上,并利用词典提供的单词到文本的映射关系,输出对应的文本内容; 将文本内容输入自然语言理解模块,并对文本内容进行词法分析,将文本拆分成单词和短语,并确定其词性; 基于对话历史的模糊指令解析,对文本内容进行句法分析和语义分析处理,分析单词和短语之间的语法关系并解析用户意图和需求; 智能语音互联系统基于用户的意图和需求,解析具体指令和操作,将自然语言理解结果转化为车辆控制指令; 在执行指令的过程中及执行完毕后,智能语音互联系统通过语音合成技术将相关信息或结果反馈给用户; 所述通过汽车座舱麦克风阵列技术捕捉用户的语音信号,并将其转换为数字信号,智能语音互联系统对数字信号进行去噪、回声消除和语音增强处理具体包括: 采用分布式麦克风阵列,并基于声源频率与阵列孔径的匹配,设计麦克风的间距; 通过硬件高通滤波器抑制低频路噪和发动机谐波干扰,并基于信号饱和度,动态调整麦克风增益; 通过现场可编程门阵列实现至少一个麦克风通道的时域对齐,将数据传输至主处理器,采用环形缓冲区管理实时数据流; 利用导航音频作为参考信号构建回声路径模型,并通过自适应算法进行回声消除处理; 基于噪声谱估计,区分语音段与非语音段,采用维纳滤波在频域对噪声成分进行衰减,保留语音段的谐波结构; 计算各麦克风间时延差,对齐信号后进行加权叠加,并增强目标方向信号,结合到达方向估计定位说话人位置,优化波束指向; 检测语音基频并提升共振峰能量,提高数字信号的清晰度; 所述经过预处理后的数字信号输入特征提取模块,利用线性预测倒谱系数算法提取数字信号中的语音特征具体包括: 将预处理后的语音信号切割为至少一个短时帧,对每帧信号施加汉明窗函数,平滑信号边缘并减少频谱泄漏; 基于对声道响应的近似估计,利用协方差计算各帧信号的线性预测系数; 将线性预测系数转换为线性预测倒谱系数,通过递归运算将预测系数映射到倒谱域,生成线性预测倒谱向量; 在倒谱域中检测周期性峰值间隔,该间隔对应声门振动周期; 通过获取倒谱域中的峰值点,计算相邻峰值点之间的距离,并输出为数字信号的基音频率; 利用线性预测系数构建传输函数,计算其频率响应曲线,在幅度谱中获取前三个局部极大值点,并输出幅度谱中前三个局部极大值点对应声道的共振峰; 将线性预测倒谱系数、基音频率和共振峰参数组合成特征向量,形成完整语音特征表示,所述特征向量包括频谱包络信息、激励源特性及声道共振特性; 所述将提取出的语音特征输入到语音识别模型中,基于声学模型对数字信号进行解码,将输入的语音特征映射到相应的音素或单词上,并利用词典提供的单词到文本的映射关系,输出对应的文本内容具体包括: 将提取的语音特征序列输入到训练好的声学模型中,特征序列按帧对齐,保留时间维度信息; 通过空白符和重复合并机制,将帧级输出转换为音素序列; 利用编码器-解码器结构,对齐声学特征与音素序列; 获取音素到单词的映射表并记为词典,对所述词典进行词典约束处理,仅保留能构成有效单词的音素组合; 计算当前音素与语音特征的匹配概率并输出为声学得分; 将声学得分与语言模型得分进行加权融合; 通过A*算法获取全局最优路径,以帧为节点,音素转移为边,边权为总得分构建搜索空间; 设计启发式函数估计从当前节点到终点的最小代价,优先扩展最小代价与实际代价之和最低的节点; 判断是否到达序列终点,若是,则结束全局最优路径搜索,若否,则不作输出; 通过字节对编码的子词单元恢复词典中的未登录词; 获取标点预测模型,输入音素序列和上下文,输出标点位置; 基于文本结构插入大写字母和换行符,生成格式化文本,完成语音到文本的转换。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人南京普塔科技有限公司,其通讯地址为:210046 江苏省南京市南京经济技术开发区兴智路6号兴智科技园B栋第17层1701室;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。