苏州大学汪磊获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉苏州大学申请的专利基于深度学习的手机端面部动作恢复语音方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119649813B 。
龙图腾网通过国家知识产权局官网在2025-09-05发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510171203.5,技术领域涉及:G10L15/24;该发明授权基于深度学习的手机端面部动作恢复语音方法及系统是由汪磊;彭程;王令设计研发完成,并于2025-02-17向国家知识产权局提交的专利申请。
本基于深度学习的手机端面部动作恢复语音方法及系统在说明书摘要公布了:本发明提供一种基于深度学习的手机端面部动作恢复语音方法及系统,涉及语音处理技术领域,该方法包括调用手机加速度传感器实时同步采集面部加速度与语音数据并传输至电脑;在电脑端接收、对齐、存储数据并去噪以增强信噪比;构建模型,先由U‑Net模型将加速度信号转成4khz采样率的语音信号,再经SR‑model超分模型生成16khz采样率的语音信号;把处理后的面部加速度信号输入训练好的深度学习模型,生成语音并按需传出。本发明有效解决现有问题,实现从面部动作到语音的恢复,具有良好应用前景。
本发明授权基于深度学习的手机端面部动作恢复语音方法及系统在权利要求书中公布了:1.一种基于深度学习的手机端面部动作恢复语音方法,其特征在于,包括: S1:调用手机加速度传感器并设定采样率,实时同步采集使用者面部加速度信号和语音信号,并将信号传输给电脑; S2:在电脑端接收信号并实时绘制显示,通过时间戳进行加速度信号和语音信号之间时间上的对齐,然后将对齐的信号对保存在本地,并通过设计合适的滤波器算法去除加速度信号中的噪音,增强数据信噪比; S3:构建基于U-Net模型与SR-model超分模型的深度学习模型,所述深度学习模型先通过U-Net模型将输入的处理后的加速度信号恢复为4khz采样率的语音信号,再通过SR-model超分模型将4khz采样率的语音信号转换为16khz采样率的语音信号; S4:在实际使用中,用户打开手机端应用程序,将手机紧贴面部,开始无声说话,将经过数据处理去除噪音的用户无声说话时的面部加速度信号输入训练好的深度学习模型,生成对应语音信号并按照用户要求传输出去。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人苏州大学,其通讯地址为:215000 江苏省苏州市吴江区久泳西路1号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。