成都元素科技有限公司黄晨阳获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉成都元素科技有限公司申请的专利基于计算机视觉与大语言模型的课堂分析方法及计算机装置获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119578958B 。
龙图腾网通过国家知识产权局官网在2025-09-26发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411476103.5,技术领域涉及:G06Q10/0639;该发明授权基于计算机视觉与大语言模型的课堂分析方法及计算机装置是由黄晨阳;杨帆设计研发完成,并于2024-10-22向国家知识产权局提交的专利申请。
本基于计算机视觉与大语言模型的课堂分析方法及计算机装置在说明书摘要公布了:本发明涉及课堂结构分析领域,具体涉及一种基于计算机视觉与大语言模型的课堂分析方法及计算机装置,提高了课堂分析的效率和准确性。方案包括:多维度信息生成,处理用户输入的教学视频、教案及科目信息,通过SCB模型检测师生行为,提取板书图像并转化为结构化数据,转换语音内容为文字;提示词生成,将多维度信息包含的行为时间段、板书时间段、转录内容、教案及科目信息整合生成提示词,将提示词输入大语言模型得到课堂结构内容,依据预审的评价标准对课堂结构内容进行审查,根据审查结果提出对应的改进意见。本发明适用于课堂结构分析。
本发明授权基于计算机视觉与大语言模型的课堂分析方法及计算机装置在权利要求书中公布了:1.基于计算机视觉与大语言模型的课堂分析方法,其特征在于,包括: S1、多维度信息生成; 用户输入教学视频、教案及科目; 对教学视频中的课堂场景数据进行标注,使用标注后的课堂场景数据对YOLOv7模型进行训练,再通过训练好的YOLOv7模型对教学视频进行检测,将每一帧的行为检测信息存储到行为表中,所述行为表包含行为信息以及出现该行为的数量信息,每个行为的时间长度为一个视频的长度,所述行为包括个体行为与群体行为,个体行为的数量大于等于1,个体行为的数量代表有多少学生存在这个行为,群体行为的数量只有0或者1,0代表群体没有这个行为,1代表群体有这个行为; 提取教学视频中的板书图片输入至视觉大模型中,获取板书的结构化数据; 通过paraformer模型提取教学视频中的语音内容,通过语音转录模型将语音内容转换为教师与学生的文字内容; 行为时间段、板书时间段、转录内容、教案及科目信息即为多维度信息; S2、根据多维度信息生成提示词; 将行为时间段、板书时间段、转录内容、教案及科目信息整合,生成指导大语言模型的提示词,具体包括: 以语音转录模型转换内容为基础时间线,将行为时间段和板书时间段上对应的内容填充到视语音转录模型转换内容的时间线上,形成多列时间线数据,包括开始时间、结束时间、文字内容、发言人、行为以及板书; 根据所述多列时间线数据生成指导大语言模型的提示词,将提示词输入大语言模型,输出课堂结构内容; S3、依据预审的评价标准对课堂结构内容进行审查; 所述评价标准包括: 课堂结构时间线的完整性,且整个时间段需要大于40分钟; 课堂被分解为多个教学环节,总的教学环节不低于8个,每个教学环节的时间不低于1分钟; 教学环节、教学内容、教学方式根据行为与板书内容来做适当调整; S4、根据审查结果提出对应的改进意见; 所述改进意见包括: 在多个教学环节中任选两个教学环节,在所选的两个教学环境中增加学生写字和学生读书的行为时间段。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人成都元素科技有限公司,其通讯地址为:610000 四川省成都市武侯区武兴五路433号2栋7层2号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。
请提出您的宝贵建议,有机会获取IP积分或其他奖励