成都华栖云科技有限公司颜涛获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉成都华栖云科技有限公司申请的专利一种对课堂实录文本进行多维总结的方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120319248B 。
龙图腾网通过国家知识产权局官网在2025-09-12发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510795857.5,技术领域涉及:G10L15/26;该发明授权一种对课堂实录文本进行多维总结的方法及系统是由颜涛;张亚敏;袁官锐;蒋文;姜铼设计研发完成,并于2025-06-16向国家知识产权局提交的专利申请。
本一种对课堂实录文本进行多维总结的方法及系统在说明书摘要公布了:本发明提供了一种对课堂实录文本进行多维总结的方法及系统,涉及信息处理技术领域;本发明使用统计学加大模型判断的方式,对整个课堂实录通过课间休息完成对课堂的分割;使用动态上下文窗口计算的方法,确保上下文处于一个合理的区间,每片上下文长度分布均匀;分层总结采用先小片段再由小片段总结大片段的模型,使小模型可以较好适配超长上下文的总结;此外,本发明使用提示词插件化和脚本插件化的方法,每层均具备不同的多个插件,提示词插件以语言大模型为基础输出总结性内容,脚本插件从全局维度输出业务统计结果;基于上述以上关键技术点,可以实现在较小参数规模的语言大模型中,对课堂实录的数据进行分层的多维度总结。
本发明授权一种对课堂实录文本进行多维总结的方法及系统在权利要求书中公布了:1.一种对课堂实录文本进行多维总结的方法,其特征在于,包括: 步骤1:对课堂实录视频进行语音识别得到说话内容,使用VAD对说话内容进行断句并对每一断句进行说话人识别,构造为结构化的说话人语音识别内容; 步骤2:根据说话内容进行课间休息分割; 步骤3:根据课间休息分割结果,将说话内容按课堂节次进行拆分,得到各节次的课堂说话内容; 步骤4:通过说话人语音识别内容调整滑动窗口上下文算法的窗口大小,并将课堂说话内容拆分为多个内容片段;其中,各内容片段之间设置有一级重叠区; 步骤5:开始一级数据总结提取,对各内容片段进行一级提示词提取;其中,每个一级提示词对应设置有一级数据提取提示词插件文件、一级输出结果提示词插件文件和一级重叠区提示词插件文件; 步骤6:检查一级重叠区的数据,使用一级重叠区提示词插件文件对一级重叠区进行二次处理,使得一级重叠区的数据与对应时戳覆盖完成,时戳顺序正确; 步骤7:对各一级提示词按照不同维度时间片段进行展开,得到一级数据总结内容; 步骤8:调整滑动窗口上下文算法的窗口大小,并将一级数据总结内容拆分为多个总结片段;其中,各总结片段之间设置有二级重叠区; 步骤9:开始二级数据总结提取,对各总结片段进行二级提示词提取;其中,每个二级提示词对应设置有二级数据提取提示词插件文件、二级输出结果提示词插件文件和二级重叠区提示词插件文件; 步骤10:检查二级重叠区的数据,使用二级重叠区提示词插件文件对二级重叠区进行二次处理,使得二级重叠区的数据与对应时戳覆盖完成,时戳顺序正确; 步骤11:对各二级提示词按照不同维度时间片段进行展开,得到二级数据总结内容; 步骤12:开始三级数据总结提取,获取二级数据总结内容下各条目所对应原始的说话人语音识别内容,并直接对原始的说话人语音识别内容进行三级提示词提取;其中,每个三级提示词对应设置有提示词文件和格式校对文件; 步骤13:将提取到的一级提示词、二级提示词、三级提示词、一级数据总结内容、二级数据总结内容和各提示词对应设置的文件作为业务输出用于后处理; 在步骤2中,通过如下步骤进行课间休息分割: 建立一个分钟为单位的数组,并根据时戳将对应的说话内容进行按分钟进行字数统计填充;其中,若说话内容为空,则填充为0; 通过数组判断是否连续三个时间点的字数小于特定阈值;若是,则标记数组对应片段为课间休息备选片段,公式如下: 令初始化课间休息区间集合 对于每一个,如果,则: 当且时, ; ; 其中,为时间调整中间变量,wi表示第i分钟的文字数,T是总分钟数; 通过语言大模型对课间休息备选片段进行总结,并在课间休息备选片段的上下浮动获取上下文;其中,备选片段为,,上下各浮动2分钟获取上下文,调整逻辑如下: 给定,令则调整后的片段为;其中,和分别为调整前的开始与结束时间点,和分别为调整后的开始与结束时间点 若识别出现下课语义和上课语义,则标记对应时间段为课间休息时段,并通过课间休息时段进行课间休息分割。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人成都华栖云科技有限公司,其通讯地址为:610000 四川省成都市高新区天府五街200号菁蓉汇4号楼A区9楼;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。