浙江大学杨洋获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉浙江大学申请的专利基于语义切分的法律文书自动摘要方法和系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN116894088B 。
龙图腾网通过国家知识产权局官网在2025-11-25发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202310880337.5,技术领域涉及:G06F16/34;该发明授权基于语义切分的法律文书自动摘要方法和系统是由杨洋;王惠娟设计研发完成,并于2023-07-18向国家知识产权局提交的专利申请。
本基于语义切分的法律文书自动摘要方法和系统在说明书摘要公布了:本发明公开了一种基于语义切分的法律文书自动摘要方法和系统,属于自然语言处理领域。本发明获取民事一审裁判文书作为输入,使用连续句子分类的方法,对裁判文书进行语义切分,将裁判文书划分为争议类别,原告诉求,被告陈述,事实与理由,裁判依据、裁判主文与尾部共五个部分的文本段落;对切分后的每个文本段落分别使用生成式文本摘要的方法得到摘要;对于同一裁判文书的各切分后段落生成的摘要,按顺序拼接得到最终结果。本发明对法律文书进行自动摘要,使用语义切分的方法,缩短了单次输入生成摘要模型的文本长度,并能够保留完整的原文语义结构特征。
本发明授权基于语义切分的法律文书自动摘要方法和系统在权利要求书中公布了:1.一种基于语义切分的法律文书自动摘要方法,其特征在于,包括: 获取法律文书,基于连续句子分类的方法,对裁判文书进行语义切分,将裁判文书划分为争议类别,原告诉求,被告陈述,事实与理由,以及裁判依据、裁判主文与尾部共五个语义结构的语义段落,分别用连续升序数字对五个语义结构进行编号; 对切分后的每个语义段落分别基于生成式文本摘要的方法得到摘要; 将同一法律文书切分后的各文本段落生成的摘要按顺序拼接得到最终结果; 所述的基于连续句子分类的方法,包括:根据标点符号将法律文书划分为多个句子并按照顺序排列;基于Bert预训练语言模型获取每一个句子表征,根据表征结果对句子进行分类,得到预测类别序列;对不符合语义结构顺序的分类结果进行修正;将所有划分为同一类的句子按顺序聚合起来,得到不同语义结构的语义段落; 所述的对不符合语义结构顺序的分类结果进行修正,包括: 判断预测类别序列是否递增,若是,则符合语义结构顺序;若不是,则根据异常类别的前后若干个类别情况,对异常类修正为连续升序数字更多的类别,若有2种及以上类别连续升序数字一样多,则修正为整体概率更大的类别上; 所述的整体概率的计算方法为:对于连续升序数字一样多的2种及以上类别,计算每个类别概率的乘积,得到该类别下的整体概率。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人浙江大学,其通讯地址为:310058 浙江省杭州市西湖区余杭塘路866号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励