中北大学雷海卫获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉中北大学申请的专利一种基于SBERT的中文专利IPC分类方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115758244B 。
龙图腾网通过国家知识产权局官网在2026-02-10发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202211445354.8,技术领域涉及:G06F40/211;该发明授权一种基于SBERT的中文专利IPC分类方法是由雷海卫;李帆;武瑞娟;李玲;李雯;呼文秀;李成奇;贾博慧;吴倩设计研发完成,并于2022-11-18向国家知识产权局提交的专利申请。
本一种基于SBERT的中文专利IPC分类方法在说明书摘要公布了:本发明公开一种基于SBERT的中文专利IPC分类方法,包括步骤:语料数据预处理:从专利文本中提取特定字句构成第一路语料数据,从IPC分类表按类别提取可表达对应类的术语描述作为第二路语料数据;语料数据的数据增强处理;文本向量化编码:分别将第一路语料数据和第二路语料数据输入SBERT框架下的第一路BERT预训练模型和第二路BERT预训练模型进行向量化编码,得到专利文本的向量表示;相似度比较:根据计算得到的相似度排名选择分类号。本发明采用具有孪生结构的SBERT作为中文专利自动分类的框架,将专利文本和IPC分类表中的术语描述作为SBERT的两路输入,经BERT向量化编码,由两路向量相近程度来判定专利类别,减少计算量,提升分类准确率,且给出多个相关IPC分类号。
本发明授权一种基于SBERT的中文专利IPC分类方法在权利要求书中公布了:1.一种基于SBERT的中文专利IPC分类方法,其特征在于,包括以下步骤: 语料数据预处理:从专利文本中提取特定字句构成第一路语料数据,从IPC分类表按类别提取可表达对应类的术语描述作为第二路语料数据;所述专利文本是待分类目标专利文本或训练样本,所述训练样本从历史专利文本获取; 对所述语料数据进行数据增强处理,对所述语料数据进行数据增强处理具体为:SBERT的模型训练过程中,采用DropOut方法,把同一文本多次输入BERT预训练模型的方式来实现样本数据的数据增强; 文本向量化编码:分别将经过数据增强处理后的所述第一路语料数据和所述第二路语料数据分别输入SBERT框架下的第一路BERT预训练模型和第二路BERT预训练模型进行向量化编码,得到专利文本的向量表示,其中所述第一路语料数据对应的专利文本的向量表示构成特征集U,所述第二路语料数据对应的专利文本的向量表示构成特征集V; 相似度比较:计算所述特征集U和所述特征集V的相似度值,得到与不同类别术语描述对应的相似度值排名,选择相似度值排第一的术语描述所对应的IPC分类号为主IPC分类号,相似度值排第N的术语描述所对应的IPC分类号为可选用的备选IPC分类号,N>1。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人中北大学,其通讯地址为:030051 山西省太原市学院路3号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励