浙江大学金伟获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉浙江大学申请的专利一种基于变分自动编码器的深度多实例学习文本分类方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119513307B 。
龙图腾网通过国家知识产权局官网在2025-10-17发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411468510.1,技术领域涉及:G06F16/35;该发明授权一种基于变分自动编码器的深度多实例学习文本分类方法是由金伟;王荣耀;于丙文设计研发完成,并于2024-10-21向国家知识产权局提交的专利申请。
本一种基于变分自动编码器的深度多实例学习文本分类方法在说明书摘要公布了:本发明公开了一种基于变分自动编码器的深度多实例学习文本分类方法,包括:首先对文本进行特征提取和归一化,变分自动编码器提取包中实例的嵌入特征,使用Dropout层和注意力网络得到各个实例权重,将包中实例加权和作为包嵌入表示,将包嵌入输入线性神经网络以及并进行归一化后得到包预测结果,建立损失函数对网络进行训练,使用待分类文本和训练后的网络完成文本分类。本发明通过引入变分自动编码器,使得网络可以充分挖掘隐藏在未标记示例中的信息,提取平滑、连续的实例嵌入,从而提高模型鲁棒性、避免过拟合,并提高文本分类的准确性。
本发明授权一种基于变分自动编码器的深度多实例学习文本分类方法在权利要求书中公布了:1.一种基于变分自动编码器的深度多实例学习文本分类方法,其特征在于,包括以下步骤: 步骤1:将文档视为包,其中的每个句子或段落视为实例,通过特征提取方式对文本进行预处理; 步骤2:对数据集进行归一化处理; 步骤3:构建多实例学习文本分类学习网络,包括:变分自动编码器提取包中实例的嵌入特征,使用Dropout层和注意力网络得到各个实例权重,将包中实例加权和作为包嵌入表示,将包嵌入输入线性神经网络以及并进行归一化后得到包预测结果, 步骤4:建立损失函数,计算变分自动编码器的重构损失以及包预测结果与真值之间的损失,并通过优化算法最小化损失函数对变分自动编码器、注意力机制以及多层线性神经网络的权重参数进行更新,直至收敛;所述变分自动编码器由编码器、隐变量层和解码器组成,编码器编码得到隐变量,隐变量解码得到重构实例向量,具体如下: 所述编码器由三个全连接层组成,前两层分别有256个和128个神经元,两层均采用ReLU激活函数;第三层具有两个分支,各有64个神经元,分别输出隐变量的均值和标准差; 所述隐变量通过重新参数化获得,计算公式如下: ; 其中,为实例所对应的隐变量,和分别对应其均值和标准差,表示元素之间的乘积,为服从于标准正态分布的辅助噪声变量; 解码器由三个全连接层组成,分别为64、128和256个神经元,前两层均采用ReLU激活函数,第三层直接输出重构向量; 步骤5:将需要文档分类的文档进行预处理和归一化后输入至训练好的多实例学习文本分类学习网络中,得到文本分类结果。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人浙江大学,其通讯地址为:310058 浙江省杭州市西湖区余杭塘路866号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励