兴业银行股份有限公司;兴业数字金融服务(上海)股份有限公司陈飞获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉兴业银行股份有限公司;兴业数字金融服务(上海)股份有限公司申请的专利面向银行客户投诉标签分类的小样本数据增强方法和系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN116049730B 。
龙图腾网通过国家知识产权局官网在2025-07-29发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202211455144.7,技术领域涉及:G06F18/241;该发明授权面向银行客户投诉标签分类的小样本数据增强方法和系统是由陈飞;王敏;陈升;何平设计研发完成,并于2022-11-21向国家知识产权局提交的专利申请。
本面向银行客户投诉标签分类的小样本数据增强方法和系统在说明书摘要公布了:本发明提供了一种面向银行客户投诉标签分类的小样本数据增强方法和系统,包括:步骤1:建立投诉文本标签体系,对投诉样本进行增强;步骤2:通过深度神经网络模型,进行标签分类和文本样本数据分组;步骤3:对误分类别概率高于预设阈值的投诉文本特征添加噪声;步骤4:利用反向翻译技术对错误分类的投诉样本进行数据增强;步骤5:在样本增强后进行自动校验和辅助校验。本发明利用包含多样化信息的投诉标签文本对原样本的某些词进行替换生成新的可理解的样本,新的小类样本融入了大类标签的特征,保持了核心语义不变,提高了样本生成的质量。
本发明授权面向银行客户投诉标签分类的小样本数据增强方法和系统在权利要求书中公布了:1.一种面向银行客户投诉标签分类的小样本数据增强方法,其特征在于,包括: 步骤1:建立投诉文本标签体系,对投诉样本进行增强; 步骤2:通过深度神经网络模型,进行标签分类和文本样本数据分组; 步骤3:对误分类别概率高于预设阈值的投诉文本特征添加噪声; 步骤4:利用反向翻译技术对错误分类的投诉样本进行数据增强; 步骤5:在样本增强后进行自动校验和辅助校验; 根据投诉文本标签体系,统计训练数据中每个投诉类别的样本量,将样本数量小于阈值的类别归为小类,将样本量最多的5个类归为大类,其余样本不做处理; 对小类投诉分词,基于TF-IDF技术选取每条投诉内容最重要的N个词,基于与类标签的Word2vec距离排序再选取最重要的N个词,固定这2N个词为关键词不变,随机选取其他的词用来自大类投诉样本的内容进行替换; 替换规则为:小类投诉分词后的词数量为M,随机选取a×M数量的非关键词作为被替换词;对大类投诉分词,计算大类分词与小类被替换词的Word2vec距离,选取距离最近的大类分词替换小类被替换词,生成标记为小类的新投诉,其中数量M、N和系数a根据实际效果动态调整,a0.5。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人兴业银行股份有限公司;兴业数字金融服务(上海)股份有限公司,其通讯地址为:350014 福建省福州市台江区江滨中大道398号兴业银行大厦;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。