浪潮电子信息产业股份有限公司乔伟旭获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉浪潮电子信息产业股份有限公司申请的专利一种文本筛选方法、装置、电子设备及存储介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN118657192B 。
龙图腾网通过国家知识产权局官网在2025-12-12发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202410705644.4,技术领域涉及:G06F18/213;该发明授权一种文本筛选方法、装置、电子设备及存储介质是由乔伟旭;陈曦;吴韶华设计研发完成,并于2024-05-31向国家知识产权局提交的专利申请。
本一种文本筛选方法、装置、电子设备及存储介质在说明书摘要公布了:本发明提供一种文本筛选方法、装置、电子设备及存储介质,涉及机器学习领域,可设置多个指导模型和一个门控单元,其中各指导模型均嵌入有对应预设评价维度的先验知识;而门控单元学习有先前已筛选的训练文本在下游模型训练任务中的历史表现,并可基于这一历史表现为输入文本生成各指导模型对应的权重值;进而可将待筛选的原始文本输入指导模型得到该原始文本生成对应的评价值,以及可将该原始文本输入门控单元得到各指导模型生成的权重值,进而可利用所有权重值对所有评价值进行加权求和处理得到各原始文本的筛选值,并根据筛选值对原始文本进行筛选,可避免人工筛选将导致的数据分布不均衡和覆盖面不够广的问题。
本发明授权一种文本筛选方法、装置、电子设备及存储介质在权利要求书中公布了:1.一种文本筛选方法,其特征在于,包括: 获取待筛选的原始文本; 将所述原始文本输入多个指导模型,得到各所述指导模型为所述原始文本输出的评价值;其中,所述指导模型属于机器学习模型,不同的指导模型已嵌入不同预设评价维度的先验知识,所述指导模型根据所述先验知识确定所述原始文本对应的评价值; 将所述原始文本输入门控单元,得到所述门控单元为各所述指导模型输出的权重值;其中,所述门控单元属于机器学习模型,所述门控单元根据所述原始文本和先前筛选出的训练文本在模型训练任务中的历史表现确定所述权重值; 利用所有所述权重值对所有所述评价值进行加权求和处理,得到各所述原始文本的筛选值,并根据所述筛选值对所述原始文本进行筛选,得到用于执行所述模型训练任务的训练文本; 所述指导模型按照数据流向依次包括编码层、第一转换解码器、全连接层和第一归一化层,所述第一转换解码器包含多个串联的转换解码器单元,所述第一转换解码器中嵌入有所述先验知识; 所述将所述原始文本输入多个指导模型,得到各所述指导模型为所述原始文本输出的评价值,包括: 将所述原始文本输入所述编码层进行位置编码,得到文本嵌入向量; 将所述文本嵌入向量输入所述第一转换解码器,以使所述第一转换解码器根据所述先验知识对所述文本嵌入向量进行特征提取,得到特征提取向量; 将所述特征提取向量输入所述全连接层进行特征转换,得到特征转换向量; 将所述特征转换向量输入所述第一归一化层进行归一化处理,得到所述评价值。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人浪潮电子信息产业股份有限公司,其通讯地址为:250000 山东省济南市高新区草山岭南路801号9层东侧;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励