华南农业大学李康顺获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉华南农业大学申请的专利基于XGBOOST算法的英语文本智能聚类评分方法及装置获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN118093869B 。
龙图腾网通过国家知识产权局官网在2025-09-19发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202410200118.2,技术领域涉及:G06F16/35;该发明授权基于XGBOOST算法的英语文本智能聚类评分方法及装置是由李康顺;曾照莲;姚婉仪;雷加伟;曾嘉;文培桦;陈菲云设计研发完成,并于2024-02-23向国家知识产权局提交的专利申请。
本基于XGBOOST算法的英语文本智能聚类评分方法及装置在说明书摘要公布了:本发明公开了一种基于XGBOOST算法的英语文本智能聚类评分方法及装置,方法包括:对原始英文文本数据进行数据预处理,运用N‑最短路径算法与停用词表对特征词进行提取;粗筛选:按一定比例,删去文本中频率特别高和频率特别低的特征词,形成特征词子集;再筛选:利用改进的粒子群优化算法,对特征进行再选择,并通过解码得到最终的特征子集;利用聚类模块对最终的特征子集进行聚类,根据自回归条件期望值选取簇,当簇达到指定数量后输出聚类结果,经过训练后,利用训练好的基于XGBOOST英文文本智能聚类评分模型中,根据聚类结果对输入的文本进行评估。本发明能够通过降低英文文本特征维度,提高系统的全局搜索能力和收敛速度,大大加快文本聚类的速度。
本发明授权基于XGBOOST算法的英语文本智能聚类评分方法及装置在权利要求书中公布了:1.基于XGBOOST算法的英语文本智能聚类评分方法,其特征在于,包括下述步骤: 对原始英文文本数据进行单词分词处理,筛选停用词,获取文本特征词集; 计算文本特征词集的文档频率,按照设定比例与文档频率进行粗选择,形成特征词子集; 构建基于XGBOOST英文文本智能聚类评分模型,模型包括TF-IDF算法模块、改进的粒子群优化模块和聚类模块;利用TF-IDF算法模块将特征词子集转换形成文本向量,选取所需要的特征词,计算特征值权重,遍历各个文本向量,根据所选特征词进行编码;利用改进的粒子群优化模块迭代计算特征词的适应值,根据特征值权重对特征词进行择优,选择适应值最优且全局最优的特征词,解码后获取最终的特征子集; 利用聚类模块对最终的特征子集进行聚类,根据自回归条件期望值选取簇,当簇达到指定数量后输出聚类结果;经过多次训练后,获取训练好的基于XGBOOST英文文本智能聚类评分模型; 将待评分文本输入训练好的基于XGBOOST英文文本智能聚类评分模型中,根据聚类结果对输入的文本进行评估。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人华南农业大学,其通讯地址为:510642 广东省广州市天河区五山路483号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励