北京新数科技有限公司陈传凯获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉北京新数科技有限公司申请的专利一种基于并行排序优化日志采集方法、系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119292870B 。
龙图腾网通过国家知识产权局官网在2026-01-27发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411440809.6,技术领域涉及:G06F11/30;该发明授权一种基于并行排序优化日志采集方法、系统是由陈传凯;王翔宇;张铎设计研发完成,并于2024-10-15向国家知识产权局提交的专利申请。
本一种基于并行排序优化日志采集方法、系统在说明书摘要公布了:本申请提出一种基于并行排序优化日志采集方法及系统,具体包括:1数据采样:从不同日志源头收集日志数据,将日志数据传输到数据处理节点,并使用面向大数据的可扩展正则采样方法,从日志数据中获取代表性样本;2并行排序:将上述代表性样本按照一定规则分配到系统中的多个节点上,在每个节点上利用并行排序算法对日志数据进行排序;3并行写入:将排序好的日志数据代表性样本并行采集到文件系统中;4监控和优化:通过效验文件和检查工具实时监控文件系统的空间利用率,定期检查日志数据的完整性。本发明采用面向大数据的可扩展正则采样方法对日志进行预处理与采样,并且利用并行排序技术对日志数据进行高效收集操作。随后,采样得到的日志样本数据将被分配至多个处理节点,以实现并行的排序操作。本发明通过分散样本存储和处理任务到各个进程进行排序,并对枢轴元素迭代更新,从而提高并行效率,减少因数据分布不均而导致的处理瓶颈,提升日志管理系统的整体性能和可靠性。
本发明授权一种基于并行排序优化日志采集方法、系统在权利要求书中公布了:1.一种基于并行排序优化日志采集方法,其特征在于:具体步骤包括: 1数据采样:数据采样时,从不同日志源头收集日志数据,将日志数据传输到数据处理节点,并使用面向大数据的可扩展正则采样方法,从日志数据中获取代表性样本; 2并行排序:将上述代表性样本按照一定规则分配到系统中的多个节点上,在每个节点上利用并行排序算法对日志数据进行排序; 3并行写入:将排序好的日志数据代表性样本并行采集到文件系统中; 4监控和优化:通过效验文件和检查工具实时监控文件系统的空间利用率,定期检查日志数据的完整性; 步骤1中,给定本地有序数据序列,均匀提取个样本,p为进程数,构建样本集合,为本地有序数据序列大小;i为进程编号;k为遍历需要提取的样本数,自适应值,U为数据均匀度; 采取分布式处理进行采样,每个进程i将其样本集合中的样本发送给进程j,同时从进程j接收样本,进程i与进程𝑗之间进行样本交换,其中,每个进程接收到一个大小为的样本序列;各个进程对接收到的样本序列进行排序,得到有序样本序列;有序样本序列用于确定第i个枢轴元素的候选值,其中第个样本作为第i个枢轴的初始候选值;每个进程确定一个枢轴元素的候选值,组成枢轴序列,用于划分数据序列成p个互不相交的子序列; 获取代表性样本时,收集所有枢轴元素,对排序,计算位移纵向和,其中为进程i到j的位移数组,若,表明枢轴元素符合负载均衡数据分区的第j个枢轴的条件,其中,,为理想位移纵向和,b为偏差率,n为数据总量。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人北京新数科技有限公司,其通讯地址为:100012 北京市朝阳区红军营南路15号院2号楼1层111室;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励