苏州棱镜七彩信息科技有限公司石澳获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉苏州棱镜七彩信息科技有限公司申请的专利同源代码的溯源方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN113987427B 。
龙图腾网通过国家知识产权局官网在2025-08-05发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202111259702.8,技术领域涉及:G06F21/16;该发明授权同源代码的溯源方法是由石澳;种衍斌;易焕腾;但吉兵;罗峋;梁大功设计研发完成,并于2021-10-28向国家知识产权局提交的专利申请。
本同源代码的溯源方法在说明书摘要公布了:本发明涉及一种同源代码的溯源方法,其包括以下步骤:通过爬虫方式建立标准化漏洞知识库,获取符合规格的开源代码,将开源代码结果预处理后进行存储;构建Neo4j图数据库;进行业务处理。由此,基于源码的内容hash值与目录hash值的图库关联关系,可提高检测速度。解决通过二进制文件与文件碰撞的检测的全量问题,使速度提高10倍以上,从而为进一步的为开源软件供应链安全检测提供引擎支持。通过多维度聚类,可根据计算的结果分数,区分是采用某模块还是它的子类,解决开源项目模块之间的包含关系导致供应链的检测结果不准确问题。能提供更加准确的开源项目与版本,从而能使软件行业安全行业漏洞检测更为准确。
本发明授权同源代码的溯源方法在权利要求书中公布了:1.同源代码的溯源方法,其特征在于包括以下步骤: 步骤一,通过爬虫方式建立标准化漏洞知识库,获取符合规格的开源代码,将开源代码结果预处理后进行存储,处理过程为, a、通过网络爬虫,对源代码托管平台与社区中符合规格的开源代码进行爬取,所述源代码托管平台与社区包含github、gitee、linux,所述规格包含判定星级、分支数; b、通过预处理后将源代码文件所涉及项目的总数值进行存储,所述预处理包括去空格、特殊字符、去掉对检测无帮助的文件,所述总数值包含文件行数、文件个数,通过动态代理、解码、随机爬取绕过反爬虫机制,爬取后的文件存储至本地; 步骤二,构建Neo4j图数据库,处理过程为, a、将开源代码进行遍历,获取其含文件的所有目录并进行提取,提取后的文件内容通过md5方式转换为md5后的hash,对目录进行去重,关联目录与md5后的hash,将目录转换为md5后的hash,将开源项目名称、版本与文件内容集合进行关联,得到hash目录-hash文件内容与项目的集合; b、追加目录至neo4j,保证唯一性,若Neo4j存在此目录,则追加文件内容,若无,则创建此目录; c、追加文件内容,保证唯一性,若neo4j存在此文件,则追加项目节点,若无,则创建此文件节点; d、追加项目节点,保证唯一性,若neo4j存在此项目,则增加与文件关联的关系,若无,则创建此项目节点; 最终构建起目录hash、文件hash、项目与版本相互关联的图数据库,若遇到相同文件属于同一个项目,则进行动态扩张,neo4j增加节点以及关系,形成关系库; 步骤三,进行业务处理,处理过程为, a、读取待检测项目,对其进行遍历,获取其含文件的目录及文件,将其通过md5加密转换为hash值,将其基本信息存入待检测项目任务库,构成mysql业务库; b、Neo4j图数据库中的目录与待检测文件目录进行碰撞,遍历完成后,将项目版本集合中,将相同的项目不同的版本进行分组,并根据权重值,选出最高的项目与版本存入新的项目版本的集合,至mysql库中寻找相应项目版本中的基本信息并进行关联,将结果存入mysql缓存库;将选出的结果与项目匹配的行数、检出率信息存储至mysql业务库; c、通过聚类分组,读取缓存库与任务库的内容,通过双方的文件数以及总行数和文件行数计算检出率、匹配行数进行打分,最后选取同组中最高分的项目作为结果,将结果集返回; 所述基本信息包含文件行数、文件数、总行数;所述碰撞期间,若取得100%的结果,则获取neo4j的目录中的文件hash值,将hash与待检测文件的hash值进行碰撞,若结果一致,则对此文件内容所对应的项目和版本进行权重累加,如果不存在此项目和版本的权重,则创建此项目和版本,存入项目版本集合,若存在,则使得项目和版本作为key的权重值累加; 所述聚类分组为,通过名称相似度、目录相似度、项目下的文件名称的维度进行聚类分组,通过检出率、匹配的行数选择最优的一组数据。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人苏州棱镜七彩信息科技有限公司,其通讯地址为:215000 江苏省苏州市高新区通安镇真北路88号6号楼3楼;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。