东南大学吴桦获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉东南大学申请的专利一种基于URL多角度特征的钓鱼网站检测方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115766212B 。
龙图腾网通过国家知识产权局官网在2025-09-05发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202211422976.9,技术领域涉及:H04L9/40;该发明授权一种基于URL多角度特征的钓鱼网站检测方法是由吴桦;刘世越;程光设计研发完成,并于2022-11-14向国家知识产权局提交的专利申请。
本一种基于URL多角度特征的钓鱼网站检测方法在说明书摘要公布了:本发明公开了一种基于URL多角度特征的钓鱼网站检测方法,属于信息安全技术领域。所述方法首先捕获网页对应的实际URL作为待测URL,然后对待测URL分解获得各组件信息;之后对URL及组件进行预处理,包括使用文本分解算法获得token和分词列表,使用文本可读性检测算法计算token可读性权值;从完整URL、各组件以及预处理结果提取成分特征和语言特征作为待测URL的特征;最后将URL特征输入训练好的机器学习分类器进行合法性判断。与基于列表的方法相比,所述方法可以检测没有出现过的URL;与基于视觉相似性和内容的方法相比,所述方法无需等待页面加载,具有较高实时性;与基于URL的同类方法相比,所述方法占用资源较少,特征丰富,泛化能力更强。
本发明授权一种基于URL多角度特征的钓鱼网站检测方法在权利要求书中公布了:1.一种基于URL多角度特征的钓鱼网站检测方法,其特征在于,该方法包括以下步骤: 步骤(1)捕获目标网站的实际URL,作为待测URL; 步骤(2)将待测URL分解,获得URL的方案、权限、路径、参数、查询、锚点组件; 步骤(3)对URL及其组件提取成分特征和语言特征,获得URL特征; 步骤(4)将URL特征输入机器学习检测模型,判断URL的合法性; 其中,所述步骤(3)对URL及各组件提取的成分特征包括: (3.1.1)URL的成分特征:URL的长度、HTTPS的使用、非常见组件的数量、URL可疑符号的数量、URL中数字的数量、双斜线的使用、URL符号化token的数量; (3.1.2)主机名的成分特征:域名的长度、子域名的数量、IP地址的使用、“-”的数量、子域名中顶级域名的使用、缩短服务的使用、域名中数字的数量; (3.1.3)路径的成分特征:路径的长度、路径的深度、路径中可疑符号的数量、路径中顶级域名的使用、路径中token的最大长度、文件扩展名的使用; (3.1.4)查询的成分特征:查询的长度、查询中数字的数量、查询的数量; 其中,语言特征包括:敏感词汇的数量、元音字母的数量、唯一字符的数量、子域名的离散度、域名中短token的数量、二级域名的可读性、子域名中token可读性的最大值;路径的语言特征包括:路径的离散度、路径中短token的数量、路径中不可读token的数量。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人东南大学,其通讯地址为:210096 江苏省南京市玄武区四牌楼2号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。