基于HTTP话会过程跟踪网页挂马攻击检测方法.ppt

基于HTTP话会过程跟踪网页挂马攻击检测方法.ppt

  1. 1、本文档共27页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
基于HTTP话会过程跟踪网页挂马攻击检测方法

2012年网络安全年会;*;原理 网页挂马攻击也称为“浏览即下载”(drive-by download attack) 指攻击者利用网站、客户端浏览器与web应用程序的漏洞(SQL注入,网站敏感文件扫描,服务器漏洞,网站程序0day等),向目标页面或内嵌对象中植入恶意的HTML脚本代码,在用户访问网页的过程中将恶意程序(malware binaries)自动植入用户系统。 主要特点 取回模式(pull-style),不同于病毒蠕虫的推送模式(push-style)。; 网页挂马攻击;A CASE STUDY; 互联网安全现状—挂马攻击的危害与泛滥性(Symantec) 每年感染上百万的互联网主机,是僵尸网络bot的主要感染方式 数量排名前五的恶意网站类型 博客、个人网站、商务/经济、 购物、教育 ;基于高交互虚拟蜜罐系统 利用虚拟系统对访问网页后的系统动态行为与状态进行监测 无误检率 互联网大规模网页扫描,检测时效有一定滞后性 基于网页代码特征匹配 将恶意脚本代码视为脚本病毒,通过已知特征码匹配进行判定 恶意脚本变种灵活、采用混淆变形技术与加密技术,难以检测 提出一种新型检测方法 HTTP会话过程跟踪的网页挂马攻击检测方法;*;检测模型结构图 ;实验数据集;域名相关特征 白名单 站点IP地址分布 域名词汇特征 引用不同类别外部域名特征 域名段数特征 HTTP头部相关特征 重定向链接层数 不同类型文件的请求数量 不同User-Agent信息域的数量 不完整头部信息域的请求数量;1、白名单 正常网页所引用的外部对象大多由知名站点提供 恶意程序分发站点一般都是由黑客直接管理并不对外提供正常的web服务 白名单:频繁被引用的网页域名集(本文取引用频次100);3、域名词汇特征 正常网站的域名一般都是基于自然语言的,从而方便宣传与用户记忆 恶意服务器的域名一般具有生存期短的特点,并使用一些偏离正常构词方法构造的域名;4、引用不同类别外部域名特征 各类网页所引用的外部域大部分都属于com与net域,并且一般情况下多引用同类型站点的内容,基本不会引用其他类型站点的内容。 比如:教育类(edu)网页除了引用com与edu类站点(共占92%)内容外,基本不会引用其他类型站点的内容。 ;5、域名段数特征 正??网站一般使用多个子域名来区分不同的服务器并对外提供服务,如、,因此其域名段数基本都在3段以上 恶意站点一般直接使用注册的二级域名对外提供服务,如、;1、重定向链接层数;正常网页与挂马网页HTTP会话的重定向链接层数(下图);2、不同类型文件的请求数量 将在网页会话过程中到可疑外部域(白名单外)的13种常见类型文件的请求数量作为特征 比如:约94.3%的正常网页没有引用可疑外部域的html文件,而约96%的挂马网页引用多于2个的html文件; ;3、不完整头部信息域的请求数量 Accept-Language、Accept-Encoding与Referer三个头部信息域,将网页会话中缺少这三个信息域的请求数量作为特征 WebClean:1.24%;WebMalware:55.3% 4、不同User-Agent信息域的数量 正常网页会话过程中的请求一般具有相同的User-Agent信息域 恶意程序会使用不同于浏览器正常默认的请求头部域信息 两个以上不同User-Agent头部域 WebClean:1.1%;WebMalware:36.2%;特征小结;*;C4.5决策树 在模型构建和样本预测过程中都不依赖于样本的分布,该方法能够有效避免样本分布变化所带来的影响,具有良好的分类稳定性; C4.5决策树处理分类问题具有更高的效率。;分类模型性能 C4.5决策树分类模型在误检率与检测率之间取得了最佳的平衡。 决策树方法根据信息增益来选择最优特征,在保证最低误检率的同时,取得了较高的检测率。 Na?ve Bayes方法依赖训练集样本先验概率分布,然而实际获取的测试集样本分布往往与训练集不同,潜在的分类不稳定性 大规模训练集会给SVM分类模型带来较大数量的支持向量,从而导致模型训练速度与样本分类的速度都较慢;分类检测结果(cont’d);样本分布对分类模型性能影响 分类模型的性能保持稳定 模糊实例(与挂马网页特征相近)影响了模型的分类规则,使得检测率降低;基于HTTP会话过程跟踪的网页挂马攻击检测方法 有效检测挂马网页,较低的误检率 可实时部署于客户端,代价小 无需分析网页代码 存在问题 还需与同类系统进行深入比较分析,改进本方法性能 针对模糊实例,需要进一步研究并发掘新的特征 测试模型的实时检测性能并研究其在线学习算法;

文档评论(0)

junjun37473 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档