- 1、本文档共27页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
基于HTTP话会过程跟踪网页挂马攻击检测方法
2012年网络安全年会;*;原理
网页挂马攻击也称为“浏览即下载”(drive-by download attack)
指攻击者利用网站、客户端浏览器与web应用程序的漏洞(SQL注入,网站敏感文件扫描,服务器漏洞,网站程序0day等),向目标页面或内嵌对象中植入恶意的HTML脚本代码,在用户访问网页的过程中将恶意程序(malware binaries)自动植入用户系统。
主要特点
取回模式(pull-style),不同于病毒蠕虫的推送模式(push-style)。; 网页挂马攻击;A CASE STUDY; 互联网安全现状—挂马攻击的危害与泛滥性(Symantec)
每年感染上百万的互联网主机,是僵尸网络bot的主要感染方式
数量排名前五的恶意网站类型
博客、个人网站、商务/经济、
购物、教育
;基于高交互虚拟蜜罐系统
利用虚拟系统对访问网页后的系统动态行为与状态进行监测
无误检率
互联网大规模网页扫描,检测时效有一定滞后性
基于网页代码特征匹配
将恶意脚本代码视为脚本病毒,通过已知特征码匹配进行判定
恶意脚本变种灵活、采用混淆变形技术与加密技术,难以检测
提出一种新型检测方法
HTTP会话过程跟踪的网页挂马攻击检测方法;*;检测模型结构图 ;实验数据集;域名相关特征
白名单
站点IP地址分布
域名词汇特征
引用不同类别外部域名特征
域名段数特征
HTTP头部相关特征
重定向链接层数
不同类型文件的请求数量
不同User-Agent信息域的数量
不完整头部信息域的请求数量;1、白名单
正常网页所引用的外部对象大多由知名站点提供
恶意程序分发站点一般都是由黑客直接管理并不对外提供正常的web服务
白名单:频繁被引用的网页域名集(本文取引用频次100);3、域名词汇特征
正常网站的域名一般都是基于自然语言的,从而方便宣传与用户记忆
恶意服务器的域名一般具有生存期短的特点,并使用一些偏离正常构词方法构造的域名;4、引用不同类别外部域名特征
各类网页所引用的外部域大部分都属于com与net域,并且一般情况下多引用同类型站点的内容,基本不会引用其他类型站点的内容。
比如:教育类(edu)网页除了引用com与edu类站点(共占92%)内容外,基本不会引用其他类型站点的内容。 ;5、域名段数特征
正??网站一般使用多个子域名来区分不同的服务器并对外提供服务,如、,因此其域名段数基本都在3段以上
恶意站点一般直接使用注册的二级域名对外提供服务,如、;1、重定向链接层数;正常网页与挂马网页HTTP会话的重定向链接层数(下图);2、不同类型文件的请求数量
将在网页会话过程中到可疑外部域(白名单外)的13种常见类型文件的请求数量作为特征
比如:约94.3%的正常网页没有引用可疑外部域的html文件,而约96%的挂马网页引用多于2个的html文件; ;3、不完整头部信息域的请求数量
Accept-Language、Accept-Encoding与Referer三个头部信息域,将网页会话中缺少这三个信息域的请求数量作为特征
WebClean:1.24%;WebMalware:55.3%
4、不同User-Agent信息域的数量
正常网页会话过程中的请求一般具有相同的User-Agent信息域
恶意程序会使用不同于浏览器正常默认的请求头部域信息
两个以上不同User-Agent头部域
WebClean:1.1%;WebMalware:36.2%;特征小结;*;C4.5决策树
在模型构建和样本预测过程中都不依赖于样本的分布,该方法能够有效避免样本分布变化所带来的影响,具有良好的分类稳定性;
C4.5决策树处理分类问题具有更高的效率。;分类模型性能
C4.5决策树分类模型在误检率与检测率之间取得了最佳的平衡。
决策树方法根据信息增益来选择最优特征,在保证最低误检率的同时,取得了较高的检测率。
Na?ve Bayes方法依赖训练集样本先验概率分布,然而实际获取的测试集样本分布往往与训练集不同,潜在的分类不稳定性
大规模训练集会给SVM分类模型带来较大数量的支持向量,从而导致模型训练速度与样本分类的速度都较慢;分类检测结果(cont’d);样本分布对分类模型性能影响
分类模型的性能保持稳定
模糊实例(与挂马网页特征相近)影响了模型的分类规则,使得检测率降低;基于HTTP会话过程跟踪的网页挂马攻击检测方法
有效检测挂马网页,较低的误检率
可实时部署于客户端,代价小
无需分析网页代码
存在问题
还需与同类系统进行深入比较分析,改进本方法性能
针对模糊实例,需要进一步研究并发掘新的特征
测试模型的实时检测性能并研究其在线学习算法;
文档评论(0)