基于机器学习的智能入侵检测系统.ppt

下载文档 降价啦

173
0
约3.08千字
约 10页
2018-05-02 发布于湖北
举报
版权申诉
保障服务

基于机器学习的智能入侵检测系统.ppt

1、本文档共10页，可阅读全部内容。
2、有哪些信誉好的足球投注网站（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

基于机器学习的智能入侵检测系统

基于机器学习的智能入侵检测系统姓名: 学号： 1 2 目录入侵检测系统简介机器学习核心算法 3 基于机器学习的智能入侵检测系统 1 入侵检测系统简介入侵检测系统 ( Intrusion Detection System, IDS) 指入侵检测过程中所需要配置的各种软硬件的组合, 它通过对信息系统的运行状态进行实时监测, 发现各种攻击企图、攻击行为或攻击结果并作出响应, 以保证系统资源的机密性、完整性和可用性。它的主要功能有: 监控、分析用户和系统的活动; 检查系统的配置和漏洞; 评估系统关键资源和数据的完整性; 识别已知的攻击行为、统计分析异常行为; 对操作系统进行日志管理; 识别违反安全策略的用户活动; 响应入侵事件等。 1 入侵检测系统简介图 1 通用入侵检测系统配置系统库攻击模式库入侵检测器响应措施数据采集安全控制器系统（工作站、服务器、防护墙、网段等）审计记录协议数据系统操作报警数据采集模块: 为入侵分析引擎提原始数据 (如操作系统的审计日志应用程序的运行日志和网络数据包等 )。入侵分析引擎: 对数据进行分析, 判断是否属于入侵行为并作出响应。应急处理模块: 发生入侵后启用紧急措施 (如关闭网络服务、中断网络连接、启动备份系统等 )。管理配置模块: 为其他模块提供配置服务, 是入侵检测系统与用户的接口。 2 机器学习的核心算法机器学习算法有很多, 本文从应用的角度出发, 主要介绍近邻法、k - 近邻法。近邻法是机器学习分类算法中比较常用的一种方法; k - 近邻法是基于统计的分类方法, 是非参数分类的一种重要方法，这两种方法是本文提出的智能入侵检测系统的核心算法。 2.1 近邻法假设有 c个类别的模式识别问题, 每类有标明的样本 Ni个, i = 1, 2,...c。定义类判别函数为: 其中, 的角标 i表示类, k表示类 Ni个样本中的第 k 个。式表示 x 与的欧氏距离, 取欧氏距离为: 决策规则为: 对于未知样本 x, 只要比较 x 与个已知类别的样本之间的欧氏距离, 就可判定 x 与离它最近的样本同类。 (1) (2) (3) 对于处于参考样本描述空间边缘或处于两个参考样本描述空间之间的待检样本 , 若直接用欧氏距离判定其属性 , 则检测结果存在一定偶然性, 因此 , 引入 k - 近邻法来提高检测的准确性。 2.1 近邻法 2.2 K-近邻法 k - 近邻法就是取未知样本 x 的 k个近邻, 并逐一测试这 k 个近邻中的多数属于哪一类, 就把 x归为哪一类。具体为: 假设这 N 个样本中, 来自类的实例有个,来自类的样本有个, ..., 来自类的样本有个,若分别是 k 个近邻中属于类的样本数, 定义判别函数为: 入侵检测时, 对于一个未知样本 x, 计算它与两个样本集 (正常 /异常行为样本集 ) 中所有样本的欧氏距离,提取距它最近的 k 个, 假如其中有个属正常行为样本, 个属异常行为样本, 若 , 则该对象行为正常, 反之, 则异常。为避免的情况出现, k需取奇数。决策规则为: (4) (5) 3 基于模式识别的智能入侵检测系统根据入侵检测的基本原理, 结合机器学习的技术和思想, 设计了基于机器学习的智能入侵检测系统。其机制是: 采用近邻法进行一次检测; 若无法得到理想的结果, 则改用 k - 近邻法进行二次检测。在保证检测准确率的基础上, 使系统具有一定的检测未知入侵的能力。 3 .1系统模型设计本系统采用模块化设计, 主要包括数据采集模块,特征提取模块, 规则处理模块, 分析检测模块和异常响应模块等。如图 3所示。各模块的功能如下: 数据采集模块: 实时采集网络原始数据, 并按不同的协议进行解码, 再对解码后的信息进行分片重组、流重组及代码转换等处理, 还原数据包的原始含义和数据包之间的关系。特征提取模块: 对数据采集模块采集到的数据进行特征选择, 然后对信息进行向量化, 生成待检测样本。规则处理模块: 进行规则集的向量化和聚类工作。首先按条读入规则, 对每条规则进行向量化处理, 得到一个规