基于内容的电子邮件过滤系统的研究-软件工程专业论文.docxVIP

基于内容的电子邮件过滤系统的研究-软件工程专业论文.docx

  1. 1、本文档共63页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
IV IV 4.2 系统功能 25 4.3 系统设计 26 4.3.1 系统总体设计 26 4.3.2 基于黑名单过滤的设计 27 4.3.3 基于内容过滤的设计 30 4.3.4 贝叶斯算法的改进与实现 33 4.3.5 基于贝叶斯算法邮件分类器的构建 37 4.4 系统的实现 41 4.4.1 实现技术介绍 41 4.4.2 数据库设计 43 4.4.3 系统界面及功能介绍 47 4.5 本章小结 57 第五章 总结与展望 58 致谢 59 参考文献 60 PAGE PAGE 1 第一章 绪论 1.1 研究的背景及意义 随着网络技术的不断发展和应用的普及,信息技术己经渗透到我们社会生活 的各个角落,正以前所未有的速度和范围改变着我们的生活和工作。目前,无论 是我们的生活还是工作,都不可能再离开网络技术,在现今这样一个信息爆炸的 时代,网络所提供的巨大的信息量和查询信息的方便性都带给我们前所未有的冲 击。同时基于网络技术的各种具体应用也不断增加,而在其中电子邮件技术 (E-mail)就是其中应用范围最广、最为人们所熟悉的一种。 所谓电子邮件,就是在遵守一组网络协议的前提下,帮助用户发送信息的一 种技术。用户利用某种机制(可以是客户端软件,也是登录到提供邮件服务的系 统的界面)编写好一封信并提供一个或多个收信人的邮箱地址,电子邮件系统就 可以将邮件发送给收信人。电子邮件的应用非常广泛,除了作为信件交换工具以 外,还可用于传递文件、图形、图像和语音等信息。而且随着电子政务系统和企 业信息化应用的逐步普及,越来越多的单位将电子邮件作为工作人员日常交流信 息的一种工具,比如说企业内部信息的发布,员工与客户间的信息交流,另外员 工也会利用电子邮件进行自己的信息传递工作。 伴随着电子邮件应用的不断普及,随之而来的问题就是垃圾邮件的产生,垃 圾邮件的出现及泛滥给电子邮件的实际应用带来了巨大的负面影响,无论是从电 子邮件系统运行效率方面还是从电子邮件的安全性方面来讲。目前国际上对电子 邮件系统仍然无法给出一个统一的定义。本文在实际研究过程中给垃圾邮件给出 了这样一个分类:第一个类别的垃圾邮件就是目前国际上比较通用的垃圾邮件, 《中国互联网协会反垃圾邮件规范》对这类垃圾邮件的定义如下[1]:(1)收件人事 先没有提出要求或者同意接收的广告、电子刊物、各种形式的宣传品等宣传性的 电子邮件;(2)收件人无法拒收的电子邮件;(3)隐藏发件人身份、地址、标题等信 息的电子邮件;(4)含有虚假的信息源、发件人、路由等信息的电子邮件。这类电 子邮件会对电子邮件系统的运行效率产生很大的负面影响,如果此类邮件过多, 很有可能导致邮件系统的瘫痪,而且邮件接收者需要经常去处理这类没有任何意 义的邮件;第二个类别的垃圾邮件是违反一些特定规则的邮件,这个规则可以是 PAGE PAGE 2 由某个组织、公司、单位制定,也可以是由某个人来制定的,凡是违反需要遵守 的规则的邮件即被定义为垃圾邮件,这类邮件可能具有正确的发送人和接受人的 信息,它不会对电子邮件系统本身的运行造成什么影响,但会对制定规则的单位 或个人造成不可估量的损失,比如说有可能会造成企业核心技术的泄露,或者客 户信息的流失等。 垃圾邮件的泛滥给当前的网络环境造成了很大的危害,具体来说,有如下几 点: 1.导致网络带宽不足,影响电子邮件系统服务的正常运行。 2.影响用户的工作效率,占用用户的时间 3.对网络安全造成损害 4.造成公司信息的泄露,影响公司的正常运作 面对垃圾邮件问题日益严重的现状,人们开始从多方面寻找解决办法。目前 主要是法律层面和技术层面来应对和缓解垃圾邮件问题,前者可以依据立法,对 制造者进行法律制裁,目前,美、英、法等国家和地区已确立了反垃圾邮件相关 法案和法规,但更多的国家尚未出台相关立法,中国互联网协会反垃圾邮件协调 小组也发出加快“反垃圾邮件立法”进程的倡议,但在最终立法的道路上,仍有 许多路要走;后者在技术层面上解决垃圾邮件问题目前是现实可行的,相关的研 究投入也越来越大,相继出现了多种垃圾邮件过滤技术,对垃圾邮件过滤技术的 研究从开始兴起,到目前逐步成为研究热点。经过这么多年的发展,邮件过滤技 术从无到有,从简单到负责,从机械到智能,已经在邮件过滤领域取得了很大的 成就,邮件过滤技术的发展经过下面几个阶段[2][3]: 简单关键字过滤。仅利用邮件服务器的开放中继(Open-Relay 或 Open-Proxy) 来发送。作为应对的过滤技术为:邮件服务器关闭 Open-Relay,同时使用黑名单、 白名单、简单的关键字过滤等技术,可以实现根据发件人地址、邮件主题和邮件 头过滤垃圾邮件。 内容自动识别技术。随着垃圾邮件制造技术迅速发展,发

文档评论(0)

1234554321 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档