- 1、本文档共11页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
垃圾邮件的识别和过滤方法
垃圾邮件识别和过滤的方法谈兆年北京理工大学计算机学,北京 100081(1120131743@)Methods for Identifying and Filtering Junk Mail or Spam Tan Zhaonian (ClassSchool of Computer Science, Beijing Institute of Technology, Beijing 100081) Abstract Identifying and Filtering Spam is an important research subject in computer network. In this thesis, I have studied the history of spam filtering technology, which mainly includes the first generation of rule-based filtering technology, the second generation of content-based filtering technology and the third generation of behavior-based filtering technology. 1. Rule-based filtering includes IP address based filtering, mail header based filtering. 2. Content-based filtering includes Bayesian filtering, Memory-based method, decision tree, Boosting method, Support Vector Machine (SVM), etc. 3. Behavior-based filtering includes Email data stream based filtering, mail header based filtering, sender reputation based filtering, mail fingerprint based filtering, behavioral characteristics weighted based filtering, etc. The spammers’ common spurious methods are summarized. Through the reference to large amount of anti-spam documents and data from home and broad, an analysis is made on existing anti-spam techniques and in particular the content-based spam filtering methods. Key words spam filtering; rule; content; text categorization; Na?ve Bayes; behavior 摘要 垃圾邮件识别和过滤是计算机网络领域的一个重要研究课题。垃圾邮件识别和过滤目前已经发展出了三代技术,第一代过滤技术是基于规则的,例如:基于IP地址、基于邮件头的过滤技术。第二代过滤技术是基于内容的,例如:贝叶斯分类算法、Memory-Based方法、决策树、Boosting方法、支持向量机等方法。第三代过滤技术是基于行为的,例如:基于邮件数据流、基于邮件头信息、基于发送方信誉、基于邮件指纹、基于行为特征加权的决策树等过滤方法。本文归纳总结了当前垃圾邮件发送者经常采用的欺骗手段和方法,并参阅国内外大量反垃圾邮件文献和数据,对已有的垃圾邮件技术作出分析和总结,尤其是对基于内容的垃圾邮件过滤方法进行了研究。关键词 垃圾邮件过滤;规则;内容;文本分类;简单贝叶斯;行为随着互联网的发展,垃圾邮件常常让人头痛不已,必威体育精装版报告称美国为垃圾邮件第一大国,中国排名第三(图1)[1]。垃圾邮件问题如今已经成为一个社会热点,近些年来,研究人员们提出了很多垃圾邮件识别和过滤的方法。这些方法的发展经历了三代,第一代过滤技术是基于规则的,例如:基于IP地址、基于邮件头的过滤技术。第二代过滤技术是基于内容的,例如:贝叶斯分类算法、Memory-Based方法、决策树、Boosting方法、支持向量机等方法。第三代过滤技术是基于行为的,例如:基于邮件数据流、基于邮件头信息、基于发送方信誉、基于邮件指纹、基于行为特征加权
您可能关注的文档
- FAX-100滤芯,FAX-160回油滤芯.doc
- FA-50净水器.doc
- FOB与CIF的区别.doc
- 2FSK--FSK通信系统调制解调综合实验电路设计.doc
- javascript选择器过滤器.docx
- Honeywell净化器产品资料.doc
- KGSS7Monitor工具使用指南.doc
- MBR污水工艺处理技术介绍.doc
- FCC-25.doc
- Multisim练习题1.doc
- 新乡航空工业有限公司校园招聘模拟试题附带答案详解及答案一套.docx
- 2024年医疗安全工作计划范文(5篇) .pdf
- 2024年人教版七年级下册英语UNIT 4同步检测试卷及答案 .pdf
- 北京市石景山区2023-2024学年七年级下学期期末英语试卷 .pdf
- 专题06 线段与角的画法(考点串讲)(解析版) .pdf
- 中医院处方调配制度及医院药事管理制度汇编 .pdf
- 2024年医院新会计制度培训课件(版) .pdf
- 人教版】七年级地理下册综合测试题及答案 .pdf
- Unit1单元同步测试卷2023--2024学年人教版英语七年级下册 .pdf
- 浙江省四校联盟2024-2025学年高二下学期3月联考政治试卷及答案.docx
文档评论(0)