[邮件过滤需求规格说明书.docVIP

  1. 1、本文档共22页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
[邮件过滤需求规格说明书

文档编号版本号___1_______ 文档名称____需求规格说明书__________ 项目名称:_ 垃圾邮件过滤系统__________________ 项目负责人:___ 开发单位:_____软件工程大作业小组________________ 编写___ ______ 校对___ ________ 审核___ ________ __ 2013____年____10____月_____13_____日 1、引言 1.1 编写目的 “邮件过滤系统”软件需求说明书主要为软件开发提供需求说明,在需求说明说中详细介绍本系统要达到什么样的要求以及基于什么样的硬件设备和软件平台来实现本软件系统的。此文档是参与本软件的需求分析人员、开发人员、测试人员的参考依据,它明确规定了本软件的性能要求、设计需求以及所能达到的期望值,保证开发出高质量、有市场价值的软件。 面向的读者:本系统软件的开发人员,测试人员,主要提供一些必要的参考给后续开发人员,从而让开发人员开发出的软件实现后能充分满足客户或用户的需求。 1.2项目背景 本项目的任务提出者:高东发老师 项目开发者:林子豪、梁晓明、崔建鹏、吴清、张珊珊 垃圾邮件的危害: 占用网络资源 浪费服务器资源 增加用户处理时间 对网络安全形成危险 散步有害信息 电子邮件已成为日常生活中最流行,最方便,经济的通信手段。用户在收发邮件同时,经常受到垃圾邮件的干扰。邮件的泛滥给互联网用户带来很多烦恼和侵害,也给社会带来了极大的负面影响。根据“中国互联网协会反垃圾中心”调查显示的数据如下: 调查结果显示,截止2013年2月,中国邮箱用户平均每周所收到的垃圾邮件大约是35%,这些垃圾邮件不仅浪费我们阅读时间,而且大大影响了我们的身心健康。由此可见,过滤垃圾邮件迫在眉睫。 目前,国内研究的过滤技术主要是基于内容的过滤。基于内容的过滤具有较高的智能性和准确率,是一种较成熟的垃圾邮件过滤技术。但是这种方法仍然存在较大的问题以下这几个问题: 对中文邮件的误判率较高 目前过滤技术对垃圾词汇不易识别 对垃圾邮件概念不明确 对其他语言邮件无法识别 无法适应日新月异的垃圾邮件伪装技术的进步 目前国内邮箱用户所收到的垃圾邮件内容状况如下: 调查结果显示,截止2012年11月,邮箱用户所收到的垃圾邮件内容集中在“欺诈类”内容和“消费类”内容。这些内容或多或少干扰我们的判断,影响我们的理性,特别是对缺乏判断能力的未成年青少年造成巨大的危害。 垃圾邮件的语言种类繁多,以下的图表显示了垃圾邮件所使用的语言种类。 通过对中国互联网用户所收取垃圾邮件的语言种类进行统计可以看出,“中文”、“英文”、“日文”这 3 类语言占用户收到垃圾邮件的前 3 位,如图所示。其中,中文垃圾邮件所占比例已经高达 67.39%,而其他语言所占比例总和仅32.61%。垃圾邮件具有很强的区域性,因此,在我国基于中文内容的垃圾邮件过滤方法研究需结合自身特点体现出较强的针对性。综合调查结果显示,不断加强垃圾邮件的过滤是一项非常重要、而且很有市场价值,但却十分艰巨的工作。 1.3定义 1.3.1垃圾邮件定义 垃圾邮件(spam、junk mail):《中国互联网协会反垃圾邮件规范》将垃圾邮件被界定如下: (l)收件人事先没有提出要求或者同意接收的广告、电子刊物以及各种形式的宣传品等宣传性的电子邮件。 (2)收件人无法拒收的电子邮件。 (3)隐藏发件人身份、地址、标题等信息的电子邮件。 (4)含有虚假的信息源、发件人、路由等信息的电子邮件。 1.3.2垃圾邮件定量描述 根据上述垃圾邮件的定义,一封电子邮件是否是垃圾邮件可以用式子 M=f(X,Y,Z) 来衡量,M的初始值为0。其中x={x1,x2,…,…,},xi表示垃圾邮件的某一信头特征,各个xi之间是互相独立的变量。如果xi是垃圾邮件的明确特征,则表明这极有可能是一封垃圾邮件。例如xi为非法的邮件服务器地址,则置变量M为一较大值;如果xi不是垃圾邮件的明确特征,例如发送服务器的域名与发件人域名不同,则只能置M为一个很小的值。Y和Z分别为邮件标题。邮件正文和邮件附件经过垃圾邮件内容分析和计算后得到的这封邮件属于垃圾邮件的概率值。 1.3.3软件开发中出现的其它术语定义 E-mail(电子邮件):又称电子信箱电子邮政,它是—种用电子手段提供信息交换的通信方式,是Internet应用最广的服务,通过网络的电子邮件系统,用户可以用非常低廉的价格(不管发送到哪里,都只需负担电话费和网费即可),以非常快速的方式(几秒钟之内可以发送到世界上任何你指定的目的地),与世界上任何一个角落的网络用户联系,这些电子邮件可以是文字、图像、声音等各种方式。同

文档评论(0)

wu12youli + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档