- 1、本文档共9页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
互联网络信息安全的监测与过滤技术
赵小兵1’2 张 普2 郝 福3 秦 鹏2 张志平1
1内蒙古呼和浩特市昭乌达路295号内蒙古师范大学信息与工程学院,010020;
2北京市海淀区学院路15号北京语言大学应用语言学研究所,100080
3国家安全生产监督管理总局通信信息中心
63.com
nmzxb—cn@1zhangpu@blcu.edu.cn
摘要:本文主要介绍了采用自然语言处理技术和计算机网络技术相结合的方
法,针对目前存在的互联网信息污染现状,监测非法网站有害信息,搜寻非法网
站网址,记录并分析非法信息内容和语言特征。系统设计采用分布武或多机集群
系统,按监管范围进行监管,并分级对待,搜集、分析、自动更新不同级别的网
站地址、域名列表。监管模型采用双层分析过滤结构,第一层过滤采用基于规则
的正则表达武串匹配算法,用规则的方法排除大多数正常网站。算法采用简单的
内容分析技术,追求高处理速度,识别率相对较低。第二层过滤采用基于语义的
文本特征向量SVM模型进行文本内容分析技术,算法复杂,速度相对较慢,准确
率更高。
关键词:互联网,信息安全,信息过滤
一、前言
互联互通和资源开放共享可以说是互联网的天然属性。借助互联网,人们自
由交流、互通有无。随着社会信息化步伐的不断加快,我国信息产业迅速发展,
已成为重要的经济增长点和支柱产业,人们对信息系统和信息服务的依赖性也越
来越强。据国务院信息办发布的《2004年中国互联网络信息资源数量调查报告》显
长56%。互联网域名数量几乎以每年翻倍的速度增长。
人们在尽情享受互联网带来便利的同时,病毒、外部入侵(黑客)、拒绝服务
攻击、内部的误用与滥用、垃圾邮件、有害信息的大量传播,以及各种灾难事故
的发生,时刻威胁着网络的业务运转和信息安全,所以网络的安全问题始终与互
联网相伴相随。进入21世纪以来,网络与信息系统特别是互联网的安全事件层出
和尼姆达蠕虫事件等多起波及全球的大规模安全事件,在世界范围内造成了相当
严重的影响和损失。
有害信息污染是信息安全问题的一个重要表现,其内容包括:
(1)色情:互联网最大公害之一。据统计,全球与色情相关网站占总数1%,
年龄8~16岁少年儿童90%浏览过色情网站。
(2)邪教:社会毒瘤。如,美国“大卫教”、“人民圣殿教”,日本“奥姆真理
教”,欧洲“太阳圣殿教”,中国“法轮功”等。他们编织歪理邪说、实施精神控制、
诈骗钱财,杀人放火、自焚等行为疯狂、危害重大。
(3)反党、反国家宣传:如,“法轮功”组织、“达赖喇嘛”集团等被反华组织利
用,建立了80多个反动宣传网站。台湾当政也利用互联网散布反华言论,宣传
独立。
另外还有“毒品”“暴力…‘赌博”“虚假新闻”“垃圾邮件”“垃圾广告”等各种形式
的有害信息存在于互联网上,所以社会呼唤纯洁互联网资源。
有害信息污染的危害表现在:
(1)危害程度严重:一旦发生信息安全问题,将导致能源、金融、交通、通信、
社会服务保障等的大面积瘫痪。
(2)传播速度快:局部地区性热点扩散为全局性热点,群体性事件引发跨地区
连锁反应。
构筑信息网络安全体系在当代网络经济生活中具有重要战略意义,人们认识
到:安全,是网络的生存之本。
二,用“动态语言知识更新”理论和研究支持“信息安全”建设
我们认为,客观事物都有两个审视角度,即“历时”性角度和“共时”性角度。
“历时”性:时间观,考察事物产生、发展、消亡的变化历程;
“共时”性:空间观,考察事物状态、特性及相互间的关系和影响;
“全程安全”:具有“历时”性特征,符合标准信息安全应急响应流程,即“起一
承一转一合”的全过程;
“全方位安全”:具有“共时”性特征,表现在如下几个方面:
(1)信息安全“政策、法律、法规”“安全措施、技术、手段”;
(2)全民安全普及教育;
(3)全社会安全信息服务、应急服务;
(4)“攻…防”全力位
采川单纯预防措施:如“防火墙”、“恶意访M愤测”等拼施的缺点址被动、“防
小胜防”,所以采,1i攻防结合策略更能避免r述缺陷,如“刚上警察”,“敞感信息监
测”等。
一l“动态语言知识更新”和“动态流通语料库”
动态语言知识更新是动态流通语料库的理沦箍jj:f【。该理沦采用控制论的调控
机制、社会语青学的嘘测方法和计算语言学的处理下_段.对滑言现象进行动态的
观测、描进、分析
文档评论(0)