- 1、本文档共12页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
大规模网络流量发布中的数据脱敏技术研究
田湘1,2,3, 朱宇佳2,3, 刘庆云2,3,孙永2,3
1(中国科学院大学,北京,100049)
2(信息内容安全技术国家工程实验室,北京,100093)
3(中国科学院信息工程研究所,北京,100093)
摘 要: 随着网络规模的日益扩大,网络流量数据共享对新形势下的互联网研究具有重大价值,但实际公布的数据集极少,一方面,隐私担忧使得网络流数据无法直接进行发布,另一方面,即便使用了某些数据脱敏手段,网络流量仍然容易受到去匿名化攻击。本文面向大规模网络流数据的发布,在总结和归纳当今流行的网络流数据脱敏技术、脱敏工具的基础上,深入分析了网络流去匿名化攻击类型,详细论述了不同的去匿名化攻击和与之相对应的数据脱敏对抗策略,对实现大规模网络流量数据共享发布具有重要意义。
关键词: 网络流;数据脱敏;去匿名化攻击;隐私保护;数据发布
Research of Data Masking Technologies on Network Traffic Release
Xiang Tian1,2,3, Yujia Zhu2,3, Qingyun Liu2,3, Yong Sun2,3
1(University of Chinese Academy of Sciences, Beijing 100049, China)
2(National Engineering Laboratory for Information Security Technologies, Beijing 100093, China)
3(Institute of Information Engineering, Chinese Academy of Sciences, Beijing 100093, China)
Abstract: With the increase scale of the network, the network traffic data release is of great significance for the research and analysis under the new situation. On the one hand, due to the concern of privacy, network traffic can not be directly released. On the other hand, masking network traffic is still susceptible to de-anonymity attacks, even with some data masking technologies. Based on the summary of the popular masking technologies of network traffic and masking tools, this paper analyzes the types of network traffic de-anonymous attacks, discuss the different attacks and corresponding data masking strategies against these attacks in detail. And it is important for achieving the privacy release of network traffic data for research and analysis.
Key words: network traffic; masking technology; de-anonymous attack; data privacy; data release.
1引言
随着互联网用户的剧增及对网络带宽需求的不断增大,网络安全事件和威胁层出不穷,基于网络数据分析的网络防病毒、网络数据内容审计、入侵检测系统等网络数据处理系统面临着巨大挑战。一方面,为了能够对互联网进行更加深入的探索,研究人员需要更多的主动测量和被动测量数据,这就需要大量的原始流量数据(Network Traffic),然而只有很少的机构具备从高带宽主干信道上获取并存储流量数据的能力,因此这些通过采集被保存下来的网络流数据是非常珍贵的研究资料[1];另一方面,大规模网络流数据包含大量的商业/个人隐私,牵制了大规模数据集的共享。如何将网络流数据脱敏发布,同时维持数据真实性、稳定性、有效性、多样性和高效性,保证研究成果对网络复杂性研究的准确性具有特别重要的意义[2]。
传统的网络流量数据脱敏发布系统主要是对网络流量数据中的敏感字
文档评论(0)