分布式网络爬虫系统设计与实现.docx

分布式网络爬虫系统设计与实现.docx

  1. 1、本文档共20页,其中可免费阅读6页,需付费200金币后方可阅读剩余内容。
  2. 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,可选择认领,认领后既往收益都归您。
  3. 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细先通过免费阅读内容等途径辨别内容交易风险。如存在严重挂羊头卖狗肉之情形,可联系本站下载客服投诉处理。
  4. 4、文档侵权举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

PAGE4

题目:分布式网络爬虫系统设计与实现

随着手机移动端和互联网的快速发展普及和不断发展,获得更多信息资源己经逐渐成为了现代人们的整个日常生活中必须不可或缺的一个组成部分。在众多的信息源中,通过浏览器访问网站是绝大多数人的选择。但是,如果以这种方式正常获取信息,信息获取速度慢,信息量小,就产生了Web爬虫。Web爬虫,又称Webspider或

Webrobots,可以根据用户自定义的规则,在短时间内收集大量关于万维网的特定信息。在抓取信息的同时,网络爬虫也带来了一些问题。例如,大量信息获取异常,这是一种损失。同时,大量的爬虫也给网站的维护带来

文档评论(0)

123456 + 关注
实名认证
内容提供者

123456

1亿VIP精品文档

相关文档