基于python的分布式网络爬虫设计与实现.docx

基于python的分布式网络爬虫设计与实现.docx

  1. 1、本文档共30页,其中可免费阅读9页,需付费100金币后方可阅读剩余内容。
  2. 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,可选择认领,认领后既往收益都归您。
  3. 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细先通过免费阅读内容等途径辨别内容交易风险。如存在严重挂羊头卖狗肉之情形,可联系本站下载客服投诉处理。
  4. 4、文档侵权举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
Abstract 基于python的分布式网络爬虫设计与实现 Abstract PAGE PAGE 1 摘要 PAGE PAGE 1 摘要 随着互联网飞速的发展,网络上的信息呈指数级的增长,如此高的信息数量级也给用户获取信息带来了巨大的挑战。网络爬虫作为获取数据的工具常常被应用于有哪些信誉好的足球投注网站引擎当中,然而面向中小规模系统的网络爬虫由于其自身的局限性常常面临诸多问题,例如单机的网络爬虫程序抓取数据速度太慢,而大多数成熟的开源网络爬虫框架都未实现分布式化:互联网中的网页结构各不相同,单一的网络爬虫程序无法匹配所有类型的网页等等。因此设计并实现一个可定制性高的、简单稳定的、面向中

您可能关注的文档

文档评论(0)

***** + 关注
实名认证
内容提供者

乐于分享,有偿帮助。

版权声明书
用户编号:8070007123000004

1亿VIP精品文档

相关文档