电大《大数据技术导论》实验3 网页数据获取.docx

电大《大数据技术导论》实验3 网页数据获取.docx

  1. 1、本文档共3页,其中可免费阅读1页,需付费50金币后方可阅读剩余内容。
  2. 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,可选择认领,认领后既往收益都归您。
  3. 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细先通过免费阅读内容等途径辨别内容交易风险。如存在严重挂羊头卖狗肉之情形,可联系本站下载客服投诉处理。
  4. 4、文档侵权举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
实验3 网页数据获取 数据获取是数据生命周期中的第一个环节,数据抽取过程是有哪些信誉好的足球投注网站全部数据源,按照某种标准选择合乎要求的数据,并将其进行适当的格式转换之后,传送到目的地中存储。为了克服被抽取的数据源分布广泛、异构、非结构化等问题,数据抽取技术和抽取工具应运而生。学习数据科学与大数据技术不仅需要掌握其理论,更重要的是能够运用工具和方法来完成数据的获取。 1.实验目的 通过网页数据获取的实验,学生可以理解网络爬虫的工作过程,掌握网页数据获取的方法,并能够灵活运用,进而解决网页数据获取的实际问题。 2.实验要求 理解爬虫软件的原理与方法,独立完成网页数据获取的实验,主要内容如下。 (1)前嗅ForeS

文档评论(0)

解题通 + 关注
实名认证
服务提供商

建筑电气工程师持证人

解题通:783284575 是以成人教育、自考、成人学历提升、中小学教育、 和高中生高考 、资格等级证考试、公务员考试等为主,为学生提供学习文档资料;作业定制、作业辅导、考前咨询等。

领域认证该用户于2023年05月12日上传了建筑电气工程师

1亿VIP精品文档

相关文档