- 1、本文档共16页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
八爪鱼产品运用手册
八爪鱼产品使用手册目录1关于八爪鱼12Cookie (更多内容详见Cookie 视频)12.1 Cookie诞生12.2 Cookie概述12.3 Cookie工作原理13Xpath、Html23.1 Xpath、Html概念23.2 Html结构23.3 Html标签、元素、节点33.4 Html常见标签33.5 Html常见属性43.6 Xml、Xpath、Html关系和区别44常见问题55常见软件操作教程65.1 采集单个网页75.2 采集单个列表页面75.3 单网页表格信息采集75.4 采集单网页列表详细信息75.5 采集分页列表75.6 采集分页列表详细信息75.7 采集分页列表+ajax延时设置75.8 单个文本输入及各种登录方式采集75.9 Cookie登录75.10 文本循环输入75.11 循环切换下拉框75.12 xpath入门175.13 xpath入门275.14 一二页重复循环采集7关于八爪鱼 八爪鱼·大数据,通过自主创新研发,以分布式云平台架构为产品核心,帮助客户通过在极短的时间内,通过简单操作即可获取想要的数据,并以结构化数据展示,为企业数据挖掘与数据分析提供基础数据源。于2015年1月,获得国家重点软件企业上市公司“拓尔思”投资。Cookie (更多内容详见Cookie 视频)Cookie诞生 当某个用户打开浏览器发出页面请求时,web服务器只是进行简单相应,然后就关闭与该用户的连接。所以当用户每发起一个打开网页请求到web服务器的时候,无论是否是第一次打开同一个网页,web服务器都会把这个请求当作第一次来对待,那这样的缺陷可想而知,比如每次打开登录页面的时候都需要输入用户名、密码。为了弥补这个缺陷,Cookie应运而生。Cookie概述 Cookie就是服务器暂时存放在你计算机上的一笔资料,好让服务器来辨认你的计算机。当你在浏览网站的时候,web服务器会先送出小小资料放在你的计算机上,cookie会帮你在网站上所打的文字(如用户名、密码)和其他一些操作都记录下来。当下次你再打开同一个网站。web服务器会先看看有没有它上次留下的cookie资料,有的话就会依据cookie的内容来判断使用者,送出特定的网页内容给你。Cookie工作原理Xpath、HtmlXpath、Html概念Xpath:是一种路径查询语言,简单的说就是利用一个路径表达式找到我们需要的数据位置。 Html:超文本标记语言,是用来描述网页的一种语言。主要用于控制数据的显示和外观。HTML文档也被称为网页。Xpath专用于xml中沿着路径查找数据用的,但是八爪鱼采集器内部有一套针对Html的Xpath引擎,使得直接用Xpath就能精准的查找定位网页里面的数据。Html结构完整的HTML文件至少包括HTML标签、HEAD标签、TITLE标签和BODY标签,并且这些标签都是成对出现的,开头标签为,结束标签为/,在这两个标签之间添加内容。通过这些标签中的相关属性可以设置页面的背景色、背景图像等。Html标签、元素、节点Html常见标签Html常见属性Xml、Xpath、Html关系和区别Xml和Html之间既有相似之处,又有很大区别。Xml包含数据和对数据的描述,主要用来交换数据。Html也包含了数据和对数据的描述,但只是针对描述网页这种用途,Html结构看起来和Xml类似,但并不严格遵循Xml标准,可以看做不标准的Xml。Xpath是专门针对Xml设计的,在复杂结构化数据中查找信息的语言,而我们的网页实质上是Html的文档,那如何对网页执行Xpath查询呢?八爪鱼采集器内部有一套针对Html的Xpath引擎,使得直接用Xpath就能精准的查找定位网页里面的数据。常见问题Q:八爪鱼采集器有免费版吗?A:八爪鱼采集器免费版所有功能都可以使用。Q:规则市场下载的文件是.otd为后缀的文件,如何打开?A:.otd文件是八爪鱼采集器的规则文件(类似于ppt模板),下载后使用八爪鱼采集器运行即可采集数据,但必须安装八爪鱼采集器才能打开。免费下载八爪鱼采集器Q:八爪鱼采集器能采集匿名账户信息吗?A:如果你没有权限查看匿名的数据就不可以,八爪鱼可以代替人工更加自动和智能的收集数据,但不会协助你收集你没有权限浏览的数据,比如别人的密码等隐私数据。Q:八爪鱼采集器能采集别人的后台数据吗?A:不能采集,后台数据需要有后台访问权限,正规的采集软件不会提供此类侵权服务。但您可以采集自己的后台数据。Q:八爪鱼能采集QQ号码、邮箱、电话号码之类的吗?A:能采集,任何你在网页上能看见的数据都可以采集,八爪鱼采集器内置的规则市场中也有很多此类规则可下载,无需配置,运行规则就可以提取到这些数据。Q:八爪鱼采集器能采集图片吗?A:可以采集图片的URL,然后通
文档评论(0)