- 1、本文档共4页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
《文章采集器》.doc
文章采集器分析
一、标题采集
打开后台→进入模块中心→新闻系统→文章采集器→手工添加新规则。
点击后出现这个页面。
1、在规则名称填入你所要采集的网站名称或者栏目名称。
2、第一个选项不管;如果是有规则多页就选择,这里介绍手工输入多页。
3、第一框填入你所采集的文章列表页网址复制进去。
4、查看文章列表页源代码。
右键点击→查看源代码→复制标题→在源代码文本中点击编辑查找→复制标题查找→分析。
复制代码。
5、拷贝代码到第二框选项中。
{url=*}代替URL地址,{title=*}代替文章标题。
6、测试采集标题。
二、内容采集
点击下一步进入内容采集规则设置。
第一个选项可以忽略。
第二个填入设置规则。
进入列表页,随意打开一篇文章→查看源代码→复制部分内容→在源代码文本中点击编辑查找→复制部分内容查找
选中文章部分前后的HTML代码→复制到内容采集规则中。
内容部分用{content=*}代替。
测试内容采集。
能看到比较清晰的文字内容就代表成功了。也可以提交采集设置,正式采集到指定栏目内查看,只需采集一两篇查看即可关掉。如果不行再重新设置分析内容代码。
三、备注
本次文章采集器分析是由电力114网站,深圳锐能达电力网络有限公司,杜六意经理联合赞助,严国隆编写而成。如有错误请直接说明并指出错误。如有看不懂者,请登录QQ给我留言。如果不会者,请直接CALL我并请我吃饭我会一一为你解答。另外,可以登录以下这个网址/help/观看演示步骤。再另外,可以按着Alt键+F+X。
文档评论(0)