还是火车头采集分页的问题 再不过我真就不能再发了 分都快没了

JavaScript020

还是火车头采集分页的问题 再不过我真就不能再发了 分都快没了,第1张

这种格式的火车头分析不出来,不容易采集的,你最好还是换其他形式的,

比如:

<a href="/imginfo/2149_3.html" >上一页</a>

<a href="/imginfo/2149_1.html" >1</a>

<a href="/imginfo/2149_2.html" >2</a>

<a href="/imginfo/2149_3.html" >3</a>

<a href="/imginfo/2149_5.html" >5</a>

<a href="/imginfo/2149_6.html" >6</a>

<a href="/imginfo/2149_5.html">下一页</a>

或者不要管上面那部分直接采集

<span class="next" title="下一页" onclick="is_go_out=falselocation.href='/comic_show/c91292_m0_i719601.html'"></span>

</dd>

这里面的网址上下页匹配,也可以用多页采集模式进行匹配

正文开始代码是<!--判断是否已经扣点-->

结束 <br />

</p>

</div>

另外可以用采集器,自动采集功能.动易2006,或者火车头采集器,火车头采集器使用方法在99D软件站有!火车头采集器下载地址在99d软件站也提供下载!!

去你百度搜索99d软件站!

软件使用,项目管理:

1、选择添加新项目,找到你需要采集的页面→复制网址到新闻网址列表框,项目名称随便填(主要是给你自己记忆备忘用)→下一步

2、项目编辑列表设置:

这里填写就要注意点了,找到你要采集的新闻列表的第一个信息标题的地方,一般标题前面这里会有一个table标签,选择这个table标签前面的具有典型特征的一些代码,代码具体选多少呢,分2种情况,一是有分页的列表,简单说就是列表最下面有下一页或者有1、2、3、等页面链接的,二是没有分页的,简单说就是列表只有1页,只有1页的情况好办,这里可以随便选了,只要保证不重复就行了。但是有分页的列表页就要麻烦一些,这时候选取代码的原则是:在保证没有重复代码的前提下,尽量选择少一点的代码,因为代码越多越容易出错,越不能保证每个列表页面都有这些代码了,这是经验之谈,当然也不一定,有些网页代码格式非常统一,那么这种网页就好采集,列表开始代码也好填一些。什么是具有典型特征的代码呢?就是基本上每个列表页都有的代码,但是这个页码在所有的列表页中又是唯一的,不重复。