最新发布

# 2023-02-17
js全局变量赋值
function test(){s = “sh”全局变量var c = 1局部的整形变量}这样即可为一个全局变量赋值。省略了var操作符，就创建了一个全局变量，如上形式就可以直接进行创建并且赋值。在js中有var操作符的变量
# 2023-02-17
javascript如何做加减运算??
方法只有一种：直接使用减号运算符进行减法运算举例： var a=2 var b=1 var c=a-b这里通过减号运算符进行减法运算一直知道js的浮点数计算是不精确的， 0.1 + 0.2 !== 0.3，但是也就知道而
# 2023-02-17
js 判断是否为空
一般判断为空有 null值、undefined值与NaN值判断undefined:var tmp = undefinedif (typeof(tmp) == "undefined"){ alert("u
# 2023-02-17
js字符串的长度
字符串的最大长度与js中能表达的【最大安全整数】有关系，这是为什么呢 utf-16相关：符号位1 指数为11 位位尾数位52(1+11+52=64) 那应该是2^52-1 才对，但小数点
# 2023-02-17
javascript用什么换行
js中alert弹出窗口换行用"n"如果这个不可以的话就是"\n"比如：&ltscript type="textjavascript"&gtalert(&qu
# 2023-02-17
js正则匹配总结
js匹配是js中比较重要的一个概念，我们在工作中经常用到，但是往往都是记得不是很清楚，或者有些遗忘，这次记录总结一下，让自己加深一下印象，同时也会小伙伴们提供查阅资料的地方正则匹配模式分为两种，一种是贪婪模式，另一种是非贪婪模式
# 2023-02-17
js获取get数据
js获取get数据如今前后端分离已经成为趋势，也就是说许多页面如果外部做链接就需要自定义话的页面进行参数设置，目前有效的办法就是get参数。通过自定义的get参数为封装的 vue等框架提供页面变量标识！当然也可以使用路由
# 2023-02-17
2020-04-29 js特殊常用字符转义
js特殊字符转义点的转义：. ==&gt\u002E 美元符号的转义：$ ==&gt\u0024 乘方符号的转义：^ ==&gt\u005E 左大括号的转义：{ ==&gt\u007
# 2023-02-17
js防水涂料是什么
js防水涂料是一种以聚丙烯酸酯乳液、乙烯-醋酸乙烯酯共聚乳液等聚合物乳液与各种添加剂组成的有机液料，和水泥、石英砂、轻重质碳酸钙等无机填料及各种添加剂所组成的无机粉料通过合理配比、复合制成的一种双组份、水性建筑防水涂料。具有抗裂性、抗冻性好
# 2023-02-17
如何使用JS控制DIV内容的滚动条
1、首先需要新建一个HTML文档，这里设立一下基本的架构。2、再新建一个CSS文件，用link关联一下HTML文档。3、创建DIV标签，并且往里面填充内容。4、先设定一下滚动条内框的大小。5、用border先来查看是否有超出，这里可以看出超

还是火车头采集分页的问题再不过我真就不能再发了分都快没了

2023-04-26 07:01:02JavaScript033

还是火车头采集分页的问题再不过我真就不能再发了分都快没了,第1张

这种格式的火车头分析不出来，不容易采集的，你最好还是换其他形式的，

比如：

<a href="/imginfo/2149_3.html" >上一页</a>

<a href="/imginfo/2149_1.html" >1</a>

<a href="/imginfo/2149_2.html" >2</a>

<a href="/imginfo/2149_3.html" >3</a>

<a href="/imginfo/2149_5.html" >5</a>

<a href="/imginfo/2149_6.html" >6</a>

<a href="/imginfo/2149_5.html">下一页</a>

或者不要管上面那部分直接采集

<span class="next" title="下一页" onclick="is_go_out=falselocation.href='/comic_show/c91292_m0_i719601.html'"></span>

</dd>

这里面的网址上下页匹配，也可以用多页采集模式进行匹配

正文开始代码是

结束 <br />

</p>

</div>

另外可以用采集器，自动采集功能.动易2006，或者火车头采集器，火车头采集器使用方法在99D软件站有！火车头采集器下载地址在99d软件站也提供下载！！

去你百度搜索99d软件站！

软件使用，项目管理：

1、选择添加新项目，找到你需要采集的页面→复制网址到新闻网址列表框，项目名称随便填（主要是给你自己记忆备忘用）→下一步

2、项目编辑列表设置：

这里填写就要注意点了，找到你要采集的新闻列表的第一个信息标题的地方，一般标题前面这里会有一个table标签，选择这个table标签前面的具有典型特征的一些代码，代码具体选多少呢，分2种情况，一是有分页的列表，简单说就是列表最下面有下一页或者有1、2、3、等页面链接的，二是没有分页的，简单说就是列表只有1页，只有1页的情况好办，这里可以随便选了，只要保证不重复就行了。但是有分页的列表页就要麻烦一些，这时候选取代码的原则是：在保证没有重复代码的前提下，尽量选择少一点的代码，因为代码越多越容易出错，越不能保证每个列表页面都有这些代码了，这是经验之谈，当然也不一定，有些网页代码格式非常统一，那么这种网页就好采集，列表开始代码也好填一些。什么是具有典型特征的代码呢？就是基本上每个列表页都有的代码，但是这个页码在所有的列表页中又是唯一的，不重复。

第一步采集网址，下载好火车头采集器后打开，新建一个任务，任务名随意。把需要采集的网站文章列表页网址添加到起始网址。从图中看出该列表页有34页，每页有N篇文章。

2

列表页会一级网址，添加多级网址获取，从而获取二级网址（文章页网址）

设置列表分页获取，3个地方分别是：分页源代码前面和后面还有中间位置。这一步用于获取列表页面链接，因为有34个列表页面。设置完保存。

网址获取选项，这一步用于获取列表页上面文章页的链接，根据自己需要设置需要截取的部分和根据网址的结构设置包含与不包含某些字符。为空即没限制，设置完保存。

设置好链接采集规则后，可以测试网址，看测试结果调整规则。看图可以看到采集链接规则从起始链接到全面列表页再到列表页上的文章页链接都已经成功采集。

第二步是采集内容，首先修改标题规则，在页面源代码里面找到标题的代码，把标题前后代码负责过去截取出标题。保存。

修改内容采集规则，跟标题规则差不多，也是源代码里面找到内容的前后代码。这里内容会有一些其他html标签，所以得添加一个html标签排除的规则。

完成后，测试看一下结果，从测试结果来调试规则，直到测试结果是自己想要的内容为止。

第三步是采集导出。前面1、2两步把规则设置好，最后就要把文章导出了。先做一个导出的模版。

然后选择方式二,把每一篇文章都分别记录到一个txt文本,保存位置自己选择,模板选择刚刚做好的导出模版.保存的文件名用文章标题为命名。其他默认，保存。

把采集网址，采集内容，发布3个选项框都勾选，然后开始采集。完成后文本就自动生成在刚刚保存的文件夹里面了。

火车头采集器采集文章教程到此就完成了，由于每个网站都是不一样的，所以这里只能用一个网站演示，只是一个方法思路，自己采集文章还需要灵活变通。

词库加载错误未能找到文件“E高铁采集器内存溢出ConfigurationDictStopwordstxt”

# 上一篇：div 设置隐藏后，在页面仍然占位，如何不让它占位

# 下一篇：上海js继续教育考试可以考几次