最新发布

# 2023-02-17
js同时测试一组网站的加载时间
js同时测试一组网站的加载时间是60秒，不同测试加载时间不同。js测试的全称是javasprits。在正确的数据下会不会产生错误的结果，在错误的数据下会不会给出正确的提示，会不会崩溃等等，总之就是测试所写的代码有没有问题。jest非常易于使
# 2023-02-17
eclipse中js代码如何设置可折叠？
js代码设置可折叠设置：设置代码折叠在菜单栏的窗口--&gt首选项1、选择常规--&gt编辑器--&gtstructure text editors，可以看到Enable folding选项，打上勾就可以使用代码折叠
# 2023-02-17
2020-04-29 js特殊常用字符转义
js特殊字符转义点的转义：. ==&gt\u002E 美元符号的转义：$ ==&gt\u0024 乘方符号的转义：^ ==&gt\u005E 左大括号的转义：{ ==&gt\u007
# 2023-02-17
js表单验证代码怎么写
我来举个例子，很简单的&lt!DOCTYPE html&gt&lthtml&gt&lthead&gt&ltmeta charset="UTF-8"&gt&a
# 2023-02-17
js执行顺序
1、注意执行的异步和同步。2、从你的描述来看setSearchCompleteCallBack这个函数执行是一个异步过程，也就是不用等函数执行完，就接着往下执行。3、所以先alert(coordinate)4、但实际执行过程还是1）、sea
# 2023-02-17
js获取get数据
js获取get数据如今前后端分离已经成为趋势，也就是说许多页面如果外部做链接就需要自定义话的页面进行参数设置，目前有效的办法就是get参数。通过自定义的get参数为封装的 vue等框架提供页面变量标识！当然也可以使用路由
# 2023-02-17
javascript如何做加减运算??
方法只有一种：直接使用减号运算符进行减法运算举例： var a=2 var b=1 var c=a-b这里通过减号运算符进行减法运算一直知道js的浮点数计算是不精确的， 0.1 + 0.2 !== 0.3，但是也就知道而
# 2023-02-17
js怎么修改模块
同学很简单的，如下操作。1.一些购买的模板是可以改变的可变图片区域。一般就是这个按钮和对话框，可以在模板的特定模块中找到替换图片。2.但是，固定背景、边框和标题栏中使用的一些图片无法修改，因为模板制作者将它们封装在固定图片区域中。3.如果需
# 2023-02-17
js判断语句的写法规则
在写JS中最常见的就是 if 判断，但是直接写 if(){}else{}太low ，下面是常见的几种js的if判断的写法：** * js 判断的几种写法 *var a = 10,b = 20console.log(a)console.l
# 2023-02-17
如何使用JS控制DIV内容的滚动条
1、首先需要新建一个HTML文档，这里设立一下基本的架构。2、再新建一个CSS文件，用link关联一下HTML文档。3、创建DIV标签，并且往里面填充内容。4、先设定一下滚动条内框的大小。5、用border先来查看是否有超出，这里可以看出超

火车头怎么采集到的内容是空的div里面的内容都没有呀

2023-03-14 22:06:02JavaScript09

火车头怎么采集到的内容是空的div里面的内容都没有呀,第1张

后台源代码里看不到的内容你用火车头当然采集不到。

比如有些内容是通过js调入的，你得去分析js是怎么调用的，调入的是哪个网址。

推荐使用抓包工具去分析找到真正的你想要抓的网址。

第一步采集网址，下载好火车头采集器后打开，新建一个任务，任务名随意。把需要采集的网站文章列表页网址添加到起始网址。从图中看出该列表页有34页，每页有N篇文章。

2

列表页会一级网址，添加多级网址获取，从而获取二级网址（文章页网址）

设置列表分页获取，3个地方分别是：分页源代码前面和后面还有中间位置。这一步用于获取列表页面链接，因为有34个列表页面。设置完保存。

网址获取选项，这一步用于获取列表页上面文章页的链接，根据自己需要设置需要截取的部分和根据网址的结构设置包含与不包含某些字符。为空即没限制，设置完保存。

设置好链接采集规则后，可以测试网址，看测试结果调整规则。看图可以看到采集链接规则从起始链接到全面列表页再到列表页上的文章页链接都已经成功采集。

第二步是采集内容，首先修改标题规则，在页面源代码里面找到标题的代码，把标题前后代码负责过去截取出标题。保存。

修改内容采集规则，跟标题规则差不多，也是源代码里面找到内容的前后代码。这里内容会有一些其他html标签，所以得添加一个html标签排除的规则。

完成后，测试看一下结果，从测试结果来调试规则，直到测试结果是自己想要的内容为止。

第三步是采集导出。前面1、2两步把规则设置好，最后就要把文章导出了。先做一个导出的模版。

然后选择方式二,把每一篇文章都分别记录到一个txt文本,保存位置自己选择,模板选择刚刚做好的导出模版.保存的文件名用文章标题为命名。其他默认，保存。

把采集网址，采集内容，发布3个选项框都勾选，然后开始采集。完成后文本就自动生成在刚刚保存的文件夹里面了。

火车头采集器采集文章教程到此就完成了，由于每个网站都是不一样的，所以这里只能用一个网站演示，只是一个方法思路，自己采集文章还需要灵活变通。

1、首先在采集列表页的源码中将带有缩略图的那部分源码复制下来，如图：

2、查看网站的源码，找到这行代码，如图：

3、打开火车头，进入采集网址规则—添加多级网址采集规则，选中手动填写链接地址规则，并将第二步骤中选中的代码粘贴进去，如图：

4、将代码进行如下修改：

5、改好后保存并进行采集测试，如图所示

6、然后再在采集内容规则里进行修改，选中“缩略图”标签，打开，进行内容替换，如图：

7、然后点击文件下载，选中下载图片，并填好缩略图保存路径及命名方式，如图：

8、在“文件保存及部分高级设置”里设定缩略图的保存盘符及其前缀，我设定为桌面，前缀为“./”，如图：

9、我们保存后测试一下，一起顺利，缩略图顺利采集下来了

词库加载错误未能找到文件“E高铁采集器内存溢出ConfigurationDictStopwordstxt”

# 上一篇：如何在mac上安装java 的

# 下一篇：怎样在电脑上兼职赚钱