最新发布

# 2023-02-17
js操作属性
获取的页面元素，就可以对页面元素的属性进行操作，属性的操作包括属性的读和写。操作属性的方法 1、“.” 操作 2、“[ ]”操作属性写法1、html的属性和js里面属性写法一样 2、“class” 属
# 2023-02-17
eclipse中js代码如何设置可折叠？
js代码设置可折叠设置：设置代码折叠在菜单栏的窗口--&gt首选项1、选择常规--&gt编辑器--&gtstructure text editors，可以看到Enable folding选项，打上勾就可以使用代码折叠
# 2023-02-17
js表单验证代码怎么写
我来举个例子，很简单的&lt!DOCTYPE html&gt&lthtml&gt&lthead&gt&ltmeta charset="UTF-8"&gt&a
# 2023-02-17
Js表单提交
表单提交是刚开始学js的朋友很迷惑的一个问题，怎么提交，怎么阻止默认提交，怎么提交表单不跳转等等问题，下面是一些示例原始的表单提交有 button 按钮提交和 &ltinput &gt类型的。它们又什么区别呢？
# 2023-02-17
JS中都有哪些数据类型？
js中有5种数据类型：Undefined、Null、Boolean、Number和String。x0dx0a还有一种复杂的数据类型Object，Object本质是一组无序的名值对组成的。x0dx0aUndefined类型只有一个值，
# 2023-02-17
js字体安装到目录
1、字体安装的位置还是很好找的，首先我们打开我的电脑并点击系统盘，相信绝大多数用户都是C盘，如果你的具体情况不一样，那就点击具体的系统盘2、找到一个名为“windows”的文件夹并打开3、随后找到一个名为“fonts”文件夹并打开4、打开后
# 2023-02-17
js 判断是否为空
一般判断为空有 null值、undefined值与NaN值判断undefined:var tmp = undefinedif (typeof(tmp) == "undefined"){ alert("u
# 2023-02-17
JS有哪几种传参方式
大家好，我是IT修真院成都分院第5期的学员，一枚正直纯洁善良的web程序员一.背景介绍：在“单机”模式下，只需要使用其本身所建立的变量即可。显然，在如今的前端环境，一个稍微正式点的项目都不太可能是这个情况，页面的跨越、服务器后台进行数
# 2023-02-17
js判断语句的写法规则
在写JS中最常见的就是 if 判断，但是直接写 if(){}else{}太low ，下面是常见的几种js的if判断的写法：** * js 判断的几种写法 *var a = 10,b = 20console.log(a)console.l
# 2023-02-17
如何使用JS控制DIV内容的滚动条
1、首先需要新建一个HTML文档，这里设立一下基本的架构。2、再新建一个CSS文件，用link关联一下HTML文档。3、创建DIV标签，并且往里面填充内容。4、先设定一下滚动条内框的大小。5、用border先来查看是否有超出，这里可以看出超

火车头怎么采集到的内容是空的div里面的内容都没有呀

2023-03-16 06:16:01JavaScript022

火车头怎么采集到的内容是空的div里面的内容都没有呀,第1张

后台源代码里看不到的内容你用火车头当然采集不到。

比如有些内容是通过js调入的，你得去分析js是怎么调用的，调入的是哪个网址。

推荐使用抓包工具去分析找到真正的你想要抓的网址。

第一步采集网址，下载好火车头采集器后打开，新建一个任务，任务名随意。把需要采集的网站文章列表页网址添加到起始网址。从图中看出该列表页有34页，每页有N篇文章。

2

列表页会一级网址，添加多级网址获取，从而获取二级网址（文章页网址）

设置列表分页获取，3个地方分别是：分页源代码前面和后面还有中间位置。这一步用于获取列表页面链接，因为有34个列表页面。设置完保存。

网址获取选项，这一步用于获取列表页上面文章页的链接，根据自己需要设置需要截取的部分和根据网址的结构设置包含与不包含某些字符。为空即没限制，设置完保存。

设置好链接采集规则后，可以测试网址，看测试结果调整规则。看图可以看到采集链接规则从起始链接到全面列表页再到列表页上的文章页链接都已经成功采集。

第二步是采集内容，首先修改标题规则，在页面源代码里面找到标题的代码，把标题前后代码负责过去截取出标题。保存。

修改内容采集规则，跟标题规则差不多，也是源代码里面找到内容的前后代码。这里内容会有一些其他html标签，所以得添加一个html标签排除的规则。

完成后，测试看一下结果，从测试结果来调试规则，直到测试结果是自己想要的内容为止。

第三步是采集导出。前面1、2两步把规则设置好，最后就要把文章导出了。先做一个导出的模版。

然后选择方式二,把每一篇文章都分别记录到一个txt文本,保存位置自己选择,模板选择刚刚做好的导出模版.保存的文件名用文章标题为命名。其他默认，保存。

把采集网址，采集内容，发布3个选项框都勾选，然后开始采集。完成后文本就自动生成在刚刚保存的文件夹里面了。

火车头采集器采集文章教程到此就完成了，由于每个网站都是不一样的，所以这里只能用一个网站演示，只是一个方法思路，自己采集文章还需要灵活变通。

正确的正则：

document\.write\('<a\s+href="(?<content>([^\/"]*\/)*[^"]*\.jpg)"\s+id="jqzoomMain"\s+class="jqlightbox">

你的正则的错误在于：

1. (?<content>.*\/+.*\.jpg)中.*使用了贪婪匹配，匹配了所有的内容，而不光是/前的内容，正确的写法是[^/"]所有非/非"的内容。

2. (?<content>.*\/+.*\.jpg)中\/+加号修饰的是\/，而非.*\/也就是说只有斜杠可以重复N次，正确的写法是([^/"]*\/)+

词库加载错误未能找到文件“E高铁采集器内存溢出ConfigurationDictStopwordstxt”

# 上一篇：vue css样式需要刷新才能加载出来

# 下一篇：怎么查看电脑上是否安装了视频（摄像头）驱动