如何采集JS的内容

JavaScript031

如何采集JS的内容,第1张

三种情况:

1、JS代码在页面中的:右击网页-查看源代码--复制代码。

2、JS代码在XXX.js文件里的:复制js文件地址到网页地址栏中,可以直接下载

3、对方设置了JS防窃取程序,这样你什么都弄不到

说明一点,大部分的JS代码都是步骤1,2相结合的!

望采纳

访问需要采集的页面,如果数据是用js输出的html,那么必定有接口或者本身页面中给js提供了数据,来遍历输出html。

用chrome的审查元素中的network,可以单独看xhr,看看是否是ajax请求的接口,如果数据是从接口来的,直接用PHP去获取那个接口的数据就可以了。

如果没有ajax请求,查看html源代码,在里面找数据。

我用Jsoup写爬虫,一般遇到html返回没有的内容。但是浏览器显示有的内容。都是分析页面的http请求日志。分析页面JS代码来解决。

1、有些页面元素被隐藏起来了->换selector解决

2、有些数据保存在js/json对象中->截取对应的串,分析解决

3、通过api接口调用->伪造请求获得数据

还有一个终极方法

4、使用phantomjs或者casperjs这种headless浏览器