简单NodeJS爬虫和使用cookie进行模拟登录

JavaScript09

简单NodeJS爬虫和使用cookie进行模拟登录,第1张

       NodeJS做爬虫也是很方便的。因为nodejs有HTTP模块直接可以使用,而且还有很多简单粗暴的库可以即拿即用。       首先,需要的库文件,       1、superagent 是个轻量的的 http 方面的库,就像jquery的post,和get一样,很简单。       2、cheerio 是一个服务端操作DOM的库,简直就是服务端的jquery。     好的,我们需要抓取某个网站的题目。如下图。这个系统下,及时是游客状态也是可以查看题目的,只是答案我们看不到。会显示我没有登录。现在我们有个需求,先抓取15页,根据URL的参数可以页数就是地址中 的P。并且要有本地cookie,获取cookie的方法,最简单的是,利用浏览器登录网站之后,在控制台直接打印document.cookie,得到之后,复制进txt文本。用fs模块读取并转换成字符串。在superagent请求时,把cookie传进去。好了,控制台已经不输出“未登录”,说明已经登录成功了。

do{

    var user = prompt("请输入用户名:","")

    var psw = prompt("请输入密码:","")

    if(user=="admin"&&psw=="123456"){

        alert("登录成功!")

        break

    }else{

        alert("登录失败!")

    }

} while(true)

你可以将原系统的账号密码做成一个配置的json文件,

然后前端去访问这个文件,账号密码一一对应就可以了。

从第三方系统单点登录到目标系统,

第三方系统会发送token进行验证,通过解析token,

获取相应的用户信息的json串,将其set到自己系统的session中。