Go开发效率还高,半个小时就写了个爬虫,看,写分布式爬虫也是Go的优势,因为Go协程比Python和Java都容易写。
最后,如果你用Go写爬虫,还可以直接用Go来写网站,三句代码就可以建立一个Web服务器和Python差不多,但包管理机制简单,只需go get –u –v 包
用Golang做爬虫,当面对页面存在复杂的JS的情况,使用普通的http.get或者http.post,如不做特殊处理,将无法解析页面源代码。
在使用python的过程中,可以使用selenium进行爬取数据,或使用selenium自动化测试,那么用Golang怎么处理这个问题呢?
其实Golang中也有selenium,Selenium 作为一个用于 Web 应用程序测试的工具,可以模拟真实浏览器进行操作,也可以实现鼠标点击、滚轮、输入等用户日常操作。
我们通过2节课的学习,实现1、本地启动selenium服务;2、远程启动selenium服务。