Go开发效率还高,半个小时就写了个爬虫,看,写分布式爬虫也是Go的优势,因为Go协程比Python和Java都容易写。
最后,如果你用Go写爬虫,还可以直接用Go来写网站,三句代码就可以建立一个Web服务器和Python差不多,但包管理机制简单,只需go get –u –v 包
不是啊,都可以啊,比如C(万能的啥都可以做),C++(也基本是万能的,爬虫不算啥),python(简单,几十行代码能搞定一个小型爬虫),go当然也可以。没有限制的!
希望我的回答对你有帮助望采纳!
colly一款快速优雅的golang爬虫框架,简单易用,功能完备。
官网地址: http://go-colly.org/
包地址: import "github.com/gocolly/colly"
一个简单的例子:
使用方式概括下来主要有三步:
创建采集器时可以指定一些配置参数,如useragent,爬取深度及日志等
回调函数共有7中
通过浏览器开发者工具查看jianshu.com结构如下
文章列表为ul标签,中间每一项是li标签,li中包含content,content中包含title,abstract和meta标签