所谓一般命令,就是在一定时间内会执行完的命令。比如 grep, cat 等等。 执行命令的步骤是:连接,执行,获取结果
连接
连接包含了认证,可以使用 password 或者 sshkey 2种方式来认证。下面的示例为了简单,使用了密码认证的方式来完成连接。
import (
"fmt"
"time"
"golang.org/x/crypto/ssh"
)
func connect(user, password, host string, port int) (*ssh.Session, error) {
var (
auth []ssh.AuthMethod
addr string
clientConfig *ssh.ClientConfig
client *ssh.Client
session *ssh.Session
err error
)
// get auth method
auth = make([]ssh.AuthMethod, 0)
auth = append(auth, ssh.Password(password))
clientConfig = &ssh.ClientConfig{
User: user,
Auth: auth,
Timeout: 30 * time.Second,
}
// connet to ssh
addr = fmt.Sprintf("%s:%d", host, port)
if client, err = ssh.Dial("tcp", addr, clientConfig)err != nil {
return nil, err
}
// create session
if session, err = client.NewSession()err != nil {
return nil, err
}
return session, nil
}
连接的方法很简单,只要提供登录主机的 用户*, *密码*, *主机名或者IP*, *SSH端口
执行,命令获取结果
连接成功后,执行命令很简单
import (
"fmt"
"log"
"os"
"time"
"golang.org/x/crypto/ssh"
)
func main() {
session, err := connect("root", "xxxxx", "127.0.0.1", 22)
if err != nil {
log.Fatal(err)
}
defer session.Close()
session.Run("ls /ls /abc")
}
上面代码运行之后,虽然命令正常执行了,但是没有正常输出的结果,也没有异常输出的结果。 要想显示结果,需要将 session 的 Stdout 和 Stderr 重定向 修改 func main 为如下:
func main() {
session, err := connect("root", "xxxxx", "127.0.0.1", 22)
if err != nil {
log.Fatal(err)
}
defer session.Close()
session.Stdout = os.Stdout
session.Stderr = os.Stderr
session.Run("ls /ls /abc")
}
这样就能在屏幕上显示正常,异常的信息了。
交互式命令
上面的方式无法远程执行交互式命令,比如 top , 远程编辑一个文件,比如 vi /etc/nginx/nginx.conf 如果要支持交互式的命令,需要当前的terminal来接管远程的 PTY。
func main() {
session, err := connect("root", "olordjesus", "dockers.iotalabs.io", 2210)
if err != nil {
log.Fatal(err)
}
defer session.Close()
fd := int(os.Stdin.Fd())
oldState, err := terminal.MakeRaw(fd)
if err != nil {
panic(err)
}
defer terminal.Restore(fd, oldState)
// excute command
session.Stdout = os.Stdout
session.Stderr = os.Stderr
session.Stdin = os.Stdin
termWidth, termHeight, err := terminal.GetSize(fd)
if err != nil {
panic(err)
}
// Set up terminal modes
modes := ssh.TerminalModes{
ssh.ECHO: 1, // enable echoing
ssh.TTY_OP_ISPEED: 14400, // input speed = 14.4kbaud
ssh.TTY_OP_OSPEED: 14400, // output speed = 14.4kbaud
}
// Request pseudo terminal
if err := session.RequestPty("xterm-256color", termHeight, termWidth, modes)err != nil {
log.Fatal(err)
}
session.Run("top")
}
学习 python 爬虫的路线
学习Python有个学习方向能够少走点弯路,就像在实习的时候,能够遇到一个好老大,给你稍微指一下方向,比你自己瞎jb琢磨的结果肯定结果相差很大。毕竟人家认知比你高上一截。
基本的 Python 语法
要用 Python 来写爬虫,当然是需要 Python 的基本语法了。Python的基本语法不难,之前我就写了一个小教程,讲的是 Python3 的一些基本使用,可以看看这里:python3入门基础有趣的教程
抓包工具
爬虫要去抓取网页上的内容,一些请求参数和返回数据信息,需要去分析和抓取,熟悉一下抓包工具的使用还是很有必要的,这不,我也写了一个关于 Fiddler 的使用:Fiddler抓包工具完全使用教程,还顺便装了个逼!
爬虫常用到的模块
Python 有一些内置的库,专门对一些网页数据的请求和解析使用的,比如urllib,http。
正则表达式
抓包获取到的数据,有很多数据是你不想要的,我们只需要拿到我们想要的数据就可以了,那么这个时候呢,正则表达式就派上用场了,常用的有:re,Xpath,BeautifulSoup。
反爬机制
有些网站被爬取怕了,做了一些爬虫的限制,要学点反爬机制才行,header,robot,时间间隔,ip代理,UA限制,Cookie限制等。
数据存储
爬取到的数据要存储下来吧,那么就要会数据库的操作,比如mysql。还要会数据去重操作。
爬虫效率
提高爬取数据的效率,就需要使用多线程,分布式。
爬虫的框架
站在巨人的肩膀上尿尿,那么就需要知道框架怎么使用,比如Scrapy,PySpider,简直牛逼。
我的思路是这样,因为自己起点低,还精力有限,又想弯道追上技术潮流,所以着眼未来,选择Golang。既然敢叫云技术语言,那么它的性能自然是适合未来发展的,像facebook这样的大公司貌似也挺重视它…最最主要的,赌它未来能全栈应用,期待可以直接上手用Go开发Android和iOS应用的那一天~框架选择上吗,初级选手建议Revel(开源案例比较多,老框架、Go官方给予了该框架很高的评价),其实Go语言众多框架性能都很卓越,水平高的不用框架直接玩更爽。顺嘴吐一下槽,Go语言框架之多如少女脸上的青春痘~
对了,选择Go语言的好处是,各个社区学习互助氛围比较好,你去哪个网上社区去请教问题,都会有人热情解答~