1、首先我们打开拉勾网,并搜索“java”,显示出来的职位信息就是我们的目标。
2、接下来我们需要确定,怎样将信息提取出来。
查看网页源代码,这时候发现,网页源代码里面找不到职位相关信息,这证明拉勾网关于职位的信息是异步加载的,这也是一种很常用的技术。
异步加载的信息,我们需要借助 chrome 浏览器的开发者工具进行分析~
1、Web开发
目前豆瓣、知乎、拉勾网等都是用的Python做开发,由此可见Web开发在国内的发展还是很不错的。
因为Python的web开发框架是最大的一个优势,如果你用Python搭建一个网站,只需要几行的代码,可谓是十分简洁。
2、网络爬虫
现在学习Python的人员中,大部分都是在学习爬虫,这也是Python的一大优势之一,最早用Python做网络爬虫的就是谷歌。
为什么用python写爬虫?
a. 跨平台,对Linux和Windows都有不错的支持
b. 科学计算,数值拟合:Numpy、Scipt
c. 可视化:2d:Matplotlib(做图很漂亮),3d:Mayavi2
d. 复杂网络:Networkx
e. 统计:与R语言接口:Rpy
f. 交互式终端
3、人工智能
发展潜力和钱途不用多说,这都是大家所知道的,但目前的话,人工智能方面的工作还是比较少的,而且都是高学历人士,以后的话肯定是最具有发展潜力的方向了。
4、服务器运维
运维也不陌生,最开始一批学习Python的人,就是运维和测试的在职人员,因为Python对于他们的工作起到很大的作用,因为使用Python脚本进行批量化的文件部署和运行调整都成了Linux服务器上很不错的选择。
5、数据分析
Python所拥有的完整的生态环境十分有利于进行数据分析处理,比如,"大数据"分析所需要的分布式计算、数据可视化、数据库操作等,都可以通过Python中的十分成熟的模块完成。