如何自学成为数据分析师?

Python018

如何自学成为数据分析师?,第1张

数据时代的到来,意味着数据增长的速度急速攀升。一方面,互联网+的经济模式使得传统行业也迸发出了巨大的数据体量。另一方面,传统互联网企业如今也做的风生水起,产业链不断完善,譬如BAT巨擘,每天产生的数据量非常惊人。

在这样的背景下,数据分析师开始应运而生,并蓬勃发展,而数据分析师也成为当下炙手可热的职位。那究竟应该如何成为一名数据分析师呢。在我看来,数据分析师需要从统计学,分析技能以及业务常识三个方面进行入手学习,这里重点说一下后两者。

首先来说分析技能。

Excel作为经典的数据分析工具,是数据分析师必备的武器库。灵活的Excel有两大经典利器,透视表以及灵活的函数。而在函数中,尤为重要的便是Vlookup。这个函数是用于进行字段匹配的,在实际工作中应用非常广泛。

Excel常用于基本的数据描述,并且可以处理的样本量非常有限。而在大数据时代,为了解决海量数据的查询,SQL就应运而生了。SQL基本可以分为增删改查四大模块,其中具体的语法又有where,select等。

除了Excel以及SQL之外,数据挖掘的工具也是必不可少的。如果没有编程基础,可以学习SPSS。而如果有编程,建议学习Python以及R。

说完分析技能,我们再来说一下业务知识。

业务知识并不是简单就能学会的,本质上是需要在企业中摸爬滚打才能学会的。然而,好的书籍也可以让你对业务知识有一定的了解。推荐两本书:《增长黑客》以及《精益数据分析》。

如果有问题,欢迎评论,一同探讨。

首先R是一种专业性很强的统计语言,如果想学得快一些的话,基本的统计学知识要懂,不然很多东西会掌握的比较慢。

掌握基本语法和操作,推荐国内的已经翻译的比如《R语言实战》《R语言编程艺术》,这个过程中最好结合一些小例子来做一些分析的东西。其他还有《R语言实例》《R语言核心技术手册》也都是很好的书!如果需要可视化的话,强烈不推荐学习R本身的作图系统,实在是太不友好了.....还是用ggplot2吧。

掌握了上面的,就可以深入一些了,如果是做数据分析和可视化,推荐《ggplot2:数据分析与图形艺术》,这个才是作图的神器啊.....如果是空间分析相关的,推荐《Applied Spatial Data Analysis with R》,这个如果可以的话看英文版,而且要有地学的一些知识背景,中文版翻译的太次了,尽量不要看。数据挖掘机器学习之类的,可以看看比如《数据挖掘与R语言》、《机器学习——实用案例解析》,不过我觉得这几本书没上面的那几本好,但是可以大概看看是咋回事,最好还是看看专门的相关书籍,熟悉各种算法和流程,到时候搜索R的package,照着文档和例子搞定,不是特别难。

最后,强烈推荐统计之都、R-bloggers,统计之都以及谢益辉、肖凯、刘思喆等人的博客(自行Google以及到上面的网站找链接),订阅一下,会很有帮助,RStudio是个很棒的IDE,用起来很爽,功能很强大。

总之,你可以从《R语言实战》开始出发吧!