如何学习数据分析

Python05

如何学习数据分析,第1张

【转自网络】

首先,我要说的是我觉得你是一名在校大学生!Data Mining不是你想的那么简单,他不单单和数学有关系,还包括了计算机领域的诸多学科。还有社会工程学、逻辑学等文科和理科的交叉学科!他是一门庞大的体系。你要是真想学我只能给你指条比较快的成才之路,后面的东西自己慢慢学都赶趟!慢慢充实自己!大学四年好好利用!学无止境!

既然是数据分析那你的高等数学必须要过硬,别着急这只是你的其他学科的基础课。其次是概率与统计,这才是正科,大学那点玩意就是糊弄人的,你要多看这方面的书。这个一定要学好!线性必须要会要精通。因为数据划分是数据挖掘里最重要的一个环节。这个就是线性范畴里的了。也要精通,学会线性分析你就发现你就学会了很多。数学有这三个底子就可以了。数学分析不要看了。因为那只是高数的延伸!

计算机你一定要懂。数据库你必须得学会。三大数据库ORACLE.SQL.MYSQL原理基本类似触类旁通!

还有就是培养你的思维,尽量缜密敏捷。这样才可以发现数据中的不同!因为有的数据挖掘是计算机处理的。有的则是纸面上的。所以必须学会记录

好了,就先这么多了。你学会了这几个就是你进军下一步的基础,这几个就够你学一阵子的了。

祝你好运哥们!

数据挖掘的起点很高——

1、统计学

2、机器学习

3、数学——图论,最优化理论等。

WEB上的数据结构更加复杂。

python语言————应该学习

抱歉,事情太多,如果不追着就忘了!我认为你作为企业员工对数据挖掘感兴趣,最主要的就是从应用和解决问题开始,所以我想把数据挖掘这个狭义定义的内容改成你应该对数据分析感兴趣,数据挖掘只是数据分析的一个重要工具和解决方法之一!

数量统计知识方面:我认为统计思想是数学在实践中最重要的体现,但对于实际工作者最重要的是掌握统计思想,其实统计理论非常复杂,但实际应用往往是比较简单的!比如,很多人都在大学学了假设检验,但实际应用中假设就是看P值是否小于0.05,但是H0是什么?拒绝还是接受的是什么现实问题;要理解!

掌握软件问题:从软件角度学,是非常好的思路,我基本上就是这样学的。我常说编软件的人最懂理论,否则编不出来,编软件的人最知道应用,否则软件买不出去;现在软件越来越友好,把软件自带案例做一遍,你会自觉不自觉的掌握软件解决问题的思路和能解决的问题类型;

数据仓库问题:OLAP和数据挖掘是数据仓库建立基础上的两个增值应用,从企业整体角度,数据挖掘应该建立在企业数据仓库完备的基础上。所以说数据仓库是针对企业级数据挖掘应用提出的,但我们应该记住,企业从来不是为了数据挖掘建立数据仓库,而是因为有了数据仓库后必然会提出数据挖掘的需求!现在随着数据挖掘软件的工具智能化,以及数据仓库和ETL工具的接口友好,对数据库层面的要求越来越少;

数学不好可能反应了一个人思考问题的方式或深入理解问题的能力,但数学不是工具是脑具,不断解决问题的过程可以让我们思考问题更数学化!

沈浩老师建议:

不急,一步一步来!先把本职工作中的数据分析问题理解了,干好了!

熟练玩好Excel软件工具,这个可以看《Excel高级应用与数据分析》我写的书,当然有很多Excel论坛和网站,从我的博客就可以连接到。

学习好统计分析方法,我不是单指统计原理,而是统计分析方法,比如回归分析,因子分析等,不断进入统计分析解决问题的思考方式;这个可以看看SPSS软件方面的书和数据案例,通过软件学习解决数据分析的统计问题,这方面的书很多,当然你也可以关注我的博客,不断增加统计分析方法解决数据分析问题的思路,自己对照着完成!

在上述问题有了比较好的理解后,也就是你应该算是一个数据分析能手的时候,开始进入数据挖掘领域,你会发现用数据挖掘思想解决问题具有智能化、自动化的优势,接下来,你需要考虑数据建模的过程,通过学习Clementine软件或SAS的挖掘工具,不断理解数据挖掘与原来的数据分析工具有什么不同或优势!

当前面都是了解并且能够得心应手后,你就要有针对性的掌握你工作所在行业的问题,例如:电信行业的解决方案问题:客户流失、客户价值、客户离网、客户保持、客户响应、客户交叉销售等商业模型,同时与数据分析和数据挖掘统一在一起的解决方案!

接下来,你应该掌握数据库的一些原理和操作,特别是SQL语言的方式

你到了这个阶段,就应该有全面解决问题的能力,比如挖掘出来的知识或商业规则如何推送到营销平台上等等

梳理自己的知识结构,不仅会操作,现在你应该成为专家了,要能够宣扬你的知识能力和领导力,当然也要表明你在数据挖掘领域的专业特长

要经常帮助同事和行业朋友,比如帮助解决数据分析问题,帮助咨询,甚至给大家讲课,这对你的知识梳理和能力的提高非常重要,你的自信心会更强!

有兴趣,可以建立一个博客或什么,不断写点东西,经常思考和总结

结交广泛的朋友!

关于入门的教材:

互联网,其实不用买什么书网络基本都有;要有好的搜索能力,当然包括搜各种软件!

SPSS和Clementine软件的说明和案例,都做一遍;

《数据挖掘——客户关系管理的艺术》

《调查研究中的统计分析法》

《Excel高级应用与数据分析》

《数据展现的艺术》

人工智能是计算机科学的一个分支,并不是一个单一学科,图像识别、自然语言处理、机器人、语言识别、专家系统等等,每一个研究都富有挑战。对人工智能感兴趣,但无法确定具体方向,如何了解人工智能现状和研究领域?

笔者推荐4本科普书,对于大多数人来说,阅读难度不高,公式和理论少,内容有趣,能读得下去;信息较新鲜且全,要有一定阅读价值,能够有深入的思考当然更好。书单不长,只用做科普入门。

1、《超级智能》

2、《我们最后的发明:人工智能与人类时代的终结》

3、《智能时代》

4、《人工智能:国家人工智能战略行动抓手》

数据分析师的基本工作流程:

1.定义问题

确定需要的问题,以及想得出的结论。需要考虑的选项有很多,要根据所在业务去判断。常见的有:变化趋势、用户画像、影响因素、历史数据等。

2.数据获取

数据获取的方式有很多种:

一是直接从企业数据库调取,需要SQL技能去完成数据提取等的数据库管理工作。

二是获取公开数据,政府、企业、统计局等机构有。

三是通过Python编写网页爬虫。

3.数据预处理

对残缺、重复等异常数据进行清洗。

4.数据分析与建模

这个部分需要了解基本的统计分析方法、数据挖掘算法,了解不同统计方法适用的场景和适合的问题。

5.数据可视化和分析报告撰写

学习一款可视化工具,将数据通过可视化最直观的展现出来。

数据分析入门需要掌握的技能有:

1. SQL(数据库):

怎么从数据库取数据?怎么取到自己想要的特定的数据?等这些问题就是你首要考虑的问题,而这些问题都是通过SQL解决的,所以SQL是数据分析的最基础的技能。

2. excel

分析师更多的时候是在分析数据,分析数据时需要把数据放到一个文件里,就是excel。

熟练excel常用公式,学会做数据透视表,什么数据画什么图等。

3.Python或者R的基础:

必备项,也是加分项,在数据挖掘方向是必备项,语言相比较工具更加灵活也更加实用。

4.学习一个可视化工具

如果你想往更高层次发展,上面的东西顶多只占20%,剩下的80%则是业务理解能力,目标拆解能力,根据数据需求更多新技能的学习能力。