python数据分析要学4点:
1、熟练地使用数据分析主流工具。
2、数据库、数据采集核心技能。
3、数据分析高级框架。
4、实际业务能力与商业分析。
自然智能,指人通过大脑的运算和决策产生有价值的行为。这些行为包括了人的大脑思考及决策、耳朵听力及判断、眼睛视觉及判断、鼻子嗅觉及判断、皮肤触觉及判断等,体现在人行为的方方面面。
人工智能是计算机科学的一个分支,它企图了解智能的本质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器。
本文中介绍的是pandas的高阶应用-分类数据category
一个列中经常会包含重复值,这些重复值是一个小型的不同值的集合。
unique() 和 value_counts() 能够从数组中提取到不同的值并分别计算它们的频率
维度表包含了不同的值,将主要观测值存储为引用维度表的整数键
不同值的数组被称之为数据的类别、字典或者层级
如果不指定顺序,分类转换是无序的。我们可以自己显式地指定
如果在特定的数据集上做了大量的数据分析,将数据转成分类数据有大大提高性能
特殊属性cat提供了对分类方法的访问
在机器学习或统计数据中,通常需要将分类数据转成虚拟变量,也称之为one-hot编码
利用python进行数据分析
链接: https://pan.baidu.com/s/15VdW4dcuPuIUEPrY3RehtQ
?pwd=3nfn 提取码: 3nfn本书也可以作为利用Python实现数据密集型应用的科学计算实践指南。本书适合刚刚接触Python的分析人员以及刚刚接触科学计算的Python程序员。