2 如何用Python进行数据计算

Python013

2 如何用Python进行数据计算,第1张

numpy计算平均数 标准差 相关系数等基本知识

NumPy 是python 语言的一个第三方库,其支持大量高维度数组与矩阵运算。此外,NumPy 也针对数组运算提供大量的数学函数。

#导入Numpy库,并命名为np

import numpy as np

#创建一维数组

a = np.array([1, 2, 3])

# NumPy可以很方便地创建连续数组,比如我使用arange或linspace函数进行创建:

b = np.arange(1,5,1) // 返回一个有终点和起点、固定步长的排列,如起点是1,终点是4,步长为1,即【1,2,3,4】,

c = np.linspace(1,9,5) 返回一个有终点和起点、元素个数的的排列,如起点是1,终点是9,元素个数为5,即【1,3,5,7,9】

#通过NumPy可以自由地创建等差数组,同时也可以进行加、减、乘、除、求n次方和取余数。

求和:np.sum(a)

求取平均值:np.mean(a)

求取中位数:np.median(a)

求取加权平均数:np.average(a)

求取方差:var() np.var(a)

求取最小值:np.amin(a)

求取最大值:np.amax(a)

将两个数相加:np.add(x1, x2)

将两个数相减:np.subtract(x1, x2)

将两个数相乘:np.multiply(x1, x2)

将两个数相除:np.divide(x1, x2)

立方:np.power(x1, x2)

除余:np.remainder(x1, x2)

相关系数计算:np.corrcoef(a1, a2) (a1、a2都是矩阵)

数据的标准化(normalization)是将数据按比例缩放,使之落入一个小的特定区间。在某些比较和评价的指标处理中经常会用到,去除数据的单位限制,将其转化为无量纲的纯数值,便于不同单位或量级的指标能够进行比较和加权。最典型的就是数据的归一化处理,即将数据统一映射到(0,1]区间上

(1)0-1标准化

将数据的最大最小值记录下来,并通过max-min作为基数(即min=0,max=1)进行数据的归一化处理

x=(x - min) / (max - min)

(2)Z-score标准化

Z分数(z-score),是一个分数与平均数的差再除以标准差的过程 → z=(x-μ)/σ,其中x为某一具体分数,μ为平均数,σ为标准差

Z值的量代表着原始分数和母体平均值之间的距离,是以标准差为单位计算。在原始分数低于平均值时Z则为负数,反之则为正数

数学意义:一个给定分数距离平均数多少个标准差?