如何用python算方差 借助numpy的向量运算更快速

Python032

如何用python算方差 借助numpy的向量运算更快速,第1张

用python算方差可以借助numpy的向量运算来求更快速:

import numpy

narray=numpy.array(nlist)

sum1=narray.sum()

narray2=narray*narray

sum2=narray2.sum()

mean=sum1/N

var=sum2/N-mean**2

以下为代码:

numstr = input("请输入全部数据:用英文逗号(,),中文逗号(,),\

空格( ),制表符(tab键)或换行(请一次性复制过来)中的一种统一分隔数据:")

if "," in numstr:

  numlist = numstr.split(",")

elif "," in numstr:

  numlist = numstr.split(",")

elif "\t" in numstr:

  numlist = numstr.split("\t")

elif "\n" in numstr:

  numlist = numstr.split("\n")

elif " " in numstr:

  numlist = numstr.split(" ")

else:

  numlist = [numstr]

numlist = list(map(lambda x:x.strip(",").strip(",").\

                 strip("\t").strip("\n").strip(" "), numlist))

for i in numlist.copy():

  try:

      a = float(i)

  except:

      numlist.remove(i)

      print("已过滤字符串:%s"%i)

#好了,上面很多只是方便用户而已(但还是有一些有用的),主要是下面

numlist = list(map(lambda x:float(x), numlist))#所有字符串转为浮点

print("最终数列:",numlist)#输出最终数列,进行核对

average = sum(numlist)/len(numlist)#用数列和除以出列长度得到平均数

variance = 0#方差,先记为0

for i in numlist:#遍历列表

  variance += (i - average) ** 2#反正就是公式对吧,先加进去

variance /= len(numlist)#还是公式,那一长串还得除以一个数列长度

print("均值:%.2f\n方差:%.2f"%(average, variance))#分两行输出

以下为输出效果:

请输入全部数据:用英文逗号(,),中文逗号(,),空格( ),制表符(tab键)或换行(请一次性复制过来)中的一种统一分隔数据:38,22,99,10,99,7, 25,,40

已过滤字符串:

最终数列: [38.0, 22.0, 99.0, 10.0, 99.0, 7.0, 25.0, 40.0]

均值:42.50

方差:1181.75

以下为解析:

平均值的思路就是总和除以列表长度,方差的思路就是把所有的(x-均值)²加起来,最后再除以一个长度即可。

本程序的优点:输入时逗号后出现空格与不小心多打逗号等情况都不会出问题,可以接受小数,可以先输出最终数列以供核对。

自定义函数求解即可,参考代码如下:

def f_sigma(x):

# 通过Python定义一个计算变量波动率的函数

# x:代表变量的样本值,可以用列表的数据结构输入

n = len(x)

u_mean = sum(x)/n #计算变量样本值的均值

z = [] #生成一个空列表

for t in range(n):

z.append((x[t]-u_mean)**2)

return (sum(z)/(n-1))**0.5# n-1 自由度

a = f_sigma(x = [1,2,3])

print('样本方差:', a)