根据python官网资料显示,total的用法是计数,类似于sum,count等计算函数。
Python由荷兰数学和计算机科学研究学会的GuidovanRossum于1990年代初设计。
1.定义函数def get_counts(sequence):
counts={}
for x in sequence:
if x in counts:
counts[x]+= 1
else:
counts[x]=1
return counts
2.定义函数(利用python标准包)
from collections import defaultdict
def get_counts2(sequence):
counts=defaultdict(int)#所以得值均会被初始化W为0
for x in sequence:
if x in counts:
counts[x]+= 1
return counts
3.python标准库中找到collections.Counter类
from collections improt Counter
counter(sequence)
value_counts是一种查看表格某列中有多少个不同值的快捷方法,并计算每个不同值有在该列中个数,类似Excel里面的count函数
其是pandas下面的顶层函数,也可以作用在Series、DataFrame下
常规用法:
pandas 的 value_counts() 函数可以对Series里面的每个值进行计数 并且 排序,默认是降序
可以看出,既可以对分类变量统计,也可以对连续数值变量统计
如果是要对结果升序排列,可以添加 ascending=True 来改变
如果不想看统计的个数,而是想看占比,那么可以设置 normalize=True 即可,结果是小数形式
可以通过apply,对每一列变量进行统计
以上是自己实践中遇到的一些点,分享出来供大家参考学习,欢迎关注DataShare公众号