Error in count(., name) : object 'name' not found
>df %>% dplyr::count (name,type)# 注意指定dplyr包
# A tibble: 6 x 3
name type n
<chr><chr> <int>
1 Alice english 1
2 Alice math 1
3 Bob english 1
4 Bob math 1
5 Carol english 1
6 Carol math 1
之前使用了均值、求和和计数
median()用法和mean()类似,只不过是中位数而已
注:mad()与IQR()基本等价,但是IQR()更适合有离群点的情况。
这三个函数的作用相当于x[1]、x[2]、x[length(x)]
通过此函数也可以找出最早和最晚出发的航班
n():不需要任何参数,返回当前分组的大小
sum(!is.na(x)):计算非缺失值的数量
n_distinct(x):计算唯一值的数量
count()函数:用于只需要计数的情况
例如:
计算哪个目的地有最多的航空公司?
count()函数用法举例:计算目的地不同的飞机数量
count()函数中可以添加加权变量,例如distance,用于计算飞机飞行里程(相当于求和)
以下一例:找出出发时间小于5:00的航班总数
以下一例:找出延误超过一小时的航班比例