install.packages('gridExtra')
library(gridExtra)
#先画一个柱状图,观察friend_count这个变量的整体趋势,发现过度离散
p1<-ggplot(aes(x=friend_count),data=pf)+geom_histogram()
#log转化
p2<-p1+scale_x_log10()
#根号转化
p3<-p1+scale_x_sqrt()
#将三张图放在一个面板里
grid.arrange(p1,p2,p3,ncol=1)
最后我们发现,做了log转化的数据更接近正态分布。
首先order是直接返回位置的可以用which来取到满足条件的下标://定义a和向量ma=2.5m=c(1,2,3,4,5)//求差取绝对值k=abs(m-a)which.min(k)//只返回满足条件一个下标which(k==min(k))//可以返回所有的最小数的下标m[(k==min(k)]//返回所有满足条件的数不好意思,我直接回答了。分不给也不要紧,难道LZ在考试?