作为一种语言进行统计分析,R有一个随机数生成各种统计分布功能的综合性图书馆。R语言可以针对不同的分布,生成该分布下的随机数。其中有许多常用的个分布可以直接调用。
在R中各种概率函数都有统一的形式,即一套统一的前缀+分布函数名:
d 表示密度函数(density)。
p 表示分布函数(生成相应分布的累积概率密度函数)。
q 表示分位数函数,能够返回特定分布的分位数(quantile)。
r 表示随机函数,生成特定分布的随机数(random)。
扩展资料:
注意事项:
1、使用了错误大小写:help()是正确的,其他都是错误的。
2、不要忘记使用必要的引号:install.packages(“gclus”)。
3、在函数调用时,不要忘记使用括号:help()。
4、在Windous上,路径名中使用的是\。
5、R拥有许多用于存储数据的对象类型,包括标量、向量、矩阵、数组、数据框和列表。数据框是用来存储数据集的主要数据结构。
参考资料来源:百度百科-R语言
参考资料来源:百度百科-标准正态分布
参考资料来源:百度百科-散点图
储存原始数据后,将其在R中命名为test,运行以下数据就能得到你要的条形图了tp <- barplot(test$Length_distribution, names.arg=test$Sequence_size, las =2, ylim=c(0,30000),col="black")
text(tp, test$Length_distribution, labels =test$Length_distribution,pos=4,srt=90,offset=0)
可以用内置的graphic包来画,就是plot()和curve()
也可以用ggplot2来画,后者更灵活。
graphic
# 先生成一组随机数x <- rnorm(2000)
# 画频率直方图, 分30个bin
hist(x, freq = F, breaks = 30)
# 再画概率分布曲线
lines(density(x, bw=.5), col="red", lwd=2)
2. ggplot2
# 准备工作, 把x设成一个数据集library(ggplot2)
data <- data.frame(x = x)
# 生成底层和直方图,概率线的图层
p <- ggplot(data, aes(x = x, y = ..density..))
p <- p + geom_histogram(fill = "navy")
p <- p + geom_density(colour = "green")
p
画出来风格不太一样,看你口味了