上课时,老师:“先不下R studio了,这个初学够用。”
哈哈哈哈哈好的。
程序可以不难学,反正我不太喜欢上来就搞最难的,零基础小白菜得安详。
哎呀,这个课老师真的超可爱,先介绍了“R当计算器比电脑自带的好用多了!”,安利了一波计算器使用方法,像极了分享自己宝贝玩具的大男孩。
R当做计算器也的确简单。把脑子里想的数学公式打进去按回车就行了。
数学函数表示方式可能得查一下。百度必应谷歌,一搜解千愁。
常见:pi --π ;sqrt(2)=根号2;log()=ln();exp()=e^x.
说起来这些对我来说也不常用,用不到的知识又增加了
好了,
1、基础概念之向量,Vectors:【向量是一串有序数据,向量内】
R里vectors分三种,数值、逻辑值、字符串,英文分别是
Numeric vectors
Logical vectors
Character vectors。
mode(x)语句可查看哪一类。
R里的向量表示方式:
输入数值可直接 c(1,2),字符串需要加单/双引号:c('hi',"morning")
逻辑值按回车后可判断正误,true false,或者NA(not available)。
2、变量、变量名、赋值
变量,咋说呢,定义是“A variable is used to store information”,反正就指代某一大串信息。
接下来,给变量起名字,并赋值。起名字有讲究的。
对了,打字之前,先知道一句R对大小写敏感(大小写敏感是说,大写小写在R看来是不同的东西,Yes 不等于 yes ),请把这句话记好。
起名字的规矩其实就三条:
1、可以有√:A-Z, a-z, 0-9, 英文句号 (.) 下划线 (_)
2、不能有×:空格,reserved keywords
3、开头只能是字母或点
(保留字是啥之后再说叭,今天用不到)
好了,现在已经会起名字了。再也不怕变量太多分不清了
那开始把名字和数据配配对。
赋值符号 :"
x=2, x
在R看来一个意思。
那怎么告诉它我想要的是“x小于负二”?
加空格。x<-2
是不是很妙
在我们实际建模拟合时,若数据中某个变量过度离散,则需要做转化,常见的有做log和根号两种方式。
install.packages('gridExtra')
library(gridExtra)
#先画一个柱状图,观察friend_count这个变量的整体趋势,发现过度离散
p1<-ggplot(aes(x=friend_count),data=pf)+geom_histogram()
#log转化
p2<-p1+scale_x_log10()
#根号转化
p3<-p1+scale_x_sqrt()
#将三张图放在一个面板里
grid.arrange(p1,p2,p3,ncol=1)
最后我们发现,做了log转化的数据更接近正态分布。
首先order是直接返回位置的可以用which来取到满足条件的下标://定义a和向量ma=2.5m=c(1,2,3,4,5)//求差取绝对值k=abs(m-a)which.min(k)//只返回满足条件一个下标which(k==min(k))//可以返回所有的最小数的下标m[(k==min(k)]//返回所有满足条件的数不好意思,我直接回答了。分不给也不要紧,难道LZ在考试?