2.setwd('E:graduation-design/OC/sctransform')#设置工作路径,引号内的内容是一个例子,注意路径最好不要有中文和特殊符号。
3.install.packages.('包')#下载包
4.library(包)#加载包
5.update.packages(包)# 可以更新已经安装的包。
6.help(package = "包") # 获取该R包的帮助文件
7.head(object) #查看对象的前6行
8.tail()#查看对象的后6行
9.[,1]#访问数据的第一列
10.rm(object) #删除对象
11.save.image("myfile") #保存工作空间到文件myfile中(默认值为.RData)
12.example("foo")#函数foo的使用示例(引号可以省略)
13.class(object) #显示某个对象的类或类型
14.c()#定义向量
15.print() #展示数据
16.mode() # 查看数据类型
17.na.rm = TRUE# 去除缺失值
18.is.na() #检查是否有缺失值
19.na.omit() # 删除包含缺失值的行
20.nchar() #统计字符串长度
21.substr(x = ,start = 1, stop = 3) # 提取字符串(首字母大写)
22.toupper()#将字符串都转化成大写
23.tolower() #将字符串都转化成小写
24.gsub("^(\\w)","\\U\\1",tolower(temp),perl = T) #首字母大写
25.gsub("^(\\w)","\\L\\1",upper(temp),perl = T) #首字母小写
26.Sys.Date() # 显示目前系统的时间
27.read.table("c:/路径",seq = "") # 读取excel
28.read.table(网址) #读取网站内容
29.read.table("clipboard")#读取剪切板中的文件
30.read.table(gzfile("文件")) #读取压缩文件
31.write(x,file = "x,txt") #输出文本
32.write.table(x,gzfile("文件名"))# 输出压缩文件
第一步:导入数据
data1<-read.table('clipboard',header=T) (其中,将EXCEL表格中的数据先复制,然后进行导入,即可),
第二步:将数据框转化为矩阵(A)
A<-as.matrix(data1)
第三步:将数据框的第一行的标题去掉
colnames(A)<-NULL
第四步:求矩阵A的转置阵,设转置阵为A1
A1<-t(A)
第五部:计算矩阵A与其转置阵A1相乘
H1<-A%*%A1
ENSG00000000003.13
ENSG00000000005.5
ENSG00000000419.11
ENSG00000000457.12
ENSG00000000460.15
ENSG00000000938.11
提示:
第一步:删除已存在变量和使用命令( stringsAsFactors = FALSE )以防止出错(R often uses a concept of factors to re-encode strings. This can be too early and too aggressive. Sometimes a string is just a string.To avoid problems delay re-encoding of strings by using stringsAsFactors = FALSE when creating data.frames.)
第二步:导入数据:
e1<-read.table("clipboard",header=T,sep=',')#读取剪切板的内容即其他地方复制后,直接使用该命令调取复制的内容。
或者直接新建.txt文档,将内容复制进去:
了解一下这个包的作用 >?org.Hs.eg.db
发现我们已有的信息ensembl_id,并且得知symbol(对象)这一列表示的是基因名,由此确定答题方向, 通过ensembl_id确定gene_id,再通过gene_id确定基因名 。
我们在g2e和我们已知的数据a的ensembl_id不一样,区别在于最后的版本号,我们已有数据有版本号,而得到的g2e没有版本号,所以先将其版本号去掉。
x,y:用于合并的两个数据框
by,by.x,by.y:指定依据哪些行合并数据框,默认值为相同列名的列.
all,all.x,all.y:指定x和y的行是否应该全在输出文件.
sort: by指定的列是否要排序.
suffixes: 指定除by外相同列名的后缀.
incomparables: 指定by中哪些单元不进行合并.
答案为:
在最后合并两个表格除了使用merge函数,还可以使用match函数
中间的失误:
提示:使用 http://www.cbioportal.org/index.do 定位数据集: http://www.cbioportal.org/datasets
打开 http://www.cbioportal.org/ ,操作如下:
得到另一种形式的图片,但是与网页制作的图片是一致的。
提示使用: http://www.oncolnc.org/
打开提示网址:
画出和网页一致的图(图片还需进一步查资料了解)
生存分析的基本了解: http://wemedia.ifeng.com/81829327/wemedia.shtml
如果 p 值小于阈值(0.05 或 0.01),则两组生存时间有显著差异。