R语言小作业

Python07

R语言小作业,第1张

ENSG00000000003.13

ENSG00000000005.5

ENSG00000000419.11

ENSG00000000457.12

ENSG00000000460.15

ENSG00000000938.11

提示:

第一步:删除已存在变量和使用命令( stringsAsFactors = FALSE )以防止出错(R often uses a concept of factors to re-encode strings. This can be too early and too aggressive. Sometimes a string is just a string.To avoid problems delay re-encoding of strings by using stringsAsFactors = FALSE when creating data.frames.)

第二步:导入数据

e1<-read.table("clipboard",header=T,sep=',')#读取剪切板的内容即其他地方复制后,直接使用该命令调取复制的内容。

或者直接新建.txt文档,将内容复制进去:

了解一下这个包的作用 >?org.Hs.eg.db

发现我们已有的信息ensembl_id,并且得知symbol(对象)这一列表示的是基因名,由此确定答题方向, 通过ensembl_id确定gene_id,再通过gene_id确定基因名

我们在g2e和我们已知的数据a的ensembl_id不一样,区别在于最后的版本号,我们已有数据有版本号,而得到的g2e没有版本号,所以先将其版本号去掉。

x,y:用于合并的两个数据框

by,by.x,by.y:指定依据哪些行合并数据框,默认值为相同列名的列.

all,all.x,all.y:指定x和y的行是否应该全在输出文件.

sort: by指定的列是否要排序.

suffixes: 指定除by外相同列名的后缀.

incomparables: 指定by中哪些单元不进行合并.

答案为:

在最后合并两个表格除了使用merge函数,还可以使用match函数

中间的失误:

提示:使用 http://www.cbioportal.org/index.do 定位数据集: http://www.cbioportal.org/datasets

打开 http://www.cbioportal.org/ ,操作如下:

得到另一种形式的图片,但是与网页制作的图片是一致的。

提示使用: http://www.oncolnc.org/

打开提示网址:

画出和网页一致的图(图片还需进一步查资料了解)

生存分析的基本了解: http://wemedia.ifeng.com/81829327/wemedia.shtml

如果 p 值小于阈值(0.05 或 0.01),则两组生存时间有显著差异。

1. 向量 Vector

    向量是用于储存数值型、字符型或逻辑型数据的一维数组。执行组合功能能的函数 可用来创建向量。

单个向量中的数据必须拥有相同的类型或模式(即数值型、字符型或逻辑型)。同一向量中无法混杂不同模式的数据。

2. 矩阵 Matrix

    矩阵是一个二维数组,知识每个元素都拥有相同的模式(数值型、字符型或逻辑型)。可通过函数 创建矩阵。

3. 数组 Array

    数组与矩阵类似,但是维度可以大于2。数组可通过 函数创建。

    数组是矩阵的一个自然推广。它们在编写新的统计方法时很有用。像矩阵一样,数组中的数据也只能拥有一种模式。从数组中选取元素的方法与矩阵相同。

4. 数据框 Data Frame

    这是R语言最常用的数据类型。不同的列可以包含不同模式的数据。每一列数据的模式必须相同,且必须等长。数据框可通过函数 创建。

5. 列表 List

    列表是一些对象(或成分)的有序集合。列表允许你整合若干(可能无关的)对象到单个对象名下。例如,某个列表中可能是若干向量、矩阵、数据框,甚至其他列表的组合。可以使用函数 创建列表。

    许多R的运行结果都是以列表的形式返回的。需要取出其中哪些成分由分析人员决定。