【R去重】 保留第一个重复去所有的重复

Python021

【R去重】 保留第一个重复去所有的重复,第1张

R语言第二章数据处理③删除重复数据

果子学生信

1.保留第一个重复: A,A,B,C --->A,B,C

2.去掉所有重复:A,A,B,C --->B,C

一般情况函数默认都是保留第一个重复。

比如:

在R中识别和删除重复数据:

主要运用 dplyr::n()

do包中的duplicate()命令和duplicated()命令的主要区别是前者包含了所有重复项,后者不包含重复的第一项。

duplicate()命令在开发版的do包中,CRAN上的do包并不包含这一命令。

安装方法是devtools:install_github("yikeshu0611/do")

去掉所有重复最简洁函数: df %>% group_by(a) %>% filter(n()==1)

cat Homo_sapiens.GRCh38.94.chr_patch_hapl_scaff.sorted.gtf | cut -f 9 | tr '' '\n' | grep "gene_biotype" | sed 's/gene_biotype//' | sort | uniq -c

ref:  在R语言中读取GTF文件的最好方法 | 果子学生信

source("https://bioconductor.org/biocLite.R")

biocLite("rtracklayer")

biocLite("SummarizedExperiment")

gtf1 <- rtracklayer::import('Homo_sapiens.GRCh38.90.chr.gtf')

gtf_df <- as.data.frame(gtf1)

test <- gtf_df[1:5,] #取第一至五行

View(test)

geneid_df <- dplyr::select(gtf_df,c(seqnames,start,end,strand,type,gene_name,gene_id,gene_biotype))

write.table(geneid_df,"geneid_df.txt",sep="\t",quote = F,col.names = F,row.names = F)

对于电源电压,应该是串联大于并联,可看出你说的电压应该是输出电压,往下看。

输出电压的话,设单个水果电源电压为U,内阻为r,负载阻值(即外电阻阻值)为R,则串联U1=3UR/(3r+R),并联U2=UR/(r/3+R),可以看出由r和R共同决定。当r<R时,U1>U2;当r=R是,U1=U2;当r>R时,U1<U2。

由此可见,你只是凑巧做实验的时候选取的负载电阻阻值小于了水果电池内阻而已。