求氨基酸的三字符号转单字符号 的R语言代码

Python040

求氨基酸的三字符号转单字符号 的R语言代码,第1张

inputAA<-strsplit(inputAA,split=" ")[[1]]

outputAA<-sapply(inputAA,function(x){

    index<-grep(x,aaa)

    if(length(index>0)){

        a[index]

    } else "0"

})

outputAA<-gsub(", ","",toString(outputAA))

R 英 [ɑː]  美 [ɑr]

n. 英语字母中的第十八个字母

abbr. 电阻(resistance);比率(ratio);医生处方(recipe)

短语

R rotunda 半r

天鹰座R R Aquilae

R Force R部队

R Virginis 室女座R

R Aquarii 宝瓶座R

r Barren 双杠

r Mannschaftskampf 团体赛

r Vierer 四桨船

r Zweier 双桨船

r Eislauf 滑冰

扩展资料

双语例句

1、He trilled the letter “r”.

他用颤音发“r”音。

2、Some people vocalize the “r” in four.

有些人把 “four”中的“r”发成元音。

3、He can't roll his r's.

他不能卷舌发出r音。

4、But this book is for those who wish to develop software in R.

但是这本书实际是为运用R语言开发软件的人编写。

5、As a way of exploring R, let us see if we can prove or disprove this explanation.

作为研究R的一种方法,来看我们是否能证明或者驳斥这一解释。

我首先是因为登陆了4个微信,每次转发同一个文件到五十个群聊,比如我发一个文献pdf是1 M,它就会被我的4个微信的200个群聊同时下载,就变成了200M的磁盘空间消耗,如下所示:

find ./ -name "*(*" ./2022-02/单细胞转录组-2个分组标准分析(1).zip ./2022-02/单细胞转录组-2个分组标准分析(2).zip ./2022-02/单细胞转录组-2个分组标准分析(3).zip ./2022-02/单细胞转录组-2个分组标准分析(4).zip # 此处省略200个 压缩包文件---

所以我首先删除这些文件名字里面有 括号的!

find ./ -name "*(*" |while read iddo(rm -rf "$id")done

减负之后是12G啦,效果还是很明显哦!

然后删除大文件:

同样是使用find命令啦,查询大于100M的文件,可以看到 基本上都是学徒完成作业后发给我的单细胞图表复现代码 :

find ./ -type f -size +100M |xargs.exe ls -lh |cut -d" " -f5- # 基本上都是学徒发给我的单细胞图表复现代码 158M Jun 7 2021 ./2021-06/GSE40791.zip 139M Jun 19 2021 ./2021-06/week2.zip 175M Jun 25 2021 ./2021-06/文章复现_Sophie_20210625.zip 116M Jun 28 2021 ./2021-06/甲状腺癌数据分析.zip 176M Jul 12 2021 ./2021-07/01_Code.zip 144M Jul 11 2021 ./2021-07/GSE150241-code.zip 171M Jul 20 2021 ./2021-07/GSE156329.zip 196M Jul 18 2021 ./2021-07/GSE166635_code.zip 190M Jul 19 2021 ./2021-07/GSE171306_Sophie_单细胞数据分析.zip 110M Jul 30 2021 ./2021-07/Meng_3rd_code.zip 118M Jul 17 2021 ./2021-07/paper+supplementary.zip 160M Nov 12 19:37 ./2021-11/几个gse数据集结果汇总.zip 102M Nov 20 09:05 ./2021-11/单细胞+深度学习.zip 247M Dec 7 21:33 ./2021-12/scRNA.7z 108M Dec 12 09:30 ./2021-12/学徒作业1.key 197M Dec 4 20:34 ./2021-12/小鼠神经元_项目结果.rar 365M Jan 6 22:25 ./2022-01/1.306西医综合(pdf).rar

因为这些代码里面都是包含了原始数据,所以巨大无比。检查后,确实们有什么值得留恋的,因为代码我都每次备份整理了,没必要使用原始版本,就一起删除吧。

find ./ -type f -size +100M |while read iddo(rm -rf "$id")done

如果你还不够解气,可以大于10M的,一起删除:

find ./ -type f -size +10M |while read iddo(rm -rf "$id")done

如果你想看懂上面的代码,就需要具备生物信息学数据分析学习过程的计算机基础知识,我把它粗略的分成基于R语言的统计可视化,以及基于Linux的NGS数据处理:

《生信分析人员如何系统入门R(2019更新版)》

《生信分析人员如何系统入门Linux(2019更新版)》

Linux的6个阶段需要一一跨越过去 ,一般来说,每个阶段都需要至少一天以上的学习:

第1阶段:把linux系统玩得跟Windows或者MacOS那样的桌面操作系统一样顺畅,主要目的就是去可视化,熟悉黑白命令行界面,可以仅仅以键盘交互模式完成常规文件夹及文件管理工作。

第2阶段:做到文本文件的表格化处理,类似于以键盘交互模式完成Excel表格的排序、计数、筛选、去冗余、查找、切割、替换、合并、补齐,熟练掌握awk、sed、grep这文本处理的三驾马车。

第3阶段:元字符,通配符及shell中的各种扩展,从此linux操作不再神秘!

第4阶段:高级目录管理:软硬链接,绝对路径和相对路径,环境变量。

第5阶段:任务提交及批处理,脚本编写解放你的双手。

第6阶段:软件安装及conda管理,让linux系统实用性放飞自我。

写在文末

我在《生信技能树》,《生信菜鸟团》,《单细胞天地》的大量推文教程里面共享的代码都是复制粘贴即可使用的, 有任何疑问欢迎留言讨论,也可以发邮件给我,详细描述你遇到的困难的前因后果给我,我的邮箱地址是 [email protected]

如果你确实觉得我的教程对你的科研课题有帮助,让你茅塞顿开,或者说你的课题大量使用我的技能,烦请日后在发表自己的成果的时候,加上一个简短的致谢,如下所示:

We thank Dr.Jianming Zeng(University of Macau), and all the members of his bioinformatics team, biotrainee, for generously sharing their experience and codes.

十年后我环游世界各地的高校以及科研院所(当然包括中国大陆)的时候,如果有这样的情谊,我会优先见你。