Perl,R,Python在生物信息学中是怎样的角色?

Python015

Perl,R,Python在生物信息学中是怎样的角色?,第1张

应该说Python/Perl是相互替代的脚本语言,但个人推荐用Python, 虽然很多老的生物信息软件是用Perl,Python学习曲线好,功能也更强大,是发展趋势。这两个语言主要是做数据预处理、文本处理和格式转换、对算法效率要求不高的分析软件开发,系统管理和pipeline搭建等工作。R语言主要的优势是大量的统计包的支持,数据统计分析中非常常用。Python和R有良好的接口。关于绘图很多人用R,其实Python的Matplotlib的绘图效果比它漂亮很多,也更强大。对pipeline的搭建shell编程更适合,是一个不可缺少的技能。与数据库相关的工作需要用到SQL, Linux : 操作系统,是基础。 生物信息对Linux的要求其实并不高,并不是要做系统开发者或管理员,只需要会用就行。复制粘贴、处理数据、安装软件等。生物信息软件:标准数据分析。 生物信息学的数据格式已经基本标准化,大部分工作可以直接用软件完成。Perl和Python:处理个性化问题、软件之间的对接。 这两门语言至少应该熟练掌握一门自己写程序用,另外一门要能看得懂。 写点小脚本感觉差别不大,但是perl写大程序不合适。 很多人认为python是趋势,但至少截止目前更多生信软件是用perl写的。 所以,如果刚开始学,建议主打python, 看懂perl。R :数据处理、统计、绘图、数据分析。 R语言的数据结构跟其他语言差异较大、而且总感觉语法比较散,不好记。但是R的软件包却异常强大。数据处理的reshape2, dplyr;绘图的ggplot2;还有Bioconductor里的几千个包。不得不会。

R可以完成: 1、处理一些简单的有格式的文本数据,包括矩阵等 2、画一些简单的统计图,比如直方图,箱线图等 3、分析一些专门的数据,比如芯片数据,RNA-seq数据等 4、画一些专业的图,比如热图之类的

我是生物信息的,明年毕业,生物信息就是用数学方法,应用计算机解决生物学问题。

你就可以看出来了,数学基础很重要,各种算法很关键,因为做生物信息数据处理要用各样的算法。

计算机方面各种编程语言:C,C++,Java要熟悉,写程序处理数据用,Linux操作系统最好也要会。

数据库一定要熟悉。

再有就是像一些软件:数学软件像Matlab,SAS,SPSS;生物信息软件:R语言一类。

计算机方面是比较重视的。

当然最主要的是解决生物学问题,所以生物学是根本。数学计算机都是手段。

生物信息看“信息”两个字,就知道是微观层面的生物学,比如染色体信息啦,DNA,RNA,蛋白质信息啦,这个明白了吧。

大概介绍一下,基本上就是这个意思,明白了吧!