基因家族分析之orthofinder后续结果的R分析基因树

Python013

基因家族分析之orthofinder后续结果的R分析基因树,第1张

更多的美化处理工作可以参考博文《在R中绘制进化树:ggtree学习笔记》。

链接为 http://blog.sciencenet.cn/home.php?mod=space&uid=255662&do=blog&id=969228

conda已经安装orthofinder2,试运行了一下,目前的问题:

1.跑出的结果不知道怎么用:哪些结果可以用作下一步分析?下一步分析要做什么?怎么做?

2.-M raxml-ng 的命令不能用,显示“”未安装raxml“”:不知道怎么自定义多序列比对和建树参数(参数方面结合具体数据同时参考其他文献)?

3.

解决方案:

A: https://www.jianshu.com/p/16e0bbb2ba19

比较基因组学的相关结果文件:

Orthogroups_SpeciesOverlaps.csv: 不同物种间的同源基因的交集

SingleCopyOrthogroups.txt: 单基因拷贝组的编号

Statistics_Overall.csv:总体统计信息

Statistics_PerSpecies.csv:分物种统计信息

其中,我们可以用Orthogroups.GeneCount.tsv来作为CAFE的输入文件,分析基因家族的扩张与收缩;使用SpeciesTree_rooted.txt作为推断的物种树,并使用r8s,从中提取超度量树(ultrametric tree)即时间树

1-2、下一步分析包括什么?

A:直系同源基因聚类的可视化及结果解读、利用多序列比对结果建树、估算物种分化时间、基因家族收缩和扩张分析、AI美化图表

https://www.jianshu.com/p/a07dddc7747e

1-3、怎么做?

教程:

直系同源基因 https://www.jianshu.com/p/a07dddc7747e

建树 https://www.jianshu.com/p/b4a5260bc254

         https://www.jianshu.com/p/9ef6d7f273b3

         https://www.jianshu.com/p/52c2b99615f6

         https://www.jianshu.com/p/90301eeb063a

         https://www.jianshu.com/p/25e60508a08f  (成功案例)

分歧时间 https://www.jianshu.com/p/b12e058c6597

基因家族收缩和扩张  https://www.jianshu.com/p/d334ec7c3571 (成功案例)

系统发育树的美化 itol AI

基因组共线性  https://www.jianshu.com/p/76d3590f7ecf

待补充

1-3-1、按照教程做的过程中有哪些难点?

A:r8s安装不上,安装包不完整,显示“缺少filename.o文件”;

       AI美化不会;

      待补充

A:参照 https://www.jianshu.com/p/9ef6d7f273b3

3、orthofinder结果中的比较基因组统计目录结果如何可视化?

A:结果文件有什么意义: https://www.jianshu.com/p/a21f1f907a3e

一些坑:

orthofinder2的参数 https://www.jianshu.com/p/f68b3b2dfc1d

cafe运行成功案例  https://www.jianshu.com/p/25a98611f688

利用R包可视化基因树  https://www.jianshu.com/p/e180694451a3 (有教程齐全的官方在线网站,不推荐用R)

主力软件总结  https://www.jianshu.com/p/ac89857c455f

宝藏up(多看看)  https://www.jianshu.com/u/b52cb67b3e80

一些软件推荐,可以看看  https://www.jianshu.com/p/15dbf53640a0

TBtools 比较基因组文件准备  https://www.jianshu.com/p/6c33312df832

raxml-ng  https://mp.weixin.qq.com/s?__biz=MzA5NjU5NjQ4MA==&mid=2651160708&idx=1&sn=38e13cc0f14062b765616d3e848f0f76&chksm=8b5c87ebbc2b0efdbcd7f3f20589cde373bbd259c43261df230357149a3fc5a4f98a10c8db61&scene=21#wechat_redirect

iq-tree  https://www.jianshu.com/p/df234ca0de71

如何构建生信平台(得花点时间慢慢看,太难了) https://protocolexchange.researchsquare.com/article/pex-807/v3

由OrthoFinder软件可产生大量的分析结果,用于多种分析,下面介绍用产生的文件画系统发育树。

根据每个直系同源群推断的系统发育树。

基因树:指基于单个同源基因差异构建的系统发生树。这种树代表的仅仅是单个基因的进化历史,而不是它所在物种的进化历史。

Orthogroups_SingleCopyOrthologues.txt:用来看画基因树应该选择哪一个直系同源群的文件。该文件中每个物种正好包含一个基因的直系同源群列表,即它们包含一对一的直系同源物。它们非常适合进行种间比较和种树推断。

下面以OG0000065_tree.txt(一对一的直系同源物)为例画基因树:

画进化树在线网站: https://itol.embl.de/personal_page.cgi

图形处理:

为每个直系同源群推断出有根的系统发育树,使用OrthoFinder复制损失合并模型进行解析。

以Resolved_Gene_Trees文件夹中的OG0000065_tree.txt文件为例:

物种树:反映物种实际种系发生的树。

以Species_Tree文件夹中的SpeciesTree_rooted.txt文件为例。

SpeciesTree_rooted.txt:从所有直系同源群推断出的STAG物种树,包含内部节点上的STAG支持值,并以STRIDE为根。