链接为 http://blog.sciencenet.cn/home.php?mod=space&uid=255662&do=blog&id=969228
conda已经安装orthofinder2,试运行了一下,目前的问题:
1.跑出的结果不知道怎么用:哪些结果可以用作下一步分析?下一步分析要做什么?怎么做?
2.-M raxml-ng 的命令不能用,显示“”未安装raxml“”:不知道怎么自定义多序列比对和建树参数(参数方面结合具体数据同时参考其他文献)?
3.
解决方案:
A: https://www.jianshu.com/p/16e0bbb2ba19
比较基因组学的相关结果文件:
Orthogroups_SpeciesOverlaps.csv: 不同物种间的同源基因的交集
SingleCopyOrthogroups.txt: 单基因拷贝组的编号
Statistics_Overall.csv:总体统计信息
Statistics_PerSpecies.csv:分物种统计信息
其中,我们可以用Orthogroups.GeneCount.tsv来作为CAFE的输入文件,分析基因家族的扩张与收缩;使用SpeciesTree_rooted.txt作为推断的物种树,并使用r8s,从中提取超度量树(ultrametric tree)即时间树
1-2、下一步分析包括什么?
A:直系同源基因聚类的可视化及结果解读、利用多序列比对结果建树、估算物种分化时间、基因家族收缩和扩张分析、AI美化图表
https://www.jianshu.com/p/a07dddc7747e
1-3、怎么做?
教程:
直系同源基因 https://www.jianshu.com/p/a07dddc7747e
建树 https://www.jianshu.com/p/b4a5260bc254
https://www.jianshu.com/p/9ef6d7f273b3
https://www.jianshu.com/p/52c2b99615f6
https://www.jianshu.com/p/90301eeb063a
https://www.jianshu.com/p/25e60508a08f (成功案例)
分歧时间 https://www.jianshu.com/p/b12e058c6597
基因家族收缩和扩张 https://www.jianshu.com/p/d334ec7c3571 (成功案例)
系统发育树的美化 itol AI
基因组共线性 https://www.jianshu.com/p/76d3590f7ecf
待补充
1-3-1、按照教程做的过程中有哪些难点?
A:r8s安装不上,安装包不完整,显示“缺少filename.o文件”;
AI美化不会;
待补充
A:参照 https://www.jianshu.com/p/9ef6d7f273b3
3、orthofinder结果中的比较基因组统计目录结果如何可视化?
A:结果文件有什么意义: https://www.jianshu.com/p/a21f1f907a3e
一些坑:
orthofinder2的参数 https://www.jianshu.com/p/f68b3b2dfc1d
cafe运行成功案例 https://www.jianshu.com/p/25a98611f688
利用R包可视化基因树 https://www.jianshu.com/p/e180694451a3 (有教程齐全的官方在线网站,不推荐用R)
主力软件总结 https://www.jianshu.com/p/ac89857c455f
宝藏up(多看看) https://www.jianshu.com/u/b52cb67b3e80
一些软件推荐,可以看看 https://www.jianshu.com/p/15dbf53640a0
TBtools 比较基因组文件准备 https://www.jianshu.com/p/6c33312df832
raxml-ng https://mp.weixin.qq.com/s?__biz=MzA5NjU5NjQ4MA==&mid=2651160708&idx=1&sn=38e13cc0f14062b765616d3e848f0f76&chksm=8b5c87ebbc2b0efdbcd7f3f20589cde373bbd259c43261df230357149a3fc5a4f98a10c8db61&scene=21#wechat_redirect
iq-tree https://www.jianshu.com/p/df234ca0de71
如何构建生信平台(得花点时间慢慢看,太难了) https://protocolexchange.researchsquare.com/article/pex-807/v3
由OrthoFinder软件可产生大量的分析结果,用于多种分析,下面介绍用产生的文件画系统发育树。
根据每个直系同源群推断的系统发育树。
基因树:指基于单个同源基因差异构建的系统发生树。这种树代表的仅仅是单个基因的进化历史,而不是它所在物种的进化历史。
Orthogroups_SingleCopyOrthologues.txt:用来看画基因树应该选择哪一个直系同源群的文件。该文件中每个物种正好包含一个基因的直系同源群列表,即它们包含一对一的直系同源物。它们非常适合进行种间比较和种树推断。
下面以OG0000065_tree.txt(一对一的直系同源物)为例画基因树:
画进化树在线网站: https://itol.embl.de/personal_page.cgi
图形处理:
为每个直系同源群推断出有根的系统发育树,使用OrthoFinder复制损失合并模型进行解析。
以Resolved_Gene_Trees文件夹中的OG0000065_tree.txt文件为例:
物种树:反映物种实际种系发生的树。
以Species_Tree文件夹中的SpeciesTree_rooted.txt文件为例。
SpeciesTree_rooted.txt:从所有直系同源群推断出的STAG物种树,包含内部节点上的STAG支持值,并以STRIDE为根。