构建遗传图谱---作图群体如何选择?

Python020

构建遗传图谱---作图群体如何选择?,第1张

基因定位最有效且最常用的方法就是先构建遗传连锁图谱再进行基因定位,该方法对于数量性状和质量性状的基因定位都适用。

构建连锁图谱的前提是建立作图群体,建立作图群体需要考虑几个因素:亲本(父母本的选择)、分离群体类型以及群体大小等。

亲本的选择

亲本的选择直接影响到构建遗传图谱的难易程度及所建图谱的使用价值。一般应从四个方面对亲本进行选择:

1、 亲本的典型性 :选择有代表性或者有优良农艺性状的材料作为亲本,进行杂交构建作图群体;

2、 亲本间多态性 :亲本间多态性与其亲缘关系有着密切关系,这种亲缘关系可用地理的、形态的或同工酶多态性作为选择标准。一般而言,异交作物的多态性高,自交作物的多态性低。在选择亲本时,并非是多态性高的一定好,多态性低的一定差,要根据实际情况选择合适的亲本材料;

3、 亲本材料的纯度 :选择亲本时应尽量选用纯度高的材料作为亲本,如果材料纯度不够,可以通过自交进一步纯化;

4、 杂交后代的可育性 :杂交后代可育性低会影响分离群体的构建,会导致严重的偏分离现象,降低图谱的准确性。

分离群体类型

根据群体的遗传稳定性可将分离群体分成两大类:

一类称为 暂时性分离群体 :如F1、F2、BC1等,这类群体可以在短期内构建,其分离单位是个体,不稳定,一经自交或近交其遗传组成就会发生变化,无法永久使用。

另一类称为 永久性分离群体 :如RIL、DH群体等,这类群体构建费时费力,其分离单位是株系,不同株系之间存在基因型的差异,而株系内个体间的基因型是相同且纯合的,是自交不分离的。这类群体可通过自交或近交繁殖后代,而不会改变群体的遗传组成,可以永久使用。

F2群体

该群体是最常用的作图群体,也是初级定位群体。

其优点是群体容易构建。其缺点主要有两个:一是存在显性杂合基因型,无法识别显性纯合和杂合基因型,会降低作图的精度(可通过扩大群体规模而降低作图误差);二是不易长久保存,如果需要保存则只能通过无性繁殖或者F2单株的衍生系(一般使用F3随机单株混合来代表F2单株)。

BC群体

常用于作图的回交群体是回交一代,也就是BC1群体。

其缺点是同样不能长久保存。但优点是BC1群体中只有两种基因型,它直接反映了F1代配子的分离比例,因而BC1群体的作图效率高,这也是它优于F2群体的地方。

RIL群体

RIL群体是杂种F1代经过多代自交而产生的一种作图群体,通常从F2代开始,采用单粒传的方法来建立。

RIL群体是一种可以长期使用的永久性分离群体。由于自交的作用是使其基因型纯合化,因此RIL群体中每个株系都是纯合的。

理论上,建立一个无限大的RIL群体,必须自交无穷多代才能达到完全纯合,但是建立一个有限大小的RIL群体则只需自交有限代。一般自交6-7代的群体称为准RIL群体,可以满足作图的要求。当然,自交代数越高,纯合度越高,作图效率及精度越高。

RIL群体的优点是可以长期永久使用,可以进行重复试验。RIL群体也只存在两种基因型,且分离比为1:1,与BC1相似。

DH群体

构建DH群体的常用方法是通过花药离体培养结合染色体加倍技术获得。即取F1植株的花药进行离体培养,诱导产生单倍体植株,然后对染色体加倍产生DH植株。

DH群体也是永久性群体,其遗传结构也是反映了F1配子中的基因分离比例,作图效率高。其缺点是依赖成熟的花培技术,不容易获得。

群体大小

遗传图谱的精度很大程度上取决于群体的大小,群体越大,作图的精度越高。

群体大小与作图目的有关,如果作图的目的是进行基因定位,那么就需要较大的群体以保证作图的精度。

同时,作图群体大小还取决于群体类型。一般来说,所需的群体大小的顺序为F2>RIL>BC1及DH。

总结

在构建作图群体时,不要盲目的扩大群体规模或选择某种群体类型,要根据实际的研究目的进行亲本的选择、群体类型的选择、以及群体大小的选择,只有这样,才能既达到研究目的,又减轻相应的工作量。

1. 文章越来越难发?是你没发现新思路,基因家族分析发2-4分文章简单快速,学习链接: 基因家族分析实操课程 、 基因家族文献思路解读

2. 转录组数据理解不深入?图表看不懂?点击链接学习深入解读数据结果文件,学习链接: 转录组(有参)结果解读 ; 转录组(无参)结果解读

3. 转录组数据深入挖掘技能-WGCNA,提升你的文章档次,学习链接: WGCNA-加权基因共表达网络分析

4. 转录组数据怎么挖掘?学习链接: 转录组标准分析后的数据挖掘 、 转录组文献解读

5. 微生物16S/ITS/18S分析原理及结果解读 、 OTU网络图绘制 、 cytoscape与网络图绘制课程

6. 生物信息入门到精通必修基础课,学习链接: linux系统使用 、 perl入门到精通 、 perl语言高级 、 R语言画图

7. 医学相关数据挖掘课程,不用做实验也能发文章,学习链接: TCGA-差异基因分析 、 GEO芯片数据挖掘 、 GSEA富集分析课程 、 TCGA临床数据生存分析 、 TCGA-转录因子分析 、 TCGA-ceRNA调控网络分析

8.其他课程链接: 二代测序转录组数据自主分析 、 NCBI数据上传 、 二代测序数据解读 。

相信大家都听说过circos图,但是亲自画过的人可能就很少,这主要因为软件的安装和使用稍微有一点麻烦。其实,circos图也是可以在线绘制的,这样就简单多了!一起来了解一下吧!

在circos官网(http://circos.ca/)的最右方有个“CIRCOS ONLINE”选项,这里可以实现在线绘制部分circos图。

打开后界面如下:

以微生物多样性分析中样品与物种丰度circos图绘制为例,给大家讲解circos图的绘制功能。该图能够很直观的反映各样品中不同物种所占的比例,以及物种在不同分组或者样品中的分布关系。

绘制circos图

1.数据准备

首先我们要做的就是准备画图所用到的数据,所用数据为物种在各样品中的相对丰度,这里只选用丰度大于0.01的物种用于绘图,数据如下(列名A、B、C为样品,行名Acetobacteraceae等是科一水平的物种分类):

OTUABC

Acetobacteraceae0.5063653216696110.5968872412369940.457528142134733

Arcobacteraceae0.0003294904846044670.0179133872520980.000426249200782749

Bacteroidaceae0.01752092807693420.04558718113953470.352221339584988

Dysgonomonadaceae0.001842974249051360.02565003004872960.0330226880824598

Lachnospiraceae0.005691857602178260.01390206286339050.0173870923992018

Lactobacillaceae0.174952205775860.2379461150250890.0588340146862225

Pseudomonadaceae0.00213263621353880.02862956070929480.0127991010016856

Ruminococcaceae0.003124728441908290.005061219761203110.0274388235522058

Sphingomonadaceae0.2578607015612780.007113946230875610.00898610815104722

由于网站要求的数据格式为非负整数,故将所有的数据乘1000(系统会自动截掉小数点后的数据),输入数据则变为:

OTUABC

Acetobacteraceae506.365321669611596.887241236994457.528142134733

Arcobacteraceae0.32949048460446717.9133872520980.426249200782749

Bacteroidaceae17.520928076934245.5871811395347352.221339584988

Dysgonomonadaceae1.8429742490513625.650030048729633.0226880824598

Lachnospiraceae5.6918576021782613.902062863390517.3870923992018

Lactobacillaceae174.95220577586237.94611502508958.8340146862225

Pseudomonadaceae2.132636213538828.629560709294812.7991010016856

Ruminococcaceae3.124728441908295.0612197612031127.4388235522058

Sphingomonadaceae257.8607015612787.113946230875618.98610815104722

2.绘图

数据准备好就可以来绘制circos图了,只需要导入数据就可以。

生成的图片如下:

可以看到,图中的物种和样品完全是按照字母顺序排列的,我们希望物种和样品分别位列两边,这里可以人为的对其指定顺序。方法也很简单,就是在数据的第一行和第一列用数字来指定顺序。如下:

OTUOTU1   2   3

OTUOTUABC

12Acetobacteraceae506.365321669611596.887241236994457.528142134733

10Bacteroidaceae17.520928076934245.5871811395347352.221339584988

8Dysgonomonadaceae1.8429742490513625.650030048729633.0226880824598

6Lachnospiraceae5.6918576021782613.902062863390517.3870923992018

11Lactobacillaceae174.95220577586237.94611502508958.8340146862225

7Pseudomonadaceae2.132636213538828.629560709294812.7991010016856

5Ruminococcaceae3.124728441908295.0612197612031127.4388235522058

9Sphingomonadaceae257.8607015612787.113946230875618.98610815104722

4Arcobacteraceae0.32949048460446717.9133872520980.426249200782749

第一行指定了样品的顺序,而第一列按丰度指定物种的顺序。生成图片时要勾选下图红框中的选项(排序所用),不然会报错哦!

新图如下:

图中由于部分物种丰度较低,导致物种名重叠,解决这个问题可以改变文字的布局。这时就需要进行设置了。

3.图片设置

点击"settings"进入设置界面,会有很多的设置选项,可以对图片进行细调。

这里只需要修改两个地方即可,将下图第一个红框改为“no”,可以调整文字为垂直布局,避免重叠;但是如果物种名太长,又可能会超出图片范围,所以要缩小圆圈的半径,即将第二个红框改为small。

修改并保存设置后,重新生成图片:

好了,今天我就先给大家介绍到这里,希望对您的科研能有所帮助!祝您工作生活顺心快乐!

更多生物信息课程:

1. 文章越来越难发?是你没发现新思路,基因家族分析发2-4分文章简单快速,学习链接: 基因家族分析实操课程 、 基因家族文献思路解读

2. 转录组数据理解不深入?图表看不懂?点击链接学习深入解读数据结果文件,学习链接: 转录组(有参)结果解读 ; 转录组(无参)结果解读

3. 转录组数据深入挖掘技能-WGCNA,提升你的文章档次,学习链接: WGCNA-加权基因共表达网络分析

4. 转录组数据怎么挖掘?学习链接: 转录组标准分析后的数据挖掘 、 转录组文献解读

5.  微生物16S/ITS/18S分析原理及结果解读 、 OTU网络图绘制 、 cytoscape与网络图绘制课程

6. 生物信息入门到精通必修基础课,学习链接: linux系统使用 、 perl入门到精通 、 perl语言高级 、 R语言画图

7. 医学相关数据挖掘课程,不用做实验也能发文章,学习链接: TCGA-差异基因分析 、 GEO芯片数据挖掘 、 GSEA富集分析课程 、 TCGA临床数据生存分析 、 TCGA-转录因子分析 、 TCGA-ceRNA调控网络分析

8.其他课程链接: 二代测序转录组数据自主分析 、 NCBI数据上传 、 二代测序数据解读 。