调节性R-loops:促进基因表达和基因组稳定性(二)

Python024

调节性R-loops:促进基因表达和基因组稳定性(二),第1张

        当R-loop去除途径被干扰时,R-loops在基因体或启动子中的存在可干扰转录起始、延伸或终止。虽然这些后果乍一看似乎是有害的,但细胞以一种可控的方式利用这些特性来调节基因表达。

        调控型R-loops通过激活和沉默基因表达,调控染色质和基因。在拟南芥中,长链非编码RNA(lncRNA) COOLAIR 启动子的功能被一个R-loop抑制,该R-loop通过转录因子ATNDX与ssDNA的结合而被稳定。ATNDX的结合可能会损害R-loop分解酶的可及性,从而影响 COOLAIR 启动子的转录。同样在拟南芥中,有一些证据表明环状RNA可能通过与它们的同源位点形成R-loop来调节外显子跳跃,尽管这种情况是否在体内发生以及潜在的机制仍有待证明。除了启动子区域,某些全基因组研究将对R-loops的研究转向基因3´末端。这与我们下面讨论的R-loops通过阻止Pol Ⅱ来促进转录终止的作用有关。

        与R-loops相关的染色质特征与启动子、TSS位点转录相关的染色质特征相似,包括组蛋白H3 Lys4的一甲基化和三甲基化(H3K4me1和H3K4me3)、组蛋白H3 Lys27的乙酰化(H3K27ac)和转录延伸(组蛋白H3 Lys36 的三甲基,H3K36me3)。与这种激活的组蛋白修饰一致,R-loops可以诱导染色质去致密化,但也可以促进异染色质组装和染色质压缩。调控型R-loops常由反义lncRNA产生,它们招募转录调节因子。例如,基因 RASSF1 及其反义lncRNA  RASSF1  antisense RNA 1( ANRASSF1 )从其所在位点的相反链上以聚合方式(头对头)转录; ANRASSF1 形成一个RNA-DNA杂交体,它招募Polycomb抑制复合物2(PRC2)来沉默 RASSF1A 启动子。当头对头反义lncRNA VIM反义RNA 1( VIM-AS1 )激活编码中间丝波形蛋白的 VIM 基因时,也会发生类似的情况,但表达结果不同; VIM-AS1 转录启动 VIM  TSS下游709bp的R-loop形成,从而促进转录激活物——核转录因子-κB(NF-κB)通路的招募。同样的研究还表明,高迁移率组蛋白 HMGA2 基因的表达是由重叠反义lncRNA  RPSAP52 的头对头转录诱导的。在芽殖酵母中,半乳糖代谢( GAL )基因簇受到环境中糖的可用性的严格调控;GAL位点转录lncRNA,lncRNA通过形成R-loops与编码蛋白的 GAL 基因重叠并正向调控。这些lncRNAs在正常情况下是顺式调控的,但在通过转基因表达时,它们也可以进行反式调控。编码 GATA3-AS1  lncRNA和 GATA3 的非重叠基因是分开转录的; GATA3-AS1 在 GATA3 TSS上游约2kb处形成R-loop,上调 GATA3 的表达,可能是通过招募H3K4甲基转移酶复合物MLL家族蛋白完成调控。质粒表达的 GATA3-AS1 也可以激活GATA3,这意味着R-loop也可以以反式进行调控。反义RNA是一种普遍存在的现象,最近的研究表明R-loops本身作为Pol Ⅱ启动子促进反义RNA的转录。

        头对头反义lncRNA  TCF21 antisense RNA inducing demethylation ( TARID ),与肿瘤抑制转录因子21( TCF21 )启动子重叠,形成R-loop,诱导局部DNA去甲基化和TCF21表达。同样,来自同一位点的正义和反义转录本的共转录似乎不是必需的,因为外源表达的lncRNA可以形成一个R-loop,从而导致基因的激活。R-loop积聚是未甲基化、含CGI的启动子的一个特征,这些启动子也显示出GC偏倚。通过GC偏倚区域的转录促进R-loop的积聚,因为G-rich RNA结合到C-rich DNA模板上具有较高的热力学稳定性。全基因组图谱显示,R-loops在DNA甲基化降低和DNase超敏性增加(染色质可及性)的位点富集。R-loops可以通过阻止DNA甲基转移酶(DNMTs)对DNA(C-5)的结合来抑制启动子的DNA甲基化;另一种机制,R-loops可能有利于DNA低甲基化是通过吸引ten–eleven translocation(TET) DNA去甲基化酶。在胚胎干细胞中,含有CGI启动子的约90,000个TET1结合位点中,约有4%可能是R-loop依赖的。与此同时,被氧化的DNA去甲基化中间产物5-甲酰胞嘧啶和5-羧基胞嘧啶在R-loops富集,且在RNase H1耗尽时其水平增加。

        调控型R-loops和lncRNAs也参与了小鼠胚胎干细胞分化过程中的染色质变化。与这些lncRNAs相关的两个染色质修饰复合物是Polycomb复合物PRC2(基因抑制)和组蛋白乙酰转移酶复合物TIP60(也称为KAT5)-p400(基因激活)。具有强烈R-loop形成倾向的启动子区域不被PRC2或PRC结合;相反,它们招募TIP60-p400并激活转录。事实上,小鼠胚胎干细胞中RNase H1的过表达降低了TIP60和p400在大多数靶基因上的定位,并允许PRC2的募集。与之相反,另一项研究发现R-loops吸引PRC到被PRC抑制的靶基因子集上;R-loops的缺失导致R-loop阳性PRC位点的转录激活。目前还不清楚R-loops是吸引PRC,还是排斥PRC。

        综上所述,这些研究强烈表明调节性 R-loops 可以作为表观遗传标记,通过改变染色质和基因表达而不影响基因序列。如果R-loops的作用是表观遗传标记,它们的“readers”是什么?蛋白质组学研究已经记录了许多R-loops相关蛋白,包括染色质修饰酶。然而,这些蛋白是直接或间接与R-loops结合,是与调控型R-loops相关还是与有害的R-loops相关,还是仅仅与R-loops在同一染色质环境中共同作用尚不清楚。复制蛋白A(RPA)、RAD51和ATNDX可能与R-loops的游离DNA链结合以稳定杂交体并介导转录抑制。在拟南芥中,ALBA DNA/RNA结合蛋白在体外识别RNA-DNA杂交体,并可能保护R-loops在体内形成DNA断裂。最近,应激反应蛋白生长阻滞和DNA损伤蛋白45A(GADD45A)被鉴定为R-loops的reader。GADD45A作为DNA去甲基化酶TET和胸腺嘧啶DNA糖基化酶的适配器,能够靶向它们进行位点特异性的DNA去甲基化。GADD45A在体外直接选择性结合RNA-DNA杂合体,在体内通过 TARID 在 TCF21 启动子上形成的调控型R-loop促进DNA去甲基化和基因表达。下表提供了所讨论的调节型R-loops及其调控过程的

        Pol Ⅱ 在基因3´末端的转录终止是一个复杂的过程,其失败会影响基因的表达。例如,在串联排列的基因中,来自于末端缺失的上游基因的读通RNA可以通过转录干扰来限制下游基因的活性。全基因组分析显示,大约2,000个G-rich Pol Ⅱ终止位点的基因映射到R-loop区域。与R-loops在转录终止中的作用一致的是,基因密集区域(通读RNA可能最有害的区域)3´末端富集R-loops。R-loops可通过促进Pol Ⅱ在3´端停滞,在某些基因的转录终止中发挥作用。新生mRNA形成的R-loops下游延伸Pol Ⅱ 的停滞被很好地记录下来,并提出了各种机制来解释它。例如,延伸的Pol Ⅱ复合物能够感知其附近的DNA构象,并在转录终止时感受到构象的改变。PolⅡ在延伸和回溯两种状态之间转换,延伸的R-loops可以使回溯的Pol Ⅱ停止。此外,尽管R-loop的位置相对于DNA轴保持固定,延伸 Pol Ⅱ 在转录过程中沿着螺旋路径旋转。因此,在R-loop下游产生的新生转录子必须包裹在DNA周围,有人提出这种不利的扭转应力可能导致转录终止。

        最近的研究揭示了R-loops和促进终止的异染色质化之间的分子联系。这项工作为一个模型提供了证据,该模型中G-rich序列促进R-loops的形成和反义RNA的合成,从而以某种方式在终止区诱导双链RNA。双链RNA是如何在R-loops内排列的尚不清楚,但它通过未知的机制吸引RNA interference RNase Dicer和组蛋白赖氨酸甲基转移酶G9a(也称为EHMT2);G9a使组蛋白H3 Lys9上二甲基化(H3K9me2)的局部沉积被认为促进了异染色质的形成,从而增强了PolⅡ暂停和转录终止。与此模型不一致的是全基因组R-loop图谱的结果:当比较3´末端无R-loops和有R-loops时,后者富集于基因激活性组蛋白修饰上。基因末端的R-loops也可能招募特定的终止蛋白,如转录延伸因子PAF1C,但招募机制尚不清楚。最近,RNA N6-甲基腺苷修饰(m6A)被认为可以促进R-loop的形成,从而促进转录终止。m6A是由含有催化亚基METTL3的甲基转移酶复合物产生的,是最丰富的可逆RNA修饰。METTL3缺失提高了含有m6A蛋白编码转录本的通读率。最近的研究显示,METTL3在R-loops上进行了大量m6A修饰,被m6A阅读器YTHDF2识别,这对RNA-DNA杂交体的去除至关重要。调和m6A如何促进RNA-DNA杂交体形成,同时增强杂交体的去除是很重要的。总而言之,m6A修饰可能对定义调控型R-loops很重要,并因此影响转录终止。

        与上面讨论的研究相比,缺失R-loop分解酶,如RNA解旋酶senataxin、 DHX9、DEAD-box解旋酶5(DDX5)、5´-3´核糖核酸外切酶2(XRN2),会引发全基因组R-loop积累和损害某些基因的转录终止。这些酶是直接结合并处理其缺失导致R-loops的位点,还是酶缺失的间接作用仍有待证实。目前还不清楚积累的R-loops在全基因组水平上对转录终止和通读活性的影响。这些研究强调了达到完美的R-loop平衡是多么的重要,因为R-loop的形成和消除都可能以相似的方式影响生物进程。

        最初的观点是RNA-DNA杂交体是DNA损伤的驱动力,因此会导致基因组不稳定。这种观点是基于观察杂交体被去除或预防时的变化而推导出的。令人惊讶的是,RNA-DNA杂交体的错误调控经常导致意外重组修复率和含有重组因子的细胞修复病灶数量的显著增加。然而,最近的研究表明,正是R-loops支持重组的这一特性可以引导DNA断裂和功能不全的端粒处的修复。R-loops还涉及着丝粒功能的建立,以确保准确的染色体分离,这是保持稳定的基因组的关键。端粒和着丝粒上的RNA-DNA杂交体形成R-loops;但是,为了准确起见,我们只参考DNA损伤位点的RNA-DNA杂交体,不清楚在这些位点是否形成了三股的R-loops。

        当DNA单链断裂(nicks)或DSB在转录活跃区域形成时,多种修复途径汇聚在一起,确保断裂附近的转录被下调。这些措施包括检验点介导的Pol II清除和暂停,后者也可以增加R-loop稳定性。此外,局部染色质结构在损伤位点周围被改变为一种更紧密的状态,以确保通过大量的基因压制染色质在破坏位点周围发生变化,从而降低转录。有趣的是,PRC1和PRC2都以R-loop依赖的方式定位于一些启动子,也通过组蛋白H2A Lys119泛素化(H2AK119)定位到断裂位点并诱导转录沉默。

        乍一看,转录抑制可能与R-loop的存在不相容,因为高转录率通常与R-loops相关;然而,越来越清楚的是,RNA-DNA杂交体确实在一部分断裂位点上积累,特别是在基因组的转录区域,在那里它们积极地促进DNA修复。利用不同的RNA-DNA杂交体检测技术和多种不同的DNA损伤来源,都证明了杂交体在某些DNA断裂和损伤位点上的共定位。尽管受损DNA位点处Pol II的停滞可能会造成该位点R-loops的积累;但也可能存在其他机制,如在DNA损伤位点,从被切除链的3´端开始的从头转录,产生了损伤诱导的lncRNA,或损伤位点处已存在的转录物重新退火,这些都可能造成杂交体积累。这些DNA损伤位点处RNA-DNA杂合体形成机制——转录停滞、重新转录或转录本重新退火——并不是相互排斥的,杂合体可能与周围环境有关,例如序列、细胞周期和/或转录活性。虽然杂交体在DNA损伤位点的来源仍未得到解决,但它们的短暂存在显然对修复很重要。值得注意的是,杂交体存在并不是所有DSBs的普遍特征,有明确的实例表明位点特异性断裂与RNA-DNA杂交体无关。DRIP-seq或DRIP-qPCR检测发现,在DSB的两侧都有R-loops的积累。乳腺癌1型易感蛋白(BRCA1)在体外可直接与RNA-DNA杂交体结合,并对同源重组至关重要。当RNase H1过表达且RNA-DNA杂交体不能形成时,电离辐射(产生DSBs)后BRCA1病灶的形成明显减少。BRCA1可以将BRCA2和PALB2(BRCA2的伴侣和定位者)招募到DSB处,其联合作用是吸引RNase H2,从杂合体中去除RNA,刺激随后的RAD51加载到新暴露的ssDNA上,开始同源搜索。尽管所涉及的因素可能因修复方式不同而不同,但事件发生的序列特征似乎是一致的:在DSB的5´端切除后,暴露的3´端形成RNA-DNA杂交体,招募修复因子(如RAD52、XPG、BRCA1、BRCA2);随后通过senataxin、RNase H1、RNase H2或DDX1去除RNA,从而允许RAD51加载和同源重组发生。DSBs中RNA-DNA杂交体的存在说明了瞬时性杂交体发挥其功能的重要性,但随后其又会被清除,以避免潜在问题的发生。如果RAD51可以同样容易地直接加载到ssDNA上,而不需要RNA-DNA杂交体中间物时,为什么会需要这样的一个过程?可能是因为在断裂发生时,“R-loops优先”的途径能够使细胞区分DNA复制过程中暴露的ssDNA(RAD51和同源重组对其有害)和DSBs产生的ssDNA(RAD51对其修复至关重要)。或者/此外,RNA-DNA杂交体可能有助于确保在一个DSB处RPA不超过RAD51。

        另一个R-loops推动DNA修复的例子是在端粒上发现的。端粒含有重复RNA( TERRA ),在染色体末端有形成R-loops的强烈倾向。这可能是由于其重复的、G-rich的序列,通过在游离的DNA链上形成G4s从而增强R-loops存在。 TERRA (和酵母端粒上的R-loops)是不稳定的,在S期早期形成,在S期后期、大约端粒复制的时候被RNase H酶降解。因此,和大部分的R-loops一样, TERRA R-loops也是瞬时的。然而,当端粒由于破坏或复制过程中逐渐缩短而变得极度短,RNase H酶不再能够有效地定位于端粒时,端粒处R-loops就稳定存在了。在酵母中,稳定的R-loops在一个缩短的端粒上促进与长端粒的重组,这有防止过早衰老的效果。当通过RNase H过表达或TERRA消融抑制短端粒的R-loops稳定时,损伤随之而来,导致衰老加速。

        端粒R-loops在人类癌细胞中也有作用。它们完全依赖重组机制,即端粒的选择性延长,以维持端粒并实现长生不老。就像DSB修复的情况一样,短端粒上R-loops的存在导致重组。然而,端粒和DSB之间的一个重要区别是参与杂交体的DNA链。

        在DSBs中,与RNA杂交的是3´端链;而在端粒上,与 TERRA 杂交的是5´端链。在这两种情况下,R-loops的存在促进了RAD51加载。活细胞成像显示, TERRA 有能力离开并随后返回被转录的特定端粒。确定短端粒在顺式或反式中是较好的 TERRA 受体,或者它们是低效率的 TERRA 分解者,或两者皆有,这将是很有趣的问题。与DSB相似,我们推测短端粒上的杂交体最终必须被移除,以允许新延长的链重新退火。的确,在酵母中,RNA退火蛋白Yra1的过表达稳定了短端粒上的R-loops,并导致增强而不是减弱的复制衰老(由端粒损伤触发的不可逆细胞周期阻滞)。尽管RNase H2负责在正常长度的端粒上以细胞周期依赖的方式去除R-loops,但尚不清楚杂交体如何最终在短端粒上被修复。总而言之,端粒R-loops也会受到类似“金发女孩效应(凡事皆有度,量力而行)”的影响,在这种效应中,只有适当数量的R-loops出现,才会产生有益的、而不是破坏性的结果。

        着丝粒基因座转录成着丝粒RNA,同时也有着丝粒R-loops(CEN R-loops),以细胞周期依赖的方式调控,这一特征在酵母和人之间保守。在人类细胞中,CEN R-loops上游离的ssDNA被RPA结合并招募DNA损伤反应激酶ATR,引发Aurora B的激活,促进正确的微管-着丝粒附着。因此,RNase H过表达阻止了ATR定位,从而使Aurora B完全激活,导致染色体滞后的后期酶数量增加。重要的是,在酵母和人类细胞中,CEN R-loops只在DNA复制后形成,以防止复制冲突,并且只在需要时出现,即有丝分裂期间。研究表明,在酵母和人类中,CEN R-loops水平的增加会导致局部染色质压缩;在裂殖酵母中,CEN R-loops会刺激RNA干扰诱导的异染色质的形成。有趣的是,ATR和相关的激酶ATM也以细胞周期依赖性地与端粒相联系,以确保端粒的功能,因此确定R-loops是否能像着丝粒那样激发它们的招募是一个很有趣的问题。

        一个关键问题是调节性R-loops的潜在有害影响是如何被限制的。例如,如果调节性R-loops会阻滞Pol Ⅱ,它们又是如何激活基因表达的?当R-loops本身被认为是DNA损伤的来源时,它们又是如何促进DNA修复的?我们现在已经知道,一些非计划的RNA-DNA杂交体的有害影响,即过度重组和转录停滞,可以被用来促进细胞的基本功能,如DNA修复和转录终止。因此,对RNA-DNA杂交体的调控是至关重要的,因为杂交体应在正确的时间和地点形成,以允许某些调控过程发生而不产生有害的影响。

        那么,这样的调控是如何建立的呢?首先,调控基因表达的R-loops可以在空间上与调控基因的TSSs分离。例如,调控上游遗传元件的R-loops可能避免干扰被调控基因的转录,如 GATA3-AS1  lncRNA在GATA3 TSS上游约2 kb处形成一个调节性R-loop。其次,当调节性R-loops位于启动子和基因体内时,其解码(阅读、解释和最终去除)可以暂时从基因的转录中分离出来,如在细胞周期中:R-loop水平在不同细胞周期中发生变化,RNase H2受到细胞周期的严格调控;就TCF21而言,其反义lncRNA  TARID 的转录、R-loop的积累、DNA去甲基化和TCF21的表达在细胞周期中依次进行。这样的顺序可以避免反义lncRNA在启动子、编码链上或mRNA在非编码链上同时形成R-loop,以便下游事件可以通过R-loops启动,而R-loops的不利影响又可以被快速去除。然而,在有丝分裂后的细胞中,调控性R-loops的解码和基因转录之间的时间分隔就是一种与细胞周期无关的模式。在这种情况下,调节性R-loops的瞬时性就显得十分有利,与DNA修复相关的R-loops就是一个典型的例子:在DSB和缩短的端粒中,一个R-loop会维持适宜的时间来招募修复机制,然后被移除。这种时间上的调控似乎是一个关键特征,因为R-loops的过度稳定和缺失都可能阻碍DNA修复过程。因此,与非计划的R-loops类似,调节性R-loops很可能是短命的,并受到内切酶和解旋酶的严格调控,以避免产生有害影响。

        非计划R-loops形成的主要模式是通过顺式转录的新生转录本对转录位点的双链DNA的共转录入侵。非计划R-loops的存在很可能与R-loops预防或删除的缺陷有关;相比之下,调节性R-loops的一个反复出现的主题是lncRNAs以反式形成的能力。因此,杂交体的形成可能不需要来自同一位点的共转录。调节性R-loops的另一个特征是,反式RNA可能通过持续的从头合成促进了调节性R-loops的寿命,这就提出了lncRNA如何进入DNA双链的问题。虽然RNA解旋酶可能促进RNA穿入,但可能不需要ATP酶活性,例如CRISPR-Cas系统,它可以导致DNA弯曲,引起DNA解旋和guide RNA穿入。在体外,借助RAD51的细菌同源物——ssDNA结合蛋白RecA,RNA-DNA杂交体可以以反式在转录后形成。在体内,RAD51是顺式形成R-loops所必需的物质,并以类似于CRISPR-Cas的作用来促进杂交体形成。因此,DNA双链的局部解旋可能足以在反式中形成自传播的R-loops,特别是在负超螺旋DNA中,杂化释放了这种高能态。某些DNA序列或结构也可能促进RNA在调节性R-loops中穿入。一个显著的可以稳定未缠绕DNA的DNA结构是分子内G4s,它普遍存在于R-loops中,并且稳定后会增加R-loops的水平。这表明,G-rich lncRNAs可能通过穿入G4结构形成的位点,并与C-rich链配对,从而在反式中形成R-loops。

        最后,研究m6A对非计划R-loops和调节性RNA-DNA杂交体的作用也是一个有意思的问题。虽然m6A被证明可以促进杂交体形成,但它也可以通过促进杂交体去除来预防R-loop介导的基因毒性胁迫。

        事实上,(至少部分)调节性R-loops以反式的作用,开启了利用RNA寡核苷酸操纵R-loops调控基因的表达或延长极短端粒的可能性。转染形成R-loop的RNA可用于控制基因表达,例如靶向GC偏倚的启动子。相反,与内源性R-loop RNAs互补的RNA寡核苷酸可用于防止R-loop的形成。因此,调节性R-loops的调控具有被用于治疗的潜在价值。

        过去的十年彻底改变了我们对调节性RNA的认识。通过使用下一代测序,已经认识到基因组的很大一部分会被转录,有无数不同长度的RNA具有潜在的调控功能。虽然一些非编码RNA(ncRNAs)的生物学研究已经相当成熟,但对其他ncRNAs调控功能的了解仍处于初级阶段或难以捉摸。RNA以序列特异性的方式在基因组中发挥调节功能的一种方式是通过形成RNA-DNA杂交体。术语RNA-DNA杂交指的是RNA与DNA的碱基配对。当RNA-DNA杂交体的形成导致单链DNA (ssDNA)游离时,这种结构称为R-loop。RNA-DNA杂交体和R-loops在各种细胞进程中发挥了重要的作用,如基因调控和DNA修复,近年来受到人们的广泛关注。矛盾的是,R-loops长期以来一直被认为是有害的转录副产物,它干扰转录过程本身,并导致基因组不稳定性。R-loop诱导的基因组压力与未能及时去除R-loops直接相关。杂交体代谢障碍的许多负面后果是由于DNA复制机制与R-loops相遇而引起的复制应激引起的;然而,R-loops相关的转录延伸缺陷、DNA双链断裂(DSB)形成、突变发生和染色质状态改变也能够以复制无关的方式发生。有很多优秀的综述文章涵盖了失控R-loops的有害影响,并涉及R-loops的去除因素。

        从这个角度出发,本文将讨论RNA-DNA杂交体和R-loops是如何被用作某些DNA事件的正调控因子和信号,重点放在转录调控和基因组完整性的维护上。然而,我们并不忽视R-loops的有害方面,它可以影响完全相同的过程。我们也讨论了可能决定R-loops和RNA-DNA杂交体命运的因素,以及这些因素如何影响杂交体是否具有调节性和生产性,或者是否具有计划性和非计划性/危害性。

        几十年来,人们已经知道RNA-DNA杂交体在各种核内进程中起着关键作用,尤其是转录和DNA复制。在DNA合成过程中,后随链的复制一个RNA-DNA杂交体功能的典型实例:DNA聚合酶α合成的RNA引物被DNA聚合酶δ聚合为成熟的冈崎片段。另一个RNA-DNA杂交体的功能实例发生在端粒上,端粒酶通过RNA-DNA碱基配对特异性地识别端粒序列,端粒酶由ncRNA和逆转录酶组成。端粒酶的RNA部分与存在于染色体末端的3´ ssDNA延伸杂交,使末端的延伸能够防止端粒被侵蚀。通常,当复制中的DNA聚合酶(最常见的为DNA聚合酶ε)将三磷酸核糖核酸错误引入到新合成的DNA链时,RNA-DNA“小型杂交体”就会形成。如果不有效地切除,错配的单磷酸核糖核酸(rNMPs)可能会损害基因组的完整性;但它们在DNA修复过程中也发挥着积极的作用,因为错配修复和非同源末端连接途径利用核糖核酸插入来促进基因组的完整性。在错配修复的情况下,rNMPs作为一种链识别信号,在新合成的链而不是模板链上指导错配碱基的修复。rNMPs如此丰富(在酵母中每个细胞周期有13000个rNMPs)的事实也暗示了其具有生物学功能。rNMPs在基因组中的积极和消极作用表明:它们是短暂的,受到严格的调控,以确保DNA的最佳修复,同时避免基因组不稳定性。上述杂交体不被认为是R-loops,因为它们不会导致DNA链游离。

        R-loops是由RNA-DNA杂合体和游离的DNA单链组成的三链结构。R-loop的特征已经在一些优秀的综述中被广泛讨论过。简单地说,三链结构通常但不完全与正在进行的转录有关,直到最近还被认为仅仅是转录的“副产物”,只以顺式(in  cis )发生在转录位点上。负超螺旋以及RNA聚合酶附近发生的DNA变性(链分离),为新生转录本提供了一个理想的机会:以退火互补模板链,形成一个R-loop。虽然RNA-DNA杂交体不断地在RNA聚合酶的转录泡内形成,但R-loops不太可能仅仅是这种有限杂交体的延伸,而更可能是通过RNA的5´端再入侵所形成的。RNA聚合酶复合物的结构证实了这一点,RNA和DNA从复合物中以不同的出口通道被挤出,这将简单地阻止R-loop扩展形成。此外,最近的一项研究表明,共转录R-loops的有效形成需要一个自由的RNA末端和一个GC偏倚(双链之间鸟嘌呤和胞嘧啶分布的不对称性)。当RNA在不同的空间位置产生时,也可以形成反式(in  trans )RNA-DNA杂交体。

        RNA-DNA杂交体的检测方法对于理解R-loops是如何被调控的,以及定位它们在基因组中形成的位置和时间是至关重要。虽然检测RNA-DNA杂交体的主要工具是单克隆杂交特异性S9.6抗体,但替代试剂和技术已经出现。催化失活的核糖核酸酶H1(RNase H1,一种能够降解RNA-DNA杂交体的RNA部分)或RNase H1杂交体结合结构域融合荧光蛋白的酶可以用作杂交体的感受器。虽然杂交体的积累位点分布有普遍的共识,但不同检测方法仍会造成不同研究之间的差异。R-loops的一个守恒特征是它们的瞬时特性。这是在一项使用芽殖酵母的研究中首次提出的,该研究表明:只有当两种RNaseH都缺失时,才能检测到均匀分布的RNA-DNA杂交体核染色。这表明,杂交体经常出现,但会被RNaseH迅速去除,至少部分去除。随后,除了RNaseH之外,多种解旋酶也被证明有助于杂交体的去除。细胞核中分散的S9.6染色结果也表明,RNA-DNA杂交体在基因组的多个位点形成。这一结果在对酵母中杂合体位点进行全基因组测序后同样得到验证:结果显示酵母中杂交体位点广泛分布,包括逆转录转座子、端粒和高表达基因(如核糖体RNA、tRNA基因座和其他结构性ncRNAs)中大量存在。

        R-loops在与反义转录相关的基因上显著富集,最近被证明其可以直接促进反义表达,表明它们在基因表达中起调节作用(见下文)。尽管有一项研究表明,在AT偏倚区域,特别是poly(A)区域可能是R-loop形成的热点区域;但普遍的共识是, R-loop积累的关键决定因素不是序列本身,而是基因座的转录率。事实上,通过改变启动子来提高转录率,一个R-loop缺失的位点就可以转化为R-loop富集位点。有一种倾向是富含GC的序列有更多的R-loops;同样的研究显示,酵母中富含GC序列的基因通常表达水平更高。在哺乳动物细胞中,GC偏倚十分有利于R-loop的形成(见下文)。然而,酵母基因组并无太多的GC偏倚,除了端粒区域。在植物中,GC偏倚和AT偏倚的区域都富集于R-loops中。高表达水平和R-loops之间的联系表明:要么高转录率促进R-loops积累,要么R-loops促进高转录率。也可以设想这么一个正反馈:通过转录导致R-loops的积累,从而再进一步促进转录。注意,已知R-loops是转录的有效抑制剂,会导致聚合酶停滞。R-loops与转录之间的矛盾关系表明,要维持高转录率,需要严格控制R-loops的持久性(半衰期),或者R-loops与开放阅读框之间存在空间分离。

        一项对酵母的研究发现,RNA聚合酶Ⅱ(Pol Ⅱ)的一个亚基定位和R-loop热点区域之间的基因组重叠很少。这表明通过S9.6 DRIP绘制的R-loop图谱并不是记录正在进行的转录,而是一些可能持续存在或转录后形成的R-loops。这是一个早期迹象——表明R-loops可能不仅仅是转录的副产物,并暗示杂交体可能独立于转录形成,即以反式存在或从远处影响转录。

        与酵母相似,R-loops在人类细胞和植物中在重复序列处所积累,如转座子、核糖体DNA、着丝粒和端粒。令人惊讶的是,在人类和植物中,R-loops在承载CpG岛(CGIs)的启动子区域也显著富集。CGIs存在于大约60%的人类基因的启动子上,其1个特征是阳性GC偏倚(GC skew+)的存在——在转录起始位点(TSS)下游的非模板链上,G比C富集。在启动子区域更精确的R-loop定位表明,R-loops通常限制在TSS和第一个内含子-外显子联接体之间。一般来说,强烈的GC偏倚与高基因表达、R-loop富集相关。以这种序列特异性方式积聚R-loops,可能是由于富含G的RNA对其互补序列具有特别强的热力学结合特性。此外,DNA二级结构的存在,如G-四联体(G4s),在游离的DNA上可以促进R-loop的稳定性——阻止分解R-loops的蛋白质进入或降低DNA的再次退火能力。最近一项使用原子力显微镜的体外研究表明,R-loops可以获得独立于G4s的二级结构。这些二级结构是在游离的DNA链上形成的,包括斑点(blobs)、刺(spurs)和环(loops)。这些R-loop构象对周围的DNA施加局部物理约束,例如弯曲DNA。一个有趣的可能性是,R-loop构象可以编码更高阶的调控信息,如通过招募不同的染色质修饰因子。在未来,确定这些R-loop构象是否存在于体内的染色质环境中是很重要的。

        基因启动子上R-loops的存在首次强烈表明该结构可能具有重要的基因调控功能。除了启动子区域,全基因组的研究发现在转录终止位点上R-loops也有相当多的富集,特别是那些GC偏倚区域。这与R-loops促进转录终止的功能是一致的。同时,杂交体还出现于DNA损伤部位,包括功能缺失的端粒和DSB处,在协调DNA修复中也具有重要的功能。

        长期以来,R-loops一直被认为是转录的偶然副产物,对细胞生理有害,不适当地删除会导致基因组不稳定性。然而,最近发现有一类有益的、“调节性”的R-loops,在各种生物过程中扮演着重要的角色。调节性R-loops利用RNA-DNA碱基配对的序列特异性来排斥或靶向不同的染色体位点的辅因子。原核生物中最重要的例子是CRISPR-Cas9系统,它在细菌中进化成一种天然防御机制,识别和破坏来自病毒的DNA。在细菌基因组中,整合到CRISPR序列中的病毒DNA被转录并与Cas9核酸酶结合,Cas9-RNA复合物在入侵的病毒DNA上形成一个序列互补的R-loop,使DNA产生断裂,最终导致病毒DNA被破坏。这个机制现在已经被用作一个高度精确和易于工程化的基因编辑工具,使用guide RNAs将Cas9靶向到基因组中的特定序列,这一过程涉及到反式R-loop的形成。

        真核生物中调节性R-loops的第一个实例来自于免疫球蛋白重链位点的类开关重组研究:在G-rich的开关区域内形成的R-loops促进基于重组的缺失和驱动抗体类别转换。RNA-DNA杂交体的序列特异性使R-loops通过精确靶向启动子和终止子序列,成为调控基因表达的候选因子之一。

原文链接:https://doi.org/10.1038/s41580-019-0206-3

一、循环和向量化

1、控制结构

(1)条件语句

if(条件) 表达式1 else 表达式2

(2)循环(loops)

for :for(变量 in 变量) 表达式

while while(条件)表达式

repeat repeat 表达式

三者略有区别:若知道终止条件(循环次数)就用for循环,若无法知道运行次数,则用while和repeat循环,repeat循环利用循环体的break语句跳出循环