单细胞测序(sc-RNA seq)分析:Seurat4.0系列教程、高级分析、文章复现

Python019

单细胞测序(sc-RNA seq)分析:Seurat4.0系列教程、高级分析、文章复现,第1张

时代的洪流奔涌而至,单细胞技术也从旧时王谢堂前燕,飞入寻常百姓家。雪崩的时候,没有一片雪花是无辜的,你我也从素不相识,到被一起卷入单细胞天地。R语言和Seurat已以势如破竹之势进入4.0时代,天问一号探测器已进入火星乌托邦平原了,你还不会单细胞吗?那么为了不被时代抛弃的太远,跟着我们一起通过学习seurat系列教程入门单细胞吧。

首先我们学习经典的标准流程,这个教程我当初入门时候曾经花1000购买过,也曾花6000购买过,不同的单细胞培训班,买的是一样的教程。现在免费送给你,别说话,开始学吧!

Seurat4.0系列教程1:标准流程 - (jianshu.com)

Seurat4.0系列教程2:多模式数据联合分析 - (jianshu.com)

Seurat4.0系列教程3:合并两个样品的10x数据集 - (jianshu.com)

Seurat4.0系列教程4:整合分析 - (jianshu.com)

Seurat4.0系列教程5:交互技巧 - (jianshu.com)

Seurat4.0系列教程6:常用命令 - (jianshu.com)

Seurat4.0系列教程7:数据可视化方法 - (jianshu.com)

Seurat4.0系列教程8:细胞周期评分和回归分析 - (jianshu.com)

Seurat4.0系列教程9:差异表达检测 - (jianshu.com)

Seurat4.0系列教程10:降维 - (jianshu.com)

Seurat4.0系列教程11:使用sctransform - (jianshu.com)

Seurat4.0系列教程12:大数据集整合的方法 - (jianshu.com)

Seurat4.0系列教程13:使用互惠 PCA (RPCA) 快速整合数据 - (jianshu.com)

Seurat4.0系列教程14:整合scRNA-seq and scATAC-seq数据 - (jianshu.com)

Seurat4.0系列教程15:映射和注释查询数据集 - (jianshu.com)

Seurat4.0系列教程16:多模式参考映射注释细胞 - (jianshu.com)

Seurat4.0系列教程17:Mixscape - (jianshu.com)

Seurat4.0系列教程18:Weighted Nearest Neighbor Analysis(WNN)) - (jianshu.com)

Seurat4.0系列教程19:多线程并行策略 - (jianshu.com)

Seurat4.0系列教程20:单细胞对象的格式转换 - (jianshu.com)

Seurat4.0系列教程21: 结合Cell Hashing分析双细胞 - (jianshu.com)

Seurat4.0系列教程22:空间转录组的分析、可视化与整合 - (jianshu.com)

Seurat4.0系列教程告一段落,但这决不是终点。这个系列教程只是给大家打开一扇窗,知道Seurat4.0有这些功能可用,少走弯路,起到一个抛转引玉的作用,后续还要自己深入研究。不要像我当初入门单细胞之时,为了找到整合方法耗费大量时间及不必要的金钱。君子生非异也,善假于物也。学,然后知不足。加油吧!少年!用好单细胞测序及分析这个技术,为人类健康研究做出自己的贡献!不足之处,恳请批评指正!------以此纪念粉丝突破1000。

CellChat三部曲1:使用CellChat对单个数据集进行细胞间通讯分析 - (jianshu.com)

CellChat 三部曲2:使用CellChat 对多个数据集细胞通讯进行比较分析 - (jianshu.com)

CellChat 三部曲3:具有不同细胞类型成分的多个数据集的细胞通讯比较分析 - (jianshu.com)

RNAvelocity系列教程1:RNA速率简介及scVelo安装 - (jianshu.com)

RNAvelocity系列教程2:使用 Seurat 和 scVelo 估计 RNA 速率 - (jianshu.com)

RNAvelocity系列教程3:使用Seurat和velocyto估算RNA速率 - (jianshu.com)

RNAvelocity系列教程4:velocyto.R的使用教程 - (jianshu.com)

RNAvelocity系列教程5:scVelo 的基本知识 - (jianshu.com)

RNAvelocity系列教程6:# scVelo用于RNA 速率基本流程 - (jianshu.com)

RNAvelocity系列教程7:# scVelo实战-胰腺数据集 - (jianshu.com)

RNAvelocity系列教程8:# scVelo实战-齿状回数据集 - (jianshu.com)

RNAvelocity系列教程9:# scVelo应用-动力学模型 - (jianshu.com)

RNAvelocity系列教程10:# scVelo应用-微分动力学 - (jianshu.com)

使用fgsea进行单细胞转录组GSEA富集分析 - (jianshu.com)

Seurat24节气之21大雪---vars.to.regress = "percent.mt"排除线粒体基因 - (jianshu.com)

Seurat24节气之2雨水---resolution参数 - (jianshu.com)

单细胞转录组基础分析五:细胞再聚类 - (jianshu.com)

单细胞测序文章图表复现01—读入文件的表达矩阵构建Seurat对象 - (jianshu.com)

单细胞测序文章图表复现02—Seurat标准流程之聚类分群 - (jianshu.com)

单细胞测序文章图表复现03—区分免疫细胞和肿瘤细胞 - (jianshu.com)

单细胞测序文章图表复现04—聚类分群的resolution参数问题 - (jianshu.com)

CNS图表复现11—RNA-seq数据可不只是表达量矩阵结果 - (jianshu.com)

主要根据文献中的描述与方法

巨噬细胞,单核细胞,DC细胞

M1和M2型注释:M1(FCGR3A)和M2(CD163)通常很难区分,一般会表达两种状态的marker gene。文献中提供的注释方法是计算M1和M2极化和抗炎促炎分数,确定M1-like和M2-like的巨噬细胞。

单核细胞的注释较为随意,没有明确的名字和功能,大多参考其他文献报道注释。如:

M-c1-THBS1 细胞: FCN1, APOBEC3A, and THBS1;

Mono2 cluster :PRF1, GNLY, and KLRC4-KLRK1;

*-resident Kupffer cells:MARCO;

myeloid-derived suppressor细胞:MDSCs, CD33+;

DC1 细胞:CLEC9A,THBD(CD141)

DC2 细胞:CD1C,CLEC10A,CD1E,而CD14,VCAN,S00A9,SELL,S100A8低表达;

DC3 细胞:CCL19,LAMP3,CCR7;有迁移到淋巴结中的潜力

该文献中对巨噬细胞的注释很模糊,方法为先给巨噬细胞自定义名称,然后再描述其可能的功能。该文献中主要是定义了一个新的DC细胞亚群,并探讨了其功能。

M-c1-THBS1 :与MDSC(myeloid-derived suppressor cell)细胞相似的基因表达;S100A, FCN1,VCAN,低表达HLA-related genes转录因子:BCL3,NR4A1,RXRA,TCF25.

M-c2-C1QA:有TAM,M1,M2 三种特征APOE,C1QA,C1QB,TREM2,SLC40A1(编码铁蛋白),GPNMB(I型跨膜糖蛋白)转录因子:ID3,MITF,RUNX2,MAF;

cDC1:CLEC9A, XCR1, CADM1

cDC2:CD1C, FCER1A, CLEC10A

DC-c4-LAMP3:LAMP3, CD80, and CD83,the migration marker CCR7and the

lymphocyte recirculation chemokines CCL19 and CCL21;

该文献对于髓系细胞的注释非常全面。

好久没更新了,上来我得写一个有分量的推文暖暖场。其实细想一下,不能全归因于平时太忙(还是太懒了),因为最近看到其它很多小伙伴做的很好且都在不断更新。其实抽出时间写一写推文对个人整理知识和练习写作能力都是很有帮助的!

Immugent最近一直在做单细胞的课题,期间收集了各种细胞注释的marker基因,本次分享主要就针对这个主题展开。

单细胞测序技术是近十年最火爆的生物学技术之一,它赋予我们在单个细胞水平研究科学问题的能力。虽然单细胞技术目前已经发展的很成熟,商业化的10X平台让很多科研团队有自己做单细胞测序的能力,但是并不是每一项通过单细胞测序得到的结果都能成功发表。我身边就有很多认识的朋友做了单细胞测序,但是没有分析出任何可用的结果,最终砸手里了。

单细胞测序既然是在单个细胞研究科学问题,那就引出了其分析流程中很关键一步--细胞亚群的注释。别小看这简单的一步,它可以说是单细胞测序研究成败的最关键因素之一,因为后续的分析都是基于这一步开展的,如果开头都是错的,那后续分析出的任何结果都是没有意义的。

理论上来说,每一类细胞都有自己独特的标志基因,就像我们做流式一样,根据表达的蛋白来对细胞进行定义,而且既然是单个细胞水平的测序结果,这应该没有什么难度。但和其它技术一样都会有自己的不足,而单细胞测序(10X)同样也有自身解决不了的问题:

如下图是一篇做正常 肾组织 单细胞文献中用到的标志基因:

这两个表已经总结的相当全面了,但是在实际进行细胞亚群注释时应当遵循一定原则,我提供以下思路来进行参考:1. 首先应根据免疫细胞的marker(PTPRC)在全局上定义出免疫细胞和非免疫细胞,因为相对于非免疫细胞,免疫细胞的种类不仅多而且功能各异;2. 其次就是对这两类再细分群,非免疫细胞可分为上皮细胞(EPCAM),内分泌细胞(PECAM1),纤维细胞(FAP)等;免疫细胞可首先区分为天然免疫细胞:NK(NCAM1),Mac(CD68),DC(XCR1),中性粒(MNDA)和肥大细胞(TPSAB1)等;适应性免疫细胞:B细胞(CD19,CD79A)和T细胞(CD3D,CD3E),到这非免疫细胞和天然免疫细胞差不多说完了,下面进一步说下更为复杂的适应性免疫细胞亚群;3. 适应性细胞中的B细胞相对好区分,就是在B细胞群基础上再多区分一群浆细胞(IGKC,MZB1)最后就说一下这个T细胞,T细胞群的注释可谓是最复杂的,第一步可以简单在大群上区分出3种:CD4 Tconv(CD40LG,MAF), Treg(FOXP3,IL2RA)和CD8 T(GZMB,NKG7)细胞接下来就需要根据功能状态把CD4 Tconv和CD8 T分为Naive(SELL,CCR7), Effector(PRF1,CCL5),Effector-memory(IL7R,EOMES), Exhausted(LAG3,TIGIT)了。

在对各种细胞亚群进行注释的过程中T细胞的注释是最复杂的,而最最复杂的是对各种CD4 T细胞的注释。正如上面抛出的一个问题所介绍的,因为CD4基因的表达不太容易像CD8A/B那样容易被捕捉到(最新的解释可能是因为CD4分子在实验过程中有内吞现象),因此对CD4 T细胞的亚群注释是难上加难的。但是我这里根据自己免疫学知识来给大家介绍另一种比较靠谱的解决方式,那就是通过各种CD4 T细胞的转录因子来注释。

首先原始的CD4 T细胞在受到TCR信号刺激的情况下会朝着各种CD4 T细胞亚群的方向分化,而这每一种不同亚群的命运是由各种转录因子来决定的,其中最重要的就是 Signal transducer and activator of transcription (STAT)。 从下图我们也可以看到,正是由不同的STAT来诱导CD4 T细胞朝着不同的方向发育,并且相对于其它种类的基因,转录因子的表达更加稳定保守,所以就比较容易被单细胞测序平台所捕获,因此,利用各种CD4 T细胞亚群的表面蛋白联合关键转录因子就能对CD4 T细胞亚群进行更准确的注释。

好了,本次的分享到这就结束了,下次我将继续这篇推文的内容,介绍一下如何利用生信软件,同时利用多种标志基因的综合评分对细胞亚群进行注释,敬请期待!