Hello,11月好呀,气温渐寒,各位小伙伴也要注意衣物增减,注意防护哦。
今天为大家分享单细胞多组学文献2024年发表于《Blood》的《Integrative single-cell chromatin and transcriptome analysis of human plasma cell differentiation》。浆细胞是B细胞的分化终点,其分化机制可在体外培养中再现,但早期分化的转录和表观遗传程序尚未完全阐明。本文结合单细胞RNA测序与单细胞表观遗传学分析,探讨浆细胞分化的轨迹与调控网络。发现了前浆母细胞阶段显示了显著的异质性,并且该阶段的染色质开放区域富集AP-1家族转录因子的结合位点(如BATF3、FOS、BATF)。同时发现某些前浆母细胞已经完成表观遗传重塑,并启动未折叠蛋白反应,即将分化为浆细胞。接下来我们看下作者的研究思路。
一:正常 B细胞 向 浆细胞(PC) 分化过程中各个阶段的转录特征
研究通过单细胞RNA测序(scRNA-seq)分析了B细胞向正常浆细胞分化(PCD)过程中四个阶段的转录特征(见图1A)。对6,392个细胞进行均一流形近似与投影(UMAP)分析,显示了三个主要群体:记忆B细胞(MBCs)、浆细胞(PCs)和前浆母细胞/浆母细胞(prePB/PB)(图1B)。MBC和PC群体的转录组特征高度特异,而prePB和PB之间未呈现明显区分,显示出显著的异质性。此外,不同健康供体来源的MBC生成的细胞群体之间无显著差异。每个阶段的基因表达特征由超过300个差异表达基因(DEGs)定义,可清晰区分各阶段(图1C)。prePB阶段表现出近2000个差异表达基因,是分化过程中变化最显著的阶段,显示重要的分子调控发生在此阶段。
正如预期,B细胞相关转录因子(PAX5、BCL6、BACH2)在MBCs中表达,而浆细胞转录因子(IRF4、PRDM1、XBP1)在PCs中显著表达(图1D)。通过前十显著DEGs的热图分析,不同阶段间的动态基因表达变化清晰可见(图1E)。接下来进一步聚焦三个关键转变阶段:
-
MBC到prePB:B细胞激活后的早期转变。
-
prePB到PB:细胞开始分泌抗体的阶段。
-
PB到PC:浆母细胞向浆细胞分化。
基因集富集分析验证了这些阶段中差异基因的功能,并与先前基于RNA测序(bulk RNA-seq)的研究结果一致。
图1:B细胞向PC 分化过程中 MBC、prePB、浆母细胞和 PC 的单细胞转录组学分析
二:单细胞染色质可及性揭示了AP-1转录因子(TFs)在前浆母细胞阶段(prePB)显著富集
为了探讨B细胞分化至浆细胞(PCD)过程中染色质开放的变化,研究应用单细胞ATAC-seq技术(scATAC-seq),共分析了7721个单细胞。通过使用MACS2工具识别的染色质开放峰值,UMAP降维显示了MBC阶段与prePB、PB和PC阶段之间的明显分离(图2A)。prePB阶段具有最多的差异可及性峰(4660个),而其他阶段的峰数显著较少(MBC: 641个; PB: 44个; PC: 105个)(图2B)。
尽管转录组层面prePB和PB细胞表现出显著差异,但三者的ATAC-seq谱系在染色质结构上具有高度相似性。此外,prePB阶段表现出显著的染色质解压缩,伴随大量ATAC-seq峰的出现(图2B-C)。
研究进一步显示,通过scATAC-seq识别的差异可及区域与scRNA-seq鉴定的差异基因数高度相关(R²=0.9949,P<0.001)。这些差异可及性峰中,大部分位于基因上,而非远端调控元件(图2D)。两两比较显示,在B细胞激活后,MBC与prePB之间的染色质变化最为显著(MBC开放峰251个,prePB为4854个)(图2D-G)。
在ATAC-seq与RNA-seq共同分析的差异基因中,29个基因(MBC)、170个基因(prePB)和11个基因(PC)既表现出染色质重塑,也显示差异表达(图2H)。这些结果表明,B 细胞激活导致了主要的表观遗传和转录组重塑。同时作者也鉴定了一系列细胞亚群特异的转录因子:
-
MBC阶段: FOXP1, PAX5
-
prePB阶段: ARID3A, BATF, BATF3, E2F4, ETS1, IKZF1, IRF2, MYB, SOX4, SPIB, SREBF2, STAT3, TFDP1, ZNF511
-
PC阶段: PRDM1.
JASPAR和CIS-BP数据库的motif富集分析验证了这些转录因子的显著富集,其中BATF3和BATF的差异可及性峰分布在核心基因及远端调控元件上(图2I)。prePB阶段中,差异可及峰富集了AP-1家族TF(如BATF3、FOS、BATF)的motif(图2J)。相比之下,MBC阶段的峰富集KLF4、SPIB和KLF9的motif,而PC阶段则富集TCF4、ASCL1和IRF4的motif。在单细胞层面,大多数prePB细胞中AP-1 TF家族(如BATF、BATF3、FOS等)表达为中到高水平(图2K)。
在prePB阶段的差异可及性峰中,38%富含BATF3的motif,潜在调控基因达1479个(图2L-M)。其中140个基因在prePB阶段上调,包括LDHA、EZH2、CXCR4、BIRC3、MKI67、TRAF1、IL21R、PAX5、CCL5、IKZF1、IRF5、CCR7等。BATF3蛋白在prePB中的显著过表达亦通过实验验证(补充图3A-B)。由于BATF3在prePB阶段以短暂脉冲方式发挥作用,其靶基因可能构成PCD关键转录节点。
图2:B 向 PC 分化过程中 MBC、prePB、浆母细胞和 PC 的单细胞染色质可及性变化
三:整合 scRNA-seq 和 scATAC-seq 揭示了一个更成熟的 prePB 亚群,其特征在于 PC 的表观遗传特征
为了整合scRNA-seq与scATAC-seq数据集,研究使用scRNA-seq数据集中每个阶段的前50个差异表达基因作为锚点,以预测scATAC-seq数据集中细胞的归属。针对scATAC-seq数据集,通过基因区域内的读取数计算基因活性矩阵。UMAP投影显示,整合后的scRNA-seq与scATAC-seq数据集,尤其在MBC与PC阶段的表现高度一致(图3A-B)。有趣的是,约一半的ATAC-seq数据中的prePB细胞未被预测为prePB,且接近四分之一的PB细胞未被预测为PB(图3C)。余下的prePB被预测为PB或PC,而余下的PB被预测为PC(图3D),这表明某些prePB与PB细胞具有更成熟的表观遗传特征。对比预测为prePB的prePB细胞与预测为PC的prePB细胞,研究发现了一些PC阶段的关键标志基因,包括XBP1、FAM46C、MZB1和BTG2(图3E;补充表2)。这表明,某些prePB亚群已发生与PC表观遗传特征相关的重塑。
通过RNA-seq数据表明,研究发现尽管某些PC基因(如IFI6)在prePB中已呈现开放染色质状态,但其表达水平仍显著低于成熟PC(图3F)。为了验证上述结果,研究进一步对组蛋白标记H3K4me3、H3K27ac和H3K36me3进行了ChIP-seq实验:H3K36me3: 与基因体内的转录延伸相关;H3K27ac: 与活跃的调控元件(包括增强子和启动子)相关;H3K4me3: 与活跃或多功能启动子相关。结果表明,PC标志基因(如FAM46C、XBP1、MZB1和IFI6)在prePB细胞中已显示出活跃染色质标记。这些数据表明,一部分prePB细胞已转变为生成抗体分泌细胞。
图3:scRNA-seq 和 scATAC-seq 数据集的整合
四:基于转录组对prePB 和 PB 亚群的拟时序分析
基于K近邻(KNN)聚类分析识别了7个亚群(图4A):
• MBC: 位于Cluster 1
• prePB: 位于Clusters 2和3
• PB: 位于Clusters 4和5
• PC: 位于Clusters 6和7
约40%的分析细胞显示出与细胞周期S-G2-M阶段相关的转录特征(图4B-C),这些细胞主要由prePB和PB6组成(图4D-E)。研究仅选择了与S-G2-M阶段相关的prePB和PB细胞,以聚焦于prePB向PB过渡过程,并尽量减少细胞周期状态的偏倚(图5A)。为揭示潜在的分化轨迹及不同阶段间的进程,利用Monocle 3对细胞进行伪时间排序(图5B-C)。研究特别关注了沿该轨迹差异表达的基因,包括编码转录因子(TFs)、表观遗传调控因子及配体/受体相互作用蛋白的基因。通过伪时间分析,研究识别了6类差异表达基因:Cluster 1中下调的基因(早期prePB);Cluster 2中下调的基因(成熟prePB);Cluster 1中上调的基因;Cluster 2中上调的基因;先下调后上调的基因(impulsed down);先上调后下调的基因(impulsed up)(图5D)。大多数差异表达基因表现为下调(占78.8%),其中52.5%集中在Cluster 2(图5E)。
在早期阶段下调的TFs包括:BATF3、IRF5、RUNX3、SPIB、PAX5、STAT5A、AHR、JUNB、STAT6和KLF6;在Cluster 2中下调的TFs包括:PHB2、TFAM、ETS1、TFDP1、YY1、E2F4、ZNF146、TP53、MAX和CEBPZ。
表观遗传因子中:从早期到成熟prePB阶段,下调的基因包括:AICDA、EZH2、EED、PRMT2和NCOA4;从prePB向PB过渡阶段,下调的基因包括:PCNA、PRMT1、SET、MBD2和HDAC1。蛋白水平验证显示,prePB中AID的表达伴随着显著诱导的53BP1和γH2AX,这表明存在DNA双链断裂。
配体/受体相互作用相关基因中:在早期prePB中下调的基因包括:IL2RA、IL21R和CD40;B细胞标志基因(如CD19、CD22、CD83、CCR7、CCL17和CCL22)在Cluster 1中下调;TACI的表达在Cluster 2中下调;PC表面标志基因(如CD27、CD38、SLAMF7、BCMA和ITGA4),以及IL-6R、IL-6ST和INSR在Cluster 1中上调。
图4:鉴定 B 到 PC 分化的不同阶段内的亚群
图5:prePB 和 PB 亚群的拟时序分析
五:基于单细胞转录组分析对 prePB 和 PB 阶段进行亚群分析
prePB阶段的异质性促使研究人员进行亚群分析,以识别新的过渡性prePB亚群。研究人员获得了5个cluster,其中包括4个prePB cluster和一个PB特异性cluster(图6A)。
利用拟时分析(图5F)鉴定的分化过程中失调的基因,研究人员按成熟度对cluster进行排序,特别是cluster 2、3和4,代表更成熟的prePB(图6B)。两两比较显示,基因表达变化在分化的早期阶段(cluster 1:684个差异表达基因)和晚期(cluster 5:437个差异表达基因)更为显著(图6C)。前50个差异表达基因的热图显示,cluster 1(早期prePB)和cluster 5(PB)具有非常特异的转录组特征(图6D)。在cluster 1(早期prePB)中,研究人员发现了多个在B细胞激活后强烈表达的配体和受体(图6D)。
此外,该cluster还表现出B细胞转录因子(IRF5、ZFP36L1、SPIB、BATF3、RUNX3和PAX5)(图6E)及AICDA的过表达。cluster 5(PB)显著表达多种PC受体,例如TNFRSF17(BCMA)、SLAMF7(CS1)、CD27、CD79A和CD38,以及PC转录因子XBP1和配体PSAP。成熟prePB被进一步划分为三个亚群:cluster 2(早期成熟prePB)、cluster 3(过渡性成熟prePB)和cluster 4(成熟prePB;图6D)。cluster 2中特异性表达的标志物包括ETS1和ATF5转录因子。ATF5是一种参与CREB3L2-ATF5-MCL1生存通路的转录因子。ETS1被认为能够调控MCL1抗凋亡因子的转录上调,并将AID招募至免疫球蛋白重链基因(IGH)位点。cluster 3中在更晚阶段表达了EGR1和FOS转录因子。EGR1参与程序性细胞死亡(PCD)途径。cluster 4(成熟prePB)和cluster 5(PB)中特异性表达KLF2(图6E)。KLF2通过控制β7整合素的表达参与控制PC在骨髓中的归巢过程。成熟prePB的各cluster还通过一些配体和受体基因的表达进行区分:cluster 2中表达CALR、HLA-DRB6、SLC1A5、NCL和CANX;cluster 3中表达GPI、CD70、HLA-DRB6和TFRC、CXCR4、ENO1、F2R;cluster 4中表达CCL3和ITGA4。基因集合富集分析显示,cluster 1富集了由NF-κB和STAT5调控的基因,这些基因分别响应TNF和IL-2刺激(图6F;补充表6)。
此外,该cluster还富集了与炎症反应和p53通路相关的基因,以及由磷脂酰肌醇3-激酶(PI3K)/丝氨酸-苏氨酸蛋白激酶(AKT)/哺乳动物雷帕霉素靶蛋白(mTOR)信号激活的基因。在所有其他cluster中,研究人员发现通过mTOR复合物1(mTORC1)激活的基因在cluster 2中富集程度更高。同时,在cluster 2中还观察到与未折叠蛋白反应(UPR)和MYC靶标相关的基因富集。这些基因集合在cluster 3中也有体现,此外还包括与氧化磷酸化、糖酵解以及细胞周期相关的E2F转录因子靶标基因。cluster 5显著富集了与蛋白分泌相关的UPR基因。
图6:鉴定prePB 和 PB 阶段的新亚群
六:prePB和PB转变过程中UPR的双重激活
研究人员重点关注在更成熟的 prePB 的第一个cluster和之后的 PB 中观察到的内质网应激的双重激活。对cluster 2与其相邻的cluster 1、3和4进行两两比较,结果显示在cluster 2中有111个基因过表达,其中19个基因(ASNS、SLC7A5、HSPA5、HSP90B1、CALR、HSPA9、SERP1、PSAT1、SSR1、EDEM1、XPOT、TARS1、SPCS3、DNAJC3、PDIA6、HYOU1、EIF4EBP1和HERPUD1)与UPR相关(图7A-C)。cluster 5相比于cluster 4有179个基因过表达,其中10个基因与内质网应激相关。在这些基因中,有5个基因在cluster 2和5中均被发现,而5个基因是cluster 5所特有的(图7B-C)。研究人员还比较了在cluster 2和5中上调的基因,以识别其他可能参与UPR的基因(图7D)。
在小鼠中的报道所示,prePB中的第一次UPR激活与参与mTORC1信号通路的基因过表达相关,而第二次激活则与mTORC1信号基因的下调以及与蛋白分泌相关基因的过表达相关(图7E-F)。UPR相关基因的热图显示了早期成熟prePB(cluster 2)中的首次激活与PB和PC中与蛋白分泌相关的第二次激活之间的显著区别(图7G)。早期UPR激活伴随着ASNS、SLC7A5、HSPA5、PSAT1、XPOT和EIF4EBP1的强表达,而第二次激活则表现为PC中TMBIM6、HERPUD1、VIMP和XBP1的强表达。有趣的是,HSPA5(编码一种名为结合免疫球蛋白蛋白的热休克蛋白70家族成员)仅与三个内质网应激跨膜传感器之一在cluster 2中共表达(图7H)。
有趣的是,在cluster 2中,研究人员观察到免疫球蛋白轻链和重链对应的reads比例不平衡(图7I),IGH对应的reads数量高于免疫球蛋白轻链基因(IGL),这可能解释了BiP从其特定时刻的内腔区域释放。在cluster 2中,仅激活了已知剪接XBP-1(sXBP-1)以产生高活性转录因子(TF)的Ire1通路。此外,负责sXBP1连接的连接酶在cluster 2中也有共表达,而拟时分析显示HSPA5的表达领先于XBP1的强表达(图7J)。研究人员还检测到一些sXBP1 reads,确认了早期成熟prePB中首次UPR激活后发生了XBP-1的剪接。在蛋白水平上验证了prePB中BiP的表达及XBP1剪接的诱导。
为了探讨mTORC1介导的UPR激活在PCD中的作用,研究人员使用了mTORC1的急性抑制剂雷帕霉素。该药物分别在第2天到第4天或第2天到第7天期间添加,以研究其对prePB的影响。当从第2天到第4天使用雷帕霉素时,显著影响了MBCs激活后的增殖。在第4、7和10天,细胞总数分别显著减少了51%、75%和56%。雷帕霉素在第4、7和10天时并未显著影响细胞活力。在细胞水平上,第4天时prePB的百分比未受到雷帕霉素的影响。相反,在第7天,prePB的百分比显著增加,而PB的百分比在mTORC1抑制下显著减少。在第10天,成熟PC的百分比显著减少。当从第2天到第7天使用雷帕霉素时,治疗产生了相同的效果,导致PCD受到抑制。PI3K抑制剂idelalisib被用作对照。PI3K抑制显著影响了增殖,但对PCD并未显著影响。
第二次UPR激活始于cluster 5,显然与免疫球蛋白基因的表达相关(图7K)。总体来看,这些数据表明,prePB通过mTORC1通路的激活已经启动UPR,为PC功能做准备,XBP1驱动的UPR激活随后将在PB中协调进行,以应对抗体合成的增加。
为了验证的结果,研究人员使用了人类扁桃体图谱数据。在由209,786个细胞构成的人类扁桃体图谱数据集中,研究人员选择了处于S期和G2/M期的生发中心B细胞和PC。研究人员鉴定出了一种prePB亚群,其特点是MS4A1和CD38表达水平较低,同时伴随BATF、BATF3、EZH2、MYB、BLM、AICDA、NSD2和PCNA的高表达(补充图11E-G)。这些prePB在MYC靶基因、E2F靶基因、mTORC1信号、氧化磷酸化、糖酵解和炎症反应方面表现出显著富集,这些特征已在研究人员的体外PCD模型中的prePB中被鉴定(图6F)。综合来看,这些结果表明在人类扁桃体中发现了转化阶段的prePB细胞,这与先前的报道一致。
图7:prePB 和 PB 阶段 UPR 的双重激活
结语
至此这篇文章已经介绍完了,总的来说这篇文章结合了单细胞转录组与ATAC,详细的刻画了B细胞到浆细胞的各个时期转变的特征。文章结构清楚,值得研究细胞发育的小伙伴们借鉴,同时数据分析也很清晰,适合设计了单细胞转录组和ATAC实验的小伙伴们参考。
乐备实是国内专注于提供高质量蛋白检测以及组学分析服务的实验服务专家,自2018年成立以来,乐备实不断寻求突破,公司的服务技术平台已扩展到单细胞测序、空间多组学、流式检测、超敏电化学发光、Luminex多因子检测、蛋白芯片、抗体芯片、PCR Array、ELISA、Elispot、多色免疫组化等30多个,建立起了一套涵盖基因、蛋白、细胞以及组织水平实验的完整检测体系。
我们可提供从样本运输、储存管理、样本制备、样本检测到检测数据分析的全流程服务。凭借严格的实验室管理流程、标准化实验室操作、原始数据储存体系以及实验项目管理系统,已经为超过3000家客户单位提供服务,年检测样本超过100万,受到了广大客户的信任与支持。