一、细胞通讯与单细胞测序技术的研究意义
多细胞生物由不同类型的细胞构成一个开放的社会。在这一社会中,单个细胞之间必须协调其行为,因此建立有效的通讯联络机制至关重要。细胞通讯是指一个细胞发出的信息通过介质传递至另一个细胞,并引发相应反应的过程。在动物和植物中,利用化学信号分子进行细胞间通讯是最为普遍的方式。其中,配体-受体复合物介导的细胞-细胞通讯在协调发育、分化及炎症等多种生物学过程中发挥着关键作用。
复杂的细胞外反应始于配体与其同源受体的结合,以及特定细胞信号通路的激活。因此,定位这些配体-受体相互作用是理解细胞行为及其对邻近细胞反应的基础。近年来,单细胞RNA测序(single-cell RNA sequencing)技术日益普及,RNA测序数据量呈指数级增长。这使得在多种细胞类型中测量配体和受体的表达,并系统性地解码细胞间通信网络成为可能,进而有助于解释组织在稳态下的功能及其在疾病状态下的变化。
二、CellPhoneDB 数据库概述
为解析不同细胞类型之间细胞通讯网络如何调控生理过程的运行,研究人员开发了CellPhoneDB[1]。该数据库专门用于储存配体、受体及其相互作用信息,以支持细胞通讯网络的系统分析。CellPhoneDB整合了来自UniProt、Ensembl、PDB、IUPHAR等多个公共数据库的信息,共收录978种蛋白质,其中包括501种分泌蛋白和585种膜蛋白。这些蛋白质参与了1396种相互作用,其中474种为涉及分泌蛋白的相互作用,490种为仅涉及膜蛋白的相互作用(图1)。
图1 CellPhoneDB 数据库概述
相较于其他数据库,CellPhoneDB的一个主要优势在于其考虑了配体和受体的结构组成,能够准确描述异聚复合物。这一特点对于许多细胞因子等蛋白质家族尤为重要,因为这些家族的配体-受体相互作用往往涉及多个亚单位,受体之间共享结构亚单位,而配体的亲和力则由受体亚单位的特定组合所决定。在CellPhoneDB收录的所有蛋白质中,有466种属于异聚体。
三、CellPhoneDB 进行细胞通讯分析的原理
CellPhoneDB 集成了一种计算方法,用于从单细胞转录组测序(scRNA-seq)数据中识别具有生物学意义的配体-受体相互作用。该方法要求输入数据中包含 counts 定量信息以及细胞类型注释,具有相同细胞类型注释的细胞将作为一个细胞状态群体进行后续分析(图 a)。
在分析过程中,CellPhoneDB 基于一种细胞类型中受体的表达以及另一种细胞类型中配体的表达,预测两种细胞状态之间可能存在的配体-受体相互作用。首先,针对每个细胞群体中的每一个基因,计算表达该基因的细胞百分比及其平均表达水平。只有当表达受体或配体基因的细胞占比超过设定的阈值(默认值为 10%)时,相应的配体-受体对才会被纳入分析。对于聚合体(复合物),则选取其各亚基中平均表达水平较低者的表达值,作为该受体的代表表达值用于后续统计分析(图 b)。
随后,算法在数据集中所有细胞类型之间进行两两比较。具体而言,首先对细胞类型标签进行随机置换,将所有细胞随机分配到新的细胞群中(默认随机置换 1000 次),并计算在新群体条件下,配体在发送细胞类型中的平均表达水平与受体在接收细胞类型中的平均表达水平的乘积。通过这种方式,为每一对细胞类型之间的每一个配体-受体对生成一个零分布(图 c)。
在构建零分布之后,依据原始细胞分群计算同一配体-受体对在相应两种细胞类型之间的实际平均表达乘积。根据在零分布中该值等于或高于实际平均表达乘积的比例,推算该配体-受体对在这两种细胞类型之间相互作用的显著性 P 值(图 d)。
在此基础上,根据每对细胞类型之间所富集的显著配体-受体对的数量,对细胞类型间高度特异的相互作用进行排序,以便进一步人工筛选具有生物学意义的相关相互作用。通过上述流程,基于特异性的蛋白质复合物信息,可预测细胞群体之间可能的分子相互作用,从而构建出细胞群体间的潜在通讯网络,并最终以表格和图形等直观形式进行可视化展示(图 e)。
四、细胞通讯分析的应用
CellPhoneDB 对细胞通讯网络的分析方法可推广至任何包含潜在相互作用细胞群的单细胞转录组数据,并已在多个单细胞图谱研究中得到应用。例如:
在一项针对健康与哮喘气道的比较研究中,研究者利用 CellPhoneDB 识别了细胞间相互作用的变化,发现健康气道中以间充质-上皮相互作用为主的通讯网络,在哮喘气道中转变为以 Th2 细胞为主的模式。
在肾脏相关研究中,通过细胞间相互作用分析揭示了上皮-免疫系统之间的串扰机制,这种串扰协调了抗菌巨噬细胞和中性粒细胞向肾脏最易感染区域的富集。
在一项 2019 年的单细胞图谱分析工作中,研究者借助涉及 VCAM1、ITGB1 和 ITGA4 等与造血相关的重要分子,确定了红细胞与 EI 巨噬细胞之间的相互作用。
此外,CellPhoneDB 数据库最初是基于人类特有的配体-受体相互作用构建的,但通过将人类基因映射至同源的小鼠基因,也可应用于小鼠数据集。在一项 2018 年的研究中,研究者利用该细胞通讯分析框架,证实了小鼠黑色素瘤模型肿瘤微环境中不同细胞类型之间存在复杂的相互作用。





沪公网安备31011502400759号
营业执照(三证合一)