单细胞多组学技术被nature methods评为2019年年度技术方法,紧接着空间转录组就被nature methods评为2020年年度技术方法,单细胞转录组测序加空间转录组联合分析已经是目前炙手可热的转录组研究方法,是研究细胞异质性、组织形态学、组织发育机制和细胞图谱等领域的不二选择。
目前广泛应用的空间转录组技术10x visium(收购了spatial transcriptomics技术),原理为原位捕获(in situ capturing),其不足之处是芯片一个位点上有1~10个细胞,无法做到单细胞级分辨率,且无法检测低表达量基因。merfish(multiplexed error-robust fluorescence in situ hybridization,多路抗错荧光原位杂交)发明者庄小威在nature methods发表了spatially resolved single-cell genomics and transcriptomics by imaging一文,介绍了基于成像原理实现单细胞空间分辨转录组学的两类技术(表 1),这些技术能将rna定位在亚细胞位置。
荧光原位杂交(fluorescence in situ hybridization, fish)应用荧光标记探针定位核酸分子,单分子水平fish(smfish)能够高度精确定位rna在细胞中的位置。然而,有限数量的颜色通道限制了fish的通量,只能检测10~30种rna。为解决这个问题,2013年庄小威团队开发了merfish,通过来自多轮杂交的信号组合来识别基因,每个基因都分配一个n位二进制条形码,每位的“1”或“0”值对应于该基因是否在一个特定轮的杂交中被检测到(图1a)。该二进制编码方案可以通过n轮杂交区分2n个基因(当在n轮杂交中使用c种颜色进行成像可达到2nc个基因)。现在merfish可以通过23轮杂交和3色成像,实现了在单细胞中对大于10,000个基因成像。
a,以merfish方法为例的多路fish方案。本文展示了一种二进制条形码方案,以及条形码如何用编码探针库印迹在rna上,并使用不同的读出探针逐位检测。b,原位测序方案示意图。核酸序列可以是基因的内源性序列,也可以是分配给基因的条形码序列,通过测序进行逐个核苷酸检测,圆圈的颜色可能表示单个核苷酸或相邻的二核苷酸对。
另一种多路fish方法seqfish,通过顺序颜色编码来区分rna,在seqfish中,不同的rna组合在每一轮杂交中被分配不同的颜色,之后用一组新的颜色组合的fish探针与细胞rna杂交,通过c色和n轮杂交,可以区分cn不同的基因。最初seqfish实现了单细胞中12个基因的定位,之后通过引入杂交链信号放大实现了约250个基因成像。然而,显微成像时分子颜色堆叠问题限制了seqfish的通量发展。
空间分辨的单细胞分析也通过序列杂交实现,例如osmfish在每个杂交的每个颜色通道中对应单个基因。这种方法在组织成像中提供了极好的信号质量,尽管其多路复用性水平较低,但提供了一种对表达水平过高或序列过短的基因进行成像的方法,它们通常无法进行单分子检测或条形码识别。这种方法也可以与上述方法相结合,可以覆盖多数的基因和难以进行单分子检测的基因。
总的来说,多路fish方法提供了具有高空间分辨率的原位单细胞转录组学和3d基因组分析。这些方法的另一个优点是检测效率高。merfish已经证明了对超过10000个基因中的80%成像,如此高的检测效率可以定量分析低表达水平的基因。
与此同时,基于成像的原位测序方法也被开发出来,用于具有高空间分辨率的单细胞转录组分析,在细胞中对rna进行原位测序,四种颜色荧光各代表一种核苷酸,根据荧光信号记录序列信息(图1b)。不同于原位杂交针对靶向rna,原位测序能以靶向或非靶向的方式进行。
在最初原位测序(iss)技术中,需在靶向原位测序中预选一组基因,将特异性核苷酸序列作为条形码通过挂锁探针杂交传递到这些基因,然后进行循环扩增和原位测序检测。starmap使用条形码挂锁探针,与靶标杂交,通过添加第二个引物,针对挂锁探针旁边的位点,避免了逆转录(rt)步骤,并降低了噪音。starmap能够对完整的组织样本进行3d分析,保留了细胞的方向性,而不仅仅是单一的2d层。但需要注意的是,这种能力只表现在100~150微米厚的切片和较少的目标数量上。starmap能够对单细胞中1020个目标基因成像,检测效率与单细胞rna测序相当。
在非靶向原位测序中,例如fisseq(fluorescence in situ sequencing,荧光原位测序),引入了细胞rna逆转录为cdna后扩增,并无需任何预选靶向序列。这种方法的优点是能做到全基因组覆盖,fisseq已经在同一样本中对大于8000个基因成像。然而,由于所有种类的rna都被测序,为了避免分子拥挤的问题,fisseq需要使用测序引物检测单个分子,导致只有一小部分的扩增子被测序,使得检测效率较低,为全基因组0.2%到<0.01%。
对于所有的靶向方法,包括原位测序和多路fish,这是克服分子堆叠以及提高检测范围一种简单的方法——将目标基因分成多个组,一次一组成像。例如,10000或20000个基因可以分为10或20组1000基因(通常不超过10轮多色成像),对10000或20000基因成像不需要改变方法,只是进行多次10或20轮成像。
之后小编将带来基于图像的单细胞空间分辨和转录组学技术应用介绍,敬请期待!
1.method of the year 2019: single-cell multimodal omics. nat methods. 2020;17(1):1. doi:10.1038/s41592-019-0703-5
2.method of the year 2020: spatially resolved transcriptomics. nat methods. 2021;18(1):1. doi:10.1038/s41592-020-01042-x
3.ståhl pl, salmén f, vickovic s, et al. visualization and analysis of gene expression in tissue sections by spatial transcriptomics. science. 2016;353(6294):78-82. doi:10.1126/science.aaf2403
4.zhuang x. spatially resolved single-cell genomics and transcriptomics by imaging. nat methods. 2021;18(1):18-22. doi:10.1038/s41592-020-01037-8
5.liao j, lu x, shao x, zhu l, fan x. uncovering an organ's molecular architecture at single-cell resolution by spatially resolved transcriptomics. trends biotechnol. 2021;39(1):43-58. doi:10.1016/j.tibtech.2020.05.006