技术专题
什么是hi-c技术(三维基因组)
文章来源:genecreate
作者:genecreate
发布时间:2018-09-27 11:43
染色体由dna与组蛋白共同组成,从染色体的一级结构(绳珠模型)到四级超螺旋折叠结构,dna分子一共被压缩了8400倍左右,正是这些折叠和压缩,导致基因在细胞中的分布复杂而又有序。
基于基因组序列,调控元件和相关的注释的信息,科学家们发现,它们在空间结构上并不是在染色体上呈线性地一字依次排开,这些离散的调控元件并不能有效地解释很多基因的调控结果和机制。由此猜测其与基因组的三维空间结构相关。
图1 loops环
基因组三维空间结构与功能的研究简称三维基因组学(three-dimensional genomics, 3d genomics)。2003年job dekker及其合作者提出了染色质构象捕获技术(chromatin conformation capture, 3c),用于测定特定的点到点之间的染色质交互作用。随后,科学家们扩展了3c技术,开发了4c技术(circularized chromatin conformation capture),用于测定一点到多点之间的染色质交互作用。dostie等人接着开发了5c技术(carbon-copy chromatin conformation capture),用于测定多点到多点之间的染色质交互作用。
为了能捕获全基因组范围的染色质相互作用,job dekker研究组又开发出了现在大家所熟知的hi-c技术。其是基于将线性距离远、空间结构近的 dna 片段进行交联,并将交联的 dna 片段富集,接着进行高通量测序,对测序数据分析可以揭示染色质的远程相互作用,从而推导出基因组的三维空间结构和可能的基因之间的调控关系
图2 hi-c 实验流程示意图
(引自lieberman-aiden e, van berkum nl, et al. comprehensive mapping of long-range interactions reveals folding principles of the human genome. science. 2009, 326(5950):289-93)
图3 序列装配过程图
(引自tingxie, jue-feizheng, et al. de novo plant genome assembly based on chromatin interactions: a case study of arabidopsis thaliana. molecular plant, 2015, 489-492)
我们优化的hi-c技术
武汉金开瑞生物工程有限公司技术顾问、华中农业大学教授, 曹罡课题组与华中农业大学李国亮教授课题组在国际著名期刊nature genetic(if=27.125)上联合发表题为“digestion-ligation-only hi-c is an efficient and cost-effective method for chromosome conformation capture”的研究论文。该论文主要介绍了一种新的染色体构象捕获技术(dlo hi-c),此技术信噪比高,质量控制于早期,为解析基因组三维结构提供了一种新型、高效、经济的研究方法。
图4 dlo hi-c实验流程
新的dlo hi-c染色体构象捕获技术(digestion-ligation-only hi-c,dlo hi-c),设计了巧妙的酶切位点,采用同时酶切酶连的方式,将dna接头连接在染色体内切酶切口末端上,然后进行邻近酶连,最后再用mmei内切酶酶切消化,回收固定大小互作dna片段。此方法具有以下特点:1. 双交联,两次连接和消化,其中第一次同时酶切酶连,收集测序固定片段;2. 无稀释液体交联,无生物素。
图5 hi-c生信分析流程
图6 hi-c多组学分析
dlo hi-c和其他hi-c的衍生技术的结果比对
如表1所示,dlo hi-c技术所能获取的图谱分辨率高于传统hi-c技术、dnase hi-c技术。在非冗余的有效数据读取中in situ dlo hi-c的读取效率和in situ hi-c相似。
表1
几种不同的hi-c衍生方法的对比分析
(引自lin d, hong p, et al. digestion-ligation-only hi-c is an efficient andcost-effective method for chromosome conformation capture. nature genetics, 2018 , 50 (5))
最终所呈现的图谱如图7所示。in situ dlo hi-c和in situ hi-c所呈现的矩阵清晰度相似,分辨率较高。
图7 几种不同的hi-c的衍生方法的矩阵图
(引自lin d, hong p, et al. digestion-ligation-only hi-c is an efficient andcost-effective method for chromosome conformation capture. nature genetics, 2018 , 50 (5))
三种hi-c 技术在读取a/b compartments数据时,无论原始数据量多大,所读取的数据相似,且2787个数据在三种技术中均被一致读取。
图8 三种hi-c技术关于a/b compartments的读取
(引自lin d, hong p, et al. digestion-ligation-only hi-c is an efficient andcost-effective method for chromosome conformation capture. nature genetics, 2018 , 50 (5))
三种hi-c 技术在读取tads数据时,in situ dlo hi-c所读取的tads区最多是3244个。dlo hi-c的tads区的读取率最高,且三种技术读取了2334个一致的tads数据。
图9 三种hi-c技术关于tads的读取
(引自lin d, hong p, et al. digestion-ligation-only hi-c is an efficient andcost-effective method for chromosome conformation capture. nature genetics, 2018 , 50 (5))
三种hi-c 技术在读取loops数据时,in situ dlo hi-c所读取的loops最多是12780个。这三种技术共同读取的loops较少,929个。
图10 三种hi-c技术关于loops的读取
(引自lin d, hong p, et al. digestion-ligation-only hi-c is an efficient andcost-effective method for chromosome conformation capture. nature genetics, 2018 , 50 (5))
综上所述,dlo hi-c技术可获取的有效的制作矩阵的数据、a/b compartments数据、tads数据和loops数据较优于其他hi-c的衍生技术。
如此强大的hi-c,到底该如何运用于生物科学研究中呢?欲知详情,且听下回分解!