二、全基因组DNA甲基化的测定

随着大数据时代的到来,全基因组高通量甲基化研究技术突飞猛进。下面将介绍几种当前最常用的全基因组甲基化研究手段,包括全基因组DNA甲基化芯片、DNA甲基化组测序以及一些其他检测方法。

(一)全基因组DNA甲基化芯片

基于芯片平台的全基因组甲基化分析是性价比较高的甲基化高通量分析方式之一,目前市场上主流的实验平台主要是Illumina和Agilent,相应的产品包括Illumina人的商品化芯片、Agilent人和小鼠的商品化芯片等。
Illumia芯片前期处理采用的是亚硫酸盐处理,将甲基化的差异转变成碱基上的差异,然后利用两个位点特异的探针检测这些化学上差异的位点,一个探针是为甲基化位点(M磁珠类型)设计的,而另一个是为未甲基化位点(U磁珠类型)设计的,结合后通过单碱基延伸掺入一个标记了的ddNTP,通过计算甲基化位点和未甲基化位点掺入的荧光信号强度检测DNA甲基化程度。Illunina最经典的产品是Human Methylation 27DNA analysis Bead Chip,该芯片含有>27 578个CpG位点。其另一款产品覆盖范围更广的芯片Human Methylation 450DNA analysis Bead Chip,包含>450 000个CpG位点,而且除了CpG岛,还涵盖有CpG shores和CpG shlves区域,以及non-CpG位点以及miRNA启动子区域等。
Agilent(安捷伦)采用的是免疫共沉淀的方法(MeDIP-chip)。基因组DNA分成两份,一份用来做MeDIP,加入抗5′-甲基化胞嘧啶核苷抗体,使用免疫磁珠法分离样品中甲基化DNA片段的抗体复合物,样品中其余的非甲基化DNA片段被洗脱;另一份作为对照。两个样品都标记荧光(富集的样品input用Cy5标记,对照用Cy3标记),然后与芯片杂交。芯片上每个探针的Cy5/Cy3强度比例显示出该区域的甲基化程度,Agilent Human CpG Island Microarray规格为包含约195 000个探针检测27 800个CpG岛,Human DNA Methylation Microarray能够检测27 627个扩展了的CpG岛和5081个非甲基化区域。

(二)DNA甲基化组测序

新一代测序仪的飞速发展,使得测序成本大幅度下降,也使得DNA甲基化组(DNA methylome)的研究成为可能。

1.“金标准”——全基因组重亚硫酸盐测序

全基因组重亚硫酸盐测序(whole genome bisulfite sequencing,BS-seq)是基于二代测序平台的全基因组研究的“金标准”。该方法的实验原理是前期用Bisulfite处理,将基因组中未发生甲基化的C碱基转换成U,进行PCR扩增后变成T,与原本具有甲基化修饰的C碱基区分开来,再结合高通量测序技术,特别适用于绘制单碱基分辨率的全基因组DNA甲基化图谱。但是相应的费用相对而言较高。

2.性价比较高的方法——甲基化DNA免疫共沉淀测序

甲基化DNA免疫共沉淀测序(methylated DNA immunoprecipitation sequencing,MeDIP-seq)是基于抗体富集原理进行测序的全基因组甲基化检测技术,采用甲基化DNA免疫共沉淀技术,通过5′-甲基胞嘧啶抗体特异性富集基因组上发生甲基化的DNA片段,然后通过高通量测序可以在全基因组水平上进行高精度的CpG密集的高甲基化区域研究。该方法优点在于精度高,覆盖广,性价比高,但是不足之处就是不能精确到单碱基分辨率,只能获得一段区域的甲基化程度 (彩图4-4)。
彩图4-4 MeDIP-seq结果分析实例图
图中外圈红色线段表示相应染色体部位DNA甲基化,内圈绿色线段表示相应位置低甲基化。请注意X染色体均为低甲基化,说明实验组有女性,而对照组均为男性

3.简化亚硫酸氢盐测序技术

简化亚硫酸氢盐测序技术(reduced representation bisulfite sequencing,RRBS)是基于酶切原理,通过酶切富集启动子及CpG岛区域,并进行Bisulfite测序,同时实现DNA甲基化状态检测的高分辨率和测序数据的高利用率。该方法前期用MspⅠ酶切,该酶的酶切位点为CCGG,从而将CpG位点富集出来,最终用较小的数据量得到包含最多CpG位点甲基化信息的单碱基精度的甲基化图谱。该方法的优势在于在其覆盖范围内可达到单碱基分辨率,多样本的覆盖区域重复性可达到85%~95%,覆盖全基因组范围内超过5百万个CpG位点,性价比较高。

4.其他基因组范围的DNA甲基化模式(methylation pattern)与甲基化谱(methylation profiling)分析 (1)限制性标记基因组扫描:

限制性标记基因组扫描 (restriction landmark genomic scanning,RLGS)是最早适用于基因组范围DNA甲基化分析的方法之一。该方法先用甲基化敏感的稀频限制性内切酶NotⅠ消化基因组DNA,甲基化位点保留,标记末端、切割、行一维电泳,随后再用更高频的甲基化不敏感的内切酶切割,行二维电泳,这样甲基化的部分被切割开并在电泳时显带,得到RLGS图谱与正常对照得出缺失条带即为甲基化的可能部位。

(2)甲基化间区位点扩增:

甲基化间区位点扩增 (amplification of inter-methylated sites,AIMS)是基于任意引物PCR(arbitrary primed PCR)的一种方法,由于任意引物PCR使用寡核苷酸连接子(linker)进行连接,不需要依赖任何序列的先验信息。在该方法中,用来进行扩增的模板序列首先通过甲基化敏感的限制性内切酶进行消化而富集,其特异性由该酶切片段一端的特定序列结合连接子来保证。随后,由内切酶进行第二次消化,再次连接,提纯进行PCR扩增,最后电泳,提取目的序列进行测序。

(3)甲基化CpG 岛扩增:

甲基化CpG 岛扩增(methylated CpG-island amplification,MCA)也是基于任意引物PCR的方法,该方法使用两种对甲基化具有不同敏感度的限制性内切酶(如Smal和Xmal)先后进行消化,然后对甲基化敏感的限制性酶切片段进行接头(adaptor)连接,行PCR,那些富含CpG的序列就会被选择性的扩增。该方法有助于甲基化分析和研究克隆甲基化差异性基因。

(周鹏)