第四节 核酸分子标志物分类

31.为什么核酸分子标志物的发展将推动个体化医学和精准医学的发展
答:生物分子标志物是指可以反映机体生理、病理状态的核酸(基因组DNA、各种RNA)、蛋白质(多肽)、各种代谢产物等。目前,用于临床分子生物学检验的核酸分子标志物主要包括个体基因组特征性DNA片段、基因组拷贝数、基因组DNA突变、基因组DNA位点多态性、线粒体DNA拷贝数与突变、基因组的甲基化、病原生物体基因组序列与拷贝数、mRNA表达水平、疾病相关的各种非编码RNA(如miRNA、lncRNA等)以及外周血游离循环核酸等。与其他的分子标志物相比,核酸分子标志物具有其独特的优势。它不仅位于遗传信息链的上游,大多数情况下可以决定下游蛋白质、代谢物等的变化,而且在体内较稳定,类型多样,易于检测,最易反映个体的早期变化。随着分子生物学检验技术的发展,核酸分子标志物的发现和应用将大大推动个体化医学和精准医学的发展。
32.什么是基因突变
答:人类基因组是由DNA组成的,细胞分裂时,DNA通过碱基互补配对的原则进行复制,将遗传信息从亲代传递给子代细胞,这个过程使得DNA成为各代细胞之间联系的纽带。某些物理、化学和生物因素可以导致DNA分子中碱基发生改变,称为DNA突变,也称为基因突变。大多数的基因突变可被高等生物自我修复。基因突变主要包括点突变、插入/缺失突变、动态突变等。基因突变可以发生在编码序列,也可以发生在非编码序列;可以发生在体细胞(不传递给子代个体),也可以发生在生殖细胞(传递给子代个体)。基因突变既是遗传变异的主要来源,也是进化的动力,有害的基因突变可以直接导致个体某种表型发生异常,也可以导致个体对某种疾病易感性的增加。
33.为什么点突变不一定引起蛋白质的变化
答:点突变(pointmutation)是指DNA分子上单个碱基的改变,即一个碱基被另一个碱基所替代,又称为碱基替换(substitution),包括转换(transition)和颠换(transversion)。转换指一种嘧啶变为另一种嘧啶或一种嘌呤变为另一种嘌呤;颠换指由嘧啶变为嘌呤或由嘌呤变为嘧啶。点突变可以有以下几种情况:①虽然突变使三联密码子发生了改变,但由于遗传密码的简并性,所编码的氨基酸没有改变,不影响蛋白质的功能,此为同义突变;②密码子的改变导致所编码的氨基酸发生改变,影响蛋白质的功能,此为错义突变;③如果点突变导致某个氨基酸的密码子突变为终止密码子,翻译提前终止,肽链因长度缩短而无活性,此为无义突变。点突变可以发生在基因组DNA的任何部位。如果发生在基因外DNA序列时,一般不会产生效应。如果发生在基因的编码序列,可能会改变氨基酸的序列。如果发生在基因的调控区域,可能造成基因表达的改变。点突变还可以引起mRNA的转录后加工错误,例如破坏了内含子剪接的识别位点,产生错误的mRNA,导致其所编码的氨基酸序列发生改变。由此可见,并不是所有的点突变都会引起蛋白质的改变,只有当点突变影响到了所编码的氨基酸才会引起蛋白质的改变。
34.什么是插入/缺失突变
答:插入/缺失突变指在DNA序列中插入/丢失一个或几个碱基。如果插入或丢失的碱基数不是3的倍数,即会导致插入点或缺失点下游的DNA三联密码子读码框发生改变,称为移码突变,其结果是突变位点后的氨基酸序列与原来的蛋白质完全不同。但是如果插入/缺失的碱基数是3的倍数,没有引起读码框的改变,那么可能只是在蛋白水平上增加或减少几个氨基酸,对蛋白质的影响可能相对较小。
35.什么是动态突变
答:DNA分子中存在着一些短串联重复序列,尤其是位于基因编码区或侧翼区的一些三核苷酸重复序列。在由亲代向子代传递过程中,这些短串联重复序列的重复次数不是固定不变的,而是可以随着世代的传递呈现逐代递增的累加突变效应,从而导致某些遗传病,故称之为动态突变。例如亨廷顿病(Huntington′s disease)就是由于其致病基因序列中所包含的一段以三核苷酸CAG为核心的重复序列发生拷贝数增加所致,正常人群CAG的拷贝数在9~34之间,患者拷贝数多在36~120之间。
36.为什么DNA会发生损伤
答:细胞内的DNA会受到各种各样的损伤,导致DNA发生突变,包括自发突变和诱发突变。能够引起DNA损伤的原因可分为物理因素、化学因素和生物因素三种主要类型。①物理因素:紫外辐射、电离辐射等不仅可以引起碱基的改变,使得DNA复制或转录时碱基发生错误配对,还能引起DNA链的断裂,使DNA片段发生重排,造成染色体结构畸变。②化学因素:一些碱基类似物可以掺入DNA分子取代某些正常碱基,引起突变,如5-溴尿嘧啶可取代T,并与G配对;亚硝酸类化合物可以使碱基发生氧化脱氨基作用,如A被脱氨基后即成为次黄嘌呤,不能与T正常配对,而与C互补结合;羟胺类化合物可使C的化学成分发生改变,与A配对结合;烷化剂可以使核苷酸因烷基化而发生错误配对;芳香族化合物则能够嵌入到DNA序列中,造成碱基的插入或丢失。③生物因素:病毒、细菌和真菌所产生的毒素或代谢产物往往能诱发DNA突变,如黄曲霉菌产生的黄曲霉素,就具有强烈的致突变作用,被认为是肝癌发生的重要诱发因素之一。
37.为什么紫外线可以引起基因突变
答:紫外线是波长从10~400nm的电磁波谱的总称,属于不可见光线。260nm左右的紫外线,其波长正好在DNA和蛋白质等生物大分子的吸收峰附近,容易导致这些生物大分子发生损伤。紫外线不但能引起DNA分子的断裂,还可以使DNA分子中两个相邻的嘧啶碱基以共价键连接形成嘧啶二聚体结构,其中以胸腺嘧啶二聚体(TT)结构多见。二聚体的形成可导致DNA双螺旋呈现不正常的构型,使复制和转录受到影响,引起基因突变,从而影响基因的表达和功能。
38.为什么生物经过很强的太阳光照射后一般不会发生基因突变
答:在自然界中,太阳是最主要的紫外线光源。太阳光透过大气层时,波长短于300nm的紫外线可被大气的臭氧层吸收,所以一般不会对地球上的生物造成损害。此外,生物体在进化过程中产生了多种损伤修复机制,可以使损伤的DNA得以复原,这对于维持生物体的生存和遗传的稳定具有重要的意义。常见的损伤修复机制包括:①直接修复:光复活作用可直接逆转紫外线辐射造成的嘧啶二聚体;②切除修复:通过修复系统将受损的碱基或核苷酸切除并替换为正确的核苷酸,是修复受损DNA最普遍的方法;③复制后修复:能够纠正DNA双链断裂;④错配修复(mismatch repair,MMR):能纠正DNA复制错误所引起的错配的碱基对。正是由于大气臭氧层的保护和体内存在的多种损伤修复机制,使得生物体在经过很强的太阳光照射后,大多数情况下并不会发生基因突变。值得一提的是,日益严重的环境污染正在使大气臭氧层遭到破坏,因此,保护好环境,保护好地球,就是保护人类自己。
39.为什么DNA多态性的检测具有重要的应用价值
答:同种群体内,同一个基因在不同个体或同一个体的两条染色体上会出现核苷酸序列的差异,若这种差异在群体中出现的频率低于1%,称为DNA突变,高于1%则称为DNA多态性。DNA突变可导致明显的基因结构、功能和表型的异常,而DNA多态性大多是中性的,虽然影响DNA的序列,但一般不影响基因的表达。多态性位点多发生在非编码区,且无临床表型或临床表型不明显。人类基因组中DNA多态性有多种形式,主要包括限制性片段长度多态性(restriction fragment length polymorphism,RFLP)、微卫星(microsatellite)和小卫星(minisatellite)多态性、单核苷酸多态性(single nucleotide polymorphism,SNP)以及拷贝数多态性(copy number polymorphism,CNP)等。人类个体千差万别,正是由于DNA的这些多态性,构成了体现个体差异的遗传标志,在法医学上可用于个体识别和亲子鉴定。此外,DNA的多态性还体现了不同个体或群体对疾病易感性和对药物、环境等因素的不同反应,是研究和检测疾病的分子遗传学基础。因此,DNA多态性在生物医学研究和临床实践中具有重要价值。
40.什么是限制性片段长度多态性
答:限制性片段长度多态性(RFLP)是指由于个体基因组DNA中核苷酸序列的变异使同种生物不同个体的DNA在限制性内切酶酶切后出现的不同长度的限制性片段(片段长度的多态性),被认为是第一代DNA分子标志。RFLP主要有以下两种类型,一种是点多态性,是指由于DNA单个碱基的改变,导致酶切位点的丢失或获得而产生的多态性。另一种是序列多态性,是指由于DNA分子中出现较大片段的缺失、重复或插入而形成的多态性。后者的特征是限制性内切酶识别位点本身的碱基不发生变化,改变的只是酶切位点在DNA分子中的相对位置。RFLP的检测被广泛用于遗传图谱构建、基因定位以及生物进化和分类的研究,也被用于地中海贫血、血友病、苯丙酮尿症等疾病的诊断。由于此技术所需样品量多、方法繁琐、实验持续时间长,目前已逐渐被其他检测方法所取代,但是仍有一定价值。
41.为什么小卫星或微卫星多态性可用于疾病的遗传分析
答:小卫星和微卫星多态性属于第二代DNA分子标志物,均表现为重复序列拷贝数的变异。小卫星DNA由长10~100bp的基本序列串联而成,可重复几十到几百甚至几千次,总长通常不超过20kb。这种可变数目串联重复(variable number of tandem repeats,VNTR)序列决定了小卫星DNA长度的多态性。微卫星DNA的基本序列只有2~8bp,又称短串联重复(short tandem repeat,STR)或简单序列重复(simple sequence repeats,SSR),通常重复几十至上百次。小卫星DNA和微卫星DNA基本序列的重复次数在个体间呈高度变异性,且数量丰富,其多态性比RFLP高,可通过聚合酶链反应(polymerase chain reaction,PCR)以及电泳对其进行分析检测,被广泛用于DNA指纹(DNA fingerprint)分析和遗传连锁分析。此外,一些基因的小卫星DNA或微卫星DNA多态性与人类疾病特别是神经系统疾病和癌症也有着密切的关系。因此,临床上可将VNTR或STR等用于疾病的遗传分析和诊断。
42.什么是单核苷酸多态性
答:单核苷酸多态性(SNP)是指在基因组水平上,由单个核苷酸的变异所引起的DNA序列多态性,主要由碱基的转换或颠换所致。它是人类可遗传变异中最简单、最常见的一种,占所有已知多态性的90%以上。SNP广泛存在于人类基因组中,平均每500~1000bp中就有1个SNP。根据SNP在基因中的位置不同,可分为基因编码区SNP(codingregion SNP,cSNP)、基因周边 SNP(perigenic SNP,pSNP)和基因间 SNP(intergenic SNP,iSNP)三大类。一般情况下,SNP并不直接致病,但有些SNP可能与疾病的易感性相关。目前,检测分析SNP的主要方法有点杂交、荧光定量PCR、变性高效液相色谱、基因测序、基因芯片分析等。近年来,通过全基因组关联分析(genome-wide association study,GWAS)已发现很多与疾病相关的SNP位点,对于疾病风险的分析具有重要作用。
43.为什么拷贝数多态性可用于疾病的诊断
答:拷贝数多态性(CNP)也称为拷贝数变异(copy number variation,CNV),是指基因组中较大的DNA片段(1kb~2Mb)所发生的拷贝数的变化,即在染色体的某个区域由于某段DNA序列的插入、复制或缺失,使得该段DNA序列的拷贝数发生增加或减少。这类变异可涉及一个基因或连续的一系列基因,可以来自遗传,也可由新发突变造成。通过细胞遗传学技术、荧光原位杂交技术和下一代测序技术等实验方法可对CNP进行检测分析。CNP与多种遗传性疾病或疾病的易感性有着密切的相关性,检测与疾病相关的CNP对于疾病的诊断和治疗具有重要的意义。
44.为什么基因组会有不稳定性
答:正常情况下,细胞内基因组的结构和功能是稳定的。当DNA自发或诱发的突变不断积累,而DNA修复系统因损伤无法及时修复这些突变时,可出现基因组不稳定性(genomic instability)。最常见的基因组不稳定性是微卫星不稳定性(microsatellite instability,MSI),表现为DNA复制过程中因错配无法被及时修复而引起的微卫星序列插入或缺失的重复次数的改变,导致微卫星序列长度发生变异。
基因组不稳定性是一种特殊的遗传损伤,与染色体变异、原癌基因激活或抑癌基因失活等一样,都是导致细胞癌变的重要原因。基因组不稳定性常被认为发生在细胞癌变过程的早期阶段,与很多肿瘤的发生关系密切。如结直肠癌患者经常表现出很强的MSI。MSI的检出必须同时检测正常细胞和肿瘤细胞的微卫星序列,并进行对比分析。
45.为什么细胞具有DNA修复机制还会出现基因组不稳定性
答:正常的基因组能够保持稳定的结构和功能,这是由于细胞内存在维护基因组稳定的修复系统,即基因组守护基因(genomic caretaker gene),可参与DNA损伤修复和错配修复(MMR)。当DNA在复制过程中因模板错位等原因而发生错配损伤,引起基因突变时,若修复系统的相关基因异常,相邻基因的突变频率则会升高100~1 000倍,“CA”等二核苷酸重复单位在微卫星序列中插入或缺失的频率也会升高500倍。因此细胞修复系统缺失是造成基因组不稳定性的重要原因,这种基因组不稳定性在肿瘤与遗传性疾病(如着色性干皮病、Bloom综合征、Fanconi贫血、毛细血管扩张性运动失调等)中发挥着重要作用。
46.为什么表观遗传是一种特殊而重要的遗传方式
答:表观遗传(epigenetic inheritance)是指可通过细胞分裂在细胞世代之间传递的不依赖DNA序列的现象,包括DNA甲基化、组蛋白修饰、染色质重塑、基因表达的重编程以及非编码RNA的调节等。表观遗传学(epigenetics)是研究表观遗传现象的一门新兴的分子和医学遗传学分支学科,主要研究非DNA序列改变所引起的基因表达和调控的可遗传性变化。与高度稳定的基因组DNA相比,表观遗传修饰既是可以遗传的,在一定条件下又是可逆的,处于亚稳定的状态。表观遗传丰富了生物遗传的概念,在更高层次上赋予遗传信息更广泛的灵活性和多样性,解释了机体在不同发育阶段、不同条件下基因表达不同的现象。表观遗传修饰的异常会使基因的表达发生明显改变,导致蛋白质表达增加或减少,甚至诱发多种疾病,包括肿瘤、免疫性疾病、内分泌疾病及神经系统疾病等。
47.什么是DNA甲基化
答:DNA甲基化(DNA methylation)是指生物体在DNA甲基转移酶的催化下,以S-腺苷甲硫氨酸作为甲基供体,将甲基转移到特定碱基上的过程。DNA甲基化的部位常见于腺嘌呤N-6位,胞嘧啶N-4位,鸟嘌呤N-7位或胞嘧啶C-5位等。在人类基因组DNA中大约有1%的碱基会发生甲基化修饰,最常见于胞嘧啶-磷酸-鸟嘌呤(CpG)二联核苷酸中的胞嘧啶上,生成5 m C。在正常组织DNA中,CpG可以散在存在,也可以串联成簇排列在一起(称为CpG岛)。DNA甲基化多分布在分散的CpG,而CpG岛则多为非甲基化状态。甲基化位点可随DNA的复制而遗传,甲基化酶可在DNA复制后对新合成的未甲基化的位点进行甲基化。DNA甲基化能使染色质结构、DNA构象、DNA稳定性以及DNA与蛋白质的相互作用方式等发生改变,从而有效调控基因表达。
针对候选基因的DNA甲基化分析,主要采用重亚硫酸盐法。该方法首先用重亚硫酸盐使DNA中所有非甲基化的胞嘧啶脱氨基转化变为尿嘧啶,而甲基化的胞嘧啶则不发生改变。结合PCR扩增、测序、酶切、电泳等手段,即可对任何基因序列的甲基化状态进行检测。若要对DNA甲基化进行高通量的检测则可应用甲基化检测芯片等最新技术。
48.为什么DNA甲基化能有效调控基因表达
答:DNA甲基化是最早发现的DNA修饰途径之一,可参与胚胎发育、X染色体失活、衰老、肿瘤等多种生理过程和疾病。DNA甲基化可引起基因组特定区域的染色质结构发生改变,使染色质高度螺旋化,凝缩成团,从而失去转录活性。而DNA去甲基化则是促进基因表达的一种方式,如位于基因转录启动子区域的CpG岛,多处于去甲基化状态,可使基因正常转录,它们是基因表达的 “开关”。因此DNA的甲基化和去甲基化修饰是细胞内一种重要的基因表达调控方式,也是表观遗传学的重要组成部分。DNA甲基化状态的异常会影响基因组的稳定性,导致基因表达过度或表达失活,诱发各种遗传性疾病或肿瘤。许多抑癌基因的表达失活都与DNA甲基化修饰有关,异常的高甲基化会使抑癌基因的转录水平大大降低或失活,从而诱发肿瘤的发生发展。
49.为什么组蛋白乙酰化修饰可以影响基因的转录活性
答:染色体的基本单位是核小体,每一个核小体由H2A、H2B、H3和H4四种组蛋白组成的八聚体以及所缠绕的DNA构成。组蛋白的核心部分均一,但位于外面的氨基端则可以被多种酶进行各种修饰,包括甲基化、乙酰化、磷酸化、泛素化等。其中乙酰化修饰主要发生在组蛋白H3和H4氨基端比较保守的赖氨酸位置,在组蛋白乙酰转移酶和去乙酰化酶的共同协调下进行。组蛋白的这些修饰可以改变其与DNA之间的相互作用,使染色质构型发生改变(称为重塑),从而影响基因的转录活性,如乙酰化参与基因活化和DNA复制;去乙酰化则与基因失活有关。构成核小体的组蛋白中被修饰的氨基酸种类、位置和修饰类型等被称为 “组蛋白密码”,它对生长发育不同阶段、不同条件下的基因表达等具有重要意义。
50.什么是RNA干扰
答:RNA干扰(RNA interference,RNAi)是由双链小RNA分子诱发的、可致互补的靶mRNA降解或表达受抑的现象,也是真核生物的一种自我保护机制。RNAi最初是在研究C.elegan线虫时发现的,被认为是基因表达调控的一个重要发现。常见的参与RNAi的小RNA分子有miRNA和siRNA两种。miRNA是一类内源性的微小RNA分子,是其前体经体内Dicer酶加工之后形成的一类长18~25bp的非编码小RNA分子,在体内与解旋酶、内切酶等多种成分形成RNA诱导沉默复合物(RNA-induced silencing complex,RISC),抑制与其有互补关系的特异性mRNA的翻译表达。miRNA的特点是具有高度的保守性、时序性和组织特异性,miRNA与靶mRNA的序列互补可以是不完全的。siRNA是一类人工合成的长20~25bp的外源性双链小RNA分子,一般与靶mRNA的序列完全互补,可通过转染进入细胞内,降解与其序列互补配对的靶mRNA,沉默相应基因的表达。
51.为什么要检测线粒体DNA
答:线粒体病是一类具有高度临床变异性和遗传异质性的疾病,线粒体疾病临床表型复杂多样,常累及多个器官或系统,临床诊断相对较难。虽然线粒体中仅有20%的蛋白质是由环状双链的线粒体DNA编码而成,但线粒体DNA本身的缺陷却是线粒体疾病发生的主要原因,因此检测线粒体DNA缺陷可以为临床诊断线粒体疾病提供直接证据。线粒体DNA缺陷包括重复、缺失及点突变,其中点突变是最常见的缺陷。针对已知点突变的检测方法包括等位基因特异性寡核苷酸(allele specific oligonucleotide,ASO)杂交、PCR-限制性片段长度多态性(PCR-RFLP)、基因芯片、连接酶链反应等。针对未知点突变的检测方法包括单链构象多态性(single strand conformation polymorphism,SSCP)分析、变性梯度凝胶电泳(denaturing gradient gel electrophoresis,DEEG)、基因测序分析、变性高效液相色谱(denaturing high performance liquid chromatography,DHPLC)等。
52.为什么要检测线粒体DNA的拷贝数
答:人体的每个细胞中有数千个乃至上万个线粒体DNA分子。在不同的组织、不同的细胞中或同一组织在不同的发育阶段、不同的生理状态下,线粒体DNA的拷贝数是可以发生动态变化的,高耗能的细胞(如肌肉细胞)含有的线粒体DNA拷贝数远多于低耗能的细胞(如胰腺细胞)。线粒体DNA拷贝数的变化与衰老、骨质疏松、糖尿病、心血管疾病、肿瘤等多种疾病的发生、发展有一定的相关性。在一些致死性的婴儿呼吸障碍、乳酸性酸中毒或肌肉、肝、肾衰竭的患者中,其线粒体DNA的拷贝数会显著减少。因此,检测线粒体DNA的拷贝数具有一定的临床应用价值。
53.为什么人体中可以检出外源性基因组
答:人体中外源性基因组主要来源于感染的病原体。当细菌或病毒等病原体入侵人体后,会在细胞内大量繁殖和释放,并进入血液,因此血液中检测病原体核酸是病原体感染的直接证据。目前临床上最常见的是利用荧光定量PCR技术来定量检测病毒的核酸载量,后者与病毒在体内的数量、病毒的活跃程度呈正比,也是临床判断病毒感染程度最重要的信息,可指导临床制订治疗方案和评估预后。此外,病原体的核酸检测不仅可以用来进行隐性感染或潜在感染的诊断,也可以对病原体进行基因型分型、亚型鉴定以及耐药性分析等,尤其在变异病毒的快速诊断中具有不可替代的优势。
54.为什么非编码RNA可以作为临床检测的分子标志物
答:所谓非编码RNA就是指不编码蛋白质的RNA,除rRNA和tRNA外,其他非编码RNA常被认为是 “垃圾”RNA。事实上,它们并非 “垃圾”,而是参与DNA甲基化修饰、染色质重构、基因转录和翻译的调控,在生命的各种生理和病理过程中具有广泛的调节作用。它们的突变或表达异常与许多疾病的发生密切相关,因此其重要性已越来越得到人们的关注。非编码RNA主要包括miRNA和lncRNA等。在人类肿瘤中,这些非编码RNA分子的表达谱往往不同于正常组织,且在不同类型的肿瘤之间也具有一定的特异性。它们既可以行使原癌基因的作用,也可发挥肿瘤抑制因子的作用,这在肝癌、肺癌、肠癌、卵巢癌和白血病等多种恶性肿瘤中已得到证实。因此,非编码RNA可用来作为疾病诊断、预防、疗效监测、预后判断的辅助分子标志物,为临床确定个体化治疗方案提供有力的工具。

(刘湘帆 潘晓蓉 梁璆荔 童建华)