基因组工程学三大利器: ZFN、TALEN和CRISPR/Cas

2013/09/03 来源:生命奥秘
分享: 
导读
锌指核酸酶和转录激活因子样效应因子核酸酶都可以对DNA进行各种遗传修饰,在这里我们就为读者介绍这种新型的、序列特异性的核酸酶在遗传分析和遗传改造工作中发挥的作用。此外,我们还会重点介绍这两种酶在临床治疗方面的潜力以及这些核酸酶在未来的发展前景。


锌指核酸酶(Zinc-finger nucleases, ZFN)和转录激活因子样效应因子核酸酶(transcription activator-like effector nucleases, TALEN)这两种新型的核酸酶重新定义了传统生物学研究的界限和范畴。这两种核酸酶都是嵌合体,都是由经过设计的、序列特异性的DNA结合元件(programmable, sequence-specific DNA-binding modules)和非特异性的DNA切割结构域结合而成的。ZFN和TALEN都可以对DNA进行各种遗传修饰,这两种核酸酶的作用机制都是先对DNA双链分子进行切割,形成DNA双链断裂切口(DNA double-strand break),然后激活细胞内的非同源末端连接修复机制(nonhomologous end joining,这是一种非保真的、容易出现遗传突变的修复机制),或者同源重组修复机制(homology-directed repair,这是一种高保真的修复机制,不容易出现突变),利用细胞自身的修复机制对DNA进行遗传学修饰。接下来, 我们就将为读者介绍这种新型的、序列特异性的核酸酶,看看它们在遗传分析和遗传 改造工作中都能发挥哪些功用。此外,我们还会重点介绍ZFN和TALEN在临床治疗方面的潜力,以及这些核酸酶,与包括最新出现的RNA介导的、基于成簇的规律间隔的短回文重复序列和Cas蛋白的DNA核酸内切酶(clustered regulatory interspaced short palindromic repeat (CRISPR)/Cas-based RNA-guided DNA endonucleases)在内的其它核酸酶在未来的发展潜力。

了解基因功能的传统方法和现代方法

随着全基因组测序技术(whole-genome sequencing)的不断发展和完善,以及大型基因组注释项目(genome annotation projects)的实施,科研人员们已经开始跃跃欲试,想要将基因组研究的成果尽早地运用到基础科学研究的各个领域,以及个性化医疗(personalized medicine)工作当中。不过海量的基因组信息也给科研人员们出了一个不小的难题,那就是该如何将这些枯燥的数据转换成有意义的基因组功能,或者与临床相关的信息呢?解决这个问题的核心就在于尽快开发出一种高效率的、可靠的方法,来帮助科研人员研究基因型(genotype)对表型(phenotype)的影响作用。利用同源重组机制(homologous recombination)对基因进行定向失活(Targeted gene inactivation)就是这样一种好方法,可以帮助科研人员明确基因的功能。不过在实际工作中使用这种方法也会受到好几个因素,比如存在效率太低、费时费力、而且有可能导致突变等的限制。而 RNAi(详见名词解释)等基因靶向敲除技术则为科学家们提供了一种快捷、廉价而且可以开展高通量研究的新方法。不过RNAi这种基因敲除技术的敲除效果还不够彻底,每次试验以及每个实验室的试验结果都会有差异,另外还存在不可预知的脱靶情况(off-target effect),所以只能够用于需要暂时抑制基因功能的试验当中。这些研究手段的种种不足都严重限制了科学家们在探索基因型和表型关系的科研道路上前进的步伐,也妨碍了RNAi技术的实际应用。

近十年来出现了一种新的研究手段,可以帮助科研人员对各种细胞和各种生物体内的几乎任意基因进行人工操作。这种新技术就是我们常说的“基因组编辑技术(genome editing)”,而前面介绍过的由序列特异性的DNA结合结构域与非特异性的DNA切割结构域组合而成的人工核酸酶就是这种基因组编辑技术的重要组成部分。这些嵌合式的核酸酶能够以极高的效率、极高的精确度对基因组进行人工修饰,其机制就是我们前面介绍过的切割DNA产生DSB,然后利用NHEJ或HDR等 DSB修复机制完成我们所需要的各种人工修饰。由于科研人员们对锌指蛋白和TALE蛋白等蛋白的DNA结合结构域的设计能力越来越强,所以这种基因组编辑技术的应用范围也一再地被拓展。这些既简单又灵活的核酸酶在遗传工程学领域里发挥了极大的作用,其重要性也在与日俱增,已经站到了遗传工程工作的最前线。下面我们将介绍几个最近在位点特异性核酸酶技术(site-specific nuclease technologies)领域取得的最新研究成果,我们也将就这项新技术在基因组靶向工程学(targeted genome engineering)领域的应用,以及在对真核细胞和模式生物的分析工作中的应用价值展开探讨。我们还将介绍这种位点特异性核酸酶技术在临床治疗方面的应用潜力,以及未来的发展趋势,比如RNA介导的、基于成簇的规律间隔的短回文重复序列和 Cas蛋白的DNA核酸内切酶未来的发展和应用前景等。

名词解释:

CRISPR/Cas (CRISPR associated) systems: CRISPR/Cas系统(CRISPR相关系统), CRISPR(clustered regulatory interspaced short palindromic repeat)即成簇的、规律间隔的短回文重复序列,是基因组中一个含有多个短重复序列的位点,这种位点在细菌和古细菌(archaea)胞内起到了一种获得性免疫(acquired immunity)的作用。CRISPR系统主要依赖crRNA和tracrRNA来对外源DNA进行序列特异性降解。目前已经发现了3种CRISPR/Cas系统,其中在2型系统(type II systems)中依赖的是Cas9蛋白。在RNA的介导下,Cas9蛋白能够对crRNA–tracrRNA识别的靶序列进行切割。

crRNA:CRISPR RNA能够与tracrRNA配对,形成双链RNA结构,这种双链RNA分子能够介导Cas9核酸内切酶对与双链RNA分子互补结合的DNA序列进行切割。

DSB:ZFN、TALEN以及CRISPR/Cas9系统对 DNA双链进行切割之后就会形成DNA双链断裂缺口(double-strand breaks),即DSB。

HDR:同源重组修复,DSB出现之后,细胞会启动这种修复机制,以同源链为模板,对DSB进行修复。由于这种修复作用是以同源链为模板,而且还有位点特异性的核酸酶(site-specific nuclease)参与,所以其保真度非常高。利用HDR可以插入一个或者多个基因,也可以进行单碱基替换。

NHEJ:非同源末端连接修复机制是另外一种DSB修复机制,通过这种修复可以将断裂的DSB末端直接连接起来。由于在这种修复过程中不会用到同源模板链,所以在断裂处容易出现小的插入或者缺失突变,常常会导致移码突变,使基因的功能遭到破坏。

PAM:前间区序列邻近基序(protospacer adjacent motif),这是一种见于crRNA分子的短核苷酸基序,可以被Cas9蛋白特异性识别并切割。

RNAi:RNA干扰技术,是一种利用RNA分子抑制或者敲除基因表达的技术。从更广义的角度来说,RNA干扰技术是细胞对外源RNA分子的天然抑制机制,是细胞的一种自我保护行为。

TALEN:转录激活因子样效应因子核酸酶主要由 Fok I内切酶结构域和TALE蛋白的DNA结合结构域组合而成。TALE蛋白含有多个33-35个氨基酸组成的重复肽段,而每一个肽段都能够识别一个碱基。与ZFN一样,TALEN也能使DNA靶序列断裂,形成DSB,进而激活DNA损伤修复机制,对基因组进行定点改造。

tracrRNA:反式激活嵌合RNA(trans-activating chimeric RNA),这是一种非编码RNA,能够促进 crRNA的形成,也是Cas9蛋白发挥RNA介导的DNA切割作用必不可少的辅助因子。

ZFN:锌指核酸酶是由FokI限制性核酸内切酶当中的非特异性的DNA切割结构域和锌指蛋白(zinc-finger protein)组合而成的。ZFN二聚体(dimers)能够促使DNA断裂形成DSB,进而诱发DSB修复机制。锌指结构域的靶向功能使ZFN能够对基因组中的特定位点进行定向改造。

ZFNickases:锌指切口酶(zinc-finger nickases)也是ZFN,不过是在其中两个FokI限制性核酸内切酶结构域当中的一个结构域发生了失活突变的ZFN。锌指切口酶只能够形成DNA单链断裂(single-strand DNA break),所以只能激活同源重组修复机制,不能激活NHEJ修复机制。

定制的DNA结合结构域

ZFN和TALEN极强的“适应性”源自我们可以对这些核酸酶里的DNA结合结构域进行个性化的定制,使其能够特异性地识别各种DNA序列。这些DNA结合结构域能够与背景知识框1里介绍过的各种效应元件(effector domain),比如转录活化因子、转录抑制因子、重组酶(recombinase)、转座酶(transposases)、DNA和组蛋白甲基转移酶(methyltransferases)以及组蛋白乙酰基转移酶(acetyltransferases)等搭配,来对基因组进行各种改造,比如对基因组的结构或者基因组的功能进行改造等。由此可以看出,其中最关键的因素就是各种核酸酶对DNA结合的特异性和亲和力。下面,我们将重点介绍几个比较成功的,组装这些DNA结合结构域的方法和技术。

Cys2–His2锌指蛋白

Cys2–His2锌指结构域是在真核生物中最常见的一种DNA结合基序,在人类基因组中也是编码频次排名第2的蛋白结构域。一个锌指大约由30个氨基酸组成,形成了一种保守的ββɑ结构(图1A)。在锌指ɑ螺旋结构表面的那几个氨基酸能够与DNA大沟上的3个碱基结合,不过这种结合的选择性会有所差异。由于锌指蛋白具有这种分子结构,所以非常适于打造个性化的DNA结合蛋白。在锌指蛋白特异性识别DNA序列的应用当中,最关键的工作就是设计出人造的、非天然的组合,比如含有3种以上的锌指蛋白DNA识别结构域的蛋白。高度保守的链接序列(linker sequence)的出现使这种设计成为了可能,因为有了这种链接序列,我们就可以设计出能够识别9~18个碱基长度的DNA序列。在一段 680亿个碱基组成的DNA序列里,18个碱基组成的序列就足以成为一段特异性的序列,所以如果能够设计出含有3种以上的锌指蛋白DNA识别结构域的蛋白,那么就意味着科学家们能够利用锌指蛋白识别出人类基因组里的任意一段DNA序列。虽然这种理论在最开始还存在一定的争议,但是后来发现,如果要识别复杂基因组中某一段特定序列的DNA片段,这种设计策略的确是最佳的方案。

基于前期开展的论证研究(proof-ofprinciple)成果,科研人员们又开发出了好 几种新的构建锌指蛋白的策略和方法,这些 锌指蛋白在DNA结合的特异性方面都有其独 到之处。模块化组装(modular assembly) 策略就是其中的一种,这种策略就是以预先 选择好的锌指蛋白模块文库(这种预选的文 库是通过对多个大型文库进行筛选,或者人 工设计出来的)为基础,从中挑选出合适的 模块组装出所需要的锌指蛋白。由于目前开 发的锌指结构域几乎已经可以识别所有64 种三联核苷酸组合(密码子),所以我们完 全可以将这些锌指模块串联起来,识别特定 的DNA序列。另外,也可以使用基于选择的 策略(selection-based approach),比如 寡聚体化序列设计策略(oligomerized pool engineering,OPEN)就可以从任意的文库 (这些文库会考虑相邻锌指之间与序列有关的 相互作用)中选择出新的锌指结构域。还有 人将前面介绍的这些方法结合起来开发出了 新的策略,比如先预先选择出与序列有关的 (context-dependency)锌指模块,然后将 这些模块组合在一起形成更长的锌指组合。多 年以来,锌指蛋白技术一直都是打造位点特 异性的DNA结合蛋白或酶的唯一方法。目前 已经有商业化的人工锌指可供选择,比如美 国的Sangamo Biosciences(Richmond, CA, USA)公司就已经和美国Sigma–Aldrich(St. Louis, MO, USA)公司合作,开发出了一套 名为CompoZr的锌指蛋白构建系统,免去了 科研人员自己构建锌指蛋白以及后续的验证工 作。目前已经有数千个锌指蛋白可供我们选 择。可以毫不夸张地说,锌指蛋白技术可以以 任意序列为靶标。

背景知识1:核酸酶之外的其它工具酶: 重组酶、转座酶及转录因子

位点特异性的核酸酶(Site-specific nucleases)是目前被研究得最透彻,也是应用范 围最广的一种遗传修饰工具酶,主要应用于细胞和模式生物的遗传改造工作。不过这种酶 也有其局限性。比如,位点特异性的核酸酶的脱靶效应(off-target effect)就会对细胞产生 毒性,更麻烦的是我们很难预测是否会出现脱靶效应,也几乎无法系统地监测细胞内出现 的脱靶效应,所以科学家们也陆续开发出了其它几种新型的基因组改造工具。此外,由于这 些核酸酶还需要依赖细胞自身的NHEJ及同源重组修复机制来完成遗传改造工作,所以这种 技术也只能应用于某几种具备这些修复机制的细胞。为了解决上述问题,科学家们决定另辟 蹊径,将锌指蛋白和TALE蛋白与核酸酶之外的其它几种酶结合,开发出了新的遗传改造工 具,比如位点特异性的重组酶、转座酶等。这些酶可以使细胞基因组DNA发生整合、切除或 者倒位等改变。因为这些酶能够自动完成对DNA的切割和连接操作,因此核酸酶脱靶导致 的“毒性”DSB不太可能在细胞内累积,也就不会对细胞造成太大的伤害。另外,重组酶和 转座酶更利于在基因组内的特定位点插入新的基因,所以能够更有目的地监测是否出现了脱 靶效应。而且重组和转座机制是不依赖于细胞自身的DSB修复机制的。所以这些工具酶几乎 可以应用于任何细胞,也可以在任何细胞周期内使用。我们还可以通过定向进化(directed evolution)的方式来提高这些工具酶的催化效率。不过要使这些重组酶和转座酶的可用性达 到核酸酶的水平,还需要对它们进行更进一步的改进和优化,进一步提高酶的活性和在使用 方面的灵活性。尤其是在所结合的重组酶的催化活性结构域中还保留有部分的序列特异性, 所以还需要对它们进行更进一步的改造,使其能够特异性地与我们所瞄准的靶标序列结合。 虽然转座酶与锌指等序列特异性结合蛋白融合之后表现出了极高的特异性,但还是会表现出 比较明显的脱靶现象,所以也需要对这类蛋白进行更进一步的优化。最后再来介绍一下人工 合成的锌指转录因子和TALE转录因子,这类蛋白能够特异性地影响基因的表达,这也起到了 一种基因组定向修饰的作用。综上所述,位点特异性的重组酶、转座酶及转录因子是除了位 点特异性的核酸酶之外的一大类灵活、好用的基因组修饰工具,是对位点特异性的核酸酶的良好补充。

TALE核酸酶

最近又发现了另外一种简单的DNA识别模块,那就是TALE核酸酶中的DNA识别模块,这无疑又给科学家们提供了另外一个平台,方便他们设计出更多的DNA结合蛋白。 TALE蛋白是一种源自植物致病菌——黄单包杆菌(Xanthomonas)的天然蛋白,其中也含有DNA结合结构域(图1B)。TALE蛋白中的DNA结合结构域是由一连串33~35个氨基酸组成的重复结构域组成的,其中每一个结构域都能够识别一对碱基。TALE核酸酶的DNA结合特异性主要由两个高度可变的氨基酸决定,科学家们将这两个关键的氨基酸称作重复可变双氨基酸残基位点(repeat-variable di-residues, RVD)。与锌指结构域一样,这种TALE重复模块也能够串联起来,识别一长串的DNA序列。不过与锌指蛋白不同的是,针对基因组中的某个位点,在连接 TALE蛋白的DNA识别模块时,接头没有太多的改造空间。经过前人对锌指蛋白开展的近 20年的科研工作,科学家们已经发现了大量的效应因子结构域(effector domain),比如核酸酶(nuclease)结构域、转录激活因子(transcriptional activator)结构域、位点特异性的重组酶(site-specific recombinase)结构域等,这些效应因子结构域都可以与 TALE蛋白DNA序列识别结构域搭配,对基因组中的目标位点进行各种遗传修饰。虽然 TALE蛋白DNA序列识别结构域能够识别单个碱基对的特性要比锌指蛋白的3碱基识别更富灵活性,在设计的时候可变性更强,但是克隆这么一大段TALE蛋白DNA序列识别结构域的重复编码序列也是一个不小的挑战。为了解决这个问题,科学家们也想出了不少的办法,现在就已经有好几种方案能够让科研人员快速地组装出任意搭配的TALE蛋白 DNA序列识别结构域。金门分子克隆技术(‘Golden Gate’molecular cloning)就是其中的一种解决方案,这是一种高通量的固态组装技术(solid-phase assembly),而且是一种不需要进行连接的克隆技术(ligation-independent cloning techniques)。有多个使用了各种组装策略的大规模的、系统性研究项目表明,TALE重复识别模块可以组装在一起,识别任何DNA序列。根据文献的报道,TALE蛋白在识别DNA序列方面存在的唯一限制就是它所识别的位点必须以T开始。最近有项研究指出,已经有人构建了一个 TALEN文库,能够靶向结合18740个人类编码基因,这说明构建TALEN蛋白并不是那么困难。这项“浩大的”工程不仅能够促进科研人员利用核酸酶开展更多的研究,同时也有利于鼓励大家开展类似的、更大规模的工作。目前也出现了商业化的人工TALE文库,比如法国巴黎的Cellectis Bioresearch公司、美国的Transposagen Biopharmaceuticals公司(Lexington, KY, USA)和生命科技公司(Life Technologies, Grand Island,NY, USA)都提供这类服务。


图1  锌指蛋白(zinc-finger)和转录活化因子样效应蛋白(transcription activator-like effector, TALE)的结构。(A)人工设计的锌指蛋白与靶标DNA分子(图中灰色所示)形成的复合结构(PDB ID: 2I13)。每一个锌指结构都由大约30个氨基酸组成,形成了一个ββɑ样结构,如放大图所示。位于锌指结构域表面的氨基酸残基(即 1、 2、 3、6号氨基酸)能够与DNA接触,如图中的棒状结构所示。因此,每一个锌指结构域都能够与 DNA大沟侧的3至4个碱基接触。保守的半胱氨酸残基侧链和组氨酸残基侧链能够与紫色的锌离子结合。(B)锌指核酸酶二聚体与 DNA结合示意图。锌指核酸酶的靶序列含有两个锌指蛋白结合位点,不过这两个位点之间还有一段5~7bp的间隔序列,锌指核酸酶里的Fok I酶切结构域就能够切割这段间隔序列。当然,我们也可以设计出只能够识别左侧或者右侧结合位点的锌指蛋白。(C)TALE蛋白与DNA分子结合形成的复合体(PDB ID: 3UGM)。每一个TALE结构域都是由33~35个碱基组成的序列反复重复形成的,每一个33~35个碱基组成的序列都能够依靠序列里两个高度可变的氨基酸残基(即重复可变双残基RVD,放大图中的棒状结构所示)识别1个碱基对。(D) TALE核酸酶二聚体与DNA形成的复合物的结构示意图。TALEN的靶序列也含有两个TALE结合位点,其中也有一段12~20bp长的间隔序列,而且也能够设计出只能与其中一个结合位点结合的 TALE。图中列举了4种RVD组合。

利用位点特异性的核酸酶进行基因组编辑(Genomeediting)操作

一直以来,科研人员在进行基因定向抑要依靠的都是同源重组技术(homologous 制、替代或者额外插入等遗传学操作时主recombination),不过这种方法对哺乳动物细胞和模式生物进行遗传改造时的效率非常低,这就极大地限制了这类遗传操作的开展。后来科学家们发现,当细胞内出现DSB之后,同源重组的效率会上调好几个数量级,再加上后来发现的定向核酸酶,就极大地提高了利用同源重组技术进行遗传改造操作的工作效率。科学家们同时在细胞内转入位点特异性的核酸酶和携带有位点特异性同源序列(locus-specific homology arm)的外源质粒,这样就能够以极高的效率在细胞基因组特定的位点转入一个或者多个转基因序列(图 2A)。我们也可以通过这种方法,转入一段不超过50bp的线性外源同源序列或者单链的 DNA寡核苷酸链,在细胞基因组内的特定位点引入替换突变、缺失突变或者插入突变。这项技术具有非常重要的意义,因为位置的效应(positional effect)在这里已经不再那么重要了(可是在以前,位置效应会让很多遗传学分析变得非常复杂),可以对天然的、复杂染色体环境下的基因组结构与其功能之间的关系进行研究。位点特异性的核酸酶除了能够提高同源重组的效率之外,还能够以很快的速度构建null表型(null phenotype)的细胞系和模式生物。这些核酸酶产生DSB之后如果启动了NHEJ修复机制,那么就会在DSB位点处引入小段的缺失突变或者是插入突变,使基因发生移码,从而起到敲除基因功能的作用(图 2B)。这些位点特异性的核酸酶还能够引入大段的染色体缺失突变,使染色体发生大段的倒位(inversion)和转位(translocation)。总而言之,借助细胞的NHEJ修复机制,通过这些核酸酶对外源DNA片段和内源染色体位点的定向切割,我们可以实现大片段的(最大可以达到14kb)转基因操作。这些方法能够帮助科研人员更好地研究基因的功能,还可以通过改变基因来模拟已知的或者是尚未确定的基因型,构建病理模型等。这类技术当中已经有很多被应用到了胚胎干细胞、iPS细胞等祖细胞(progenitor cell type)的研究工作当中(表1),这样就可以开发出更多遗传背景下的细胞、乃至组织等模型。我们还可以用这类技术对非编码DNA(比如调控序列)的作用进行研究,有助于发现与目的基因有关的未知调控序列。


图2 使用位点特异性核酸酶进行基因组编辑操作时可能出现的几种情况。核酸酶切割DNA形成DSB之后细胞可能会借助同源重组修复途径,或者是NHEJ修复途径对DSB进行修复。(A)在缺乏外源质粒DNA模版的情况下,细胞会通过NHEJ机制进行修复,在基因组中形成小型的插入或者缺失突变。在存在双链寡聚核苷酸分子,或者在细胞内存在线性的质粒片段时,可以通过NHEJ机制在基因组中插入大段的DNA序列,最长可以插入14kb的序列。同时形成两种DSB之后会形成缺失、倒位或者倒位的序列转位等突变。(B)在存在同源序列的外源模版的情况下,细胞会通过同源重组修复机制修复DSB,在基因组内插入1个或者多个转基因,或者对基因组中的错误基因进行修复。

表1 使用ZFN、TALEN和CRISPR/Cas对人及模式生物进行基因组修饰的案例

遗传修饰类型修饰物种修饰基因使用的核酸酶
破坏基因功能CCR5ZFN
  TALEN
  CRISPR/Cas
TCR(T细胞受体编码基因)ZFN
斑马鱼gol (Golden)、ntl (No tail)、kraZFN
ɑ1, 3-半乳糖转移酶编码基因GGTA1 (ɑ1, 3-galactosyltransferase)ZFN
 低密度脂蛋白受体编码基因LDLR(LDL receptor)TALEN
ACAN12、p65TALEN
EMX1、PVALBCRISPR/Cas
大鼠IgM、Rab38ZFN
拟南芥(Arabidopsis)ADH1、TT4ZFN
秀丽隐杆线虫ben-1、rex-1、sdc-2ZFN/TALEN
仓鼠(Hamster)DHFRZFN
果蝇YellowZFN
水稻OsSWEET14TALEN
插入基因OCT4、PITX3ZFN/TALEN
CCR5ZFN
凝血因子9编码基因F9(Coagulation Factor IX)ZFN
小鼠Rosa26ZFN
AAVS1ZFN
  TALEN
  CRISPR/Cas
VEGF-AZFN
斑马鱼酪氨酸羟化酶(tyrosine hydroxylase)编码基因th、fam46c、 smad5TALEN
玉米IPK1ZFN
基因修正IL2RGZFN
 ɑ1抗胰蛋白酶(ɑ1-antitrypsin)编码基因A1ATZFN
 β球蛋白(β-globin)编码基因HBBZFN
 ɑ突触核蛋白(ɑ­synuclein)编码基因SNCAZFN
烟草乙酰乳酸合酶(acetolactate synthase)编码基因SuRA、SurRBZFN
果蝇yellowZFN

位点特异性核酸酶的优化问题

位点特异性核酸酶应用(遗传分析、临床应用等)的一大特点就是要保证极高的位点特异性。不过在复杂的基因组里,同一段序列往往会含有多个拷贝,这些序列都和我们的目标序列一模一样(或者高度同源),这就会给核酸酶技术带来脱靶的问题,而且很有可能会给细胞带来毒性和伤害。为了解决这个问题,科学家们提出了以结构和选择为基础的方案,开发出了ZFN和TALEN的异源二聚体蛋白,这种新型的核酸酶蛋白的切割特异性更高,而且对细胞的毒性也更低。Thomas Gaj等人的实验室就运用定向进化技术(directed evolution)开发出了具有超强活性的Fok I蛋白酶切结构域,他们将之称作Sharkey。这种蛋白的酶切活性要比传统的ZFN至少提高了 15倍,而且可以和任意的ZFN蛋白搭配。另外,有大量的证据表明,每一个ZFN中如果携带4至6个锌指结构域,就能够获得最大的特异性和酶切活性。除此之外,科研人员还开发出了其它几种改进核酸酶的方法,比如暂时使用低温培养条件来提高核酸酶的表达量;在使用核酸酶的同时使用DNA末端处置酶(DNA end-processing enzyme);使用荧光报告载体筛选、富集ZFN和TALEN作用过的细胞等。随着锌指切口酶(zinc-finger nickases,该酶可以切割DNA双链,也可以切割DNA单链)的出现,ZFN介导的基因组修饰技术的特异性得到了进一步增强,有研究发现,使用这种酶切割DNA之后只会激活同源重组修复机制,不会激活比较容易出错的NHEJ修复机制。这样一来就会减少脱靶(突变)效应出现的机率,不过在使用这种锌指切口酶时,同源重组的效率也会比使用锌指核酸酶时低一些。如果使用传统的DNA和mRNA转染的方式在细胞内表达锌指核酸酶,那只能对特定的几种细胞进行操作,而且还会发生很多副作用(背景知识框2),比如会出现插入突变、细胞毒性及转染效率低下等。为了解决这些问题,他们最近又新开发了一种更加简便的措施,直接将已经纯化的锌指核酸酶转入目标细胞里,这样就不会出现插入突变,而且脱靶效应出现的机率也更低。这种新方法对于那些需要从事高精度的基因组遗传改造工作的科研人员非常有帮助。

背景知识2:将位点特异性的核酸酶输送到细胞内的几种方法

虽然位点特异性的核酸酶是一种非常好的基因组改造工具,但是如何将这些酶转移到目标细胞 内,这还是一个比较棘手的问题,也直接影响了位点特异性的核酸酶的应用。通常使用的几种方法 包括直接将携带编码位点特异性的核酸酶基因片段的质粒、病毒载体或者直接用体外转录的mRNA转 入细胞当中。科学家们可以根据应用的需要,或者所针对的细胞类型对这些转染方法进行适当的改 进,但是现有的病毒或非病毒转运系统还是大大地限制了位点特异性的核酸酶的应用。尤其是在转 染质粒DNA或者是体外转录mRNA时,如果采用电转(electroporation)或者是阳离子脂质转染试剂 (cationic lipid-based reagents)等方式,会给细胞带来比较大的毒性,所以这种方法只能应用于少 数几种细胞,这更是限制了位点特异性的核酸酶的应用。采用病毒载体也有缺陷,比如病毒非常复 杂,很难制备,而且还存在潜在的免疫原性,同时还牵涉到很多监管方面的问题等等。不过虽然存在 上述种种困难,以腺病毒为载体的ZFN临床试验也已经开展起来了,目前开展的这些试验主要都是以 T淋巴细胞为靶标,将来如果出现了更好的转运技术,则会给位点特异性的核酸酶带来更广阔的应用前景。

整合酶缺陷的慢病毒载体(Integrase-deficient lentiviral vector, IDLV)是一种比较诱人的ZFN 转运工具,尤其适用于用常规方法难以转染的细胞。不过这种载体似乎不太适于装载高度重复的 TALEN编码序列。虽然设计TALEN明显要容易一些,但是TALEN要比ZFN更难被转运进入细胞内。 AAV载体也是一个比较有前景的ZFN转运载体,能够提高ZFN介导的同源重组修复的效率,也能够提 高细胞内ZFN引起的基因修复工作的效率。不过AAV只适合装载不超过4.2kb的DNA序列。虽然这个 装载容量对于ZFN单体和外源模板序列来说已经足够了,但是对于TALEN而言却不太够,只能装下一 个TALEN单体外加一段最简单的启动子序列。

Thomas Gaj等人的课题组最近发现可以让纯化的ZFN蛋白直接透过细胞膜进入细胞内,使细胞 内的基因被破坏,这也可以作为一种ZFN转运的替代技术。与传统的基因转运方式相比,他们这种方 法具有以下几个优势。首先,可以减少脱靶效应发生的几率,因为它减少了细胞内ZFN酶活性持续的 时间,所以最大限度地降低了核酸酶的“脱靶活性”。其次,这种方法对目标细胞没有太大的偏好 性,也不存在病毒或者非病毒基因转运系统对细胞带来的毒性伤害。第三,这种方法不存在安全性 等监管方面的障碍,所以更适合用来开发ZFN治疗技术。不过他们现在还不确定是不是也能将纯化的 TALEN蛋白直接转入细胞内。

位点特异性的核酸酶在模式生物中的应用

位点特异性的核酸酶也能够在多种在生物研究工作中经常会用到的模式生物里进行位点特异性的遗传修饰,其中就包括斑马鱼、大鼠、小鼠、果蝇、秀丽隐杆线虫、黑脉金斑蝶(monarch butterfly)、蛙和家畜(livestock)等。ZFN和TALEN都能应用于这些模式生物的研究工作当中,比如就可以用 ZFN和TALEN对秀丽隐杆线虫和与其关系相近的广杆属线虫(Caenorhabditis briggsae)的基因功能进行比较研究,来发现这些彼此亲缘关系相近物种间的相似之处和差异,这让正向同源基因(orthologous gene)之间的比对分析工作成为了可能。实验证明,用显微注射的方法在单个的斑马鱼胚胎内注入TALEN的 mRNA和单链的DNA寡核苷酸片段,或者是携带有超过800bp同源臂(homology arm)的质粒等外源序列,就可以实现定点整合(targeted integration)的遗传编辑操作,得到loxP人工染色体。用这种方法也可以对模式生物进行有条件的人工基因活化操作。ZFN和 TALEN除了在上述这些动物模式生物上具有应用价值之外,也可以应用于拟南芥、水稻、玉米等多种植物模式生物,进行遗传改造,打造出携带多种有益性状的“人造”植物,比如让植物携带抗病基因或者抗除草剂基因等。我们相信,将来这些位点特异性核酸酶一定可以应用于更多的模式生物,为基础研究和基因组生物学研究提供更多、更好的研究平台。

位点特异性的核酸酶在临床治疗方面的应用价值

在临床治疗工作中使用位点特异性的核酸酶是基因治疗领域的一大进展和趋势。与目的在于暂时缓解症状,或者是随意地在基因组中掺入几个治疗因子(therapeutic factors)的传统基因治疗方式所不同的是, ZFN和TALEN都能够纠正错误的致病基因,所以能够一劳永逸地解决问题。到目前为止,ZFN搭配同源重组修复的基因组编辑技术已经被用于多种疾病的临床治疗工作当中了,其中就包括 X染色体连锁的严重复合免疫缺陷病(X-linked severe combined immune deficiency, SCID)、乙型血友病(hemophilia B)、镰刀状细胞贫血(sickle-cell disease)和ɑ1抗胰蛋白酶缺乏综合症(ɑ1-antitrypsin deficiency)等疾病。此外, ZFN也被用于修复帕金森氏病患者自身来源的iPS细胞里与帕金森氏病相关的SNCA基因突变。用ZFN及NHEJ机制实施的基因靶向敲除操作在治疗艾滋病方面也表现出了非常大的应用潜力。有人利用ZFN技术对初始T细胞(primary T cell)进行了遗传改造,使T细胞上的HIV共受体——C-C细胞因子受体5(C-C chemokine receptor type 5)编码基因CCR5丧失了正常的功能,这样一来HIV就不能感染这些T细胞了。现在这项技术已经进入了临床试验阶段,NCT01252641、NCT00842634和NCT01044654这3个临床实验项目都在进行相关的试验研究。最近,还有科研人员利用 ZFN相关技术在CCR5基因所在的基因座内敲入了抗HIV的限制性因子(anti-HIV restriction factor),得到了对R5和X4 HIV毒株(R5¬and X4-tropic strains of HIV)近乎完全抵抗的T细胞。此外,ZFN也被用来改进T细胞免疫疗法的治疗效果,主要就是通过ZFN技术使 T细胞受体编码基因失活,提高肿瘤特异性的 T细胞的获得效率。位点特异性的核酸酶能够以非常安全的方式在人类基因组特定的位点(所谓的安全插入位点)里插入治疗性的转基因序列。虽然目前这种技术主要还只能应用于体细胞改造,但是随着干细胞研究的不断深入,随着iPS技术的不断发展,相信位点特异性的核酸酶一定能够在基因治疗方面取得更大的成果,比如应用于自体干细胞移植等领域。

使用RNA介导的DNA内切酶进行基因组编辑操作

与前面介绍的位点特异性的核酸酶不同, CRISPR/Cas系统是最近才发现的一个新型的基因组定向编辑技术,而且完全有能力与 ZFN和TALEN技术“分庭抗礼”。CRISPR系统能够为细菌提供一种获得性免疫保护机制,通过这套RNA介导的DNA切割机制使细菌免受外源DNA的侵扰。在2型CRISPR/Cas系统里,短片段的外源DNA分子(也可以称之做间隔分子)被整合到CRISPR基因组位点内,进行转录,进而被处理成短CRISPR RNA,即所谓的crRNA分子。这些crRNA分子与反式激活的crRNA,即tracrRNA结合,介导了序列特异性的切割作用,最后在Cas蛋白的作用下使外源的“致病”DNA分子沉默。最近的研究表明,Cas9蛋白的靶向识别作用需要依靠crRNA里的一段“种子序列”,以及crRNA结合区域上游的保守的含有双核苷酸(dinucleotide-containing)的间隔前临近基序序列(protospacer adjacent motif sequence, PAM)的帮助。所以从理论上来说,这套CRISPR/Cas系统几乎可以在crRNA 的介导下对任意的DNA序列进行切割,关键 就在于设计出合适的crRNA序列。更加重要的 是,这套CRISPR/Cas系统已经被证实能够在 人体细胞内发挥作用,只需要在人体细胞内转 入能够表达Cas9核酸内切酶的质粒和相应的 crRNA分子就够了。已经有人使用这套RNA 介导的DNA切割机制成功地对iPS细胞进行了 试验,证明这套技术对这种细胞具有基因破坏 作用和定向整合等多种基因组编辑修饰作用。 Cas9蛋白也可以被替换成切口酶,进而启动 另外一种DNA修复操控机制。除了能够应用 于人体细胞之外,这套CRISPR/Cas基因组编 辑技术也可以应用于斑马鱼和细菌等其它物种 的细胞,不过还需要开展更进一步的研究来充 分认识这套系统的真正应用价值,比如是否存 在脱靶效应等。另外,我们也不清楚这套系统 是否就是唯一的单位点特异性的基因组识别系统。

使用RNA介导的DNA内切酶进行基因组编辑操作

与前面介绍的位点特异性的核酸酶不同, CRISPR/Cas系统是最近才发现的一个新型的基因组定向编辑技术,而且完全有能力与 ZFN和TALEN技术“分庭抗礼”。CRISPR系统能够为细菌提供一种获得性免疫保护机制,通过这套RNA介导的DNA切割机制使细菌免受外源DNA的侵扰。在2型CRISPR/Cas系统里,短片段的外源DNA分子(也可以称之做间隔分子)被整合到CRISPR基因组位点内,进行转录,进而被处理成短CRISPR RNA,即所谓的crRNA分子。这些crRNA分子与反式激活的crRNA,即tracrRNA结合,介导了序列特异性的切割作用,最后在Cas蛋白的作用下使外源的“致病”DNA分子沉默。最近的研究表明,Cas9蛋白的靶向识别作用需要依靠crRNA里的一段“种子序列”,以及crRNA结合区域上游的保守的含有双核苷酸(dinucleotide-containing)的间隔前临近基序序列(protospacer adjacent motif sequence, PAM)的帮助。所以从理论上来说,这套CRISPR/Cas系统几乎可以在crRNA 的介导下对任意的DNA序列进行切割,关键 就在于设计出合适的crRNA序列。更加重要的 是,这套CRISPR/Cas系统已经被证实能够在 人体细胞内发挥作用,只需要在人体细胞内转 入能够表达Cas9核酸内切酶的质粒和相应的 crRNA分子就够了。已经有人使用这套RNA 介导的DNA切割机制成功地对iPS细胞进行了 试验,证明这套技术对这种细胞具有基因破坏 作用和定向整合等多种基因组编辑修饰作用。 Cas9蛋白也可以被替换成切口酶,进而启动 另外一种DNA修复操控机制。除了能够应用 于人体细胞之外,这套CRISPR/Cas基因组编 辑技术也可以应用于斑马鱼和细菌等其它物种 的细胞,不过还需要开展更进一步的研究来充 分认识这套系统的真正应用价值,比如是否存 在脱靶效应等。另外,我们也不清楚这套系统 是否就是唯一的单位点特异性的基因组识别系统。

结论及未来的发展方向

ZFN、TALEN和CRISPR/Cas系统都是非 常有力的转化工具,对生物学研究和个性化 医疗(personalized medicine)都能够起到 革命性的影响和促进作用。实际上,这些新兴 的技术极大地拓展了我们对模式生物的处置和 研究能力,也为治疗遗传性疾病,纠正遗传错 误提供了一种平台。不过要充分发挥这类技术 的潜力,还有很多问题和困难需要解决和克服 (背景知识框3)。其中最主要的问题就是每 一种技术平台的特异性问题。在不久的将来, 能够全面识别脱靶位点的高通量筛查技术可以 帮助我们更清楚地认识每一种技术平台的特异 性问题。其它问题还包括用哪种方法往细胞 或者生物体内输送核酸酶更合适等。尤其值 得注意的是,虽然腺病毒载体能够装载并转 运全长的TALEN编码基因到人类细胞当中, 但是用于转运TALEN的慢病毒载体(lentiviral plasmid vectors)比较容易导致基因组重排 (rearrangement)。另外,TALEN编码序列 这种比较庞大的基因片段也影响了重组腺相 关病毒(adeno-associated virus, AAV)载体 的转运能力,研究表明,这种载体更适于转 运ZFN基因。上述研究发现都表明,开发新 的TALEN转运系统迫在眉睫,是未来一个重 要的研究方向。虽然CRISPR/Cas系统在遗传 改造方面表现出了极大的潜力,同时也展现 出了极强的灵活性,但是这套系统对PAM序 列的独特需求也在一定程度上限制了它的应 用。对Cas9蛋白的定向进化工作可能能够帮 助CRISPR/Cas系统最终“抛弃”PAM序列, 同时也可以得到酶切效率更高的Cas9蛋白。 当然,还需要开展其它体内和体外研究,来评 价CRISPR/Cas系统的特异性和毒性。最后, 对重组酶、转录因子等能够影响基因组结构和 功能的蛋白的继续开发工作也不能中断,因为 它们都能对核酸酶系统起到非常重要的补充作 用。综上所述,这些技术能够极大地提高我们 研究基因组、改造基因组的能力,为我们认识 并最终攻克疾病提供一个更新、更好及更有力 的技术平台。

背景知识3:尚存的几点问题

如果用作治疗用途,ZFN和TALEN的疗效会如何?

什么方法是转运位点特异性的核酸酶的最佳方法?如果使用慢病毒载体该如何转运TALEN蛋白?

Cas9蛋白能够被当作DNA结合结构域与其它酶蛋白的活性结构域融合,形成新的工具酶蛋白吗?

CRISPR/Cas9系统的特异性和安全性如何?与ZFN和TALEN技术相比,CRISPR/Cas9系统的基因组编辑效率如何?

在哺乳动物细胞内使用CRISPR/Cas9系统时使用哪一种RNA骨架结构效果最好?

本网站所有注明“来源:生物探索”的文字、图片和音视频资料,版权均属于生物探索所有,其他平台转载需得到授权。本网所有转载文章系出于传递更多信息之目的,且明确注明来源和作者,不希望被转载的媒体或个人可与我们联系(editor@biodiscover.com),我们将立即进行删除处理。所有文章仅代表作者观点,不代表本站立场。