隨著基因測序技術的發展,利用基因組編輯技術(genome editing technologies) 研究基因的功能已經成為后基因組時代生物學研究的重要方向。鋅指核酸酶(zinc finger nucleases,ZFN)、類轉錄激活因子 核 酸 酶 (transcription activator-like effectornucleases,TALEN) 及規律成簇的間隔短回文重復序列(clustered regularly interspaced short palindromicrepeats,CRISPR) 是繼同源重組基因打靶技術后,迅速發展起來的基因組編輯技術。與傳統的基因打靶技術不同,人工核酸酶技術是利用限制性內切酶在特定的DNA位點切割DNA雙鏈斷裂(double strandbreaks,DSBs) ,誘 導 細 胞 產 生 非 同 源 末 端 連 接(non-homologous end joining,NHEJ) 或 同 源 重 組(homologous recombination,HR) 修復機制對損傷的DNA進行修復,從而實現對基因組的定點修飾。傳統的基因修飾技術是通過胚胎干細胞的同源重組實現基因組的靶向修飾[1],但是該技術打靶效率低、耗時長,且打靶后有外源基因的殘留[2].人工核酸酶技術構建簡單,耗時短且不再依賴ES細胞,可以通過受精卵注射直接獲得基因修飾動物,在許多物種已經實現基因的定向修飾。本文將介紹3種人工核酸酶的原理及在生命科學和醫學研究的應用。
1基于ES細胞同源重組的基因打靶技術
傳統的基因修飾技術是基于胚胎干細胞的獲得與DNA同源重組引入外源基因這兩種技術獲得轉基因動物[1].同源重組技術是在酵母細胞中最先發展起來。 Smithies等[3]首次證明了在哺乳動物細胞也存在同源重組現象。 Mansour等[4]采用了正負選擇系 統 使 同 源 重 組 的 概 率 大 大 提 高。同 時,Capecchi[5]利用ES細胞同源重組打靶技術成功構建基因敲除小鼠。雖然基于ES細胞的同源重組基因打靶技術能夠實現基因組的定點突變,但是由于該技術依賴于胚胎干細胞的獲得、胚胎干細胞嵌合到動物生殖細胞的能力以及同源重組在胚胎干細胞中的重組效率等因素,導致這種基因打靶技術存在效率低、耗時長并有明顯物種限制的缺陷。
2人工核酸酶介導的基因修飾技術
目前,主要的人工核酸酶主要包括3種:ZFN、TALEN和CRISPR系統。這3種基因組編輯技術的工作原理大致相似:DNA的特異性結合,限制性內切酶 在 特 定 的DNA位 點 切 割DNA雙 鏈 斷 裂(double strand breaks,DSBs) ,誘導細胞產生非同源末端連接(non-homologous end joining,NHEJ) 和同源重組 (homologous recombination,HR) 修復機制對損傷的DNA進行修復,從而實現對基因組的定點修飾[6,7].
2. 1鋅指核酸酶
鋅指核酸酶(zinc finger nucleases,ZFN) 是第1代人工核酸酶,ZFN由鋅指蛋白(zinc finger protein,ZFP) 構成的特異性的DNA結合域和核酸內切酶FokⅠ構成切割域兩部分組成[8,9]. DNA結合結構域由3 ~ 6個Cys2-His2鋅指重復單位組成。 ZFP可以識別并結合3個連續的堿基,然后ZFP在核酸內切酶FokⅠ的指導下在靶基因位點將DNA雙鏈切開(Fig. 1)。由于核酸內切酶FokⅠ需要形成二聚體才具有酶切活性[10].因此需要將兩個鋅指蛋白分別與核酸內切酶FokⅠ結合,使核酸內切酶FokⅠ形成二聚體將DNA雙鏈切開,誘發細胞的DNA損傷修復機制[11].經過十幾年的發展,鋅指核酸酶技術已經成 功 應 用 于 很 多 物 種 的 遺 傳 研 究,不 僅 在 果蠅[12]、斑馬魚[13]、大鼠[14]、小鼠[15]等多種模式動物成功實現了基因敲除或修飾,而且在2005年ZFN技術首次實現了對人類細胞的基因的定點敲除[16],隨后更多類型的人類細胞也成功實現了靶基因的定點修飾[17,18].
作為最先應用的靶向基因編輯技術,與ES細胞同源重組基因打靶技術相比ZFN技術有以下幾點優勢:1) 不需要獲取ES細胞就能實現基因組修飾;2)ZFN可以實現基因的定點修飾;3) 敲除效率明顯提高。但是,ZFN也有一定的局限性,比如:ZFN對于每一個特定的靶點都需要構建龐大的鋅指表達文庫,然后再篩選出高效且特異的鋅指蛋白,這一構建過程耗時耗力且費用較高。
2. 2類轉錄激活因子核酸酶
類轉錄激活因子核酸酶(TALEN) 是第2代人工核酸酶,與ZFN相比,構建更加簡單,特異性更強。 TALEN與ZFN結 構 類 似,其DNA結 合 域 由TALE蛋白構成,TALE蛋白的DNA結合域由12個以上的串聯重復單元組成[20],每個重復單元一般含有34個氨基酸殘基,其中第12、13位氨基酸被稱為RVD(repeat-variable diresidue)[21,22].不 同 的RVD能夠特異性識別一種或多種堿基,目前已經發現了五種RVD,它們與堿基對應關系為: 組氨酸-天冬氨酸識別堿基C; 天冬酰胺-異亮氨酸識別堿基A; 天冬酰胺-天冬酰胺識別堿基G或A; 天冬酰胺-甘氨酸識別堿基T; 天冬酰胺-絲氨酸可以識別A、T、G、C中的任一種。與ZFN的工作原理一樣,兩個TALE蛋白分別與核酸內切酶FokⅠ結合形成二聚體,對基因組上特定靶位點進行切割,誘導細胞DNA修復機制從 而 實 現 靶 位 點 的 基 因 修 飾 (Fig. 2)。目 前TALEN技術已經成功的應用于包括果蠅[23]、斑馬魚[24]、大鼠[25]、小鼠[26]以及人類的多能干細胞[27]等的基因組修飾。 2014年,我們的研究組與國內學者合作利用TALEN技術實現了對非人靈長類X染色體連鎖基因MECP2基因敲除[28].
TALEN技術較ZFN技術有巨大的進步。 TALEN技術有如下優勢:1) 在構建上TALEN易于ZFN,且TALEN只需要簡單的分子克隆技術就可以完成篩選;2)TALEN在識別靶位點時有更加廣泛的選擇范圍,且在特異識別DNA序列上能力更強,特異性更強,相應的效率也高。但是,TALEN技術目前仍然處于初級階段,存在以下幾個方面的問題:1) 與ZFN一樣TALEN識別目的基因的成分是蛋白質,構建識別20 bp DNA的TALEN蛋白,可能需要設計含有1000多個氨基酸的TALEN蛋白,這可能會引起機體的免疫反應,從而在細胞中降低TALEN的作用;2)TALEN也存在一定脫靶問題,這會直接影響基因的敲除效率。
2. 3規律成簇的間隔短回文重復序列
規律成簇的間隔短回文重復序列(CRISPR) 系統是第3代人工核酸酶,該系統最初并沒有被應用于生物基因組的編輯,而是在原核生物中表現出某種獲得性免疫功能,能使宿主獲得抵抗噬菌體、質粒等外來DNA入侵的免疫能力[29]. CRISPR系統通常由CRISPR基 因 座 轉 錄 的RNA以 及CRISPR-associated(Cas) 蛋白兩個部分組成,其中最為常見的是Ⅱ型CRISPR系統即CRISPR/Cas9系統。在CRISPR / Cas9系 統 中CRISPR基因 座 轉 錄crRNA(CRISPR RNA) 與轉錄激活crRNA(trans-activatingcrRNA,tracrRNA) 退火形成復合物特異識別基因組序列,然后引導Cas9核酸內切酶在目的片段生成DNA雙鏈斷裂 (double-strand breaks,DSBs) ,進而誘導 細 胞 產 生DNA損 傷 修 復 (Fig. 3)。目 前,CRISPR / Cas9已經在斑馬魚[29]、大鼠[30]、小鼠[31]、以及人類細胞[32]等成功實現了基因的靶向修飾。此外,2014年,我們與合作者利用CRISPR/Cas9技術對非人靈長類的基因組進行了修飾,獲得多位點基因敲除食蟹猴[33].
CRISPR / Cas9系統相比于ZFN和TALEN有著明顯的優勢: 首先,CRISPR/Cas9系統的靶位點比ZFN和TALEN在 基 因 組 中 分 布 范 圍 廣; 其 次,CRISPR / Cas9系統可以同時實現對多個基因進行定點修飾,而ZFN和TALEN則需要多對; 再次,相對于ZFN和TALEN的構建,CRISPR/Cas9系統更加相簡易且成本較低; 最后,Ⅱ型CRISPR/Cas9系統易于改造,例如將cas9蛋白進行改造可以實現對真核細胞轉錄的調控[35].然而,CRISPR / Cas9系統也存在像ZFN、TALEN這些人工核酸酶常見的脫靶效應[36,37].
3基因組編輯技術的應用
3. 1基因功能研究
隨著基因測序技術的不斷發展,深入了解基因的功能、構建人類疾病動物模型以及探索新型基因治療方案已經成為后基因組時代的重要研究方向。而基因敲除是基因功能研究必不可少的環節,隨著人 工 核 酸 酶 技 術 的 不 斷 發 展,ZFN、TALEN和CRISPR / Cas9系統都已經在許多物種實現了靶基因的敲除。例如:2009年,Geurts等[38]利用ZFN技術成功構建靶基因敲除的大鼠,而且該基因突變可以穩定遺傳至后代;Huang等[39]利用TALEN技術在斑馬魚中實現對Tnikb和Dip2a兩基因的定點突變,并證明這種突變可以穩定地遺傳; 利用傳統的基因打靶技術很難實現對哺乳動物的Y染色體的基因修飾,而Wang等[40]成功利用TALEN技術實現了小鼠Y染色體上相關基因的修飾,并且成功獲得了基因修飾的小鼠。 Wang等[41]利用CRISPR/Cas9技術實現了同時高效編輯5個不同基因,這對于基因家族成員的功能相關性的研究有著重要的意義。同樣的結果相繼在斑馬魚[29]和人體細胞[32]被證實。
3. 2人類疾病模型
人類疾病動物模型在探索發病機制、疾病診斷及藥物篩選等方面發揮重要作用。采用基因組打靶技術至今,研究者已制備許多重要的人類疾病動物模型。 Jaenisch等報道了利用CRISPR/Cas9技術構建多基因突變的小鼠,實現首次應用CRISPR/Cas9技術對哺乳動物進行基因編輯。
2014年,我們研究組[28]與國內學者合作利用TALEN技術實現了對食蟹猴X染色體連鎖基因MECP2基因敲除,這是利用這項技術構建出的首個非人類靈長類動物模型。 MECP2基因位于X染色體,該位點的突變通常會造成妊娠中期的雄性胎兒的死亡,僅有雌性胎兒可以順利出生并存活,但會在出生后6 ~ 18個月開始發病,表現自閉癥特點的“Rett綜合征”(Rett syndrome,RTT,一種嚴重影響女性神經系統發育的疾?。?。我們的研究結果顯示,該基因突變的雄性胎兒在懷孕期間流產,而雌性猴在出生后則表現出明顯的自閉癥癥狀。