前言
啟動子作為 RNA 聚合酶和一些轉錄因子結合的靶序列,對轉錄起始有調節和控制作用,決定著基因表達過程的起始以及在什么條件下開始。因此啟動子的識別與分析是表達調控研究的前提和基礎。隨著越來越多的原核和真核模式生物基因組測序完成,使得研究基因之間的相互作用關系進而構建表達調控網絡已經成為可能。而且啟動子與結合蛋白的研究能夠幫助我們尋找新的功能性蛋白質。啟動子分析對于構建基因工程載體,表達目的蛋白有著重要的意義。如何查找并通過實驗確定啟動子序列是研究啟動子功能的前提。啟動子分析大多是基于DNA 和蛋白質相互作用的特性。本文從原核和真核啟動子的基本結構、分類入手,對常用的幾種啟動子分析方法,如生物信息學分析方法、酵母單雜交(Y1H)技術、瞬時轉染法(TransientTransfection)、染色質免疫共沉淀(ChIP)技術、凝膠阻滯分析(EMSA)試驗和 DNA 足紋(DNase I footprinting)分析法等,從原理、優缺點和最新應用等方面的研究進展作一綜述,并對近年來出現的新技術新方法的應用前景進行展望,為啟動子的結構與功能研究提供借鑒,以進一步促進這一領域研究工作的深入發展。
1 啟動子基本結構
1.1 原核生物啟動子的結構模型原核生物啟動子 (Prokaryote promoter) 長度一般為 20bp~200 bp,細菌啟動子常由四部分組成[1]: CAT 序列,轉錄起始位點;Pribnow 框,即轉錄起始位點 .10 位置,有一段共有序列TATAAT,是 RNA 聚合酶的結合位點,啟動子的強度很大程度上是由這一序列的核苷酸構造所決定;Sextama 框,位于 .35區,其共有序列是 TTGACA,是 RNA 聚合酶的識別位點;間隔區:兩段長為 6 個核苷酸保守序列,被長為非特異性的 17~19個核苷酸序列所分隔。在 Pribnow 框和 Sextama 框之間的堿基序列的間隔數十分重要[2].啟動子的規模有時相當大,能夠包含轉錄起始位點上游 2000 bp,有些特定基因的轉錄區內部也存在著轉錄因子的結合位點。
1.2 真核生物啟動子結構模型真核生物啟動子(Eukaryotic promoter)主要有三類,分別對應于細胞內的三種 RNA 聚合酶與相關蛋白質。其中Ⅱ類啟動子即 RNApolⅡ啟動子序列的基本結構特征是,位于轉錄起點上游 .25~ .30 區有一與原核生物的 Pribnow 框相似的富含AT 堿基對的 TATA 盒(Hogness 盒),TATA 盒有 7 對共有堿基序列:5'. TATA(A/T) A(A/T).3',其功能與原核啟動子的 Prib.now 框也相似,決定 RNA 聚合酶 II 的位置,控制轉錄起始的準確性及效率,此為核心元件[1].大多數真核基因啟動子上游距帽位點約 80 ~ 220 bp 處,都存在上游原件,其中有 CAAT 盒,GC 盒等,它們的保守序列與結合蛋白因子也各不相同,可以大大提高的基本啟動子的低水平轉錄活性。
2 啟動子分類
根據對轉錄水平控制的程度,可以將啟動子分為弱啟動子和強啟動子;參照轉錄模式,啟動子又可以分[3]:①組成型啟動子(constitutive promoter),該類啟動子能夠調控結構基因的表達基本恒定在一定程度上,在不同部位或組織表達水平差異不明顯。在高等植物轉基因工作中,花椰菜花葉病毒(CaMV)35S 啟動子,以及來自根癌農桿菌 Ti 質粒 T.DNA 區域的胭脂堿合成酶基因 nos 啟動子都得到廣泛使用。nos 啟動子來自細菌,但具有植物啟動子的特性;②組織特異啟動子 (tissue.specific pro.moter),該類啟動子的調控作用使得基因往往只在某些特定的器官或組織部位表達,且表現出發育調節的特性;③誘導型啟動子(inducible promoter),即在某些特定的物理或化學信號刺激后,基因轉錄水平在該類型啟動子調控下大幅度地提升。目前已經分離了眾多啟動子如熱誘導表達基因、光誘導表達基因、創傷誘導表達基因、真菌誘導表達基因和共生細菌誘導表達基因啟動子等。而這些誘導型啟動子又分為人工構建的誘導型啟動子,天然誘導型啟動子,阻遏型啟動子系統和激活型啟動子系統。
Trinklein N D,Krom N,Yang L 和 Dhadi S R 等多位研究者發現[4.7],近年來的生物信息學研究也表明,在人類、蠅、擬南芥、水稻和楊樹等動植物基因組中,存在眾多的相鄰且轉錄方向相反的基因,稱之為"頭對頭",而當這兩個基因相鄰的轉錄起始位點(transcription start site,TSS)之間的距離低于 1 kb 左右時,這段基因間 DNA 序列可稱之為"雙向啟動子"(bidirectionalpromoter),劉石娟等對雙向啟動子的功能作了介紹[8].