釀酒酵母作為一種模式生物在實驗系統研究方面具有許多內在的優勢。首先,酵母是一種單細胞生物,能夠在基本培養基上生長,使得實驗者能夠通過改變物理或化學環境完全控制其生長。其次,酵母在單倍體和二倍體的狀態下均能生長,并能在實驗條件下較為方便地控制單倍體和二倍體之間的相互轉換,對其基因功能的研究十分有利。如在單倍體狀態下,只需一次基因替換,就能得到某個特定基因缺失的酵母株;而對于一些缺失后致死的基因,人們可以在二倍體菌株中進行基因替換,然后通過孢子篩選,獲得帶有基因缺失的單倍體菌株。此外,酵母的生命周期很適合經典的遺傳學分析,使得在酵母16條染色體上構建精細的遺傳圖譜成為可能。更重要的是,目前已發展了一些非常有效的技術使得酵母基因組中6000個基因中的任何一個基因均能被突變的等位基因取代,甚至從基因組中完全缺失,這種方法具有很高的效率和準確性[1~3]。
1.酵母基因組組成
在釀酒酵母測序計劃開始之前,人們通過傳統的遺傳學方法已確定了酵母中編碼RNA或蛋白質的大約2600個基因[4]。通過對釀酒酵母的完整基因組測序,發現在12068kb的全基因組序列中有5885個編碼專一性蛋白質的開放閱讀框。這意味著在酵母基因組中平均每隔2kb就存在一個編碼蛋白質的基因,即整個基因組有72%的核苷酸順序由開放閱讀框組成[5]。這說明酵母基因比其它高等真核生物基因排列緊密。如在線蟲基因組中,平均每隔6kb存在一個編碼蛋白質的基因[6];在人類基因組中,平均每隔30kb或更多的堿基才能發現一個編碼蛋白質的基因。酵母基因組的緊密性是因為基因間隔區較短與基因中內含子稀少。酵母基因組的開放閱讀框平均長度為1450bp即483個密碼子,最長的是位于XII號染色體上的一個功能未知的開放閱讀框(4910個密碼子),還有極少數的開放閱讀框長度超過1500個密碼子。在酵母基因組中,也有編碼短蛋白的基因,例如,編碼由40個氨基酸組成的細胞質膜蛋白脂質的PMP1基因。此外,酵母基因組中還包含:約140個編碼RNA的基因,排列在XII號染色體的長末端;40個編碼SnRNA的基因,散布于16條染色體;屬于43個家族的275個tRNA基因也廣泛分布于基因組中。表1提供了酵母基因在各染色體上分布的大致情況。
表1 酵母染色體簡況
染色體編號 |
長度(bp) | 基因數 | tRNA基因數 |
I | 23×103 | 89 | 4 |
II | 807188 | 410 | 13 |
III | 315×103 | 182 | 10 |
IV | 1531974 | 796 | 27 |
V | 569202 | 271 | 13 |
VI | 270×103 | 129 | 10 |
VII | 1090936 | 572 | 33 |
VIII | 561×103 | 269 | 11 |
IX | 439886 | 221 | 10 |
X | 745442 | 379 | 24 |
XI | 666448 | 331 | 16 |
XII | 1078171 | 534 | 22 |
XIII | 924430 | 459 | 21 |
XIV | 784328 | 419 | 15 |
XV | 1092283 | 560 | 20 |
XVI | 948061 | 487 | 17 |
序列測定揭示了酵母基因組中大范圍的堿基組成變化。多數酵母染色體由不同程度的、大范圍的GC豐富DNA序列和GC缺乏DNA序列鑲嵌組成[5、7]。這種GC含量的變化與染色體的結構、基因的密度以及重組頻率有關。GC含量高的區域一般位于染色體臂的中部,這些區域的基因密度較高;GC含量低的區域一般靠近端粒和著絲粒,這些區域內基因數目較為貧乏[5、8]。Simchen等證實[9],酵母的遺傳重組即雙鏈斷裂的相對發生率與染色體的GC豐富區相耦合,而且不同染色體的重組頻率有所差別,較小的Ⅰ、Ⅲ、Ⅳ和Ⅸ號染色體的重組頻率比整個基因組的平均重組頻率高。?
酵母基因組另一個明顯的特征是含有許多DNA重復序列,其中一部分為完全相同的DNA序列,如rDNA與CUP1基因、Ty因子及其衍生的單一LTR序列等[8]。在開放閱讀框或者基因的間隔區包含大量的三核苷酸重復,引起了人們的高度重視。因為一部分人類遺傳疾病是由三核苷酸重復數目的變化所引起的。還有更多的DNA序列彼此間具有較高的同源性,這些DNA序列被稱為遺傳豐余(genetic redundancy)[8、10]。酵母多條染色體末端具有長度超過幾十個kb的高度同源區,它們是遺傳豐余的主要區域,這些區域至今仍然在發生著頻繁的DNA重組過程。遺傳豐余的另一種形式是單個基因重復,其中以分散類型最為典型,另外還有一種較為少見的類型是成簇分布的基因家族。成簇同源區(cluster homology region,簡稱CHR)是酵母基因組測序揭示的一些位于多條染色體的同源大片段,各片段含有相互對應的多個同源基因,它們的排列順序與轉錄方向十分保守,同時還可能存在小片段的插入或缺失。這些特征表明,成簇同源區是介于染色體大片段重復與完全分化之間的中間產物,因此是研究基因組進化的良好材料,被稱為基因重復的化石[5、8]。染色體末端重復、單個基因重復與成簇同源區組成了酵母基因組遺傳豐余的大致結構。研究表明,遺傳豐余中的一組基因往往具有相同或相似的生理功能,因而它們中單個或少數幾個基因的突變并不能表現出可以辨別的表型,這對酵母基因的功能研究是很不利的。所以許多酵母遺傳學家認為,弄清遺傳豐余的真正本質和功能意義,以及發展與此有關的實驗方法,是揭示酵母基因組全部基因功能的主要困難和中心問題。
2.酵母基因組分析
在酵母基因組測序以前,人們已知道在酵母和哺乳動物中有大量基因編碼類似的蛋白質[11]。對于一些編碼結構蛋白質(如核糖體和細胞骨架中的)在內的同源基因,人們并不感到意外。但某些同源基因卻出乎人們意料,如在酵母中發現的兩個同源基因RAS1和RAS2與哺乳動物的H-ras原癌基因高度同源。酵母細胞如同時缺乏RAS1和RAS2基因,呈現致死表型。在1985年,首次應用RAS1和RAS2基因雙重缺陷的酵母菌株進行了功能保守性檢測,結果表明,當哺乳動物的H-ras基因在RAS1和RAS2基因雙重缺陷的酵母菌株中表達時,酵母菌株可以恢復生長。因此,酵母的RAS1和RAS2基因不僅與人類的H-ras原癌基因在核苷酸順序上高度同源,而且在生物學功能方面保守。
隨著整個酵母基因組測序計劃的完成,人們可以估計有多少酵母基因與哺乳動物基因具有明顯的同源性。Botstein等將所有的酵母基因同GenBank數據庫中的哺乳動物基因進行比較(不包括EST順序),發現有將近31%編碼蛋白質的酵母基因或者開放閱讀框與哺乳動物編碼蛋白質的基因有高度的同源性[12]。因為數據庫中并未能包含所有編碼哺乳動物蛋白質的序列,甚至不能包括任何一個蛋白質家族的所有成員,所以上述結果無疑會被低估。酵母與哺乳動物基因的同源性往往僅限于單個的結構域而非整個蛋白質,這反映了在蛋白質進化過程中功能結構域發生了重排。在酵母5800多個編碼蛋白質的基因中,約41%(~2611個)是通過傳統遺傳學方法發現的,其余都是通過DNA序列測定所發現。約有20%酵母基因編碼的蛋白質與其它生物中已知功能的基因產物具有不同程度的同源性(其中約6%表現出很強的同源性,約12%表現出稍弱的同源性),從而能初步推測其生物學功能。酵母基因組中有10%基因(約653個)與其它生物中功能未知的蛋白質的基因具有同源性,被稱為孤兒基因對或孤兒基因家族(orphan pairs or family);約25%的基因(~1544個)則與所有已發現的蛋白質的基因沒有同源性,屬首次發現的新基因,是真正意義上的孤兒基因[5、13]。這些孤兒基因的發現是酵母基因組計劃的重要收獲,對于其功能的闡明,將大大推進對酵母生命過程的認識,因而引起了眾多遺傳學家的重視。
為了系統地分析酵母基因組測序發現的3000多個新基因的功能,1996年1月,隨著DNA測序工作的結束,歐洲建立了名為EUROFAN(European Functional Analysis Network)的研究網絡。這一網絡由歐洲14個國家的144個實驗室組成,它包括服務共同體(service consortia,A1-A4)、研究共同體(research consortia,B0?B9)和特定功能分析部(specific functional analysis nodes,N1-N14)三部分,每個部分下設許多小的分支機構。其中研究共同體中的B0部門負責制作特定的酵母基因缺失突變株。缺失突變株的制作采用新發展起來的PCR介導的基因置換方法進行,即將來自細菌的卡那霉素抗性基因(KanMX)與線狀真菌Ashbya gossypil的啟動子和終止序列構建成表達單元,它可賦予酵母細胞G418以抗性。然后,根據所要置換的染色體DNA序列設計PCR引物,這些引物的外側與染色體DNA序列同源,內側則保證通過PCR可以擴增出KanMX基因,PCR產物直接用于基因置換操作[14]。通過這項技術,可以有目的地將新發現的基因用KanMX置換,造成基因缺失突變,隨后通過系統地研究這些酵母缺失突變株表型有無改變(如生活力、生長速度、接合能力等)以確定這些基因的功能[15]。此種方法中有兩個方面的問題限制實驗進程:其一是大部分的突變子(60%~80%)并不顯示明顯的突變表型,這往往與前面提到的遺傳豐余有關;其二是許多突變子即使發生了表型改變,也不能反映其編碼蛋白質的功能,如某些突變子不能在高溫或高鹽的環境中生長,但這些表型卻不能提示任何有關缺失蛋白質在生理功能方面的信息。
3.酵母作為模式生物的作用
酵母作為高等真核生物特別是人類基因組研究的模式生物,其最直接的作用體現在生物信息學領域。當人們發現了一個功能未知的人類新基因時,可以迅速地到任何一個酵母基因組數據庫中檢索與之同源的功能已知的酵母基因,并獲得其功能方面的相關信息,從而加快對該人類基因的功能研究。研究發現,有許多涉及遺傳性疾病的基因均與酵母基因具有很高的同源性,研究這些基因編碼的蛋白質的生理功能以及它們與其它蛋白質之間的相互作用將有助于加深對這些遺傳性疾病的了解。此外,人類許多重要的疾病,如早期糖尿病、小腸癌和心臟疾病,均是多基因遺傳性疾病,揭示涉及這些疾病的所有相關基因是一個困難而漫長的過程,酵母基因與人類多基因遺傳性疾病相關基因之間的相似性將為我們提高診斷和治療水平提供重要的幫助。
酵母作為模式生物的最好例子體現在那些通過連鎖分析、定位克隆然后測序驗證而獲得的人類遺傳性疾病相關基因的研究中,后者的核苷酸序列與酵母基因的同源性為其功能研究提供了極好的線索。例如,人類遺傳性非息肉性小腸癌相關基因與酵母的MLH1、MSH2基因,運動失調性毛細血管擴張癥相關基因與酵母的TEL1基因,布盧姆氏綜合征相關基因與酵母的SGS1基因,都有很高的同源性(見表2)。遺傳性非息肉性小腸癌基因在腫瘤細胞中表現出核苷酸短重復順序不穩定的細胞表型,而在該人類基因被克隆以前,研究工作者在酵母中分離到具有相同表型的基因突變(msh2和mlh1突變)。受這個結果啟發,人們推測小腸癌基因是MSH2和MLH1的同源基因,而它們在核苷酸序列上的同源性則進一步證實了這一推測。布盧姆氏綜合征是一種臨床表現為性早熟的遺傳性疾病,病人的細胞在體外培養時表現出生命周期縮短的表型,而其相關基因則與酵母中編碼蝸牛酶的SGS1基因具有很高的同源性。與來自布盧姆氏綜合征個體的培養細胞相似,SGS1基因突變的酵母細胞表現出顯著縮短的生命周期[16]。Francoise等研究了170多個通過功能克隆得到的人類基因,發現它們中有42%與酵母基因具有明顯的同源性,這些人類基因的編碼產物大部分與信號轉導途徑、膜運輸或者DNA合成與修復有關,而那些與酵母基因沒有明顯同源性的人類基因主要編碼一些膜受體、血液或免疫系統組分,或人類特殊代謝途徑中某些重要的酶和蛋白質[17]。
表2 與定位克隆的人類疾病基因高度同源的釀酒酵母基因
人類疾病 |
人類基因 |
人類cDNA |
酵母基因 | 酵母cDNA GenBank登記號 |
酵母基因功能 |
遺傳性非息肉性小腸癌 |
MSH2 |
U03911 | MSH2 | M84170 |
DNA修復蛋白 |
遺傳性非息肉性小腸癌 | MLH1 | U07418 | MLH1 | U07187 |
DNA修復蛋白 |
囊性纖維變性 | CFTR | N28668 | YCF1 | L35237 | 金屬抗性蛋白 |
威爾遜氏病 | WND | U11700 | CCC2 | L36317 | 銅轉運器 |
甘油激酶缺乏癥 | GK | L13943 | GUT1 | X69049 |
甘油激酶 |
布盧姆氏綜合癥 | BLM | U39817 | SGS1 | U22341 | 蝸牛酶 |
X-連鎖的腎上腺腦白質營養不良 | ALD | Z21876 | PAL1 | L38491 | 過氧化物酶轉運器 |
共濟失調性毛細血管擴張癥 | ATM | U26455 | TEL1 | U31331 | P13激酶 |
肌萎縮性脊髓側索硬化 | SOD1 | K00065 | SOD1 | J03279 | 過氧化物歧化酶 |
營養不良性肌萎縮 | DM | L19268 | YPK1 | M21307 | 絲氨酸/蘇氨酸蛋白激酶 |
勒韋氏綜合癥 | OCRL | M88162 | YIL002C | X47047 | IPP-5-磷酸酶 |
I-型神經纖維瘤 | NF1 | M89914 | IRA2 | M33779 | 抑制性的調節蛋白 |
隨著獲得高等真核生物更多的遺傳信息,人們將會發現有更多的酵母基因與高等真核生物基因具有同源性,因此酵母基因組在生物信息學領域的作用會顯得更加重要,這同時也會反過來促進酵母基因組的研究。與酵母相比,高等真核生物具有更豐富的表型,從而彌補了酵母中某些基因突變沒有明顯表型改變的不足。下面將要提到的例子正說明了酵母和人類基因組研究相互促進的關系。人類著色性干皮病是一種常染色體隱性遺傳的皮膚疾病,極易發展成為皮膚癌。早在1970年Cleaver等就曾報道,著色性干皮病和紫外線敏感的酵母突變體都與缺乏核苷酸切除修復途徑(nucleotide excision repair,NER)有關[18]。1985年,第一個NER途徑相關基因被測序并證實是酵母的RAD3基因[19]。1987年,Sung首次報道酵母Rad3p能修復真核細胞中DNA解旋酶活力的缺陷[20]。1990年,人們克隆了著色性干皮病相關基因xPD,發現它與酵母NER途徑的RAD3基因有極高的同源性[21]。隨后發現所有人類NER的基因都能在酵母中找到對應的同源基因。重大突破來源于1993年,發現人類xPBp和xPDp都是轉錄機制中RNA聚合酶Ⅱ的TFⅡH復合物的基本組分[22]。于是人們猜測xPBp和xPDp在酵母中的同源基因(RAD3和RAD25) 也應該具有相似的功能,依此線索很快獲得了滿意的結果并證實了當初的猜測[23]。
酵母作為模式生物的作用不僅是在生物信息學方面的作用,酵母也為高等真核生物提供了一個可以檢測的實驗系統。例如,可利用異源基因與酵母基因的功能互補以確證基因的功能。據Bassett的不完全統計,到1996年7月15日,至少已發現了71對人類與酵母的互補基因,這些酵母基因可分為六個類型:(1)20個基因與生物代謝包括生物大分子的合成、呼吸鏈能量代謝以及藥物代謝等有關;(2)16個基因與基因表達調控相關,包括轉錄、轉錄后加工、翻譯、翻譯后加工和蛋白質運輸等;(3)1個基因是編碼膜運輸蛋白的;(4)7個基因與DNA合成、修復有關;(5)7個基因與信號轉導有關;(6)17個基因與細胞周期有關,F在,人們發現有越來越多的人類基因可以補償酵母的突變基因,因而人類與酵母的互補基因的數量已遠遠超過過去的統計。
在酵母中進行功能互補實驗無疑是一種研究人類基因功能的捷徑。如果一個功能未知的人類基因可以補償酵母中某個具有已知功能的突變基因,則表明兩者具有相似的功能。而對于一些功能已知的人類基因,進行功能互補實驗也有重要意義。例如與半乳糖血癥相關的三個人類基因GALK2(半乳糖激酶)、GALT(UDP-半乳糖轉移酶)和GALE(UDP-半乳糖異構酶)能分別補償酵母中相應的GAL1、GAL7、GAL10基因突變。在進行互補實驗以前,人類和酵母的乳糖代謝途徑都已十分清楚,對有關幾種酶的活性檢測法也十分健全,并已獲得其純品,可以進行一系列生化分析。隨著人類三個半乳糖血癥相關基因的克隆分離成功,功能互補實驗成為可能,從而在遺傳學水平進一步確證了人類半乳糖血癥相關基因與酵母基因的保守性。人們又將這一成果予以推廣,利用酵母系統進行半乳糖血癥的檢測和基因治療,如區別真正的突變型和遺傳多態性,在酵母中模擬多種突變型的組合表型,或篩選基因內或基因間的抑制突變等[24]。這些方法也同樣適用于其它遺傳病的研究。
利用異源基因與酵母基因的功能,還能使酵母成為其它生物新基因的篩查工具。通過使用特定的酵母基因突變株,對人類cDNA表達文庫進行篩選,從而獲得互補的克隆。如Tagendreich等利用酵母的細胞分裂突變型(cdc mutant)分離到多個在人類細胞有絲分裂過程中起作用的同源基因[25]。利用此方法,人們還克隆分離到了農作物、家畜和家禽等的多個新基因[26]。 為了充分發揮酵母作為模式生物的作用,除了發展酵母生物信息學和健全異源基因在酵母中進行功能互補的研究方法外,通過建立酵母最小的基因組也是一個可行的途徑。酵母最小的基因組是指所有明顯豐余的基因減少到允許酵母在實驗條件下的合成培養基中生長的最小數目[10、27]。人類cDNA克隆與酵母中功能已知基因缺陷型進行遺傳互補可以確定人類新基因的功能,但是這種互補實驗會受到酵母基因組中其它豐余基因的影響。如果構建的酵母最小基因組中所保留的基因可以被人類或者病毒的DNA序列完全替換,那么替換后的表型將完全取決于外源基因,這將成為一種篩選抗癌和抗病毒藥物的分析系統。?
參考文獻
[1]Rothstein RJ. Methods Enzymol,1983,101:202~211
[2]Baudin A et al. Nucleic Acids Res,1993,21:3329~3330
[3]Wach A et al. Yeast,1994,10:1793~1808
[4]Mortimer RK et al. Yeast,1992,8:817~902
[5]Dujon B. Trends Genet,1996,12:263~270
[6]Hodgkin J et al. Science,1994,270:410
[7]Sharp PM et al. Nucleic Acids Res,1993,21:179~183
[8]Goffeau A et al. Science,1996,274:546
[9]Zenvirth D et al. EMBO J,1992,11:3441~3447
[10]Oliver SG. Microbiology,1997,143:1483~1487
[11]Botstein D et al. Science,1988,240:1439~1443
[12]Botstein D et al. Science,1997,277:1259~1260
[13]Heumann K et al. Max-planck?institute fur Biochemie,Germany,1997,82152
[14]Wach A. Yeast,1996,12:259~265
[15]Oliver S. Trends Genet,1996,12:241~242
[16]Sinclair DA et al. Science,1997,277:1313~1316
[17]Francoise F. Gene,1997,195:1~10
[18]Cleaver JE. Photobiol,11:547~550
[19]Reynolds P et al. Nucleic Acids Res,13:2357~2372
[20]Sung P. Proc Natl Acad Sci USA,1987,84:8951~8955
[21]Weber CA et al. EMBO J,1990,9:1343~1347
[22]Schaeffer L et al. Science,1993,260:58~63
[23]Feaver WJ et al. Cell,75:1379~1387
[24]Quimby BB et al. Am J Hum Genet,1997,61:590~598
[25]Tugendreich S et al. Cell,1997,81:261~268
[26]Taylor RM et al. Plant J,1998,14:75~81
[27]Oliver SG. Nature,1996,379:597~600