同源異形盒(homeobox)是同源異形基因中都具有的保守基序。
控制果蠅發(fā)育的3組基因:母體基因,分節(jié)基因和同源異形基因。其中的一組調(diào)節(jié)另外兩個中的一組基因和編碼結(jié)構(gòu)基因的靶基因。調(diào)節(jié)基因之間的相互作用是通過分析其它基因發(fā)生突變時相應(yīng)基因的表達(dá)改變來確定的。但目前只鑒別出少數(shù)幾個結(jié)構(gòu)靶基因,3組調(diào)節(jié)基因作用在靶上,使得身體的各部分產(chǎn)生分化。
分節(jié)基因編碼的蛋白調(diào)節(jié)轉(zhuǎn)錄,3個裂缺座位(hb,kr,kni)基因含有鋅指模體。在轉(zhuǎn)錄因子TF和SP1中的模體是負(fù)責(zé)和DNA連接。裂缺基因中其它座位的產(chǎn)物也有DNA-結(jié)合模體;giant編碼的蛋白具有氨基酸拉鏈模體;而tailless編碼的蛋白與類固醇受體相似。這表明裂缺基因的一般功能是轉(zhuǎn)錄調(diào)節(jié)。
在很多同源異形基因和分節(jié)基因中發(fā)現(xiàn)了保守的模體。普遍的模體是同源異形盒,它是位于各種分節(jié)基因和同源異形座位轉(zhuǎn)達(dá)錄單位3'端附近的180bp的區(qū)域。此序列是開放讀框的一部分。在這個序列中密碼子的第三個堿基常發(fā)性改變。同源異形盒的大小及序列都是固定不變的。約有40個基因含有同源異形盒,而且這些基因幾乎都和發(fā)育調(diào)節(jié)有關(guān)(同源異形盒是通過它在同源異形基因中超優(yōu)勢度(predominance)而首先被鑒別出來的,因此而得名)。由同源異形盒編碼的蛋白序列稱之為同源結(jié)構(gòu)域(homrodomain)。
果蠅的同源結(jié)構(gòu)域分成為幾組,主要是由BX-C/ANT-C復(fù)盒座位中同源異形基因組成。它們被稱為觸角足組。它們的同源結(jié)構(gòu)域具有70-80%的保守性,通常是存在于蛋白質(zhì)的C端。在相關(guān)的engrailed和invected基因中發(fā)現(xiàn)了特殊序列,它和觸角足組只有45%的同源性。其它類型的同源異形結(jié)構(gòu)區(qū)序列存在于2~4個基因中。
在果蠅中很多含有同源異形盒的基因組成了基因族。在BX-C基因簇中有3個同源異形基因具有同源異形盒。在ANT-C復(fù)合座位中含有一組5個帶有同源異形盒的同源異形基因,和4個也會有同源異形盒的其它基因。在BX-C和ANT-C中的同源異形基因有時也用HOM-C(homeotic-complex)基因來表示。
在前-后軸上HOM-C的功能是什么呢?據(jù)推測同源異形結(jié)構(gòu)區(qū)上帶有不同的氨基酸序列可以識別DNA上不同的靶序列。將不同的蛋白之間交換它們的同源異形結(jié)構(gòu)區(qū),這個實驗表明這些蛋白主要的特異部分就在干同源異形結(jié)構(gòu)區(qū)。但它們與特異的DNA靶位點的結(jié)合能力并不能表明它們的特點。例如,這些蛋白中的某一些在前后呼應(yīng)中要么能激活轉(zhuǎn)錄,要么能抑制轉(zhuǎn)錄,它們的活性依賴于另一套能結(jié)合DNA,而卻不識別DNA的蛋白。在這一組基因中密切相關(guān)的一些成員的同源結(jié)構(gòu)區(qū)之間的相似性表明它們能識別靶位點的重疊模式。這樣為組合效應(yīng)開劈了一條途經(jīng),使帶有相關(guān)同源異形結(jié)構(gòu)域的蛋白之間就能像依賴質(zhì)量差異一樣依賴于數(shù)量,對同一位點,進行競爭。在有的情況下,不同的同源異形蛋白識別DNA上相同的靶位點,這也提出了有關(guān)它作用特異性的難題;估計DNA結(jié)合位點上仍存在著微小的差異或者存在著相互作用,例如蛋白質(zhì)之間的相互作用。
同源異形盒模體在進化中廣泛存在。其重要意義是通過同源異形盒探針與很多真核的基因組進行雜交而獲得。在蛙,小鼠和人的DNA都發(fā)現(xiàn)同源異形盒的存在。在蛙和哺乳動物基因在胚胎發(fā)生的早期表達(dá)增強了與果蠅一些基因的平行關(guān)系,表明可能這些會有同源異形的基因與各種生物胚胎發(fā)育中基因調(diào)節(jié)有關(guān)。
在哺乳動物(可能所有動物)中那些與HOM-C組相關(guān)的基因都具有一個顯著的特點:它們像BX-C/ANT-C復(fù)合座位一樣組成基因簇。其中單個的哺乳動物的基因稱為Hox基因,其基因簇可達(dá)20-100kb,含有的基因可多達(dá)10個。4個Hox家族,基因含有同源異形盒,它們在小鼠和人類的基因組中被描敘。
通過比較同源異形盒的序列表明哺乳動物中Hox基的排列和果蠅的同源基因是一致的。如HoxA4和HoxB4與Dfd最相關(guān)。當(dāng)哺乳動物的Hox基因簇和果蠅的同源異形盒基因簇的關(guān)系確定之后,人們就能識別一系列與ANT-C和BX-C基因簇相關(guān)的基因。哺乳動物Hox基因1~9組已被確定和ANT-C 和BX-C座位的序列相一致。10~13組是通過串聯(lián)重復(fù)產(chǎn)生的,與9組產(chǎn)生差異。在每一個基因簇中的相應(yīng)座位有時稱為平行進化同源基因(paralogs),例如HoxA4和HoxB4就是平等進化同源基因。若果蠅和哺乳動物某一點上產(chǎn)生分歧的話,那么果蠅就可能存在只有單個的復(fù)合座位于,(如ANT-C和BX-C不同源)而復(fù)合座位含有的各基因都限定了前后極性。文昌魚(Amphioxus)其進化路線是和脊椎動物平行的。這種生物有單個的Hox基因簇,含有平行進化同源基因組中的一個成員;是原始基因簇的典型。在進化中果蠅的這些基因分成為兩個基因簇,而哺乳動 物整個一組基因發(fā)生了重復(fù),在重復(fù)之后個別成員從各個復(fù)合座位中丟失了。
這些基因在小鼠和果蠅中的排列和空間表達(dá)的方式都表現(xiàn)出平行性。在Hox基因簇中的基因在胚胎中表達(dá)方式是兩者在基因組中的組成呈對應(yīng)的。這樣一來產(chǎn)生了一種很大的可能性,即基因簇不僅分擔(dān)了共同的進化,而且在基因組的組成與果蠅,小鼠空間表達(dá)的相關(guān)性中維持了相同的功能,在同源基因之間還存在著某些一致性。小鼠的Hox D4 或HoxB6在果蠅中的異位表達(dá)產(chǎn)生的同源異形轉(zhuǎn)化與Dfd或Antp的同源異形表達(dá)的結(jié)果完全相同。從而證實對二者關(guān)系的推論。由于小鼠和果蠅蛋白之間的同源性,結(jié)果使它們保持了幾乎是它們所特有的異形結(jié)構(gòu)域,這就加強了這樣的觀點,即結(jié)構(gòu)域決定特異性。
Hox基因很小,但具有大量的蛋白編碼單位。小鼠的HoxB基因簇長120kb 左右,含9個基因。基因組中的的位置和胚胎中表達(dá)兩者之間的連接與果蠅中的情況相類似,但前面只描敘了基因的本身;現(xiàn)在尚沒有掌握有關(guān)順式-作用位點的信息。這是因為在脊椎動物中通過各種突變來得出結(jié)論是十分困難的。但已發(fā)現(xiàn)控制Hox 基因僅通過上游區(qū)域的啟動子和增強子。這還要得看是否廣泛地存在著突變基因的副本,是否存在果蠅同源異形基因的復(fù)合控區(qū)。
在果蠅中每個基因都是唯一的,但在脊椎動物中基因簇的重復(fù)使多基因(平等進化同源基因)具有相同或十分相似的表達(dá)模式。若平行進化同源基因有冗余或部分的冗余功能,那么缺乏一種產(chǎn)物至少可以被另一個基因簇相應(yīng)基因產(chǎn)物所代替,因此突變的效應(yīng)也就可減少到最小的程度。
小鼠中的Hox基因通過重排也可被破壞而導(dǎo)致隱性致死。在頭部和胸部的結(jié)構(gòu)變異體中HoxA1和HoxA表達(dá)缺陷。不是在所有結(jié)構(gòu)中突變基因都錯誤表達(dá),表明確實存在功能的冗余性。即1組或3組的Hox基因能彌補某些組織,缺乏HoxA基因而不是所有其它組織對HoxA基因的缺乏。
在小鼠中同樣的突變能引起同源異形轉(zhuǎn)化,但要比果蠅中少。例如HoxC8的缺失使某些骨節(jié)出現(xiàn)前部骨節(jié)的表型。這還要看此是否是一般規(guī)律。
Hox基因的異位表達(dá)已成功地用于論證,這些基因能使一些體節(jié)的特征發(fā)生相應(yīng)的轉(zhuǎn)化。最常見的是果蠅的前部體節(jié)出現(xiàn)了后部體節(jié)的表型。其實同源異型基因的表達(dá)是加上了附加信息。這些附加信息控制了后部體節(jié)的特征。在小鼠中也獲得了相似的效應(yīng)。但模式不完全一致。
這些清楚表明Hox基因與果蠅決定前后軸發(fā)育模式的基因簇很相似。可能存在著Hox基因表達(dá)的組合密碼子或者可能在平行進化同源基因之間功能冗余的程度不同。但目前尚未能提出它們在決定方式中所引起作用的模型。
Hox基因座位結(jié)構(gòu)仍難以解釋以什么基因簇基因組的位置與胚胎的表達(dá)相一致?在進化中是如何維持下來的?一種解釋是基因表達(dá)的全面控制使得一個基因只有在基因簇中才能適當(dāng)?shù)乇磉_(dá)。但這并不真實,至少在個別情況中一些基因可從基因簇中取消掉。分析了啟動子區(qū),表明Hox基因可受控于一系列的啟動子或增強子元件,啟動子和增強子控制了整個的表達(dá)模式。通常這些元件是在轉(zhuǎn)錄起始點的上游區(qū)域。例如HoxB4能在含有這些元件的質(zhì)粒中表達(dá),并可以制備轉(zhuǎn)基因鼠,但為什么在進化壓力下在一個有序列的基因簇中保留著一些基因呢?一種可能是一個基因的增強子可能被埋入在另一個基因內(nèi)。我們可以將一個基因易位別處時,看它是否有功能來加以判斷它是否屬于這種情況,若它含有相鄰基因的調(diào)節(jié)元件的話,那么它被取消將影響到其它基因的表達(dá)。