怎樣優化設計寡核苷酸呢?至少有下列幾個方面的問題需要考慮。
1. 估測可能形成的DNA或RNA雙鏈的穩定性
寡核苷酸,無論是DNA的或者RNA的,都有形成雙鏈結構的潛在可能性,正如下面反復提到的,這種結構對寡核苷酸的作用有很大影響。所以,預測這種結構的穩定性對設計和優化寡核苷酸就很重要。在一個雙鏈結構中,堿基對的相對穩定性是由其鄰近堿基決定的。在熱動力學中,這樣的性質以雙鏈形成時的自由能(ΔG)來表示。現在,大多采用 Breslauer等人提出的,以最接近的相鄰核苷酸的動力學數值(自由能)來預測雙鏈穩定性的方法。為簡化起見,所有的計算都在25 ℃條件下進行。此時,最接近的相鄰核苷酸的自由能是:
第一個(5′)核苷酸 |
第二個核苷酸 |
|||
dA |
dC |
dG |
dT |
|
dA |
-1.9 |
-1.3 |
-1.6 |
-1.5 |
dC |
-1.9 |
-3.1 |
-3.6 |
-1.6 |
dG |
-1.6 |
-3.1 |
-3.1 |
-1.3 |
dT |
-1.0 |
-1.6 |
-1.9 |
-1.9 |
ΔG(kcal/mol)
例如,雙鏈d(ACGG/CCGT)的ΔG是:
ΔG(ACGG)=ΔG(AC)+ΔG(CG)+ΔG(GG)=-(1.3+3.6+3.1)=-8.0 kcal/mol
此計算方法特別適用于測定其3′末端會形成雙鏈的引物的相容性。也可以用來計算發夾環結構的ΔG。不過,這時需要根據環區內核苷酸的數量添加一定的數值。如3個核苷酸時為5.2 kcal/mol;4個時為4.5;5個為4.4;6個是4.3;7和8個為4.1 kcal/mo1。
2. 選擇引物的一般規則
設計和選擇引物時有5個要素必需注意。
2.1 引物的3′末端不互補 引物的3′末端一定不能有很大的互補性,因為它們的互補會形成引物二聚體,這就會帶來很大的問題,例如合成出非專一的產物,極大地減少所期望產物的得量。有實驗表明,3′末端雙鏈的ΔG是0~-2 kcal/mol時,PCR產量幾乎達到百分之百,隨著其絕對值的增加產量逐漸下降,在-6時只有40%,到-8時少于20%,而-10時,接近于0。雖然產量還取決于其他參數,如退火溫度、引物的專一性等等,但是用Taq聚合酶操作時,由于它的工作能力很強,能夠在很短的時間內就識別3′末端互補的雙鏈區并發動聚合反應,即使3′末端雙鏈的穩定性很差也不能阻礙它的作用,所以這時產量對二聚體的形成就有很大的依賴性。
2.2 引物分子內不互補 應當盡量不用會通過釋放能量而形成分子內雙鏈結構的寡核苷酸。雖然有些帶有發夾環,其ΔG為-3 kcal/mol的自身互補引物也可以得到不錯的結果,但是如果它的3′末端被發夾環占據時就很麻煩,即會引發引物內部的延伸反應,減少了參與正式反應引物的數量。當然,如果發夾環在5′末端對反應就沒有多大的影響了。
2.3 引物的組分、解鏈溫度和長度 普遍認為PCR引物應當有50%的GC/AT比率。其實,這是不對的。以人基因組DNA為模板,用81% AT的引物可以產生單一的,專一的,長250 bp,含有70% AT的產物。完全沒有必要復雜地去計算產物和引物的解鏈溫度,PCR引物的GC/AT比率應當等于或高于所要放大的模板的GC/AT比。
要知道,更重要的因素是模板與穩定性較小的引物之間解鏈溫度的差異。差異越小,PCR的效率越高。因為DNA的解鏈溫度也取決于它的長度,所以有的研究者喜歡設計很長,而不求它很穩定的引物。可是,引物太長就難以避免形成二聚體和自身互補,因此,一般還是不用為好。如果期待的產物長度等于或小于500 bp,選用短的(16~18 mer)的引物:若產物長5 kb,則用24 mer的引物。有人用20~23 mer引物得到40 kb的產物。但是,引物較長時,如果不借助引物選擇的計算機軟件幫助,就很難確定一對引物是否會形成二聚體,是否有自身互補性以及專一性如何。于是,用眼睛選出來的寡核苷酸放大長片段DNA時就會使引物彼此引發而不是延伸模板,得出非專一產物。通過下述的觀察內部穩定性原理可以極大地減少這種問題。
2.4 引物的內部穩定性 在DNA測序和PCR中最好用5′末端穩定(如GC含量較多),而3′末端不太穩定(如AT含量較多)的引物,這種引物的結構可以有效地消除假引發反應。這就是基于引物內部穩定性的經驗之談。其3′末端穩定性低的引物在這些反應中能起好作用的原因在于,接近或在3′末端上的堿基與非靶位點堿基所形成的配對的穩定程度還不足以引發DNA合成,所以不會產生假產物。因此,為了有效地引發反應,引物的5′末端和中央部分必須與靶DNA也形成雙鏈。與此相反,帶有穩定的、GC豐富的3′末端的寡核苷酸不需要其所有的核苷酸序列都與靶序列配對,只憑借其3′末端與靶序列任何位點的牢固配合就可以引發反應,產生非專一產物。
如果用3′末端低穩定性的引物,反應的最適退火溫度范圍會不尋常的寬。這就可以不經過事先的最佳化實驗就能在最佳條件下進行反應。還要注意的是PCR反應產物的質量還取決于模板(底物的復雜性、Tm、產物長度)和退火的溫度與時間。
所以,有時3′末端穩定的引物也可以滿意地進行反應。但是,無論如何,寡核苷酸3′末端最后5個核苷酸的穩定性小于-9 kcal/mol的,通常就是專一性的探針或引物。寡核苷酸3′末端越不穩定,假引發的可能性越低。
2.5 引物的唯一性 為了放大單個的、專一性DNA片段,選用的引物序列就應當是唯一的,即在模板中沒有重復序列。雖然不會整個引物序列都偏好于和模板中的一個以上位點匹配,但是,通常見到的引物的3′末端往往都有6~7個沒有什么個性的核苷酸。如果假引發的位點正好在放大區的內部,那麻煩就大了。由于短的DNA片段有更高的PCR或雜交效率,就容易產生非專一產物。
如果用哺乳動物基因組序列作為模板,可以用Alu序列或其他短重復元件來核對想用的引物的互補性。由此也可知,應當避免使用同寡聚物(如—AAAAAA—)和二核苷酸重復(如—ATATAT—)。
3. 按照氨基酸序列設計寡核苷酸
按照多肽的氨基酸序列來設計 PCR引物或雜交探針是最常用的實驗手段,尤其是在試圖“釣取”一個蛋白質的基因時。此時要注意的問題有:
(1)寧可用簡并引物,也不用猜測的引物。氨基酸密碼子的簡并性給予引物設計以可塑性,這比用猜測的密碼子要好得多。有人用1 024個簡并引物得到很好的結果。
但是,應當避免在一個區域內有很高的簡并性。但也有簡并性低使引物不工作的報道。
(2)引物與模板的錯配。一般認為,所用引物與模板有15%~20%的錯配,PCR的效果還能接受。但是,引物3′末端的錯配比同樣錯配率的5′末端錯配會引起更嚴重的問題。
在最后4個堿基中有2個錯配的引物,其 PCR產量急劇下降。但是,當核苷酸濃度高時,3′末端有錯配的引物還能被Tag聚合酶很好地利用。在0.8 mmol/L時,大多數3′末端錯配引物可以接受,雖然非專一產物比較多,DNA合成的忠實性也下降。即使在低核苷濃度下,還會有少量從錯配堿基出發的合成,因此,在開始的PCR循環中把退火時間增加到3~5分鐘,比之于用標準退火時間和高濃度核苷酸能夠產生質量更好的所求產物。
(3)在用唯一性引物時,建議用0.2 mmol/L或更低的總核苷酸濃度,因為高濃度會增加錯誤參入的比率。
(4)簡并寡核苷酸時,PCR應當在比較高的引物濃度下進行,即1~3 μmol/L而不是0.2 μmol/L,因為在反應混合物中的大多數寡聚物并不是被用來引發專一的反應,而只是產生高的背景而已。