新四季網

穩定化逆轉錄酶融合蛋白的製作方法

2023-08-05 21:01:41

專利名稱:穩定化逆轉錄酶融合蛋白的製作方法
穩定化逆轉錄酶融合蛋白繼續申請數據本申請要求於2009年3月4日提交的美國臨時申請序號61/157,332的權益,上述申請通過引用結合到本文中。政府資助本工作至少部分受到來自美國國家衛生研究院衛生與公眾服務部補助金號 GM37949-22的支持。美國政府可擁有本發明中的特定權利。
背景技術:
逆轉錄聚合酶鏈式反應縮寫為RT-PCR,是用於擴增RNA的公知技術。在RT-PCR 中,將RNA鏈逆轉錄成互補DNA (cDNA),接著在聚合酶鏈式反應中使用DNA聚合酶擴增互補 DNA。在該方法的第一步中,使用脫氧核糖核苷酸磷酸和逆轉錄酶連同DNA引物從RNA模板製備cDNA。從RNA模板合成cDNA可受到RNA 二級和三級結構的阻礙,RNA 二級和三級結構由 RNA鏈中的螺旋和各種其他種類的扭結組成。RNA二級和三級結構可通過在較高溫度下(例如,高於50°C )進行反應或者通過加入變性添加劑來減少。然而,變性添加劑的加入是不合乎需要的,因為它經常降低逆轉錄酶活性。較高溫度還通過降低非特異性引物結合提供增加DNA合成特異性的優點。遺憾的是,只有有限數量的能在高溫下起作用的逆轉錄酶是目前可用的,並且它們表現出相對低保真度DNA聚合。例如,市售禽類成髓細胞性白血病病毒逆轉錄酶包含RNA酶H活性,並可在37°C起作用,但具有僅約1. 7 X10-4的保真度。RNA酶 H活性與DNA聚合酶活性和引物結合位點競爭,因此cDNA產出較低。因此,需要能夠在較高溫度下進行逆轉錄的逆轉錄酶,包括那些具有高保真度和持續合成能力的逆轉錄酶。這樣的酶是有益的,因為較高溫度減少阻礙性RNA 二級和三級結構,並通過允許使用較長和更特異的引物來增加逆轉錄的特異性。發明概述在一個方面,本發明提供一種穩定逆轉錄酶(RT)融合蛋白,其包含與穩定劑蛋白連接的熱穩定逆轉錄酶。在穩定化逆轉錄酶融合蛋白的一個實施方案中,熱穩定逆轉錄酶是細菌逆轉錄酶。在另一個實施方案中,細菌逆轉錄酶是II組內含子衍生的逆轉錄酶。熱穩定細菌逆轉錄酶的實例包括細長熱聚球藍細菌(Thermosynechococcus elongatus)逆轉錄酶和嗜熱脂肪土芽孢桿菌(GecAacillus stearothermophilus)逆轉錄酶。在另一個實施方案中,熱穩定逆轉錄酶表現出高保真度cDNA合成。在又一個實施方案中,熱穩定逆轉錄酶包含多肽,所述多肽具有與選自SEQ ID NO :1、SEQ ID NO :2、SEQ ID NO :3、SEQ ID NO 4或SEQ ID NO 5的序列實質上相似的序列同一性。穩定化逆轉錄酶融合蛋白包含穩定劑蛋白,當與逆轉錄酶連接時,其增加熱穩定逆轉錄酶的保存期限和/或熱穩定性和/或溶解度。在特定實施方案中,穩定劑蛋白是親和蛋白或溶解度增加蛋白(例如,麥芽糖結合蛋白或N-利用物質A蛋白)。在另外的實施方案中,穩定劑蛋白通過用不帶電胺基酸置換特定的帶電胺基酸來修飾。 穩定化逆轉錄酶融合蛋白也可包含接頭肽,其將熱穩定逆轉錄酶與穩定劑蛋白連接。在一些實施方案中,該接頭肽是非可切割接頭,而在其他實施方案中,它是非可切割剛性接頭。在一些實施方案中,接頭肽由1-20個胺基酸組成,而在其他實施方案中,接頭肽由 1-5個或3-5個胺基酸組成。例如,剛性非可切割接頭肽可包含5個丙氨酸胺基酸。在另外的實施方案中,穩定化逆轉錄酶融合蛋白具有包含多肽的胺基酸序列,所述多肽具有與選自 SEQ ID NO 6,SEQ ID NO :7、SEQ ID NO :8、SEQ ID NO :9 或 SEQ ID NO 10的序列實質上相似的胺基酸序列同一性。在一些實施方案中,穩定化逆轉錄酶融合蛋白是能夠在約45°C至約65°C的溫度下以2. OX 10_5以下的錯誤頻率進行逆轉錄的高保真度逆轉錄酶。在另外的實施方案中,穩定化逆轉錄酶融合蛋白能夠在高達約81°C的溫度下進行實質水平的逆轉錄。本發明的另一個方面提供一種從RNA分子製備cDNA的方法,其包括如下步驟(a) 向RNA分子中加入引物核苷酸序列,和(b)在足以合成與RNA分子的全部或部分互補的 cDNA分子的條件下,在一種或多種修飾或未修飾的脫氧核糖核苷三磷酸或雙脫氧核糖核苷三磷酸和穩定化逆轉錄酶融合蛋白存在下孵育RNA分子,所述穩定化逆轉錄酶融合蛋白包含與穩定劑蛋白連接的熱穩定逆轉錄酶。在特定實施方案中,熱穩定逆轉錄酶通過接頭肽 (例如非可切割接頭肽或剛性非可切割接頭肽)與穩定劑蛋白連接。優選地,逆轉錄在這樣的溫度範圍內進行其中,RNA包含實質上減少量的阻礙性穩定二級或三級結構。該方法的實施方案包括其中熱穩定逆轉錄酶是II組內含子衍生的逆轉錄酶的方法。在該方法的另外的實施方案中,熱穩定逆轉錄酶包含多肽,其具有與和選自SEQ ID NO=USEQ ID NO 2、SEQ ID NO :3,SEQ ID NO :4或SEQ ID NO :5的序列實質上相似的胺基酸序列同一性;由 1-20個胺基酸組成的非可切割接頭;和穩定劑蛋白是親和蛋白或溶解度增加蛋白。在該方法其他的實施方案中,在約45°C至約65°C的溫度下以2. OX 10_5以下的錯誤頻率進行逆轉錄。本發明的另一方面提供一種用於生產穩定化逆轉錄酶融合蛋白的DNA表達載體, 所述DNA表達載體包含編碼多肽的核酸,所述多肽具有與選自SEQ ID NO :6、SEQ ID NO :7、 SEQ ID NO 8, SEQ ID NO :9或SEQ ID NO 10的序列實質上相似的胺基酸序列同一性。本發明的另一方面提供一種生產穩定化逆轉錄酶融合蛋白的方法,其包括如下步驟(a)培養包含用於生產穩定化逆轉錄酶融合蛋白的DNA表達載體的宿主細胞,所述載體包含編碼多肽的核酸,所述多肽具有與選自SEQ ID NO 6,SEQ ID NO :7、SEQ ID N0:8、SEQ ID NO 9或SEQ ID NO :10的序列實質上相似的胺基酸序列同一性;(b)表達由DNA表達載體編碼的穩定化逆轉錄酶融合蛋白;和(c)從宿主細胞分離穩定化逆轉錄酶融合蛋白。穩定化逆轉錄酶融合蛋白可促進在較高溫度下的cDNA合成和/或具有較高的持續合成能力和/或允許使用較長、更穩定的引物,所述引物增加逆轉錄的特異性(即保真度)。因此,本發明的穩定RT融合蛋白可用於多種應用,例如研究應用。應該理解,前述一般說明和下述詳細說明都只是例示性和解釋性的,且不限制要求保護的本發明。附圖簡述

圖1是通過剛性接頭與麥芽糖結合蛋白結合的細長熱聚球藍細菌逆轉錄酶的胺基酸序列表(SEQ ID NO :6)。胺基酸殘基1-367代表修飾的麥芽糖結合蛋白(SEQ ID N0 11);胺基酸殘基368-372代表剛性接頭(SEQ ID NO 12);和胺基酸殘基373-935代表TeI4c ORF(SEQ ID NO :1)。圖2是通過剛性接頭與麥芽糖結合蛋白結合的細長熱聚球藍細菌逆轉錄酶的胺基酸序列表(SEQ ID NO :7)。胺基酸殘基1-367代表麥芽糖結合蛋白(SEQ ID NO=Il);胺基酸殘基368-372代表剛性接頭(SEQ ID NO 12);和胺基酸殘基373-935代表1TeMf ORF (SEQ ID NO 2)。圖3是通過剛性接頭與麥芽糖結合蛋白結合的細長熱聚球藍細菌逆轉錄酶的胺基酸序列表(SEQ ID NO :8)。胺基酸殘基1-367代表麥芽糖結合蛋白(SEQ ID NO=Il); 胺基酸殘基368-372代表剛性接頭(SEQ ID NO 12);和胺基酸殘基373-935代表TeI4h* ORF(SEQ ID NO :3)。圖4是通過剛性接頭與麥芽糖結合蛋白結合的嗜熱脂肪土芽孢桿菌逆轉錄酶的胺基酸序列表(SEQ ID NO :9)。胺基酸殘基1-367代表麥芽糖結合蛋白(SEQ ID NO=Il); 胺基酸殘基368-372代表剛性接頭(SEQ ID NO 12);和胺基酸殘基373-1008代表嗜熱脂肪土芽孢桿菌(isll ORF(SEQ ID NO :4)。圖5是通過剛性接頭與麥芽糖結合蛋白結合的嗜熱脂肪土芽孢桿菌逆轉錄酶的胺基酸序列表(SEQ ID NO: 10)。胺基酸殘基1-367代表麥芽糖結合蛋白(SEQ ID NO 11); 胺基酸殘基368-372代表剛性接頭(SEQ ID NO 12);和胺基酸殘基373-792代表嗜熱脂肪土芽孢桿菌 GsI2 ORF (SEQ ID NO :5)。圖6是在pMAL表達構建體中細長熱聚球藍細菌的逆轉錄酶的MalE-TeMc開放閱讀框(ORF)剛性融合體的核苷酸序列表(SEQ ID NO: 13)。圖7是在pMAL表達構建體中細長熱聚球藍細菌逆轉錄酶的MalE_TeI4f ORF剛性融合體的核苷酸序列表(SEQ ID N0:14)。圖8是在pMAL表達構建體中細長熱聚球藍細菌逆轉錄酶的MalE-TeI4h* ORF剛性融合體的核苷酸序列表(SEQ ID N0:15)。圖9是在pMAL表達構建體中嗜熱脂肪土芽孢桿菌逆轉錄酶的MalE-GsIl ORF剛性融合體的核苷酸序列表(SEQ ID N0:16)。圖10是在pMAL表達構建體中嗜熱脂肪土芽孢桿菌逆轉錄酶的MalE_GsI2 ORF剛性融合體的核苷酸序列表(SEQ ID N0:17)。圖11提供顯示在不同溫度下逆轉錄酶(RT)活性的聚(rA)/寡(抓)42測定的圖。測定的酶是 MalE-RF-GsIl、MalE-RF-(isI2、MalE-RF-TeI4c、MalE-RF-TeI4f、MalE-RF-TeI4h*、 LtrA和MalE-RF-LtrA。通過將RT (對於iTeMc為50nM、而對於所有其他RT為IOOnM)與 IOOnM 聚(rA) / 寡(dT)42 和 5μ 1 [ α -32P]-dTTP(3, OOOCi/mmol) 一起在 75mM KClUOmM MgCl2,20mM Tris-HCl, pH 7. 5和ImMDTT中孵育進行反應。在所示溫度下在反應介質中預孵育RT和聚(rA)/寡(dT)42l分鐘後,通過加入[α -32P]-dTTP開始反應,孵育被證實在線性範圍內的時間(對於TeI4c RT為90秒、且對於所有其他RT為5分鐘),並通過加入EDTA 至終濃度為250mM停止反應。[α -32P]-dTTP聚合成高分子量材料通過以下步驟定量將反應產物點於 Whatman DE81 層析紙(GE Health care Biosciences Corp)上,用 0. 3MNaCl 和0. 03M檸檬酸鈉洗滌,並用Phosphorlmager掃描以定量與過濾器結合的放射性,如在材料和方法中所述。該圖顯示作為反應溫度的函數的與過濾器結合的放射性。圖12顯示II組內含子RT和融合蛋白的示意圖。12㈧部分提供II組內含子編碼的RT和逆轉錄病毒RT的比較。II組內含子RT通過由Li. LtrB內含子編碼的LtrA蛋白例示,通常包含4個主要結構域帶保守序列區組RT-1-7的RT、X/拇指、DNA結合(D)和 DNA內切核酸酶(En)。II組內含子RT的RT和拇指結構域與通過HIV-I RT例示的逆轉錄病毒RT的同源,但由於N末端延伸以及保守RT序列區組上遊(RT-O)和之間的插入(例如, LtrA 中的 RT-2a、3a、4a 和 7a 以及拇指結構域插入、;Blocker 等,RNA 11,14-28,2005)而較大。逆轉錄病毒RT的拇指結構域的三個α螺旋特徵的位置對於LtrA和HIV-RT均顯示。 在本工作中使用的II組內含子RT除了缺少En結構域的(isI2 RT之外都包含En結構域。 12⑶部分顯示II組內含子RT融合蛋白。II組內含子RT(IEP)與融合的N末端MalE或 NusA溶解度標籤一起表達。最初構建體在通過帶TEV蛋白酶切割位點(下劃線)的柔性接頭與RT的N末端融合的表達載體PMalE-c2t中包含MalE溶解度標籤。在圖11中測試的這些最初構建體的變體包含缺失TEV蛋白酶切割位點的PMalE-c2t接頭。改進的構建體使用修飾的MalE或NusA標籤,該標籤通過包含5個丙氨酸殘基(下劃線)的剛性接頭與RT 的N末端融合。修飾的MalE標籤具有的帶電胺基酸殘基改變為丙氨酸(斜體),且修飾的 NusA標籤缺失兩個C末端胺基酸殘基。圖13提供顯示帶不同剛性融合接頭或溶解度標籤序列的MalE-RF-TeMc RT衍生物的RT活性的圖。圖13(A)提供顯示在60°C的RT活性的條形圖。如圖11使用50nM蛋白和IOOnM聚(rA)/寡(dT)42並孵育90秒,進行與MalE-RF_TeI4c RT(左條)或包含不同標籤或接頭序列的變體(右面的條)的反應。值是三次測定的平均,誤差條表示標準差。圖 13(B)提供顯示NusA-RF-TeMc RT的RT活性的溫度曲線的圖。如圖11使用50nM蛋白和 IOOnM聚(rA)/寡(dT)42並在所示溫度下孵育2分鐘,測定RT活性。y軸顯示各蛋白(圖 A)或作為反應溫度函數的NusA-RF-TeMc RT (圖B)的與過濾器(PhosphorImager單元) 結合的放射性。圖14提供圖和放射自顯影圖,其提供在不同溫度下通過MalE-RF-TeMc、 MalE-RF-GsI2和superscript III RT活性進行cDNA合成的比較。在圖(A-C)中,底物是帶退火的5』-標記的37-nt引物的轉錄自AflIII消化的pBS KS(+)的531_nt RNA,而在圖 (D-F)中,底物是帶退火的5,-標記的44-nt DNA引物的1.2_kb kanR RNA。通過在以下中將 IOOnM退火的模板/引物與200nM酶孵育來進行反應對於MalE-RF-TeMc RT (圖A和D)和 MalE-RF-Gs12 RT (圖 B和 E),在 IOOmM KCl、20mM Tris HCl pH 7.5、10mM MgCldPlOmM DTT 中,而對於superscript III RT (圖C和F),在製造商的緩衝液中。通過加入dNTP至終濃度為1. 25mM開始反應,在所示溫度下孵育30分鐘,並通過加入0. 1% SDS/250mM EDTA (終濃度)終止反應,然後苯酚-CIA萃取。通過在變性的6%聚丙烯醯胺凝膠中電泳分析產物, 乾燥凝膠並用Wiosphorlmager定量。在各圖中,頂部和底部放射自顯影圖分別顯示包含全長產物(箭頭)和未延伸或部分延伸引物的凝膠部分,而條形圖基於Wiosphorlmager定量顯示延伸至全長cDNA的引物百分比。「?」表示在全長產物的定量中未使用的未鑑定條帶。 使用5』 -標記的10-bp梯條帶anvitrogen )作為大小標記物。兩種模板引物底物的示意圖示於圖的底部。圖 15 是 1. 2-kb kanR RNA 模板的核苷酸序列表(SEQ ID NO 21)。圖16提供從qRT-PCR獲得的半對數圖,以比較在不同溫度下通過MalE-RF-TeMc RT 和 Superscript III RT 進行 cDNA 合成的量。通過 MalE-RF-iTeMc RT 或 SuperscriptIII RT (SSI 11 RT)使用帶退火引物 P078(Tm = 80°C )的 1. 2_kb kanR RNA 合成 cDNA,並用 nt 188-257和nt 562-634處的引物/探針組檢測(用引物組nt 188-257檢測的數據示於圖中,用引物組nt 562-634獲得的數據示於圖17中)。qPCR擴增曲線顯示螢光(Δ RN) 對循環數的半對數圖。對於每個樣品,分析兩個孔並繪於各擴增圖中。通過MalE-RF-TeMc RT或superscript IIIRT進行的各cDNA合成反應的循環閾(Ct)值(螢光越過閾值0. 4的循環)示於曲線下方。較低的(^值顯示較大數量的合成cDNA。圖17提供從qRT-PCR獲得的半對數圖,以比較通過MalE-RF-TeMc RT和 superscript III RT進行cDNA合成的持續合成能力。通過MalE-RF-TeMc RT或 superscript III RT 使用帶退火引物 P078 (Tm = 80°C )的 1. 2_kb kanR RNA 合成 cDNA,並用nt 188-257和nt562-634處的引物/探針組檢測。cDNA樣品在60°C (A、B)和65°C (C、 D)獲得。對於每個樣品,分析三個重複並繪於各擴增圖中。平均拷貝數得自定量和稀釋的 PET9質粒的標準曲線。如對於MalE-RF-TeMc RT所看到的,用兩種引物組檢測相似數量的cDNA拷貝顯示大部分cDNA延伸至接近RNA模板的末端,這表明高持續合成能力。如對於superscript III RT所看到的,相比更靠近3』端(nt 562-634)的引物組,用接近5』端 (nt 188-257)的引物組檢測的較低數量的cDNA拷貝表明,RT脫落或以某種其它方式被妨礙,而不到達RNA模板的5』端。圖18是NusA溶解度增加蛋白的胺基酸序列表(SEQ ID NO 38)。發明詳述除非另外定義,本文使用的所有技術和科學術語具有與本發明所屬領域普通技術人員通常理解的相同的含義。本發明說明書中使用的術語僅用於描述具體實施方案,並非旨在限制本發明。本文提及的所有公開出版物、專利申請、專利和其他參考文獻通過引用以其整體結合到本文中。定義如本發明說明書和所附權利要求中所用,除非上下文明確地另外指出,否則單數形式旨在也包括複數形式。另外,通過端點對數值範圍的描述包括該範圍內包含的所有數值(例如,1-5 包括 1,1. 5、2、2· 75,3,3. 80、4、5 等)。本文所用「多肽」指胺基酸多聚體,且不表示胺基酸多聚體的具體長度。因此,例如術語肽、寡肽、蛋白、抗體和酶包含在多肽的定義內。該術語亦包括帶表達後修飾的多肽, 表達後修飾例如糖基化(例如糖加成)、乙醯化、磷酸化等。本文所用「分離的」多肽或多核苷酸指從其天然環境中移走的、使用重組技術生產的或者化學或酶合成的多肽或多核苷酸。優選地,本發明的多肽或多核苷酸是純化的,即基本上不含任何其他多肽或多核苷酸和相關細胞產物或其他雜質。本文所用「胺基酸」指具有下述通式的化合物NH2-CRH-C00H,其中側鏈R是H或有機基團。當R是有機基團時,R可不同且是極性的或非極性的(即疏水的)。貫穿本申請使用下列縮寫A = Ala =丙氨酸、T = Thr =蘇氨酸、V = Val =纈氨酸、C = Cys =半胱氨酸、L = Leu =亮氨酸、Y = Tyr =酪氨酸、I = Ile =異亮氨酸、N = Asn =天冬醯胺、P =Pro =脯氨酸、Q = Gln =穀氨醯胺、F = Phe =苯丙氨酸、D = Asp =天冬氨酸、W = Trp =色氨酸、E = Glu =穀氨酸、M = Met =甲硫氨酸、K = Lys =賴氨酸、G = Gly =甘氨酸、 R = Arg =精氨酸、S = Ser =絲氨酸、H = His =組氨酸。除非另外指出,本文使用的術語「胺基酸」亦包括仍然保留通式的胺基酸衍生物。核苷酸的組成為,通過磷酯鍵與戊糖(RNA中是核糖、且DNA中是脫氧核糖)連接的磷酸基團,戊糖繼而與有機鹼基連接。核酸的單體單元是核苷酸。天然存在的DNA和RNA 各包含四種不同的核苷酸具有腺嘌呤、鳥嘌呤、胞嘧啶和胸腺嘧啶鹼基的核苷酸存在於天然存在的DNA中,而具有腺嘌呤、鳥嘌呤、胞嘧啶和尿嘧啶鹼基的核苷酸存在於天然存在的 RNA中。鹼基腺嘌呤、鳥嘌呤、胞嘧啶、胸腺嘧啶和尿嘧啶通常分別縮寫成A、G、C、T和U。

核苷酸包括游離的一磷酸、二磷酸和三磷酸形式(即磷酸基團分別具有一個、兩個或三個磷酸部分)。因此,核苷酸包括核糖核苷三磷酸(例如ATP、UTP、CTG和GTP)和脫氧核糖核苷三磷酸(例如dATP、dCTP、dITP、dGTP和dTTP),以及其衍生物。核苷酸亦包括雙脫氧核糖核苷三磷酸(ddNTP,包括ddATP、ddCTP、ddGTP、ddITP和ddTTP)及其衍生物。「實質上相似」意指給定核酸或胺基酸序列與參比序列共有至少85%、更優選至少 90%和甚至更優選至少95%的同一性。此外,總的來說,僅描述或編碼其中在保守區中作出僅保守置換的蛋白的序列實質上相似。優選地,實質上相似的序列亦保留多肽的獨特活性。通常視為保守置換的置換是在脂肪族胺基酸Ala、Val、Leu和Ile中的彼此置換、羥基殘基Ser和Thr的互換、酸性殘基Asp和Glu的交換、醯胺殘基Asn和Gln之間的置換、鹼性殘基Lys和Arg的交換以及芳香殘基Wie、Tyr間的置換。本文所用「啟動子」指介導由RNA聚合酶進行的轉錄的起始的DNA序列。轉錄啟動子可包含若干下述不同序列元件中的一個或多個1)存在於轉錄起始位點的序列元件; 2)存在於轉錄起始位點上遊的序列元件和;幻轉錄起始位點下遊的序列元件。各個序列元件作為DNA上的位點起作用,RNA聚合酶和促進RNA聚合酶定位到DNA上的轉錄因子與該位點結合。本文所用術語「聚合酶鏈式反應」(「PCR」)指在基因組DNA混合物中增加靶序列區段濃度而無克隆或純化的方法。例如參見Bartlett等,Methods MoI. Biol. 226 3-6 (2003),其提供PCR及其進展的綜述。該用於擴增靶序列的方法通常由以下步驟組成 將大量過量的兩條寡核苷酸引物引入包含所需靶序列的DNA混合物中,然後是在DNA聚合酶存在下的系列精確的熱循環。兩條引物與其各自的雙鏈靶序列的鏈互補。為了實現擴增, 使混合物變性,然後引物與其在靶分子內的互補序列退火。退火以後,用聚合酶延伸引物以形成新的互補鏈對。變性、引物退火和聚合酶延伸的步驟可重複多次,以獲得高濃度的擴增的所需靶序列區段。除非另外指明,本文所用PCR亦包括PCR的變體,例如等位基因特異性 PCR、不對稱PCR、熱啟動PCR、連接介導PCR、多重PCR、逆轉錄PCR或者本領域技術人員所知的任何其他PCR變體。如本說明書所用,不管在過渡性短語還是在權利要求主體中,術語「包含」和「包括」應解釋為具有開放式含義。換言之,術語應解釋為與短語「至少具有」或者「至少包含」 同義。當用於方法語境時,術語「包括」意指該方法至少包括列舉的步驟,但可包括另外的步驟。當用於化合物或組合物語境時,術語「包含」意指化合物或組合物包含至少列舉的特徵或組分,但亦可包含另外的特徵或組分。本文所用「融合蛋白」指具有至少兩個共價連接的異源多肽的蛋白,其中一個多肽來自一個蛋白序列或結構域,而另一個多肽來自另一個蛋白序列或結構域。 穩定化逆轉錄酶融合蛋白
9
本發明提供穩定化逆轉錄酶融合蛋白,其包含與穩定劑蛋白連接的熱穩定逆轉錄酶。在許多實施方案中,熱穩定逆轉錄酶通過接頭肽與穩定劑蛋白連接。然而,熱穩定逆轉錄酶和穩定劑蛋白也可相互直接融合。包含融合蛋白的多肽優選從N末端到C末端連接。 然而,逆轉錄酶和穩定劑蛋白可按任一順序連接在一起。例如,兩個肽序列可從C端到N端連接或者從N端到C端連接。在一些實施方案中,接頭肽包含在逆轉錄酶和穩定劑蛋白的連接C末端和N末端之間。將穩定劑蛋白與熱穩定逆轉錄酶連接可提供一個或多個優點。穩定化逆轉錄酶融合蛋白可具有一個或多個下述優點(a)在高溫下增加穩定性;(b)較高的持續合成能力; (c)增加溶解度,和/或(d)較高的保真度。在一些實施方案中,本發明的逆轉錄酶可具有多個以上列出的性質。例如,穩定化逆轉錄酶融合蛋白可具有增加的熱穩定穩定性和增加的保真度。優點有時可源自彼此。例如,通過提供增加的溶解度,由於溶解先前不溶的高保真度熱穩定逆轉錄酶,穩定化逆轉錄酶融合蛋白可提供能夠提供增加的轉錄保真度的產物。在融合蛋白中使用穩定劑蛋白亦可提供其他優點,例如增加蛋白表達和改進蛋白摺疊。 在穩定劑蛋白和熱穩定逆轉錄酶之間包含接頭肽可進一步增強這些優點。如本文所述,穩定化逆轉錄酶融合蛋白包含熱穩定逆轉錄酶和穩定劑蛋白。穩定化逆轉錄酶融合蛋白亦可包含接頭肽。例如,穩定化逆轉錄酶融合蛋白可具有分別示於圖 1-5 的 SEQ ID N0:6、SEQ ID NO :7、SEQ ID NO :8、SEQ ID NO :9 或 SEQ ID NO :10 中所示的胺基酸序列。備選地,穩定化逆轉錄酶融合蛋白可具有與SEQ ID NO 6, SEQ ID N0:7、SEQ ID NO :8、SEQ ID NO 9或SEQ ID NO 10中所示的一個或多個序列實質上相似的胺基酸序列。與序列6-10提供的融合蛋白「實質上相似」的穩定化逆轉錄酶融合蛋白胺基酸序列將分享至少85%同一性、更優選90%同一性和甚至更優選95%同一性,並僅包括保守區中的保守胺基酸置換。熱穩定逆轉錄酶本發明提供包含熱穩定逆轉錄酶的逆轉錄酶融合蛋白。術語「逆轉錄酶」(即RNA 指導的DNA聚合酶)指一組具有逆轉錄酶活性的酶(即催化從RNA模板合成DNA)。通常,這樣的酶包括但不限於逆轉錄病毒逆轉錄酶、逆轉錄轉座子逆轉錄酶和細菌逆轉錄酶(例如 II組內含子衍生的逆轉錄酶),以及其突變體、變體或衍生物。細菌逆轉錄酶的實例包括乳酸乳球菌(Lactococcus lactis)逆轉錄酶、細長熱聚球藍細菌逆轉錄酶或嗜熱脂肪土芽孢桿菌逆轉錄酶。更多細菌逆轉錄酶參見Simon等,Nucleic Acids Research,36,第7219-29 M (2008)以及 Kojima 和 Kanehisa,Molecular Biology and Evolution, 25,第 1395—04 頁(2008),其描述許多類別的逆轉錄酶(即尤其逆轉錄子、II組內含子和產生多樣性的逆轉錄元件)。逆轉錄酶主要用於將RNA轉錄為cDNA,cDNA可接著被克隆到載體中用於進一步操作或者用於多種擴增方法,例如聚合酶鏈式反應、基於核酸序列的擴增(NASBA)、轉錄介導的擴增(TMA)、自動維持序列複製(3SR)、多樣化引物延伸反應、5』 RACE、化學修飾的檢測或者其他需要使用RNA模板合成DNA的技術。術語「熱穩定的」指酶或蛋白質(例如逆轉錄酶)抗熱滅活的能力。這樣的酶通常獲自已經進化成在高溫環境中生長的喜溫生物(即嗜熱生物)。本文所用嗜熱生物是具有 45°C以上的最佳生長溫度和通常70°C以上的最高生長溫度的生物。通常,熱穩定酶比一般的酶(例如來自嗜溫生物的酶)對熱滅活更具抗性。因此,熱穩定逆轉錄酶的核酸合成活性可通過熱處理下降到某種程度,但比不上來自嗜溫生物的逆轉錄酶的下降。「熱穩定的」 亦指酶在高於38°C的溫度下有活性,優選在約38-100°C之間,且更優選在約40-81 °C之間。 特別優選溫度範圍是約45°C至約65°C。在一些實施方案中,在核酸合成混合物中於90°C被加熱30秒後,熱穩定逆轉錄酶保留其至少50% (例如至少60%、至少70%、至少80%、至少90%或至少95% )的核酸合成活性。與此相反,一般逆轉錄酶在高溫下將不起作用,在這種熱處理後失去其大部分核酸合成活性。熱穩定逆轉錄酶也通常具有較高的最佳核酸聚合溫度。一些逆轉錄酶是熱穩定的,因此在基於PCR的核酸合成中常用的溫度下實質上仍有活性。這提供了能夠在單一反應環境中進行逆轉錄和DNA擴增二者的優點。這樣的溫度視反應參數而不同,反應參數包括PH、模板和引物核苷酸組成、引物長度和鹽濃度。熱穩定逆轉錄酶包括細長熱聚球藍細菌(Te)RT、嗜熱脂肪土芽孢桿菌(Gs)RT、這些RT的修飾形式、以及禽類成髓細胞性白血病病毒(AMV)RT、莫洛尼鼠白血病病毒(M-MLV)RT和人免疫缺陷病毒(HIV)RT的工程改造變體。可預期從生活在高溫環境(即高於37°C )生物中獲得的逆轉錄酶在生物的生存溫度和合理程度以上的溫度下穩定。一類特別適合在穩定化逆轉錄酶融合蛋白中使用的逆轉錄酶是II組內含子衍生的逆轉錄酶。許多II組內含子衍生的逆轉錄酶是已知的。例如參見Zimmerly實驗室網址的Mobile Group II htrons (可動II組內含子),其描述105種全長II組內含子衍生的逆轉錄酶。該網站的使用參見Dai等,Nucleic Acids Research,31,第42416頁(2003)。在特定實施方案中,熱穩定逆轉錄酶是由II組內含子編碼的酶。II組內含子RT 通常由四個保守結構域組成RT(其包含是逆轉錄病毒RT的手指和手掌區域特徵的七個保守序列區組(RT1-7)) ;X,至少部分對應於逆轉錄病毒RT的拇指結構域的為RNA剪接活性所需的區);D,參與DNA靶位點識別的DNA結合結構域;和En,切割DNA靶位點以產生逆轉錄引物的DNA內切核酸酶結構域(圖12A ;Blocker等,RNA 11,14-28,2005)。En結構域在一些II組內含子RT中缺失,這些RT改為使用DNA複製叉處的新生鏈以引發逆轉錄(Zhong 等,EMBO J. 22,4555-4565,2003)。由於N末端延伸、附加的N末端保守序列區組(RT-O) 以及在RT和X/拇指結構域的保守序列區組之間的插入(部分為非-LTR-逆轉錄轉座子 RT所共有),因此II組內含子RT的RT和X/拇指結構域比逆轉錄病毒RT的大。已表明, II組內含子和相關RT的較大尺寸的RT和拇指結構域使與模板RNA的結合能夠更緊密,得到在逆轉錄過程中更高的持續合成能力和保真度。與逆轉錄病毒RT不同,II組內含子RT 缺少RNA酶H結構域並通常具有很低的依賴DNA的DNA聚合酶活性(Smith等,Genes and Development 19,2477-2487,2005)。II組內含子編碼一類已知其自剪接反應的RNA。在特定的體外條件下,II組內含子編碼的RNA可在無蛋白幫助下將其自身從前體mRNA切除並將它們側翼的外顯子連接在一起。剪接反應機制與核前mRNA內含子的剪接相似。許多II組內含子亦編碼逆轉錄酶 (RT)開放閱讀框(ORF)並且是活性可動元件。ORF通常存在於II組內含子編碼的RNA的 DIV結構域中。II組內含子RT通過穩定催化活性RNA結構輔助RNA剪接,並然後在核糖核蛋白(RNP)中保持與切除內含子RNA結合,該核糖核蛋白通過稱為「反向歸巢(retrohoming)」 的過程促進內含子移動性。反向歸巢通過其中RNP中的切除內含子RNA直接插入DNA靶位點中並通過RT逆轉錄的機制發生。在反向歸巢期間,II組內含子促進內含子靶向合適DNA序列,II組內含子RT必須生產內含子RNA的精確cDNA拷貝,內含子RNA通常2_2. 5kb長且摺疊成高度穩定和緻密的二級和三級結構。因此,II組內含子RT必須具有高的持續合成能力和保真度,以便完成其生物學功能。II組內含子衍生的RT亦缺乏RNA酶H活性,其可以是有益的,因為RNA酶H特異降解RNA:DNA雜合體的RNA,使任何RNA僅能夠複製一次並可導致降低的全長cDNA產率。基於到目前為止評價的II組內含子衍生的逆轉錄酶,這些RT通常表現相對高的保真度和高的持續合成能力。逆轉錄酶的保真度指在RNA逆轉錄成DNA期間核苷酸參入的可靠性,其中較高的保真度描述低數量錯誤(例如,錯參)的核苷酸複製。較高的特異性可通過使用較長和更特異的引物提供,這要求在較高溫度下進行逆轉錄的能力。例如,II組內含子衍生的逆轉錄酶可提供2. OX 10_5以下的錯誤頻率的逆轉錄,其中錯誤頻率表示發生的核苷酸複製錯誤相對無錯誤發生的核苷酸複製事件的數量的比例。高保真度轉錄的其他實例包括 1Χ1(Γ4、7. 5Χ1(Γ5、5Χ1(Γ5、2. 5X 1(Γ5、1 X 1(Γ5 和 5X IO"6 的錯誤頻率。關於 II 組內含子衍生的RT的高保真度的進一步描述,參見Conlan等,Nucleic Acids Research, 33,第 5262-70 頁(2005)。合適II組內含子衍生的逆轉錄酶的實例包括SEQ ID NO =USEQ ID NO :2、SEQ ID NO :3, SEQ ID NO :4和SEQ ID NO :5所示的逆轉錄酶,其獲自細長熱聚球藍細菌(TeI4c、f 和h*)和嗜熱脂肪土芽孢桿菌((isll和(isI2)。這些序列示於圖1-5。本發明亦涵蓋與SEQ ID NO :1、SEQ ID NO :2、SEQ ID NO :3、SEQ ID NO 4 和 SEQ ID NO 5 所示的那些實質上相似的II組內含子衍生的逆轉錄酶。與由序列1-5提供的逆轉錄酶「實質上相似」的逆轉錄酶將分享至少85%同一性、更優選90%同一性和甚至更優選95%同一性,且將僅包含保守區中的保守胺基酸置換。一些Π組內含子衍生的RT的熱穩定性示於圖11中,其表明,當如圖 11 所示評價時,包含 SEQ ID NO :1、SEQ ID NO :2、SEQ ID NO :3、SEQ ID NO 4 和 SEQ ID NO :5所示的逆轉錄酶的穩定化逆轉錄酶融合蛋白具有比嗜溫Li. LtrB逆轉錄酶高的熱穩定性,而不管嗜溫Li. LtrB逆轉錄酶是否是融合蛋白的一部分。嗜溫Li. LtrB單獨或者作為融合蛋白的一部分均顯示約35°C的最佳溫度。正如本文所提及的,亦可使用熱穩定II組內含子衍生的RT的修飾形式。例如, SEQ ID N0:3(TeI4h*RT)不表示天然形式的逆轉錄酶,而是活性位點從胺基酸序列YA⑶改變為胺基酸序列YADD的衍生物,以便更接近地相似其他活性II組內含子衍生的RT的活性位點。給定胺基酸序列與參比序列「實質上相似」的量可例如通過使用序列分析軟體比較序列信息來測定,序列分析軟體如BLAST 2搜索算法的Blastp程序,版本2. 2. 10,如 Tatusova 等(FEMS Microbiology Letters,174,第 247-50 頁(1999))描述,並可通過全球資訊網在美國國家生物技術信息中心(National Center for Biothechnology Information) 網站分子資料庫(Molecular Database)板塊的BLAST下獲得。優選地,所有BLAST2搜索參數使用默認值,包括矩陣=BL0SUM62 ;開放空位罰分=11、延伸空位罰分=1、空位χ下降=50、期望值=10、字長=3和任選過濾器開。在使用BLAST搜索算法比較兩個胺基酸序列中,結構相似性稱為「相似性」,而結構同一性稱作「同一性」。胺基酸同一性在候選多肽和參比胺基酸序列間比較的情況下定義,且通過比對兩條胺基酸序列(即候選胺基酸序列和參比胺基酸序列)的殘基以優化沿其序列長度的相同胺基酸數量來測定;在進行比對時允許兩條序列之一或二者中的空位,但是每條序列中的胺基酸必須仍然保持其正確次序。支持II組內含子衍生的逆轉錄酶的結構-功能關聯的信息是可得到的。例如參見對細菌逆轉錄酶的RT結構域進行分類和比對的Simon等,Nucleic Acids Research, 36, 第7219- 頁Q008),和提供顯示七個保守結構域和42個保守位置的82個RT序列比對的 Xiong 等,EMBO J.,9,第 3353-62 頁(1990)。亦參見 Blocker 等,RNA,11,第 14- 頁 (2005),其提供乳酸乳球菌Li. LtrB內含子RT (LtrA蛋白)的三維模型,描述蛋白酶剪切位點和保守區,並提供LtrA相對於HIV-IRT的序列比對分析。因此,多種與SEQ ID NO. 6-10 所示的那些實質上相似的穩定化逆轉錄酶融合蛋白可容易地通過保守區外胺基酸的修飾和已知保守區內僅保守胺基酸修飾來獲得。在一個實施方案中,本發明提供具有逆轉錄酶活性的穩定化逆轉錄酶融合蛋白, 其在高溫(即高於37°C)具有比相應的未結合逆轉錄酶長的半壽期。在一些實施方案中, 本發明逆轉錄酶的半壽期在50°C可為5分鐘以上,且優選為10分鐘以上。在一些實施方案中,本發明的逆轉錄酶可具有等於或大於約25分鐘的半壽期(例如在50°C ),優選等於或大於約50分鐘,更優選等於或大於約100分鐘,以及最優選等於或大於約200分鐘。穩定劑蛋白 本發明的穩定化逆轉錄酶融合蛋白亦包含穩定劑蛋白。本文定義的穩定劑蛋白是形成融合蛋白一部分的蛋白,其起增加融合蛋白整體穩定性的作用。穩定性包括蛋白保持其構象和活性的能力。另外,穩定劑蛋白優選增加融合蛋白的溶解度,如本文就溶解度增加蛋白的進一步描述。這對於II組內含子衍生的RT可特別有幫助,已發現II組內含子衍生的RT在RNP中的它們通常與之緊密結合的內含子RNA不存在時表達差且不溶(Vellore等 Appl. Environ. Microbiol. 70,7140-7147,2004 ;Ng 等,Gene 393,137-144,2007)。有效穩定劑蛋白包括這樣的蛋白其包含獨立摺疊結構域和/或不摺疊成可影響蛋白聚集傾向的長壽命錯摺疊中間體。提供獨立摺疊結構域的蛋白參見Janin等,Progress in Biophysics and Molecular Biology,42,第21-78頁(1983),而不摺疊成長壽命錯摺疊中間體的蛋白參見Idicula等,Protein Science,14,第582-592頁(2005)。例如,穩定劑蛋白可以是包含50個以上胺基酸的蛋白。在其他實施方案中,穩定劑蛋白可以是包含100個以上胺基酸的更大的蛋白。如本文提供的麥芽糖結合蛋白和NusA蛋白所例示,穩定劑蛋白亦可具有約 250個胺基酸至約400個胺基酸的大小。穩定劑蛋白亦可是熱穩定蛋白。穩定劑蛋白亦可是或者包含親和蛋白。本文所用術語親和蛋白指存在其容易獲得的配體的蛋白,該配體表現對該蛋白的高結合常數(即「親和力」)。親和蛋白通常用於親和標籤的作用。如本領域技術人員已知的,親和蛋白可在融合蛋白中提供以有助於通過例如親和純化(其中標籤與親和柱內的配體結合)等技術純化與親和蛋白連接或融合的蛋白。 合適的親和蛋白是本領域已知的。例如參見Waugh,D.,Trends in Biotechnology,23,第 316-320頁000 ,其描述許多合適的親和蛋白,包括穀胱甘肽S-轉移酶、麥芽糖結合蛋白、FLAG標籤肽、生物素接納體肽、鏈黴親和素結合肽和鈣調蛋白結合肽。對於製備和使用包含親和蛋白的融合蛋白,例如參見美國專利號5,643,758,5,654, 176和7,001,745。穩定劑蛋白亦可為溶解度增加蛋白。重組表達的融合蛋白在其宿主細胞和/或在隨後的方法應用中可表現低溶解度,這可通過在融合蛋白中包含溶解度增加蛋白而改良,該溶解度增加蛋白實質上增加水環境中的融合蛋白溶解度。一些使用的溶解度增加蛋白亦是親和蛋白,並因此可描述為溶解度增加親和蛋白。溶解度增加蛋白的實例包括糖結合蛋白,例如阿拉伯糖結合蛋白、殼多糖結合蛋白、纖維素結合蛋白和麥芽糖結合蛋白。溶解度增加蛋白的其他實例包括由Novagen 提供的NusA和Dsb溶解度標籤以及hvitrogen 提供的溶解度增加標籤(SET)。Harrision已經證明NusA溶解度標籤提供非常高的溶解度,而 Dsb 的溶解度增加由 Collins-Racie 描述。參見 Harrison, R. G.,inNovations,11,第 4-7 頁(2000),和 Collins-Racie 等,Biotechnology, 13,第 982-87 頁(1995)。在一些實施方案中,穩定劑蛋白例如溶解度增加蛋白或者親和蛋白可被修飾以改進其性能。與蛋白的正常野生型序列相比,修飾可包括提供穩定劑蛋白的蛋白序列內胺基酸的一個或多個置換、插入或缺失。例如,穩定劑蛋白(例如親和蛋白或溶解度增加蛋白) 可通過在蛋白的特定區域中使用不帶電胺基酸置換帶電胺基酸來修飾。帶電胺基酸包括具有帶正電或帶負電側鏈的胺基酸。具有帶正電側鏈的胺基酸的實例包括精氨酸、組氨酸、賴氨酸等。具有帶負電側鏈的胺基酸的實例包括天冬氨酸和穀氨酸等。不帶電胺基酸包括但不限於丙氨酸、絲氨酸、蘇氨酸、穀氨醯胺、纈氨酸、亮氨酸、異亮氨酸、苯丙氨酸和酪氨酸。 例如,麥芽糖結合蛋白可通過用丙氨酸置換一個或多個帶電胺基酸而修飾。合適親和蛋白的實例包括SEQ ID NO :11所示的麥芽糖結合蛋白胺基酸序列(示於圖1-5)和與SEQ ID NO 11實質上相似的序列。應注意,當親和蛋白的修飾不是必需時, SEQ ID NO :11所示的麥芽糖結合蛋白被修飾為在近C末端用丙氨酸置換三個帶電胺基酸。 另一種合適蛋白(在該情況下為增溶蛋白)是N-利用物質A(NusA)蛋白,其具有圖18所示SEQ ID NO :38中所示的胺基酸序列。在本發明另外的實施方案中,本文描述包含麥芽糖結合蛋白的融合蛋白可用N-利用物質A蛋白置換麥芽糖結合蛋白。接頭肽在一些實施方案中,穩定化逆轉錄酶融合蛋白亦包含位於穩定劑蛋白和熱穩定逆轉錄酶之間的接頭肽。優選地,接頭肽是非可切割接頭肽。「位於...之間」是指接頭肽通過化學鍵(例如,醯胺鍵)與穩定劑蛋白和逆轉錄酶各自的N末端或C末端連接,如本文關於融合蛋白的描述。例如,接頭肽可通過醯胺鍵與穩定劑蛋白的C末端區和熱穩定逆轉錄酶的N末端區連接。非可切割意指接頭肽不容易對蛋白酶切割易感。在另外的實施方案中,接頭肽是剛性接頭肽;即相對非柔性肽接頭。剛性接頭肽不要求完全缺乏柔性,而是比柔性接頭肽如富甘氨酸肽接頭柔性少。由於其相對缺乏柔性,剛性接頭肽降低通過剛性接頭肽連接在一起的兩個蛋白結構域(在當前情況下是穩定劑蛋白和熱穩定逆轉錄酶)的運動。提供有序鏈(例如α螺旋結構)的接頭肽可提供剛性接頭肽。例如,精氨酸、亮氨酸、穀氨酸、穀氨醯胺和甲硫氨酸都顯示出相對高的螺旋接頭結構傾向。然而,包含許多脯氨酸殘基的非螺旋接頭也可表現顯著的剛性。剛性接頭的實例包括聚賴氨酸和聚-DL-丙氨酸聚賴氨酸。剛性肽接頭的進一步描述fifeiggers等,Biopolymers, 80,第 736-46 頁(2005)提供。此外,剛性接頭肽在由 George 等,Protein Engineering, 15,第871-79頁000;3)描述的接頭資料庫中描述。優選地,剛性接頭肽也是非可切割接頭肽,即非可切割剛性接頭肽。優選相對短的多肽用作接頭肽。例如,接頭肽可包含1-20個胺基酸。接頭肽亦可包含1-15個、1-10個、1-5個或3-5個胺基酸。可用作接頭肽的具體序列實例包括由丙氨酸胺基酸形成的二肽、三肽、四肽和五肽。一種合適的剛性接頭肽是AAAAA (SEQ ID N0:12),而另一種合適剛性接頭肽是AAAEF(SEQ ID N0:18)。在融合蛋白中使用接頭肽(例如剛性接頭肽)可提供一個或多個優點。例如,雖然未旨在受理論束縛,但是據相信剛性接頭肽的使用可通過降低融合蛋白兩部分相對彼此的運動量來穩定融合蛋白。雖然可使用非常短(即 1或2個胺基酸)的接頭,但優選使用包含3-5個胺基酸的接頭。 接頭肽可以是通過蛋白酶可切割或非可切割的。親和蛋白通常在融合蛋白中使用可切割肽與另一個蛋白相連,以便可移除親和蛋白。然而,由於本文描述的理由,在本發明中穩定劑蛋白(例如親和蛋白)保持與逆轉錄酶結合。因此,一般優選接頭肽是非可切割的。然而,可切割接頭可用於一些實施方案。例如,如果在後續步驟期間除去穩定劑蛋白是合乎需要的,且在使用融合蛋白過程中避免暴露於蛋白酶切割,那麼可使用對蛋白酶切割易感的可切割接頭,包括剛性可切割接頭肽。
穩定化逆轉錄酶融合蛋白的使用本發明也提供從RNA (例如mRNA、rRNA、tRNA和miRNA)製備cDNA的方法,其為其他方法例如逆轉錄聚合酶鏈式反應(RT-PCR)所需。本文所用術語「RT-PCR」指RNA序列的複製和擴增。在該方法中,逆轉錄與PCR結合,例如,如美國專利號5,322,770中所述。在 RT-PCR中,RNA模板由於酶的逆轉錄酶活性轉變成cDNA,然後使用相同或不同酶的聚合活性擴增。在本發明的實踐中,cDNA分子的製備可通過在有助於通過組合物的酶作用逆轉錄核酸分子以形成cDNA分子(單鏈或雙鏈)的條件下,將使用本領域公知方法獲自細胞、 組織或器官的一種或多種核酸分子(例如RNA)與本發明的組合物混合。因此,本發明的方法包括(a)將一種或多種核酸模板(優選一種或多種RNA或mRNA模板,例如RNA分子群體)與本發明的穩定RT融合蛋白混合,和(b)在足以允許一種或者多種核酸模板的全部或部分的cDNA合成的條件下孵育混合物。在一個方面,方法包括如下步驟(a)將引物加入RNA分子中,和(b)在足以合成與RNA模板的全部或部分互補的cDNA分子的條件下,在一種或多種脫氧核糖核苷三磷酸或者雙脫氧核糖核苷三磷酸和包含與穩定劑蛋白連接的熱穩定逆轉錄酶的穩定化逆轉錄酶融合蛋白的存在下孵育RNA分子。將引物加入RNA分子中可包括使引物與RNA分子雜交。 在一些實施方案中,穩定化逆轉錄酶融合蛋白亦可包含將穩定劑蛋白與熱穩定逆轉錄酶連接的接頭肽。優選地,逆轉錄在其中RNA包含實質上減少量的阻礙性穩定二級或三級結構的溫度範圍內進行。這可以是約45°C至約85°C的溫度,其中更優選的溫度範圍是約45°C至約65°C。這亦可描述成其中RNA不形成顯著量的穩定二級或三級結構的溫度範圍。由於II 組內含子衍生的RT的高保真度和其他優點,可優選使用它們。例如,穩定化逆轉錄酶融合蛋白可包含11組內含子衍生的逆轉錄酶,其具有與選自SEQ ID NO :1、SEQ ID NO :2、SEQ ID NO 3,SEQ ID NO :4或SEQ ID NO :5的序列實質上相似的胺基酸序列同一性;由1_20個胺基酸組成的非可切割接頭;和穩定劑蛋白包含溶解度增加蛋白或親和蛋白。穩定化逆轉錄酶融合蛋白亦可包含穩定劑肽和逆轉錄酶之間的接頭肽,其可具有1-20個胺基酸的長度,可以是非可切割接頭或者可以是剛性接頭。方法實施方案可以2. OX 10_5以下的錯誤頻率進行逆轉錄。特別是在約45°C至約65°C的溫度下。穩定化逆轉錄酶融合蛋白亦可在用於其他應用。例如,穩定RT融合蛋白可用於克隆差別表達的mRNA 5』末端;一種稱為cDNA末端快速擴增(RACE)的方法及其變體,例如 RNA配體介導的RACE (RLM-RACE)。穩定RT融合蛋白亦可用於RNA中的化學足跡作圖、差示 RT-PCR(其使得能夠分析細胞群體中的基因表達)和用於醫學診斷的原位PCR。穩定化逆轉錄酶融合蛋白的製備包含編碼穩定化逆轉錄酶融合蛋白的核酸分子的表達載體可用於在重組宿主細胞中穩定化逆轉錄酶融合蛋白的高水平表達。表達載體可包括但不限於克隆載體、修飾的克隆載體、特別設計的質粒或病毒。多種表達載體可用於在合適細胞類型中表達重組穩定化逆轉錄酶融合蛋白序列。例如,細菌載體、哺乳動物載體、真菌載體和昆蟲載體可分別用於在細菌、哺乳動物細胞、真菌細菌和昆蟲細胞中表達。穩定化逆轉錄酶融合蛋白可通過獲得能夠表達穩定化逆轉錄酶融合蛋白的核苷酸序列和接著在宿主細胞中表達該核苷酸序列來製備。由宿主細胞表達的穩定化逆轉錄酶融合蛋白可接著使用多種本領域技術人員已知的技術純化,部分取決於宿主細胞的性質。本發明能夠表達穩定化逆轉錄酶融合蛋白的核苷酸序列可使用多種本領域技術人員已知的方法製備。例如,核苷酸序列可使用其中組合有不同接頭、逆轉錄酶和穩定劑蛋白的重組質粒製備,如本文實施例1所述。本發明亦涉及用包含能夠表達穩定化逆轉錄酶融合蛋白的核酸分子的載體轉化或轉染的宿主細胞。重組宿主細胞可為原核的或真核的,包括但不限於,細菌例如大腸桿菌,真菌細胞例如酵母,哺乳動物細胞包括但不限於牛、豬、猴和齧齒動物來源的細胞系;和昆蟲細胞包括但不限於果蠅和蠶衍生的細胞系。這樣的重組宿主細胞可在合適條件下培養以生產穩定化逆轉錄酶融合蛋白或生物學等價的形式。如本文所定義,術語「宿主細胞」不旨在包括在轉基因人、人胎兒或人胚胎體內的宿主細胞。如上文所示,包含編碼穩定化逆轉錄酶融合蛋白的DNA的表達載體可用於在重組宿主細胞中表達穩定化逆轉錄酶融合蛋白。因此,本發明另一方面是用於在重組宿主細胞中表達穩定化逆轉錄酶融合蛋白的方法,包括(a)將包含核酸的載體引入合適宿主細胞中,該核酸包含編碼穩定化逆轉錄酶融合蛋白的核苷酸序列,其中穩定化逆轉錄酶融合蛋白包含與穩定劑蛋白直接連接或通過接頭連接的熱穩定逆轉錄酶,和(b)在允許表達穩定化逆轉錄酶融合蛋白的條件下培養宿主細胞。穩定化逆轉錄酶融合蛋白可改變以包含本文描述的任何特徵,例如包含與熱穩定逆轉錄酶和穩定劑蛋白連接的接頭肽。在穩定化逆轉錄酶融合蛋白在宿主細胞中表達之後,可回收穩定化逆轉錄酶融合蛋白以提供純化的穩定逆轉錄酶融合蛋白。若干蛋白純化方法可用且適合使用。例如,參見本文提供的實施例2。重組蛋白可通過分級鹽析、離子交換層析、大小排阻層析、羥基磷灰石吸附層析和疏水作用層析的不同組合或單獨應用來從細胞裂解物和萃取物中純化。本發明一些實施方案中親和標籤的使用可有助於純化蛋白。例如,穩定化逆轉錄酶融合蛋白可通過使用由對融合蛋白的逆轉錄酶或穩定劑蛋白部分特異的單克隆或多克隆抗體製成的免疫親和柱與其他細胞蛋白分離。可使用加熱從在高溫下不穩定並將因此沉澱的宿主蛋白中分離穩定化逆轉錄酶融合蛋白。能夠表達穩定RT融合蛋白的核酸可裝配到表達盒中,該表達盒包含設計用於在宿主細胞中提供融合蛋白的有效表達的序列。該盒優選包含編碼穩定化逆轉錄酶融合蛋白的開放閱讀框,以及與其有效連接的相關轉錄和翻譯控制序列,例如啟動子和終止序列。例如,開放閱讀框可包含編碼多肽的核酸,該多肽具有與選自分別示於圖1-5的SEQ ID NO 6、SEQ ID NO :7、SEQ ID NO :8、SEQ ID NO 9 或 SEQ ID NO 10 的序列實質上相似的胺基酸序列同一性。在一個優選實施方案中,啟動子是用於在大腸桿菌中表達的T7或tac啟動子,但是本領域技術人員將認識到可使用許多其他已知啟動子中的任一種。大腸桿菌還具有不依賴和依賴rho的終止子,並可使用T7聚合酶用於快速DNA複製。在真核細胞中,包含聚腺苷酸化位點將有助於mRNA的正確加工。開放閱讀框亦可包含分別如圖6-10所示的SEQ ID NO 13,SEQ ID NO 14,SEQ ID NO 15, SEQ ID N0:16和SEQ ID NO :17中所示的多核苷酸序列。備選地,開放閱讀框可包含與 SEQ ID NO 13,SEQ ID NO 14,SEQ ID NO :15、SEQ ID NO :16 禾口 SEQ ID N0:17 所示的那些實質上相似的多核苷酸序列。在此特定的上下文中,術語「實質上相似」指核苷酸序列變體,其中可互換使用編碼相同胺基酸的密碼子,使得核苷酸序列將仍導致對應於SEQ ID NO 6-10的胺基酸序列的翻譯。穩定化逆轉錄酶融合蛋白開放閱讀框多核苷酸優選與選自 SEQ ID NO :13、SEQ ID NO :14、SEQ ID NO :15、SEQ ID NO 16 和 SEQ ID NO 17 的多核苷酸序列具有至少約80%同一性、至少約90%同一性、至少約95%同一性或至少約98%同一性。核苷酸同一性在候選穩定化逆轉錄酶融合蛋白開放閱讀框與選自SEQ ID NO 13、SEQ ID NO :14、SEQ ID NO :15、SEQ ID NO 16 和 SEQ ID NO 17 的多核苷酸序列之間比較的情況下定義,且通過比對兩個多核苷酸的殘基以優化沿其序列長度的相同核苷酸數來測定。在進行比對時允許兩個序列之一或二者中的空位,以便優化共有核苷酸的數量, 但是各序列中的核苷酸必須仍保持其正確次序。優選地,兩個核苷酸序列使用BLAST 2搜索算法的 Blastn 程序比較,如 Tatusova 等(FEMS Microbiology Letters,174,第 M7-50 頁(1999))所述,並可通過全球資訊網在美國國家生物技術信息中心網站分子資料庫板塊的 BLAST下獲得。優選地,所有BLAST 2搜索參數使用默認值,包括匹配獎勵=1、錯配罰分 =-2、開放空位罰分=5、延伸空位罰分=2、空位χ下降=50、期望值=10、字長=11和任選過濾器開。在使用BLAST搜索算法比較兩個核苷酸序列中,核苷酸同一性稱為「同一性」。關於從核苷酸序列製備蛋白,應當注意四種可能核苷酸鹼基的「三聯體」密碼子可以超過60種變體形式存在。因為這些密碼子提供僅20種不同胺基酸(以及轉錄起始和終止)的信息,所以一些胺基酸可由多於一種密碼子編碼,一種稱為密碼子冗餘的現象。因此,用於製備穩定化逆轉錄酶融合蛋白特定胺基酸序列的核苷酸序列可頗為不同,視使用的具體密碼子而定。由於未完全理解的原因,備選密碼子不一致地存在於不同細胞類型的內源DNA中,在特定類型的細胞中某些密碼子存在天然序位或「優選」。因此,在一些實施方案中,選擇用於表達穩定化逆轉錄酶融合蛋白的密碼子可通過使用導致高水平表達的特定密碼子來優化。依據本發明,穩定化逆轉錄酶融合蛋白表達盒插入到載體中。載體優選質粒載體或腺病毒載體,但是亦可使用與啟動子連接的線性DNA或其他載體,例如腺伴隨病毒或修飾的痘苗病毒、逆轉錄病毒載體或慢病毒載體。特別優選使用大腸桿菌質粒載體。以下提供由本發明人為開發和評價穩定化逆轉錄酶融合蛋白而進行的工作的詳細說明。II組內含子RT作為MalE融合蛋白的表達及純化
表現差蛋白的表達和溶解度有時可通過融合高度可溶蛋白改善,高度可溶蛋白例如麥芽糖結合蛋白(MalE)或 N 利用物質 A(NusA) (Nallamsetty 等,Protein Expression and Purification 45,175-182,2005)。此外MalE標籤使得能夠通過直鏈澱粉親和層析容易地純化蛋白。本發明人因此測試II組內含子RT是否可作為MalE融合體表達和純化。最初,MalE標籤通過pMal-c2t表達載體中的TEV蛋白酶可切割接頭與RT的N末端融合(圖 12B)。若干細長熱聚球藍細菌II組內含子RT的MalE-RT融合蛋白在大腸桿菌中表達良好, 並可通過包括聚乙烯亞胺(PEI)沉澱除去核酸,然後直鏈澱粉親和層析和肝素瓊脂糖層析的步驟純化。此外,純化後立即測定的未切割MalE-RT融合蛋白具有高熱穩定RT活性。然而,對於熱聚球藍細菌(Thermosynechococcus)蛋白,這些蛋白的產量< 0. 2mg/L·另外,當通過TEV蛋白酶切割除去MalE標籤時,RT立刻形成不溶沉澱,而如果保持標籤未切割,那麼即便在保存於冰上或瞬間冷凍於50%甘油中時,MalE-RT融合蛋白也逐漸失去RT活性並在數天內降解。後者的發現是出人意外的,因為在溶解度標籤的存在下正確摺疊的蛋白在切除標籤後趨於保持可溶(Nallamsetty 等,Protein Expression and Purification 45, 175-182,2005)。在存在而非不存在連接的MalE標籤的情況下有活性的II組內含子RT似乎是例外。穩定劑蛋白必須保持與熱穩定逆轉錄酶連接的發現表明,其在保持熱穩定逆轉錄酶可溶和活性中起積極作用。為了克服這些困難,本發明人測試是否可通過非可切割剛性接頭將MalE標籤與蛋白連接使II組內含子RT穩定在活性形式。該MalE-剛性融合體通常具有3-5個丙氨酸殘基的接頭區,以及在MalE標籤的C末端用丙氨酸置換帶電胺基酸殘基的改變(Smyth 等,Genes and Development 19,2477-2487,2003)。這些剛性融合體接頭降低構象異質性,使帶有連接的接頭的蛋白能夠結晶用於結構測定(Smyth等,同上)。對於本文測試的 MalE-RF-RT 融合體,將 pMal-dt 的 MalE/ 接頭區 TVDEALKDAQTNS3N1(ILENLYFQGEF(SEQ ID NO 19)修飾為 TVDAALAAAQTAAA (SEQ ID NO 20),並稱為 MalE-RF (剛性融合體)標籤(圖 12B)。為了快速確定MalE-RF標籤是否影響II組內含子RT的活性,本發明人測試 MalE-RF-RT是否可支持體內反向歸巢。對於初始測試,所選RT是由乳酸乳球菌Li. LtrB 內含子編碼的LtrA蛋白,和是由熱穩定細長熱聚球藍細菌TeI4h內含子編碼的RT的活化衍生物的TeI4h* RT。在37°C反向歸巢測定中,MalE-RF-LtrA蛋白以20%的效率相比天然 LtrA 86 %的效率支持反向歸巢,而在48 °C反向歸巢測定中,MalE-RF-TeI4h*蛋白以87 %的效率相比未融合TeI4h*蛋白100%的效率支持反向歸巢;參見表1。因此,兩種MalE-RF-RT 均顯著保持以高但稍微降低的效率支持反向歸巢的能力,而不管連接的麥芽糖結合蛋白剛性接頭序列存在與否。這些發現表明,蛋白保留實質上為反向歸巢所需的所有活性水平,包括RT活性、RNA剪接活性和DNA內切核酸酶活性。該移動性測定提供對活性II組內含子 RT的合宜篩查。表1 不同RT的反向歸巢效率
權利要求
1.一種穩定化逆轉錄酶融合蛋白,包含與穩定劑蛋白連接的熱穩定逆轉錄酶。
2.權利要求1的穩定化逆轉錄酶融合蛋白,其中所述熱穩定逆轉錄酶包含細菌逆轉錄酶。
3.權利要求2的穩定化逆轉錄酶融合蛋白,其中所述細菌逆轉錄酶包含II組內含子衍生的逆轉錄酶。
4.權利要求3的穩定化逆轉錄酶融合蛋白,其中所述細菌逆轉錄酶是細長熱聚球藍細菌逆轉錄酶或嗜熱脂肪土芽孢桿菌逆轉錄酶。
5.權利要求1的穩定化逆轉錄酶融合蛋白,其中所述熱穩定逆轉錄酶包含與選自SEQ ID N0:1、SEQ ID N0:2、SEQ ID N0:3、SEQ ID NO :4 或 SEQ ID NO :5 的序列有至少 85%胺基酸序列同一性的多肽。
6.權利要求1的穩定化逆轉錄酶融合蛋白,其中所述穩定劑蛋白包含親和蛋白或溶解度增加蛋白。
7.權利要求6的穩定化逆轉錄酶融合蛋白,其中所述穩定劑蛋白包含麥芽糖結合蛋白或N-利用物質A蛋白。
8.權利要求6的穩定化逆轉錄酶融合蛋白,其中所述穩定劑蛋白通過將帶電胺基酸置換為不帶電胺基酸而修飾。
9.權利要求1的穩定化逆轉錄酶融合蛋白,其中所述熱穩定逆轉錄酶與所述穩定劑蛋白通過接頭肽連接。
10.權利要求9的穩定化逆轉錄酶融合蛋白,其中所述接頭肽是非可切割接頭肽。
11.權利要求10的穩定化逆轉錄酶融合蛋白,其中所述非可切割接頭肽是剛性接頭肽。
12.權利要求10的穩定化逆轉錄酶融合蛋白,其中所述接頭肽由1-20個胺基酸組成。
13.權利要求10的穩定化逆轉錄酶融合蛋白,其中所述接頭肽由1-5個胺基酸組成。
14.權利要求10的穩定化逆轉錄酶融合蛋白,其中所述接頭肽由3-5個胺基酸組成。
15.權利要求11的穩定化逆轉錄酶融合蛋白,其中所述剛性接頭肽由SEQID N0:12組成。
16.權利要求1的穩定化逆轉錄酶融合蛋白,其中所述融合蛋白具有包含多肽的胺基酸序列,所述多肽與選自 SEQ ID NO :6、SEQ ID NO :7、SEQ ID NO :8、SEQ ID NO 9 或 SEQ ID NO 10的序列有至少85%胺基酸序列同一性。
17.權利要求1的穩定化逆轉錄酶融合蛋白,其中所述穩定化逆轉錄酶融合蛋白能夠在約45°C至約65°C的溫度下以2. OX 10_5以下的錯誤頻率進行逆轉錄。
18.一種從RNA分子製備cDNA的方法,所述方法包括以下步驟(a)將引物核苷酸序列加入RNA分子中(b)在足以合成與所述RNA分子的全部或部分互補的cDNA分子的條件下,在一種或多種脫氧核糖核苷三磷酸或雙脫氧核糖核苷三磷酸和包含與穩定劑蛋白連接的熱穩定逆轉錄酶的穩定化逆轉錄酶融合蛋白存在下孵育所述RNA分子。
19.權利要求18的方法,其中所述熱穩定逆轉錄酶與所述穩定劑蛋白通過非可切割接頭肽連接。
20.權利要求18的方法,其中在所述RNA具有實質上減少量的阻礙性穩定二級或三級結構的溫度範圍內進行逆轉錄。
21.權利要求18的方法,其中所述熱穩定逆轉錄酶是II組內含子衍生的逆轉錄酶。
22.權利要求19的方法,其中所述熱穩定逆轉錄酶包含與選自SEQID NO =USEQ ID NO 2,SEQ ID N0:3、SEQ ID NO :4或SEQ ID NO :5的序列有至少85%胺基酸序列同一性的多肽;由1-20個胺基酸組成的非可切割接頭;和所述穩定劑蛋白包含親和蛋白或溶解度增加蛋白。
23.權利要求18的方法,其中在約45°C至約65°C的溫度下以2.OX 10_5以下的錯誤頻率進行逆轉錄。
24.一種用於生產穩定化逆轉錄酶融合蛋白的DNA表達載體,包含編碼多肽的分離核酸,所述多Jft 與選自 SEQ ID NO 6,SEQ ID NO :7、SEQ ID NO :8、SEQ ID NO :9 或 SEQ ID NO: 10的序列有至少85%胺基酸序列同一性。
25.—種生產穩定化逆轉錄酶融合蛋白的方法,包括以下步驟(a)培養包含權利要求M的DNA表達載體的宿主細胞;(b)表達由所述DNA表達載體編碼的穩定化逆轉錄酶融合蛋白;和(c)從所述宿主細胞中分離所述穩定化逆轉錄酶融合蛋白。
全文摘要
本發明描述穩定化逆轉錄酶融合蛋白,其包含與穩定劑蛋白連接的熱穩定逆轉錄酶。將穩定劑蛋白與熱穩定逆轉錄酶連接使融合蛋白穩定並可幫助其純化、提供增加的溶解度、允許長期儲存或者允許用於更加苛刻的條件例如較高溫度下。穩定化逆轉錄酶融合蛋白也可包含穩定劑蛋白和熱穩定逆轉錄酶之間的接頭。穩定化逆轉錄酶融合蛋白適合用於核酸擴增方法,例如逆轉錄聚合酶鏈式反應和其他包括cDNA合成的應用。
文檔編號C07K14/195GK102421791SQ201080020123
公開日2012年4月18日 申請日期2010年3月4日 優先權日2009年3月4日
發明者A·M·拉姆博維茨, E·加尼姆, G·摩爾, S·摩爾 申請人:德克薩斯系統大學評議會

同类文章

一種新型多功能組合攝影箱的製作方法

一種新型多功能組合攝影箱的製作方法【專利摘要】本實用新型公開了一種新型多功能組合攝影箱,包括敞開式箱體和前攝影蓋,在箱體頂部設有移動式光源盒,在箱體底部設有LED脫影板,LED脫影板放置在底板上;移動式光源盒包括上蓋,上蓋內設有光源,上蓋部設有磨沙透光片,磨沙透光片將光源封閉在上蓋內;所述LED脫影

壓縮模式圖樣重疊檢測方法與裝置與流程

本發明涉及通信領域,特別涉及一種壓縮模式圖樣重疊檢測方法與裝置。背景技術:在寬帶碼分多址(WCDMA,WidebandCodeDivisionMultipleAccess)系統頻分復用(FDD,FrequencyDivisionDuplex)模式下,為了進行異頻硬切換、FDD到時分復用(TDD,Ti

個性化檯曆的製作方法

專利名稱::個性化檯曆的製作方法技術領域::本實用新型涉及一種檯曆,尤其涉及一種既顯示月曆、又能插入照片的個性化檯曆,屬於生活文化藝術用品領域。背景技術::公知的立式檯曆每頁皆由月曆和畫面兩部分構成,這兩部分都是事先印刷好,固定而不能更換的。畫面或為風景,或為模特、明星。功能單一局限性較大。特別是畫

一種實現縮放的視頻解碼方法

專利名稱:一種實現縮放的視頻解碼方法技術領域:本發明涉及視頻信號處理領域,特別是一種實現縮放的視頻解碼方法。背景技術: Mpeg標準是由運動圖像專家組(Moving Picture Expert Group,MPEG)開發的用於視頻和音頻壓縮的一系列演進的標準。按照Mpeg標準,視頻圖像壓縮編碼後包

基於加熱模壓的纖維增強PBT複合材料成型工藝的製作方法

本發明涉及一種基於加熱模壓的纖維增強pbt複合材料成型工藝。背景技術:熱塑性複合材料與傳統熱固性複合材料相比其具有較好的韌性和抗衝擊性能,此外其還具有可回收利用等優點。熱塑性塑料在液態時流動能力差,使得其與纖維結合浸潤困難。環狀對苯二甲酸丁二醇酯(cbt)是一種環狀預聚物,該材料力學性能差不適合做纖

一種pe滾塑儲槽的製作方法

專利名稱:一種pe滾塑儲槽的製作方法技術領域:一種PE滾塑儲槽一、 技術領域 本實用新型涉及一種PE滾塑儲槽,主要用於化工、染料、醫藥、農藥、冶金、稀土、機械、電子、電力、環保、紡織、釀造、釀造、食品、給水、排水等行業儲存液體使用。二、 背景技術 目前,化工液體耐腐蝕貯運設備,普遍使用傳統的玻璃鋼容

釘的製作方法

專利名稱:釘的製作方法技術領域:本實用新型涉及一種釘,尤其涉及一種可提供方便拔除的鐵(鋼)釘。背景技術:考慮到廢木材回收後再加工利用作業的方便性與安全性,根據環保規定,廢木材的回收是必須將釘於廢木材上的鐵(鋼)釘拔除。如圖1、圖2所示,目前用以釘入木材的鐵(鋼)釘10主要是在一釘體11的一端形成一尖

直流氧噴裝置的製作方法

專利名稱:直流氧噴裝置的製作方法技術領域:本實用新型涉及ー種醫療器械,具體地說是ー種直流氧噴裝置。背景技術:臨床上的放療過程極易造成患者的局部皮膚損傷和炎症,被稱為「放射性皮炎」。目前對於放射性皮炎的主要治療措施是塗抹藥膏,而放射性皮炎患者多伴有局部疼痛,對於止痛,多是通過ロ服或靜脈注射進行止痛治療

新型熱網閥門操作手輪的製作方法

專利名稱:新型熱網閥門操作手輪的製作方法技術領域:新型熱網閥門操作手輪技術領域:本實用新型涉及一種新型熱網閥門操作手輪,屬於機械領域。背景技術::閥門作為流體控制裝置應用廣泛,手輪傳動的閥門使用比例佔90%以上。國家標準中提及手輪所起作用為傳動功能,不作為閥門的運輸、起吊裝置,不承受軸向力。現有閥門

用來自動讀取管狀容器所載識別碼的裝置的製作方法

專利名稱:用來自動讀取管狀容器所載識別碼的裝置的製作方法背景技術:1-本發明所屬領域本發明涉及一種用來自動讀取管狀容器所載識別碼的裝置,其中的管狀容器被放在循環於配送鏈上的文檔匣或託架裝置中。本發明特別適用於,然而並非僅僅專用於,對引入自動分析系統的血液樣本試管之類的自動識別。本發明還涉及專為實現讀