新四季網

改善的ss07-聚合酶偶聯蛋白質的製作方法

2023-04-24 06:11:16

專利名稱:改善的ss07-聚合酶偶聯蛋白質的製作方法
背景技術:
可通過將一序列非特異性雙鏈核酸結合域與酶或其催化結構域相連接而改進聚合酶的活性(參見WO0192501)。這樣修飾的聚合酶與未修飾酶相比顯示出加工能力提高。然而,在一些情況中,可採用其它方法修飾這些改進的聚合酶的加工能力。例如,當進行長模板的聚合酶鏈式反應(PCR)時,採用高加工能聚合酶通常會導致產量更低。因此,需要調節聚合酶的加工能力以最優化該酶用於特定目的,例如長PCR。
此外,在一些情況中,用序列非特異性雙鏈核酸結合域修飾聚合酶會減少聚合酶區分錯配的引物/模板與適配引物/模板的能力。因此,也可能需要提高聚合酶對引物模板的特異性。
本發明針對了這兩種需要,即調節聚合酶的加工能力和引物/模板結合特異性。本發明提供一種聚合酶偶聯物,該偶聯物包含有一個聚合酶或聚合酶催化結構域連接的突變的DNA結合域如Sso7d、Sac7d或與相關結構域。該突變的結合域在DNA結合域多肽序列表面殘基(face residue)處含有1個或多個胺基酸取代。這些取代的融合性聚合酶在聚合酶反應中,例如聚合酶鏈式反應(PCR)中性能提高。
發明概述本發明提供的聚合酶具有改進的加工能力。在一些實施方案中,該聚合酶也表現出增強的引物/模板結合特異性。具體說本發明提供一種Sso7-聚合酶偶聯蛋白質,此蛋白質含有與連接於聚合酶結構域的SEQ ID NO2相同性至少為60%的Sso7結構域,在此Sso7結構域中通過參比SEQ ID NO2所確定的某表面殘基位點的胺基酸被不同的胺基酸所取代;其中該表面殘基的置換導致其加工能力低於野生型Sso7-聚合酶融合物但高於未融合Sso7d結構域的該聚合酶結構域的加工能力。通常,與含SEQ ID NO2的Sso7聚合酶融合性蛋白相比,該表面殘基的置換,也增加了該聚合酶的引物/模板結合特異性。
在一些實施方案中,該表面殘基位點選自位點24的色氨酸殘基、位點26的纈氨酸殘基、位點29的甲硫氨酸殘基。在具體的實施方案中,該表面殘基位點是位點24的色氨酸殘基,置換胺基酸殘基是除了Asp、Glu、Arg、Lys或Pro之外的任何胺基酸。一般,置換胺基酸殘基是甘氨酸、纈氨酸或丙氨酸。
在較佳實施方案中,該物的聚合酶結構域具有熱穩定性聚合酶活性。該聚合酶結構域可以是家族A聚合酶結構域如棲熱菌(Thermus)聚合酶結構域或家族B聚合酶結構域如火球菌(Pyrococcus)聚合酶結構域。通常該聚合酶結構域是ΔTaq聚合酶結構域。
在其它實施方案中,Sso7結構域包含SEQ ID NO2,其中其表面殘基位點的胺基酸被一個不同胺基酸所取代。例如,在一些實施方案中,Sso7結構域包含SEQ ID NO2中位點24的色氨酸殘基,被選自甘氨酸、丙氨酸和纈氨酸的胺基酸殘基所取代。
另一方面,本發明提供一種調節對溶液中存在的靶核酸進行聚合酶反應的方法,該方法包括(a)使該靶核酸接觸Sso7聚合酶蛋白,此偶聯蛋白質包含與連接於聚合酶結構域的SEQ ID NO2相同性至少為60%的Sso7d結構域,Sso7d結構域中通過參比SEQ ID NO2所確定的某表面殘基位點有一胺基酸被野生型Sso7蛋白該表面殘基位沒有的胺基酸殘基所取代;其中該表面殘基的置換導致其加工能力高於未融合Sso7結構域的該聚合酶結構域的加工能力;其中所述溶液是一種組合物,能使該結合域結合靶核酸和使該聚合酶結構域可延伸與靶核酸序列雜交的引物;(b)在聚合酶可延伸引物的條件下孵育溶液。通常,與含SEQ ID NO2的Sso7聚合酶融合蛋白質相比,該表面殘基的置換可提高該聚合酶的引物/模板結合特異性。
本發明還提供產生本文所示聚合酶偶聯物和利用其調節聚合酶反應的方法。
附圖的簡要說明

圖1描述比較Sso7d(G)-ΔTaq與野生型融合蛋白Sso7d-ΔTaq的PCR反應的結果。最終PCR產物在1%瓊脂糖凝膠上作分析以評估相對產量。
圖2顯示Sac7e(SEQ ID NO10)和Sso7d(SEQ ID NO9)的排列對比。共有肽=SEQ ID NOS11-14。
發明詳述定義術語「Sso7」或「Sso7DNA結合域」或「Sso7樣DNA結合域」指核酸和多肽的多態變體、等位基因、突變體和種間同源物它們(1)具有的胺基酸序列與SEQID NO2的Sso7序列胺基酸序列相同性大於約60%、65%、70%、75%、80%、85%、90%,優選91%、92%、93%、94%、95%、96%、97%、98%或99%或更高胺基酸序列相同性,優選某區域有至少約15、25、35、50或更多胺基酸相同;(2)能結合抗體,例如針對含SEQ ID NO2胺基酸序列的免疫原和其保守性修飾變體的多克隆抗體;(3)在嚴謹雜交的條件下能與SEQ ID NO1的Sso7核酸序列和其保守性修飾變體特異性雜交;(4)具有的核酸序列與SEQ ID NO1的核酸序列相同性大於約50%,優選大於約60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%或99%,優選某區域有至少約50、100、150或更多核苷酸相同上;或(5)被能在嚴謹雜交條件下與引物組,如5』GCAACAGTAAAGTTCAAGTACAAAGG 3』(SEQ ID NO15)(正向)和5』CTAACATTTGTAGTAGTTCTTTTGGAGCG 3』(SEQ ID NO16)(反向)相同的序列特異性雜交的引物所擴增。該術語包括全長Sso7多肽和具有序列非特異性雙鏈DNA結合活性的多肽的片段。
「結構域」指蛋白或蛋白複合體中的一個單元,該單元包括一多肽序列、一完整的多肽序列或多個有明確功能的單元的多肽序列。功能應理解為廣義功能可以是配基結合、催化活性或對蛋白結構有穩定作用。
本文中關於2種核酸或多肽序列的術語「相同」指排列進行最大相應性對比時,2種序列中相同的殘基,如用下節題為「根據同源性鑑定Sso7結構域」(Identification of Sso7 domains based on homology)所述的「序列比較算法」測量的那樣。
「野生型Sso7」指天然產生的Sso7蛋白。「野生型Sso7胺基酸序列」指天然產生的胺基酸序列。
「Sso7聚合酶偶聯物」指一種修飾的聚合酶,其包含與聚合酶結構域或聚合酶結構域的催化亞基相連接的至少1個Sso7DNA結合域。「取代的Sso7聚合酶物」所指該偶聯物中至少有1個表面位點的胺基酸殘基被天然Sso7序列該位點中沒有的胺基酸殘基所取代。「Sso7聚合酶物」可包括多個Sso7結合域。
本文中關於本發明核酸修飾酶的「效率」指該酶在特定反應條件下行使其催化功能的能力。通常,本文定義的「效率」可由在特定反應條件下生成的產物量來表示。
本文中酶的「提高」指改進酶活性,即增加每單位酶每單位時間的產物量。
「融合」指通過共價鍵連接。
當用於指某蛋白質的部分時,「異源性」表示該蛋白質含有2個或多個在天然蛋白質中沒有發現相同關係的結構域。這種蛋白如融合蛋白包含2個或多個來自不相關蛋白的結構域,因而產生了一種新的功能性蛋白質。
「連接」指本領域用於功能性連接蛋白質結構域的任何已知方法,包括但不限於有或沒有中間結構域內含肽介導的融合、非共價結合和共價結合,包括二硫鍵結合;氫鍵結合;靜電結合;構象結合,如抗體-抗原和生物素-抗生物素蛋白的結合所產生的重組融合物。
側鏈體積小於色氨酸側鏈體積的胺基酸殘基,指側鏈比色氨酸小的胺基酸殘基。這種側鏈一般體積小於約1703。
「聚合酶」指能進行模板引導的核苷酸合成的酶。該術語涵蓋具有聚合酶活性的全長多肽或某結構域。
「加工能力」指聚合酶保持結合於模板或底物並進行DNA合成的能力。加工能力可通過每次結合所發生的催化活動的數量來測量。
如本文所用,「熱穩定性聚合酶」指能用DNA或RNA作為模板,通過在核苷酸鏈上加入核苷酸單位來催化多核苷酸合成,且在45℃以上溫度時有最優活性的酶。
「棲熱菌聚合酶」指從任何棲熱菌屬分離得到的家族ADNA聚合酶,包括但不限於棲熱水生菌(Thermus aquaticus)、Thermus brockianus和嗜熱棲熱菌(Thermus thermophilus);從棲熱菌屬衍生獲得的任何重組酶和其功能性衍生物,無論是通過遺傳修飾或化學修飾或是本領域其它已知方法產生的。
術語「擴增反應」指任何增加靶核酸序列拷貝的體外方法。這種方法包括但不限於聚合酶鏈式反應(PCR)、DNA連接酶鏈式反應(參見美國專利4,683,195和4,682,202;《PCR操作方法和應用指南》(PCR ProtocolsA Guide toMethods and Applications)(Innis等編輯,1990)),(LCR)、QBeta RNA複製酶和以RNA轉錄為基礎(如TAS和3SR)的擴增反應,以及本領域技術人員已知的其它方法。
「擴增」指如果所有反應成分完整使溶液經歷的條件足以擴增多核苷酸的步驟。擴增反應的組分包括例如引物、多核苷酸模板、聚合酶、核苷酸等。術語「擴增」通常指靶核酸「是指數式」增加。然而,如本文所用,「擴增」也可指所選靶核酸序列數量呈線性增加,如用循環測序所獲得的那樣。
術語「擴增反應混合物」指含有用於擴增靶核酸的各種試劑的水溶液。這些試劑包括酶、水緩衝液、鹽、擴增引物、靶核酸和三磷酸核苷。根據上下文,該混合物可以是完整或不完整的擴增反應混合物。
「聚合酶鏈式反應」或「PCR」指以等比級數擴增靶雙鏈DNA特定區段或亞序列的方法。PCR是本領域技術人員熟知的;參見例如美國專利4,683,195和4,682,202;《PCR操作方法和應用指南》,Innis等編輯,1990。典型PCR反應條件一般包括二或三步循環。二步循環包括變性步驟,接著是雜交/延伸步驟。三步循環包括變性步驟,接著是雜交步驟,然後是分別延伸步驟。
「長PCR」指擴增5kb或更長長度的DNA片段。長PCR通常用特別適合的聚合酶或聚合酶混合物進行(參見例如美國專利5,436,149和5,512,462),與常規用於擴增較短產物的聚合酶不同。
「引物」指能與靶核酸上的某段序列雜交並用作核酸合成起始點的一種多核苷酸序列。引物可以是不同長度,通常長度不到50個核苷酸,例如長12-30個核苷酸。用於PCR的引物長度和序列可根據本領域技術人員已知原理設計,參見例如Innis等,同上。
「溫度設定」指PCR或循環測序反應的變性、退火和/或延伸步驟的溫度和時間長度。PCR或循環測序反應的溫度一般由類似或相同的較短溫度設定的10到60個重複組成;這些較短的設定通常各可確定為一種二步驟或三步驟循環。選擇溫度設定系根據本領域技術人員已知的各種考慮,參見例如Innis等,同上。在本文所述的長PCR反應中,獲得5kb或更長的擴增產物所需的延伸時間比常規聚合酶混合物要少。
PCR的「敏感性」指擴增低濃度存在的靶核酸的能力。「低濃度」指核酸樣品中待擴增的靶序列每微升有104個,通常是103、102、101個或更低。
如本文所用,術語「聚合酶引物/模板結合特異性」指Sso7融合聚合酶區分正確匹配的引物/模板與錯配的引物/模板的能力。在本文中,「提高聚合酶引物/模板結合特異性」指本發明的Sso7變異性融合聚合酶區分匹配的引物/模板的能力,比含SEQ ID NO2的野生型Sso7聚合酶融合蛋白提高。
「模板」指一種雙鏈多核苷酸序列,其包含待擴增的側接有引物雜交位點的多核苷酸。因此,「靶模板」包括側接有5』引物和3』引物雜交位點的的靶多核苷酸序列。
「改善的聚合酶」包括連接有聚合酶或聚合酶結構域的一種序列非特異性雙鏈DNA結合域。「未改善的聚合酶」或「未修飾的聚合酶」是沒有序列非特異性雙鏈DNA結合域的聚合酶。
術語「多肽」、「肽」和「蛋白質」本文可互換使用指一種胺基酸殘基的聚合物。這些術語所應用的胺基酸聚合物中,有1個或多個胺基酸殘基是對應天然產生胺基酸的人工化學模擬物,該術語也用於天然產生的胺基酸聚合物和非天然產生的胺基酸聚合物。
術語「胺基酸」指天然產生的和合成的胺基酸以及作用方式類似於天然產生胺基酸的胺基酸類似物和胺基酸模擬物。天然產生的胺基酸是由遺傳密碼編碼的胺基酸以及後來經過修飾的胺基酸,例如羥基脯氨酸、γ-羥基穀氨酸和O-磷酸絲氨酸。胺基酸類似物指基本化學結構,即結合氫的α碳、羧基、氨基和R基團與天然產生胺基酸相同的化合物,例如高絲氨酸、正亮氨酸、甲硫氨酸亞碸、甲硫氨酸甲鋶。這種類似物含有修飾的R基團(如正亮氨酸)或修飾的肽主鏈,但保留了與天然產生胺基酸相同的基本化學結構。胺基酸模擬物指結構不同於胺基酸一般化學結構,但作用方式類似於天然產生胺基酸的化合物。
本文中胺基酸可由它們通用的已知三字母符號表示或由IUPAC-IUB生物化學命名委員會推薦的一字母符號表示。同樣,核苷酸可由它們普遍接受的單字母碼表示。
「保守性修飾的變體」可用於胺基酸和核酸序列。關於特定核酸序列,保守性修飾的變體指編碼相同或基本相同胺基酸序列的核酸。由於遺傳密碼子的簡併性,許多功能相同的核酸可編碼一種給定的蛋白。例如,密碼子GCA、GCC、GCG和GCU都編碼胺基酸丙氨酸。因此,在某密碼子指定丙氨酸的每個位點,可將其密碼子變成所述任一相應的密碼子而不會改變編碼的多肽。這種核酸變異是「沉默變異」,它們是保守性修飾變異的一種種類。本文編碼某多肽的每個核酸序列也描述了該核酸的每個可能的沉默變異。技術人員知道可修飾核酸中的各密碼子(除了甲硫氨酸通常只有一個密碼子AUG和色氨酸通常只有一個密碼子TGG)以產生功能相同的分子。因此,在各所述序列中指出了編碼某多肽的核酸的各種沉默性變異。
關於胺基酸序列,技術人員知道可在核酸、肽、多肽或蛋白序列中進行單個取代、缺失或添加而改變、在編碼序列中加入或缺失單個胺基酸或小百分比胺基酸,是一種「保守性修飾的變體」,其中這種改變導致某胺基酸被化學性質類似的胺基酸所取代。提供功能類似胺基酸的保守性取代表是本領域熟知的。這種保守性修飾的變體除外或不包括本發明的多態性變體、種間同源物和等位基因。
例如,可進行以下取代,其中脂肪族胺基酸(G、A、I、L或V)用該組的另一個成員取代。類似的,脂肪族極性-不帶電基團的胺基酸如C、S、T、M、N或Q可用該另一個成員取代;鹼性胺基酸殘基如K、R或H可彼此取代。在一些實施方案中,含酸性側鏈的胺基酸E或D可分別用其不帶電的對應物Q或N取代;反之亦然。下列8組各包含彼此可保守性取代的其它示範胺基酸
1)丙氨酸(A),甘氨酸(G);2)天冬氨酸(D),穀氨酸(E);3)天冬醯胺(N),穀氨醯胺(Q);4)精氨酸(R),賴氨酸(K);5)異亮氨酸(I),亮氨酸(L),甲硫氨酸(M),纈氨酸(V);6)苯丙氨酸(F),酪氨酸(Y),色氨酸(W);7)絲氨酸(S),蘇氨酸(T);8)半胱氨酸(C),甲硫氨酸(M)(參見例如Creighton,《蛋白》(Proteins)(1984))。
引言本發明提供的變異性Sso7聚合酶偶聯物,與野生型Sso7融合聚合酶相比,表現出調整的加工能力和/或增加的特異性。這些聚合酶反應與未修飾的聚合酶或野生型Sso7融合聚合酶相比,通常更有效且產生更多產物。該變異性融合聚合酶包含有與Sso7結合域相連的聚合酶結構域。Sso7結合域包含的Sso7中表面位點的胺基酸被取代成在已知野生型Sso7中該位點所沒有的胺基酸。
本領域技術人員知道可將能調節加工能力的取代引入某聚合酶的核酸結合域中,該聚合酶包含Sso7以外的一種異源性序列非特異性雙鏈核酸結合域。例如,可將1種或多種取代引入某嵌合性聚合酶的DNA結合域的特定位點(如能與DNA相互作用的位點)中,該嵌合性聚合酶含有與該聚合酶結構域相融合的序列非特異性螺旋-髮夾-螺旋(HhH)結合域(例如Pavlov等,Proc.Natl.Acad.Sci.USA 9913510-13515,2002)。
聚合酶DNA聚合酶是本領域技術人員熟知的。它們包括DNA依賴性聚合酶和RNA依賴性聚合酶如逆轉錄酶。已知至少有5個DNA依賴性DNA聚合酶家族,儘管大部分屬於家族A、B和C。不同家族間的結構或序列相似性很小或沒有。大部分家族A聚合酶是單鏈蛋白質,能含有多種酶功能,包括聚合酶、3』到5』核酸外切酶活性和5』到3』核酸外切酶活性。家族B聚合酶通常含有一種催化結構域,與聚合酶和3』到5』核酸外切酶活性以及輔助因子。家族C聚合酶一般是具有聚合作用和3』到5』核酸外切酶活性的多亞基蛋白質。在大腸桿菌(E.coli)中,發現了3種DNA聚合酶DNA聚合酶I(家族A)、II(家族B)和III(家族C)。在真核細胞中,有3種不同的家族B聚合酶DNA聚合酶α、δ和ε參與核複製,和家族A聚合酶,聚合酶γ用於線粒體DNA複製。其它類型的DNA聚合酶包括噬菌體聚合酶。
類似的,RNA聚合酶通常包括真核RNA聚合酶I、II、III和細菌RNA聚合酶以及噬菌體和病毒聚合酶。RNA聚合酶可以是DNA依賴性和RNA依賴性。
在具體實施方案中,將Taq聚合酶結構域摻入到該融合蛋白中。在具體的聚合酶變體中如Δtaq它是標準Taq DNA聚合酶的遺傳修飾形式,缺乏5』到3』核酸外切酶活性(Lawyer等,J Biol Chem 2646427-6437(1989)),常用於構建本發明的融合的聚合酶。也可採用其它的家族A聚合酶,它們的作用類似於Taq,例如與Taq聚合酶有約90%相似性的Thermus brockianus聚合酶,以及黃色棲熱菌(Thermus flavus)聚合酶和具有逆轉錄酶活性的嗜熱棲熱菌聚合酶。另外,嗜熱性較差的聚合酶如來自嗜熱脂肪芽孢桿菌(Bacillus stearothermophilus)的家族A聚合酶可能證明有用,嗜溫聚合酶如大腸桿菌Pol I和其缺失衍生物也如此。
家族B聚合酶如火球菌聚合酶例如Pfu聚合酶,也可用作與取代的Sso7結構域相融合的聚合酶結構域。
可用本領域技術人員熟知的試驗測定聚合酶的活性。例如,測定酶的加工活性如聚合酶活性,可通過測定反應如聚合酶鏈式反應中合成的核酸量而進行。測定酶的相對效率時可將採用含序列非特異性雙鏈DNA結合域的聚合酶獲得的產物量,與用正常聚合酶所得產物量作比較,這在下文和實施例中有更詳細描述。
適用於本發明的聚合酶結構域可以是酶本身或催化結構域,例如Taq聚合酶或具有聚合酶活性的Taq結構域。催化結構域可包括額外的胺基酸和/或可以是含胺基酸取代、缺失或添加的變體,但仍保留酶活性。
Sso7蛋白本發明的聚合酶包含在表面殘基位點有胺基酸取代的Sso7多肽序列。Sso7d是一種小的(63個胺基酸,約7000kd MW)、鹼性染色性蛋白質,來自嗜高熱古細菌硫磺礦硫化葉菌(Sulfolobus solfataricus)。此蛋白富含賴氨酸-具有高溫、酸和化學穩定性。它以序列非依賴性方式結合DNA,結合時在一些條件下能提高DNA的TM高至40℃(McAfee等,Biochemistry3410063-10077,1995)。通常認為,Sso7d和其同源物在升高溫度時參與包裝基因組DNA和穩定基因組DNA。該蛋白的序列列於SEQ ID NO2。
已有幾種已知的Sso7d樣蛋白(也稱為Sso7蛋白),包括但不限於Sso7a、Sso7b、Sso7d和Sso7e來自嗜高熱古細菌嗜酸熱硫化葉菌(S.acidocaldarius);Ssh7a和Ssh7b來自芝田硫化葉菌(Sulfolobus shibatae)。這些蛋白與Sso7d的相同性範圍為78%-98%。其它用於本發明的Sso7結構域也可如下所述鑑定。
Sso7蛋白的表面殘基位點可參比SEQ ID NO2所列Sso7d序列來確定。表面殘基是暴露於蛋白表面,能與DNA雙螺旋鹼基相互作用的殘基。這些殘基系通過Sso7d的結構研究所鑑定(參見例如Gao等,Nature Struct.Biol.5782-786,1998)。SEQ ID NO2的表面胺基酸Trp24、Val26、Met29、Ser31、Arg43和Ala45是表面殘基,通常在本發明的融合性聚合酶中已被取代。應理解這種位點指定本身不表示本發明權利要求分子的胺基酸編號,但表示當將權利要求分子的序列與SEQID NO2進行最大程度排列對比時權利要求分子中的殘基。排列對比可用手工進行或利用下述比較算法。例如,取代的Sso7蛋白在SEQ ID NO4中所列融合性聚合酶序列的N末端具有取代天然色氨酸殘基的甘氨酸。此取代發生在SEQ IDNO4的第29個胺基酸殘基處。然而,參比SEQ ID NO2,該取代發生在Trp24位點。根據所述排列對比,下列殘基通常存在於野生型Sso7蛋白的表面位點24-Trp;26-Val;29-Met;43-Arg和45-Ala。
排列對比Sso7蛋白Sac7e與SEQ ID NO2和鑑定表面殘基位點的例子見圖2。用NCBI BLAST程序和默認參數獲得對比結果(參見例如Altschul等,Nucl.AcidsRes.253389-3402,1997)。Sac7e與SEQ ID NO2有80%的相同性。在圖2中,沒有顯示位點1的Sso7d起始甲硫氨酸。因此,儘管Ala殘基在圖2中顯示為Sso7d序列的第1個殘基,但它對應於SEQ ID NO2的位點2。如上所指出,Sso7d的表面殘基位點24為Trp、位點26為Val、位點29為Met、位點31為Ser、位點43為Arg和位點45為Ala。當參比SEQ ID NO2來確定時,Sac7e的相應表面殘基是位點24為Trp(Sac7e序列中編號23的殘基);位點26為Val(Sac7e序列中編號25的殘基);位點29為Met(Sac7e序列編號28的殘基);位點31為Ser(Sac7e序列編號30的殘基);位點43為Arg(Sac7e序列編號41的殘基)和位點45為Ala(Sac7e序列編號43的殘基)。
由於這些殘基的側鏈能與小溝槽中的鹼基直接相互作用,可利用將這些殘基變成野生型胺基酸以外的殘基來修改與DNA相互作用的強度,而不破壞Sso7結構域的結構、降低其熱穩定性或大幅降低該結構域在本發明中發揮作用的能力。此外,一組表面殘基Trp24、Val26、Met29和Ala45能與DNA螺旋扭結的位點相互作用。因此,可利用這些位點之一的突變來減少Sso7結構域對含扭結位點附近錯配的DNA的親和性。
表面殘基可用多種胺基酸殘基取代。通常,取代用的殘基是任何其它天然產生Sso7蛋白中該位點所沒有的殘基。通常該取代殘基佔據的體積比天然序列中的胺基酸殘基小。例如,色氨酸側鏈佔據了天然產生胺基酸的最大體積。因此,可用更小的胺基酸取代色氨酸,具體是這些殘基是佔據更少空間的殘基如丙氨酸、甘氨酸或纈氨酸。此外,通常應避免引入主要結構變化到多肽中的殘基如脯氨酸或能引入這種變化的殘基如半胱氨酸作為表面取代殘基。
取代胺基酸時,也要考慮電荷和疏水性。Sso7d表面是高度鹼性的,含2個精氨酸和14個賴氨酸。例如,需要選擇中性或弱正電荷的胺基酸殘基。將任何表面胺基酸變成強酸性的Glu或Asp,預計不能產生功能性蛋白質。
因此,表面殘基通常用Ala、Gly、His、Iso、Leu、Met、Phe、Set、Thr、Tyr、Asn、Gln、Cys或Val取代。此外,選擇插入本發明融合性多肽以取代所需表面殘基的胺基酸,常常是在天然產生的Sso7多肽該表面殘基位點中沒有的殘基。根據同源性鑑定其它Sso7結構域用於本發明的其它適合Sso7DNA結合域可根據它們與Sso7d的序列同源性作鑑定。一般,本發明中可採用與已知的序列非特異性雙鏈核酸結合蛋白有約60%胺基酸序列相同性,任選約70%、75、80、85、90或95-98%胺基酸序列相同性的結構域,比較窗口約為30個胺基酸,任選約50-70個胺基酸,或整個蛋白的全長。在比較窗口中,或在指定區域中比較並排列對比序列的最大對應性,如用下列序列比較算法之一或用手工排列對比和目視檢查測量。對於本專利的目的,用BLAST默認參數確定胺基酸相同性百分比。
為了序列比較,通常一種序列作為參比序列,將測試序列與之比較。當使用序列比較算法時,將測試和參比序列輸入計算機,如果需要,指定亞序列坐標,並指定序列算法程序參數。可使用默認程序參數,或可指定另外的參數。序列比較算法以程序參數為基礎隨後計算測試序列相對於參比序列的序列相同性百分比。
比較窗口包括涉及連任何一種數目毗位點的區段,該毗連位點數目選自20-600,通常約50-200,更常約100-150,其中可在二序列最佳排列後將一序列與毗連位點數目相同的參比序列作比較。於排列比較序列的方法是本領域熟知的。例如可通過SmithWaterman,Adv.Appl.Math.2482(1981)的局部同源性算法、NeedlemanWunsch,J.Mol.Biol.48443(1970)的同源性排列算法、PearsonLipman,Proc.Natl.Acad.Sci.USA 852444(1988)的相似性搜索方法、用計算機執行這些算法(Wisconsin遺傳學軟體包中的GAP、BESTFIT、FASTA和TFASTA,Genetics Computer Group,575Science Dr.,Madison,WI)或通過手工排列和目視檢查(參見例如《分子生物學的當前程序》(Current Protocols in MolecularBiology)(Ausubel等編輯.1995增刊))來進行序列的最佳排列對比。
適合測定序列相同性和序列相似性百分比的算法例子是BLAST和BLAST 2.0算法,它們分別描述於Altschul等,Nuc.Acids Res.253389-3402(1977)和Altschul等,J.Mol.Biol.215403-410(1990)中。進行BLAST分析的軟體可通過生物技術信息國家中心公開獲得(http//www.ncbi.nlm.nih.gov/)。此算法包括通過鑑定查詢序列中長度為W的短字(short words),與資料庫序列中的相同長度字排列對比時,它們是否匹配或滿足一些正域值分數T來首先鑑定高評分序列對(HSPs)。T稱為鄰近字的評分域值(Altschul等,同上)。這些初始鄰近字的命中可作為種子,起動搜索以發現含有它們的更長HSPs。將字命中以2個方向沿著各序列延伸,直到累積排列對比評分可能增加。計算核苷酸序列的累積評分,採用參數M(匹配殘基對的獎賞分;總是>0)和N(錯配殘基對的罰分;總是<0)。對於胺基酸序列,利用評分矩陣來計算累積評分。當累積排列評分從其達到的最大值下降數量x時;由於累積了1個或多個負記分殘基排列對比,或到達任一序列末端,該累積評分降到零或之下;各方向的字命中延伸暫停。BLAST算法參數W、T和X決定了排列對此的敏感性和速度。BLASTN程序(用於核苷酸序列)使用默認值的字長(W)為11,期望值(E)為10,M=5,N=-4並比較2條鏈。對於胺基酸序列,BLASTP程序使用默認值的字長為3,期望值(E)為10,BLOSUM62評分矩陣(參見HenikoffHenikoff,Proc.Natl.Acad.Sci.USA 8910915(1989))的默認值字長(B)為50,期望值(E)為10,M=5,N=-4並比較2條鏈。
BLAST算法也進行2條序列間相似性的統計學分析(參見例如KarlinAltschul,Proc.Natl.Acad.Sci.USA 905873-5787(1993))。BLAST算法提供的一種相似性測量是最小總和概率(P(N)),它表示2條核苷酸或胺基酸序列之間偶然出現匹配的概率。例如,如果在測試核酸與參比核酸的比較中最小總和概率小於約0.2,更優選小於約0.01,最優選小於約0.001時,認為測試核酸與參比序列相似。
根據對Sso7特異性抗體的交叉反應結合鑑定Sso7蛋白用於本發明的Sso7DNA蛋白也可通過交叉反應性鑑定,該鑑定採用的抗體優選能結合已知Sso7結合域多克隆抗體。多克隆抗體可用本領域普通技術人員熟知的方法產生(參見例如Coligan,《免疫學的當前操作》(Current Protocols inImmunology)(1991);HarlowLane,《抗體,實驗室手冊》(Antibodies,A LaboratoryManual)(1988))。這些蛋白是免疫交叉反應性結合蛋白,可通過多種試驗方法檢測。對於可使用的多種模式和條件的描述,參見例如《細胞生物學方法細胞生物學中的抗體》(Methods in Cell BiologyAntibodies in Cell Biology),37卷(Asai編輯,1993),Coligan,同上和HarlowLane,同上。
有用的免疫試驗模式包括樣品蛋白被固定於固體支持物上的試驗。例如,交叉反應性結合蛋白可用免疫印跡分析,如蛋白質印跡鑑定。蛋白質印跡技術一般包括凝膠電泳根據分子量分離樣品蛋白,將分離的蛋白轉移至適當的固體支持物(如硝酸纖維素濾膜、尼龍濾膜或衍生的尼龍濾膜)上,用能結合該序列非特異性雙鏈核酸結合域的抗體孵育樣品。該抗體能特異性結合固體支持物上交叉反應性多肽。該抗體可直接標記或隨後另外用標記能特異性結合抗結合域抗體的的抗體(如標記的羊抗小鼠抗體)檢測。其它免疫印跡試驗如重組蛋白質文庫分析也可用於鑑定適用於本發明的蛋白質。
在指定的免疫試驗條件下用此方法,可能鑑定到免疫交叉反應性蛋白質,此蛋白能結合特定抗體,至少是背景的2倍或更高,通常是背景的10倍以上,同時基本上不顯著結合樣品中存在的其它蛋白。
競爭性結合模式的免疫試驗也能用於確定交叉反應性。例如,產生針對已知的Sso7結構域如Sso7d的多克隆抗血清。然後可將靶抗原固定於固體支持物。在此試驗中加入交叉反應性極小(如果存在)的非靶抗原可改進血清的選擇性。將所加入蛋白與固定蛋白競爭與抗血清結合的能力,與Sso7蛋白本身的競爭能力相比較。採用標準算法計算出上述蛋白質的交叉反應性百分比。選擇與加入蛋白交叉反應性小於10%的那些抗血清並合併。也可從合併的抗血清中去除與非靶抗原起交叉反應的抗體,方法是用非靶抗原作免疫吸收。用此方法也可製成能特異性結合本發明特定核酸結合域的抗體。
然後將免疫吸收和合併的抗血清用於上述競爭性結合免疫試驗以比較第2種蛋白與免疫原蛋白,這第2種蛋白也許是已知Sso7結合域的等位基因、多態變體或同源物,例如另一種動物的同源物。為進行這種比較,分別測試廣泛濃度範圍的2種蛋白,確定各蛋白抑制抗血清與固定蛋白發生50%結合所需的量。如果抑制50%結合所需的第2種蛋白量比抑制50%結合所需的核酸結合域蛋白的量小10倍,則認為第2種蛋白能特異性結合產生的針對Sso7d免疫原的多克隆抗體。
該序列非特異性雙鏈核酸結合域的活性可用多種上述試驗評估,例如見WO0192501中所述。在本發明中,Sso7結構域至少有1個表面殘基被取代。當其連接於聚合酶時,該取代的Sso7結構域表現出加工能力的調整和/或引物/模板結合特異性的增強。本發明的Sso7偶聯聚合酶可用本領域熟知的試驗鑑定,這些試驗在本文中將進一步描述。
連接Sso7DNA結合域與聚合酶本發明偶聯蛋白質的Sso7DNA結合域和聚合酶結構域如Sso7d和Taq聚合酶,可用本領域技術人員熟知的方法相連接。這些方法包括化學和重組方法。
連接Sso7蛋白和聚合酶的化學方法描述見例如《生物偶聯技術》(BioconjugateTechniques),Hermanson編輯.,Academic Press(1996)。它們包括通過蛋白質化學領域熟知的方法例如衍生法使2種蛋白或直接或經接頭化合物彼此連接。例如,在一個化學偶聯實施方案中,連接催化結構域與核酸結合域的方法,包括採用異雙功能-偶聯試劑,此試劑最終能在兩部分之間形成分子間二硫鍵。描述了用於在本發明此種能力的其它種類偶聯試劑,例如美國專利4,545,985中所述。另外,各部分的天然產生或通過遺傳工程插入的半胱氨酸之間易形成分子間二硫鍵。連接兩部分的方法也可用異雙功能交聯試劑之間的硫醚鍵或特定低pH可切割的交聯接頭或特定蛋白酶可切割的接頭或其它可切割或不能切割的連接鍵。
連接Sso7與該偶聯蛋白的聚合酶結構域的方法也可包括在用標準肽合成化學或重組方法分別合成的兩部分之間形成肽鍵,偶聯蛋白質本身也可用化學方法產生,用於合成完整或部分胺基酸序列。例如,可用固相技術,如Merrifield的固相合成方法來合成肽,此方法中將胺基酸依次加到增長的胺基酸鏈上(參見Merrifield(1963)J.Am.Chem.Soc.,852149-2146)。自動合成多肽的設備可從供應商處購買到,如PE公司(Foster City,CA),一般可根據廠商說明書操作。隨後將合成的肽從樹脂上切下來並純化,如通過製備性高效液相層析純化(參見Creighton,《蛋白結構和分子原理》(Proteins Structures and Molecular Principles),50-60(1983))。合成多肽或多肽亞片段的組成可通過胺基酸分析或測序驗證(例如埃德曼降解方法;參見Creighton,《蛋白結構和分子原理》,34-49頁(1983))。
另外,可將非經典胺基酸或化學胺基酸類似物引入該序列作為取代或添加殘基。非經典胺基酸包括但不限於普通胺基酸的D-異構體、α-氨基異丁酸、4-氨基丁酸、Abu、2-氨基丁酸、γ-Abu、ε-Ahx、6-氨基己酸、Aib、2-氨基異丁酸、3-氨基丙酸、鳥氨酸、正亮氨酸、正纈氨酸、羥基-脯氨酸、肌氨酸、瓜氨酸、半胱磺酸、t-丁基甘氨酸、t-丁基丙氨酸、苯基甘氨酸、環己基丙氨酸、β-丙氨酸、氟-胺基酸、設計的胺基酸如β-甲基胺基酸、Cα-甲基胺基酸、Nα-甲基胺基酸和大體上的胺基酸類似物。此外,胺基酸可以是D(右旋)或L(左旋)。
在另一個實施方案中,Sso7和聚合酶結構域經一連接基團相連接。該連接基團可以是化學交聯劑,包括例如琥珀醯亞胺基-(N-馬來醯亞胺甲基)-環己烷-1-羧酸酯(SMCC)。該連接基團也可以是其它胺基酸序列,包括例如聚丙氨酸、聚甘氨酸或類似的連接基團。
在一個特定實施方案中,該融合蛋白中各多肽的編碼序列在其氨基-或羧基-末端直接經肽鍵以任何順序連接。或者,可利用胺基酸接頭序列將第1和第2種多肽成分分開足夠的距離以確保各多肽能摺疊成其二級和三級結構。將這種胺基酸接頭序列加入該融合蛋白中,所用的標準技術是本領域熟知的。適當的肽接頭序列可根據下列因素選擇(1)它們能採取可彎曲延伸的構象;(2)它們不會採取可能與第1和第2種多肽上的功能性抗原表位相互作用的二級結構;(3)缺乏可能與該多肽功能性抗原表位反應的疏水或帶電殘基。典型的肽接頭序列包含Gly、Ser、Val和Thr殘基。該接頭序列中也可用其它近中性的胺基酸如Ala。可用作接頭的胺基酸序列包括Maratea等(1985)Gene 4039-46;Murphy等(1986)Proc.Natl.Acad.Sci.USA 838258-8262;美國專利號4,935,233和4,751,180中所示的序列。接頭序列一般長1到約50個胺基酸,如長3、4、6或10個胺基酸,但可以是100或200個胺基酸長度。當第1和第2種多肽含有可用於分隔功能性結構域和防止空間位阻幹擾的非必需N末端胺基酸區域時,可能不需要接頭序列。
其它化學接頭包括碳水化合物接頭、脂類接頭、脂肪酸接頭、聚醚接頭如PEG等。例如,聚(乙二醇)接頭可獲自Shearwater Polymers,Inc.Huntsville,Alabama。這些接頭任選含有醯胺鍵、巰鍵或異雙功能鍵。
其它連接Sso7和聚合酶結構域的方法包括通過表達的負電荷和正電荷尾部的離子結合,以及通過抗體和鏈黴親和素-生物素相互作用的間接結合(參見例如《生物偶聯技術》,同上)也可將結構域通過中間的相互作用序列連接在一起。例如,可將Sso7d-相互作用序列(即結合Sso7d的序列)連接於聚合酶。所得融合蛋白隨後可能與Sso7d非共價結合產生Sso7d-聚合酶偶聯物。
用重組技術產生融合蛋白在一個典型實施方案中,本發明的偶聯Sso7-聚合酶蛋白是通過重組表達編碼該蛋白的核酸而產生的,此技術在本領域中是標準的實施技術。可通過本領域已知方法使編碼所需胺基酸序列的適當核酸序列在合適的編碼框中彼此連接,並表達產物來製備這種融合產物。
可用重組遺傳學領域的常規技術獲得待摻入本發明融合蛋白的結構域的編碼核酸。說明本發明所用一般方法的基礎課本包括Sambrook和Russel,《分子克隆,實驗室手冊》(Molecular Cloning,A Laboratory Manual),(第3版,2001);Kriegler,《基因轉移和表達實驗室手冊》(Gene Transfer and ExpressionA LaboratoryManual)(1990);《分子生物學的當前程序》(Ausubel等編輯.1994-1999)。
編碼Sso7和聚合酶多肽的核酸序列可用多種方法之一獲得。在一些實施方案中,編碼該多肽的核酸序列可通過與探針雜交從cDNA和基因組DNA文庫中克隆,或採用寡核苷酸引物進行擴增技術分離得到。利用DNA或RNA模板擴增技術更常用於擴增和分離Sso7和聚合酶序列,(參見例如DieffenfachDveksler,《PCR引物實驗室手冊》(PCR PrimerA Laboratory Manual)(1995))。另外,可合成產生重疊的寡核苷酸並連接以產生1個或多個結構域。用抗體作為探針編碼催化性或雙鏈核酸結合域的核酸也可從表達文庫中分離得到。
在一個用PCR獲得編碼Sso7或聚合酶結構域的核酸的例子中,用PCR擴增該核酸序列或亞序列,採用了含有一個限制性位點的有義引物和含有另一個限制性位點的反義引物。這會生成編碼所需結構域序列或亞序列且含有末端限制性位點的核酸。然後不難將此核酸連入含編碼第2個結構域的核酸和具有適當的相應限制性位點的核酸中,可將該結構域直接連接或可通過一接頭或其它蛋白序列隔開。本領域技術人員可利用GenBank或其它來源提供的序列信息確定適當的PCR引物。也可將適當的限制性位點通過定點誘變加入編碼該蛋白或蛋白亞序列的核酸中。將含該結構域編碼核苷酸序列或亞序列的質粒用適當限制性核酸內切酶切割,然後連入合適的載體中用標準方法擴增和/或表達。
足以通過體外擴增方法指導技術人員的技術例子見Berger、Sambrook和Ausubel以及Mullis等,(1987)美國專利號4,683,202;《PCR操作方法和應用指南》(Innis等編輯)Academic Press Inc.San Diego,CA(1990)(Innis);ArnheimLevinson(1990年10月1日)CEN 36-47;The Journal Of NIH Research(1991)381-94;(Kwoh等(1989)Proc.Natl.Acad.Sci.USA 861173;Guatelli等(1990)Proc.Natl.Acad.Sci.USA 87,1874;Lomell等(1989)J.Clin.Chem.,351826;Landegren等,(1988)Science 2411077-1080;Van Brunt(1990)Biotechnology 8291-294;Wu和Wallace(1989)Gene 4560;Barringer等(1990)Gene 89117。
可將特定核酸表達的多肽的其它物理性質與Sso7多肽或聚合酶性質相比較,以提供另一種鑑定適當核酸的方法。
技術人員也知道可對Sso7和聚合酶結構域進行另外修飾而不減少其生物活性。可進行一些修飾以促進結構域的克隆、表達或摻入到融合蛋白中。這種修飾是本領域技術人員熟知的,包括例如在編碼該結合域的多核苷酸兩末端之一加入密碼子,例如在氨基末端加入甲硫氨酸提供起始位點,或在兩末端之一放置額外的胺基酸(如聚組氨酸),產生容易定位的限制性位點或終止密碼子或純化序列。
也可修飾1個或多個結構域以促進2個結構域的聯接,獲得編碼本發明融合多肽的多核苷酸。因此,通過這些方法修飾的Sso7和聚合酶結構域也是發明的一部分。例如,可將半胱氨酸殘基的密碼子置於結構域任一末端,使該結構域通過例如二硫鍵連接。可採用重組或化學方法進行這種修飾(參見例如Pierce化學公司目錄,Rockford IL)。
該重組融合蛋白的Sso7和聚合酶結構域常通過接頭結構域連接,常用的多肽序列包括如上所述的Gly、Ser、Ala和Val。在一些實施方案中,將脯氨酸殘基摻入該接頭以防止接頭形成顯著的二級結構元件。
在一些實施方案中,修飾編碼本發明蛋白質的重組核酸以提供優選密碼子,可提高此核酸在所選生物體中的翻譯(例如將酵母優選密碼子取代到編碼核酸中,用於酵母中的表達)。
用於表達該融合多肽的表達盒和宿主細胞有許多本領域普通技術人員已知的表達系統可產生該融合多肽(參見例如《基因表達系統》(Gene Expression Systems),Femandex和Hoeffler編輯,AcademicPress,1999;SambrookRussel,同上和Ausubel等,同上)。通常,將編碼該融合多肽的多核苷酸置於在所需宿主細胞中有功能的啟動子控制下。可購到極其多種的啟動子,可用於本發明的表達載體中,這取決於具體應用。選擇啟動子一般取決於該啟動子在宿主細胞中是否有活性。也可任選包括其它表達控制序列如核糖體結合位點、轉錄終止位點等。包括1種或多種這些控制序列的構建物稱為「表達盒」。因此,可摻入編碼該連接多肽的核酸以在所需宿主細胞中高水平表達。
適用於特定宿主細胞的表達控制序列常通過克隆可在該細胞中表達的基因來獲得。本文定義的常用原核控制序列包括用於轉錄起始的啟動子,任選含有操縱子,連同核糖體結合位點序列,包括常用啟動子如β-內醯胺酶(青黴素酶)和乳糖(lac)啟動子系統(Change等,Nature(1977)1981056)、色氨酸(trp)啟動子系統(Goeddel等,Nucleic Acids Res.(1980)84057)、tac啟動子(DeBoer等,Proc.Natl.Acad.Sci.U.S.A.(1983)8021-25);λ-衍生的PL啟動子和N-基因核糖體結合位點(Shimatake等,Nature(1981)292128)。具體的啟動子系統對本發明不是關鍵,可採用任何在原核生物中能發揮功能的可買到的啟動子。標準的細菌表達載體包括質粒如pBR322類質粒,例如pBLUESCRIPTTM、pSKF、pET23D、λ-噬菌體衍生的載體,以及融合表達系統如GST和LacZ。也可在重組蛋白中加入抗原表位標記以提供方便的分離方法,如c-myc、HA-標記、6-His(SEQ ID NO17)標記、麥芽糖結合蛋白、VSV-G標記、抗DYKDDDDK(SEQ ID NO18)標記或任何這類標記,許多這些標記是本領域技術人員熟知的。
為在在大腸桿菌以外的原核細胞中表達融合多肽,需要在具體原核生物種類中能發揮功能的啟動子。這種啟動子可獲自從這些種類生物克隆的基因,或可採用異源啟動子。例如,除了大腸桿菌外,雜合trp-lac啟動子在桿菌(Bacillus)中也能發揮功能。這些和其它適當的細菌啟動子是本領域熟知的並在例如Sambrook等和Ausubel等文章中有所描述。用於表達本發明蛋白質的細菌表達系統可在例如大腸桿菌、芽胞桿菌屬和沙門菌(Salmonella)中(Pavla等,Gene 22229-235(1983);Mosbach等,Nature 302543-545(1983))得到。這種表達系統的試劑盒可商業購買到。
用於哺乳動物細胞、酵母和昆蟲細胞的真核表達系統是本領域熟知的且可商業購買到。在酵母中,載體包括酵母整合質粒(如Yip5)和酵母複製質粒(Yrp毓質粒)和pGPD-2。含有真核病毒調節元件的表達載體通常用於真核表達系統,例如SV40載體、乳突瘤病毒載體和獲自EB病毒的載體。其它示範性真核載體包括pMSG、pAV009/A+、pMTO10/A+、pMAMneo-5、杆狀病毒pDSVE和任何其它能表達蛋白的載體,表達是在CMV啟動子、SV40早期啟動子、SV40晚期啟動子、金屬硫蛋白啟動子、小鼠乳房腫瘤病毒啟動子、羅氏肉瘤病毒啟動子、多角體蛋白啟動子或其它顯示對真核細胞中表達有效的啟動子的指導下。
可將組成型或調節啟動子用於本發明。調節啟動子可能有優點,因為宿主細胞可在誘導該融合多肽表達前生長到高密度。在一些情況中,高水平表達異源蛋白會減緩細胞生長。可誘導性啟動子是能指導基因表達的啟動子,其中表達水平可因環境或發育因素而改變,例如溫度、pH、厭氧或需氧條件、光、轉錄因子和化學物質。
對於大腸桿菌和其它細菌宿主細胞,可誘導性啟動子是本領域技術人員已知的。它們包括例如lac啟動子、噬菌體λPL啟動子、雜合trp-lac啟動子(Amann等(1983)Gene 25167;de Boer等(1983)Proc.Natl.Acad.Sci.U.S.A.8021)、和噬菌體T7啟動子(Studier等(1986)J.Mol.Biol.;Tabor等(1985)Proc.Natl.Acad.Sci.U.S.A.821074-8)。這些啟動子和它們的兇Sambrook等,(同上)所述。
其它生物的可誘導性啟動子也是本領域技術人員熟知的。它們包括例如金屬硫蛋白啟動子、熱激啟動子以及許多其它啟動子。
可利用翻譯偶聯來提高表達。此策略採用短的上遊開放讀框和核糖體結合位點,開放讀框衍生自該翻譯系統的天然高表達基因,置於該啟動子下遊,而核糖體結合位點後幾個胺基酸密碼子之後跟隨著終止密碼子。就在終止密碼子之前是第2個核糖體結合位點,終止密碼子之後是翻譯起始的啟動密碼子。該系統融合了RNA中的二級結構,可有效啟動翻譯。參見Squires等(1988),J.Biol.Chem.26316297-16302。
構成多核苷酸構建物一般需要使用能在細菌中複製的載體。這種載體是本領域普遍使用的。有許多的試劑盒可商業購買到,用於從細菌中純化質粒(例如EasyPrepJ、FlexiPrepJ,產自Pharmacia Biotech;StrataCleanJ產自Stratagene;和QIAexpress表達系統,(Qiagen)。隨後可進一步操作分離和純化的質粒以產生其它質粒用於轉化細胞。
該融合多肽可在細胞內表達,或可從細胞中分泌。胞內表達通常產量高。如果需要,可溶性的活性多肽的量可通過再重疊過程而增加(參見例如Sambrook等,同上;Marston等,Bio/Technology(1984)2800;Schoner等,Bio/Technology(1985)3151)。本發明的融合多肽可在多種宿主細胞中表達,包括大腸桿菌、其它細菌宿主、酵母、多種高等真核細胞如COS、CHO和HeLa細胞系及骨髓瘤細胞系。宿主細胞可以是哺乳動物細胞、昆蟲細胞或微生物,例如酵母細胞、細菌細胞或真菌細胞。
一旦表達,該重組融合多肽可根據本領域的標準程序純化,包括硫酸銨沉澱、親和柱、柱層析、凝膠電泳等(一般參見R.Scopes,《蛋白純化》(ProteinPurification),Springer-Verlag,N.Y.(1982),Deutscher,《酶學方法182卷蛋白純化指南》((Methods in Enzymology Vol.182Guide to Protein Purification),AcademicPress,Inc.N.Y.(1990))。優選至少約90-95%均一性的充分純化組合物,最優選98-99%或更高均一性。一旦部分純化後或達到所需的均一性,隨後可使用此多肽(如作為免疫原用於產生抗體)。
為促進本發明融合蛋白的純化,編碼該融合多肽的核酸也可包含親和結合試劑可利用的抗原表位或「標記」的編碼序列。適當抗原表位的例子包括myc和V-5報告基因;用於重組產生含有這些抗原表位的融合多肽的表達載體可商業購買到(例如Invitrogen(Carlsbad CA)載體pcDNA3.1/Myc-His和pcDNA3.1/V5-His適於在哺乳動物細胞中表達)。適於將標記附著於本發明融合蛋白的其它表達載體和相應的檢測系統是本領域技術人員已知的,一些可商業購買到(例如FLAG」(Kodak,Rochester NY)。另一個適當標記的例子是聚組氨酸序列,它能結合金屬螯合親和配基。通常,使用6個毗連的組氨酸,儘管可採用多於或小於6個。可用作聚組氨酸結合部分的適當金屬螯合親和配基,包括次氮基三乙酸(NTA)(Hochuli,E.(1990)「用金屬螯合吸收劑純化重組蛋白」(Purification of recombinant proteinswith metal chelating absorbents),《遺傳工程原理和方法》(Genetic EnginereringPrinciples and Methods),J.K.Setlow編輯,Plenum Press,NY;可從Qiagen(SantaClarita,CA)商業購買到)。
將突變引入Sso7序列中本發明的Sso7序列包含表面殘基的取代。技術人員知道有許多產生這些改變或給定核酸序列變體的方法。這種熟知的方法包括定點誘變、利用簡併寡核苷酸的PCR擴增、化學合成所需寡核苷酸(例如結合連接和/或克隆以產生大核酸)和其它熟知的技術。參見GilimanSmith,Gene 881-97(1979),Roberts等,Nature328731-734(1987)和Sambrook,Innis和Ausubel(都同上)。
在一個產生本發明Sso7序列的例子中,用定點誘變使胺基酸殘基取代表面殘基。通過合成含突變的寡核苷酸引物取代該核酸序列。該引物能與Sso7核酸如SEQID NO1雜交;擴增新序列。然後將含該突變的擴增產物連入表達載體中。
多肽序列最常如上改變,即通過改變對應的核酸序列和表達多肽。然而,多肽序列也可用商業購買的肽合成儀合成產生,用於產生所需多肽(參見Merrifield和StewartYoung,同上)。
最後,評估該取代的Sso7序列,可採用如下所述的技術來鑑定該融合性聚合酶,是否顯示出引物/模板識別特異性增加和/或加工能力相對於未修飾聚合酶有所增強。取代的融合蛋白的加工能力通常小於野生型Sso7融合聚合酶。
調節聚合酶活性本發明的融合性聚合酶表現出活性調整,包括加工能力相對未修飾聚合酶增強和引物/模板結合特異性改進。這些活性可用本領域標準技術測量。
本發明的融合性聚合酶常表現出引物/模板特異性比含野生型Sso7序列如SEQ ID NO2的融合性聚合酶有所增加。引物/模板特異性是酶區分匹配的引物/模板雙螺旋與錯配的引物/模板雙螺旋的能力。例如可通過比較2種反應的相對產量,1種使用匹配引物,1種使用錯配引物來測定特異性。區分能力增加的酶用匹配引物的產量高於用錯配引物,即利用匹配引物的反應相對用錯配引物的反應的產量比率約為1或以上。後能可將此比率採用含野生型Sso7結構域的融合性聚合酶的平行組的反應所得產量相比較。本發明的融合蛋白相對於野生型融合聚合酶顯示該比率一般增加至少2倍,通常3倍或更高。
特異性也可用例如實時PCR測量,此PCR中可利用完全互補的引物/模板和錯配引物/模板之間的Ct(循域)值(ΔCt)差異來測量不同酶的引物/模板結合特異性。Ct值代表產生可檢測量DNA所需的循環次數(『可檢測』的DNA量一般高於背景2X,通常5X、10X、100x或更高)。特異性提高的聚合酶能在較少循環次數中產生可檢測的DNA量,更密切接近PCR的理論上最高擴增效率。
聚合酶的加工能力可用本領域普通技術人員已知的多種方法測量。聚合酶加工能力一般定義為在修飾酶的在一次結合中所能摻入匹配模板的核苷酸數量。例如,5』FAM-標記的引物退火結合環狀或線性ssM13mp18DNA形成引導模板(primed template)。在測量加工能力時,引導模板常以顯著超過存在的聚合酶摩爾量,從而最大程度減少了引導模板被聚合酶延伸1次以上的機會。然後在存在緩衝液和dNTPs時將該引導模板與聚合酶以比例如4000∶1(引導的DNA∶DNA聚合酶)混合。加入MgCl2以啟動DNA合成。啟動後不同時間樣品淬滅,在測序凝膠上分析。然後將本發明蛋白質,即含有與聚合酶催化結構域相融合的取代的Sso7核酸結合域的取代的融合聚合酶的加工能力,與無此結合域的酶(未修飾聚合酶)和含野生型Sso7序列的融合性聚合酶的加工能力相比較。本發明的取代的融合性聚合酶顯示其加工能力,比未修飾的聚合酶有所增強,但通常加工能力比野生型Sso7融合性聚合酶減少。
效率的提高也可通過測量酶生成產物的能力增加來證明。這種分析通過測定反應所得產物的量,間接測量該雙鏈核酸雙螺旋的穩定性。例如,可用PCR試驗測量所得PCR產物的量,用短的如12個核苷酸長度的引物,在提高的溫度如50℃下退火。在此分析中,效率提高是通過在PCR反應中採用12個核苷酸的引物50℃退火當其連接於取代的Sso7d序列時相較未修飾聚合酶可產生更多產物的能力來顯示。
可採用長PCR作為證明效率提高的另一種方法。例如,與相對效率更低的酶比較,效率提高的酶一般在較短延伸時間內能擴增長的擴增子(>5kb)。
也可採用例如鹽敏感性試驗來證明本發明核酸修飾酶加工效率的改善。當聚合酶融合於本發明的Sso7序列時,表現出對高鹽濃度的耐受性提高,即加工能力增加的加工酶可在較高鹽濃度下產生更多產物。例如,可進行PCR分析來測定採用取代的Sso7融合性Taq聚合酶的反應中所得產物的量與未修飾的Taq聚合酶在高鹽如80mM反應條件下的產物量作比較。
評估本發明改善的聚合酶效率提高的其它方法,可由本領域普通技術人員,採用給定修飾酶的標準酶活性試驗來確定。
實施例實施例1突變Sso7-ΔTaq融合物的構建採用連續PCR在SEQ ID NO2所列野生型Sso7d-Δtaq的編碼W24密碼子處引入點突變。在第1輪PCR中,採用引物對M13R(5』GCGGATAACAATTTCACACAGG 3』;SEQ ID NO19)和W24T(5』ATCTCCAAGATCAA GAAATAGNGCGTGTGGGCAAGATG 3』;SEQ ID NO20)和引物對W24AEVG-B(5』CTACTTTCTTGATCTTGGAGAT 3』;SEQ ID NO21)和1008R(5』GAGGGCTTTATAAGGCTCG 3』;SEQ ID NO22)擴增pYW1的相應區域(參見PCT出版物WO 01/92501)。純化第1次PCR的產物並在第2輪PCR中與引物M13R和1008R混合以產生400bp片段。將此片段用限制性酶EcoRI和BstXI消化並插入pYW1的相應位點中。引物W24-T包含5』末端位點23的簡併核苷酸,從而最終的寡核苷酸將是此位點含G、T、A、C各25%的混合群。結果,密碼子GNG編碼該突變融合蛋白中以下的4種胺基酸之一,Gly(GGG)(SEQ IDNO3,粗體且加下劃線);Val(GTG)(SEQ ID NO5,粗體且加下劃線);Glu(GAG)(SEQ ID NO7,粗體且加下劃線)或Ala(GCG)。
實施例2錯配引物試驗根據結構研究(Gao等,Nature Struct.Biol.5782-786,1998),野生型Sso7d中的W24殘基參與將鹼基錨定在其不堆積位點。此實施例顯示該位點的突變可導致該融合蛋白的引物-模板結合特異性增加。
採用2對引物評估PCR酶區分匹配引物與錯配引物的能力。匹配引物57F(5』TCCGTTCTTCTTCGTCATAACT 3』;SEQ ID NO23)與λDNA充分互補。錯配引物57F5/6(5』TCCGCCCTTCTTCGTCATAACT 3』;SEQ ID NO24)包含2個與λDNA模板不互補的鹼基(在5』末端的位點5和6)。採用相同的匹配反向引物732R(5』CCTGACTGTTCGATATATTCACTC 3』;SEQ ID NO25)與57F或57F5/6一起來產生657bp擴增子。所用循環程序是94℃-1分鐘,20輪(94℃-10秒,50-74℃-30秒,72℃-1分鐘),72℃-10分鐘。定量測定PCR產物的最終產量,採用TE緩衝液配的PicoGreen稀釋液(1∶200PicoGreen∶TE)和螢光平板讀數器。對於各酶,進行2次PCR擴增,一次使用引物57F和732R,另一次使用引物57F5/6和732R。
酶區分錯配引物與匹配引物的能力可通過比較2種反應的相對產量來測定。區分能力更高的酶用匹配引物的相對產量應高於用錯配引物。表1顯示在64℃退火溫度下分析的結果。野生型融合蛋白對匹配與錯配引物的區分能力最差。3種突變蛋白顯示比野生型融合蛋白提高2.5-14倍。
表1.比較PCR中的匹配與錯配區分
實施例3野生型與突變融合蛋白的加工能力比較由於Sso7d與dsDNA之間的結合相互作用對提高該融合蛋白加工能力很重要,引入突變可去除這種提高。採用加工能力測定試驗(參見PCT出版物WO01/92501)來測量在Sso7d的殘基W24處含突變的融合蛋白的加工能力,結果小結於表2中。3種突變蛋白中的2種即W24G和W24V與未修飾的蛋白Δtaq相比仍保持高2倍的加工能力。含W24E變化的突變蛋白顯示與未修飾蛋白相同的加工能力。這些結果提示此位點的不同突變對融合蛋白的加工能力可能有不同作用。
表2.加工能力比較
實施例4突變蛋白在PCR擴增後期循環中更有效在PCR應用中將突變蛋白與野生型蛋白作比較。比較採用了2種標準,一種是qPCR應用中的域循環(Ct)值,它反映酶在擴增早期循環中的效率,另一種是PCR產物的最終產量,它反映酶在擴增後期循環中的效率。採用以SYBR green為基礎的qPCR反應來擴增2種人基因組DNA的β-肌動蛋白擴增子BA481和BA203,。該反應包含最終濃度的1xSYBR Green I和2mM MgCl2。採用55.8℃-72.1℃的退火梯度。Ct值小結於表3中。野生型融合蛋白和Sso7d(G)融合蛋白獲得很相似的Ct值,提示早期循環中2種酶之間的效率沒有顯著差異。
將最終PCR產物在1%瓊脂糖凝膠上作分析以評估相對產量。如圖1所示,使用突變蛋白Sso7d(G)-ΔTaq時BA481和BA203擴增子的最終產量均顯著高於使用野生型融合蛋白時的產量,這與突變蛋白在擴增後期循環中更有效相一致。
表3.比較65℃退火溫度時的Ct值
理解本文所述實施例和實施方案僅用於闡述目的據此本領域技術人員可提出多種修飾和變化均包括在本專利申請的精神和範圍及所附權利要求範圍內。本文引用的所有出版物、專利和專利申請的內容納入供參考,用於各種目的。
Sso7d和Sso7d融合序列表SEQ ID NO1ATGGCAACCGTAAAGTTCAAGTACAAAGGCGAAGAAAAAGAGGTAGACATCTCCAAGATCAAGAAAGTATGGCGTGTGGGCAAGATGATCTCCTTCACCTACGACGAGGGCGGTGGCAAGACCGGCCGTGGTGCGGTAAGCGAAAAGGACGCGCCGAAGGAGCTGCTGCAGATGCTGGAGAAGCAGAAAAAGSEQ ID NO2MATVKFKYKGEEKEVDISKIKKVWRVGKMISFTYDEGGGKTGRGAVSEKDAPKELLQMLEKQKKSEQ ID NO3編碼Sso7d(G)-ΔTaq的DNA序列ATGATTACGAATTCGAGCGCAACCGTAAAGTTCAAGTACAAAGGCGAAGAAAAAGAGGTAGAGATCTCCAAGATCAAGAAAGTAGGGCGTGTGGGCAAGATGATCTCCTTCACCTACGACGAGGGCGGTGGCAAGACCGGCCGTGGTGCGGTAAGCGAAAAGGACGCGCCGAAGGAGCTGCTGCAGATGCTGGAGAAGCAGAAAAAGGGCGGCGGTGTCACTAGTCCCAAGGCCCTGGAGGAGGCCCCCTGGCCCCCGCCGGAAGGGGCCTTCGTGGGCTTTGTGCTTTCCCGCAAGGAGCCCATGTGGGCCGATCTTCTGGCCCTGGCCGCCGCCAGGGGGGGCCGGGTCCACCGGGCCCCCGAGCCTTATAAAGCCCTCAGGGACCTGAAGGAGGCGCGGGGGCTTCTCGCCAAAGACCTGAGCGTTCTGGCCCTGAGGGAAGGCCTTGGCCTCCCGCCCGGCGACGACCCCATGCTCCTCGCCTACCTCCTGGACCCTTCCAACACCACCCCCGAGGGGGTGGCCCGGCGCTACGGCGGGGAGTGGACGGAGGAGGCGGGGGAGCGGGCCGCCCTTTCCGAGAGGCTCTTCGCCAACCTGTGGGGGAGGCTTGAGGGGGAGGAGAGGCTCCTTTGGCTTTACCGGGAGGTGGAGAGGCCCCTTTCCGCTGTCCTGGCCCACATGGAGGCCACGGGGGTGCGCCTGGACGTGGCCTATCTCAGGGCCTTGTCCCTGGAGGTGGCCGAGGAGATCGCCCGCCTCGAGGCCGAGGTCTTCCGCCTGGCCGGCCACCCCTTCAACCTCAACTCCCGGGACCAGCTGGAAAGGGTCCTCTTTGACGAGCTAGGGCTTCCCGCCATCGGCAAGACGGAGAAGACCGGCAAGCGCTCCACCAGCGCCGCCGTCCTGGAGGCCCTCCGCGAGGCCCACCCCATCGTGGAGAAGATCCTGCAGTACCGGGAGCTCACCAAGCTGAAGAGCACCTACATTGACCCCTTGCCGGACCTCATCCACCCCAGGACGGGCCGCCTCCACACCCGCTTCAACCAGACGGCCACGGCCACGGGCAGGCTAAGTAGCTCCGATCCCAACCTCCAGAACATCCCCGTCCGCACCCCGCTTGGGCAGAGGATCCGCCGGGCCTTCATCGCCGAGGAGGGGTGGCTATTGGTGGCCCTGGACTATAGCCAGATAGAGCTCAGGGTGCTGGCCCACCTCTCCGGCGACGAGAACCTGATCCGGGTCTTCCAGGAGGGGCGGGACATCCACACGGAGACCGCCAGCTGGATGTTCGGCGTCCCCCGGGAGGCCGTGGACCCCCTGATGCGCCGGGCGGCCAAGACCATCAACTTCGGGGTCCTCTACGGCATGTCGGCCCACCGCCTCTCCCAGGAGCTAGCCATCCCTTACGAGGAGGCCCAGGCCTTCATTGAGCGCTACTTTCAGAGCTTCCCCAAGGTGCGGGCCTGGATTGAGAAGACCCTGGAGGAGGGCAGGAGGCGGGGGTACGTGGAGACCCTCTTCGGCCGCCGCCGCTACGTGCCAGACCTAGAGGCCCGGGTGAAGAGCGTGCGGGAGGCGGCCGAGCGCATGGCCTTCAACATGCCCGTCCAGGGCACCGCCGCCGACCTCATGAAGCTGGCTATGGTGAAGCTCTTCCCCAGGCTGGAGGAAATGGGGGCCAGGATGCTCCTTCA
GGTCCACGACGAGCTGGTCCTCGAGGCCCCAAAAGAGAGGGCGGAGGCCGTGGCCCGGCTGGCCAAGGAGGTCATGGAGGGGGTGTATCCCCTGGCCGTGCCCCTGGAGGTGGAGGTGGGGATAGGGGAGGACTGGCTCTCCGCCAAGGAGGGCATTGATGGCCGCGGCGGAGGCGGGCATCATCATCATCATCATTAATGAGATCTSEQ ID NO4融合蛋白Sso7d(G)-ΔTaq的胺基酸序列粗體、加下劃線的殘基表示相對野生型Sso7d-ΔTAq的胺基酸取代MITNSSATVKFKYKGEEKEVDISKIKKVGRVGKMISFTYDEGGGKTGRGAVSEKDAPKELLQMLEKQKKGGGVTSPKALEEAPWPPPEGAFVGFVLSRKEPMWADLLALAAARGGRVHRAPEPYKALRDLKEARGLLAKDLSVLALREGLGLPPGDDPMLLAYLLDPSNTTPEGVARRYGGEWTEEAGERAALSERLFANLWGRLEGEERLLWLYREVERPLSAVLAHMEATGVRLDVAYLRALSLEVAEEIARLEAEVFRLAGHPFNINSRDQLERVLFDELGLPAIGKTEKTGKRSTSAAVLEALREAHPIVEKILQYRELTKLKSTYIDPLPDLIHPRTGRLHTRFNQTATATGRLSSSDPNLQNIPVRTPLGGQRIRRAFIAEEGWLVALDYSQIELRVLAHLSGDENLIRVFQEGRDIHTETASWMFGVPREAVDPLMRRAAKTINFGVLYGMSAHRLSQELAIPYEEAQAFIERYFQSFPKVRAWIEKTLEEGRRRGYVETLFGRRRYVPDLEARVKSVREAAERMAFNMPVQGTAADLMKLAMVKLFPRLEEMGARMLLQVHDELVLEAPKERAEAVARLAKEVMEGVYPLAVPLEVEVGIGEDWLSAKEGIDGRGGGGHHHHHHSEQ ID NO5編碼Sso7d(V)-ΔTaq的DNA序列ATGATTACGAATTCGAGCGCAACCGTAAAGTTCAAGTACAAAGGCGAAGAAAAAGAGGTAGACATCTCGAAGATCAAGAAAGTAGTGCGTGTGGGCAAGATGATCTCCTTCACCTACGACGAGGGCGGTGGCAAGACCGGCCGTGGTGCGGTAAGCGAAAAGGACGCGCCGAAGGAGCTGCTGCAGATGCTGGAGAAGCAGAAAAAGGGCGGCGGTGTCACTAGTCCCAAGGCCCTGGAGGAGGCCCCCTGGCCCCCGCCGGAAGGGGCCTTCGTGGGCTTTGTGCTTTCCCGCAAGGAGCCCATGTGGGCCGATCTTCTGGCCCTGGCCGCCGCCAGGGGGGGCCGGGTCCACCGGGCCCCCGAGCCTTATAAAGCCCTCAGGGACCTGAAGGAGGCGCGGGGGCTTCTCGCCAAAGACCTGAGCGTTCTGGCCCTGAGGGAAGGCCTTGGCCTCCCGCCCGGCGACGACCCCATGCTCCTCGCCTACCTCCTGGACCCTTCCAACACCACCCCCGAGGGGGTGGCCCGGCGCTACGGCGGGGAGTGGACGGAGGAGGCGGGGGAGCGGGCCGCCCTTTCCGAGAGGCTCTTCGCCAACCTGTGGGGGAGGCTTGAGGGGGAGGAGAGGCTCCTTTGGCTTTACCGGGAGGTGGAGAGGCCCCTTTCCGCTGTCCTGGCCCACATGGAGGCCACGGGGGTGCGCCTGGACGTGGCCTATCTCAGGGCCTTGTCCCTGGAGGTGGCCGAGGAGATCGCCCGCCTCGAGGCCGAGGTCTTCCGCCTGGCCGGCCACCCCTTCAACCTCAACTCCCGGGACCAGCTGGAAAGGGTCCTCTTTGACGAGCTAGGGCTTCCCGCCATCGGCAAGACGGAGAAGACCGGCAAGCGCTCCACCAGCGCCGCCGTCCTGGAGGCCCTCCGCGAGGCCCACCCCATCGTGGAGAAGATCCTGCAGTACCGGGAGCTCACCAAGCTGAAGAGCACCTACATTGACCCCTTGCCGGACCTCATCCACCCCAGGACGGGCCGCCTCCACACCCGCTTCAACCAGACGGCCACGGCCACGGGCAGGCTAAGTAGCTCCGATCCCAACCTCCAGAACATCCCCGTCCGCACCCCGCTTGGGCAGAGGATCCGCCGGGCCTTCATCGCCG
AGGAGGGGTGGCTATTGGTGGCCCTGGACTATAGCCAGATAGAGCTCAGGGTGCTGGCCCACCTCTCCGGCGACGAGAACCTGATCCGGGTCTTCCAGGAGGGGCGGGACATCCACACGGAGACCGCCAGCTGGATGTTCGGCGTCCCCCGGGAGGCCGTGGACCCCCTGATGCGCCGGGCGGCCAAGACCATCAACTTCGGGGTCCTCTACGGCATGTCGGCCCACCGCCTCTCCCAGGAGCTAGCCATCCCTTACGAGGAGGCCCAGGCCTTCATTGAGCGCTACTTTCAGAGCTTCCCCAAGGTGCGGGCCTGGATTGAGAAGACCCTGGAGGAGGGCAGGAGGCGGGGGTACGTGGAGACCCTCTTCGGCCGCCGCCGCTACGTGCCAGACCTAGAGGCCCGGGTGAAGAGCGTGCGGGAGGCGGCCGAGCGCATGGCCTTCAACATGCCCGTCCAGGGCACCGCCGCCGACCTCATGAAGCTGGCTATGGTGAAGCTCTTCCCCAGGCTGGAGGAAATGGGGGCCAGGATGCTCCTTCAGGTCCACGACGAGCTGGTCCTCGAGGCCCCAAAAGAGAGGGCGGAGGCCGTGGCCCGGCTGGCCAAGGAGGTCATGGAGGGGGTGTATCCCCTGGCCGTGCCCCTGGAGGTGGAGGTGGGGATAGGGGAGGACTGGCTCTCCGCCAAGGAGGGCATTGATGGCCGCGGCGGAGGCGGGCATCATCATCATCATCATTAATGAGATCTSEQ ID NO6融合蛋白Sso7d(V)-ΔTaq的胺基酸序列粗體、加下劃線的殘基表示相對野生型Sso7d-ΔTaq的胺基酸取代MITNSSATVKFKYKGEEKEVDISKIKKVVRVGKMISFTYDEGGGKTGRGAVSEKDAPKELLQMLEKQKKGGGVTSPKALEEAPWPPPEGAFVGFVLSRKEPMWADLLALAAARGGRVHRAPEPYKALRDLKEARGLLAKDLSVLALREGLGLPPGDDPMLLAYLLDPSNTTPEGVARRYGGEWTEEAGERAALSERLFANLWGRLEGEERLLWLYREVERPLSAVLAHMEATGVRLDVAYLRALSLEVAEEIARLEAEVFRLAGHPFNLNSRDQLERVLFDELGLPAIGKTEKTGKRSTSAAVLEALREAHPIVEKILQYRELTKLKSTYIDPLPDLIHPRTGRLHTRFNQTATATGRLSSSDPNLQNIPVRTPLGQRIRRAFIAEEGWLLVALDYSQIELRVLAHLSGDENLIRVFQEGRDIHTETASWMFGVPREAVDPLMRRAAKTINFGVLYGMSAHRLSQELAIPYEEAQAFIERYFQSFPKVRAWIEKTLEEGRRRGYVETLFGRRRYVPDLEARVKSVREAAERMAFNMPVQGTAADLMKLAMVKLFPRLEEMGARMLLQVHDELVLEAPKERAEAVARLAFEVMEGVYPLAVPLEVEVGIGEDWLSAKEGIDGRGGGGEHHHHHHSEQ ID NO7編碼Sso7d(E)-ΔTaq的DNA序列ATGATTACGAATTCGAGCGCAACCGTAAAGTTCAAGTACAAAGGCGAAGAAAAAGAGGTAGACATCTCCAAGATCAAGAAAGTAGAGCGTGTGGGCAAGATGATCTCCTTCACCTACGACGAGGGCGGTGGCAAGACCGGCCGTGGTGCGGTAAGCGAAAAGGACGCGCCGAAGGAGCTGCTGCAGATGCTGGAGAAGCAGAAAAAGGGCGGCGGTGTCACTAGTCCCAAGGCCCTGGAGGAGGCCCCCTGGCCCCCGCCGGAAGGGGCCTTCGTGGGCTTTGTGCTTTCCCGCAAGGAGCCCATGTGGGCCGATCTTCTGGCCCTGGCCGCCGCCAGGGGGGGCCGGGTCCACCGGGCCCCCGAGCCTTATAAAGCCCTCAGGGACCTGAAGGAGGCGCGGGGGCTTCTCGCCAAAGACCTGAGCGTTCTGGCCCTGAGGGAAGGCCTTGGCCTCCCGCCCGGCGACGACCCCATGCTCCTCGCCTACCTCCTGGACCCTTCCAACACCACCCCCGAGGGGGTGGCCCGGCGCTACGGCGGGGAGTGGACGGAGGAGGCGGGGGAGCGGGCCGCCCTTTCCGAGAGGCTCTTCGCCAACCTGTGGGGGAGGCTTGAGGGGGAGGAGAGGCTCCTTTGGCTTTACCGGGAGGTGGAGAGGCCCCTTTCCGCTGTCCTGGC
CCACATGGAGGCCACGGGGGTGCGCCTGGACGTGGCCTATCTCAGGGCCTTGTCCCTGGAGGTGGCCGAGGAGATCGCCCGCCTCGAGGCCGAGGTCTTCCGCCTGGCCGGCCACCCCTTCAACCTCAACTCCCGGGACCAGCTGGAAAGGGTCCTCTTTGACGAGCTAGGGCTTCCCGCCATCGGCAAGACGGAGAAGACCGGCAAGCGCTCCACCAGCGCCGCCGTCCTGGAGGCCCTCCGCGAGGCCCACCCCATCGTGGAGAAGATCCTGCAGTACCGGGAGCTCACCAAGCTGAAGAGCACCTACATTGACCCCTTGCCGGACCTCATCCACCCCAGGACGGGCCGCCTCCACACCCGCTTCAACCAGACGGCCACGGCCACGGGCAGGCTAAGTAGCTCCGATCCCAACCTCCAGAACATCCCCGTCCGCACCCCGCTTGGGCAGAGGATCCGCCGGGCCTTCATCGCCGAGGAGGGGTGGCTATTGGTGGCCCTGGACTATAGCCAGATAGAGCTCAGGGTGCTGGCCCACCTCTCCGGGGACGAGAACCTGATCCGGGTCTTCCAGGAGGGGCGGGACATCCACACGGAGACCGCCAGCTGGATGTTCGGCGTCCCCCGGGAGGCCGTGGACCCCCTGATGCGCCGGGCGGCCAAGACCATCAACTTCGGGGTCCTCTACGGCATGTCGGCCCACCGCCTCTCCCAGGAGCTAGCCATCCCTTACGAGGAGGCCCAGGCCTTCATTGAGCGCTACTTTCAGAGCTTCCCCAAGGTGCGGGCCTGGATTGAGAAGACCCTGGAGGAGGGCAGGAGGCGGGGGTACGTGGAGACCCTCTTCGGCCGCCGCCGCTACGTGCCAGACCTAGAGGCCCGGGTGAAGAGCGTGCGGGAGGCGGCCGAGCGCATGGCCTTCAACATGCCCGTCCAGGGCACCGCCGCCGACCTCATGAAGCTGGCTATGGTGAAGCTCTTCCCCAGGCTGGAGGAAATGGGGGCCAGGATGCTCCTTCAGGTCCACGACGAGCTGGTCCTCGAGGCCCCAAAAGAGAGGGCGGAGGCCGTGGCCCGGCTGGCCAAGGAGGTCATGGGAGGGGTGTATCCCCTGGCCGTGCCCCTGGAGGTGGAGGTGGGGATAGGGGAGGACTGGCTCTCCGCCAAGGAGGGCATTGATGGCCGCGGCGGAGGCGGGCATCATCATCATCATCATTAATGAGATCTSEQ ID NO8融合蛋白Sso7d(E)-ΔTaq的胺基酸序列粗體、加下劃線的殘基表示相對野生型Sso7d-ΔTaq的胺基酸取代MITNSSATVKFKYKGEEKEVDISKIKKVERVGKMISFTYDEGGGKTGRGAVSEKDAPKELLQMLEKQKKGGGVTSPKALEEAPWPPPEGAFVGFVLSRKEPMWADLLALAAARGGRVHRAPEPYKALRDLKEARGLLAKDLSVLALREGLGLPPGDDPMLLAYLLDPSNTTPEGVARRYGGEWTEEAGERAALSERLFANLWGRLEGEERLLWLYREVERPLSAVLAHMEATGVRLDVAYLRALSLEVAEEIARLEAEVFRLAGHPFNLNSRDQLERVLFDELGLPAIGKTEKTGKRSTSAAVLEALREAHPIVEKILQYRELTKLKSTYIDPLPDLIHPRTGRLHTRFNQTATATGRLSSSDPNLQNIPVRTPLGQRIRRAFIAEEGWLLVALDYSQIELRVLAHLSGDENLIRVFQEGRDIHTETASWMFGVPREAVDPLMRRAAKTINFGVLYGMSAHRLSQELAIPYEEAQAFIERYFQSFPKVRAWIEKTLEEGRRRGYVETLFGRRRYVPDLEARVKSVREAAERMAFNMPVQGTAADLMKLAMVKLFPRLEEMGARMLLQVHDELVLEAPKERAEAVARLAKEVMEGVYPLAVPLEVEVGIGEDWLSAKEGIDGRGGGGHHHHHH
序列表110王焱(Wang,Yan)MJ生物工程股份有限公司(MJ Bioworks,Inc.)120改善的SS07-聚合酶偶聯蛋白質130020130-001200PC140未知141未知150US 10/280,1391512002-10-2316025170PatentIn Ver.2.12101211192212DNA213硫磺礦硫化葉菌(Sulfolobus solfataricus)220
223Sso7d蛋白4001atggcaaccg taaagttcaa gtacaaaggc gaagaaaaag aggtagacat ctccaagatc 60aagaaagtat ggcgtgtggg caagatgatc tccttcacct acgacgaggg cggtggcaag 120accggccgtg gtgcggtaag cgaaaaggac gcgccgaagg agctgctgca gatgctggag 180aagcagaaaa ag 192210221164212PRT213硫磺礦硫化葉菌(Sulfolobus solfataricus)220
223Sso7d蛋白4002Met Ala Thr Val Lys Phe Lys Tyr Lys Gly Glu Glu Lys Glu Val Asp1 5 10 15
Ile Ser Lys Ile Lys Lys Val Trp Arg Val Gly Lys Met Ile Ser Phe20 25 30Thr Tyr Asp Glu Gly Gly Gly Lys Thr Gly Arg Gly Ala Val Ser Glu35 40 45Lys Asp Ala Pro Lys Glu Leu Leu Gln Met Leu Glu Lys Gln Lys Lys50 55 6021032111907212DNA213人工序列220
223人工序列的描述Sso7d(G)-ΔTaq取代的融合聚合酶4003atgattacga attcgagcgc aaccgtaaag ttcaagtaca aaggcgaaga aaaagaggta 60gacatctcca agatcaagaa agtagggcgt gtgggcaaga tgatctcctt cacctacgac 120gagggcggtg gcaagaccgg ccgtggtgcg gtaagcgaaa aggacgcgcc gaaggagctg 180ctgcagatgc tggagaagca gaaaaagggc ggcggtgtca ctagtcccaa ggccctggag 240gaggccccct ggcccccgcc ggaaggggcc ttcgtgggct ttgtgctttc ccgcaaggag 300cccatgtggg ccgatcttct ggccctggcc gccgccaggg ggggccgggt ccaccgggcc 360cccgagcctt ataaagccct cagggacctg aaggaggcgc gggggcttct cgccaaagac 420ctgagcgttc tggccctgag ggaaggcctt ggcctcccgc ccggcgacga ccccatgctc 480ctcgcctacc tcctggaccc ttccaacacc acccccgagg gggtggcccg gcgctacggc 540ggggagtgga cggaggaggc gggggagcgg gccgcccttt ccgagaggct cttcgccaac 600ctgtggggga ggcttgaggg ggaggagagg ctcctttggc tttaccggga ggtggagagg 660cccctttccg ctgtcctggc ccacatggag gccacggggg tgcgcctgga cgtggcctat 720ctcagggcct tgtccctgga ggtggccgag gagatcgccc gcctcgaggc cgaggtcttc 780cgcctggccg gccacccctt caacctcaac tcccgggacc agctggaaag ggtcctcttt 840gacgagctag ggcttcccgc catcggcaag acggagaaga ccggcaagcg ctccaccagc 900gccgccgtcc tggaggccct ccgcgaggcc caccccatcg tggagaagat cctgcagtac 960cgggagctca ccaagctgaa gagcacctac attgacccct tgccggacct catccacccc 1020aggacgggcc gcctccacac ccgcttcaac cagacggcca cggccacggg caggctaagt 1080agctccgatc ccaacctcca gaacatcccc gtccgcaccc cgcttgggca gaggatccgc 1140cgggccttca tcgccgagga ggggtggcta ttggtggccc tggactatag ccagatagag 1200ctcagggtgc tggcccacct ctccggcgac gagaacctga tccgggtctt ccaggagggg 1260cgggacatcc acacggagac cgccagctgg atgttcggcg tcccccggga ggccgtggac 1320cccctgatgc gccgggcggc caagaccatc aacttcgggg tcctctacgg catgtcggcc 1380caccgcctct cccaggagct agccatccct tacgaggagg cccaggcctt cattgagcgc 1440tactttcaga gcttccccaa ggtgcgggcc tggattgaga agaccctgga ggagggcagg 1500
aggcgggggt acgtggagac cctcttcggc cgccgccgct acgtgccaga cctagaggcc 1560cgggtgaaga gcgtgcggga ggcggccgag cgcatggcct tcaacatgcc cgtccagggc 1620accgccgccg acctcatgaa gctggctatg gtgaagctct tccccaggct ggaggaaatg 1680ggggccagga tgctccttca ggtccacgac gagctggtcc tcgaggcccc aaaagagagg 1740gcggaggccg tggcccggct ggccaaggag gtcatggagg gggtgtatcc cctggccgtg 1800cccctggagg tggaggtggg gataggggag gactggctct ccgccaagga gggcattgat 1860ggccgcggcg gaggcgggca tcatcatcat catcattaat gagatct 19072104211632212PRT213人工序列220
223人工序列的描述Sso7d(G)-ΔTaq取代的融合聚合酶蛋白4004Met Ile Thr Asn Ser Ser Ala Thr Val Lys Phe Lys Tyr Lys Gly Glu1 5 10 15Glu Lys Glu Val Asp Ile Ser Lys Ile Lys Lys Val Gly Arg Val Gly20 25 30Lys Met Ile Ser Phe Thr Tyr Asp Glu Gly Gly Gly Lys Thr Gly Arg35 40 45Gly Ala Val Ser Glu Lys Asp Ala Pro Lys Glu Leu Leu Gln Met Leu50 55 60Glu Lys Gln Lys Lys Gly Gly Gly Val Thr Ser Pro Lys Ala Leu Glu65 70 75 80Glu Ala Pro Trp Pro Pro Pro Glu Gly Ala Phe Val Gly Phe Val Leu85 90 95Ser Arg Lys Glu Pro Met Trp Ala Asp Leu Leu Ala Leu Ala Ala Ala100 105 110Arg Gly Gly Arg Val His Arg Ala Pro Glu Pro Tyr Lys Ala Leu Arg115 120 125Asp Leu Lys Glu Ala Arg Gly Leu Leu Ala Lys Asp Leu Ser Val Leu130 135 140
Ala Leu Arg Glu Gly Leu Gly Leu Pro Pro Gly Asp Asp Pro Met Leu145 150 155 160Leu Ala Tyr Leu Leu Asp Pro Ser Asn Thr Thr Pro Glu Gly Val Ala165 170 175Arg Arg Tyr Gly Gly Glu Trp Thr Glu Glu Ala Gly Glu Arg Ala Ala180 185 190Leu Ser Glu Arg Leu Phe Ala Asn Leu Trp Gly Arg Leu Glu Gly Glu195 200 205Glu Arg Leu Leu Trp Leu Tyr Arg Glu Val Glu Arg Pro Leu Ser Ala210 215 220Val Leu Ala His Met Glu Ala Thr Gly Val Arg Leu Asp Val Ala Tyr225 230 235 240Leu Arg Ala Leu Ser Leu Glu Val Ala Glu Glu Ile Ala Arg Leu Glu245 250 255Ala Glu Val Phe Arg Leu Ala Gly His Pro Phe Asn Leu Asn Ser Arg260 265 270Asp Gln Leu Glu Arg Val Leu Phe Asp Glu Leu Gly Leu Pro Ala Ile275 280 285Gly Lys Thr Glu Lys Thr Gly Lys Arg Ser Thr Ser Ala Ala Val Leu290 295 300Glu Ala Leu Arg Glu Ala His Pro Ile Val Glu Lys Ile Leu Gln Tyr305 310 315 320Arg Glu Leu Thr Lys Leu Lys Ser Thr Tyr Ile Asp Pro Leu Pro Asp325 330 335Leu Ile His Pro Arg Thr Gly Arg Leu His Thr Arg Phe Asn Gln Thr340 345 350Ala Thr Ala Thr Gly Arg Leu Ser Ser Ser Asp Pro Asn Leu Gln Asn355 360 365Ile Pro Val Arg Thr Pro Leu Gly Gln Arg Ile Arg Arg Ala Phe Ile370 375 380
Ala Glu Glu Gly Trp Leu Leu Val Ala Leu Asp Tyr Ser Gln Ile Glu385 390 395 400Leu Arg Val Leu Ala His Leu Ser Gly Asp Glu Asn Leu Ile Arg Val405 410 415Phe Gln Glu Gly Arg Asp Ile His Thr Glu Thr Ala Ser Trp Met Phe420 425 430Gly Val Pro Arg Glu Ala Val Asp Pro Leu Met Arg Arg Ala Ala Lys435 440 445Thr Ile Asn Phe Gly Val Leu Tyr Gly Met Ser Ala His Arg Leu Ser450 455 460Gln Glu Leu Ala Ile Pro Tyr Glu Glu Ala Gln Ala Phe Ile Glu Arg465 470 475 480Tyr Phe Gln Ser Phe Pro Lys Val Arg Ala Trp Ile Glu Lys Thr Leu485 490 495Glu Glu Gly Arg Arg Arg Gly Tyr Val Glu Thr Leu Phe Gly Arg Arg500 505 510Arg Tyr Val Pro Asp Leu Glu Ala Arg Val Lys Ser Val Arg Glu Ala515 520 525Ala Glu Arg Met Ala Phe Asn Met Pro Val Gln Gly Thr Ala Ala Asp530 535 540Leu Met Lys Leu Ala Met Val Lys Leu Phe Pro Arg Leu Glu Glu Met545 550 555 560Gly Ala Arg Met Leu Leu Gln Val His Asp Glu Leu Val Leu Glu Ala565 570 575Pro Lys Glu Arg Ala Glu Ala Val Ala Arg Leu Ala Lys Glu Val Met580 585 590Glu Gly Val Tyr Pro Leu Ala Val Pro Leu Glu Val Glu Val Gly Ile595 600 605Gly Glu Asp Trp Leu Ser Ala Lys Glu Gly Ile Asp Gly Arg Gly Gly610 615 620
Gly Gly His His His His His His625 63021052111907212DNA213人工序列220
223人工序列的描述Sso7d(V)-ΔTaq取代的融合聚合酶4005atgattacga attcgagcgc aaccgtaaag ttcaagtaca aaggcgaaga aaaagaggta 60gacatctcca agatcaagaa agtagtgcgt gtgggcaaga tgatctcctt cacctacgac 120gagggcggtg gcaagaccgg ccgtggtgcg gtaagcgaaa aggacgcgcc gaaggagctg 180ctgcagatgc tggagaagca gaaaaagggc ggcggtgtca ctagtcccaa ggccctggag 240gaggccccct ggcccccgcc ggaaggggcc ttcgtgggct ttgtgctttc ccgcaaggag 300cccatgtggg ccgatcttct ggccctggcc gccgccaggg ggggccgggt ccaccgggcc 360cccgagcctt ataaagccct cagggacctg aaggaggcgc gggggcttct cgccaaagac 420ctgagcgttc tggccctgag ggaaggcctt ggcctcccgc ccggcgacga ccccatgctc 480ctcgcctacc tcctggaccc ttccaacacc acccccgagg gggtggcccg gcgctacggc 540ggggagtgga cggaggaggc gggggagcgg gccgcccttt ccgagaggct cttcgccaac 600ctgtggggga ggcttgaggg ggaggagagg ctcctttggc tttaccggga ggtggagagg 660cccctttccg ctgtcctggc ccacatggag gccacggggg tgcgcctgga cgtggcctat 720ctcagggcct tgtccctgga ggtggccgag gagatcgccc gcctcgaggc cgaggtcttc 780cgcctggccg gccacccctt caacctcaac tcccgggacc agctggaaag ggtcctcttt 840gacgagctag ggcttcccgc catcggcaag acggagaaga ccggcaagcg ctccaccagc 900gccgccgtcc tggaggccct ccgcgaggcc caccccatcg tggagaagat cctgcagtac 960cgggagctca ccaagctgaa gagcacctac attgacccct tgccggacct catccacccc 1020aggacgggcc gcctccacac ccgcttcaac cagacggcca cggccacggg caggctaagt 1080agctccgatc ccaacctcca gaacatcccc gtccgcaccc cgcttgggca gaggatccgc 1140cgggccttca tcgccgagga ggggtggcta ttggtggccc tggactatag ccagatagag 1200ctcagggtgc tggcccacct ctccggcgac gagaacctga tccgggtctt ccaggagggg 1260cgggacatcc acacggagac cgccagctgg atgttcggcg tcccccggga ggccgtggac 1320cccctgatgc gccgggcggc caagaccatc aacttcgggg tcctctacgg catgtcggcc 1380caccgcctct cccaggagct agccatccct tacgaggagg cccaggcctt cattgagcgc 1440tactttcaga gcttccccaa ggtgcgggcc tggattgaga agaccctgga ggagggcagg 1500aggcgggggt acgtggagac cctcttcggc cgccgccgct acgtgccaga cctagaggcc 1560cgggtgaaga gcgtgcggga ggcggccgag cgcatggcct tcaacatgcc cgtccagggc 1620accgccgccg acctcatgaa gctggctatg gtgaagctct tccccaggct ggaggaaatg 1680ggggccagga tgctccttca ggtccacgac gagctggtcc tcgaggcccc aaaagagagg 1740gcggaggccg tggcccggct ggccaaggag gtcatggagg gggtgtatcc cctggccgtg 1800cccctggagg tggaggtggg gataggggag gactggctct ccgccaagga gggcattgat 1860ggccgcggcg gaggcgggca tcatcatcat catcattaat gagatct 1907
2106211632212PRT213人工序列220
223人工序列的描述Sso7d(V)-ΔTaq取代的融合聚合酶蛋白4006Met Ile Thr Asn Ser Ser Ala Thr Val Lys Phe Lys Tyr Lys Gly Glu1 5 10 15Glu Lys Glu Val Asp Ile Ser Lys Ile Lys Lys Val Val Arg Val Gly20 25 30Lys Met Ile Ser Phe Thr Tyr Asp Glu Gly Gly Gly Lys Thr Gly Arg35 40 45Gly Ala Val Ser Glu Lys Asp Ala Pro Lys Glu Leu Leu Gln Met Leu50 55 60Glu Lys Gln Lys Lys Gly Gly Gly Val Thr Ser Pro Lys Ala Leu Glu65 70 75 80Glu Ala Pro Trp Pro Pro Pro Glu Gly Ala Phe Val Gly Phe Val Leu85 90 95Ser Arg Lys Glu Pro Met Trp Ala Asp Leu Leu Ala Leu Ala Ala Ala100 105 110Arg Gly Gly Arg Val His Arg Ala Pro Glu Pro Tyr Lys Ala Leu Arg115 120 125Asp Leu Lys Glu Ala Arg Gly Leu Leu Ala Lys Asp Leu Ser Val Leu130 135 140Ala Leu Arg Glu Gly Leu Gly Leu Pro Pro Gly Asp Asp Pro Met Leu145 150 155 160Leu Ala Tyr Leu Leu Asp Pro Ser Asn Thr Thr Pro Glu Gly Val Ala165 170 175Arg Arg Tyr Gly Gly Glu Trp Thr Glu Glu Ala Gly Glu Arg Ala Ala
180 185 190Leu Ser Glu Arg Leu Phe Ala Asn Leu Trp Gly Arg Leu Glu Gly Glu195 200 205Glu Arg Leu Leu Trp Leu Tyr Arg Glu Val Glu Arg Pro Leu Ser Ala210 215 220Val Leu Ala His Met Glu Ala Thr Gly Val Arg Leu Asp Val Ala Tyr225 230 235 240Leu Arg Ala Leu Ser Leu Glu Val Ala Glu Glu Ile Ala Arg Leu Glu245 250 255Ala Glu Val Phe Arg Leu Ala Gly His Pro Phe Asn Leu Asn Ser Arg260 265 270Asp Gln Leu Glu Arg Val Leu Phe Asp Glu Leu Gly Leu Pro Ala Ile275 280 285Gly Lys Thr Glu Lys Thr Gly Lys Arg Ser Thr Ser Ala Ala Val Leu290 295 300Glu Ala Leu Arg Glu Ala His Pro Ile Val Glu Lys Ile Leu Gln Tyr305 310 315 320Arg Glu Leu Thr Lys Leu Lys Ser Thr Tyr Ile Asp Pro Leu Pro Asp325 330 335Leu Ile His Pro Arg Thr Gly Arg Leu His Thr Arg Phe Asn Gln Thr340 345 350Ala Thr Ala Thr Gly Arg Leu Ser Ser Ser Asp Pro Asn Leu Gln Asn355 360 365Ile Pro Val Arg Thr Pro Leu Gly Gln Arg Ile Arg Arg Ala Phe Ile370 375 380Ala Glu Glu Gly Trp Leu Leu Val Ala Leu Asp Tyr Ser Gln Ile Glu385 390 395 400Leu Arg Val Leu Ala His Leu Ser Gly Asp Glu Asn Leu Ile Arg Val405 410 415Phe Gln Glu Gly Arg Asp Ile His Thr Glu Thr Ala Ser Trp Met Phe
420 425 430Gly Val Pro Arg Glu Ala Val Asp Pro Leu Met Arg Arg Ala Ala Lys435 440 445Thr Ile Asn Phe Gly Val Leu Tyr Gly Met Ser Ala His Arg Leu Ser450 455 460Gln Glu Leu Ala Ile Pro Tyr Glu Glu Ala Gln Ala Phe Ile Glu Arg465 470 475 480Tyr Phe Gln Ser Phe Pro Lys Val Arg Ala Trp Ile Glu Lys Thr Leu485 490 495Glu Glu Gly Arg Arg Arg Gly Tyr Val Glu Thr Leu Phe Gly Arg Arg500 505 510Arg Tyr Val Pro Asp Leu Glu Ala Arg Val Lys Ser Val Arg Glu Ala515 520 525Ala Glu Arg Met Ala Phe Asn Met Pro Val Gln Gly Thr Ala Ala Asp530 535 540Leu Met Lys Leu Ala Met Val Lys Leu Phe Pro Arg Leu Glu Glu Met545 550 555 560Gly Ala Arg Met Leu Leu Gln Val His Asp Glu Leu Val Leu Glu Ala565 570 575Pro Lys Glu Arg Ala Glu Ala Val Ala Arg Leu Ala Lys Glu Val Met580 585 590Glu Gly Val Tyr Pro Leu Ala Val Pro Leu Glu Val Glu Val Gly Ile595 600 605Gly Glu Asp Trp Leu Ser Ala Lys Glu Gly Ile Asp Gly Arg Gly Gly610 615 620Gly Gly His His His His His His625 63021072111907212DNA
213人工序列220
223人工序列的描述Sso7d(E)-ΔTaq取代的融合聚合酶4007atgattacga attcgagcgc aaccgtaaag ttcaagtaca aaggcgaaga aaaagaggta 60gacatctcca agatcaagaa agtagagcgt gtgggcaaga tgatctcctt cacctacgac 120gagggcggtg gcaagaccgg ccgtggtgcg gtaagcgaaa aggacgcgcc gaaggagctg 180ctgcagatgc tggagaagca gaaaaagggc ggcggtgtca ctagtcccaa ggccctggag 240gaggccccct ggcccccgcc ggaaggggcc ttcgtgggct ttgtgctttc ccgcaaggag 300cccatgtggg ccgatcttct ggccctggcc gccgccaggg ggggccgggt ccaccgggcc 360cccgagcctt ataaagccct cagggacctg aaggaggcgc gggggcttct cgccaaagac 420ctgagcgttc tggccctgag ggaaggcctt ggcctcccgc ccggcgacga ccccatgctc 480ctcgcctacc tcctggaccc ttccaacacc acccccgagg gggtggcccg gcgctacggc 540ggggagtgga cggaggaggc gggggagcgg gccgcccttt ccgagaggct cttcgccaac 600ctgtggggga ggcttgaggg ggaggagagg ctcctttggc tttaccggga ggtggagagg 660cccctttccg ctgtcctggc ccacatggag gccacggggg tgcgcctgga cgtggcctat 720ctcagggcct tgtccctgga ggtggccgag gagatcgccc gcctcgaggc cgaggtcttc 780cgcctggccg gccacccctt caacctcaac tcccgggacc agctggaaag ggtcctcttt 840gacgagctag ggcttcccgc catcggcaag acggagaaga ccggcaagcg ctccaccagc 900gccgccgtcc tggaggccct ccgcgaggcc caccccatcg tggagaagat cctgcagtac 960cgggagctca ccaagctgaa gagcacctac attgacccct tgccggacct catccacccc 1020aggacgggcc gcctccacac ccgcttcaac cagacggcca cggccacggg caggctaagt 1080agctccgatc ccaacctcca gaacatcccc gtccgcaccc cgcttgggca gaggatccgc 1140cgggccttca tcgccgagga ggggtggcta ttggtggccc tggactatag ccagatagag 1200ctcagggtgc tggcccacct ctccggcgac gagaacctga tccgggtctt ccaggagggg 1260cgggacatcc acacggagac cgccagctgg atgttcggcg tcccccggga ggccgtggac 1320cccctgatgc gccgggcggc caagaccatc aacttcgggg tcctctacgg catgtcggcc 1380caccgcctct cccaggagct agccatccct tacgaggagg cccaggcctt cattgagcgc 1440tactttcaga gcttccccaa ggtgcgggcc tggattgaga agaccctgga ggagggcagg 1500aggcgggggt acgtggagac cctcttcggc cgccgccgct acgtgccaga cctagaggcc 1560cgggtgaaga gcgtgcggga ggcggccgag cgcatggcct tcaacatgcc cgtccagggc 1620accgccgccg acctcatgaa gctggctatg gtgaagctct tccccaggct ggaggaaatg 1680ggggccagga tgctccttca ggtccacgac gagctggtcc tcgaggcccc aaaagagagg 1740gcggaggccg tggcccggct ggccaaggag gtcatggagg gggtgtatcc cctggccgtg 1800cccctggagg tggaggtggg gataggggag gactggctct ccgccaagga gggcattgat 1860ggccgcggcg gaggcgggca tcatcatcat catcattaat gagatct 19072108211632212PRT213人工序列
220
223人工序列的描述Sso7d(E)-ΔTaq取代的融合聚合酶蛋白4008Met Ile Thr Asn Ser Ser Ala Thr Val Lys Phe Lys Tyr Lys Gly Glu1 5 10 15Glu Lys Glu Val Asp Ile Ser Lys Ile Lys Lys Val Glu Arg Val Gly20 25 30Lys Met Ile Ser Phe Thr Tyr Asp Glu Gly Gly Gly Lys Thr Gly Arg35 40 45Gly Ala Val Ser Glu Lys Asp Ala Pro Lys Glu Leu Leu Gln Met Leu50 55 60Glu Lys Gln Lys Lys Gly Gly Gly Val Thr Ser Pro Lys Ala Leu Glu65 70 75 80Glu Ala Pro Trp Pro Pro Pro Glu Gly Ala Phe Val Gly Phe Val Leu85 90 95Ser Arg Lys Glu Pro Met Trp Ala Asp Leu Leu Ala Leu Ala Ala Ala100 105 110Arg Gly Gly Arg Val His Arg Ala Pro Glu Pro Tyr Lys Ala Leu Arg115 120 125Asp Leu Lys Glu Ala Arg Gly Leu Leu Ala Lys Asp Leu Ser Val Leu130 135 140Ala Leu Arg Glu Gly Leu Gly Leu Pro Pro Gly Asp Asp Pro Met Leu145 150 155 160Leu Ala Tyr Leu Leu Asp Pro Ser Asn Thr Thr Pro Glu Gly Val Ala165 170 175Arg Arg Tyr Gly Gly Glu Trp Thr Glu Glu Ala Gly Glu Arg Ala Ala180 185 190Leu Ser Glu Arg Leu Phe Ala Ash Leu Trp Gly Arg Leu Glu Gly Glu195 200 205Glu Arg Leu Leu Trp Leu Tyr Arg Glu Val Glu Arg Pro Leu Ser Ala210 215 220
Val Leu Ala His Met Glu Ala Thr Gly Val Arg Leu Asp Val Ala Tyr225 230 235 240Leu Arg Ala Leu Ser Leu Glu Val Ala Glu Glu Ile Ala Arg Leu Glu245 250 255Ala Glu Val Phe Arg Leu Ala Gly His Pro Phe Asn Leu Asn Ser Arg260 265 270Asp Gln Leu Glu Arg Val Leu Phe Asp Glu Leu Gly Leu Pro Ala Ile275 280 285Gly Lys Thr Glu Lys Thr Gly Lys Arg Ser Thr Ser Ala Ala Val Leu290 295 300Glu Ala Leu Arg Glu Ala His Pro Ile Val Glu Lys Ile Leu Gln Tyr305 310 315 320Arg Glu Leu Thr Lys Leu Lys Ser Thr Tyr Ile Asp Pro Leu Pro Asp325 330 335Leu Ile His Pro Arg Thr Gly Arg Leu His Thr Arg Phe Asn Gln Thr340 345 350Ala Thr Ala Thr Gly Arg Leu Ser Ser Ser Asp Pro Asn Leu Gln Asn355 360 365Ile Pro Val Arg Thr Pro Leu Gly Gln Arg Ile Arg Arg Ala Phe Ile370 375 380Ala Glu Glu Gly Trp Leu Leu Val Ala Leu Asp Tyr Ser Gln Ile Glu385 390 395 400Leu Arg Val Leu Ala His Leu Ser Gly Asp Glu Asn Leu Ile Arg Val405 410 415Phe Gln Glu Gly Arg Asp Ile His Thr Glu Thr Ala Ser Trp Met Phe420 425 430Gly Val Pro Arg Glu Ala Val Asp Pro Leu Met Arg Arg Ala Ala Lys435 440 445Thr Ile Asn Phe Gly Val Leu Tyr Gly Met Ser Ala His Arg Leu Ser450 455 460
Gln Glu Leu Ala Ile Pro Tyr Glu Glu Ala Gln Ala Phe Ile Glu Arg465 470 475 480Tyr Phe Gln Ser Phe Pro Lys Val Arg Ala Trp Ile Glu Lys Thr Leu485 490 495Glu Glu Gly Arg Arg Arg Gly Tyr Val Glu Thr Leu Phe Gly Arg Arg500 505 510Arg Tyr Val Pro Asp Leu Glu Ala Arg Val Lys Ser Val Arg Glu Ala515 520 525Ala Glu Arg Met Ala Phe Asn Met Pro Val Gln Gly Thr Ala Ala Asp530 535 540Leu Met Lys Leu Ala Met Val Lys Leu Phe Pro Arg Leu Glu Glu Met545 550 555 560Gly Ala Arg Met Leu Leu Gln Val His Asp Glu Leu Val Leu Glu Ala565 570 575Pro Lys Glu Arg Ala Glu Ala Val Ala Arg Leu Ala Lys Glu Val Met580 585 590Glu Gly Val Tyr Pro Leu Ala Val Pro Leu Glu Val Glu Val Gly Ile595 600 605Gly Glu Asp Trp Leu Ser Ala Lys Glu Gly Ile Asp Gly Arg Gly Gly610 615 620Gly Gly His His His His His His625 630210921163212PRT213硫磺礦硫化葉菌(Sulfolobus solfataricus)220
223未顯示起始甲硫氨酸的Sso7d4009Ala Thr Val Lys Phe Lys Tyr Lys Gly Glu Glu Lys Glu Val Asp Ile
1 5 10 15Ser Lys Ile Lys Lys Val Trp Arg Val Gly Lys Met Ile Ser Phe Thr20 25 30Tyr Asp Glu Gly Gly Gly Lys Thr Gly Arg Gly Ala Val Ser Glu Lys35 40 45Asp Ala Pro Lys Glu Leu Leu Gln Met Leu Glu Lys Gln Lys Lys50 55 602101021164212PRT213噬酸熱硫化葉菌(Sulfolobus acidocaldarius)220
223Sso7d樣蛋白Sac7e40010Ala Lys Val Arg Phe Lys Tyr Lys Gly Glu Glu Lys Glu Val Asp Thr1 5 10 15Ser Lys Ile Lys Lys Val Trp Arg Val Gly Lys Met Val Ser Phe Thr20 25 30Tyr Asp Asp Asn Gly Lys Thr Gly Arg Gly Ala Val Ser Glu Lys Asp35 40 45Ala Pro Lys Glu Leu Met Asp Met Leu Ala Arg Ala Glu Lys Lys Lys50 55 602101121113212PRT213人工序列220
223人工序列的描述Sso7d和Sac7e排列對比共有肽40011Val Lys Phe Lys Tyr Lys Gly Glu Glu Lys Glu Val Asp1 5 10
2101221112212PRT213人工序列220
223人工序列的描述Sso7d和Sac7e排列對比共有肽40012Ser Lys Ile Lys Lys Val Trp Arg Val Gly Lys Met1 5 10210132115212PRT213人工序列220
223人工序列的描述Sso7d和Sac7e排列對比共有肽40013Ser Phe Thr Tyr Asp1 52101421119212PRT213人工序列220
223人工序列的描述Sso7d和Sac7e排列對比共有肽40014Gly Gly Gly Lys Thr Gly Arg Gly Ala Val Ser Glu Lys Asp Ala Pro1 5 10 15Lys Glu Leu2101521126
212DNA213人工序列220
223人工序列的描述正向擴增引物40015gcaacagtaa agttcaagta caaagg 262101621129212DNA213人工序列220
223人工序列的描述反向擴增引物40016ctaacatttg tagtagttct tttggagcg 29210172116212PRT213人工序列220
223人工序列的描述6-His的表位標記40017His His His His His His1 5210182118212PRT213人工序列220
223人工序列的描述抗-DYKDDDDK的表位標記40018Asp Tyr Lys Asp Asp Asp Asp Lys
152101921122212DNA213人工序列220
223人工序列的描述順序PCR第1輪擴增引物M13R40019gcggataaca atttcacaca gg 222102021139212DNA213人工序列220
223人工序列的描述順序PCR第1輪擴增引物W24T220
221modified_base222(23)223n=g、a、c或t40020atctccaaga tcaagaaagt agngcgtgtg ggcaagatg 392102121122212DNA213人工序列220
223人工序列的描述順序PCR第1輪擴增引物W24AEVG-B40021ctactttctt gatcttggag at 2221022
21119212DNA213人工序列220
223人工序列的描述順序PCR第1輪擴增引物1008R40022gagggcttta taaggctcg 192102321122212DNA213人工序列220
223人工序列的描述匹配的引物57F40023tccgttcttc ttcgtcataa ct 222102421122212DNA213人工序列220
223人工序列的描述匹配的引物57F5/640024tccgcccttc ttcgtcataa ct 222102521124212DNA213人工序列220
223人工序列的描述匹配的反向引物732R40025cctgactgtt cgatatattc actc 2權利要求
1.一種Sso7聚合酶偶聯蛋白質,其特徵在於,該偶聯蛋白質包含與連接於聚合酶結構域的SEQ ID NO2相同性至少為60%的Sso7結構域,在此Sso7結構域中通過參比SEQ ID NO2所確定的某表面殘基位點的胺基酸用不同胺基酸置換;其中該表面殘基的置換導致其加工能力低於野生型Sso7-聚合酶融合物的加工能力但高於未融合Sso7d結構域時該聚合酶結構域的加工能力。
2.如權利要求1所述的Sso7聚合酶偶聯蛋白質,其特徵在於,所述表面殘基位點選自位點24的色氨酸殘基、位點26的纈氨酸殘基、位點29的甲硫氨酸殘基。
3.如權利要求2所述的Sso7聚合酶偶聯蛋白質,其特徵在於,所述表面殘基位點是位點24的色氨酸殘基,置換的胺基酸殘基是除了Asp、Glu、Arg、Lys或Pro的此外任何胺基酸。
4.如權利要求3所述的Sso7聚合酶偶聯蛋白質,其特徵在於,所述置換的胺基酸殘基選自甘氨酸、纈氨酸和丙氨酸。
5.如權利要求4所述的Sso7聚合酶偶聯蛋白質,其特徵在於,所述置換的胺基酸殘基是甘氨酸。
6.如權利要求4所述的Sso7聚合酶偶聯蛋白質,其特徵在於,所述胺基酸殘基是纈氨酸。
7.如權利要求1、2、3、4、5或6所述的Sso7聚合酶蛋白,其特徵在於,所述聚合酶結構域具有熱穩定聚合酶活性。
8.如權利要求7所述的Sso7聚合酶蛋白,其特徵在於,所述聚合酶結構域是家族A聚合酶結構域。
9.如權利要求8所述的Sso7聚合酶蛋白,其特徵在於,所述聚合酶結構域是ΔTaq聚合酶結構域。
10.如權利要求7所述的Sso7聚合酶蛋白,其特徵在於,所述聚合酶結構域是聚合酶B家族成員。
11.如權利要求10所述的Sso7聚合酶蛋白,其特徵在於,所述聚合酶結構域是火球菌聚合酶結構域。
12.如權利要求1所述的Sso7聚合酶蛋白,其特徵在於,所述Sso7結構域包含SEQ ID NO2,其中某表面殘基位點的胺基酸被不同的胺基酸置換。
13.如權利要求1所述的Sso7聚合酶偶聯蛋白質,其特徵在於,Sso7結構域包含SEQ ID NO2,其中位點24的色氨酸殘基被選自甘氨酸、丙氨酸和纈氨酸的胺基酸殘基置換。
14.如權利要求1所述的Sso7聚合酶蛋白,其特徵在於,與含SEQ ID NO2的Sso7聚合酶融合蛋白相比,該表面殘基的置換增加了該聚合酶的引物/模板結合特異性。
15.如權利要求14所述的Sso7聚合酶偶聯蛋白質,其特徵在於,所述表面殘基位點選自位點24的色氨酸殘基、位點26的纈氨酸殘基和位點29的甲硫氨酸殘基。
16.如權利要求15所述的Sso7聚合酶偶聯蛋白質,其特徵在於,所述表面殘基位點是位點24的色氨酸殘基,所述置換胺基酸殘基是除了Asp、Glu、Arg、Lys或Pro以外的任何胺基酸。
17.如權利要求16所述的Sso7聚合酶蛋白,其特徵在於,所述置換胺基酸殘基選自甘氨酸、纈氨酸和丙氨酸。
18.如權利要求17所述的Sso7聚合酶蛋白,其特徵在於,所述置換胺基酸殘基是甘氨酸。
19.如權利要求17所述的Sso7聚合酶偶聯蛋白質,其特徵在於,其中的胺基酸殘基是纈氨酸。
20.如權利要求14、15、16、17、18或19中任一項所述的Sso7聚合酶蛋白,其特徵在於,所述聚合酶結構域具有熱穩定聚合酶活性。
21.如權利要求20所述的Sso7聚合酶蛋白,其特徵在於,所述聚合酶結構域是家族A聚合酶結構域。
22.如權利要求21所述的Sso7聚合酶蛋白,其特徵在於,所述聚合酶結構域是ΔTaq聚合酶結構域。
23.如權利要求14所述的Sso7聚合酶蛋白,其特徵在於,Sso7結構域包含SEQ ID NO2,其中某表面殘基位點的胺基酸被不同的胺基酸置換。
24.如權利要求14所述的Sso7聚合酶蛋白,其特徵在於,Sso7結構域包含SEQ ID NO2,其中位點24的色氨酸殘基被選自甘氨酸、丙氨酸和纈氨酸的胺基酸殘基置換。
25.一種調節溶液中存在的靶核酸上的聚合酶反應的方法,其特徵在於,所述方法包括(a)使該靶核酸接觸Sso7聚合酶蛋白,此偶聯蛋白質包含與連接於聚合酶結構域的SEQ ID NO2相同性至少為60%的Sso7結構域,在此Sso7結構域中通過參比SEQ ID NO2所確定的某表面殘基位點的胺基酸被野生型Sso7蛋白該表面殘基位點沒有的胺基酸殘基置換;其中該表面殘基的置換導致其加工能力高於未融合Sso7結構域的該聚合酶結構域的加工能力;其中所述溶液是能使該結合域結合靶核酸和使該聚合酶結構域可延伸與靶核酸序列雜交的引物的組合物。(b)在聚合酶可延伸該引物的條件下孵育此溶液。
26.如權利要求25所述的方法,其特徵在於,與含SEQ ID NO2的Sso7聚合酶融合蛋白質相比,所述表面殘基的置換增加了該聚合酶的引物/模板結合特異性。
27.如權利要求25所述的方法,其特徵在於,所述表面殘基選自位點24的色氨酸殘基、位點26的纈氨酸殘基和位點29的甲硫氨酸殘基。
28.如權利要求27所述的方法,其特徵在於,所述表面殘基是位點24的色氨酸殘基,所述置換殘基是中性或帶正電荷殘基,其側鏈體積小於色氨酸側鏈體積。
29.如權利要求28所述的方法,其特徵在於,所述胺基酸殘基選自甘氨酸、纈氨酸和丙氨酸。
30.如權利要求29所述的方法,其特徵在於,所述胺基酸殘基是甘氨酸。
31.如權利要求29所述的方法,其特徵在於,所述胺基酸殘基是纈氨酸。
32.如權利要求25所述的方法,其特徵在於,所述聚合酶結構域具有熱穩定聚合酶活性。
33.如權利要求32所述的方法,其特徵在於,所述聚合酶結構域是家族A聚合酶結構域。
34.如權利要求32所述的方法,其特徵在於,所述聚合酶結構域是家族B聚合酶結構域。
35.如權利要求32所述的方法,其特徵在於,所述聚合酶結構域是ΔTaq聚合酶結構域。
36.如權利要求25所述的方法,其特徵在於,Sso7結構域包含SEQ ID NO2,其中位點24的色氨酸殘基被選自甘氨酸、丙氨酸和纈氨酸的胺基酸殘基置換。
全文摘要
本發明提供在聚合酶反應中活性改善的Sso7-聚合酶偶聯物。
文檔編號C12N9/00GK1720324SQ200380105035
公開日2006年1月11日 申請日期2003年10月20日 優先權日2002年10月23日
發明者王焱 申請人:Mj生物工程股份有限公司

同类文章

一種新型多功能組合攝影箱的製作方法

一種新型多功能組合攝影箱的製作方法【專利摘要】本實用新型公開了一種新型多功能組合攝影箱,包括敞開式箱體和前攝影蓋,在箱體頂部設有移動式光源盒,在箱體底部設有LED脫影板,LED脫影板放置在底板上;移動式光源盒包括上蓋,上蓋內設有光源,上蓋部設有磨沙透光片,磨沙透光片將光源封閉在上蓋內;所述LED脫影

壓縮模式圖樣重疊檢測方法與裝置與流程

本發明涉及通信領域,特別涉及一種壓縮模式圖樣重疊檢測方法與裝置。背景技術:在寬帶碼分多址(WCDMA,WidebandCodeDivisionMultipleAccess)系統頻分復用(FDD,FrequencyDivisionDuplex)模式下,為了進行異頻硬切換、FDD到時分復用(TDD,Ti

個性化檯曆的製作方法

專利名稱::個性化檯曆的製作方法技術領域::本實用新型涉及一種檯曆,尤其涉及一種既顯示月曆、又能插入照片的個性化檯曆,屬於生活文化藝術用品領域。背景技術::公知的立式檯曆每頁皆由月曆和畫面兩部分構成,這兩部分都是事先印刷好,固定而不能更換的。畫面或為風景,或為模特、明星。功能單一局限性較大。特別是畫

一種實現縮放的視頻解碼方法

專利名稱:一種實現縮放的視頻解碼方法技術領域:本發明涉及視頻信號處理領域,特別是一種實現縮放的視頻解碼方法。背景技術: Mpeg標準是由運動圖像專家組(Moving Picture Expert Group,MPEG)開發的用於視頻和音頻壓縮的一系列演進的標準。按照Mpeg標準,視頻圖像壓縮編碼後包

基於加熱模壓的纖維增強PBT複合材料成型工藝的製作方法

本發明涉及一種基於加熱模壓的纖維增強pbt複合材料成型工藝。背景技術:熱塑性複合材料與傳統熱固性複合材料相比其具有較好的韌性和抗衝擊性能,此外其還具有可回收利用等優點。熱塑性塑料在液態時流動能力差,使得其與纖維結合浸潤困難。環狀對苯二甲酸丁二醇酯(cbt)是一種環狀預聚物,該材料力學性能差不適合做纖

一種pe滾塑儲槽的製作方法

專利名稱:一種pe滾塑儲槽的製作方法技術領域:一種PE滾塑儲槽一、 技術領域 本實用新型涉及一種PE滾塑儲槽,主要用於化工、染料、醫藥、農藥、冶金、稀土、機械、電子、電力、環保、紡織、釀造、釀造、食品、給水、排水等行業儲存液體使用。二、 背景技術 目前,化工液體耐腐蝕貯運設備,普遍使用傳統的玻璃鋼容

釘的製作方法

專利名稱:釘的製作方法技術領域:本實用新型涉及一種釘,尤其涉及一種可提供方便拔除的鐵(鋼)釘。背景技術:考慮到廢木材回收後再加工利用作業的方便性與安全性,根據環保規定,廢木材的回收是必須將釘於廢木材上的鐵(鋼)釘拔除。如圖1、圖2所示,目前用以釘入木材的鐵(鋼)釘10主要是在一釘體11的一端形成一尖

直流氧噴裝置的製作方法

專利名稱:直流氧噴裝置的製作方法技術領域:本實用新型涉及ー種醫療器械,具體地說是ー種直流氧噴裝置。背景技術:臨床上的放療過程極易造成患者的局部皮膚損傷和炎症,被稱為「放射性皮炎」。目前對於放射性皮炎的主要治療措施是塗抹藥膏,而放射性皮炎患者多伴有局部疼痛,對於止痛,多是通過ロ服或靜脈注射進行止痛治療

新型熱網閥門操作手輪的製作方法

專利名稱:新型熱網閥門操作手輪的製作方法技術領域:新型熱網閥門操作手輪技術領域:本實用新型涉及一種新型熱網閥門操作手輪,屬於機械領域。背景技術::閥門作為流體控制裝置應用廣泛,手輪傳動的閥門使用比例佔90%以上。國家標準中提及手輪所起作用為傳動功能,不作為閥門的運輸、起吊裝置,不承受軸向力。現有閥門

用來自動讀取管狀容器所載識別碼的裝置的製作方法

專利名稱:用來自動讀取管狀容器所載識別碼的裝置的製作方法背景技術:1-本發明所屬領域本發明涉及一種用來自動讀取管狀容器所載識別碼的裝置,其中的管狀容器被放在循環於配送鏈上的文檔匣或託架裝置中。本發明特別適用於,然而並非僅僅專用於,對引入自動分析系統的血液樣本試管之類的自動識別。本發明還涉及專為實現讀