新四季網

a-澱粉酶與纖維素結合結構域融合以用於澱粉降解的製作方法

2023-05-20 08:42:36

專利名稱:a-澱粉酶與纖維素結合結構域融合以用於澱粉降解的製作方法
技術領域:
本發明特別是涉及糖類結合結構域(「CBD」)和用於工業澱粉加工(值得注意的是用於甜味劑,特別是含有葡萄糖和/或果糖的糖漿的生產(參見下文)的澱粉加工)的這類酶的雜合體的應用,所述的一類酶具體是澱粉分解酶,例如用於所謂的「澱粉液化作用」加工(參見下文)的α-澱粉酶,其中將澱粉降解(常稱為「糊化」)到較小的寡聚和/或多糖片段,或者是與所謂的「糖化作用」加工有關的用於將支鏈澱粉衍生的澱粉片段脫支的脫支酶(例如異澱粉酶或支鏈澱粉酶),「糖化作用」加工過程(參見下文)通常是在液化階段之後進行的。本發明也涉及由CDB-接頭-酶組成的雜合體酶。
背景技術:
如上所述,本發明在澱粉加工(澱粉轉變)領域特別有價值。常規的澱粉轉變工藝和液化和/或糖化作用工藝的條件描述於例如美國專利3,912,590和EP252730和EP063909。從澱粉生產甜味劑從澱粉生產含有葡萄糖和/或果糖的糖漿的「傳統」工藝通常由三個連續的酶促過程組成,即液化過程,隨後是糖化作用過程和(用於生產含有果糖的糖漿時)異構化過程。在液化過程期間,通常在pH5.5-6.2之間和在95-160℃的溫度下,由α-澱粉酶[EC3.2.1.1;例如TermanylTM(地衣芽孢桿菌α-澱粉酶),可從Novo Nordisk A/S,Bagsvaerd,丹麥獲得]作用約2小時而將澱粉(從含水介質中的澱粉懸浮液形式開始)降解為糊精(澱粉的寡聚和多糖片段)。為了確保在這些條件下有最佳酶穩定性,通常將約1mM的鈣(約40ppm的游離鈣離子)加入到澱粉懸浮液中。
在液化過程之後,通過加入葡糖澱粉酶(澱粉葡糖苷酶,EC3.2.1.3;例如AMGTM,從Novo Nordisk A/S獲得),並且通常加入脫支酶,例如異澱粉酶(EC3.2.1.68)或支鏈澱粉酶(EC3.2.1.41;例如PromozymeTM,從Novo Nordisk A/S獲得)將糊精轉變為右旋糖(D-葡萄糖)。在該步驟之前,通常將介質的pH降低到低於4.5(例如pH4.3),並維持高溫(95℃以上),從而使液化作用的α-澱粉酶活性變性。然後通常將溫度調低到60℃,並加入葡糖澱粉酶和脫支酶。通常使液化過程進行24-72小時。在糖化作用階段完成之後,將介質的pH升高到6-8的範圍內,優選的是pH 7.5,並通過離子交換層析去除鈣離子。然後可利用固定化的「葡萄糖異構酶」(木糖異構酶,EC5.3.1.5;例如SweetzymeTM,從NovoNordisk A/S獲得)將獲得的糖漿(右旋糖糖漿)轉變為高果糖糖漿。
對目前用於澱粉轉化加工的酶的特性進行一些改進可能是必要的。就澱粉液化而言,對液化作用的α-澱粉酶可以進行至少3種改進,概括於下文中;各種改進被視為單方面有益,雖然將它們結合使用(例如1+2,1+3,2+3,或1+2+3)有可能得到更好的效果。改進1降低液化性α-澱粉酶對Ca2+的依賴性為了確保目前用於澱粉液化的α-澱粉酶具有合適的高穩定性,需要加入游離鈣(鈣離子),但是異構階段的介質中存在鈣離子會導致對其中使用的葡萄糖異構酶的活性產生強烈抑制。因此有必要藉助於昂貴的裝置操作(例如離子交換)將介質中的鈣離子含量降低到低於約3-5ppm的游離鈣水平,或者以其它的方式將鈣的抑制作用降低到最小,例如通過在糖化作用階段之後將足以適當地「競爭性取消」鈣離子與葡萄糖異構酶的結合的量的鎂離子加入到介質中。如果不加入鈣離子也可以進行液化過程,從而不需要隨後的昂貴補救裝置操作來去除鈣離子或將其抑制作用降低到最小,則可以顯著地節約資金。
為此,需要在低濃度的游離鈣(<40ppm)中穩定的和高活性的α-澱粉分解酶。優選地,這樣的酶的最適pH值在pH4.5-6.5範圍內,更優選是在pH4.5-5.5範圍內。改進2使無用的Maillard產物的形成降低在液化過程期間無用的Maillard產物的形成程度取決於pH。低pH有利於降低Maillard產物的形成。因此希望能夠將該過程的pH從約pH6.0降低到約pH4.5;不幸的是,公眾已知的所有熱穩定的液化性α-澱粉酶在低pH值(即pH<6.0)時不太穩定,並且其比活性通常較低。
為達到上述目的,需要獲得在pH4.5-6.5範圍內比較穩定、並且優選地維持高比活性的α-澱粉分解酶。改進3液化性α-澱粉酶對糖化作用過程的影響降低以前已經有人報導(美國專利5234823),當用黑麴黴葡糖澱粉酶和B.acidopullulyticus支鏈澱粉酶進行糖化作用時,如果在糖化作用階段之前α-澱粉酶沒有被失活,那麼在液化過程之後保留的殘餘α-澱粉酶活性會導致右旋糖產率較低。如上所述(參見上文),通常通過在溫度降低到60℃以進行糖化作用之前,在95℃將pH調節到pH4.5以下而進行這一失活過程。
對右旋糖產量的這一負面影響的原因目前沒有完全搞清楚,但是有假設說這是由於所使用的液化性α-澱粉酶製劑(例如TermanylTM產物,例如TermanylTM120L)通過水解支鏈澱粉分支點附近和兩側的1,4-α-葡糖苷鍵而產生「極限糊精」(它是B.acidopullulyticus支鏈澱粉酶的較差底物)所導致的。葡糖澱粉酶對這些極限糊精的水解導致產生三糖4-α-葡糖基麥芽糖,該糖僅緩慢地被葡糖澱粉酶水解。
開發不再受這一缺點困擾的熱穩定的α-澱粉分解酶將是一個重要的工藝改進,因為這樣將不再需要單獨的失活步驟。
本發明的目的之一是獲得與澱粉液化過程相關的α-澱粉分解酶改進性能-例如通過獲得一種或多種上面概述的改進-通過改變該酶與澱粉底物的親和性,使經修飾的酶與該底物接觸更緊密。
發明概述本發明一方面涉及使用修飾形式的液化性α-澱粉酶的用於液化澱粉的改進的酶促方法,其中所述的α-澱粉酶連接到包括糖類結合結構域的胺基酸序列上(參見下文)。
本發明也涉及用於液化澱粉的改進的酶促方法,其中除了用經修飾的α-澱粉酶外,還用脫支酶進行處理。通過將其連接到包含糖類結合結構域的胺基酸序列上可以修飾該脫支酶。
類似地,也在本發明範圍內的是,估計在糖化過程中使用經類似修飾(即CBD衍生的)形式的脫支酶(例如異澱粉酶或支鏈澱粉酶),使支鏈澱粉衍生的澱粉片段(例如與上文概述的澱粉轉變過程的糖化作用步驟有關)脫支,將導致脫支性能加強,從而可增加右旋糖的產量。發明詳述因此本發明的第一個方面涉及用於液化澱粉的方法,其中將澱粉底物在含水介質中用經修飾的酶(酶雜合體)進行處理,所述經修飾的酶包含與含有糖類結合結構域(CBD)的胺基酸序列連接(即共價連接)的α-澱粉酶胺基酸序列。
本發明也涉及用於液化澱粉的改進的酶促方法,其中除了用經修飾的α-澱粉酶外,也用脫支酶處理。該脫支酶可以通過連接到包含糖類結合結構域的胺基酸序列上而得到修飾。
本發明的又一方面涉及用於對已經進行過液化加工的澱粉進行糖化作用的方法,其中液化之後的反應混合物用經修飾的酶(酶雜合體)處理,所述經修飾的酶包含與含有糖類結合結構域(CBD)的胺基酸序列連接(即共價連接)的支鏈澱粉脫支酶(如異澱粉酶或支鏈澱粉酶)的胺基酸序列。
應理解在本發明中描述的澱粉液化過程不包括諸如紡織品的脫漿處理,在所述的處理中通過酶促過程從織物或紡織品中去除存在於織物或紡織品(通常稱為纖維素的或含有纖維素的纖維或紡織品)中的澱粉(「漿」)。糖類結合結構域糖類結合結構域(CBD)是優先與多或寡糖(糖類)結合的多肽胺基酸序列,它常常、但並非絕對只能與多或寡糖的水不溶性形式(包括晶體)結合。
雖然在專利和科學文獻中已經描述了許多類型的CBD,但是其中大部分--它們中許多來源於纖維素裂解酶(纖維素酶)--通常被稱為「纖維素結合結構域」;因此典型的纖維素結合結構域是出現在纖維素酶中的CBD。類似地,CBD的其它亞類應包括例如幾丁質結合結構域(通常出現在幾丁質酶中的CBD),木聚糖結構域(通常出現在木聚糖酶中的CBD),甘露聚糖結合結構域(通常出現在甘露聚糖酶中的CBD),澱粉結合結構域(一些澱粉分解酶例如某些葡糖澱粉酶,或例如環糊精葡聚糖轉移酶(「CGT酶」)中可能出現的CBD)和其它。
CBD是由2個或多個多肽胺基酸序列區組成的大多肽或蛋白質的整合部分,尤其是存在於水解酶中,所述水解酶通常包含一個含有用於底物水解的活性位點的催化結構域和一個用於與目的糖類底物結合的糖類結合結構域(CBD)。這樣的酶可以包含一個以上的催化結構域和一個、兩個或三個CBD,還可選擇性地包含一個或多個將CBD與所述催化結構域連接起來的多肽胺基酸序列區,後一類型的區域通常被稱為「接頭」。包含CBD的水解酶的例子有纖維素酶,木聚糖酶,甘露聚糖酶,阿拉伯呋喃糖苷酶,乙醯酯酶和幾丁質酶,其中一些已在上文中提及。也已經在藻類中,例如在紅藻Porphyra purpurea中發現了來源於纖維素酶和木聚糖酶的非水解性多糖結合蛋白質形式的CBD(參見P.Tomme等人,纖維素結合結構域-分類和在不可溶性糖類的酶促降解中的特性,John N.Saddler和Michael H.Penner(Eds),ACS年會系列,No.618(1996))。但是,大多數已知的CBD(由P.Tomme等人(出處同前),分類和命名為「纖維素結合結構域」)來源於纖維素酶和木聚糖酶。
在本發明中,術語「纖維素結合結構域」與後一參考文獻(P.Tomme等人(出處同前))中的含義相同,因此本文使用的簡寫「CBD」經常可以理解為廣義(糖類結合結構域)或原則上狹義地理解(纖維素結合結構域)。P.Tomme等人的參考文獻將120種以上的「纖維素結合結構域」劃分為10個家族(Ⅰ-Ⅹ),它們可能在底物結合機理方面具有不同的功能或作用。然而,估計在將來還會出現新的家族代表和其它CBD家族。
對於其中存在CBD的蛋白質/多肽(例如酶,通常是水解酶),CBD可能位於N或C末端或位於內部位置。
其本身構成CBD的多肽或蛋白質(例如水解酶)的那一部分通常由約30個以上且約250以下的胺基酸殘基組成。例如根據P.Tomme等人(出處同前)描述,在家族Ⅰ中列出和分類的那些CBD由33-37個胺基酸殘基組成,在家族Ⅱa中列出和分類的CBD由95-108個胺基酸殘基組成,在家族Ⅵ中列出和分類的CBD由85-92個胺基酸殘基組成,而在家族Ⅶ中列出和分類的一種CBD(來源於熱纖維端孢菌)由240個胺基酸殘基組成。因此,本身構成CBD的胺基酸序列的分子量通常是在約4kD到約40kD的範圍內,並且通常低於約35kD。酶雜合體本發明的說明書和權利要求書中涉及的酶分類號(EC號)與國際生物化學和分子生物學聯合會命名委員會的推薦(1992),學術出版社,1992一致。
已經在某種程度上指出(參見上文),本文中經修飾的酶(在下文中也稱之為酶雜合體)包括含有與包含CBD的胺基酸序列連接(即共價連接)的澱粉分解酶[在本發明中可以是例如α-澱粉酶(EC3.2.1.1),異澱粉酶(EC3.2.1.68)或支鏈澱粉酶(EC3.2.1.41)]的胺基酸序列的那些種類。
與澱粉降解相關的其它含有CBD的目的酶雜合體包括,例如含有葡聚糖1,4-α-麥芽糖水解酶(EC3.2.1.133),p-澱粉酶(EC3.2.1.2),葡糖澱粉酶(EC3.2.1.3),或新支鏈澱粉酶(EC3.2.1.135)的胺基酸序列的雜合體。
含有CBD的酶雜合體以及其製備和純化的詳細描述是本領域內技術人員已知的(參見,例如WO90/00609,WO94/24158和WO95/16782,以及Greenwood等人,生物技術和生物工程44(1994),第1295-1305)。它們可以例如通過將DNA構建體轉化到宿主細胞中(所述DNA構建體包含通過或不通過接頭而與編碼目的酶的DNA序列連接的編碼纖維素結合結構域的DNA至少一個片段),培養轉化的宿主細胞以表達融合基因。所獲得的重組產物(酶雜合體)在本領域內經常稱為「融合蛋白質」,可由下面的通式描述A-CBD-MR-X在此通式中,A-CBD是至少包含糖類結合結構域(CBD)本身的一個胺基酸序列的N-末端或C-末端區域。MR是中間區域(「接頭」),X是由編碼與CBD連接的酶(或其它蛋白質)的DNA序列所編碼多肽的胺基酸殘基序列。
A部分或者沒有(這樣A-CBD就是CBD本身,即除了構成CBD的胺基酸殘基以外沒有包含其它的胺基酸殘基),或者可以是一個或多個胺基酸殘基的序列(其功能是CBD本身的末端延伸)。接頭(MR)可以是一個鍵,或包含約2到約100個碳原子、特別是2-40個碳原子的短的連接基團。但是,MR優選是具有約2到約100個胺基酸殘基、更優選2-40個胺基酸殘基,例如2-15個胺基酸殘基的序列。
X部分可以構成整個酶雜合體的N-末端或C-末端區域。
因此根據上面所述,所述類型的酶雜合體中的CBD顯然可以位於該酶雜合體的C-末端、N-末端或內部。可用於製備CBD的纖維素酶(纖維素酶基因)適用於分離纖維素酶基因的技術是本領域內技術人員熟知的。在本發明中,術語「纖維素酶」是指可催化纖維素降解為葡萄糖、纖維二糖,纖維三糖和/或其它纖維寡糖的酶。
本發明優選的纖維素酶(即包含優選的CBD的纖維素酶)是微生物纖維素酶,特別是細菌或真菌纖維素酶。內切葡聚糖酶(EC3.2.1.4),特別是單成分(重組)內切葡聚糖酶是優選的纖維素酶類型。
有用的細菌纖維素酶的例子是來源於下列組的細菌或可由它們所產生的纖維素酶假單孢菌,芽孢桿菌,纖維單胞菌,梭菌,Microspora,棲熱袍菌,Caldocellum和放線菌例如鏈黴菌,Thermomonospora和Acidothemus,特別是來自於下列組Pseudomonas cellulolyticus,燦爛芽孢桿菌,Bacillus agaradherens,糞肥纖維單胞菌,熱纖維單胞菌,糞堆梭菌,Microspora bispora,Termomonospora fusca,Termomonosporacellulolyticum和Acidothemus cellulolyticus。
纖維素酶可以是酸性、中性或鹼性纖維素酶,即分別在酸性、中性或鹼性範圍內顯示最大的分解纖維活性的酶。
有用的纖維素酶是酸性纖維素酶,優選的是真菌酸性纖維素酶,它是來源於下列各屬之組的真菌或可由它們所產生的纖維素酶木黴屬,漆斑菌屬,麴黴屬,Phanaerochaete,脈孢黴屬,Neocallimastix和葡萄孢屬。
優選的有用酸性纖維素酶是來源於下列各種真菌或可由它們所產生的酸性纖維素酶綠色木黴,Trichoderma reesei,Trichodermalongibrachiatum,疣孢漆斑菌,黑麴黴,米麴黴,Phanaerochaetechrysosporium,粗糙脈孢黴,Neocallimastix partriciarum和灰葡萄孢。
另一種有用的纖維素酶是中性或鹼性纖維素酶,優選的是真菌的中性或鹼性纖維素酶,它來源於下列組的各屬內真菌或可由它們產生麴黴屬,青黴屬,毀絲黴屬,腐質黴屬,耙菌屬,鐮孢屬,葡萄穗酶屬,帚酶屬,毛殼屬,疣孢黴屬,輪枝孢屬,漆斑菌屬、絲葚黴屬、粘帚黴屬、頭孢屬和支頂孢屬。
優選的鹼性纖維素酶是來源於下列組的各種真菌或可由它們所產生的鹼性纖維素酶Humicola insolens,尖鐮孢,嗜熱毀絲黴,微紫青黴和頭孢黴,優選來自於下列組或可由它們產生的鹼性纖維素酶Humicola insolens DSM1800,尖鐮孢DSM2672,嗜熱毀絲黴CBS117.65和頭孢黴RYM-202。
優選的纖維素酶是一種鹼性內切葡聚糖酶,它與針對高度純化的、來源於Humicola insolens DSM1800的~43kD內切葡聚糖酶而產生的抗體具有免疫反應性,或者它是該~43kD內切葡聚糖酶的衍生物並且顯示纖維素酶活性。
有用的纖維素酶的其它例子是真菌或細菌來源的母體纖維素酶(例如來源於真菌Humicola,木黴屬或鐮孢屬之一的種的菌株的母體纖維素酶)的變體。可用於製備CBD的其它蛋白質(蛋白質基因)
如已經提到的,包含CBD的其它類型水解酶例如有木聚糖酶,甘露聚糖酶,阿拉伯呋喃糖苷酶,乙醯酯酶和幾丁質酶。以前也已經提到,例如在一些藻類(如紅藻Porphyra purpurea)中也發現了非水解性的多糖結合性蛋白質形式的CBD。可參考P.Tomme等人(出處同前)的文獻進一步詳細了解有關這種CBD的來源(生物體屬和種)的具體細節。與本發明相關的其它CBD包括來源於葡糖澱粉酶(EC3.2.1.3)或來源於CGT酶(EC2.4.1.19)的CBD。
衍生自這種來源的CBD通常也適用於本發明。在這一方面,適用於分離例如木聚糖酶基因、甘露聚糖酶基因、阿拉伯呋喃糖苷酶基因、乙醯酯酶基因、幾丁質酶基因(和其它相關基因)的技術是本領域內技術人員熟知的。CBD的分離為了分離例如纖維素酶的纖維素結合結構域,可以使用幾條基因工程途徑。一種方法是使用限制性酶以除去基因的一部分,然後將留下的基因一載體片段讀框一致地融合,以獲得編碼對於特定的基因片段有所截短的蛋白質的突變基因。另一種方法涉及使用外切核酸酶,例如Bal31,從DNA的5』和3』末端外部地或從基因內限制性缺口內部地系統性缺失核苷酸。這些基因缺失方法導致產生編碼縮短的基因分子的突變基因,然後可以評價該突變基因的表達產物的底物結合(例如纖維素酶結合)能力。用於評價結合能力的合適底物包括纖維素物質,例如AvicelTM和棉花織物。其它方法包括使用能夠從目的蛋白質的多肽鏈的剩餘部分裂解CBD(例如末端CBD)的選擇性或特異性蛋白酶。
如已經說明的(參見上文),一旦已經鑑定出編碼底物結合(糖類結合)性區域的核苷酸序列,不管是cDNA還是染色體DNA,那麼可以通過各種各樣的方式對它進行操作以將其與編碼目的酶的DNA序列融合。然後將編碼糖類結合性胺基酸序列的DNA片段和編碼目的酶的DNA通過或不通過接頭而連接起來。然後可以採用各種方法對獲得的連接DNA序列進行操作以獲得表達。優選的微生物表達宿主包括一些麴黴(例如黑麴黴或米麴黴),芽孢桿菌以及諸如大腸桿菌或啤酒酵母之類的生物體。澱粉分解酶適用於作為本發明使用的CBD/澱粉酶雜合體類型的基礎的澱粉酶(特別是α-澱粉酶)包括細菌和真菌來源的酶。在這一點上,也包括這種澱粉酶的經化學或基因工程修飾過的突變體。相關的α-澱粉酶包括例如可得自芽孢桿菌的α-澱粉酶,特別是可得自GB1296839中詳細描述的地衣芽孢桿菌一個特殊菌株的α-澱粉酶。相關的市售澱粉酶包括DuramylTM,TermamylTM,FungamylTM和BANTM(均可得自NovoNordisk A/S,Bagsvaerd,丹麥),以及RapidaseTM和Maxamyl PTM(可得自Gist-Brocades,Holland),OptithermTM(可從Solvay獲得),Spezym AATM和Spezyme Delta AA(可從Genencor獲得),和KeistaseTM(可從Daiwa獲得)。
適合作為本發明中使用的CBD/澱粉酶雜合體類型的基礎的其它澱粉酶(特別是α-澱粉酶)包括由BAN
(可從Novo Nordisk獲得)的1-35個N-末端胺基酸與具有一個或多個下列突變H156Y,A181T,N190F,A209V,Q264S的Termanyl
(可從Novo Nordisk獲得)的C-末端36-483個C-末端胺基酸組成的雜合體α-澱粉酶;或具有一個或多個下列突變I201E,D207H,E211Q,H205S的Termamyl
;或具有一個或多個下列突變H133Y,N188P、S的MaxamylTM(可從Gist-Brocades/Genencor獲得)。澱粉或澱粉片段脫支酶異澱粉酶適合作為本發明使用的CBD/異澱粉酶雜合體類型的基礎的異澱粉酶(EC3.2.1.68)包括細菌來源的那些。這樣也包括這種異澱粉酶的經化學或基因工程修飾的突變體。相關的異澱粉酶包括例如可從假單孢菌(例如假單孢菌SMP1或澱粉皮假單孢菌SB15),芽孢桿菌(例如解澱粉芽孢桿菌),黃桿菌或噬纖維菌(溶桿菌)獲得的異澱粉酶。
支鏈澱粉酶適合作為本發明使用的CBD/支鏈澱粉酶雜合體類型的基礎的支鏈澱粉酶(EC3.2.1.41)包括細菌來源的那些。這樣也包括這種支鏈粉酶的經化學或基因工程修飾的突變體。相關的支鏈澱粉酶包括例如可從芽孢桿菌(例如B.acidopullulyticus;如PromozymeTM,可從Novo Nordisk A/S獲得)獲得的支鏈澱粉酶。質粒能夠表達融合蛋白質的質粒的製備是本領域內技術人員熟知的(參見,例如WO90/00609和WO95/16782),所述融合蛋白質具有從一個以上多肽的片段衍生的胺基酸序列。表達盒可以包括在用於在合適細胞宿主中維持附加體的複製體系內,或者可以提供沒有複製系統的表達盒,此時它將整合到宿主基因組中。可根據已知的技術,例如轉化、微量注射等等,將該DNA導入到宿主中。
一旦已經將該融合基因導入到合適的宿主中,則可以培養宿主以便表達該融合基因。通常,另外加入可以提供融合基因分泌的信號序列是較令人滿意的。有用的融合基因的典型例子是信號序列--(原肽)--糖類結合結構域-接頭-目的酶,或信號序列--(原肽)-目的酶-接頭-糖類結合結構域,其中原肽序列通常含有5-25個胺基酸殘基。
重組產物可以是糖基化的或非糖基化的。α-澱粉分解酶活性(KNU)的測定利用馬鈴薯澱粉作為底物,可以測定酶或酶雜合體的α-澱粉分解活性。該方法是基於改性的馬鈴薯澱粉的裂解(水解),反應後將澱粉/酶或澱粉/雜合體酶溶液的樣品與碘溶液混合。起初,形成稍黑的藍顏色,但是在澱粉的裂解期間,藍顏色變得越來越弱,並逐漸轉變為稍紅的棕色。將所得顏色與帶色的玻璃校正標準比較。
1千Novo α-澱粉酶單位(KNU)定義為在標準條件下(即在37±0.05℃,0.0003M鈣離子,pH5.6)下使5.26克澱粉乾物質(可溶性的MerckAmylum)糊精化的酶(酶雜合體)的量。適於評估含有CBD的酶雜合體在澱粉加工中的效能的測試條件適於測試如上所述的CBD/α澱粉酶、CBD/異澱粉酶或CBD/支鏈澱粉酶雜合體的測試條件(例如pH,溫度,鈣濃度等等條件)可以是上面就工業澱粉轉化加工而描述的那些條件。適於測定多種類型的酶在各種條件下(例如pH,溫度,鈣濃度等等,取決於酶雜合體的特性)的酶活性的測定方法是本領域已知的,所述酶適於與本文所述的CBD連接,本領域的普通技術人員能夠容易地選擇適於評估在本文中應用的酶雜合體的酶效能的測試方法。
本發明也涉及編碼具有澱粉分解活性的雜合體酶的分離DNA序列,該序列包含(a)編碼澱粉分解活性的DNA序列;(b)編碼CBD的DNA序列;和(c)編碼SEQ ID NO:21所示接頭序列的DNA序列或其片段。
含有通過接頭連接的酶和CBD的雜合體酶的一個常見問題是由於存在接頭,它們不是非常穩定的。本發明人已經發現,當利用SEQ IDNO:21所示接頭或其基本部分時,雜合體是非常穩定的。
本發明的分離DNA序列通常編碼具有澱粉分解活性如α澱粉酶活性,尤其是芽孢桿菌α澱粉酶活性,特別是Termamyl
的活性或其突變體,或上面在「澱粉分解酶」部分提到的澱粉分解活性之一的酶。CBD可以是任何CBD,例如在上述「糖類結合結構域」部分所述的CBD。在一個優選實施方案中,CBD是Bacillus agaradherens NCIMBNo.40482鹼性纖維素酶Cel5A的CBD或糞堆梭菌(NCIMB11754)XynA的CBD二聚體。
在本發明一個具體實施方案中,該分離的DNA序列是SEQ ID NO:19所示由質粒pMB492編碼的Termamyl
-接頭-Cel5A-CBD。
本發明另一方面涉及含有與一個或多個控制序列可操作地連接的本發明分離DNA序列的DNA構建體,所述控制序列能夠在適當的表達宿主中指導該DNA序列的表達。
啟動子可以是在選定的宿主細胞中顯示轉錄活性的任何DNA序列,它可以得自編碼與宿主細胞同源或異源的蛋白質的基因。在細菌宿主細胞中能指導編碼本發明纖維分解酶的DNA進行轉錄的適當啟動子例如有嗜熱脂肪芽孢桿菌麥芽原澱粉酶基因、地衣芽孢桿菌α澱粉酶基因、解澱粉芽孢桿菌BAN澱粉酶基因、枯草芽孢桿菌鹼性蛋白酶基因或者短小芽孢桿菌木聚糖酶或木糖苷酶基因等的啟動子,λ噬菌體PR或PL啟動子,或大腸桿菌lac,trp或tac啟動子。
適用於酵母宿主細胞的啟動子的例子包括來自酵母糖酵解基因(Hitzeman等人(1980)生物化學雜誌,255:12073-12080;Alber和Kawasaki(1982)分子應用遺傳學雜誌1:419-434)或乙醇脫氫酶基因[Young等人(1982),在微生物基因工程生產化學製品(Hollaender等人編),Plenum出版社,紐約]的啟動子,或TPI1(美國4599311)或ADH2-4C(Russell等人(1983),自然,304:652-654)啟動子。
為了將CBD/酶雜合體導入宿主細胞的分泌途徑,可以在表達載體中提供一個分泌信號序列(也已知為前導序列,前原序列或前序列)。分泌信號序列是以正確的閱讀框架與編碼酶雜合體的DNA序列連接在一起的。分泌信號序列通常位於編碼澱粉分解酶的DNA序列的5』端。分泌信號序列可以是通常與澱粉分解酶有關的分泌信號序列,或可以來自編碼另一種分泌蛋白質的基因。
在一個優選實施方案中,本發明的表達載體可以含有與WO86/05812中所述地衣芽孢桿菌(澱粉酶基因的分泌信號編碼序列基本上相同的分泌信號序列。
而且,可以例如通過串聯擴增技術(涉及單或雙交換)或通過多拷貝技術(如美國4959316或WO91/09129中所述)而增加表達。或者,表達載體可包括一個溫度敏感的複製原點,例如EP283075中所述。
用於分別連接編碼纖維分解酶的DNA序列、啟動子和可選擇地終止子和/或分泌信號序列,並將它們插入含有複製所需信息的適當載體中的方法是本領域技術人員熟知的(參見例如Sambrook等人(1989),出處同上)。
本發明也涉及含有本發明DNA構建體、啟動子以及轉錄和翻譯終止信號的重組表達載體。
本發明的另一個目的是提供含有本發明DNA構建體的宿主細胞。
欲在其中導入本發明DNA構建體或重組表達載體的本發明宿主細胞可以是能夠產生澱粉分解酶的任何細胞,包括細菌、酵母、真菌和高等真核細胞。
在培養時能夠產生本發明纖維分解酶的細菌宿主細胞的例子是革蘭氏陽性細菌,如芽孢桿菌菌株,特別是枯草芽孢桿菌、地衣芽孢桿菌、遲緩芽孢桿菌、短芽孢桿菌、嗜熱脂肪芽孢桿菌、嗜鹼芽孢桿菌、解澱粉芽孢桿菌、凝結芽孢桿菌、環狀芽孢桿菌、燦爛芽孢桿菌、巨大芽孢桿菌、短小芽孢桿菌、蘇雲金芽孢桿菌或B.agaradherens的菌株,或鏈黴菌菌株,特別是淺青紫鏈黴菌或鼠灰鏈黴菌的菌株,或者是革蘭氏陰性細菌如大腸桿菌。細菌的轉化可以通過原生質體轉化或通過已知的方式利用感受態細胞進行(例如,Sambrook等人(1989),出處同上)。
當在細菌如大腸桿菌中表達CBD/酶雜合體時,酶可以保留在細胞質中,通常是作為不溶性顆粒(已知為內涵體),或者可以通過細菌分泌序列引導到壁膜間隙中。在前一種情況下,裂解細胞並回收顆粒和變性,在這之後,通過稀釋變性試劑而再摺疊纖維分解酶。在後一情況下,通過破碎細胞(例如超聲波或等滲休克)以釋放壁膜間隙內的內容物並回收雜合體酶,即可以從壁膜間隙回收雜合體酶。
然後在允許纖維分解酶表達的條件下,在適當的營養培養基中培養如上所述的已轉化或轉染的宿主細胞,在這之後,即從培養物中回收所得的纖維分解酶。
用於培養細胞的培養基可以是適於培養宿主細胞的任何常規培養基,如基本培養基或含有適當補充物的複合培養基。從商業供應商可以得到適當的培養基或者可以根據公開的配方(例如美國典型培養物保藏中心的目錄)製備。然後可以根據目的纖維分解酶的類型,通過常規方法從培養物回收細胞產生的纖維分解酶,所述方法包括通過離心或過濾從培養基中分離宿主細胞,通過鹽(例如硫酸銨)的方法沉澱上清液或過濾液中的蛋白質成分,並經多種層析方法如離子交換層析、凝膠過濾層析、親和層析等進行純化。
本發明還涉及用於生產本發明的CBD/酶雜合體的方法,所述方法包括(a)培養芽孢桿菌菌株以產生含有所述多肽的上清液;和(b)回收該多肽。
本發明還涉及用於生產本發明的雜合體酶的方法,所述方法包括(a)在有助於表達所述多肽的條件下培養宿主細胞;和(b)回收該多肽。
在兩種方法中,均利用本領域已知的方法在適於生產雜合體酶的營養培養基中培養細胞。例如,可以在適當的培養基中和允許多肽表達和/或分離的條件下,通過搖瓶培養,在實驗室或工業發酵罐中進行小規模或大規模發酵(包括連續的、分批、分批補料或固態發酵)而培養細胞。在含有碳和氮源及無機鹽的適當營養培養基中利用本領域已知的方法進行培養(參見,細菌和酵母的參考文獻;Bennett,J.W.和LaSure,L.,編輯(1991),《真菌中的更多基因操作》,學術出版社,CA)。從商業供應商可以得到適當的培養基,或可以根據公開的組合物(例如,在美國典型培養物保藏中心的目錄中)可以製備。如果多肽被分泌到營養培養基中,就可以從培養基中直接回收多肽。如果多肽不被分泌,則可以從細胞裂解物中回收多肽。
可以利用本領域已知的特異於雜合體酶的方法檢測雜合體酶。這些檢測方法包括特異性抗體的應用,酶產物的形成,或酶底物的消失。例如,可以利用酶測試確定酶的活性。確定澱粉分解活性的方法是本領域已知的,下面將進行描述。
可以通過本領域已知的方法回收得到的雜合體酶。例如,可以通過常規方法,包括但不限於離心、過濾、萃取、噴霧乾燥、蒸發或沉澱等而從營養培養基中回收雜合體酶。然後,可以通過各種層析方法,例如離子交換層析、凝膠過濾層析、親和層析等進一步純化已回收的雜合體酶。
可以通過本領域已知的各種方法,包括但不限於層析法(例如離子交換、親和、疏水、層析聚焦和尺寸排阻層析),電泳方法(例如製備性等電聚焦(IEF),差異溶解性(例如硫酸銨沉澱),或萃取(參見,例如,蛋白質純化(Janson和Ryden編輯),VCH出版社,紐約,1989)純化本發明的雜合體酶。
在本發明的最後方面涉及由本發明分離的DNA序列編碼的分離和純化的CBD/酶雜合體,特別是SEQ ID NO:20所示的雜合體。
材料和方法材料酶和酶雜合體Termamvl
-接頭-CBDEGV:Termamyl
和來自Humicola insolensEGV的真菌CBDEGV的雜合體。在實施例9中敘述了該雜合體的構建過程。
CBDCenA-Termamyl
來自糞肥纖維單胞菌內切葡聚糖酶A(CenA)的CBDCenA和Tcrmamyl
經由接頭連接的雜合體。在實施例8中敘述了該雜合體的構建過程。
Termamyl
(從Novo Nordisk A/S獲得)質粒pDN1528(S.J
rgensen等人(1991),細菌學雜誌,173卷,p559-567)pBluescriptKSII-(Stratagene,USA)pDNl981(P.L.J
rgensen,C.K.Hansen,G.B.Poulsen和B.Diderichsen(1990),體內基因工程作為質粒構建的工具的同源重組,基因,96,p37-41)pSJl678在WO94/19454中敘述;pDN1981由J
rgensen等人(1990),基因,96:37-41)記載。
菌株表達下面實施例l中所述編碼內切葡聚糖酶的SEQ ID NO:1的DNA序列的芽孢桿菌ACl3 NCIMB 40482(與Bacillus agaradherensDSM8721相同)大腸桿菌菌株製備可用於電穿孔的、編碼α乙醯乳酸脫羧酶(一種來自短芽孢桿菌的外切酶)的大腸桿菌SJ2細胞(Diderichsen等人(1990),細菌學雜誌,172:4315-4321),並利用來自BIO-RAD的GenePulserTM電穿孔儀按照生產商所述進行電穿孔轉化。
利用枯草芽孢桿菌PL2306作為轉化反應的宿主菌株。這是一種纖維素酶陰性菌株,它是通過在枯草芽孢桿菌菌株DN1885中已知的枯草芽孢桿菌纖維素酶基因的轉錄單位中導入一個破壞而產生的(Diderichsen,B.,Wedsted,U.,Hedegaard,L.,Jensen,B.R.,Sj
holm,C.(1990)編碼α乙醯乳酸脫羧酶(一種來自短芽孢桿菌的外切酶)的aldB的克隆。細菌學雜誌,172:4315-4321)。不僅DN1885的纖維素酶基因遭到破壞,而且兩個蛋白酶編碼基因也遭到破壞,這兩個蛋白酶基因即aprE(Stahl,M.L.和E.Ferrari,1984,利用體外來源的缺失突變替代枯草芽孢桿菌枯草蛋白酶結構基因。細菌學雜誌,158:411-418)和nprE基因(Yang,M.Y.等人,1984,枯草芽孢桿菌中性蛋白酶基因的克隆和利用已克隆的基因產生體外來源的缺失突變。細菌學雜誌,160:16-21)。
基本上如在枯草芽孢桿菌和其它革蘭氏陽性細菌中所述進行基因破壞(A.LSonenshein,J.A.Hoch和Richard Losick編,美國微生物學協會,1993,p618)。
枯草芽孢桿菌利用ToC46(Diderichsen,B.,Wedsted,U.,Hedegaard,L.,Jensen,B.R.,Sj
holm,C.(1990)編碼α乙醯乳酸脫羧酶(一種來自短芽孢桿菌的外切酶)的aldB的克隆。細菌學雜誌,172,4315-4321)作為次級表達宿主,如上所述進行感受態細胞製備和轉化。
溶液/培養基/試劑來自Cerestar的蠟質玉米玉米澱粉Cerestar(89%DS)GL 03406批號624362TY和LB瓊脂(如Ausubel,F.M.等人編輯的「當代分子生物學方法」。John Wiley和Sohs,1995中所述)。
SB:32克胰蛋白腖,20克酵母提取物,5克NaCl和5毫升1NNaOH在無菌水中混合至終體積為1升。在121℃通過高壓蒸汽滅菌20分鐘而將溶液滅菌。
10%Avicel將100克的Avicel(FLUKA,瑞士)與無菌水混合至終體積為1升,通過在121℃高壓蒸汽處理20分鐘而將10%Avicel滅菌。
緩衝液0.05M磷酸鉀,pH7.5方法DE測定DE(右旋糖當量)定義為樣品中以溶解的乾物質的w/w%表示的還原性糖類的量(測量為右旋糖當量)。它由新亞銅試劑測試測量(Dygert,LiFloridana(1965),生物化學年評,368)。新亞銅試劑測試的原理是在樣品中加入CuSO4,還原性糖還原Cu++,並在450納米測量形成的新亞銅試劑複合物。
一般分子生物學方法利用分子生物學的標準方法進行DNA操作和轉化(Sambrook等人(1989),分子克隆實驗室手冊,冷泉港實驗室,冷泉港,紐約;Ausubel,F.M.等人編輯「當代分子生物學方法」,John Wiley和Sons,1995;Harwood,C.R.,和Cutting,S.M.編輯「用於芽孢桿菌的分子生物學方法」,John Wiley和Sons,1990)。
根據供應商的說明書使用DNA操作中的酶。
纖維分解活性纖維分解活性可表示為利用羧甲基纖維素(CMC)作為底物,在pH9.0確定的纖維素酶粘度單位(CEVU)。
相對於酶標準(<1%水,保持在-20℃N2氣中;重要標準保存在-80℃)確定纖維素酶粘度單位。使用的標準17-1187在標準溫育條件即pH9.0,Tris緩衝液0.1M,CMC Hercules 7 LFD底物33.3克/升,40.0℃30分鐘下是4400 CEVU/克。
α-澱粉酶-Termamyl
活性參見可索要的Novo Nordisk分析方法AF 9/6。
實施例給出下述實施例的目的是向本領域普通技術人員完全公開和描述怎樣產生和使用各種構建體,進行本發明的各種方法,並不打算用來限制本發明人視為他們的發明的範圍。除非另有指出,各部分均以重量分計量,溫度是攝氏度,壓力是或接近大氣壓。已經儘量保證所用數字的準確度(例如DNA序列的長度、分子量、數量、特定成分等等),但應該考慮可以存在一些偏差。
實施例1Bacillus agaradherens內切葡聚糖酶基因的克隆基因組DNA的製備如WO94/01532中所述,在液體培養基中增殖菌株NCIMB40482(與Bacillus agaradherens DSM 8721相同)。在30℃和300rpm培養16小時後,收穫細胞,通過Pitcher等人(1989),應用微生物學通訊,8:151-156敘述的方法分離基因組DNA。
構建基因組文庫利用限制酶Sau3A部分消化基因組DNA,在0.7%瓊脂糖凝膠上電泳進行大小分級分離。通過電泳到DEAE纖維素紙上分離大小在2-7kb之間的片段(Dretzen等人(1981),生物化學年評,112:295-298)。將分離的DNA片段連接到經BamHⅠ消化的pSJl678質粒DNA上。
PCR擴增為了得到連接到pSJl678載體上的內切葡聚糖酶基因,將連接混合物在PCR反應中用作模板,所述PCR反應中含有各200mM的各種核苷酸(dATP,dCTP,dGTP,dTTP),2.5mM MgCl2,擴增高保真度緩衝液,2.0單位的擴增高保真度PCR系統酶混合物和各300nM的下述引物引物1(#9555):5′-TCACAGATCCTC-GCGAATTGGTGCGGCCGCGTNGTNG-ARGARCAYGGNC-3′(SEQID No.3).
引物1是設計為與WO94/01532中提供的N末端胺基酸序列的胺基酸序列(Val-Val-Glu-Glu-His-Gly-Gln)(SEQ ID NO:4)匹配的簡併引物。最後一個胺基酸只由該密碼子第一個核苷酸C給出。C是該引物的3』核苷酸。
另外,在5′末端包含一個NotⅠ位點以用於克隆目的的,這些核苷酸由下面劃線表示。引物2(#9029);5′-CAGAGCAAGAGATTACGCGC-3′(SEQ ID NO:5).
引物2對應於pSJ1678載體中存在的一段序列。
按照下述方案在Hans Landgraf THERMOCYCLER(HansLandgraf,德國)中進行PCR循環1×(94℃120秒);10×(94℃10秒,55℃30秒,72℃240秒);30×(94℃10秒;55℃30秒;72℃180秒;每個新循環在72℃增加20秒保持時間);和1×(72℃300秒)。
在0.7%的瓊脂糖凝膠中通過凝膠電泳而對PCR產物進行凝膠純化,從凝膠切出相關的片段(大約1.7kb),並利用QIAquick Gel提取試劑盒(Qiagen,USA),根據生產商的說明純化。在50μl 10mMTris-HCl,pH8.5中洗脫已純化的DNA。
將這一DNA用作PCR再擴增的模板,其中仍使用與上述相同的引物、混合物和循環方案。
在0.7%瓊脂糖凝膠中凝膠電泳而對PCR產物進行凝膠純化,從凝膠中切出相關的片段,並利用QIAquick Gel提取試劑盒純化。在50μl 10mM Tris-HCl,pH8.5中洗脫已純化的DNA。
利用NotⅠ和HindⅢ消化已純化的DNA,如上所述進行凝膠純化,並連接到也經NotⅠ和HindⅢ消化的載體pBluescriptⅡ KS-(Stratagene,USA)中,利用連接混合物轉化大腸桿菌SJ2。
在含有氨苄青黴素(200μg/ml)並補加了X-gal(5-溴-4-氯-3-吲哚-α-D-吡喃半乳糖苷,50微克/毫升)的LB瓊脂平板上對細胞鋪板。陽性克隆的鑑定和表徵在含有氨苄青黴素(200微克/毫升)並補加了X-gal(5-溴-4-氯-3-吲哚-α-D-吡喃半乳糖苷,50微克/毫升)的LB瓊脂平板上塗布已轉化的細胞,並在37℃培養過夜。第二天,通過在新鮮LB-氨苄青黴素瓊脂平板上對白色菌落再劃線而進行增殖,在37℃培養過夜。一天後,將每個克隆的單菌落轉移到含有氨苄青黴素(200微克/毫升)的液體LB培養基中,並在37℃於250rpm振搖培養過夜。
利用QIAgen質粒純化小試劑盒從液體培養物中提取質粒。利用NotⅠ和HindⅢ消化5微升質粒樣品。通過在0.7%瓊脂糖凝膠(NuSieve,FMC)上凝膠電泳檢查消化物。出現約1.0kb的DNA片段表示這是一個陽性克隆。克隆DNA片段的核苷酸測序利用Taq脫氧末端循環測序試劑盒(Perkin Elmer,USA)和下面的「反向」引物或「正向」引物對經Qiagen純化的質粒DNA測序反向5′-GTTTTCC-CAGTCACGAC-3′(SEQ ID No.6),正向5′-GCGGATAACAATTTCACACAGG-3′(SEQ ID No.7)。
利用APPlied Biosystems 373A自動測序儀,根據生產商的說明對DNA測序。根據Devereux等人(1984),核酸研究,12:387-395的方法進行序列數據的分析。
從這一序列,可以設計新引物用於進行反向PCR[參見McPherson等人(編),《PCR-一種實用方法》;1991,IRL出版社]。對菌株NCIMB 40482的基因組DNA進行反向PCR如上所述分離基因組DNA。利用EcoRⅠ消化2毫克純基因組DNA。在65℃加熱20分鐘而熱失活EcoRⅠ,然後進行DNA的酚氯仿抽提。最後乙醇沉澱DNA,再懸浮於20毫升TE中。
在100毫升含有T4連接酶緩衝液和1單位的T4-DNA連接酶(Boehringer Mannheim,德國)的反應混合物中利用T4連接酶連接1毫升經EcoRⅠ消化的DNA。在14℃連接18小時後,在68℃加熱10分鐘離熱失活連接酶。為了在反向PCR之前使已環化的基因組DNA片段線性化,向連接混合物中補加10U BstEⅡ(BstEⅡ位點存在於上面得到的DNA序列的內部)。
將50毫升經BstEⅡ消化的連接混合物在PCR反應中用作模板,該PCR反應中含有各200mM的每一種核苷酸(dATP,dCTP,dGTP和dTTP),2.5mM MgCl2,擴增高保真度緩衝液,2.0單位擴增高保真度PCR系統酶混合物,和各300nM的下述每一種引物引物3(#19719):5′-TGACCCGTACGGTCCGTGGG-3′(SEQ ID No.8),和引物4(#19720):5′-GGCTCTTGATTTTGTGTCCACC-3′(SEQ ID No.9).
在Hans Landgraf THERMOCYCLER(Hans Landgraf,德國)中按照下面的方案進行PCR循環1×(94℃120秒)10×(94℃10秒;55℃30秒;72℃240秒);30×(94℃10秒;55℃30秒;72℃180秒,每個新循環均在72℃增加保留時間20秒);和1×(72℃300秒)。
在0.7%瓊脂糖凝膠中凝膠純化PCR產物,從凝膠上切出相關的片段(約4-5kb),並利用QIAquick Gel提取試劑盒純化。在50μl 10mMTris-HCl,pH8.5中洗脫已純化的DNA。反向PCRDNA片段的核苷酸測序利用Taq脫氧末端循環測序試劑盒(Perkin Elmer,美國),和如上所述的引物1、3和4,利用應用生物系統373A自動測序儀,根據生產商的說明,對經Qiagen純化的DNA測序。根據Devereux等人(1984,出處同上)的方法進行序列數據的分析。為了克隆如SEQ ID NO:12所示的鹼性內切葡聚糖酶基因,根據已得到的序列設計兩個新引物。它們是#20887(SEQ ID NO:10)和#100084(SEQ ID NO:14),如下所述。
實施例2在枯草芽孢桿菌中表達鹼性內切葡聚糖酶通過PCR克隆SEQ 1D NO:12中的核苷酸序列以用於導入到表達質粒pDN1981中。
如下所述,利用下述兩個含有NdeⅠ和KpnⅠ(KpnⅠ位點方便地位於擴增序列內)限制位點的引物對500ng基因組DNA進行PCR,其中限制位點可用於將編碼內切葡聚糖酶的DNA序列導入到pDN1981中以便表達引物5(#20887):5′-GTA GGC TCA GTC ATA TGT TAC ACA TTG AAA GGG GAG GAG AAT CATGAA AAA GAT AAC TAC TAT TTT TGT CG-3′(SEQ ID No.10),和引物7(#100084):5′-CCT CGC GAG GTA CCA GCG GCC GCG TAC CAC CAA TTA AGT ATG GTAC-3′(SEQID No.14)引物5中的下劃線核苷酸對應於NdeⅠ位點,引物7中的下劃線核苷酸是序列中存在的KpnⅠ位點的一部分。
使用ExpandTM長模板PCR系統(可從Boehringer Mannheim,德國得到),利用含有稀釋10倍的緩衝液1和各200μM的各種dNTP,2.5單位酶混合物(Boehringer Mannheim,德國)和各500pmole的各種引物的混合物進行擴增。
利用DNA熱循環器(可從Landgraf,德國得到)進行PCR反應。先在94℃溫育一次2分鐘,接著的循環方式為94℃變性10秒,55℃退火30秒,68℃延伸4分鐘,進行10個循環的PCR。隨後進行循環方式為94℃變性10秒,55℃退火30秒,和68℃延伸3分鐘的PCR 25個循環(25個循環中每一循環的延伸時間均延長20秒)。
通過在0.7%瓊脂糖凝膠(NuSieve,FMC)中電泳,利用ReadyLoad100bp DNA梯度標準(GibcoBRL,Denmark)作為分子量標記,分析擴增產物的10μl等分試樣。
在PCR循環後,利用QIAquick PCR柱試劑盒(Qiagen,美國),根據生產商的說明純化PCR片段。在50μl 10mM Tris-HCl,pH8.5中洗脫已純化的DNA,利用NdeⅠ和KpnⅠ消化並連接到已經消化的pDN1981中。利用連接混合物轉化枯草芽孢桿菌PL2304。
製備感受態細胞並如Yasbin等人所述[Yasbin R E,Wilson G A和Young F E;枯草芽孢桿菌的溶原性菌株中的轉化和轉染在感受態細胞中選擇性地誘導原噬菌體的證據;細菌學雜誌,1975,121 296-304]進行轉化。分離和測試枯草芽孢桿菌轉化體將轉化細胞鋪板到含有10毫克/毫升卡那黴素,0.4%葡萄糖,10mM KH2PO4和0.1%AZCL HE-纖維素(Megazyme,澳大利亞)的LB瓊脂平板上,並在37℃培養18小時。周圍有藍圈的菌落鑑定為內切葡聚糖酶陽性菌落。
在含有10mg/ml卡那黴素的10毫升TY培養基中接種培養每個陽性轉化體。在37℃和250rpm振蕩下培養1天後,取出50毫升上清液。通過在含有0.1%AZCL HE-纖維素的LB瓊脂平板的瓊脂內穿刺產生的洞中加入50毫升上清液從而鑑定內切葡聚糖酶活性。
在37℃培養16小時後,洞周圍的藍圈表示枯草芽孢桿菌中內切葡聚糖酶的表達。
實施例3分析已克隆的序列來源於已克隆的內切葡聚糖酶基因的蛋白質序列顯示這是一種具有下述組成的內切葡聚糖酶胺基酸殘基1到26對應於信號肽;胺基酸殘基27到326構成真正的內切葡聚糖酶(與家族5的其它糖基水解酶同源);胺基酸殘基327到354對應於接頭;胺基酸殘基355到400對應於纖維素結合結構域(如實施例3中所述);胺基酸殘基401到416對應於接頭;而胺基酸殘基417到462構成第二個纖維素結合結構域[與第一個(在胺基酸殘基355到400)高度同源]。
摩爾消光係數確定為為146.370。分子量約為52千道爾頓。
對於沒有信號序列的蛋白質,其摩爾消光係數確定為146.370。分子量約為49千道爾頓。
該酶沒有半胱氨酸,由帶電胺基酸計算出pI值約為4。
實施例4部分Termamyl
序列的亞克隆對pDN1528上編碼的α澱粉酶基因進行PCR擴增,以便在編碼區的3』末端導入一個BamHⅠ位點。如下進行PCR和克隆。在補加了各200μM的每種dNTP,2.6單位高保真度
擴增酶混合物,和各300pmol的下述每種引物的高保真度
PCR緩衝液(Boehringer Mannheim,德國)中PCR擴增約10到20ng質粒pDN1528引物8,#52895′-GCT TTA CGC CCG ATT GCT GAC GCT G-3′(SEQ ID No.15)引物9,#267485′-GCG ATG AGA CGC GCG GCC GCC TAT CTT TGA ACA TAA ATT GAA ACGGAT CCG-3′(SEQ ID No.16)限制性位點BamHⅠ下面劃線。
利用DNA熱循環儀(Landgraf,德國)進行PCR反應。先在94℃2分鐘,60℃30秒和72℃45秒溫育一次,接著按照下列循環方式94℃變性30秒,60℃退火30秒,在72℃延伸45秒進行PCR的10次循環,然後是在94℃變性30秒,60℃30秒和72℃45秒進行20次循環(在每個循環的延伸步驟均增加20秒)。通過在1.0%瓊脂糖凝膠(NuSieve,FMC)中電泳,利用ReadyLoad 100bp DNA梯度標準(GibcoBRL,丹麥)作為分子量標記分析擴增產物的10μl等分試樣。
將如上所述產生的PCR產物的40微升等分試樣利用QIAquickPCR純化試劑盒(Qiagen,美國),根據生產商的說明進行純化。在50微升10mM Tris-HCl,pH8.5中洗脫已純化的DNA。利用BamHⅠ和PstⅠ消化25微升已純化的PCR片段,並在1.0%低凝膠化溫度的瓊脂糖(SeaPlaque GTG,FMC)凝膠中電泳,從凝膠中切出相關的片段,利用QIAquick Gel提取試劑盒(Qiagen,美國)根據生產商的說明進行純化。然後將分離的DNA片段連接到經BamHⅠ-PstⅠ消化的pBluescriptⅡKS-上,利用連接混合物轉化大腸桿菌SJ2。
將細胞鋪板在含有氨苄青黴素(200微克/毫升)並補加了X-gal(5-溴-4-氯-3-吲哚-α-D-吡喃半乳糖苷,50微克/毫升)的LB瓊脂平板上,並在37℃培養過夜。第二天,將白色菌落在新鮮的LB氨苄青黴素瓊脂平板上再劃線,並在37℃培養過夜。第二天,將單個菌落轉移到含有氨苄青黴素(200微克/毫升)的液體LB培養基中並在37℃於250rpm振搖培養過夜。
利用QIAgen質粒純化小試劑盒(Qiagen,美國),根據生產商的說明從液體培養物中提取質粒。利用PstⅠ和BamHⅠ消化5微升質粒樣品。在1.0%瓊脂糖凝膠(NuSieve,FMC)上電泳檢查消化物。將含有包含α澱粉酶基因-部分的PstⅠ-BamHⅠ片段的一個陽性克隆命名為pMB335。然後,將這一質粒用於構建α澱粉酶-CBD雜合體。接頭和Bacillus agaradherens NCIMB 40482的C末端CBD的體外擴增在補加了各200μM的每種dNTP,2.6單位高保真度
擴增酶混合物,和各300pmol的下述每種引物的高保真度
PCR緩衝液(BoeringerMannheim,德國)中PCR擴增從Bacillus agaradherens NCIMB40482得到的約100-200ng染色體DNA(如上述實施例1到3所述)引物10,#110150A5′-GCT GCA GGA TCC GTT TCA ATT TAT GTT CAA AGA TCT GAT CCA GATTCA GGA G-3′(SEQ ID No.17)引物11,#1000845′-CCT CGC GAG GTA CCA GCG GCC GCG TAC CAC CAA TTA AGT ATG GTAC-3′(SEQ ID NO.18)限制性位點BamHⅠ和NotⅠ由下劃線標出。
引物設計成可以擴增接頭和上面的實施例中敘述的Bacillusagaradherens NCIMB 40482的內切葡聚糖酶編碼基因的C末端CBD。
利用DNA熱循環儀(Landgraf.德國)進行PCR反應。先在94℃2分鐘,60℃30秒和72℃45秒進行一次溫育,接著進行循環方式為94℃變性30分鐘,60℃退火30秒,72℃延伸45秒的PCR10次循環,然後在94℃30秒,60℃30秒和72℃45秒進行20次循環(在每次循環的延伸步驟增加20秒)。通過在1.5%瓊脂糖凝膠(NuSieve,FMC)中電泳,利用Ready Load 100bp DNA梯度標準(GibcoBRL,丹麥)作為分子量標記,分析擴增產物的10μl等分試樣。通過聚合酶鏈式反應(PCR)進行克隆PCR片段的亞克隆利用QIAquick PCR純化試劑盒(Qiagen,美國),根據生產商的說明,對如上所述產生的PCR產物40微升等分試樣進行純化。在50微升10mM Tris-HCl,pH8.5洗脫已純化的DNA。利用NotⅠ消化25微升已純化的PCR片段,再利用BamHⅠ部分消化,在1.5%低凝膠化溫度的瓊脂糖(SeaPlaque GTG,FMC)凝膠中電泳,從凝膠中切出相關的片段,利用QIAquick Gel提取試劑盒(Qiagen,美國),根據生產商的說明進行純化。然後將已分離的DNA片段與經BamHⅠ-NotⅠ消化的pMB335連接,用連接混合物轉化大腸桿菌SJ2。陽性克隆的鑑定和表徵在含有z(200微克/毫升)的LB瓊脂平板上塗布細胞,並在37℃培養過夜。第二天,在新鮮LB氨苄青黴素瓊脂平板上對菌落再劃線,並在37℃培養溫育。第二天,將單個菌落轉移到含有(200微克/毫升)的液體LB培養基中並在37℃於250rpm振搖培養過夜。
利用QIAgen質粒純化小試劑盒(Qiagen,美國),根據生產商的說明從液體培養物中提取質粒。利用BamHⅠ和NotⅠ消化5微升質粒樣品。通過在1.5%瓊脂糖凝膠(NuSieve,FMC)上電泳檢查消化物。出現與PCR擴增中看到的同樣大小的DNA片段表明這是一個陽性克隆。
將含有α澱粉酶基因和Bacillus agaradherens NCIMB No.40482鹼性纖維素酶Cel5A之CBD的融合構建體的一個陽性克隆命名為MBamyC5ANewlink。將融合構建體克隆至基於芽孢桿菌的表達載體中pDN1528載體含有地衣芽孢桿菌的amyL基因,這一基因在枯草芽孢桿菌中活躍地表達,導致產生出現在上清液中的活性α-澱粉酶。為了進行表達,將如上構建的編碼融合蛋白的DNA導入pDN1528中。
通過利用SalⅠ-NotⅠ消化pMBamyC5ANewlink和pDN1528,純化片段,並將4.7kb pDN1528 SalⅠ-NotⅠ片段與0.5kbpMBamyC5ANewlink SalⅠ-NotⅠ片段連接起來即達到了上面的目的。這產生了雜合構建體與Termamyl基因的讀框一致融合體。參見pMB492的序列(SEQ ID NO:19)。
將連接混合物用於轉化PL2306的感受態細胞。將細胞塗布在含有氯黴素(6微克/毫升)、0.4%葡萄糖和10mM磷酸氫鉀的LB瓊脂平板上,並在37℃培養過夜。第二天,在新鮮的LBPG氯黴素瓊脂平板上對菌落再劃線,並在37℃培養過夜。一天後,將每個克隆的單個菌落轉移到含有氯黴素(6微克/毫升)的液體LB培養基中,並在37℃於250rpm振搖培養過夜。
利用QIAgen質粒純化小試劑盒(Qiagen,美國),根據生產商的說明,從液體培養物中提取質粒,不同的是,在37℃裂解細胞15分鐘之前,重懸浮緩衝液中補加了1毫克/毫升雞蛋白溶菌酶(西格瑪,美國)。利用BamHⅠ和NotⅠ消化5微升質粒樣品。通過在1.5%瓊脂糖凝膠(NuSieve,FMC)上電泳檢查消化產物。出現如PCR擴增中看到的同樣大小的DNA片段表明這是一個陽性克隆。將一個陽性克隆命名為MB492。融合蛋白質的表達,分泌和功能分析將克隆MB492(表達與Bacillus agaradherens的Cel5A-接頭-CBD融合的Termamyl
)在37℃和250rpm下,在SB培養基中培養20小時。將1毫升無細胞上清液與200微升10%Avicel混合。將混合物在0℃保持溫育1小時。在CBD與Avicel的這一結合後,將含有CBD的Avicel於5000g離心5分鐘。將沉澱重懸浮於100微升的SDS-PAGE緩衝液中,在95℃煮5分鐘,5000g離心5分鐘,再將25μl上樣到4-20% Laemmli Tris-Glycine,SDS-PAGE NOVEX凝膠(Novex,美國)上。按照生產商的說明,在XcellTMMini-Cell(NOVEX,美國)中電泳樣品。隨後對凝膠的所有操作,包括利用考馬斯藍染色,脫色和乾燥,均按照生產商的說明進行。
約60千道爾頓的一條蛋白質條帶的出現表示在枯草芽孢桿菌中表達了質粒pMB492(SEQ ID NO:19)中編碼的Termamyl
-接頭-CBD融合體。SEQ ID NO:20給出了pMB492的融合構建體的表達蛋白質序列。
在這一實施例中敘述的目的接頭區是下述特定序列SDPDSGEPDPTPPSDPG(SEQ ID No.21)實施例5從糞肥梭菌NCIMB11754中分離基因組DNA在如國立工業和海洋細菌保藏有限公司(蘇格蘭)推薦的特異培養基中於60℃厭氧培養糞肥梭菌NCIMB11754。通過離心收集細胞。如Pitcher等人(Pitcher,D.G.,Saunders,N.A.,Owen,R.J.(1989),利用硫氰酸胍快速提取細菌基因組DNA。應用微生物學應用通訊,8,151-156)所述分離基因組DNA。糞肥梭菌(NCIMB 11754)XynA的CBD二聚體的體外擴增在添加了各200μM的每種dNTP,2.6單位高保真度
延伸酶混合物和各300pmol下述每種引物的高保真度
PCR緩衝液(BoehringerMannheim,德國)中PCR擴增約100-200ng的基因組DNA(如上所述分離)引物12,#1141355′-GCT GCA GGA TCC GTT TCA ATT TAT GTT CAA AGA TCT CCA ACT CCTGCC CCA TCT CAA AGC-3′(SEQ ID NO.22)引物13,#1101515′-GCG ATG AGA CGC GCG GCC GCT ACT ACC AGT CAA CAT TAA CAG GACCTG AG-3′(SEQ ID NO.23)限制性位點BamHⅠ和NotⅠ由下劃線標出。
設計引物以便擴增編碼糞肥梭菌(NCIMB 11754)XynA的纖維素結合結構域的DNA,根據登記號D13325,從資料庫GenBank獲得該DNA序列。
利用DNA熱循環儀進行PCR反應(Landgraf.德國)。先在94℃2分鐘,60℃30秒,72℃45秒進行一次溫育,接著利用循環方案94℃變性30秒,60℃退火30秒,72℃延伸45秒進行PCR的10次循環,然後在94℃變性30秒,60℃30秒和72℃45秒進行20次循環(在這一延伸步驟中每一循環均增加20秒)。通過在1.0%瓊脂糖凝膠(NuSieve,FMC)中電泳,利用ReadyLoad 100bp DNA梯度標準(GibcoBRL,丹麥)作為分子量標記分析擴增產物的10微升等分試樣。通過聚合酶鏈式反應(PCR)進行克隆PCR片段的亞克隆利用QIAquick PCR純化試劑盒(Qiagen,美國),根據生產商的說明,對如上所述產生的PCR產物40微升等分試樣進行純化。在50微升10mM Tris-HCl,pH8.5中洗脫已純化的DNA。利用BamHⅠ和EagⅠ消化25微升已純化的PCR片段,在1.0%低凝膠化溫度的瓊脂糖(SeaPlaque GTG,FMC)凝膠中電泳,從凝膠中切出相關的片段,利用QIAquick Gel提取試劑盒(Qiagen,美國),根據生產商的說明進行純化。然後將分離的DNA片段與經BamHⅠ-NotⅠ消化的pMB335連接,用連接混合物轉化大腸桿菌SJ2。
然後,如上所述進行下面的步驟-鑑定和表徵陽性克隆。
-將融合構建體克隆至基於芽孢桿菌的表達載體中。
-表達、分泌和功能分析融合蛋白質。
在考馬斯染色的SDS-PAGE上出現約87千道爾頓的一條蛋白質帶顯示在枯草芽孢桿菌中雜合體的表達呈陽性。
所以,在枯草芽孢桿菌克隆MBXynCBD2中表達了雜合體,該雜合體是由DNA序列SEQ ID NO:24編碼的,該DNA序列可以翻譯成SEQ ID NO:25所示的蛋白質序列。
實施例6CBDCel5A-接頭-Termamyl
澱粉加工我們研究了CBDCel5A-接頭-Termamyl
(即實施例4中所述構建的通過SEQ ID NO:21所示接頭與Termamyl
連接的Bacillusagaradherens NCIMB 40482內切葡聚糖酶C末端CBD)與Termamyl
相比,在pH6.0和40ppm Ca2+中,其每微克酶蛋白/克乾物質對澱粉的液化作用是否有所提高。
將振搖的油浴加熱到105℃。製備兩種澱粉懸浮液(含有40ppm Ca++的30%DS),利用NaOH將pH調節到6.0。分別將CBDCel5A-接頭-Termamyl
和Termamyl
與懸浮液混勻。
從每種懸浮液,中各取4份,每份10克。將每份置於帶有螺旋帽的Erlenmeyer燒瓶中。將燒瓶置於105℃的油浴中8分鐘,然後在95℃放置90分鐘。
在油浴中處理7分鐘45秒後,將油浴的恆溫器調節到95.4℃,向油浴中加入室溫下的2升油。啟動鍾,在20、40、60和90分鐘取樣(每種懸浮液取1燒瓶)。向每個燒瓶加入2滴1N HCl以失活澱粉酶。
然後,作為時間的函數確定DE值,以便比較CBDCel5A-接頭-Termamyl
與Termamyl
的每微克酶/克DS的澱粉液化能力。
實施例7構建CBDCenA表達載體pCBDT001將編碼來自糞肥纖維單胞菌內切葡聚糖酶A(CenA)的103殘基CBDCenA的基因片段克隆到高表達載體pTugEO7K3中。通過PCR在CBDCenA基因的5』和3』末端導入適當的限制位點。每種PCR混合物(50毫升總體積)含有25ng模板DNA(pTZ18R-1.6cenA;Damude 1995,博士論文,英國哥倫比亞大學,加拿大),25-50pmol引物(5』SAENH和3』SAENH),10%二甲基亞碸,0.4mM 2』-脫氧核苷-5』三磷酸和於「Thermopol」緩衝液中的1單位Vent DNA聚合酶(新英格蘭生物實驗室)。94℃變性30秒,接著在55℃退火30秒,和72℃引物延伸54秒,如此進行20次連續循環。利用寡核苷酸(5』SAENH)作為引物,在CBDCenA基因片段的5』末端導入一個SpeⅠ位點(下面劃線)引物145′-AGGTCTACTAGTCCCGGCTGCCGCGTCGAC-3′(SEQ ID No.27)利用寡核苷酸(3』SAENH)作為引物,在CBDCenA序列的3』末端導入EcoRⅠ(下面劃線),NheⅠ(黑體)和HindⅢ(斜體)限制位點引物155′-CCGATTAAAGCTTATTAGCTAGCACGGAATTCCGTGGGGCTGGTCGTCGGCAC-3′(SEQ ID No.28)
利用SpeⅠ和HindⅢ消化得到的0.38kb PCR片段,並與Cex前導肽在pTugE07K3的NheⅠ-HindⅢ位點處符合讀框地連接,其中pTugEO7K3已預先用NheⅠ和HindⅢ消化而除去了CBDCex基因片段。通過限制性切割和PCR分析證實最後的構建體pCBDT001。構建CBD-Termamyl
雜合表達載體pNAMK1.0。通過標準方法從芽孢桿菌分離含有Termamyl
基因的質粒pSJ3368,它是pDN1528的一種衍生物(S.J
rgensen等人(1991),細菌學雜誌,173卷,p559-567)。通過PCR導入適當限制位點以用於在大腸桿菌載體pCBDT001中再克隆Termamyl
基因片段和構建雜合體。每種PCR反應混合物(50毫升總體積)含有15ng模板DNA(pSJ3368),3pmol引物(PAM1和PAM2),2mM MgSO4,10%二甲基亞碸,0.4mM 2』-脫氧核苷-5』-三磷酸和於「Thermopol」緩衝液中的1單位Vent DNA聚合酶(新英格蘭生物實驗室)。如下進行三十個連續的循環95℃變性1分鐘,55℃退火1分鐘和72℃引物延伸1.54分鐘。
用寡核苷酸(PAM1)作為引物,在基因的5』末端導入一個NheⅠ(下面劃線)和一個NcoⅠ位點引物165′-TCATGAGCCATGGCTAGCGCAAATCTTAATGGGACGCTGATG-3′(SEQ ID NO.29)利用寡核苷酸(PAM2)作為引物,在Termamyl基因的3』末端導入一個SpeⅠ(黑體)和一個HindⅢ位點(下面劃線)引物175′-ATGACTAAGCTTAC TTACTTAGTGATGGTGATGGTGATGACTAGTTCTTTGAACATAAATTGAAACCGA-3′(SEQ ID NO.30)這樣也導入了一個His6標記(斜體),可便於通過固定化金屬親和層析(IMAC)純化雜合體蛋白質,並且在HindⅢ限制序列之前緊挨著接了一個終止密碼子。利用NheⅠ和HindⅢ消化得到的1.5kb片段,並且與CBDCenA符合讀框地克隆到pCBDT001的NheⅠ-HindⅢ位點,得到pNAMK1.0。通過利用NheⅠ和HindⅢ限制消化及自動測序證實構建體。CBDCenA-PTPTTP-Termamyl
的產生和純化在添加了1.25mM CaCl2和100mg/ml卡那黴素的營養肉湯(TB;1升中含有12克蛋白腖,24克酵母提取物,9.8克K2HPO4,2.2克KH2PO4和8克(10毫升)甘油)(Sambrook等人,1989)(參考Sambrook J.,Fritsch,E.F.Maniatis,T.(1989)分子克隆實驗室手冊,第二版,冷泉港實驗室出版,冷泉港,紐約)中將含有質粒pNAM1.0的大腸桿菌JM101過夜培養物稀釋500倍,並在30℃培養到A600為3.0-5.0。通過加入並丙基-β-D-硫代半乳糖苷(IPTG)到終濃度為0.1mM而誘導蛋白質產生。在30℃再培養培養物18小時,在這段時間內CBD-Termamyl
雜合體將滲漏到培養基中。通過在4℃於13000×g離心10分鐘除去細胞。利用70%(NH4)2SO4並在4℃攪拌過夜而從澄清的上清液沉澱蛋白質。通過在11000×g離心回收蛋白質,將沉澱溶解在20mM Tris-HCl,pH8.0(結合緩衝液)中。在15000×g進一步離心後,將已澄清的上清液上樣到Ni2+瓊脂糖柱(Novagen,Markham,ON)中。利用40mM咪唑,200mM NaCl,20mM Tris-HCl,pH8.0(洗滌緩衝液)洗滌柱。利用在含有500mM NaCl的20mM Tris-HCl緩衝液中的咪唑梯度(0-500mM)洗脫已結合的蛋白質。立即向每一級分中加入CaCl2至終濃度為1mM,以穩定蛋白質。在SDS-PAGE(12%)上及通過活性測量分析各級分。
SEQ ID NO:31顯示了NAM1.0的核苷酸序列,可以翻譯成SEQID NO:32所示的胺基酸序列。
實施例8Termamyl-接頭-來自Humicola insolens EGV.pNAMK6.1的真菌CBD(Termamyl
接頭-CBDEGV)CBD C末端的Termamyl載體NAM2.0每種PCR反應混合物(50毫升總體積)含有15ng模板DNA(pSJ3368),3pmol引物(5Term2和3Term2),2mM MgSO4,10%二甲基亞碸,0.4mM 2』-脫氧核苷-5』-三磷酸和於「Thermopol」緩衝液中的1單位Vent DNA聚合酶(新英格蘭生物實驗室)。如下進行三十個連續循環95℃變性1分鐘,55℃退火1分鐘和72℃引物延伸1.54分鐘。
用寡核苷酸(5Term2)作為引物,在Termamyl基因的5』末端導入NheⅠ(下面劃線)和EcoRⅠ(黑體)位點引物185′-CATATGGCTAGCGAATTCGCAAATCTTAATGGGACGCTG-3′(SEQ ID NO.33)利用寡核苷酸(3Term2)作為引物,在Termamyl
基因的3』末端導入StuⅠ(下面劃線),SpeⅠ(黑體)和HindⅢ(斜體)位點引物195′-AAGCTTACTAGTAGGCCTTCTTTGAACATAAATT GAAA-3′(SEQ ID NO.34)通過限制消化和自動測序證實構建體。
真菌CBD載體通過將來自Humicola insolens內切葡聚糖酶V(WO91/17243)的編碼CBDEGV的基因片段克隆到pTugEO7K3中得到pCBDT006。通過PCR在CBDEGV基因的5』和3』末端導入適當的限制位點。每種PCR混合物(50毫升總體積)含有25ng模板DNA,25-50pmol引物(N137和NIPTcs),10%二甲基亞碸,0.4mM 2』-脫氧核苷-5』-三磷酸,和於「Thermopol」緩衝液中的1單位Vent DNA聚合酶(新英格蘭生物實驗室)。按下述進行20次連續的循環96℃變性45秒,50℃退火60秒,和72℃引物延伸35秒。最後一個循環後在72℃延伸90秒。
利用寡核苷酸(5CBDT6)作為引物,於CBDEGV序列的3』末端,在人工接頭(小寫字母,斜體)之前導入NheⅠ(下面劃線)、EcoRⅠ(黑體,下面劃線)、StuⅠ(黑體)限制位點,在接頭後面導入SpeⅠ(斜體,下面劃線)和Eco47Ⅲ(小寫,黑體)位點引物205′-CCATGGGCTAGCCCTGAATTCAGGCCTccaacccccACTAGTCCGagcgctCCCAGCGGCTGCACTGCTG-3′(SEQ ID No.35)
利用寡核苷酸(3CBDT6)作為引物,在CBDEGV序列的3』末端導入HindⅢ(下面劃線)限制位點。引物215′-AGCCTAAGCTTACAGGCACTGATGGTACCAGT-3′(SEQ ID No.36)利用NheⅠ和HindⅢ消化得到的0.18kb PCR片段,並將它與Cex前導肽讀框一致地連接到pTugEO7K3的NheⅠ-HindⅢ位點,其中pTugEO7K3已預先用NheⅠ和HindⅢ消化以除去CBDCex基因片段。通過限制性消化和PCR分析證實最後的構建體pCBDT006。構建雜合體NAMK6.1(Termamyl
接頭-CBDEGV)用NheⅠ和StuⅠ消化Termamyl
載體NAM2.0,利用GeneClean(Bio101)試劑盒凝膠純化所得到的1.48kb片段,再將它與編碼CBDEGV的片段讀框一致地連接到已預先用NheⅠ和StuⅠ消化的pCBDT006中,得到pNAMK6.1。
該產物具有下面特徵MW60863;總共537個胺基酸殘基;首先是Termamyl
催化性澱粉酶,然後是單字母表示的接頭RPPTPTSPSAPS(SEQ ID NO:37),最後是來自真菌CBD的38個殘基。SEQ ID NO:26顯示了pNAMK6.1的全部核苷酸序列(含有Termamyl
CBDEGV插入片段的pTugK)。
實施例9Termamyl
接頭-CBDEGV澱粉加工我們研究了在pH6.0和40ppm Ca2+中,與Termamyl
相比,Termamyl
接頭-CBDEGV(如上面的實施例9所述構建的Termamyl
接頭-來自Humicola insolens EGV的真菌CBD)的每微克酶蛋白/克乾物質是否能得到更好的澱粉液化效果。
將振搖的油浴加熱到105℃。製備三種澱粉懸浮液(含有40ppm Ca++的30%DS),利用NaOH調節pH到6.0。根據下述模式將酶與諸懸浮液混勻
懸浮液1:Termamyl
接頭-CBDEGV10.9微克/克DS澱粉懸浮液2:Termamyl
接頭-CBDEGV8.72微克/克DS澱粉懸浮液3:Termamyl
10.9微克/克DS澱粉從每種懸浮液各取四份,每份10克。將每份置於帶有螺旋帽的Erlenmeyer燒瓶中。將燒瓶置於105℃的油浴8分鐘,然後在95℃放置90分鐘。
在油浴中放置7分鐘45秒後,將油浴的恆溫器調節到95.4℃,向油浴中加入室溫的2升油。啟動鍾,在20、40、60和90分鐘取樣(每一懸浮液取1燒瓶)。在每個燒瓶中加入2滴1N HCl,以失活澱粉酶。
確定為時間函數的DE值
從上表可以看出,與Termamyl
相比,Termamyl
接頭-CBDEGV的每微克酶/克DS的液化效果有所提高。
實施例10CBDCenA-Termamyl
澱粉加工還研究了在pH6.0和40ppm Ca2+下,與Termamyl
相比,CBDCenA-Termamyl
(上面實施例8中所述的經由接頭連接的糞肥纖維單胞菌內切葡聚糖酶ACBD和Termamyl
的每活性單位/克乾物質的澱粉液化作用是否提高。將振搖油浴加熱到105℃。製備兩份澱粉懸浮液(含有40ppm Ca++的30%DS),利用NaOH調節到pH6.0。根據下述模式將酶與懸浮液混勻懸浮液1:CBDCenA-Termamyl
75NU/克DS澱粉懸浮液2:Termamyl
75NU/克DS澱粉從每一懸浮液中各取四份,每份10克。將每份置於帶有螺旋帽的Erlenmeyer燒瓶中。將燒瓶置於105℃油浴8分鐘,然後在95℃放置90分鐘。
在油浴中放置7分鐘45秒後,將油浴的恆溫器調節到95.4℃,並向油浴中加入室溫的油2升。啟動鍾,在20、40、60和90分鐘取樣(每一懸浮液取一個燒瓶)。在每個燒瓶中加入2滴1N HCl,以失活澱粉酶。
確定為時間函數的DE值
從上表可以看,與Termamyl
相比,CBDCenA-Termamyl
每活性單位/克DS的液化作用效果更好。
序列表(1)一般信息(I)申請人(A)名稱Novo Nordisk A/S(B)街道Novo Alle(C)城市Bagsvaerd(E)國家丹麥(F)郵編(ZIP):DK-2880(G)電話+45 4444 8888(H)傳真+45 4449 3256(ⅱ)發明名稱雜合體酶/澱粉加工(ⅲ)序列數目37(ⅳ)計算機可讀形式(A)介質類型軟盤(B)計算機IBM PC兼容機(C)作業系統PC-DOS/MS-DOS(D)軟體PatentIn Release#1.0.#1.30版本(EPO)(2)SEQ ID NO:1的資料(I)序列特徵(A)長度1203個鹼基對(B)類型核酸(C)鏈型單鏈(D)拓撲結構線性(ⅱ)分子類型cDNA(ⅳ)來源(A)生物體Bacillus agaradherens(B)菌株AC13(ⅸ)特徵(A)名稱/關鍵詞CDS
(B)位置1..1203(ⅹⅰ)序列描述SEQ ID NO:1ATG AAA AAG ATA ACT ACT ATT TTT GTC GTA TTG CTT ATG ACA GTG GCG 48Met Lys Lys Ile Thr Thr Ile Phe Val Val Leu Leu Met Thr Val Ala1 5 10 15TTG TTC AGT ATA GGA AAC ACG ACT GCT GCT GAT AAT GAT TCA GTT GTA 96Leu Phe Ser Ile Gly Asn Thr Thr Ala Ala Asp Asn Asp Ser Val Val20 25 30GAA GAA CAT GGG CAA TTA AGT ATT AGT AAC GGT GAA TTA GTC AAT GAA 144Glu Glu His Gly Gln Leu Ser Ile Ser Asn Gly Glu Leu Val Asn Glu35 40 45CGA GGC GAA CAA GTT CAG TTA AAA GGG ATG AGT TCC CAT GGT TTG CAA 192Arg Gly Glu Gln Val Gln Leu Lys Gly Met Ser Ser His Gly Leu Gln50 55 60TGG TAC GGT CAA TTT GTA AAC TAT GAA AGT ATG AAA TGG CTA AGA GAT 240Trp Tyr Gly Gln Phe Val Asn Tyr Glu Ser Met Lys Trp Leu Arg Asp65 70 75 80GAT TGG GGA ATA AAT GTA TTC CGA GCA GCA ATG TAT ACC TCT TCA GGA 288Asp Trp Gly Ile Asn Val Phe Arg Ala Ala Met Tyr Thr Ser Ser Gly85 90 95GGA TAT ATT GAT GAT CCA TCA GTA AAG GAA AAA GTA AAA GAG GCT GTT 336Gly Tyr Ile Asp Asp Pro Ser Val Lys Glu Lys Val Lys Glu Ala Val100 105 110GAA GCT GCG ATA GAC CTT GAT ATA TAT GTG ATC ATT GAT TGG CAT ATC 384Glu Ala Ala Ile Asp Leu Asp Ile Tyr Val Ile Ile Asp Trp His Ile115 120 125CTT TCA GAC AAT GAC CCA AAT ATA TAT AAA GAA GAA GCG AAG GAT TTC 432Leu Ser Asp Asn Asp Pro Asn Ile Tyr Lys Glu Glu Ala Lys Asp Phe130 135 140TTT GAT GAA ATG TCA GAG TTG TAT GGA GAC TAT CCG AAT GTG ATA TAC 480Phe Asp Glu Met Ser Glu Leu Tyr Gly Asp Tyr Pro Asn Val Ile Tyr145 150 155 160GAA ATT GCA AAT GAA CCG AAT GGT AGT GAT GTT ACG TGG GGC AAT CAA 528Glu Ile Ala Asn Glu Pro Asn Gly Ser Asp Val Thr Trp Gly Asn Gln165 170 175ATA AAA CCG TAT GCA GAG GAA GTC ATT CCG ATT ATT CGT AAC AAT GAC 576Ile Lys Pro Tyr Ala Glu Glu Val Ile Pro Ile Ile Arg Asn Asn Asp180 185 190CCT AAT AAC ATT ATT ATT GTA GGT ACA GGT ACA TGG AGT CAG GAT GTC 624Pro Asn Asn Ile Ile Ile Val Gly Thr Gly Thr Trp Ser Gln Asp Val195 200 205CAT CAT GCA GCT GAT AAT CAG CTT GCA GAT CCT AAC GTC ATG TAT GCA 672His His Ala Ala Asp Asn Gln Leu Ala Asp Pro Asn Val Met Tyr Ala210 215 220TTT CAT TTT TAT GCA GGG ACA CAT GGT CAA AAT TTA CGA GAC CAA GTA 720Phe His Phe Tyr Ala Gly Thr His Gly Gln Asn Leu Arg Asp Gln Val225 230 235 240GAT TAT GCA TTA GAT CAA GGA GCA GCG ATA TTT GTT AGT GAA TGG GGA 768Asp Tyr Ala Leu Asp Gln Gly Ala Ala Ile Phe Val Ser Glu Trp Gly245 250 255ACA AGT GCA GCT ACA GGT GAT GGT GGC GTG TTT TTA GAT GAA GCA CAA 816Thr Ser Ala Ala Thr Gly Asp Gly Gly Val Phe Leu Asp Glu Ala Gln260 265 270GTG TGG ATT GAC TTT ATG GAT GAA AGA AAT TTA AGC TGG GCC AAC TGG 864Val Trp Ile Asp Phe Met Asp Glu Arg Asn Leu Ser Trp Ala Asn Trp275 280 285TCT CTA ACG CAT AAA GAT GAG TCA TCT GCA GCG TTA ATG CCA GGT GCA 912Ser Leu Thr His Lys Asp Glu Ser Ser Ala Ala Leu Met Pro Gly Ala290 295 300AAT CCA ACT GGT GGT TGG ACA GAG GCT GAA CTA TCT CCA TCT GGT ACA 960Ash Pro Thr Gly Gly Trp Thr Glu Ala Glu Leu Ser Pro Ser Gly Thr305 310 315 320TTT GTG AGG GAA AAA ATA AGA GAA TCA GCA TCT ATT CCG CCA AGC GAT 1008Phe Val Arg Glu Lys Ile Arg Glu Ser Ala Ser Ile Pro Pro Ser Asp325 330 335CCA ACA CCG CCA TCT GAT CCA GGA GAA CCG GAT CCA ACG CCC CCA AGT 1056Pro Thr Pro Pro Ser Asp Pro Gly Glu Pro Asp Pro Thr Pro Pro Ser340 345 350GAT CCA GGA GAG TAT CCA GCA TGG GAT CCA AAT CAA ATT TAC ACA AAT 1104Asp Pro Gly Glu Tyr Pro Ala Trp Asp Pro Ash Gln Ile Tyr Thr Asn355 360 365GAA ATT GTG TAC CAT AAC GGC CAG CTA TGG CAA GCA AAA TGG TGG ACA 1152Glu Ile Val Tyr His Asn Gly Gln Leu Trp Gln Ala Lys Trp Trp Thr370 375 380CAA AAT CAA GAG CCA GGT GAC CCG TAC GGT CCG TGG GAA CCA CTC AAT 1200Gln Ash Gln Glu Pro Gly Asp Pro Tyr Gly Pro Trp Glu Pro Leu Asn385 390 395 400TAA 1203(2)SEQ ID NO:2的資料(ⅰ)序列特徵(A)長度400個胺基酸(B)類型胺基酸(D)拓撲結構線性(ⅱ)分子類型蛋白質(ⅹⅰ)序列描述SEQ ID NO:2Met Lys Lys Ile Thr Thr Ile Phe Val Val Leu Leu Met Thr Val Ala1 5 10 15Leu Phe Ser Ile Gly Asn Thr Thr Ala Ala Asp Asn Asp Ser Val Val20 25 30Glu Glu His Gly Gln Leu Ser Ile Ser Asn Gly Glu Leu Val Asn Glu35 40 45Arg Gly Glu Gln Val Gln Leu Lys Gly Met Ser Ser His Gly Leu Gln50 55 60Trp Tyr Gly Gln Phe Val Asn Tyr Glu Ser Met Lys Trp Leu Arg Asp65 70 75 80Asp Trp Gly Ile Asn Val Phe Arg Ala Ala Met Tyr Thr Ser Ser Gly85 90 95Gly Tyr Ile Asp Asp Pro Ser Val Lys Glu Lys Val Lys Glu Ala Val100 105 110Glu Ala Ala Ile Asp Leu Asp Ile Tyr Val Ile Ile Asp Trp His Ile115 120 125Leu Ser Asp Asn Asp Pro Asn Ile Tyr Lys Glu Glu Ala Lys Asp Phe130 135 140Phe Asp Glu Met Ser Glu Leu Tyr Gly Asp Tyr Pro Asn Val Ile Tyr145 150 155 160Glu Ile Ala Asn Glu Pro Asn Gly Ser Asp Val Thr Trp Gly Asn Gln165 170 175Ile Lys Pro Tyr Ala Glu Glu Val Ile Pro Ile Ile Arg Asn Asn Asp180 185 190Pro Asn Asn Ile Ile Ile Val Gly Thr Gly Thr Trp Ser Gln Asp Val195 200 205His His Ala Ala Asp Asn Gln Leu Ala Asp Pro Asn Val Met Tyr Ala210 215 220Phe His Phe Tyr Ala Gly Thr His Gly Gln Asn Leu Arg Asp Gln Val225 230 235 240Asp Tyr Ala Leu Asp Gln Gly Ala Ala Ile Phe Val Ser Glu Trp Gly245 250 255Thr Ser Ala Ala Thr Gly Asp Gly Gly Val Phe Leu Asp Glu Ala Gln260 265 270Val Trp Ile Asp Phe Met Asp Glu Arg Asn Leu Ser Trp Ala Asn Trp275 280 285Ser Leu Thr His Lys Asp Glu Ser Ser Ala Ala Leu Met Pro Gly Ala290 295 300Asn Pro Thr Gly Gly Trp Thr Glu Ala Glu Leu Ser Pro Ser Gly Thr305 310 315 320Phe Val Arg Glu Lys Ile Arg Glu Ser Ala Ser Ile Pro Pro Ser Asp325 330 335Pro Thr Pro Pro Ser Asp Pro Gly Glu Pro Asp Pro Thr Pro Pro Ser340 345 350Asp Pro Gly Glu Tyr Pro Ala Trp Asp Pro Asn Gln Ile Tyr Thr Asn355 360 365Glu Ile Val Tyr His Asn Gly Gln Leu Trp Gln Ala Lys Trp Trp Thr370 375 380Gln Asn Gln Glu Pro Gly Asp Pro Tyr Gly Pro Trp Glu Pro Leu Asn385 390 395 400(2)SEQ ID N0:3的資料(ⅰ)序列特徵(A)長度49個鹼基對(B)類型核酸(C)鏈型單鏈(D)拓撲結構線性(ⅱ)分子類型其它核酸(ⅸ)特徵(A)名稱/關鍵詞misc-特徵(B)其它信息/desc=「引物1(#9555)」(ⅸ)特徵(A)名稱/關鍵詞misc-特徵(B)位置33,36,39,42,45,48(D)其它信息/注釋N=A,G,C或TR=G或AY=C或T(ⅹⅰ)序列描述SEQ ID NO:3TCACAGATCC TCGCGAATTG GTGCGGCCGC GTNGTNGARG ARCAYGGNC 49(2)SEQ ID NO:4的資料(ⅰ)序列特徵(A)長度7個胺基酸(B)類型胺基酸(D)拓撲結構線性(ⅱ)分子類型蛋白質(ⅹⅰ)序列描述SEQ ID NO:4Val Val Glu Glu His Gly Gln5(2)SEQ ID NO:5的資料(ⅰ)序列特徵(A)長度19個鹼基對(B)類型核酸(C)鏈型單鏈(D)拓撲結構線性(ⅱ)分子類型其它核酸(ⅸ)特徵(A)名稱/關鍵詞misc-特徵(B)其它信息/desc=「引物2」(ⅹⅰ)序列描述SEQ ID NO:5CAGAGCAAGAG ATTACGCGC 19(2)SEQ ID NO:6的資料(ⅰ)序列特徵(A)長度17個鹼基對(B)類型核酸(C)鏈型單鏈(D)拓撲結構線性(ⅱ)分子類型其它核酸(ⅸ)特徵(A)名稱/關鍵詞misc-特徵(B)其它信息/desc=「反向引物」(ⅹⅰ)序列描述SEQ ID NO:6GTTTTCCCAG TCACGAC17(2)SEQ ID NO:7的資料(ⅰ)序列特徵
(A)長度22個鹼基對(B)類型核酸(C)鏈型單鏈(D)拓撲結構線性(ⅱ)分子類型其它核酸(ⅸ)特徵(A)名稱/關鍵詞misc-特徵(B)其它信息/desc=「正向引物」(ⅹⅰ)序列描述SEQ ID NO:7GCGGATAACA ATTTCACACA GG 22(2)SEQ ID NO:8的資料(ⅰ)序列特徵(A)長度20個鹼基對(B)類型核酸(C)鏈型單鏈(D)拓撲結構線性(ⅱ)分子類型其它核酸(ⅸ)特徵(A)名稱/關鍵詞misc-特徵(B)其它信息/desc=「引物3,#19719」(ⅹⅰ)序列描述SEQ ID NO:8TGACCCGTAC GGTCCGTGGG20(2)SEQ ID NO:9的資料(ⅰ)序列特徵(A)長度22個鹼基對
(B)類型核酸(C)鏈型單鏈(D)拓撲結構線性(ⅱ)分子類型其它核酸(ⅸ)特徵(A)名稱/關鍵詞misc-特徵(B)其它信息/desc=「引物4,#19720」(ⅹⅰ)序列描述SEQ ID NO:9GGCTCTTGAT TTTGTGTCCA CC 22(2)SEQ ID NO:10的資料(ⅰ)序列特徵(A)長度71個鹼基對(B)類型核酸(C)鏈型單鏈(D)拓撲結構線性(ⅱ)分子類型其它核酸(ⅸ)特徵(A)名稱/關鍵詞misc-特徵(B)其它信息/desc=「引物5,#20887」(ⅹⅰ)序列描述SEQ ID NO:10GTAGGCTCAG TCATATGTTA CACATTGAAA GGGGAGGAGA ATCATGAAAA AGATAACTAC 60TATTTTTGTC G 71(2)SEQ ID NO:11的資料(ⅰ)序列特徵(A)長度51個鹼基對(B)類型核酸
(C)鏈型單鏈(D)拓撲結構線性(ⅱ)分子類型其它核酸(ⅸ)特徵(A)名稱/關鍵詞misc-特徵(B)其它信息/desc=「引物6」(ⅹⅰ)序列描述SEQ ID NO:11GTACCTCGCG GGTACCAAGC GGCCGCTTAA TTGAGTGGTT CCCACGGACC G 51(2)SEQ ID NO:12的資料(ⅰ)序列特徵(A)長度1386個鹼基對(B)類型核酸(C)鏈型單鏈(D)拓撲結構線性(ⅱ)分子類型DNA(基因組)(ⅵ)原始來源(A)生物體Bacillus agaradherens(B)菌種AC13(ⅸ)特徵(A)名稱/關鍵詞CDS(B)位置1..1386(ⅹⅰ)序列描述SEQ ID NO:12:ATG AAA AAG ATA ACT ACT ATT TTT GTC GTA TTG CTT ATG ACA GTG GCG 48Met Lys Lys Ile Thr Thr Ile Phe Val Val Leu Leu Met Thr Val Ala1 5 10 15TTG TTC AGT ATA GGA AAC ACG ACT GCT GCT GAT AAT GAT TCA GTT GTA 96Leu Phe Ser Ile Gly Asn Thr Thr Ala Ala Asp Asn Asp Ser Val Val20 25 30GAA GAA CAT GGG CAA TTA AGT ATT AGT AAC GGT GAA TTA GTC AAT GAA 144Glu Glu His Gly Gln Leu Ser Ile Ser Asn Gly Glu Leu Val Asn Glu35 40 45CGA GGC GAA CAA GTT CAG TTA AAA GGG ATG AGT TCC CAT GGT TTG CAA 192Arg Gly Glu Gln Val Gln Leu Lys Gly Met Ser Ser His Gly Leu Gln50 55 60TGG TAC GGT CAA TTT GTA AAC TAT GAA AGT ATG AAA TGG CTA AGA GAT 240Trp Tyr Gly Gln Phe Val Asn Tyr Glu Ser Met Lys Trp Leu Arg Asp65 70 75 80GAT TGG GGA ATA AAT GTA TTC CGA GCA GCA ATG TAT ACC TCT TCA GGA 288Asp Trp Gly Ile Asn Val Phe Arg Ala Ala Met Tyr Thr Ser Ser Gly85 90 95GGA TAT ATT GAT GAT CCA TCA GTA AAG GAA AAA GTA AAA GAG GCT GTT 336Gly Tyr Ile Asp Asp Pro Ser Val Lys Glu Lys Val Lys Glu Ala Val100 105 110GAA GCT GCG ATA GAC CTT GAT ATA TAT GTG ATC ATT GAT TGG CAT ATC 384Glu Ala Ala Ile Asp Leu Asp Ile Tyr Val Ile Ile Asp Trp His Ile115 120 125CTT TCA GAC AAT GAC CCA AAT ATA TAT AAA GAA GAA GCG AAG GAT TTC 432Leu Ser Asp Asn Asp Pro Asn Ile Tyr Lys Glu Glu Ala Lys Asp Phe130 135 140TTT GAT GAA ATG TCA GAG TTG TAT GGA GAC TAT CCG AAT GTG ATA TAC 480Phe Asp Glu Met Ser Glu Leu Tyr Gly Asp Tyr Pro Asn Val Ile Tyr145 150 155 160GAA ATT GCA AAT GAA CCG AAT GGT AGT GAT GTT ACG TGG GGC AAT CAA 528Glu Ile Ala Asn Glu Pro Asn Gly Ser Asp Val Thr Trp Gly Asn Gln165 170 175ATA AAA CCG TAT GCA GAG GAA GTC ATT CCG ATT ATT CGT AAC AAT GAC 576Ile Lys Pro Tyr Ala Glu Glu Val Ile Pro Ile Ile Arg Asn Asn Asp180 185 190CCT AAT AAC ATT ATT ATT GTA GGT ACA GGT ACA TGG AGT CAG GAT GTC 624Pro Asn Asn Ile Ile Ile Val Gly Thr Gly Thr Trp Ser Gln Asp Val195 200 205CAT CAT GCA GCT GAT AAT CAG CTT GCA GAT CCT AAC GTC ATG TAT GCA 672His His Ala Ala Asp Asn Gln Leu Ala Asp Pro Asn Val Met Tyr Ala210 215 220TTT CAT TTT TAT GCA GGG ACA CAT GGT CAA AAT TTA CGA GAC CAA GTA 720Phe His Phe Tyr Ala Gly Thr His Gly Gln Asn Leu Arg Asp Gln Val225 230 235 240GAT TAT GCA TTA GAT CAA GGA GCA GCG ATA TTT GTT AGT GAA TGG GGA 768Asp Tyr Ala Leu Asp Gln Gly Ala Ala Ile Phe Val Ser Glu Trp Gly245 250 255ACA AGT GCA GCT ACA GGT GAT GGT GGC GTG TTT TTA GAT GAA GCA CAA 816Thr Ser Ala Ala Thr Gly Asp Gly Gly Val Phe Leu Asp Glu Ala Gln260 265 270GTG TGG ATT GAC TTT ATG GAT GAA AGA AAT TTA AGC TGG GCC AAC TGG 864Val Trp Ile Asp Phe Met Asp Glu Arg Asn Leu Ser Trp Ala Asn Trp275 280 285TCT CTA ACG CAT AAA GAT GAG TCA TCT GCA GCG TTA ATG CCA GGT GCA 912Ser Leu Thr His Lys Asp Glu Ser Ser Ala Ala Leu Met Pro Gly Ala290 295 300AAT CCA ACT GGT GGT TGG ACA GAG GCT GAA CTA TCT CCA TCT GGT ACA 960Asn Pro Thr Gly Gly Trp Thr Glu Ala Glu Leu Ser Pro Ser Gly Thr305 310 315 320TTT GTG AGG GAA AAA ATA AGA GAA TCA GCA TCT ATT CCG CCA AGC GAT 1008Phe Val Arg Glu Lys Ile Arg Glu Ser Ala Ser Ile Pro Pro Ser Asp325 330 335CCA ACA CCG CCA TCT GAT CCA GGA GAA CCG GAT CCA ACG CCC CCA AGT 1056Pro Thr Pro Pro Ser Asp Pro Gly Glu Pro Asp Pro Thr Pro Pro Ser340 345 350GAT CCA GGA AAG TAT CCA GCA TGG GAT CCA AAT CAA ATT TAC ACA AAT 1104Asp Pro Gly Lys Tyr Pro Ala Trp Asp Pro Asn Gln Ile Tyr Thr Asn355 360 365GAA ATT GTG TAC CAT AAC GGC CAG CTA TGG CAA GCA AAA TGG TGG ACA 1152Glu Ile Val Tyr His Asn Gly Gln Leu Trp Gln Ala Lys Trp Trp Thr370 375 380CAA AAT CAA GAG CCA GGT GAC CCG TAC GGT CCG TGG GAA CCA CTC AAA 1200Gln Asn Gln Glu Pro Gly Asp Pro Tyr Gly Pro Trp Glu Pro Leu Lys385 390 395 400TCT GAT CCA GAT TCA GGA GAA CCG GAT CCA ACG CCC CCA AGT GAT CCA 1248Ser Asp Pro Asp Ser Gly Glu Pro Asp Pro Thr Pro Pro Ser Asp Pro405 410 415GGA GAA TAT CCA GCA TGG GAC CCA ACG CAA ATT TAC ACA GAT GAA ATT 1296Gly Glu Tyr Pro Ala Trp Asp Pro Thr Gln Ile Tyr Thr Asp Glu Ile420 425 430GTG TAC CAT AAC GGC CAG CTA TGG CAA GCC AAA TGG TGG ACA CAA AAT 1344Val Tyr His Asn Gly Gln Leu Trp Gln Ala Lys Trp Trp Thr Gln Asn435 440 445CAA GAG CCA GGT GAC CCA TAC GGT CCG TGG GAA CCA CTC AAT 1386Gln Glu Pro Gly Asp Pro Tyr Gly Pro Trp Glu Pro Leu Asn450 455 460(2)SEQ ID NO:13的資料(ⅰ)序列特徵(A)長度462個胺基酸(B)類型胺基酸(D)拓撲結構線性(ⅱ)分子類型蛋白質(ⅹⅰ)序列描述SEQ ID NO:13Met Lys Lys Ile Thr Thr Ile Phe Val Val Leu Leu Met Thr Val Ala1 5 10 15Leu Phe Ser Ile Gly Asn Thr Thr Ala Ala Asp Asn Asp Ser Val Val20 25 30Glu Glu His Gly Gln Leu Ser Ile Ser Asn Gly Glu Leu Val Asn Glu35 40 45Arg Gly Glu Gln Val Gln Leu Lys Gly Met Ser Ser His Gly Leu Gln50 55 60Trp Tyr Gly Gln Phe Val Asn Tyr Glu Ser Met Lys Trp Leu Arg Asp65 70 75 80Asp Trp Gly Ile Asn Val Phe Arg Ala Ala Met Tyr Thr Ser Ser Gly85 90 95Gly Tyr Ile Asp Asp Pro Ser Val Lys Glu Lys Val Lys Glu Ala Val100 105 110Glu Ala Ala Ile Asp Leu Asp Ile Tyr Val Ile Ile Asp Trp His Ile115 120 125Leu Ser Asp Asn Asp Pro Asn Ile Tyr Lys Glu Glu Ala Lys Asp Phe130 135 140Phe Asp Glu Met Ser Glu Leu Tyr Gly Asp Tyr Pro Asn Val Ile Tyr145 150 155 160Glu Ile Ala Asn Glu Pro Asn Gly Ser Asp Val Thr Trp Gly Asn Gln165 170 175Ile Lys Pro Tyr Ala Glu Glu Val Ile Pro Ile Ile Arg Asn Asn Asp180 185 190Pro Asn Asn Ile Ile Ile Val Gly Thr Gly Thr Trp Ser Gln Asp Val195 200 205His His Ala Ala Asp Asn Gln Leu Ala Asp Pro Asn Val Met Tyr Ala210 215 220Phe His Phe Tyr Ala Gly Thr His Gly Gln Asn Leu Arg Asp Gln Val225 230 235 240Asp Tyr Ala Leu Asp Gln Gly Ala Ala Ile Phe Val Ser Glu Trp Gly245 250 255Thr Ser Ala Ala Thr Gly Asp Gly Gly Val Phe Leu Asp Glu Ala Gln260 265 270Val Trp Ile Asp Phe Met Asp Clu Arg Asn Leu Ser Trp Ala Asn Trp275 280 285Ser Leu Thr His Lys Asp Glu Ser Ser Ala Ala Leu Met Pro Gly Ala290 295 300Asn Pro Thr Gly Gly Trp Thr Glu Ala Glu Leu Ser Pro Ser Gly Thr305 310 315 320Phe Val Arg Glu Lys Ile Arg Glu Ser Ala Ser Ile Pro Pro Ser Asp325 330 335Pro Thr Pro Pro Ser Asp Pro Gly Glu Pro Asp Pro Thr Pro Pro Ser340 345 350Asp Pro Gly Lys Tyr Pro Ala Trp Asp Pro Asn Gln Ile Tyr Thr Asn355 360 365Glu Ile Val Tyr His Asn Gly Gln Leu Trp Gln Ala Lys Trp Trp Thr370 375 380Gln Asn Gln Glu Pro Gly Asp Pro Tyr Gly Pro Trp Glu Pro Leu Lys385 390 395 400Ser Asp Pro Asp Ser Gly Glu Pro Asp Pro Thr Pro Pro Ser Asp Pro405 410 415Gly Glu Tyr Pro Ala Trp Asp Pro Thr Gln Ile Tyr Thr Asp Glu Ile420 425 430Val Tyr His Asn Gly Gln Leu Trp Gln Ala Lys Trp Trp Thr Gln Asn435 440 445Gln Glu Pro Gly Asp Pro Tyr Gly Pro Trp Glu Pro Leu Asn450 455 460(2)SEQ ID NO:14的資料(ⅰ)序列特徵(A)長度46個鹼基對(B)類型核酸(C)鏈型單鏈(D)拓撲結構線性(ⅱ)分子類型其它核酸(ⅸ)特徵(A)名稱/關鍵詞misc-特徵(B)其它信息/desc=「引物7,#100084」(ⅹⅰ)序列描述SEQ ID NO:14CCTCGCGAGG TACCAGCGGC CGCGTACCAC CAATTAAGTA TGGTAC46(2)SEQ ID NO:15的資料(ⅰ)序列特徵(A)長度35個鹼基對(B)類型核酸(C)鏈型單鏈(D)拓撲結構線性(ⅱ)分子類型其它核酸(ⅸ)特徵(A)名稱/關鍵詞misc-特徵(B)其它信息/dese=「引物8,#5289」(ⅹⅰ)序列描述SEQ ID NO:15GCTTTACGCC CGATTGCTGA CGCTG 35(2)SEQ ID NO:16的資料(ⅰ)序列特徵(A)長度51個鹼基對(B)類型核酸(C)鏈型單鏈(D)拓撲結構線性(ⅱ)分子類型其它核酸(ⅸ)特徵(A)名稱/關鍵詞misc-特徵(B)其它信息/desc=「引物9,#26748」(ⅹⅰ)序列描述SEQ ID NO:16GCGATGAGAC GCGCGGCCGC CTATCTTTGA ACATAAATTG AAACGGATCC G 51(2)SEQ ID NO:17的資料(ⅰ)序列特徵(A)長度52個鹼基對(B)類型核酸(C)鏈型單鏈(D)拓撲結構線性(ⅱ)分子類型其它核酸(ⅸ)特徵(A)名稱/關鍵詞misc-特徵(B)其它信息/desc=「引物10,#110150A」(ⅹⅰ)序列描述SEQ ID NO:17GCTGCAGGAT CCGTTTCAAT TTATGTTCAA AGATCTGATC CAGATTCAGG AG52
(2)SEQ ID NO:18的資料(ⅰ)序列特徵(A)長度46個鹼基對(B)類型核酸(C)鏈型單鏈(D)拓撲結構線性(ⅱ)分子類型其它核酸(ⅸ)特徵(A)名稱/關鍵詞misc-特徵(B)其它信息/desc=「引物11,#100084」(ⅹⅰ)序列描述SEQ ID NO:18CCTCGCGAGG TACCAGCGGC CGCGTACCAC CAATTAAGTA TGGTAC 46(2)SEQ ID NO:19的資料(ⅰ)序列特徵(A)長度1725個鹼基對(B)類型核酸(C)鏈型單鏈(D)拓撲結構線性(ⅱ)分子類型其它核酸(A)描述/desc=「雜合體」(ⅸ)特徵(A)名稱/關鍵詞CDS(B)位置1..1725(ⅹⅰ)序列描述SEQ ID NO:19ATG AAA CAA CAA AAA CGG CTT TAC GCC CGA TTG CTG ACG CTG TTA TTT 48Met Lys Gln Gln Lys Arg Leu Tyr Ala Arg Leu Leu Thr Leu Leu Phe1 5 10 15GCG CTC ATC TTC TTG CTG CCT CAT TCT GCA GCA GCG GCG GCA AAT CTT 96Ala Leu Ile Phe Leu Leu Pro His Ser Ala Ala Ala Ala Ala Asn Leu20 25 30AAT GGG ACG CTG ATG CAG TAT TTT GAA TGG TAC ATG CCC AAT GAC GGC 144Asn Gly Thr Leu Met Gln Tyr Phe Glu Trp Tyr Met Pro Asn Asp Gly35 40 45CAA CAT TGG AAG CGT TTG CAA AAC GAC TCG GCA TAT TTG GCT GAA CAC 192Gln His Trp Lys Arg Leu Gln Asn Asp Ser Ala Tyr Leu Ala Glu His50 55 60GGT ATT ACT GCC GTC TGG ATT CCC CCG GCA TAT AAG GGA ACG AGC CAA 240Gly Ile Thr Ala Val Trp Ile Pro Pro Ala Tyr Lys Gly Thr Ser Gln65 70 75 80GCG GAT GTG GGC TAC GGT GCT TAC GAC CTT TAT GAT TTA GGG GAG TTT 288Ala Asp Val Gly Tyr Gly Ala Tyr Asp Leu Tyr Asp Leu Gly Glu Phe85 90 95CAT CAA AAA GGG ACG GTT CGG ACA AAG TAC GGC ACA AAA GGA GAG CTG 336His Gln Lys Gly Thr Val Arg Thr Lys Tyr Gly Thr Lys Gly Glu Leu100 105 110CAA TCT GCG ATC AAA AGT CTT CAT TCC CGC GAC ATT AAC GTT TAC GGG 384Gln Ser Ala Ile Lys Ser Leu His Ser Arg Asp Ile Asn Val Tyr Gly115 120 125GAT GTG GTC ATC AAC CAC AAA GGC GGC GCT GAT GCG ACC GAA GAT GTA 432Asp Val Val Ile Asn His Lys Gly Gly Ala Asp Ala Thr Glu Asp Val130 135 140ACC GCG GTT GAA GTC GAT CCC GCT GAC CGC AAC CGC GTA ATC TCA GGA 480Thr Ala Val Glu Val Asp Pro Ala Asp Arg Asn Arg Val Ile Ser Gly145 150 155 160GAA CAC CTA ATT AAA GCC TGG ACA CAT TTT CAT TTT CCG GGG GCC GGC 528Glu His Leu Ile Lys Ala Trp Thr His Phe His Phe Pro Gly Ala Gly165 170 175AGC ACA TAC AGC GAT TTT AAA TGG CAT TGG TAC CAT TTT GAC GGA ACC 576Ser Thr Tyr Ser Asp Phe Lys Trp His Trp Tyr His Phe Asp Gly Thr180 185 190GAT TGG GAC GAG TCC CGA AAG CTG AAC CGC ATC TAT AAG TTT CAA GGA 624Asp Trp Asp Glu Ser Arg Lys Leu Asn Arg Ile Tyr Lys Phe Gln Gly195 200 205AAG GCT TGG GAT TGG GAA GTT TCC AAT GAA AAC GGC AAC TAT GAT TAT 672Lys Ala Trp Asp Trp Glu Val Ser Asn Glu Asn Gly Asn Tyr Asp Tyr210 215 220TTG ATG TAT GCC GAC ATC GAT TAT GAC CAT CCT GAT GTC GCA GCA GAA 720Leu Met Tyr Ala Asp Ile Asp Tyr Asp His Pro Asp Val Ala Ala Glu225 230 235 240ATT AAG AGA TGG GGC ACT TGG TAT GCC AAT GAA CTG CAA TTG GAC GGA 768Ile Lys Arg Trp Gly Thr Trp Tyr Ala Asn Glu Leu Gln Leu Asp Gly245 250 255AAC CGT CTT GAT GCT GTC AAA CAC ATT AAA TTT TCT TTT TTG CGG GAT 816Asn Arg Leu Asp Ala Val Lys His Ile Lys Phe Ser Phe Leu Arg Asp260 265 270TGG GTT AAT CAT GTC AGG GAA AAA ACG GGG AAG GAA ATG TTT ACG GTA 864Trp Val Asn His Val Arg Glu Lys Thr Gly Lys Glu Met Phe Thr Val275 280 285GCT GAA TAT TGG CAG AAT GAC TTG GGC GCG CTG GAA AAC TAT TTG AAC 912Ala Glu Tyr Trp Gln Asn Asp Leu Gly Ala Leu Glu Asn Tyr Leu Asn290 295 300AAA ACA AAT TTT AAT CAT TCA GTG TTT GAC GTG CCG CTT CAT TAT CAG 960Lys Thr Asn Phe Asn His Ser Val Phe Asp Val Pro Leu His Tyr Gln305 310 315 320TTC CAT GCT GCA TCG ACA CAG GGA GGC GGC TAT GAT ATG AGG AAA TTG 1008Phe His Ala Ala Ser Thr Gln Gly Gly Gly Tyr Asp Met Arg Lys Leu325 330 335CTG AAC GGT ACG GTC GTT TCC AAG CAT CCG TTG AAA TCG GTT ACA TTT 1056Leu Asn Gly Thr Val Val Ser Lys His Pro Leu Lys Ser Val Thr Phe340 345 350GTC GAT AAC CAT GAT ACA CAG CCG GGG CAA TCG CTT GAG TCG ACT GTC 1104Val Asp Asn His Asp Thr Gln Pro Gly Gln Ser Leu Glu Ser Thr Val355 360 365CAA ACA TGG TTT AAG CCG CTT GCT TAC GCT TTT ATT CTC ACA AGG GAA 1152Gln Thr Trp Phe Lys Pro Leu Ala Tyr Ala Phe Ile Leu Thr Arg Glu370 375 380TCT GGA TAC CCT CAG GTT TTC TAC GGG GAT ATG TAC GGG ACG AAA GGA 1200Ser Gly Tyr Pro Gln Val Phe Tyr Gly Asp Met Tyr Gly Thr Lys Gly385 390 395 400GAC TCC CAG CGC GAA ATT CCT GCC TTG AAA CAC AAA ATT GAA CCG ATC 1248Asp Ser Gln Arg Glu Ile Pro Ala Leu Lys His Lys Ile Glu Pro Ile405 410 415TTA AAA GCG AGA AAA CAG TAT GCG TAC GGA GCA CAG CAT GAT TAT TTC 1296Leu Lys Ala Arg Lys Gln Tyr Ala Tyr Gly Ala Gln His Asp Tyr Phe420 425 430GAC CAC CAT GAC ATT GTC GGC TGG ACA AGG GAA GGC GAC AGC TCG GTT 1344Asp His His Asp Ile Val Gly Trp Thr Arg Glu Gly Asp Ser Ser Val435 440 445GCA AAT TCA GGT TTG GCG GCA TTA ATA ACA GAC GGA CCC GGT GGG GCA 1392Ala Asn Ser Gly Leu Ala Ala Leu Ile Thr Asp Gly Pro Gly Gly Ala450 455 460AAG CGA ATG TAT GTC GGC CGG CAA AAC GCC GGT GAG ACA TGG CAT GAC 1440Lys Arg Met Tyr Val Gly Arg Gln Asn Ala Gly Glu Thr Trp His Asp465 470 475 480ATT ACC GGA AAC CGT TCG GAG CCG GTT GTC ATC AAT TCG GAA GGC TGG 1488Ile Thr Gly Asn Arg Ser Glu Pro Val Val Ile Asn Ser Glu Gly Trp485 490 495GGA GAG TTT CAC GTA AAC GGC GGA TCC GTT TCA ATT TAT GTT CAA AGA 1536Gly Glu Phe His Val Asn Gly Gly Ser Val Ser Ile Tyr Val Gln Arg500 505 510TCT GAT CCA GAT TCA GGA GAA CCG GAT CCA ACG CCC CCA AGT GAT CCA 1584Ser Asp Pro Asp Ser Gly Glu Pro Asp Pro Thr Pro Pro Ser Asp Pro515 520 525GGA GAA TAT CCA GCA TGG GAC CCA ACG CAA ATT TAC ACA GAT GAA ATT 1632Gly Glu Tyr Pro Ala Trp Asp Pro Thr Gln Ile Tyr Thr Asp Glu Ile530 535 540GTG TAC CAT AAC GGC CAG CTA TGG CAA GCC AAA TGG TGG ACA CAA AAT 1680Val Tyr His Asn Gly Gln Leu Trp Gln Ala Lys Trp Trp Thr Gln Asn545 550 555 560(2)SEQ ID NO:20的資料(ⅰ)序列特徵(A)長度575個胺基酸(B)類型胺基酸(D)拓撲結構線性(ⅱ)分子類型蛋白質(ⅹⅰ)序列描述SEQ ID NO:20Met Lys Gln G1n Lys Arg Leu Tyr Ala Arg Leu Leu Thr Leu Leu Phe1 5 10 15Ala Leu Ile Phe Leu Leu Pro His Ser Ala Ala Ala Ala Ala Asn Leu20 25 30Asn Gly Thr Leu Met Gln Tyr Phe Glu Trp Tyr Met Pro Asn Asp Gly35 40 45Gln His Trp Lys Arg Leu Gln Asn Asp Ser Ala Tyr Leu Ala Glu His50 55 60Gly Ile Thr Ala Val Trp Ile Pro Pro Ala Tyr Lys Gly Thr Ser Gln65 70 75 80Ala Asp Val Gly Tyr Gly Ala Tyr Asp Leu Tyr Asp Leu Gly Glu Phe85 90 95His Gln Lys Gly Thr Val Arg Thr Lys Tyr Gly Thr Lys Gly Glu Leu100 105 110Gln Ser Ala Ile Lys Ser Leu His Ser Arg Asp Ile Asn Val Tyr Gly115 120 125Asp Val Val Ile Asn His Lys Gly Gly Ala Asp Ala Thr Glu Asp Val130 135 140Thr Ala Val Glu Val Asp Pro Ala Asp Arg Asn Arg Val Ile Ser Gly145 150 155 160Glu His Leu Ile Lys Ala Trp Thr His Phe His Phe Pro Gly Ala Gly165 170 175Ser Thr Tyr Ser Asp Phe Lys Trp His Trp Tyr His Phe Asp Gly Thr180 185 190Asp Trp Asp Glu Ser Arg Lys Leu Asn Arg Ile Tyr Lys Phe Gln Gly195 200 205Lys Ala Trp Asp Trp Glu Val Ser Asn Glu Asn Gly Asn Tyr Asp Tyr210 215 220Leu Met Tyr Ala Asp Ile Asp Tyr Asp His Pro Asp Val Ala Ala Glu225 230 235 240Ile Lys Arg Trp Gly Thr Trp Tyr Ala Asn Glu Leu Gln Leu Asp Gly245 250 255Asn Arg Leu Asp Ala Val Lys His Ile Lys Phe Ser Phe Leu Arg Asp260 265 270Trp Val Asn His Val Arg Glu Lys Thr Gly Lys Glu Met Phe Thr Val275 280 285Ala Glu Tyr Trp Gln Asn Asp Leu Gly Ala Leu Glu Asn Tyr Leu Asn290 295 300Lys Thr ASn Phe Asn His Ser Val Phe Asp Val Pro Leu His Tyr Gln305 310 315 320Phe His Ala Ala Ser Thr Gln Gly Gly Gly Tyr Asp Met Arg Lys Leu325 330 335Leu Asn Gly Thr Val Val Ser Lys His Pro Leu Lys Ser Val Thr Phe340 345 350Val Asp Asn His Asp Thr Gln Pro Gly Gln Ser Leu Glu Ser Thr Val355 360 365Gln Thr Trp Phe Lys Pro Leu Ala Tyr Ala Phe Ile Leu Thr Arg Glu370 375 380Ser Gly Tyr Pro Gln Val Phe Tyr Gly Asp Met Tyr Gly Thr Lys Gly385 390 395 400Asp Ser Gln Arg Glu Ile Pro Ala Leu Lys His Lys Ile Glu Pro Ile405 410 415Leu Lys Ala Arg Lys Gln Tyr Ala Tyr Gly Ala Gln His Asp Tyr Phe420 425 430Asp His His Asp Ile Val Gly Trp Thr Arg Glu Gly Asp Ser Ser Val435 440 445Ala Asn Ser Gly Leu Ala Ala Leu Ile Thr Asp Gly Pro Gly Gly Ala450 455 460Lys Arg Met Tyr Val Gly Arg Gln Asn Ala Gly Glu Thr Trp His Asp465 470 475 480I1e Thr Gly Asn Arg Ser Glu Pro Val Val Ile Asn Ser Glu Gly Trp485 490 495Gly Glu Phe His Val Asn Gly Gly Ser Val Ser Ile Tyr Val Gln Arg500 505 510Ser Asp Pro Asp Ser Gly Glu Pro Asp Pro Thr Pro Pro Ser Asp Pro515 520 525Gly Glu Tyr Pro Ala Trp Asp Pro Thr Gln Ile Tyr Thr Asp Glu Ile530 535 540Val Tyr His Asn Gly Gln Leu Trp Gln Ala Lys Trp Trp Thr Gln Asn545 550 555 560Gln Glu Pro Gly Asp Pro Tyr Gly Pro Trp Glu Pro Leu Asn *565 570 575(2)SEQ ID NO:21的資料
(ⅰ)序列特徵(A)長度17個胺基酸(B)類型胺基酸(D)拓撲結構線性(ⅱ)分子類型蛋白質(ⅸ)特徵(A)名稱/關鍵詞misc-特徵(B)其它信息/desc=「接頭」(ⅹⅰ)序列描述SEQ ID NO:21Ser Asp Pro Asp Ser Gly Glu Pro Asp Pro Thr Pro Pro Ser Asp Pro Gly5 10 15(2)SEQ ID NO:22的資料(ⅰ)序列特徵(A)長度60個鹼基對(B)類型核酸(C)鏈型單鏈(D)拓撲結構線性(ⅱ)分子類型其它核酸(ⅸ)特徵(A)名稱/關鍵詞misc-特徵(B)其它信息/desc=「引物12,#114135」(ⅹⅰ)序列描述SEQ ID NO:22GCTGCAGGAT CCGTTTCAAT TTATGTTCAA AGATCTCCAA CTCCTGCCCC ATCTCAAAGC60(2)SEQ ID NO:23的資料(ⅰ)序列特徵(A)長度50個鹼基對
(B)類型核酸(C)鏈型單鏈(D)拓撲結構線性(ⅱ)分子類型其它核酸(ⅸ)特徵(A)名稱/關鍵詞misc-特徵(B)其它信息/desc=「引物13,#110151」(ⅹⅰ)序列描述SEQ ID NO:23GCGATGAGAC GCGCGGCCGC TACTACCAGT CAACATTAAC AGGACCTGAG 50(2)SEQ ID NO:24的資料(ⅰ)序列特徵(A)長度2346個鹼基對(B)類型核酸(C)鏈型單鏈(D)拓撲結構線性(ⅱ)分子類型其它核酸(A)描述/desc=「雜合體」(ⅸ)特徵(A)名稱/關鍵詞CDS(B)位置1..2346(ⅹⅰ)序列描述SEQ ID NO:24ATG AAA CAA CAA AAA CGG CTT TAC GCC CGA TTG CTG ACG CTG TTA TTT 48Met Lys Gln Gln Lys Arg Leu Tyr Ala Arg Leu Leu Thr Leu Leu Phe1 5 10 15GCG CTC ATC TTC TTG CTG CCT CAT TCT GCA GCA GCG GCG GCA AAT CTT 96Ala Leu Ile Phe Leu Leu Pro His Ser Ala Ala Ala Ala Ala Asn Leu20 25 30AAT GGG ACG CTG ATG CAG TAT TTT GAA TGG TAC ATG CCC AAT GAC GGC 144Asn Gly Thr Leu Met Gln Tyr Phe Glu Trp Tyr Met Pro Asn Asp Gly35 40 45CAA CAT TGG AAG CGT TTG CAA AAC GAC TCG GCA TAT TTG GCT GAA CAC 192Gln His Trp Lys Arg Leu Gln Asn Asp Ser Ala Tyr Leu Ala Glu His50 55 60GGT ATT ACT GCC GTC TGG ATT CCC CCG GCA TAT AAG GGA ACG AGC CAA 240Gly Ile Thr Ala Val Trp Ile Pro Pro Ala Tyr Lys Gly Thr Ser Gln65 70 75 80GCG GAT GTG GGC TAC GGT GCT TAC GAC CTT TAT GAT TTA GGG GAG TTT 288Ala Asp Val Gly Tyr Gly Ala Tyr Asp Leu Tyr Asp Leu Gly Glu Phe85 90 95CAT CAA AAA GGG ACG GTT CGG ACA AAG TAC GGC ACA AAA GGA GAG CTG 336His Gln Lys Gly Thr Val Arg Thr Lys Tyr Gly Thr Lys Gly Glu Leu100 105 110CAA TCT GCG ATC AAA AGT CTT CAT TCC CGC GAC ATT AAC GTT TAC GGG 384Gln Ser Ala Ile Lys Ser Leu His Ser Arg Asp Ile Asn Val Tyr Gly115 120 125GAT GTG GTC ATC AAC CAC AAA GGC GGC GCT GAT GCG ACC GAA GAT GTA 432Asp Val Val Ile Asn His Lys Gly Gly Ala Asp Ala Thr Glu Asp Val130 135 140ACC GCG GTT GAA GTC GAT CCC GCT GAC CGC AAC CGC GTA ATC TCA GGA 480Thr Ala Val Glu Val Asp Pro Ala Asp Arg Asn Arg Val Ile Ser Gly145 150 155 160GAA CAC CTA ATT AAA GCC TGG ACA CAT TTT CAT TTT CCG GGG GCC GGC 528Glu His Leu Ile Lys Ala Trp Thr His Phe His Phe Pro Gly Ala Gly165 170 175AGC ACA TAC AGC GAT TTT AAA TGG CAT TGG TAC CAT TTT GAC GGA ACC 576Ser Thr Tyr Ser Asp Phe Lys Trp His Trp Tyr His Phe Asp Gly Thr180 185 190GAT TGG GAC GAG TCC CGA AAG CTG AAC CGC ATC TAT AAG TTT CAA GGA 624Asp Trp Asp Glu Ser Arg Lys Leu Asn Arg Ile Tyr Lys Phe Gln Gly195 200 205AAG GCT TGG GAT TGG GAA GTT TCC AAT GAA AAC GGC AAC TAT GAT TAT 672Lys Ala Trp Asp Trp Glu Val Ser Asn Glu Asn Gly Asn Tyr Asp Tyr210 215 220TTG ATG TAT GCC GAC ATC GAT TAT GAC CAT CCT GAT GTC GCA GCA GAA 720Leu Met Tyr Ala Asp Ile Asp Tyr Asp His Pro Asp Val Ala Ala Glu225 230 235 240ATT AAG AGA TGG GGC ACT TGG TAT GCC AAT GAA CTG CAA TTG GAC GGA 768Ile Lys Arg Trp Gly Thr Trp Tyr Ala Asn Glu Leu Gln Leu Asp Gly245 250 255AAC CGT CTT GAT GCT GTC AAA CAC ATT AAA TTT TCT TTT TTG CGG GAT 816Asn Arg Leu Asp Ala Val Lys His Ile Lys Phe Ser Phe Leu Arg Asp260 265 270TGG GTT AAT CAT GTC AGG GAA AAA ACG GGG AAG GAA ATG TTT ACG GTA 864Trp Val Asn His Val Arg Glu Lys Thr Gly Lys Glu Met Phe Thr Val275 280 285GCT GAA TAT TGG CAG AAT GAC TTG GGC GCG CTG GAA AAC TAT TTG AAC 912Ala Glu Tyr Trp Gln Asn Asp Leu Gly Ala Leu Glu Asn Tyr Leu Asn290 295 300AAA ACA AAT TTT AAT CAT TCA GTG TTT GAC GTG CCG CTT CAT TAT CAG 960Lys Thr Asn Phe Asn His Ser Val Phe Asp Val Pro Leu His Tyr Gln305 310 315 320TTC CAT GCT GCA TCG ACA CAG GGA GGC GGC TAT GAT ATG AGG AAA TTG 1008Phe His Ala Ala Ser Thr Gln Gly Gly Gly Tyr Asp Met Arg Lys Leu325 330 335CTG AAC GGT ACG GTC GTT TCC AAG CAT CCG TTG AAA TCG GTT ACA TTT 1056Leu Asn Gly Thr Val Val Ser Lys His Pro Leu Lys Ser Val Thr Phe340 345 350GTC GAT AAC CAT GAT ACA CAG CCG GGG CAA TCG CTT GAG TCG ACT GTC 1104Val Asp Asn His Asp Thr Gln Pro Gly Gln Ser Leu Glu Ser Thr Val355 360 365CAA ACA TGG TTT AAG CCG CTT GCT TAC GCT TTT ATT CTC ACA AGG GAA 1152Gln Thr Trp Phe Lys Pro Leu Ala Tyr Ala Phe Ile Leu Thr Arg Glu370 375 380TCT GGA TAC CCT CAG GTT TTC TAC GGG GAT ATG TAC GGG ACG AAA GGA 1200Ser Gly Tyr Pro Gln Val Phe Tyr Gly Asp Met Tyr Gly Thr Lys Gly385 390 395 400GAC TCC CAG CGC GAA ATT CCT GCC TTG AAA CAC AAA ATT GAA CCG ATC 1248Asp Ser Gln Arg Glu Ile Pro Ala Leu Lys His Lys Ile Glu Pro Ile405 410 415TTA AAA GCG AGA AAA CAG TAT GCG TAC GGA GCA CAG CAT GAT TAT TTC 1296Leu Lys Ala Arg Lys Gln Tyr Ala Tyr Gly Ala Gln His Asp Tyr Phe420 425 430GAC CAC CAT GAC ATT GTC GGC TGG ACA AGG GAA GGC GAC AGC TCG GTT 1344Asp His His Asp Ile Val Gly Trp Thr Arg Glu Gly Asp Ser Ser Val435 440 445GCA AAT TCA GGT TTG GCG GCA TTA ATA ACA GAC GGA CCC GGT GGG GCA 1392Ala Asn Ser Gly Leu Ala Ala Leu Ile Thr Asp Gly Pro Gly Gly Ala450 455 460AAG CGA ATG TAT GTC GGC CGG CAA AAC GCC GGT GAG ACA TGG CAT GAC 1440Lys Arg Met Tyr Val Gly Arg Gln Asn Ala Gly Glu Thr Trp His Asp465 470 475 480ATT ACC GGA AAC CGT TCG GAG CCG GTT GTC ATC AAT TCG GAA GGC TGG 1488Ile Thr Gly Asn Arg Ser Glu Pro Val Val Ile Asn Ser Glu Gly Trp485 490 495GGA GAG TTT CAC GTA AAC GGC GGA TCC GTT TCA ATT TAT GTT CAA AGA 1536Gly Glu Phe His Val Asn Gly Gly Ser Val Ser Ile Tyr Val Gln Arg500 505 510TCT CCA ACT CCT GCC CCA TCT CAA AGC CCA ATT AGA AGA GAT GCA TTT 1584Ser Pro Thr Pro Ala Pro Ser Gln Ser Pro Ile Arg Arg Asp Ala Phe515 520 525TCA ATA ATC GAA GCG GAA GAA TAT AAC AGC ACA AAT TCC TCC ACT TTA 1632Ser Ile Ile Glu Ala Glu Glu Tyr Asn Ser Thr Asn Ser Ser Thr Leu530 535 540CAA GTG ATT GGA ACG CCA AAT AAT GGC AGA GGA ATT GGT TAT ATT GAA 1680Gln Val Ile Gly Thr Pro Asn Asn Gly Arg Gly Ile Gly Tyr Ile Glu545 550 555 560AAT GGT AAT ACC GTA ACT TAC AGC AAT ATA GAT TTT GGT AGT GGT GCA 1728Asn Gly Asn Thr Val Thr Tyr Ser Asn Ile Asp Phe Gly Ser Gly Ala565 570 575ACA GGG TTC TCT GCA ACT GTT GCA ACG GAG GTT AAT ACC TCA ATT CAA 1776Thr Gly Phe Ser Ala Thr Val Ala Thr Glu Val Asn Thr Ser Ile Gln580 585 590ATC CGT TCT GAC AGT CCT ACC GGA ACT CTA CTT GGT ACC TTA TAT GTA 1824Ile Arg Ser Asp Ser Pro Thr Gly Thr Leu Leu Gly Thr Leu Tyr Val595 600 605AGT TCT ACC GGC AGC TGG AAT ACA TAT CAA ACC GTA TCT ACA AAC ATC 1872Ser Ser Thr Gly Ser Trp Asn Thr Tyr Gln Thr Val Ser Thr Asn Ile610 615 620AGC AAA ATT ACC GGC GTT CAT GAT ATT GTA TTG GTA TTC TCA GGT CCA 1920Ser Lys Ile Thr Gly Val His Asp Ile Val Leu Val Phe Ser Gly Pro625 630 635 640GTC AAT GTG GAC AAC TTC ATA TTT AGC AGA AGT TCA CCA GTG CCT GCA 1968Val Asn Val Asp Asn Phe Ile Phe Ser Arg Ser Ser Pro Val Pro Ala645 650 655CCT GGT GAT AAC ACA AGA GAC GCA TAT TCT ATC ATT CAG GCC GAG GAT 2016Pro Gly Asp Asn Thr Arg Asp Ala Tyr Ser Ile Ile Gln Ala Glu Asp660 665 670TAT GAC AGC AGT TAT GGT CCC AAC CTT CAA ATC TTT AGC TTA CCA GGT 2064Tyr Asp Ser Ser Tyr Gly Pro Asn Leu Gln Ile Phe Ser Leu Pro Gly675 680 685GGT GGC AGC GCC ATT GGC TAT ATT GAA AAT GGT TAT TCC ACT ACC TAT 2112Gly Gly Ser Ala Ile Gly Tyr Ile Glu Asn Gly Tyr Ser Thr Thr Tyr690 695 700AAA AAT ATT GAT TTT GGT GAC GGC GCA ACG TCC GTA ACA GCA AGA GTA 2160Lys Asn Ile Asp Phe Gly Asp Gly Ala Thr Ser Val Thr Ala Arg Val705 710 715 720GCT ACC CAG AAT GCT ACT ACC ATT CAG GTA AGA TTG GGA AGT CCA TCG 2208Ala Thr Gln Asn Ala Thr Thr Ile Gln Val Arg Leu Gly Ser Pro Ser725 730 735GGT ACA TTA CTT GGA ACA ATT TAC GTG GGG TCC ACA GGA AGC TTT GAT 2256Gly Thr Leu Leu Gly Thr Ile Tyr Val Gly Ser Thr Gly Ser Phe Asp740 745 750ACT TAT AGG GAT GTA TCC GCT ACC ATT AGT AAT ACT GCG GGT GTA AAA 2304Thr Tyr Arg Asp Val Ser Ala Thr Ile Ser Asn Thr Ala Gly Val Lys755 760 765GAT ATT GTT CTT GTA TTC TCA GGT CCT GTT AAT GTT GAC TGG 2346Asp Ile Val Leu Val Phe Ser Gly Pro Val Asn Val Asp Trp770 775 780(2)SEQ ID NO:25的資料(ⅰ)序列特徵(A)長度782個胺基酸(B)類型胺基酸(D)拓撲結構線性(ⅱ)分子類型蛋白質(ⅹⅰ)序列描述SEQ ID NO:25Met Lys Gln Gln Lys Arg Leu Tyr Ala Arg Leu Leu Thr Leu Leu Phe1 5 10 15Ala Leu Ile Phe Leu Leu Pro His Ser Ala Ala Ala Ala Ala Asn Leu20 25 30Asn Gly Thr Leu Met Gln Tyr Phe Glu Trp Tyr Met Pro Asn Asp Gly35 40 45Gln His Trp Lys Arg Leu Gln Asn Asp Ser Ala Tyr Leu Ala Glu His50 55 60Gly Ile Thr Ala Val Trp Ile Pro Pro Ala Tyr Lys Gly Thr Ser Gln65 70 75 80Ala Asp Val Gly Tyr Gly Ala Tyr Asp Leu Tyr Asp Leu Gly Glu Phe85 90 95His Gln Lys Gly Thr Val Arg Thr Lys Tyr Gly Thr Lys Gly Glu Leu100 105 110Gln Ser Ala Ile Lys Ser Leu His Ser Arg Asp Ile Asn Val Tyr Gly115 120 125Asp Val Val Ile Asn His Lys Gly Gly Ala Asp Ala Thr Glu Asp Val130 135 140Thr Ala Val Glu Val Asp Pro Ala Asp Arg Asn Arg Val Ile Ser Gly145 150 155 160Glu His Leu Ile Lys Ala Trp Thr His Phe His Phe Pro Gly Ala Gly165 170 175Ser Thr Tyr Ser Asp Phe Lys Trp His Trp Tyr His Phe Asp Gly Thr180 185 190Asp Trp Asp Glu Ser Arg Lys Leu Asn Arg Ile Tyr Lys Phe Gln Gly195 200 205Lys Ala Trp Asp Trp Glu Val Ser Asn Glu Asn Gly Asn Tyr Asp Tyr210 215 220Leu Met Tyr Ala Asp Ile Asp Tyr Asp His Pro Asp Val Ala Ala Glu225 230 235 240Ile Lys Arg Trp Gly Thr Trp Tyr Ala Asn Glu Leu Gln Leu Asp Gly245 250 255Asn Arg Leu Asp Ala Val Lys His Ile Lys Phe Ser Phe Leu Arg Asp260 265 270Trp Val Asn His Val Arg Glu Lys Thr Gly Lys Glu Met Phe Thr Val275 280 285Ala Glu Tyr Trp Gln Asn Asp Leu Gly Ala Leu Glu Asn Tyr Leu Asn290 295 300Lys Thr Asn Phe Asn His Ser Val Phe Asp Val Pro Leu His Tyr Gln305 310 315 320Phe His Ala Ala Ser Thr Gln Gly Gly Gly Tyr Asp Met Arg Lys Leu325 330 335Leu Asn Gly Thr Val Val Ser Lys His Pro Leu Lys Ser Val Thr Phe340 345 350Val Asp Asn His Asp Thr Gln Pro Gly Gln Ser Leu Glu Ser Thr Val355 360 365Gln Thr Trp Phe Lys Pro Leu Ala Tyr Ala Phe Ile Leu Thr Arg Glu370 375 380Ser Gly Tyr Pro Gln Val Phe Tyr Gly Asp Met Tyr Gly Thr Lys Gly385 390 395 400Asp Ser Gln Arg Glu Ile Pro Ala Leu Lys His Lys Ile Glu Pro Ile405 410 415Leu Lys Ala Arg Lys Gln Tyr Ala Tyr Gly Ala Gln His Asp Tyr Phe420 425 430Asp His His Asp Ile Val Gly Trp Thr Arg Glu Gly Asp Ser Ser Val435 440 445Ala Asn Ser Gly Leu Ala Ala Leu Ile Thr Asp Gly Pro Gly Gly Ala450 455 460Lys Arg Met Tyr Val Gly Arg Gln Asn Ala Gly Glu Thr Trp His Asp465 470 475 480Ile Thr Gly Asn Arg Ser Glu Pro Val Val Ile Asn Ser Glu Gly Trp485 490 495Gly Glu Phe His Val Asn Gly Gly Ser Val Ser Ile Tyr Val Gln Arg500 505 510Ser Pro Thr Pro Ala Pro Ser Gln Ser Pro Ile Arg Arg Asp Ala Phe515 520 525Ser Ile Ile Glu Ala Glu Glu Tyr Asn Ser Thr Asn Ser Ser Thr Leu530 535 540Gln Val Ile Gly Thr Pro Asn Asn Gly Arg Gly Ile Gly Tyr Ile Glu545 550 555 560Asn Gly Asn Thr Val Thr Tyr Ser Asn Ile Asp Phe Gly Ser Gly Ala565 570 575Thr Gly Phe Ser Ala Thr Val Ala Thr Glu Val Asn Thr Ser Ile Gln580 585 590Ile Arg Ser Asp Ser Pro Thr Gly Thr Leu Leu Gly Thr Leu Tyr Val595 600 605Ser Ser Thr Gly Ser Trp Asn Thr Tyr Gln Thr Val Ser Thr Asn Ile610 615 620Ser Lys Ile Thr Gly Val His Asp Ile Val Leu Val Phe Ser Gly Pro625 630 635 640Val Asn Val Asp Asn Phe Ile Phe Ser Arg Ser Ser Pro Val Pro Ala645 650 655Pro Gly Asp Asn Thr Arg Asp Ala Tyr Ser Ile Ile Gln Ala Glu Asp660 665 670Tyr Asp Ser Ser Tyr Gly Pro Asn Leu Gln Ile Phe Ser Leu Pro Gly675 680 685Gly Gly Ser Ala Ile Gly Tyr Ile Glu Asn Gly Tyr Ser Thr Thr Tyr690 695 700Lys Asn Ile Asp Phe Gly Asp Gly Ala Thr Ser Val Thr Ala Arg Val705 710 715 720Ala Thr Gln Asn Ala Thr Thr Ile Gln Val Arg Leu Gly Ser Pro Ser725 730 735Gly Thr Leu Leu Gly Thr Ile Tyr Val Gly Ser Thr Gly Ser Phe Asp740 745 750Thr Tyr Arg Asp Val Ser Ala Thr Ile Ser Asn Thr Ala Gly Val Lys755 760 765Asp Ile Val Leu Val Phe ser Gly ProVal A5n Val Asp Trp770 775780(2)SEQ ID NO:26的資料(ⅰ)序列特徵(A)長度6136個鹼基對(B)類型核酸(C)鏈型單鏈(D)拓撲結構線性(ⅱ)分子類型cDNA(ⅹⅰ)序列描述SEQ ID NO:26TTTGACAGCT TATCATCGAC TGCACGGTGC ACCAATGCTT CTGGCGTCAG GCAGCCATCG 60GAAGCTGTGG TATGGCTGTG CAGGTCGTAA ATCACTGCAT AATTCGTGTC GCTCAAGGCG 120CACTCCCGTT CTGGATAATG TTTTTTGCGC CGACATCATA ACGGTTCTGG CAAATATTCT 180GAAATGAGCT GTTGACAATT AATCATCGGC TCGTATAATG TGTGGAATTG TGAGCGGATA 240ACAATTTCAC ACAGGAAACA GAATTGATCC ATAACTAACT AATCTAGTAA TAATTTTGTT 300TAACTTTAAG AAGGAGATAT ATCCATGGAT CCTAGGACCA CGCCCGCACC CGGCCACCCG 360GCCCGCGGCG CCCGCACCGC TCTGCGCACG ACGCTCGCCG CCGCGGCGGC GACGCTCGTC 420GTCGGCGCCA CGGTCGTGCT GCCCGCCCAG GCCGCTAGCG AATTCGCAAA TCTTAATGGG 480ACGCTGATGC AGTATTTTGA ATGGTACATG CCCAATGACG GCCAACATTG GAGGCGTTTG 540CAAAACGACT CGGCATATTT GGCTGAACAC GGTATTACTG CCGTCTGGAT TCCCCCGGCA 600TATAAGGGAA CGAGCCAAGC GGATGTGGGC TACGGTGCTT ACGACCTTTA TGATTTAGGG 660GAGTTTCATC AAAAAGGGAC GGTTCGGACA AAGTACGGCA CAAAAGGAGA GCTGCAATCT 720GCGATCAAAA GTCTTCATTC CCGCGACATT AACGTTTACG GGGATGTGGT CATCAACCAC 780AAAGGCGGCG CTGATGCGAC CGAAGATGTA ACCGCGGTTG AAGTCGATCC CGCTGACCGC 840AACCGCGTAA TCTCAGGAGA ACACCTAATT AAAGCCTGGA CACATTTTCA TTTTCCGGGG 900CGCGGCAGCA CATACAGCGA TTTTAAATGG CATTGGTACC ATTTTGACGG AACCGATTGG 960GACGAGTCCC GAAAGCTGAA CCGCATCTAT AAGTTTCAAG GAAAGGCTTG GGATTGGGAA 1020GTTTCCAATG AAAACGGCAA CTATGATTAT TTGATGTATG CCGACATCGA TTATGACCAT 1080CCTGATGTCG CAGCAGAAAT TAAGAGATGG GGCACTTGGT ATGCCAATGA ACTGCAATTG 1140GACGGTTTCC GTCTTGATGC TGTCAAACAC ATTAAATTTT CTTTTTTGCG GGATTGGGTT 1200AATCATGTCA GGGAAAAAAC GGGGAAGGAA ATGTTTACGG TAGCTGAATA TTGGCAGAAT 1260GACTTGGGCG CGCTGGAAAA CTATTTGAAC AAAACAAATT TTAATCATTC AGTGTTTGAC 1320GTGCCGCTTC ATTATCAGTT CCATGCTGCA TCGACACAGG GAGGCGGCTA TGATATGAGG 1380AAATTGCTGA ACGGTACGGT CGTTTCCAAG CATCCGTTGA AATCGGTTAC ATTTGTCGAT 1440AACCATGATA CACAGCCGGG GCAATCGCTT GAGTCGACTG TCCAAACATG GTTTAAGCCG 1500CTTGCTTACG CTTTTATTCT CACAAGGGAA TCTGGATACC CTCAGGTTTT CTACGGGGAT 1560ATGTACGGGA CGAAAGGAGA CTCCCAGCGC GAAATTCCTG CCTTGAAACA CAAAATTGAA 1620CCGATCTTAA AAGCGAGAAA ACAGTATGCG TACGGAGCAC AGCATGATTA TTTCGACCAC 1680CATGACATTG TCGGCTGGAC AAGGGAAGGC GACAGCTCGG TTGCAAATTC AGGTTTGGCG 1740GCATTAATAA CAGACGGACC CGGTGGGGCA AAGCGAATGT ATGTCGGCCG GCAAAACGCC 1800GGTGAGACAT GGCATGACAT TACCGGAAAC CGTTCGGAGC CGGTTGTCAT CAATTCGGAA 1860GGCTGGGGAG AGTTTCACGT AAACGGCGGG TCGGTTTCAA TTTATGTTCA AAGAAGGCCT 1920CCAACCCCCA CTAGTCCGAG CGCTCCCAGC GGCTGCACTG CTGAGAGGTG GGCTCAGTGC 1980GGCGGCAATG GCTGGAGCGG CTGCACCACC TGCGTCGCTG GCAGCACTTG CACGAAGATT 2040AATGACTGGT ACCATCAGTG CCTGTAAGCT TATTATATTA CTAATTAATT GGGGACCCTA 2100GAGGTCCCCT TTTTTATTTT AGCTTCACGC TGCCGCAAGC ACTCAGGGCG CAAGGGCTGC 2160TAAAGGAAGC GGAACACGTA GAAAGCCAGT CCGCAGAAAC GGTGCTGACC CCGGATGAAT 2220GTCAGCTACT GGGCTATCTG GACAAGGGAA AACGCAAGCG CAAAGAGAAA GCAGGTAGCT 2280TGCAGTGGGC TTACATGGCG ATAGCTAGAC TGGGCGGTTT TATGGACAGC AAGCGAACCG 2340GAATTGCCAG CTGGGGCGCC CTCTGGTAAG GTTGGGAAGC CCTGCAAAGT AAACTGGATG 2400GCTTTCTTGC CGCCAAGGAT CTGATGGCGC AGGGGATCAA GATCTGATCA AGAGACAGGA 2460TGAGGATCGT TTCGCATGAT TGAACAAGAT GGATTGCACG CAGGTTCTCC GGCCGCTTGG 2520GTGGAGAGGC TATTCGGCTA TGACTGGGCA CAACAGACAA TCGGCTGCTC TGATGCCGCC 2580GTGTTCCGGC TGTCAGCGCA GGGGCGCCCG GTTCTTTTTG TCAAGACCGA CCTGTCCGGT 2640GCCCTGAATG AACTGCAGGA CGAGGCAGCG CGGCTATCGT GGCTGGCCAC GACGGGCGTT 2700CCTTGCGCAG CTGTGCTCGA CGTTGTCACT GAAGCGGGAA GGGACTGGCT GCTATTGGGC 2760GAAGTGCCGG GGCAGGATCT CCTGTCATCT CACCTTGCTC CTGCCGAGAA AGTATCCATC 2820ATGGCTGATG CAATGCGGCG GCTGCATACG CTTGATCCGG CTACCTGCCC ATTCGACCAC 2880CAAGCGAAAC ATCGCATCGA GCGAGCACGT ACTCGGATGG AAGCCGGTCT TGTCGATCAG 2940GATGATCTGG ACGAAGAGCA TCAGGGGCTC GCGCCAGCCG AACTGTTCGC CAGGCTCAAG 3000GCGCGCATGC CCGACGGCGA GGATCTCGTC GTGACACATG GCGATGCCTG CTTGCCGAAT 3060ATCATGGTGG AAAATGGCCG CTTTTCTGGA TTCATCGACT GTGGCCGGCT GGGTGTGGCG 3120GACCGCTATC AGGACATAGC GTTGGCTACC CGTGATATTG CTGAAGAGCT TGGCGGCGAA 3180TGGGCTGACC GCTTCCTCGT GCTTTACGGT ATCGCCGCTC CCGATTCGCA GCGCATCGCC 3240TTCTATCGCC TTCTTGACGA GTTCTTCTGA GCGGGACTCT GGGGTTCGAA ATGACCGACC 3300AAGCGACGCC CAACCTGCCA TCACGAGATT TCGATTCCAC CGCCGCCTTC TATGAAAGGT 3360TGGGCTTCGG AATCGTTTTC CGGGACGCCG GCTGGATGAT CCTCCAGCGC GGGGATCTCA 3420TGCTGGAGTT CTTCGCCCAC CCCAAAAGGA TCTAGGTGAA GATCCTTTTT GATAATCTCA 3480TGACCAAAAT CCCTTAACGT GAGTTTTCGT TCCACTGAGC GTCAGACCCC GTAGAAAAGA 3540TCAAAGGATC TTCTTGAGAT CCTTTTTTTC TGCGCGTAAT CTGCTGCTTG CAAACAAAAA 3600AACCACCGCT ACCAGCGGTG GTTTGTTTGC CGGATCAAGA GCTACCAACT CTTTTTCCGA 3660AGGTAACTGG CTTCAGCAGA GCGCAGATAC CAAATACTGT CCTTCTAGTG TAGCCGTAGT 3720TAGGCCACCA CTTCAAGAAC TCTGTAGCAC CGCCTACATA CCTCGCTCTG CTAATCCTGT 3780TACCAGTGGC TGCTGCCAGT GGCGATAAGT CGTGTCTTAC CGGGTTGGAC TCAAGACGAT 3840AGTTACCGGA TAAGGCGCAG CGGTCGGGCT GAACGGGGGG TTCGTGCACA CAGCCCAGCT 3900TGGAGCGAAC GACCTACACC GAACTGAGAT ACCTACAGCG TGAGCTATGA GAAAGCGCCA 3960CGCTTCCCGA AGGGAGAAAG GCGGACAGGT ATCCGGTAAG CGGCAGGGTC GGAACAGGAG 4020AGCGCACGAG GGAGCTTCCA GGGGGAAACG CCTGGTATCT TTATAGTCCT GTCGGGTTTC 4080GCCACCTCTG ACTTGAGCGT CGATTTTTGT GATGCTCGTC AGGGGGGCGG AGCCTATGGA 4140AAAACGCCAG CAACGCGGCC TTTTTACGGT TCCTGGCCTT TTGCTGGCCT TTTGCTCACA 4200TGTTCTTTCC TGCGTTATCC CCTGATTCTG TGGATAACCG TATTACCGCC TTTGAGTGAG 4260CTGATACCGC TCGCCGCAGC CGAACGACCG AGCGCAGCGA GTCAGTGAGC GAGGAAGCGG 4320AAGAGCGCCT GATGCGGTAT TTTCTCCTTA CGCATCTGTG CGGTATTTCA CACCGCATAT 4380GCAGATATTT TGTTAAAATT CGCGTTAAAT TTTTGTTAAA TCAGCTCATT TTTTAACCAA 4440TAGGCCGAAA TCGGCAAAAT CCCTTATAAA TCAAAAGAAT AGACCGAGAT AGGGTTGAGT 4500GTTGTTCCAG TTTGGAACAA GAGTCCACTA TTAAAGAACG TGGACTCCAA CGTCAAAGGG 4560CGAAAAACCG TCTATCAGGG CGATGGCCCA CTACGTGAAC CATCACCCTA ATCAAGTTTT 4620TTGGGGTCGA GGTGCCGTAA AGCACTAAAT CGGAACCCTA AAGGGAGCCC CCGATTTAGA 4680GCTTGACGGG GAAAGCCGGC GAACGTGGCG AGAAAGGAAG GGAAGAAAGC GAAAGGAGCG 4740GGCGCTAGGG CGCTGGCAAG TGTAGCGGTC ACGCTGCGCG TAACCACCAC ACCCGCCGCG 4800CTTAATGCGC CGCTACAGGG CGCGTCAGGT GGCACTTTTC GGGGAAATGT GCGCGGAACC 4860CCTATTTGTT TATTTTTCTA AATACATTCA AATATGTATC CGCTCATGAG ACAATAACCC 4920TGCTGCATTT ACGTTGACAC CATCGAATGG TGCAAAACCT TTCGCGGTAT GGCATGATAG 4980CGCCCGGAAG AGAGTCAATT CAGGGTGGTG AATGTGAAAC CAGTAACGTT ATACGATGTC 5040GCAGAGTATG CCGGTGTCTC TTATCAGACC GTTTCCCGCG TGGTGAACCA GGCCAGCCAC 5100GTTTCTGCGA AAACGCGGGA AAAAGTGGAA GCGGCGATGG CGGAGCTGAA TTACATTCCC 5160AACCGCGTGG CACAACAACT GGCGGGCAAA CAGTCGTTGC TGATTGGCGT TGCCACCTCC 5220AGTCTGGCCC TGCACGCGCC GTCGCAAATT GTCGCGGCGA TTAAATCTCG CGCCGATCAA 5280CTGGGTGCCA GCGTGGTGGT GTCGATGGTA GAACGAAGCG GCGTCGAAGC CTGTAAAGCG 5340GCGGTGCACA ATCTTCTCGC GCAACGCGTC AGTGGGCTGA TCATTAACTA TCCGCTGGAT 5400GACCAGGATG CCATTGCTGT GGAAGCTGCC TGCACTAATG TTCCGGCGTT ATTTCTTGAT 5460GTCTCTGACC AGACACCCAT CAACAGTATT ATTTTCTCCC ATGAAGACGG TACGCGACTG 5520GGCGTGGAGC ATCTGGTCGC ATTGGGTCAC CAGCAAATCG CGCTGTTAGC GGGCCCATTA 5580AGTTCTGTCT CGGCGCGTCT GCGTCTGGCT GGCTGGCATA AATATCTCAC TCGCAATCAA 5640ATTCAGCCGA TAGCGGAACG GGAAGGCGAC TGGAGTGCCA TGTCCGGTTT TCAACAAACC 5700ATGCAAATGC TGAATGAGGG CATCGTTCCC ACTGCGATGC TGGTTGCCAA CGATCAGATG 5760GCGCTGGGCG CAATGCGCGC CATTACCGAG TCCGGGCTGC GCGTTGGTGC GGATATCTCG 5820GTAGTGGGAT ACGACGATAC CGAAGACAGC TCATGTTATA TCCCGCCGTT AACCACCATC 5880AAACAGGATT TTCGCCTGCT GGGGCAAACC AGCGTGGACC GCTTGCTGCA ACTCTCTCAG 5940GGCCAGGCGG TGAAGGGCAA TCAGCTGTTG CCCGTCTCAC TGGTGAAAAG AAAAACCACC 6000CTGGCGCCCA ATACGCAAAC CGCCTCTCCC CGCGCGTTGG CCGATTCATT AATGCAGCTG 6060GCACGACAGG TTTCCCGACT GGAAAGCGGG CAGTGAGCGC AACGCAATTA ATGTGAGTTA 6120GCGCGAATTG ATCTGG 6136(2)SEQ ID NO:27的資料(ⅰ)序列特徵(A)長度30個鹼基對(B)類型核酸(C)鏈型單鏈(D)拓撲結構線性(ⅱ)分子類型其它核酸(ⅸ)特徵(A)名稱/關鍵詞misc-特徵(B)其它信息/desc=「引物14」(ⅹⅰ)序列描述SEQ ID NO:27AGGTCTACTA GTCCCGGCTG CCGCGTCGAC30(2)SEQ ID NO:28的資料(ⅰ)序列特徵(A)長度53個鹼基對
(B)類型核酸(C)鏈型單鏈(D)拓撲結構線性(ⅱ)分子類型其它核酸(ⅸ)特徵(A)名稱/關鍵詞misc-特徵(B)其它信息/desc=「引物15」(ⅹⅰ)序列描述SEQ ID NO:28CCGATTAAAG CTTATTAGCT AGCACGGAAT TCCGTGGGGC TGGTCGTCGG CAC53(2)SEQ ID NO:29的資料(ⅰ)序列特徵(A)長度42個鹼基對(B)類型核酸(C)鏈型單鏈(D)拓撲結構線性(ⅱ)分子類型其它核酸(ⅸ)特徵(A)名稱/關鍵詞misc-特徵(B)其它信息/desc=「引物16」(ⅹⅰ)序列描述SEQ ID NO:29TCATGAGCCA TGGCTAGCGC AAATCTTAAT GGGACGCTGA TG42(2)SEQ ID NO:30的資料(ⅰ)序列特徵(A)長度69個鹼基對(B)類型核酸
(C)鏈型單鏈(D)拓撲結構線性(ⅱ)分子類型其它核酸(ⅸ)特徵(A)名稱/關鍵詞misc-特徵(B)其它信息/desc=「引物17」(ⅹⅰ)序列描述SEQ ID NO:30ATGACTAAGC TTACTTACTT AGTGATGGTG ATGGTGATGA CTAGTTCTTT GAACATAAAT TGAAACCGA69(2)SEQ ID NO:31的資料(ⅰ)序列特徵(A)長度1959個鹼基對(B)類型核酸(C)鏈型單鏈(D)拓撲結構線性(ⅱ)分子類型cDNA(ⅸ)特徵(A)名稱/關鍵詞CDS(B)位置1..1959(ⅹⅰ)序列描述SEQ IDNO:31ATG GAT CCT AGG ACC ACG CCC GCA CCC GGC CAC CCG GCC CGC GGC GCC 48Met Asp Pro Arg Thr Thr Pro Ala Pro Gly His Pro Ala Arg Gly Ala1 5 10 15CGC ACC GCT CTG CGC ACG ACG CTC GCC GCC GCG GCG GCG ACG CTC GTC 96Arg Thr Ala Leu Arg Thr Thr Leu Ala Ala Ala Ala Ala Thr Leu Val20 25 30GTC GGC GCC ACG GTC GTG CTG CCC GCC CAG GCC GCT AGT CCC GGC TGC 144Val Gly Ala Thr Val Val Leu Pro Ala Gln Ala Ala Ser Pro Gly Cys35 40 45CGC GTC GAC TAC GCC GTC ACC AAC CAG TGG CCC GGC GGC TTC GGC GCC 192Arg Val Asp Tyr Ala Val Thr Asn Gln Trp Pro Gly Gly Phe Gly Ala
50 55 60AAC GTC ACG ATC ACC AAC CTC GGC GAC CCC GTC TCG TCG TGG AAG CTC 240Asn Val Thr Ile Thr Asn Leu Gly Asp Pro Val Ser Ser Trp Lys Leu65 70 75 80GAC TGG ACC TAC ACC GCA GGC CAG CGG ATC CAG CAG CTG TGG AAC GGC 288Asp Trp Thr Tyr Thr Ala Gly Gln Arg Ile Gln Gln Leu Trp Asn Gly85 90 95ACC GCG TCG ACC AAC GGC GGC CAG GTC TCC GTC ACC AGC CTG CCC TGG 336Thr Ala Ser Thr Asn Gly Gly Gln Val Ser Val Thr Ser Leu Pro Trp100 105 110AAC GGC AGC ATC CCG ACC GGC GGC ACG GCG TCG TTC GGG TTC AAC GGC 384Aan Gly Ser Ile Pro Thr Gly Gly Thr Ala Ser Phe Gly Phe Asn Gly115 120 125TCG TGG GCC GGG TCC AAC CCG ACG CCG GCG TCG TTC TCG CTC AAC GGC 432Ser Trp Ala Gly Ser Asn Pro Thr Pro Ala Ser Phe Ser Leu Asn Gly130 135 140ACC ACC TGC ACG GGC ACC GTG CCG ACG ACC AGC CCC ACG GAA TTC CGT 480Thr Thr Cys Thr Gly Thr Val Pro Thr Thr Ser Pro Thr Glu Phe Arg145 150 155 160GCT AGC GCA AAT CTT AAT GGG ACG CTG ATG CAG TAT TTT GAA TGG TAC 528Ala Ser Ala Asn Leu Asn Gly Thr Leu Met Gln Tyr Phe Glu Trp Tyr165 170 175ATG CCC AAT GAC GGC CAA CAT TGG AAG CGC TTG CAA AAC GAC TCG GCA 576Met Pro Asn Asp Gly Gln His Trp Lys Arg Leu Gln Asn Asp Ser Ala180 185 190TAT TTG GCT GAA CAC GGT ATT ACT GCC GTC TGG ATT CCC CCG GCA TAT 624Tyr Leu Ala Glu His Gly Ile Thr Ala Val Trp Ile Pro Pro Ala Tyr195 200 205AAG GGA ACG AGC CAA GCG GAT GTG GGC TAC GGT GCT TAC GAC CTT TAT 672Lys Gly Thr Ser Gln Ala Asp Val Gly Tyr Gly Ala Tyr Asp Leu Tyr210 215 220GAT TTA GGG GAG TTT CAT CAA AAA GGG ACG GTT CGG ACA AAG TAC GGC 720Asp Leu Gly Glu Phe His Gln Lys Gly Thr Val Arg Thr Lys Tyr Gly225 230 235 240ACA AAA GGA GAG CTG CAA TCT GCG ATC AAA AGT CTT CAT TCC CGC GAC 768Thr Lys Gly Glu Leu Gln Ser Ala Ile Lys Ser Leu His Ser Arg Asp245 250 255ATT AAC GTT TAC GGG GAT GTG GTC ATC AAC CAC AAA GGC GGC GCT GAT 816Ile Asn Val Tyr Gly Asp Val Val Ile Asn His Lys Gly Gly Ala Asp260 265 270GCG ACC GAA GAT GTA ACC GCG GTT GAA GTC GAT CCC GCT GAC CGC AAC 864Ala Thr Glu Asp Val Thr Ala Val Glu Val Asp Pro Ala Asp Arg Asn275 280 285CGC GTA ATT TCA GGA GAA CAC TTA ATT AAA GCC TGG ACA CAT TTT CAT 912Arg Val Ile Ser Gly Glu His Leu Ile Lys Ala Trp Thr His Phe His290 295 300TTT CCG GGG CGC GGC AGC ACA TAC AGC GAT TTT AAA TGG CAT TGG TAC 960Phe Pro Gly Arg Gly Ser Thr Tyr Ser Asp Phe Lys Trp His Trp Tyr305 310 315 320CAT TTT GAC GGA ACC GAT TGG GAC GAG TCC CGA AAG CTG AAC CGC ATC 1008His Phe Asp Gly Thr Asp Trp Asp Glu Ser Arg Lys Leu Asn Arg Ile
325 330 335TAT AAG TTT CAA GGA AAG GCT TGG GAT TGG GAA GTT TCC AAT GAA AAC 1056Tyr Lys Phe Gln Gly Lys Ala Trp Asp Trp Glu Val Ser Asn Glu Asn340 345 350GGC AAC TAT GAT TAT TTG ATG TAT GCC GAC ATC GAT TAT GAT CAT CCT 1104Gly Asn Tyr Asp Tyr Leu Met Tyr Ala Asp Ile Asp Tyr Asp His Pro355 360 365GAT GTC GCA GCA GAA ATT AAG AGA TGG GGC ACT TGG TAT GCC AAT GAA 1152Asp Val Ala Ala Glu Ile Lys Arg Trp Gly Thr Trp Tyr Ala Asn Glu370 375 380CTG CAA TTG GAC GGT TTC CGT CTT GAT GCT GTC AAA CAC ATT AAA TTT 1200Leu Gin Leu Asp Gly Phe Arg Leu Asp Ala Val Lys His Ile Lys Phe385 390 395 400TCT TTT TTG CGG GAT TGG GTT AAT CAT GTC AGG GAA AAA ACG GGG AAG 1248Ser Phe Leu Arg Asp Trp Val Asn His Val Arg Glu Lys Thr Gly Lys405 410415GAA ATG TTT ACG GTA GCT GAA TAT TGG CAG AAT GAC TTG GGC GCG CTG 1296Glu Met Phe Thr Val Ala Glu Tyr Trp Gln Asn Asp Leu Gly Ala Leu420 425 430GAA AAC TAT TTG AAC AAA ACA AAT TTT AAT CAT TCA GTG TTT GAC GTG 1344Glu Asn Tyr Leu Asn Lys Thr Asn Phe Asn His Ser Val Phe Asp Val435 440 445CCG CTT CAT TAT CAG TTC CAT GCT GCA TCG ACA CAG GGA GGC GGC TAT 1392Pro Leu His Tyr Gln Phe His Ala Ala Ser Thr Gln Gly Gly Gly Tyr450 455 460GAT ATG AGG AAA TTG CTG AAC GGT ACG GTC GTT TCC AAG CAT CCG TTG 1440Asp Met Arg Lys Leu Leu Asn Gly Thr Val Val Ser Lys His Pro Leu465 470 475480AAA GCG GTT ACA TTT GTC GAT AAC CAT GAT ACA CAG CCG GGG CAA TCG 1488Lys Ala Val Thr Phe Val Asp Asn His Asp Thr Gln Pro Gly Gln Ser485 490 495CTT GAG TCG ACT GTC CAA ACA TGG TTT AAG CCG CTT GCT TAC GCT TTT 1536Leu Glu Ser Thr Val Gln Thr Trp Phe Lys Pro Leu Ala Tyr Ala Phe500 505 510ATT CTC ACA AGG GAA TCT GGA TAC CCT CAG GTT TTC TAC GGG GAT ATG 1584Ile Leu Thr Arg Glu Ser Gly Tyr Pro Gln Val Phe Tyr Gly Asp Met515 520 525TAC GGG ACG AAA GGA GAC TCC CAG CGC GAA ATT CCT GCC TTG AAA CAC 1632Tyr Gly Thr Lys Gly Asp Ser Gln Arg Glu Ile Pro Ala Leu Lys His530 535 540AAA ATT GAA CCG ATC TTA AAA GCG AGA AAA CAG TAT GCG TAC GGA GCA 1680Lys Ile Glu Pro Ile Leu Lys Ala Arg Lys Gln Tyr Ala Tyr Gly Ala545 550 555 560CAG CAT GAT TAT TTC GAC CAC CAT GAC ATT GTC GGC TGG ACA AGG GAA 1728Gln His Asp Tyr Phe Asp His His Asp Ile Val Gly Trp Thr Arg Glu565 570 575GGC GAC AGC TCG GTT GCA AAT TCA GGT TTG GCG GCA TTA ATA ACA GAC 1776Gly Asp Ser Ser Val Ala Asn Ser Gly Leu Ala Ala Leu Ile Thr Asp580 585 590GGA CCC GGT GGG GCA AAG CGA ATG TAT GTC GGC CGG CAA AAC GCC GGT 1824Gly Pro Gly Gly Ala Lys Arg Met Tyr Val Gly Arg Gln Asn Ala Gly
595 600 605GAG ACA TGG CAT GAC ATT ACC GGA AAC CGT TCG GAG CCG GTT GTC ATC 1872Glu Thr Trp His Asp Ile Thr Gly Asn Arg Ser Glu Pro Val Val Ile610 615 620AAT TCG GAA GGC TGG GGA GAG TTT CAC GTA AAC GGC GGG TCG GTT TCA 1920Asn Ser Glu Gly Trp Gly Glu Phe His Val Asn Gly Gly Ser Val Ser625 630635 640ATT TAT GTT CAA AGA ACT AGT CAT CAC CAT CAC CAT CACIle Tyr Val Gln Arg Thr Ser His His His His His His645 650(2)SEQ ID NO:32的資料(ⅰ)序列特徵(A)長度653個胺基酸(B)類型胺基酸(D)拓撲結構線性(ⅱ)分子類型蛋白質(ⅹⅰ)序列描述SEQ ID NO:32Met Asp Pro Arg Thr Thr Pro Ala Pro Gly His Pro Ala Arg Gly Ala1 5 10 15Arg Thr Ala Leu Arg Thr Thr Leu Ala Ala Ala Ala Ala Thr Leu Val20 25 30Val Gly Ala Thr Val Val Leu Pro Ala Gln Ala Ala Ser Pro Gly Cys35 40 45Arg Val Asp Tyr Ala Val Thr Asn Gln Trp Pro Gly Gly Phe Gly Ala50 55 60Asn Val Thr Ile Thr Asn Leu Gly Asp Pro Val Ser Ser Trp Lys Leu65 70 75 80Asp Trp Thr Tyr Thr Ala Gly Gln Arg Ile Gln Gln Leu Trp Asn Gly85 90 95Thr Ala Ser Thr Asn Gly Gly Gln Val Ser Val Thr Ser Leu Pro Trp100 105 110Asn Gly Ser Ile Pro Thr Gly Gly Thr Ala Ser Phe Gly Phe Asn Gly115 120 125Ser Trp Ala Gly Ser Asn Pro Thr Pro Ala Ser Phe Ser Leu Asn Gly130 135 140Thr Thr Cys Thr Gly Thr Val Pro Thr Thr Ser Pro Thr Glu Phe Arg145 150 155 160Ala Ser Ala Asn Leu Asn Gly Thr Leu Met Gln Tyr Phe Glu Trp Tyr165 170 175Met Pro Asn Asp Gly Gln His Trp Lys Arg Leu Gln Asn Asp Ser Ala180 185 190Tyr Leu Ala Glu His Gly Ile Thr Ala Val Trp Ile Pro Pro Ala Tyr195 200 205Lys Gly Thr Ser Gln Ala Asp Val Gly Tyr Gly Ala Tyr Asp Leu Tyr210 215 220Asp Leu Gly Glu Phe His Gln Lys Gly Thr Val Arg Thr Lys Tyr Gly225 230 235 240Thr Lys Gly Glu Leu Gln Ser Ala Ile Lys Ser Leu His Ser Arg Asp245 250 255Ile Asn Val Tyr Gly Asp Val Val Ile Asn His Lys Gly Gly Ala Asp260 265 270Ala Thr Glu Asp Val Thr Ala Val Glu Val Asp Pro Ala Asp Arg Asn275 280 285Arg Val Ile Ser Gly Glu His Leu Ile Lys Ala Trp Thr His Phe His290 295 300Phe Pro Gly Arg Gly Ser Thr Tyr Ser Asp Phe Lys Trp His Trp Tyr305 310 315 320His Phe Asp Gly Thr Asp Trp Asp Glu Ser Arg Lys Leu Asn Arg Ile325 330 335Tyr Lys Phe Gln Gly Lys Ala Trp Asp Trp Glu Val Ser Asn Glu Asn340 345 350Gly Asn Tyr Asp Tyr Leu Met Tyr Ala Asp Ile Asp Tyr Asp His Pro355 360 365Asp Val Ala Ala Glu Ile Lys Arg Trp Gly Thr Trp Tyr Ala Asn Glu370 375 380Leu Gln Leu Asp Gly Phe Arg Leu Asp Ala Val Lys His Ile Lys Phe385 390 395 400Ser Phe Leu Arg Asp Trp Val Asn His Val Arg Glu Lys Thr Gly Lys405 410 415Glu Met Phe Thr Val Ala Glu Tyr Trp Gln Asn Asp Leu Gly Ala Leu420 425 430Glu Asn Tyr Leu Asn Lys Thr Asn Phe Asn His Ser Val Phe Asp Val435 440 445Pro Leu His Tyr Gln Phe His Ala Ala Ser Thr Gln Gly Gly Gly Tyr450 455 460Aep Met Arg Lys Leu Leu Asn Gly Thr Val Val Ser Lys His Pro Leu465 470 475 480Lys Ala Val Thr Phe Val Asp Asn His Asp Thr Gln Pro Gly Gln Ser485 490 495Leu Glu Ser Thr Val Gln Thr Trp Phe Lys Pro Leu Ala Tyr Ala Phe500 505 510Ile Leu Thr Arg Glu Ser Gly Tyr Pro Gln Val Phe Tyr Gly Asp Met515 520 525Tyr Gly Thr Lys Gly Asp Ser Gln Arg Glu Ile Pro Ala Leu Lys His530 535 540Lys Ile Glu Pro Ile Leu Lys Ala Arg Lys Gln Tyr Ala Tyr Gly Ala545 550 555 560Gln His Asp Tyr Phe Asp His His Asp Ile Val Gly Trp Thr Arg Glu565 570 575Gly Asp Ser Ser Val Ala Asn Ser Gly Leu Ala Ala Leu Ile Thr Asp580 585 590Gly Pro Gly Gly Ala Lys Arg Met Tyr Val Gly Arg Gln Asn Ala Gly595 600 605Glu Thr Trp His Asp Ile Thr Gly Asn Arg Ser Glu Pro Val Val Ile610 615 620Asn Ser Glu Gly Trp Gly Glu Phe His Val Asn Gly Gly Ser Val Ser625 630 635 640Ile Tyr Val Gln Arg Thr Ser His His His His His His645 650(2)SEQ ID NO:33的資料(ⅰ)序列特徵(A)長度29個鹼基對(B)類型核酸(C)鏈型單鏈(D)拓撲結構線性(ⅱ)分子類型其它核酸(ⅸ)特徵(A)名稱/關鍵詞misc-特徵(B)其它信息/desc=「引物18」(ⅹⅰ)序列描述SEQ ID NO:33CATATGGCTA GCGAATTCGC AAATCTTAAT GGGACGCTG 29(2)SEQ ID NO:34的資料(ⅰ)序列特徵(A)長度28個鹼基對(B)類型核酸(C)鏈型單鏈(D)拓撲結構線性(ⅱ)分子類型其它核酸
(ⅸ)特徵(A)名稱/關鍵詞misc-特徵(B)其它信息/desc=「引物19」(ⅹⅰ)序列描述SEQ ID NO:34AAGCTTACTA GTAGGCCTTC TTTGAACATA AATTGAAA 28(2)SEQ ID NO:35的資料(ⅰ)序列特徵(A)長度70個鹼基對(B)類型核酸(C)鏈型單鏈(D)拓撲結構線性(ⅱ)分子類型其它核酸(ⅸ)特徵(A)名稱/關鍵詞misc-特徵(B)其它信息/desc=「引物20」(ⅹⅰ)序列描述SEQ ID NO:35CCATGGGCTA GCCCTGAATT CAGGCCTCCA ACCCCCACTA GTCCGAGCGC TCCCAGCGGCTGCACTGCTG 70(2)SEQ ID NO:36的資料(ⅰ)序列特徵(A)長度32個鹼基對(B)類型核酸(C)鏈型單鏈(D)拓撲結構線性(ⅱ)分子類型其它核酸(ⅸ)特徵
(A)名稱/關鍵詞misc-特徵(B)其它信息/desc=「引物21」(ⅹⅰ)序列描述SEQ ID NO:36AGCCTAAGCT TACAGGCACT GATGGTACCA GT 32(2)SEQ ID NO:37的資料(ⅰ)序列特徵(A)長度12個胺基酸(B)類型胺基酸(D)拓撲結構線性(ⅱ)分子類型蛋白質(ⅸ)特徵(A)名稱/關鍵詞misc-特徵(B)其它信息/desc=「接頭」(ⅹⅰ)序列描述SEQ ID NO:37Arg Pro Pro Thr Pro Thr Ser Pro Ser Ala Pro Ser1 5 10
權利要求
1.一種用於液化澱粉的方法,其中將澱粉底物在含水介質中用經修飾的酶(酶雜合體)進行處理,該經修飾的酶包含連接了含有糖類結合結構域(CBD)的胺基酸序列的α-澱粉酶胺基酸序列。
2.根據權利要求1所述的液化澱粉的方法,其中還包含脫支酶。
3.根據權利要求2所述的方法,其中脫支酶是連接了含有糖類結合結構域(CBD)的胺基酸序列的經修飾的脫支酶(酶雜合體)。
4.用於對已經進行了液化加工的澱粉進行糖化的方法,其中將液化之後的反應混合物用經修飾的酶(酶雜合體)處理,所述經修飾的酶包含連接了含有糖類結合結構域(CBD)的胺基酸序列上的脫支酶胺基酸序列。
5.根據權利要求2,3或4所述的方法,其中所述脫支酶是異澱粉酶或支鏈澱粉酶。
6.用於對已經進行了液化加工的澱粉進行糖化的方法,其中將液化之後的反應混合物用一種經修飾的酶(酶雜合體)處理,所述經修飾的酶包含連接了含有糖類結合結構域(CBD)的胺基酸序列的葡糖澱粉酶胺基酸序列。
7.根據前面任一項權利要求所述的方法,其中所述CBD是來自於纖維素酶、木聚糖酶、甘露聚糖酶、阿拉伯呋喃糖苷酶、乙醯酯酶、幾丁質酶、葡糖澱粉酶或CGT酶的CBD。
8.包含連接了含有糖類結合結構域(CBD)的胺基酸序列的α-澱粉酶胺基酸序列的經修飾酶(酶雜合體)在液化澱粉中的用途。
9.包含連接了含有糖類結合結構域(CBD)的胺基酸序列的脫支酶胺基酸序列的經修飾酶(酶雜合體)在已經進行了液化加工的澱粉的糖化加工中的用途。
10.包含連接了含有糖類結合結構域(CBD)的胺基酸序列的葡糖澱粉酶胺基酸序列的經修飾酶(酶雜合體)在已經進行了液化加工的澱粉的糖化加工中的用途。
11.編碼具有澱粉分解活性的雜合體酶的分離的DNA序列,其中包含(a)編碼澱粉分解活性的DNA序列;(b)編碼CBD的DNA序列;和(c)編碼SEQ ID NO:21所示接頭序列的DNA序列或其片段。
12.根據權利要求11所述的分離的DNA序列,其中澱粉分解活性是α-澱粉酶活性,尤其是芽孢桿菌α-澱粉酶,特別是Termamyl
或其變體的活性。
13.根據權利要求11或12所述的分離的DNA序列,其中所述CBD是Bacillus agaradherens NCIMB No.40482鹼性纖維素酶Cel5A的CBD。
14.根據權利要求13所述的分離的DNA序列,其編碼SEQ ID NO:19所示的由質粒pMB492編碼的Termamyl
-接頭-Cel5A-CBD。
15.根據權利要求11或12所述的分離的DNA序列,其中所述CBD是糞堆梭菌(NCIMB 11754)XynA的CBD二聚體。
16.一種DNA構建體,其中包含可操作地連接了一個或多個控制序列的權利要求11-15中任一項所述的DNA序列,所述控制序列能夠指導該DNA序列在合適的表達宿主中進行表達。
17.根據權利要求16所述的DNA構建體,其中包含編碼選自下述組的啟動子的核苷酸序列嗜熱脂肪芽孢桿菌麥芽原澱粉酶基因的啟動子,地衣芽孢桿菌α澱粉酶基因的啟動子,解澱粉芽孢桿菌BAN
澱粉酶基因的啟動子,枯草芽孢桿菌鹼性蛋白酶基因的啟動子,或短小芽孢桿菌纖維素酶或木糖苷酶基因的啟動子。
18.一種重組表達載體,其中包含權利要求16或17所述的DNA構建體,啟動子及轉錄和翻譯終止信號。
19.包含權利要求16或17所述的DNA構建體的宿主細胞。
20.根據權利要求19所述的細胞,其中細胞是來自於下述組的菌株的一種芽孢桿菌細胞枯草芽孢桿菌菌株,地衣芽孢桿菌,遲緩芽孢桿菌,短芽孢桿菌,嗜熱脂肪芽孢桿菌,嗜鹼芽孢桿菌,解澱粉芽孢桿菌,凝結芽孢桿菌,環狀芽孢桿菌,燦爛芽孢桿菌,巨大芽孢桿菌,短小芽孢桿菌,蘇雲金芽孢桿菌或B.agaradherens。
21.一種生產CBD/雜合體酶的方法,包括在允許該酶產生的條件下培養權利要求19或20所述的細胞,以及從培養物中回收該酶。
22.由權利要求11-15中任一項所述的DNA序列編碼的分離的和純化的CBD/酶雜合體。
23.根據權利要求22所述的CBD/酶雜合體,它是SEQ ID NO:20所示的雜合體酶。
全文摘要
本發明涉及一種澱粉轉化方法,其中將澱粉底物在含水介質中用CBD/酶雜合體進行處理。此外,本發明也涉及編碼穩定的CBD/酶雜合體的分離的DNA序列,包含本發明所述DNA序列的DNA構建體,包含本發明的DNA序列的表達載體,以及CBD/酶雜合體。
文檔編號C12N15/56GK1233286SQ97198640
公開日1999年10月27日 申請日期1997年10月13日 優先權日1996年10月11日
發明者M·比喬恩瓦德, S·佩德森, M·舒雷恩, H·比斯加德-弗蘭岑 申請人:諾沃挪第克公司

同类文章

一種新型多功能組合攝影箱的製作方法

一種新型多功能組合攝影箱的製作方法【專利摘要】本實用新型公開了一種新型多功能組合攝影箱,包括敞開式箱體和前攝影蓋,在箱體頂部設有移動式光源盒,在箱體底部設有LED脫影板,LED脫影板放置在底板上;移動式光源盒包括上蓋,上蓋內設有光源,上蓋部設有磨沙透光片,磨沙透光片將光源封閉在上蓋內;所述LED脫影

壓縮模式圖樣重疊檢測方法與裝置與流程

本發明涉及通信領域,特別涉及一種壓縮模式圖樣重疊檢測方法與裝置。背景技術:在寬帶碼分多址(WCDMA,WidebandCodeDivisionMultipleAccess)系統頻分復用(FDD,FrequencyDivisionDuplex)模式下,為了進行異頻硬切換、FDD到時分復用(TDD,Ti

個性化檯曆的製作方法

專利名稱::個性化檯曆的製作方法技術領域::本實用新型涉及一種檯曆,尤其涉及一種既顯示月曆、又能插入照片的個性化檯曆,屬於生活文化藝術用品領域。背景技術::公知的立式檯曆每頁皆由月曆和畫面兩部分構成,這兩部分都是事先印刷好,固定而不能更換的。畫面或為風景,或為模特、明星。功能單一局限性較大。特別是畫

一種實現縮放的視頻解碼方法

專利名稱:一種實現縮放的視頻解碼方法技術領域:本發明涉及視頻信號處理領域,特別是一種實現縮放的視頻解碼方法。背景技術: Mpeg標準是由運動圖像專家組(Moving Picture Expert Group,MPEG)開發的用於視頻和音頻壓縮的一系列演進的標準。按照Mpeg標準,視頻圖像壓縮編碼後包

基於加熱模壓的纖維增強PBT複合材料成型工藝的製作方法

本發明涉及一種基於加熱模壓的纖維增強pbt複合材料成型工藝。背景技術:熱塑性複合材料與傳統熱固性複合材料相比其具有較好的韌性和抗衝擊性能,此外其還具有可回收利用等優點。熱塑性塑料在液態時流動能力差,使得其與纖維結合浸潤困難。環狀對苯二甲酸丁二醇酯(cbt)是一種環狀預聚物,該材料力學性能差不適合做纖

一種pe滾塑儲槽的製作方法

專利名稱:一種pe滾塑儲槽的製作方法技術領域:一種PE滾塑儲槽一、 技術領域 本實用新型涉及一種PE滾塑儲槽,主要用於化工、染料、醫藥、農藥、冶金、稀土、機械、電子、電力、環保、紡織、釀造、釀造、食品、給水、排水等行業儲存液體使用。二、 背景技術 目前,化工液體耐腐蝕貯運設備,普遍使用傳統的玻璃鋼容

釘的製作方法

專利名稱:釘的製作方法技術領域:本實用新型涉及一種釘,尤其涉及一種可提供方便拔除的鐵(鋼)釘。背景技術:考慮到廢木材回收後再加工利用作業的方便性與安全性,根據環保規定,廢木材的回收是必須將釘於廢木材上的鐵(鋼)釘拔除。如圖1、圖2所示,目前用以釘入木材的鐵(鋼)釘10主要是在一釘體11的一端形成一尖

直流氧噴裝置的製作方法

專利名稱:直流氧噴裝置的製作方法技術領域:本實用新型涉及ー種醫療器械,具體地說是ー種直流氧噴裝置。背景技術:臨床上的放療過程極易造成患者的局部皮膚損傷和炎症,被稱為「放射性皮炎」。目前對於放射性皮炎的主要治療措施是塗抹藥膏,而放射性皮炎患者多伴有局部疼痛,對於止痛,多是通過ロ服或靜脈注射進行止痛治療

新型熱網閥門操作手輪的製作方法

專利名稱:新型熱網閥門操作手輪的製作方法技術領域:新型熱網閥門操作手輪技術領域:本實用新型涉及一種新型熱網閥門操作手輪,屬於機械領域。背景技術::閥門作為流體控制裝置應用廣泛,手輪傳動的閥門使用比例佔90%以上。國家標準中提及手輪所起作用為傳動功能,不作為閥門的運輸、起吊裝置,不承受軸向力。現有閥門

用來自動讀取管狀容器所載識別碼的裝置的製作方法

專利名稱:用來自動讀取管狀容器所載識別碼的裝置的製作方法背景技術:1-本發明所屬領域本發明涉及一種用來自動讀取管狀容器所載識別碼的裝置,其中的管狀容器被放在循環於配送鏈上的文檔匣或託架裝置中。本發明特別適用於,然而並非僅僅專用於,對引入自動分析系統的血液樣本試管之類的自動識別。本發明還涉及專為實現讀