新四季網

具有降解碳水化合物材料的活性或幫助降解碳水化合物材料的活性的多肽及其用途的製作方法

2023-07-28 15:44:36 2

專利名稱:具有降解碳水化合物材料的活性或幫助降解碳水化合物材料的活性的多肽及其用途的製作方法
技術領域:
本發明涉及包含下述基因的序列,所述基因編碼具有降解碳水化合物材料活性的多肽的序列或輔助降解碳水化合物材料活性的多肽的序列。本發明涉及該新穎基因的全長編碼序列以及該全長功能性蛋白的胺基酸序列,以及所述基因或胺基酸序列的變體和片段。本發明還涉及在工業方法中使用這些蛋白的方法。本發明還包括用根據本發明的多核苷酸轉化的適用於生產這些蛋白質的細胞。本發明還涉及編碼下述多肽的基因在宿主中的成功表達,所述多肽具有降解碳水化合物材料的活性。宿主可以是任何合適的宿主,例如Aspergillus (例如 Aspergillus niger)或 Talaromyces (例如 Talaromyces emersonii)。
背景技術:
碳水化合物組成地球上最豐量的有機化合物。然而,許多這類碳水化合物隱蔽在複雜聚合物中,包括澱粉(種子和穀物中的主要儲存碳水化合物)和被稱為木質纖維素的碳水化合物與木質素的集合體。木質纖維素的主要碳水化合物組分是纖維素、半纖維素和果膠。這些複雜的聚合物通常被統稱為木質纖維素。從由於OPEC減少石油輸出而導致石油危機爆發的70年代開始,可再生的木質纖維素生物質轉化為可發酵的糖的生物轉化吸引了研究人員強烈的注意力,所述可發酵的糖隨後被發酵產生醇(例如乙醇),作為液體燃料的替代品。在過去二十年間,乙醇已被廣泛使用,在美國作為與汽油的10%的摻合物,或在巴西作為車輛的純燃料。最近實現了E85(85%乙醇摻合物)的使用,特別是用於清潔城市應用。燃料生物乙醇的重要性將會隨著油價的提高及其來源的逐漸耗盡而提高。另外,可發酵的糖被用於生產塑料、聚合物和其他基於生物的製品,並且預期這一工業將大幅增長,從而提高了對大量的低成本可發酵糖的需求,所述可發酵糖可以被用作原料來代替基於石油的原料。大量碳水化合物在植物生物質中的隱蔽以糖(五碳糖以及六碳糖)的形式提供了大量潛在的能量來源,所述糖能夠被用於大量工業和農業過程。然而,這些碳水化合物的巨大能源潛力目前利用不足,因為糖封閉在複雜聚合物中並因此不容易進行發酵。由植物生物質生產糖的方法會提供大量的、經濟上有競爭性的原料,用於發酵成化學品、塑料,例如琥珀酸和(生物)燃料,包括乙醇、甲醇、丁醇合成液體燃料和沼氣。與纖維素原料的種類無關,酶的成本和水解效率是限制生物質生物轉化方法商業化的主要因素。由微生物生產的酶的生產成本與產酶菌株的生產力和發酵液中最終的活性產率密切相關。儘管過去幾十年為了理解酶促木質纖維素生物質降解和纖維素酶生產而進行了持續的研究,但是仍然期望發現或者改造新的有高度活性的纖維素酶和半纖維素酶。還高度期望構建能夠進行迅速和高效的木質纖維素材料生物降解的高效酶組合物,尤其是具有提高的熱穩定性的此類纖維素酶和半纖維素酶。此類酶可被用於生產糖,用於發酵成化學品,塑料,例如琥珀酸和(生物)燃料,包括乙醇、甲醇、丁醇、合成液體燃料和沼氣,用於青貯,還在其他工業方法中(例如在食品或飼料、紡織品、製漿或造紙或洗滌劑工業和其他工業中)用作酶。

發明內容
本發明提供了編碼能夠降解(即幫助降解)碳水化合物(例如多糖)、特別是木質纖維素的多肽的多核苷酸。本發明的多核苷酸典型地編碼具有降解碳水化合物的活性或幫助降解碳水化合物的活性的多肽。本發明還提供了具有此類活性的天然和重組生產的多肽,以及生產此類酶的重組細胞系。還提供了製造和使用本發明多核苷酸和多肽的方法。根據本發明,提供了包含SEQ ID NO :2中示出的胺基酸序列或SEQID NO :1的核·苷酸序列編碼的胺基酸序列,或其變體多肽或變體多核苷酸,其中所述變體多肽與SEQ IDNO 2中示出的序列具有至少76%的序列同一性,或所述變體多核苷酸編碼與SEQ ID NO 2中示出的序列具有至少76%序列同一性的多肽。根據本發明的多肽具有良好的特性,尤其是具有降解碳水化合物材料的活性或幫助降解碳水化合物材料的活性的特性。在一種實施方式中,根據本發明的多肽具有氧化水解酶(oxidohydrolase)活性。在一種實施方式中,多肽具有GH61活性。在一種實施方中,變體多肽具有殘基His27(如在SEQ ID N0:2中的位置)。在本文中,假設His27在金屬離子(Ni2+和Mg2+)以及可能地其他陽離子的結合中發揮作用。在一種實施方式中,變體多肽與在SEQ IDNO 2中列出的序列具有至少76%序列同一性、具有催化殘基His27和氧化水解酶和/或GH61活性。另外,多肽具有高的熱穩定性。根據本發明的多肽以孵育時間(h)的函數保持高的相對活性(初始活性的% ),例如2小時、3小時、4小時、5小時、6小時、8小時、9小時、10小時或更多、20小時或更多、30小時或更多,尤其是在高溫下,例如在60°C或更高溫度下、在65°C或更高溫度下、在70°C或更高溫度下,例如在65°C下8小時或在60°C下72小時。本發明還提供了包含以下的多核苷酸(a) SEQ ID NO 1中示出的核苷酸序列;或(b)與是SEQ ID NO 1的反向互補體對多核苷酸選擇性雜交的核苷酸序列;或(c)與SEQ ID NO 1的核苷酸序列具有至少約80%序列同一性的核苷酸序列;或(d)如(a)、(b)或(C)中定義的核苷酸序列的片段,其長度至少約100個核苷酸;或(e)序列,其是作為遺傳編碼的結果的(a)、(b)、(c)或(d)任一中定義的序列簡併體;或(f)核苷酸序列,其為(a)、(b)、(c)、(d)或(e)中定義的核苷酸序列的反向互補體。根據本發明還提供了併入了本發明多核苷酸序列的載體(例如表達載體)和包含本發明多肽、多核苷酸或載體的細胞。
本發明還提供了 用於製備具有降解碳水化合物的活性或幫助降解碳水化合物的活性的多肽的方法,所述方法包括在允許所述多肽表達的條件下培養本發明的細胞,並任選地回收所表達的多肽;可通過此類方法獲得的多肽;和 組合物,其包含(i)本發明的多肽;和(ii)纖維素酶和/或半纖維素酶和/或果膠酶。具有降解碳水化合物的活性或幫助降解碳水化合物的活性的本發明多肽可被用於工業方法中。因此,本發明提供了用於處理包含碳水化合物材料的底物的方法,所述方法包括使底物與本發明的多肽或組合物接觸。本發明尤其提供了用於從木質纖維素材料生產一種或多種糖的方法,所述方法包括使木質纖維素材料與本發明的多肽或組合物接觸。通過這種方式生產的糖可在發酵方法中使用。因此,本發明提供了用於生產發酵產物的方法,所述方法包括使用上述方法生產可發酵的糖;對得到的可發酵的糖進行發酵,從而生產發酵產物。本發明的多肽或組合物也可以在例如食物製品的製備、洗滌劑的製備、動物飼料的製備、漿體的處理或造紙或織物或紡織品的製備或其清潔中使用。本發明還提供了 可通過使植物材料或木質纖維素材料與本發明的多肽或組合物接觸獲得的經加工的材料;包含本發明的多肽或組合物的食物或飼料;和包含根據本發明的多核苷酸、多肽、載體或細胞的植物或其部分。附圖
簡述圖I :用於在A.niger中表達基因的pGBTOP的圖譜。描繪了從葡糖澱粉酶啟動子(PglaA)開始表達的感興趣的基因(GOI)。另外,描繪了表達盒的葡糖澱粉酶側翼(3』 glaA)。在本申請中,感興趣的基因是TEMER07589的編碼序列,如下文所定義。圖2 :通過含有1BG、ICBHI、ICBHII和IEG或具有降解碳水化合物的活性或幫助降解碳水化合物的活性的4酶混合物= Ch:A;
— ■f = CEB;——■-- = TEMER07589)或通過典型的纖維素酶產物
(―—▲ ---= Hhrnsc把NI ) 用相對於每克預處理的小麥稻乾物質15mg蛋白(作
為BSA當量)孵育,從2%乾物質預處理小麥秸中的葡萄糖隨時間的釋放量(以mmol/L表示)的圖。序列表簡述SEQ ID NO 1 展示了 TEMER07589 的編碼序列;SEQ ID NO 2 展示了 TEMER07589 的胺基酸序列;SEQ ID NO 3 展示了 TEMER07589 的信號序列;發明詳述在本說明書和所附權利要求書的通篇中,詞語「包含」("comprise")和「包括,,(" include")及其不同詞性的變體(如"comprises" , " comprising" ," includeS"和"including")應被解釋為開放性的。也就是說,在上下文允許時,這些詞語旨在表達可能包括未明確指出的其他要素或成分。冠詞「一」(「a」和「an」)在本文中被用於表示一個或多於一個(即一個或至少一個)所述冠詞的語法客體。例如,「一要素」可表示一個要素或多於一個要素。本發明提供了編碼多肽的多核苷酸,所述多肽例如是能夠改性(例如降解)碳水化合物材料的酶。碳水化合物材料是包含一種或多種碳水化合物或由其組成或基本由其組成的材料。酶在本文中是多肽的亞類。在本文中,底物(也稱作原料)被用於表示包含碳水化合物材料的物質,其可用根據本發明的酶處理,使得其中的碳水化合物材料被改性。除了碳水化合物材料以外,底物還 可含有任何其他組分,包括但不限於非碳水化合物材料和澱粉。本發明提供了編碼多肽的多核苷酸,所述多肽例如是能夠改性(例如降解)碳水化合物材料的酶。碳水化合物材料是包含一種或多種碳水化合物或由其組成或基本由其組成的材料。酶在本文中是多肽的亞類。典型地,本發明的多核苷酸編碼具有至少降解碳水化合物的活性或幫助降解碳水化合物的活性、暫時稱作TEMER07589、具有根據SEQ ID NO :2的胺基酸序列的多肽,或編碼其變體的序列,或編碼所述多肽或其變體的片段的序列,所述變體典型地為具有SEQ IDNO 2的序列的多肽的功能性等同物。 「具有降解碳水化合物的活性或幫助降解碳水化合物的活性」在本文中被定義為,多肽具有降解糖水化合物的活性或多肽幫助降解碳水化合物或上述二者。在一種實施方式中,多肽增強至少一種纖維素酶的活性。在所述實施方式中,當本發明的多肽在具有一種或多種纖維素酶的混合物中,例如在具有纖維二糖水解酶(CBH)和3 -葡糖苷酶(BG)的混合物中存在時,其會增強這些纖維素酶的活性,這會導致降解纖維素的混合物的活性更高。認為TEMER07589屬於酶的GH61家族。基於在一個家族成員(內切葡聚糖酶(EC 3. 2. I. 4))中的非常弱的內切-l,4-b-D-葡聚糖酶的測量,該家族中的酶最初被歸類為糖苷水解酶家族。當然這些酶的結構和作用模式不是典型的並且它們不能被認作真正的糖苷酶。但是,當與纖維素酶或纖維素酶的混合物連起來使用時,基於其增強木質纖維素分解的能力,它們被保留在 CAZy 種類中。Harris,PV et al,Biochemistry 2010,49,3305-3316 的圖 5中給出了 GH61家族的已知成員的綜述。在一種實施方式中,除了增強纖維素酶的活性,根據本發明的增強纖維素酶的蛋白具有內切葡聚糖酶(EC)活性。在該實施方式中,可避免將內切葡聚糖酶(除根據本發明的增強纖維素酶的蛋白之外)添加至纖維素酶混合物,所述添加對有效降解纖維素而言通常是必要的。本文中,內切-@ -1,4-葡聚糖酶(EC 3. 2. I. 4)是能夠催化纖維素、地衣澱粉或穀類3-D-葡聚糖中1,4-0-D-葡糖苷鍵內切水解的任何多肽。此類多肽也可以能夠水解還含有1,3_鍵的P-D-葡聚糖中的1,4_鍵。所述酶也可以被稱作纖維素酶、微晶纖維素酶、^ -1,4-內切葡聚糖水解酶、^ -1,4-葡聚糖酶、羧甲基纖維素酶、纖維糊精酶、內切-1,4- ^ -D-葡聚糖酶、內切-I,4- P -D-葡聚糖水解酶、內切-I,4- P -葡聚糖酶或內切葡聚糖酶在一種實施方式中,本發明的多肽可具有一種或多種除上述提到的纖維素酶增強活性和內切葡聚糖酶活性之外的替代性和/或額外的活性,例如本文中提到的其他降解碳水化合物和/或水解碳水化合物活性之一。碳水化合物在本文上下文中包括所有糖類,例如多糖、寡糖、二糖或單糖。根據本發明的多肽可通過化學降解或物理降解此類材料或水解碳水化合物來改性和/或降解碳水化合物材料。物理降解包括例如打斷纖維素微纖維之間的相互作用和/或打開纖維素纖維結構。碳水化合物材料的化學改性可例如通過水解、氧化或其他化學改性,例如通過裂合酶的作用導致此類材料的降解。物理改性可伴隨或不伴隨化學改性。合適的碳水化合物材料適合被本發明的多肽改性的非澱粉碳水化合物是木質纖維素。可以被認為是潛在的可再生原料的、包含不同木質纖維素殘基的主要的多糖是纖維素(葡聚糖)、半纖維素 (木聚糖、雜木聚糖(heteroxylans)和木葡聚糖(xyloglucans))。另外,一些半纖維素可以作為葡甘露聚糖(glucomannans)存在於例如木材衍生的原料中。這些多糖變成為可溶糖(例如葡萄糖、木糖、阿拉伯糖、半乳糖、果糖、甘露糖、鼠李糖、核糖、D-半乳糖醛酸和其他己糖和戊糖)的酶促水解發生於共同作用的不同酶的作用下。另外,果膠和其他果膠物質如阿拉伯聚糖(arabinans)可佔來自非木本植物組織典型的細胞壁乾物質的可觀的比例(約四分之一到一半的乾物質可以是果膠)。纖維素是由通過¢-1,4鍵連接的葡萄糖殘基組成的線性多糖。纖維素纖維的線性本質以及化學計量的¢-連接的葡萄糖(相對於a)比澱粉的高度枝化的a-連接的結構更傾向於產生鏈間(interstrand)氫鍵合的結構。因此,纖維素聚合物與澱粉中存在的纖維相比通常溶解度更小,並且形成更緊密結合的纖維。半纖維素是複合聚合物,並且其組成常常在生物之間、組織類型之間大幅變化。通常,半纖維素的主要成分是¢-1,4-連接的木糖(一種五碳糖)。然而,所述木糖通常在木糖的0-3和/或0-2處被枝化,並且可以被與阿拉伯糖、半乳糖、甘露糖、葡糖醛酸、半乳糖醛酸形成的鍵取代,或者被對乙酸的酯化(和阿魏酸對阿拉伯糖的酯化)取代。半纖維素也可含有葡聚糖,所述葡聚糖是¢-連接的六碳糖(如先前提到的¢-(1,3)(1,4)葡聚糖和雜葡聚糖)和額外的葡甘露聚糖(其中葡萄糖和甘露糖均存在於線性主鏈中,彼此通過
鍵連接)的總稱。與單子葉植物(monocots,即具有單個子葉或種子葉的植物,如玉米、小麥、水稻、草、大麥)相比,雙子葉植物(dicot,即其種子具有兩片子葉或種子葉的植物,如利馬豆(lima beans)、花生、杏仁、豌豆、四季豆)中半纖維素的組成、取代性質和枝化程度差異很大。在雙子葉植物中,半纖維素主要由下述木葡聚糖組成,所述木葡聚糖是具有I,6- P -連接的木糖基側鏈的1,4-0_連接的葡萄糖鏈。在單子葉植物(包括大部分穀類作物)中,半纖維素的主要組分是雜木聚糖。這些主要由下述1,4-0_連接的木糖主鏈聚合物組成,所述木糖主鏈聚合物與阿拉伯糖、半乳糖、甘露糖和葡糖醛酸或4-0-甲基-葡糖醛酸具有l,3_a連接以及與由酯連接的乙酸改性的木糖具有I,3-a連接。還存在由1,3_和1,4-3-連接的葡糖基鏈組成的P葡聚糖。在單子葉植物中,纖維素、雜木聚糖和¢-葡聚糖可以大致等量地存在,各自包含約15-25%的細胞壁乾物質。另外,不同的植物可包含不同量和不同組成的果膠物質。例如,甜菜含有以乾重為基礎約19%的果膠和約21%的阿拉伯聚糖。
因此,本發明的組合物可根據要使用的具體原料(也稱作底物)來定製。也就是說,本發明組合物中的活性譜可根據考慮的原料來變化。酶組合或物理處理可以並發或先後地施用。酶可以在微生物、酵母、真菌、細菌或植物中外源產生,然後分離並加入木質纖維素原料中。或者,酶可以被生產但不分離,並且將粗製細胞群發酵液或植物材料(如玉米杆)等等加入原料中。或者,可以處理粗製細胞群或酶生產培養基或植物材料,以預防進一步的微生物生長(例如通過加熱或添加抗微生物劑),然後添加至原料。這些粗製酶混合物可包含生產酶的生物。或者,酶可以在下述發酵中生產,所述發酵施用原料(例如玉米杆)對生產酶的生物提供營養。通過這種方式,生產酶的植物可以發揮木質纖維素原料的作用,並且被添加進木質纖維素原料中。酶活性內切-1,4- P -葡聚糖酶(EG)和外切-纖維二糖水解酶(CBH)催化不溶性纖維素水解成為纖維寡糖(纖維二糖作為主要產物),而¢-葡糖苷酶(BGL)將寡糖(主要是纖維二糖和纖維三糖)轉化為葡萄糖。
·
木聚糖酶與其他附屬酶例如a-L-阿拉伯呋喃糖酶、阿魏酸酯酶和乙醯木聚糖酯酶、葡糖醛酸糖苷酶和3 -木糖苷酶一起,催化半纖維素的部分水解。果膠物質包括果膠、阿拉伯聚糖、半乳聚糖和阿拉伯半乳聚糖。果膠是植物細胞壁中最複雜的多糖。它們沿著一定程度上散布有L-鼠李糖的a (1,4)_連接的D-半乳糖醛酸單元核心鏈周圍構建。在任何細胞壁中都存在符合該描述的大量結構單元,並且通常認為在單個果膠分子中,不同結構單元的核心鏈彼此連續。果膠酶包括例如內切多聚半乳糖醛酸酶,果膠甲基酯酶,內切-半乳聚糖酶,^ -半乳糖苷酶,果膠乙醯基酯酶,內切-果膠裂合酶,果膠酸裂合酶,a -鼠李糖苷酶,外切-半乳糖醛酸酶,外切多聚半乳糖醛酸酯裂合酶,鼠李半乳糖醛酸聚糖水解酶,鼠李半乳糖醛酸聚糖裂合酶,鼠李半乳糖醛酸聚糖乙醯基酯酶,鼠李半乳糖醛酸聚糖半乳糖醛酸水解酶,木半乳糖醛酸酶,a-阿拉伯呋喃糖苷酶。結構單元的主要類型是聚半乳糖醛酸(同聚半乳糖醛酸),其可被甲醇在羧基上取代,被乙酸酯在0-2和0-3上取代;鼠李半乳糖醛酸聚糖I (RGI),其中半乳糖醛酸單元與帶有(1,4)_連接的半乳聚糖和(1,5)_連接的阿拉伯聚糖側鏈的鼠李糖交替存在。阿拉伯聚糖側鏈可直接與鼠李糖結合,或者通過半乳聚糖鏈間接結合;木半乳糖醛酸聚糖,在半乳糖醛酸的0-3上具有單個木糖基單元(與RGI緊密結合);和鼠李半乳糖醛酸聚糖
II(RGII),含有罕見糖例如芹菜糖的特別複雜的小型單元。RGII單元可含有兩個芹菜糖殘基,所述芹菜糖殘基在合適的離子條件下能夠與硼酸鹽可逆地形成酯。如上文所述,本發明的多肽典型地具有纖維素酶增強活性。然而,除了所述活性之外或替代所述活性,本發明的多肽可具有一種或多種上文公開的活性。除了具有纖維素酶增強活性的本發明多肽所提供的活性以外,本文所述的本發明的組合物還可具有一種或多種上文所述的活性。多核苷酸序列本發明提供了包含編碼TEMER07589的基因的基因組多核苷酸序列及其編碼序列。因此,本發明涉及包含根據SEQ ID NO :1的編碼核苷酸序列的基因組核苷酸序列的經分離的多核苷酸,及其任一的變體,例如功能性等同物。
本發明尤其涉及下述經分離的多核苷酸,所述多核苷酸能夠(例如在嚴格條件下、優選地在高度嚴格條件下)選擇性地與包含SEQ ID NO :1中示出的序列的多核苷酸的反向互補體雜交。更特定地,本發明涉及包含根據SEQ ID NO 1的核苷酸序列或基本由其組成的多核苷酸。本發明還涉及包含下述序列或基本由其組成的經分離的多核苷酸或其任一的變體(例如功能性等同物)或片段,所述序列編碼根據SEQ ID NO :2的多肽或其變體的至少一個功能性結構域。在本文中使用時,術語「基因」和「重組基因」是指可從染色體DNA中分離的核酸分子,其包含編碼蛋白質(例如根據本發明的纖維素酶增強蛋白)的開放讀碼框。 基因可包括編碼序列、非編碼序列、內含子和/或調節序列。另外,術語「基因」可表示如本文定義的經分離的核酸分子。可使用本文提供的序列信息和標準分子生物學技術,分離本發明的核酸分子,例如具有SEQ ID NO :1的核苷酸序列的核酸分子或其變體(例如功能等同物)。例如,使用SEQ ID NO :1的全部或部分核酸序列作為雜交探針,可以使用標準雜交和克隆技術分離根據本發明的核酸分子(例如,如Sambrook, J. , Fritsh, E. F. , and Maniatis,T. Molecular Cloning ALaboratory Manual. 2nd, ed. , Cold Spring Harbor Laboratory,Cold SpringHarbor Laboratory Press, Cold Spring Harbor, NY, 1989 中所述)。另外,可使用以SEQ ID NO : I中含有的序列信息為基礎設計的合成寡核苷酸引物,通過聚合酶鏈式反應(PCR)分離包含SEQ ID NO :1全部或部分的核酸分子。可以使用cDNA、mRNA或者基因組DNA作為模板和適當的寡核苷酸引物,根據標準PCR擴增技術擴增本發明的核酸。可以將藉此擴增的核酸克隆進適當的載體中,並通過DNA序列分析來表徵。另外,可以通過標準合成技術,例如使用自動化DNA合成儀,製備對應於本發明核苷酸序列或可與本發明核苷酸序列雜交的寡核苷酸。在一個優選的實施方式中,本發明的經分離的核酸分子包含SEQ IDNO :1中所示的核苷酸序列。在另一個優選的實施方式中,本發明的經分離的核酸分子包含下述核酸分子,所述核酸分子是SEQ ID NO :1中所示核苷酸序列的反向互補體,或此類核苷酸序列任一的變體,例如功能性等同物。與另一核苷酸序列互補的核酸分子是與另一核苷酸序列充分互補、使得其能夠與另一核苷酸序列雜交從而形成穩定雙鏈體的核酸分子。本發明的一個方面涉及編碼本發明多肽或其變體(例如功能性等同物,例如生物活性片段或結構域)的經分離的核酸分子,以及足以用作鑑定編碼本發明多肽的核酸分子的雜交探針的核酸分子,和適合用作用於擴增或突變核酸分子的PCR引物的、此類核酸分子的片段。根據本發明的多核苷酸可以是「經分離的」。在本發明上下文中,「經分離的多核苷酸」或「經分離的核酸」是下述DNA或RNA,所述DNA或RNA與其來源生物天然存在的基因組中與之緊鄰的一條或兩條編碼序列(一條在5』端,一條在3』端)不再緊鄰。因此,在一個實施方式中,經分離的核酸包括與編碼序列緊鄰的部分或所有5』非編碼(例如啟動子)區。該術語因此包括例如被整合進載體中、自助複製的質粒或病毒中、或原核生物或真核生物的基因組DNA中的,或者作為獨立於其他序列的單獨的分子(例如通過PCR或限制性內切核酸酶處理生產的cDNA或基因組DNA片段)存在的重組DNA。其還包括基本不含細胞材料、病毒材料、或培養基(通過重組DNA技術生產時)或化學前體或其他化學品(化學合成時)的重組DNA,所述重組DNA是編碼其他多肽的雜種基因的部分。另外,「經分離的核酸片段」是不作為片段天然存在並且在天然狀態下不會被找到的核酸片段。在本文中使用時,術語「多核苷酸」或「核酸分子」旨在包括DNA分子(例如cDNA或基因組DNA)和RNA分子(例如mRNA)和使用核苷酸類似物生產的DNA或RNA的類似物。核酸分子可以是單鏈或雙鏈的,但是優選地是雙鏈DNA。可以使用寡核苷酸類似物或衍生物(例如肌苷或硫代磷酸核苷酸(phosphorothioate nucleotides))合成核酸。此類寡核苷酸可被用於例如製備具有改變的鹼基配對能力或提高的核酸酶抗性的核酸。
本發明的另一實施方式提供了與TEMER07589核酸分子反義的經分離的核酸分子,例如TEMER07589核酸分子的編碼鏈。還包括在本發明範圍內的是本文所述核酸分子的互補鏈。除非另有說明,本文通過測序DNA分子所測定的所有核苷酸序列均使用自動化DNA測序儀測定,本文測定的DNA分子編碼的多肽的所有胺基酸序列均通過上文測定的DNA序列的翻譯來預測。因此,如本領域針對通過所述自動化途徑測定的任何DNA序列所已知的,本文測定的任何核苷酸序列可含有一些錯誤。通過自動化測定的核苷酸序列典型地與被測序的DNA分子的實際核苷酸序列至少約90%相同,更典型地至少約95%到至少約99. 9%相同。可以通過其他途徑(包括本領域公知的手動DNA測序法)來更加精確地測定實際序列。也如本領域所已知的,與實際序列相比被測定的核苷酸序列中的單個插入或缺失會在核苷酸序列的翻譯中引起移碼,使得預測的由所測定的核苷酸序列編碼的胺基酸序列從此類插入或缺失點處開始,與被測定的DNA分子實際編碼的胺基酸序列完全不同。本領域技術人員能夠鑑定此類被錯誤鑑定的鹼基,並且已知如何校正此類錯誤。根據本發明的核酸分子可僅包含SEQ ID NO 1中所示核酸序列(或其任一的變體)的部分或片段,例如可用作探針或引物的片段,或編碼TEMER07589多肽的一部分的片段。通過克隆TEMER07589基因和cDNA測定的核苷酸序列允許生產被設計用於鑑定和/或克隆其他TEMER07589家族成員以及來自其他物種的TEMER07589同源物的探針和引物。探針/引物典型地包含基本純化的寡核苷酸,所述寡核苷酸典型地包含下述核苷酸序列區域,所述區域優選地在高度嚴格條件下與SEQ ID NO: I所示核苷酸序列或其任一的變體(例如功能性等同物)的至少從約12個到約15個、優選地從約18個到約20個、優選地從約22個到約25個、更優選地約30個、約35個、約40個、約45個、約50個、約55個、約60個、約65個、或曰75個或更多個連續的核苷酸雜交。基於TEMER07589核苷酸序列的探針可被用於檢測例如其他生物中編碼相同或同源多肽的轉錄本或基因組TEMER07589序列。在優選的實施方式中,探針還包含與之結合的標籤基團,例如所述標籤基團可以是放射性同位素、螢光化合物、酶或酶輔因子。此類探針也可以被用作用於鑑定表達TEMER07589多肽的細胞的診斷測試試劑盒的部分。本文的多核苷酸可以是合成的多核苷酸。合成的多核苷酸可以按照密碼子使用被優化,優選地根據W02006/077258和/或PCT/EP2007/055943中所述的方法被優化,所述參考文獻通過引用併入本文。PCT/EP2007/055943介紹了密碼子對優化。密碼子對優化是這樣一種方法其中編碼多肽的核苷酸序列根據其密碼子使用、尤其是使用的密碼子對而被修飾,以獲得編碼多肽的核苷酸序列經改進的表達和/或所編碼的多肽的經改進的生產。密碼子對被定義為編碼序列中一組兩個連續的三聯體(密碼子)。本發明還涉及包含前文所述多核苷酸的核酸構建體。「核酸構建體」在本文中被定義為單鏈或雙鏈的核酸分子,其與天然存在的基因分離,或者已被修飾為含有下述核酸區段,所述核酸區段以天然不會存在的方式組合和並置。當核酸構建體含有表達編碼序列所需的所有控制序列時,術語核酸構建體與術語「表達盒」同 義。本文定義的術語「編碼序列」在本文中被定義為下述序列,所述序列被轉錄成mRNA並翻譯成本發明的蛋白酶啟動子的轉錄活化子。編碼序列的界限通常由mRNA 5』-端的ATG起始密碼子和mRNA 3'-端終止開放讀碼框的翻譯終止密碼子序列決定。編碼序列可包括但不限於DNA、cDNA和重組核酸序列。優選地,核酸具有高GC含量。本文的GC含量是指構建體中G和C核苷酸的數量除以核苷酸的總數,以%表示。GC含量優選地為56%或更多、57%或更多、58%或更多、59%或更多、60%或更多,或者在56-70%的範圍內或58-65%的範圍內。優選地,DNA構建體包含啟動子DNA序列、與所述啟動子DNA序列可操作地連接的編碼序列,和控制序列例如-一個選自以下序列列表的由5』朝向3』方向的翻譯終止序列TAAG、TAGA和TAAA,優選地TAAA,和/或-一個選自以下序列列表的由5』朝向3』方向的翻譯起始子編碼序列GCTACCCCC ;GCTACCTCC ;GCTACCCTC ;GCTACCTTC ;GCTCCCCCC ;GCTCCCTCC ;GCTCCCCTC ;GCTCCCTTC ;GCTGCCCCC ;GCTGCCTCC ;GCTGCCCTC ;GCTGCCTTC ;GCTTCCCCC ;GCTTCCTCC ;GCTTCCCTC ;和GCTTCCTTC,優選地 GCT TCC TTC,和 / 或-選自以下序列列表的翻譯起始子序列5』-mwChkyCAAA_3』;5』-mwChkyCACA_3』或5』-mwChkyCAAG-3』,其中使用核苷酸的模糊編碼m(A/C) ;w(A/T) ;y(C/T) ;k(G/T) ;h(A/C/T),優選地 5』 -CACCGTCAAA-3』 或 5』 -CGCAGTCAAG-3 』。在本發明的上下文中,術語「翻譯起始子編碼序列」被定義為DNA編碼序列開放讀碼框起始子或起始密碼子緊下遊的9個核苷酸。起始子或起始密碼子編碼AA甲硫氨酸。起始密碼子典型地為ATG,但是也可以是任何功能性起始密碼子如GTG。在本發明的上下文中,術語「翻譯終止序列」被定義為從開放讀碼框或核苷酸編碼序列3』端的翻譯終止密碼子開始並按5』到3』方向的四個核苷酸。在本發明的上下文中,術語「翻譯起始子序列」被定義為編碼多肽的DNA序列開放讀碼框的起始子或起始密碼子緊上遊的十個核苷酸。起始子或起始密碼子編碼AA甲硫氨酸。起始密碼子典型地為ATG,但是也可以是任何功能性起始密碼子如GTG。本領域公知在RNA中尿嘧啶U代替脫氧核苷酸胸腺嘧啶T。同源性和同一性當胺基酸序列或核苷酸序列展示某些相似性水平時,其被稱為是同源的。同源的兩個序列表示共同的進化來源。不論兩個同源序列是密切相關的還是更遠相關的,其分別由或高或低的「百分比同一性」或「百分比相似性」表示。雖然是有爭論的,但為了表示「百分比同一性」或「百分比相似性」,「同源性水平」或「百分比同源性」通常互換使用。術語「同源性」、「百分比同源性」、「百分比同一性」或「百分比相似性」在本文可互換使用。就本發明的目的而言,在本文中定義為了測定兩條胺基酸序列或兩條核酸序列的百分比同一性,就最佳比較目的而言比對全序列。為了優化兩個序列之間的比對,可在被比較的兩條序列的任一條中引入缺口。這類比對可以在被比較的序列的全長上進行。或者,比對可在更短的比較長度上進行,例如在約20、約50、約100或更多個核酸/鹼基或胺基酸上進行。同一性是在報告的比對區域上的兩條序列之間的同一性匹配的百分比。可以使用數學算法完成兩個序列之間的序列比較和同一性百分比測定。技術人員應當明白下述事實可獲得比對兩條序列的若干種不同的電腦程式並測定兩條序列之間的同源性(Kruskal, J. B. (1983)An overview ofsequence comparison In D.Sankoffand J. B. Kruskal, (ed. ), Time warps, stringedits and macromolecules the theoryand practice of sequence comparison,pp. l_44Addison Wesley)。可使用用於I匕對兩條 序列的Needleman和Wunsch算法測定兩條胺基酸序列之間的百分比同一性(Needleman,
S.B. andffunsch, C. D. (1970) J. Mol. Biol. 48,443-453)。算法比對胺基酸序列以及核苷酸序列。Needleman-Wunsch算法已在電腦程式NEEDLE中實施。就本發明目的而言,使用了來自 EMBOSS包的NEEDLE程序(版本2. 8. 0或更高,EMBOSS :The European Molecular BiologyOpen Software Suite(2000)Rice,P. Longden,I. and Bleasby,A. Trends in Genetics 16,(6)pp276_277, http://emboss, bioinformatics, nl/)。就多妝序列而言,EBL0SUM62 用於替換矩陣,就核苷酸序列而言,使用了 EDNAFULL。可指定其他矩陣。用於比對胺基酸序列的任選的參數是缺口開放懲罰為10和缺口延伸懲罰為0. 5。技術人員會意識到所有這些不同的參數會產生些微不同的結果,但是當使用不同的算法時兩條序列的總百分比同一性不顯著改變。總體同源性定義同源性或同一性是在包括任何缺口或延伸的總比對區域上的兩條全序列之間的同一性匹配的百分比。兩條比對序列之間的同源性或同一性如下計算在兩個序列中都顯示相同胺基酸的比對中的對應位置的數目除以包括缺口的比對的全長。本文中定義的同一性可從NEEDLE中獲得並在程序輸出中被標記為「同一性」。最長的同一性定義在兩個比對序列之間的同源性或同一性如下計算在兩個序列中都顯示相同胺基酸的比對中的對應位置的數目除以減去比對中的總缺口數目後的比對的全長。可通過使用N0BRIEF選擇從NEEDLE中獲得本文中定義的同一性並且所述同一性在程序輸出中被標記為「最長同一性」。就本發明目的而言,根據「最長同一性」的定義計算兩條序列(胺基酸或核苷酸)之間的同一性(同源性)水平,如可通過使用程序NEEDLE進行計算。本方面的多肽序列還可用作「查詢序列」以針對序列資料庫進行搜索,例如來鑑定其他家族成員或相關序列。可使用BLAST程序進行此類搜索。進行BLAST分析的軟體通過National Center for BiotechnoIoRyInformation(http://wwww. ncbi. nlm. nih. rov)是公眾可得到的。BLASTP用於胺基酸序列,BLASTN用於核苷酸序列。BLAST程序使用下述預設:-開放缺口的開銷預設=5用於核苷酸/11用於多肽-延伸缺口的開銷預設=2用於核苷酸/I用於多肽-核苷酸錯配懲罰預設=-3-核苷酸匹配獎勵預設=I-期望值預設=10-字長預設=11用於核苷酸/28用於megablast/3用於多肽此外,通過BLAST程序,測定查詢胺基酸序列或查詢核酸序列與檢索的同源序列 之間的局部同一性(同源性)程度。但是,僅僅比較在某一閾值上給出匹配的那些序列段。從而,程序僅針對這些匹配段計算同一性。因此,以這種方式計算的同一性被稱為局部同一性。雜交在本文中使用時,術語「選擇性雜交」("selectively hybridizing "和「hybridizes selectively」)和類似的術語旨在描述用於雜交和洗漆的下述條件,在所述條件下彼此至少約50 %、至少約55 %、至少約60 %、至少約65 %、至少約70 %、至少約75%、至少約80%、更優選地至少約85%、進一步更優選地至少約90%、最優選地至少95%、更優選地至少約98%或更優選地至少約99%彼此同源的核苷酸序列典型地保持為彼此雜交。也就是說,這類雜交序列可共享至少約50%、至少約55%、至少約60%、至少約65*%、至少約70*%、至少約75*%、至少約80*%、更優選地至少約85*%、進一步更優選地至少約98%或更優選地至少約99%的序列同一性。這類雜交條件的一個優選的非限制性例子是於約45°C下在6X氯化鈉/檸檬酸鈉(SSC)中雜交,然後於約50°C、優選約55°C、優選約60°C和進一步更優選約65°C下,在I X SSC,0. 1% SDS中洗滌一次或多次。高度嚴格條件包括例如於約68°C下在5XSSC/5XDenhardf s溶液/I. 0% SDS中雜交並於室溫下在0. 2XSSC/0. 1% SDS中洗滌。或者,洗滌可以在42°C進行。技術人員應當知道對於嚴格和高度嚴格的雜交條件而言應用何種條件。涉及這類條件的其它指示在該領域能夠容易地獲得,例如在Sambrooket al. , 1989, MolecularCloning, A Laboratory Manual, Cold Spring HarborPress, N. Y.;和 Ausubel etal. (eds. ),1995, Current Protocols in MolecularBiology, (John Wiley & Sons,N. Y.)中。當然,僅與多聚A序列(例如mRNA的3』術端多聚(A))或互補的T (或U)殘基段雜交的多核苷酸不應被包括於與本發明的核酸部分特異雜交的本發明多核苷酸中,因為這類多核苷酸會與含有多聚(A)段或其互補體的任何核酸分子(例如尤其是任何雙鏈cDNA克隆)雜交。可以以一種典型的途徑,來篩選從其它生物(例如絲狀真菌,尤其是來自Trichomaceae 科、例如來自 Aspergillus 或 Penicillium 屬的微生物例如 Penicilliumdecumbens)構建的cDNA文庫。例如,可以通過Northern印跡針對同源的TEMER07589多核苷酸篩選Penicillium菌株。檢測到與根據本發明的多核苷酸同源的轉錄物後,可以利用本領域技術人員公知的標準技術從分離自適當菌株的RNA構建cDNA文庫。或者,可以使用能夠與根據本發明的TEMER07589多核苷酸雜交的探針來篩選總基因組DNA文庫。可以例如通過進行PCR分離同源的基因序列,所述PCR使用以本文所述核苷酸序列為基礎設計的兩個簡併寡核苷酸引物池。用於反應的模板可以是通過反轉錄mRNA獲得的cDNA,所述mRNA從已知或懷疑表達本發明多核苷酸的菌株中製備。可以對PCR產物進行亞克隆和測序,以確保被擴增的序列代表了新TEMER07589核酸序列的序列或其功能等同物。然後可以通過多種已知方法,使用PCR片段來分離全長cDNA克隆。例如,被擴增的片段可以被標記,並用於篩選噬菌體或粘粒cDNA文庫。或者,被標記的片段可以被用於篩選基因組文庫。也可以用PCR技術來從其它生物中分離全長cDNA序列。例如,可以根據標準步驟從合適的細胞或組織來源中分離RNA。可以使用特異於被擴增片段最5』端的寡核苷酸引物,引導第一鏈合成,針對RNA進行反轉錄反應。·然後可以使用標準的末端轉移酶反應將得到的RNA/DNA雜交體「加尾」(例如用鳥嘌呤),可以用RNase H消化所述雜交體,然後(例如用多聚-C引物)引物起始第二鏈合成。因此,被擴增片段上遊的cDNA序列可以容易地被分離。有用的克隆策略的綜述,參閱例如上文 Sambrook etal.;和上文的 Ausubel et al.。載體本發明的另一方面涉及包含編碼TEMER07589多肽或其功能性等同物的本發明多核苷酸的載體,包括克隆和表達載體,還涉及在例如本發明多肽發生表達的條件下,在合適的宿主細胞中培養、轉化或轉染這類載體的方法。本文使用的術語「載體」指能夠轉運與之連接的另一核酸的核酸分子。本發明的多核苷酸可以被摻入重組的可複製載體中,例如克隆或表達載體中。載體可被用於在相容的宿主細胞中複製核酸。因此在另一實施方式中,本發明提供了如下製造本發明多核苷酸的方法將本發明的多核苷酸引入可複製載體中,將所述載體引入相容的宿主細胞中,並在使得所述載體複製的條件下培養所述宿主細胞。載體可以從宿主細胞中被回收。合適的宿主細胞在下文討論。其中插入本發明表達盒或多核苷酸的載體可以是能夠便利地進行重組DNA操作的任何載體,並且所述載體的選擇通常應取決於要引入它的宿主細胞。根據本發明的載體可以是自主複製載體,即顯示為染色體外實體的載體,其複製不依賴於染色體複製,例如質粒。或者載體可以是被引入宿主細胞中後被整合進宿主細胞基因組中,並與整合了它的染色體一起複製的載體。一種類型的載體是「質粒」,質粒是指其中可以連接其它DNA區段的環狀雙鏈DNA環。另一種類型的載體是病毒載體,其中其它DNA區段可以被連接進病毒基因組中。某些載體在它們被引入的宿主細胞中能夠自主複製(例如具有細菌複製起點的細菌載體和附加體哺乳動物載體)。其它載體(例如非附加體哺乳動物載體)在引入宿主細胞時被整合進宿主細胞的基因組中,從而隨宿主細胞的基因組一起被複製。另外,某些載體能夠指導與它們可操作地連接的基因的表達。這類載體在本文中被稱作「表達載體」。一般而言,重組DNA技術中使用的表達載體通常是以質粒的形式存在的。術語「質粒」和「載體」在本文中可互換使用,因為質粒是最常用的載體形式。然而,本發明旨在包括這類表達載體的起等同作用的其它形式,如粘粒、病毒載體(例如複製缺陷反轉錄病毒、腺病毒和腺伴隨病毒)和噬菌體載體。對大部分絲狀真菌和酵母而言,載體或表達構建體優選地被整合進宿主細胞的基因組中,從而獲得穩定的轉化體。然而,對某些酵母而言還可獲得合適的附加體載體,可以向其中併入表達構建體進行穩定和高水平的表達,其例子包括分別衍生自Saccharomyces和Kluyveromyces的2 U和pKDl質粒的載體,或含有AMA序列(例如來自Aspergillus的AMA1)的載體。將表達構建體整合進宿主細胞基因組中的情況下,所述構建體被整合進基因組中隨機基因座處,或者使用同源重組整合進預定的目標基因座處,在這種情況下目標基因座優選地包含高度表達的基因。因此,可用於本發明的表達載體包括來自染色體、附加體和病毒的載體,例如來自細菌質粒、噬菌體、酵母附加體、酵母染色體元件、病毒(如杆狀病毒、乳多空病毒、痘苗病 毒、腺病毒、禽痘病毒、假狂犬病病毒和反轉錄病毒)的載體和來自其組合的病毒,如來自質粒和噬菌體遺傳元件的病毒(如粘粒和噬菌粒)。根據本發明的載體可以體外使用,例如用於生產RNA或用於轉染或轉化宿主細胞。可以例如使用T7啟動子調節序列和T7聚合酶體外轉錄和翻譯重組表達載體。本發明的載體可包含兩種或更多,例如三種、四種或五種本發明的多核苷酸,例如用於過表達。本發明的重組表達載體以適合核酸在宿主細胞中表達的形式包含本發明的核酸,這意味著重組表達載體含有一個或多個與待表達的核酸序列可操作地連接的調節序列,以要用於表達的宿主細胞為基礎選擇所述調節序列。在載體例如表達載體中,「可操作地連接」旨在表示感興趣的核苷酸序列與調節序列以允許該核苷酸序列表達(例如在體外轉錄/翻譯體系中或當載體被引入宿主細胞中時在宿主細胞中)的方式連接,即術語「可操作地連接」是指一種連接,其中所述組分處於允許它們以其預期方式發揮功能的關係中。與編碼序列「可操作地連接」的調節序列如啟動子、增強子或其它表達調節信號以下述方式放置在與所述控制序列相容的條件下實現所述編碼序列的表達;或者所述調節序列被布置為使得它們與其預期目的一致地發揮功能,例如轉錄在啟動子處開始並通過編碼多肽的DNA序列繼續。針對指定宿主細胞的載體或表達構建體因此可包含以下元件,所述元件以相對於編碼第一發明的多肽的序列的編碼鏈從5』 -端到3』 -端的連續順序彼此可操作地連接(i)能夠在給定的宿主細胞中指導編碼多肽的核苷酸序列轉錄的啟動子序列;(2)任選地,能夠指導多肽從給定的宿主細胞分泌進培養基中的信號序列;(3)本發明的DNA序列,其編碼成熟和優選地活性形式的、具有纖維素酶增強活性的多肽;和優選地還有(4)能夠終止編碼多肽的核苷酸序列下遊轉錄的轉錄終止區(終止子)。根據本發明的核苷酸序列的下遊可以是含有一個或多個轉錄終止位點(例如終止子)的3』非翻譯區。終止子的起點較不關鍵。終止子可以例如對編碼多肽的DNA序列而言是天然的。然而,優選地在酵母宿主細胞中使用酵母終止子並在絲狀真菌宿主細胞中使用絲狀真菌終止子。更優選地,終止子對宿主細胞(其中要表達編碼多肽的核苷酸序列)而言是內源的。在被轉錄的區域中,可存在用於翻譯的核糖體結合位點。構建體所表達的成熟轉錄本的編碼部分應當包括位於要翻譯的多肽起點處的翻譯起始AUG和適當地位於結尾處的終止密碼子。本發明多核苷酸的增強的 表達也可以通過對異源調節區(例如啟動子、分泌前導肽和/或終止子區)的選擇來實現,所述異源調節區可發揮以下作用提高表達宿主對感興趣的多肽的表達水平和需要時的分泌水平,和/或提供本發明多肽表達的誘導型控制。本領域技術人員應當知道對表達載體的設計可以以下述因素為基礎,如待轉化的宿主細胞的選擇、期望的多肽表達水平等。本發明的載體(例如表達載體)可以被引入宿主細胞中,從而生產由本文所述的核酸編碼的蛋白質或肽(例如TEMER07589多肽、TEMER07589多肽的突變體形式,其片段、變體或功能等同物)。本發明的載體(例如重組表達載體)可以被設計用於在原核細胞和真核細胞中表達TEMER07589多肽。例如,TEMER07589多肽可以在細菌細胞如E. coli、昆蟲細胞(使用杆狀病毒表達載體)、絲狀真菌、酵母細胞、真菌細胞或哺乳動物細胞中表達。合適的宿主細胞在Goeddel,Gene Expression Technology !Methods inEnzymology 185,Academic Press,SanDiego, CA(1990)中進一步討論。適當宿主的代表性例子在下文中描述。用於上述宿主細胞的適當培養基和條件是本領域已知的。術語「控制序列」或「調節序列」在本文中被定義為至少包括對多肽表達而言必需和/或有利地任何組件。任何控制序列對於編碼多肽的本發明核酸序列而言可以是天然的或外源的。此類控制序列可包括但不限於啟動子、前導序列、最適翻譯起始序列(如Kozak,1991,J. Biol. Chem. 266 :19867-19870中所述)、分泌信號序列、原-肽序列、多聚腺苷酸化序列、轉錄終止子。控制序列至少典型地包括啟動子、轉錄和翻譯終止信號。如上文所述,「可操作地連接」在本文中被定義為一種連接,其中控制序列相對於DNA序列的編碼序列被適當地置於一定位置上,使得控制序列指導多肽的生產。可以為了引入特定的限制性位點而對控制序列提供連接子,所述特定的限制性位點有助於將控制序列與編碼多肽的核酸序列的編碼區連接。術語「可操作地連接」在本文中被定義為一種連接,其中控制序列相對於DNA序列的編碼序列被適當地置於一定位置上,使得控制序列指導多肽的生產。控制序列可以是合適的啟動子序列,啟動子序列是被宿主細胞識別用於表達核酸序列的核酸序列。啟動子序列含有介導多肽表達的轉錄控制序列。啟動子可以是在細胞中顯示轉錄活性的任何核酸序列,包括突變、截短和雜種的啟動子,並且可得自編碼對細胞而言同源或異源的細胞外或細胞內多肽的基因。控制序列也可以是合適的轉錄終止子序列,這是被絲狀真菌細胞識別為終止轉錄的序列。終止子序列與編碼多肽的核酸序列的3'-端可操作地連接。本發明中可以使用在細胞中發揮功能的任何終止子。控制序列也可以是終止子。對絲狀真菌細胞而言優選的終止子得自編碼以下的基因A. oryzae TAKA澱粉酶、A. niger葡糖澱粉酶(glaA)、A. nidulans鄰氨基苯甲酸合酶、A. niger a -葡糖苷酶、trpC基因和Fusariumoxysporum膜蛋白酶樣蛋白酶。控制序列也可以是合適的前導序列、對絲狀真菌細胞翻譯而言重要的mRNA非翻譯區。前導序列與編碼多肽的核酸序列的5'端可操作地連接。在細胞中發揮功能的任何前導序列可用於本發明中。對絲狀真菌細胞而言優選的前導序列得自編碼以下的基因A. oryzae澱粉酶和A. nidulans憐酸丙糖異構酶和A. niger glaA。其他控制序列可分離自Penicillium IPNS基因,或pcbC基因,P微管蛋白基因。WO 01/21779中引用的所有控制序列通過引用併入本文。控制序列也可以是多聚腺苷酸化序列,這是與核酸序列3'-端可操作地連接的序列,其轉錄後被絲狀真菌細胞識別為對所轉錄的mRNA添加多聚腺苷殘基的信號。本發明中可以使用在細胞中有功能的任何多聚腺苷酸化序列。對絲狀真菌細胞而言優選的多聚腺苷酸化序列得自編碼以下的基因A. oryzae TAKA澱粉酶、A. niger葡糖澱粉酶、A. nidulans鄰氨基苯甲酸合酶、Fusarium oxysporum膜蛋白酶樣蛋白酶和A. niger a-葡糖苷酶。當根據本發明的多肽要從宿主細胞分泌進培養基時,可以對多肽添加適當的信號序列,從而將從新合成的多肽導向宿主細胞的分泌途徑。本領域技術人員已知針對特定的宿主細胞選擇適當的信號序列。信號序列對宿主細胞可以是天然的,或者對宿主細胞可以 是外源的。例如,可以使用來自對宿主細胞而言天然的多肽的信號序列。優選地,所述天然的多肽是高度分泌的多肽,即以高於被分泌的多肽總量10%的量被分泌的多肽。根據本發明優選地使用的信號序列是例如pmeA。作為信號序列的替代方式,本發明的多肽可與分泌載體多肽(carrierpolypeptide)或其部分融合。此類嵌合構建體藉助於載體多肽或其部分的信號序列而被導向分泌途徑。另外,載體多肽會對根據本發明的多肽提供穩定化效應,和/或可以增強溶解度。此類載體多肽可以是任何多肽。優選地,使用高度分泌的多肽作為載體多肽。載體多肽對根據本發明的多肽而言可以是天然的或外源的。載體多肽對宿主細胞而言可以是天然的或可以是外源的。此類載體多肽的例子是葡糖澱粉酶,a-交配因子的前原序列,Clostridium cellulovorans纖維素結合蛋白A的纖維素結合結構域,穀胱甘肽-S-轉移酶,Bacillus circulans幾丁質酶Al的幾丁質結合結構域,E. coliK12的malE基因編碼的麥芽糖結合結構域,P -半乳糖苷酶,和鹼性磷酸酶。用於在Aspergillus細胞中表達此類嵌合構建體的一種優選的載體多肽是葡糖澱粉酶。載體蛋白和多肽可含有特定的胺基酸基序,以便於多肽的分離;根據本發明的多肽可通過專用的釋放劑被釋放。釋放劑可以是蛋白水解酶或化學試劑。此類胺基酸基序的一個例子是KEX蛋白酶切割位點,其是本領域技術人員公知的。可以使用信號序列來協助本發明蛋白質或多肽的分泌和分離。信號序列的典型特徵是疏水胺基酸核,其通常在分泌期間的一個或多個切割事件中從成熟蛋白質上被切割。這類信號肽含有加工位點,所述加工位點允許在經過分泌通路時從成熟蛋白質上切下信號序列。信號序列指導蛋白質如從轉化了表達載體的真核宿主中分泌,並且隨後或同時切割信號序列。然後可以通過已知方法,從細胞外介質中容易地純化蛋白質。或者,可以使用簡化純化的序列(如具有GST結構域),將信號序列與感興趣的蛋白質連接。因此,例如編碼多肽的序列可以與簡化融合多肽純化的標記序列(如編碼肽的序列)融合。在本發明這一方面的某些優選的實施方式中,標記序列是六-組氨酸肽,如PQE載體(Qiagen,Inc.)中提供的標籤,以及其它,其中許多可商業獲得。例如如Gentz et al,Proc. Natl. Acad. Sci.USA86 =821-824(1989)中所述,六-組氨酸提供了融合蛋白的便利純化。HA標籤是可用於純化的另一種肽,其對應於衍生自流感血凝素蛋白的表位,由例如Wilson et al. , Cell 37:767(1984)描述。優選地,通過標準重組DNA技術生產本發明的TEMER07589融合蛋白。例如,根據常規技術將編碼不同多肽序列的DNA片段以符合讀碼框的方式連接在一起,所述常規技術例如通過使用平末端或交錯末端(stagger-ended termini)用於連接、使用限制性酶消化來提供適當的末端、適當時填平粘末端、使用鹼性磷酸酶處理來避免不想要的接合,和酶促連接。在另一實施方式中,可以通過常規技術(包括自動化DNA合成儀)合成融合基因。或者,可以使用錨定引物進行基因片段的PCR擴增,所述錨定引物在兩條相鄰的基因片段之間產生互補性懸突,所述相鄰基因片段可隨後退火併被再擴增產生嵌合基因序列(參閱例如 CurrentProtocols in Molecular Biology, eds. Ausubel et al. John Wiley &Sons:1992)。另外,可以商業獲得已經編碼融合片段(例如GST多肽)的許多表達載體。TEMER07589-編碼核酸可以被克隆進這樣的表達載體中,從而使融合片段與TEMER07589蛋白以符合讀碼框的方式連接。優選地,通過宿主細胞增強的同源重組能力提高了定向整合進宿主細胞基因組中(即在預定的靶基因座中整合)的效率。細胞的此類表型優選地涉及如W02005/095624中所述的缺陷型hdfA或hdfB基因。W02005/095624公開了獲得包含提高的定向整合效率的·絲狀真菌細胞的一種優選的方法。任選地,宿主細胞包含與野生型細胞相比提高的解摺疊蛋白應答(UPR),以增強感興趣的多肽的生產能力。可以通過US2004/0186070A1和/或US2001/0034045A1和/或W001/72783A2和/或W02005/123763中描述的技術提高UPR。更特定地,為了獲得具有提高的UPR的宿主細胞,調控了 HACl和/或IREl和/或PTC2的蛋白質水平,和/或改造了SEC61蛋白質。或者,或與提高的UPR組合,對宿主細胞進行遺傳修飾,以獲得與野生型細胞相比展示更低蛋白酶表達和/或蛋白酶分泌的表型,從而增強感興趣的多肽的生產能力。此類表型可以通過蛋白酶表達的轉錄調節子的缺失和/或修飾和/或失活來獲得。此類轉錄調節子可以是例如prtT。通過調控prtT來降低蛋白酶的表達可以通過US2004/0191864A1中描述的技術進行。或者,或與提高的UPR和/或展示更低蛋白酶表達和/或蛋白酶分泌的表型組合,宿主細胞展示了草酸鹽缺陷型表型,從而增強感興趣的多肽的生產產量。草酸鹽缺陷型表型可以通過W02004/070022A2中描述的技術獲得。或者,或與提高的UPR和/或展示更低蛋白酶表達和/或蛋白酶分泌和/或草酸鹽缺陷的表型組合,宿主細胞展示了與野生型相比的表型差異的組合,以增強感興趣的多肽的生產產率。這些差異可包括但不限於,降低的葡糖澱粉酶和/或中性a-澱粉酶A和/或中性a-澱粉酶B蛋白酶和草酸水解酶的表達。宿主細胞展示的所述表型差異可以通過根據US2004/0191864A1中所述技術的遺傳修飾獲得。或者,或與提高的UPR和/或展示更低蛋白酶表達和/或蛋白酶分泌和/或草酸鹽缺陷的表型和雨野生型相比為了增強感興趣的多肽生產產率的表型差異的組合相組合,宿主細胞展示毒素基因的缺陷,使得絲狀真菌宿主細胞失去表達毒素的能力。此類毒素包括但不限於,赭曲毒素,煙麴黴毒素,環並偶氮酸(cyclapiazonic acid),3_硝基丙酸,布洛芬,畸形素,黃麴黴毒素和黑麥酸。此類缺陷優選地例如描述於W02000/039322中。
(過)表達在一個優選的實施方式中,與其中本文所述的本發明的多核苷酸未被過表達的親本微生物菌株相比,所述基因可以在本發明的微生物菌株中被過表達。多核苷酸序列的過表達在本文中被定義為所述序列基因的表達,所述表達導致微生物菌株中所述序列編碼的酶活性是親本微生物中酶活性的至少約I. 5倍;優選地所述酶活性是親本微生物中酶活性的至少約2倍,更優選地至少約3倍,更優選地至少約4倍,更優選地至少約5倍,進一步更優選地至少約10倍,最優選地至少約20倍。載體可還包括產生RNA的多核苷酸側翼的序列,所述側翼的序列包含與真核基因組序列或病毒基因組序列同源的序列。這會允許將本發明的多核苷酸引入宿主細胞的基因組中。整合型克隆載體可在整合了它的宿主細胞染色體中隨機整合或在預定的靶基因座處整合。在本發明的一個優選的實施方式中,整合型克隆載體可包含與宿主細胞基因組中預定的靶基因座中的DNA序列同源的DNA片段,用於將克隆載體的整合靶向所述預定的 基因座。為了促進定向整合,在轉化宿主細胞之前優選地將克隆載體線性化。優選地以下述方式進行線性化,所述方式使得克隆載體的至少一端,優選地任一端的側翼是與靶基因座同源的序列。靶基因座側翼的同源序列的長度優選地至少約0. lkb,例如至少約0. 2kb,更優選地至少約0. 5kb,進一步更優選地至少約Ikb,最優選地至少約2kb。優選地,可如W005/095624和/或W02007/115886中所述,為了經改進的定向DNA整合頻率修飾親本宿主菌株。本發明中提供的缺失例子使用基因的啟動子作為5』-側翼,使用基因作為3』-側翼,從而在啟動子和基因之間插入選擇標記物,進而破壞(即功能性失活)基因轉錄。上文給出的基因序列可被用於製造類似地功能失活的基因。基因可以被一分為二,得到5』 -側翼和3』 -側翼,但是基因也可以被用於克隆含有基因啟動子和終止子區的基因組DNA的大片段,所述啟動子和終止子區隨後可發揮5』 -側翼和3』 -側翼的功能。載體系統可以是單個載體例如單個質粒,或兩個或更多個載體,例如兩個或更多個質粒,它們一起含有要被引入宿主細胞基因組中的總DNA。載體可以反義方向含有本發明的多核苷酸,以提供反義RNA的生產。可以通過常規的轉化或轉染技術將載體DNA引入原核或真核細胞中。本文使用的術語「轉化」和「轉染」旨在表示用於向宿主細胞中引入外源核酸(例如DNA)的多種本領域公認的技術,包括磷酸鈣或氯化鈣共沉澱、DEAE-葡聚糖-介導的轉染、轉導、感染、月旨質轉染、陽離子脂質介導的轉染或電穿孔。用於轉化或轉染宿主細胞的合適方法可見於Sambrook,et al. (Molecular Cloning A Laboratory Manual, 2nd,ed. ColdSpring HarborLaboratory, Cold Spring Harbor Laboratory Press, Cold SpringHarbor, NY,1989),Davis et al. , Basic Methods in Molecular Biology (1986)和其它實驗室手冊中。對於哺乳動物細胞的穩定轉染而言,已知取決於使用的表達載體和轉染技術,只有非常小的細胞級分可以將外源DNA整合進它們的基因組中。為了鑑定並選擇這些整合體,通常將編碼可選擇標記(例如抗性或抗生素)的基因與感興趣的基因一起引入宿主細胞中。優選的可選擇標記包括但不限於賦予藥物抗性或補足宿主細胞缺陷的可選擇標記。它們包括例如可用於轉化大部分絲狀真菌和酵母的通用標記基因,如乙醯胺酶基因或cDNA (來自 A. nidulans、A. oryzae 或 A. niger 的 amdS、niaD、facA基因或 cDNA),或提供抗生素抗性如G418、潮黴素、博來黴素、卡那黴素、甲氨喋呤、腐草黴素或苯菌靈抗性(benA)的基因。或者,可以使用特異性選擇標記,如需要相應突變體宿主菌株的營養缺陷型標記,例如URA3(來自S. cerevisiae或來自其它酵母的類似基因)、pyrG或pyrA (來自A. nidulans或A. niger)、argB (來自A. nidulans或A. niger)或trpC。在一個優選的實施方式中,在引入表達構建體後從經轉化的宿主細胞中缺失選擇標記,從而獲得能夠生產下述多肽的經轉化的宿主細胞,所述多肽不含選擇標記基因。其它標記包括ATP合成酶、亞基9(oliC)、乳清苷-5'-磷酸脫羧酶(pvrA)、細菌G418抗性基因(這也可在酵母中使用,但是不能在真菌中使用)、氨苄西林抗性基因(E. coli)、新黴素抗性基因(Bacillus)、來自Streptomyces nursei的諾爾絲菌素抗性基因natl、Aspergillus oryzae的卩比唳硫胺抗性基因ptrA以及編碼P _葡糖醒酸糖苷酶(GUS)的E. coli UidA基因。載體可以體外使用,例如用於生產RNA或用於轉染或轉化宿主細胞。 蛋白質在原核生物中的表達常在E. coli中用下述載體完成,所述載體含有指導融合蛋白或非融合蛋白表達的組成型或誘導型啟動子。融合載體對其中編碼的蛋白質、例如對重組蛋白的氨基端添加大量胺基酸。這類融合載體典型地具有三個目的1)提高重組蛋白的表達;2)提高重組蛋白的溶解度;3)通過在親和層析中發揮配體作用來幫助純化重組蛋白。通常在融合表達載體中,在融合片段和重組蛋白的接合處引入蛋白水解切割位點,使得能夠在融合蛋白的純化後將重組蛋白與融合片段分開。如所指出的,表達載體優選地含有可選擇標記。這類標記包括用於真核細胞培養的二氫葉酸還原酶或新黴素抗性,和用於在E. coli和其它細菌中培養的四環素或氨苄西林抗性。優選用於細菌的載體例如公開於W0-A1-2004/074468中,所述文獻通過引用併入本文。其它合適的載體應是技術人員容易知道的。為了將翻譯的蛋白質分泌進入內質網腔中、進入壁膜間隙中或進入細胞外環境中,可以向被表達的多肽中整合進適當的分泌信號。所述信號對多肽可以是同源的或它們可以是異源信號。TEMER07589多肽可以以經修飾的方式(例如作為融合蛋白)被生產,並可不僅含有分泌信號而且含有額外的異源功能區。因此,例如額外胺基酸區(尤其是帶電荷的胺基酸)可被添加至多肽的N端,以促進純化期間或隨後的操作和儲存期間在宿主細胞中的穩定性和持久性。還可向多肽添加肽基元,以便於純化。本發明提供了經分離的多肽,所述多肽具有根據SEQ ID NO :2的胺基酸序列,和能夠通過在合適的宿主中表達SEQ ID NO :1的多核苷酸獲得的胺基酸序列。包含上述多肽的變體(例如功能等同物)的肽或多肽也包括在本發明內。上述多肽集體包含在術語「本發明的多肽」中。術語「變體肽」或「變體多肽」在本文中被定義為分別在肽或多肽的一個或多個特定位置上包含一個或多個改變(例如一個或多個特定胺基酸殘基的取代、插入、缺失和/或截短)的肽或多肽。相應地,變體信號肽是在信號肽的一個或多個特定位置上包含一個或多個改變(例如一個或多個特定胺基酸殘基的取代、插入、缺失和/或截短)的信號肽。術語「多核苷酸」與術語「核酸分子」相同,並且在本文中可互換理解。該術語是指多核苷酸分子,其為單鏈或雙鏈的核糖核酸(RNA)或脫氧核糖核酸(DNA)分子。多核苷酸可以分離形式存在,或者可包含在重組核酸分子或載體中,或包含在宿主細胞中。術語「變體多核苷酸」在本文中被定義為在多核苷酸中一個或多個特定位置上包含一個或多個改變(例如一個或多個核苷酸的取代、插入、缺失和/或截短)的多核苷酸。術語「肽」和「寡肽」被認為是同義的(如其通常被認為的那樣),且當上下文需要表示通過肽鍵偶合的至少兩個胺基酸鏈時,每個術語可以互換使用。詞語「多肽」在本文中使用表示含有多於七個胺基酸殘基的鏈。所有的寡肽和多肽式或序列在本文中從左到右和從氨基端到羧基端的方向書寫。本文使用的單字母胺基酸代碼是本領域普遍已知的,並可見於 Sambrook, et al. (Molecular Cloning A Laboratory Manual, 2nd, ed. ColdSpringHarbor Laboratory, Cold Spring Harbor Laboratory Press, Cold SpringHarbor, NY,1989)o「分離的」多肽或蛋白質表示被從其天然環境中取出的多肽或蛋白質。例如,就 本發明的目的而言,在宿主細胞中表達的重組產生的多肽和蛋白質被認為是分離的,與通過任何合適的技術已基本純化的天然或重組多肽一樣,所述合適的技術例如Smith andJohnson, Gene 67 :31-40 (1988)中公開的單步驟純化方法。根據本發明的TEMER07589纖維素酶增強多肽可以通過本領域已知的方法從重組細胞培養物中回收和純化。最優選地,使用高效液相色譜(「HPLC」)進行純化。本發明的多肽包括天然純化的產物、化學合成步驟的產物,和通過重組技術從原核或真核宿主生產的產物,所述宿主包括例如細菌、酵母、高等植物、昆蟲和哺乳動物細胞。取決於重組生產步驟中使用的宿主,可以將本發明的多肽糖基化或不糖基化。另外,本發明的多肽也可以包含最初被修飾的殘基(在一些情況下由宿主介導的過程產生)。本發明還包括根據本發明的多肽的生物活性片段。本發明的多肽的生物活性片段包括包含下述胺基酸序列的多肽,所述胺基酸序列與TEMER07589多肽的胺基酸序列(例如SEQ ID NO 2的胺基酸序列)足夠相同或來自後者,所述片段包含比全長多肽更少的胺基酸但是顯示相應的全長多肽的至少一種生物活性。典型地,生物活性片段包含具有TEMER07589多肽的至少一種活性的結構域或基序。本發明的多肽的生物活性片段可以是長度為例如約10、約25、約50、約100或更多個胺基酸,或長度至少約100個胺基酸、至少約150、200、250、300、350、400個胺基酸,或長度多達本發明多肽胺基酸總數的多肽。另外,其它生物活性部分(其中多肽的其它區域被缺失)可以通過重組技術被製備,並針對本發明多肽的天然形式的一種或多種生物活性做出評價。本發明還包括編碼TEMER07589多肽的上述生物活性片段的核酸片段。多肽在本發明的另一方面中,提供了經改進的TEMER07589多肽。經改進的TEMER07589多肽是其中至少一種生物活性被改進的多肽。這類多肽可以如下獲得沿全部或部分TEMER07589編碼序列隨機地引入突變(例如通過飽和誘變),重組表達得到的突變體並針對生物活性進行篩選。導致經改進的纖維素酶增強功能的本發明胺基酸序列經改進的變體可通過本發明的相應基因獲得。此類修飾包括
I.易錯PCR以引入隨機突變,之後篩選獲得的變體並分離具有經改進的動力學特性的變體2.編碼纖維素酶增強的酶的基因相關變體的家族改組,之後篩選獲得的變體並分離具有經改進的動力學特性的變體導致提高的mRNA和/或多肽水平、導致更多纖維素酶增強活性的本發明的基因變體可通過所述基因的多核苷酸序列獲得。此類修飾包括I.以下述方式改進密碼子使用,所述方式使得密碼子(最適地)適合親本微生物宿主。2.以下述方式改進密碼子對使用,所述方式使得密碼子(最適地)適合 親本微生物宿主3.對編碼纖維素酶增強多肽的基因組信息添加穩定化序列,導致具有提高的半衰期的mRNA分子分離具有經改進的催化特性或提高的mRNA或蛋白質水平的變體的優選方法描述於TO03/010183和W003/01311中。優化親本微生物菌株中密碼子使用的優選方法描述於PCT/EP2007/05594中。對編碼本發明的纖維素酶增強多肽的基因添加穩定化元件的優選方法描述於W02005/059149中。在一個優選的實施方式中,TEMER07589多肽具有根據SEQ ID NO 2的胺基酸序列。在另一實施方式中,TEMER07589多肽與根據SEQ ID NO :2的胺基酸序列基本同源,並保留根據SEQ ID NO :2的多肽的至少一種生物活性,但是由於所述的天然變異或誘變而在
胺基酸序列上有差異。在又一個優選的實施方式中,TEMER07589多肽具有由下述經分離的核酸片段編碼的胺基酸序列,所述經分離的核酸片段能夠與根據SEQ IDNO 1的核酸優選地在高度嚴格的雜交條件下雜交。因此,TEMER07589多肽優選地是包含下述胺基酸序列的多肽,所述胺基酸序列與SEQ ID NO: 2所示胺基酸序列至少76 %、至少77 %、至少78 %、至少79 %、至少80 %、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少 90%、至少 91%、92%、93%、94%、95%、96%、97%、98%、99%或更多同源,典型地,保留根據SEQ ID NO :2的多肽的至少一種功能活性。也可以如下文所述來鑑定根據本發明的多肽的功能等同物例如,針對纖維素酶增強活性,篩選本發明多肽的突變體(例如截短突變體)的組合文庫。在一個實施方式中,通過核酸水平上的組合誘變產生有斑文庫(variegated library)。可以通過例如將合成的寡核苷酸混合物酶連接為基因序列來產生變體的有斑文庫,從而可能的多肽序列的簡併集合(degenerateset)可作為個體多肽表達,或者作為一組更大的融合蛋白表達(例如用於噬菌體展示)。存在可用於從簡併寡核苷酸生產本發明多肽的可能變體文庫的多種方法。用於合成簡併寡核苷酸的方法是本領域已知的(見例如Narang(1983) Tetrahedron 39 3 ;ltakura et al. (1984)Annu. Rev. Biochem. 53323 ;ltakura et al. (1984)Science 198 1056 ;Ike et al. (1983)Nucleic AcidRes 11 :477)。另外,本發明多肽的編碼序列的片段文庫可以被用於產生有斑的多肽群,用於篩選隨後的變體選擇。例如,可以如下產生編碼序列片段的文庫在每個分子僅發生約一次切割的條件下用核酸酶處理感興趣的編碼序列的雙鏈PCR片段,變性雙鏈DNA,將DNA復性形成雙鏈DNA (其可包含來自被不同切割的產物的有義/反義對),通過用SI核酸酶處理從再形成的雙鏈體上去除單鏈部分,並將得到的片段文庫連接進表達載體中。通過該方法,可以得到下述表達文庫,所述表達文庫編碼感興趣的蛋白質的不同大小的N-末端和內部片段。本領域已知有若干種技術可用於篩選組合文庫(其通過截短的點突變製造)的基因產物,和用於篩選cDNA文庫以獲得具有選定特性的基因產物。用於篩選大基因文庫的、適用於高通量分析的、最廣泛使用的技術典型地包括將基因文庫克隆進可複製的表達載體中,用得到的載體文庫轉化合適的細胞,和在下述條件下表達組合基因,所述條件下想要的活性的檢測簡化編碼基因(其產物被檢測)的載體的分離。循環總體誘變(Recursiveensemble mutagenesis, REM),—種增強文庫中功能突變體頻率的技術,可以與篩選實驗組合使用以鑑定本發明多妝的變體(Arkin andYourvan (1992)Proc. Natl. Acad. Sci. USA 89:7811-7815 ;Delgrave et al. (1993)Protein Engineering 6(3) :327-331)。
除了 SEQ ID NO :1中所示的TEMER07589基因序列外,本領域技術人員應當知道給定的種群中可存在DNA序列多態,所述多態導致TEMER07589多肽胺基酸序列中的改變。這類遺傳多態性可存在於來自不同種群的細胞中或由於天然等位基因變異而存在於一個種群中。等位基因變體也可包括功能等同物。根據本發明的多核苷酸的片段也可包括不編碼功能多肽的多核苷酸。這類多核苷酸可作為PCR反應的探針或引物作用。根據本發明的核酸無論是編碼功能多肽還是無功能的多肽,均可被用作雜交探針或聚合酶鏈式反應(PCR)引物。不編碼具有TEMER07589活性的多肽的本發明核酸分子的用途尤其包括(I)從cDNA文庫分離編碼TEMER07589多肽的基因或其等位基因變體,所述cDNA文庫例如來自合適的微生物;(2)與中期染色體塗片原位雜交(例如FISH)以提供 TEMER07589 基因的精確染色體定位,如 Verma et al. ,HumanChromosomes a Manual ofBasic Techniques, Pergamon Press, New York(1988)所述;(3)Northern 印跡分析,用於檢測TEMER07589mRNA在特定組織中的表達;和4)能夠被用作診斷工具來分析給定的生物(例如組織)樣品中核酸存在的探針和引物,所述核酸能與TEMER07589探針雜交。本發明還包括獲得TEMER07589基因功能等同物的方法。這類方法需要獲得被標記的含有被分離的核酸的探針,所述被分離的核酸編碼根據SEQ ID NO :2的多肽序列或其任何變體的全部或部分;在允許探針與文庫中的核酸片段雜交從而形成核酸雙鏈體的條件下,用被標記的探針篩選核酸片段文庫,和從任何被標記的雙鏈體中的核酸片段製備全長的基因序列,以獲得與TEMER07589基因相關的基因。在一個實施方式中,本發明的TEMER07589核酸與SEQ ID NO :1中所示的核酸序列或其互補體至少80 %、至少81%、至少82 %、至少83 %、至少84 %、至少85 %、至少86 %、至少87%、至少88%、至少89%、至少90%、至少91 %、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或更加同源。本發明進一步提供了包含本發明多核苷酸或載體的宿主細胞。所述多核苷酸對宿主細胞的基因組可以是異源的。通常涉及宿主細胞的術語「異源的」表示多核苷酸不天然存在於宿主細胞的基因組中,或者多肽不由所述細胞天然地生產。在另一實施方式中,本發明包括細胞,例如含有本發明所包括的核酸的經轉化的宿主細胞或重組的宿主細胞。「經轉化的細胞」或「重組細胞」是其中(或其祖先中)已經藉助於重組DNA技術引入了本發明核酸的細胞。原核和真核細胞均包括在內,例如細菌、真菌、酵母等等,特別優選的是來自絲狀真菌(例如Aspergillus niger或Talaromycesemersonii)的細胞。可選用調控插入序列表達並以特異的、期望的方式加工基因產物的宿主細胞。蛋白質產物的這類修飾(例如糖基化)和加工(例如切割)可促進蛋白質發揮最佳功能。多種宿主細胞具有用於翻譯前加工和修飾蛋白質和基因產物的特性和特異機制。可選用分子生物學和/或微生物學領域技術人員熟悉的適當細胞系或宿主系統,以確保對所表達的外源蛋白質的想要的和正確的修飾與加工。為此,可以使用具有下述細胞機制的真核宿主細胞,所述細胞機制用於適當地加工原始轉錄本、糖基化和磷酸化基因產物。這類宿主細胞是本領域公知的。如果需要的話,可以在根據本發明的多肽的製備中使用上述細胞。這樣的方法典 型地包含在提供編碼多肽的編碼序列(的載體)表達的條件下培養宿主細胞(例如用上述表達載體轉化或轉染的),並任選地回收被表達的多肽。可以將本發明的多核苷酸併入重組可複製載體例如表達載體中。可以使用載體在相容的宿主細胞中複製核酸。因此在又一個實施方式中,本發明提供了如下製造本發明多核苷酸的方法將本發明的多核苷酸引入可複製載體中,將所述載體引入相容的宿主細胞中,並在使得所述載體複製的條件下培養所述宿主細胞。可以從所述宿主細胞中回收載體。優選地,多肽作為分泌型蛋白質被生產,在這種情況下,表達構建體中編碼多肽成熟形式的核苷酸序列與編碼信號序列的核苷酸序列可操作地連接。優選地,信號序列對編碼多肽的核苷酸序列而言是天然的(同源的)。或者,信號序列對編碼多肽的核苷酸序列而言是外來的(異源的),在這種情況下信號序列優選地對其中表達本發明核苷酸序列的宿主細胞而言是內源的。對酵母宿主細胞而言合適的信號序列的例子是衍生自酵母a-因子基因的信號序列。類似地,對絲狀真菌宿主細胞而言合適的信號序列是例如衍生自絲狀真菌澱粉葡萄糖苷酶(AG)基因例如A.niger glaA基因的信號序列。這可與澱粉糖苷酶(也稱作(葡糖)澱粉酶)啟動子自身組合使用,以及與其它啟動子組合使用。在本發明上下文中也可以使用雜種信號序列。優選的異源分泌前導序列是來自於真菌澱粉葡萄糖苷酶(AG)基因(glaA-例如來自Aspergillus的18和24個胺基酸版本)、a -因子基因(酵母,例如Saccharomyces和Kluyveromyces)或a -澱粉酶基因(Bacillus)的分泌前導序列。可如上文所述將載體轉化或轉染進合適的宿主細胞中,以提供本發明多肽的表達。該方法可包括在提供編碼本發明多肽的編碼序列的載體表達的條件下培養宿主細胞,所述宿主細胞用如上所述的表達載體轉化。宿主細胞本發明因此提供了用本發明多核苷酸或載體轉化或轉染的或包含本發明多核苷酸或載體的宿主細胞。優選地,所述多核苷酸被包含在用於複製和表達多核苷酸的載體中。應選擇與所述載體相容的細胞,並且其可以是原核(例如細菌)、真菌、酵母或植物細胞。可以選擇異源宿主,其中本發明的多肽以基本不含其它纖維素降解酶或半纖維素降解酶的形式被生產。這可以通過選擇正常情況下不生產此類酶的宿主來實現。
本發明包括通過編碼多肽的DNA序列的重組表達來生產本發明多肽的方法。就這一目的而言,本發明的DNA序列可用於基因擴增和/或改變表達信號如啟動子、分泌信號序列,從而允許合適同源或異源宿主細胞中多肽的經濟生產。同源宿主細胞是下述宿主細胞,其與DNA序列衍生自的物種是相同物種或是相同物種內的變體。合適的宿主細胞優選地是原核微生物如細菌,或更優選地是真核生物,例如真菌,如酵母或絲狀真菌,或植物細胞。通常,酵母細胞是超過真菌細胞優選的,因為它們更易於操作。然而,一些蛋白質在酵母中分泌較差,或者在一些情況下不被正確加工(例如酵母中的超糖基化)。在這些情況下,應當選擇真菌宿主生物。宿主細胞可過表達多肽,並且用於進行過表達的技術是公知的。宿主細胞因此可具有兩個或更多拷貝的編碼多核苷酸(因此載體可相應地具有兩個或更多拷貝)。來自Bacillus屬的細菌非常適合作為異源宿主,因為它們能夠將蛋白質分泌進培養基中。適合作為宿主的其它細菌是來自Streptomyces和Pseudomonas屬的細菌。用於表達編碼多肽的DNA序列的一種優選的酵母宿主細胞是Saccharomyces、Kluyveromyces、·Hansenula、Pichia、Yarrowia 和 Schizosaccharomyces 的屬。更優選地,酵母宿主細胞選自由Saccharomyces cerevisiae、Kluyveromyceslactis (也已知為 Kluyveromycesmarxianus var. lactis)、Hansenulapolymorpha、Pichiapastoris、Yarrowia Iipolytica 和 Schizosaccharomyces pombe 物種組成的組。然而,最優選的是(例如絲狀)真菌宿主細胞。優選的絲狀真菌宿主細胞選自由 Aspergillus、Trichoderma/Hypocrea、Fusarium、Disporotrichum、Penicillium、Acremonium、Neurospora、Thermoascus、Myceliophtora、Sporotrichum、Thielavia、Chryosporium、Fusarium、Humicola、Neurospora 和 Talaromyces 屬組成的組。更優選地,絲狀真菌宿主細胞是下屬種。所述種包括但不限於Aspergillusniger、Aspergillu sawamori> Aspergillus tubingensis、AspergiIlusacuIeatus>Aspergillus foetidus、Aspergillus nidulans、Aspergillusjaponicus>Aspergillusoryzae 和 Aspergillus ficuum、 Trichodermareesei/Hypocrea jecorina、 Fusariumgraminearum>Talaromyces emersonii、Penicillium decumbens>Acremonium alabamense、Neurospora crassa、Myceliophtora thernaophilurri、Sporotrichum cellulophilum、Disporotrichumdimorphosporum、Talaromyces emersonii、Talaromyces stipitatus 和Thielavia terrestris。根據本發明的宿主細胞包括植物細胞,因此本發明擴展至含有一個或多個本發明細胞的轉基因生物,如植物及其部分。所述細胞可異源表達本發明的多肽,或可異源地含有一個或多個本發明的多核苷酸。轉基因(或經遺傳修飾的)植物可因此在其基因組中(例如穩定地)插入了編碼一個或多個本發明多肽的序列。可以使用已知技術,例如使用來自Agrobacterium tumefaciens的Ti或Ri質粒,進行植物細胞的轉化。質粒(或載體)可因此含有感染植物必需的序列,並且可以使用Ti和/或Ri質粒的衍生物。或者,可進行植物部分例如葉、根或莖的直接感染。在該技術中,例如如下對要被感染的植物造成創傷用刀片切割植物、或用針穿刺植物或用磨蝕劑摩擦植物。然後用Agrobacterium接種傷口。然後可在合適的培養基上培養植物或植物部分,並允許其發育成為成熟的植物。可通過已知技術實現經轉化的細胞成為經遺傳修飾的植物的再生,例如通過使用抗生素選擇經轉化的枝條,並將枝條接種在含有適當營養素、植物激素等等的培養基上來實現。本發明因此還包括被修飾為表達本發明的纖維素酶增強多肽或其變體的細胞。這類細胞包括經瞬時修飾的,或優選地經穩定修飾的高級真核細胞系,例如哺乳動物細胞或昆蟲細胞,低級真核細胞,例如酵母和絲狀真菌細胞,或原核細胞例如細菌細胞。還可能本發明的多肽在細胞系中或膜上(例如在杆狀病毒表達系統中)被瞬時表達。適合表達根據本發明的多肽的此類系統也包括在本發明的範圍內。根據本發明,本發明多肽的生產可以通過在便利的營養發酵培養基中培養微生物表達宿主來實現,所述微生物表達宿主已用一種或多種本發明的多核苷酸轉化。多肽/酶生產可使用本領域已知的步驟培養根據本發明的重組宿主細胞。對啟動子和宿主細胞 的每種組合而言,可以獲得有助於編碼多肽的DNA序列表達的培養條件。達到期望的細胞密度或多肽滴度後,停止培養並使用已知的步驟回收多肽。發酵培養基可含有已知的培養基,所述培養基含有碳源(例如葡萄糖、麥芽糖、糖蜜、澱粉、纖維素、木聚糖、果膠、木質纖維素生物質水解產物等等)、氮源(例如硫酸銨、硝酸銨、氯化銨等等)、有機氮源(例如酵母提取物、麥芽提取物、蛋白腖等等)和無機氮源(例如磷酸鎂、磷酸鉀、磷酸鋅、磷酸鐵等等)。任選地可以包括誘導劑(例如纖維素、果膠、木聚糖、麥芽糖、麥芽糖糊精或聚木糖半乳糖醒酸(xylogalacturonan))。對合適培養基的選擇可基於表達宿主的選擇和/或基於表達構建體的調節需求來進行。這類培養基是本領域技術人員已知的。需要時,培養基可含有額外的組分,所述額外的組分對經轉化的表達宿主的偏好優於其它可能的汙染微生物。可根據任何已知的程序進行通過轉化的宿主(發酵)的多肽生產。生產時間可在從約0. 5到約30天的周期上進行。發酵可以是分批、連續或補料分批的過程,在0-100°C或0-80°C範圍內,例如從約0°C到約60°C的合適溫度下,和/或例如在從約2到約10或從約3到約9的pH下。優選的發酵條件是從約20°C到約55°C之間範圍內的溫度和/或從約3到約5之間的pH。適當的條件通常基於表達宿主的選擇和要表達的多肽來選擇。發酵後,如果必須的話,可通過離心或過濾從發酵液中去除細胞。發酵停止或去除細胞後,可隨後回收本發明的多肽,並且需要時通過常規手段純化和分離。多肽/酶組合物本發明提供了包含本發明的多肽和纖維素酶和/或半纖維素酶和/或果膠酶的組合物。當本發明的多肽是纖維素酶時,除了本發明的多肽以外,本發明的組合物會典型地包含半纖維素酶和/或果膠酶。當本發明的多肽是半纖維素酶時,除了本發明的多肽以外,本發明的組合物會典型地包含纖維素酶和/或果膠酶。當本發明的多肽是果膠酶時,除了本發明的多肽以外,本發明的組合物會典型地包含纖維素酶和/或半纖維素酶。本發明的組合物可包含一類、兩類或三類或更多類的纖維素酶,例如內切-1,4-3-葡聚糖酶(EG)、外切-纖維二糖水解酶(CBH)和¢-葡糖苷酶(BGL)中的一種、兩種或所有。本發明的組合物可包含具有相同酶活性的多肽,例如與本發明多肽提供的活性相同類型的纖維素酶、半纖維素酶和/或果膠酶活性。本發明的組合物可包含與本發明的多肽提供的活性不同類型的纖維素酶活性和/或半纖維素酶活性和/或果膠酶活性。例如,本發明的組合物可包含本發明多肽提供的一種類型的纖維素酶和/或半纖維素酶活性和/或果膠酶活性和其他半纖維素酶/果膠酶提供的另一種類型的纖維素酶和/或半纖維素酶活性和/或果膠酶活性。在本文中,纖維素酶是能夠降解纖維素的任何多肽。能夠降解纖維素的多肽是能夠催化下述過程的多肽將纖維素降解成更小的單元,例如部分地降解成纖維素糊精,或者完全降解成葡萄糖單體。與纖維素酶接觸時,根據本發明的纖維素酶可得到纖維素糊精與葡萄糖單體的混合種群。此類降解將典型地通過水解反應而發生。 本文中,半纖維素是能夠降解半纖維素的任何多肽。也就是說,半纖維素酶可以能夠降解木聚糖、葡糖醛酸木聚糖、阿拉伯木聚糖、葡甘露聚糖和木葡聚糖之一種或多種。能夠降解半纖維素的多肽是能夠催化下述過程的多肽將半纖維素降解成更小的多糖,例如部分地降解成寡糖,或者完全降解成糖單體,例如己糖或戊糖單體。與半纖維素酶接觸時,根據本發明的半纖維素酶可得到寡糖與糖單體的混合種群。此類降解將典型地通過水解反應而發生。本文中,果膠酶是能夠降解果膠的任何多肽。能夠降解果膠的多肽是能夠催化下述過程的多肽將果膠降解成更小的單元,例如部分地降解成寡糖,或者完全降解成糖單體。與果膠酶接觸時,根據本發明的果膠酶可得到寡糖與糖單體的混合種群。此類降解將典型地通過水解反應而發生。因此,本發明的組合物可包含任何纖維素酶,例如纖維二糖水解酶,內切-P -1,4-葡聚糖酶,¢-葡糖苷酶或¢-(1,3) (1,4)_葡聚糖酶。本文中,纖維二糖水解酶是能夠催化纖維素或纖維四糖中1,4-0-D-葡糖苷鍵水解、從鏈的末端釋放纖維二糖的任何多肽。所述酶也可以被稱作纖維素酶1,4-0_纖維二糖苷酶(I,4-0 -cellobiosidase),1,4_0 -纖維二糖水解酶,1,4-^ -D-葡聚糖纖維二糖水解酶,微晶纖維素酶(avicelase),外切-1,4-0 -D-葡聚糖酶,纖維素酶增強酶或外切葡聚糖酶。其可具有EC編碼EC 3. 2. I. 91。纖維二糖水解酶可細分為纖維二糖水解酶I (CBHI)和纖維二糖水解酶II (CBH II)。CBH I被定義為主要從還原性末端水解纖維素、分裂出纖維二糖的纖維二糖水解酶。CBH II被定義為主要從非還原性末端水解纖維素、分裂出纖維二糖的纖維二糖水解酶。本文中,內切-3-1,4-葡聚糖酶(EC 3. 2. I. 4)是能夠催化纖維素、地衣澱粉或穀類P-D-葡聚糖中1,4-0-D-葡糖苷鍵內切水解的任何多肽。此類多肽也可以能夠水解還含有1,3_鍵的P-D-葡聚糖中的1,4_鍵。所述酶也可以被稱作纖維素酶、微晶纖維素酶、¢-1,4-內切葡聚糖水解酶、¢-1,4-葡聚糖酶、羧甲基纖維素酶、纖維糊精酶、內切-I,4- @ -D-葡聚糖酶、內切-I,4- @ -D-葡聚糖水解酶、內切-I,4- @ -葡聚糖酶或內切葡聚糖酶。本文中,CEA是基於其3D結構被歸類在糖基水解酶家族5 (GH5)下的內切葡聚糖酶EC3. 2. I. 4。GH5家族成員的已知活性包括殼聚糖酶(EC 3. 2. I. 132)、^ -甘露糖苷酶(EC 3.2. I. 25)、纖維素酶(EC 3.2. I. 4)、葡聚糖 1,3-0-葡糖苷酶(EC3. 2. I. 58)、地衣澱粉酶(Iicheninase) (EC 3. 2. I. 73)、葡聚糖內切-1,6_P -葡糖苷酶(EC 3. 2. I. 75)、甘露聚糖內切-3-1,4-甘露糖苷酶(EC 3.2. I. 78)、內切-3-1,4-木聚糖酶(EC 3.2. 1.8)、纖維素¢-1,4-纖維二糖苷酶(EC 3. 2. I. 91)、內切-3-1,6-半乳聚糖酶(EC 3.2.1.-)、¢-1,3-甘露聚糖酶(EC 3.2. I.-)、木糖葡聚糖-特異性內切-¢-1,4-葡聚糖酶(EC
3.2. I. 151)、甘露聚糖轉糖基酶(EC 2. 4. I.-)活性。本文中CEB是基於其3D結構被歸類在糖基水解酶家族7 (GH7)下的內切葡聚糖酶EC 3.2. 1.4。GH7家族成員的已知活性包括內切-1,4-葡聚糖酶(EC 3. 2. 1.4),[對還原末端起作用的]纖維二糖水解酶(EC3.2. I.-)、殼聚糖酶(EC 3.2. I. 132)、內切-3-1,3-1,4-葡聚糖酶(EC 3.2. I. 73)活性。本文中,¢-葡糖苷酶(縮寫為BG) (EC 3.2.1.21)是能夠催化末端、非還原性
3-D-葡萄糖殘基水解並釋放P-D-葡萄糖的任何多肽。這樣的多肽可具有針對P-D-葡糖苷的廣泛特異性,並且也可以水解以下一種或多種P -D-半乳糖苷、a -L-阿拉伯糖苷、
3-D-木糖苷或3-D-巖藻糖苷。所述酶也可以被稱作苦杏仁苷酶、3-D-葡糖苷葡糖水解酶、纖維二糖酶或龍膽二糖酶。本文中,¢-(1,3) (1,4)_葡聚糖酶(EC 3. 2. I. 73)是能夠催化含有1,3_和1,
4-鍵的P-D-葡聚糖中I,4-P-D-葡糖苷鍵水解的任何多肽。此類多肽可作用於地衣澱粉和穀類P-D-葡聚糖,但不作用於僅含1,3_或1,4_鍵的P-D-葡聚糖。所述酶也可以被稱作地衣澱粉酶(Iicheninase),1,3-1,4-P-D-葡聚糖4-葡聚糖水解酶,P -葡聚糖酶,內切-¢-1, 3-1,4葡聚糖酶,地衣多糖酶(Iichenase)或混合鍵P -葡聚糖酶。這類酶的替代方案是被描述為內切-1,3(4)-0-葡聚糖酶的EC 3. 2. 1.6。當下述葡萄糖殘基在C-3處被自身取代時,這類酶水解P -D-葡聚糖酶中的I,3-鍵或I,4-鍵,所述葡萄糖殘基的還原基團涉及要水解的鍵。替代性的名稱包括內切-1,3-P-葡聚糖酶,昆布多糖酶,1,3-(1,3 ;1,4)-P-D-葡聚糖3(4)葡聚糖水解酶,底物包括昆布多糖,地衣澱粉和穀類P-D-葡聚糖。本發明的組合物可以包含任何半纖維素酶,例如內切木聚糖酶、¢-木糖苷酶、a -L-阿拉伯呋喃糖苷酶、a -D-葡糖醛酸糖苷酶、乙醯木聚糖酯酶、阿魏酸酯酶、香豆酸酯酶、a -半乳糖苷酶、3 -半乳糖苷酶、3 -甘露聚糖酶或3 -甘露糖苷酶。本文中,內切木聚糖酶(EC 3. 2. I. 8)是能夠催化木聚糖中1,4_@ -D-木糖苷鍵內切水解的任何多肽。所述酶也可以被稱作內切-1,4-0 -木聚糖酶或1,4-P-D-木聚糖木聚糖水解酶。一種替代是EC 3. 2. I. 136,葡糖醛酸阿拉伯木聚糖內切木聚糖酶,一種能夠水解葡糖醛酸阿拉伯木聚糖中1,4木糖苷鍵的酶。本文中,@ -木糖苷酶(EC 3. 2. I. 37)是能夠催化1,4_@ -D-木聚糖的水解、從非還原性末端去除相繼的D-木糖殘基的任何多肽。這類酶也可以水解木二糖。所述酶也可以被稱作木聚糖1,4-0 -木糖苷酶、1,4-0 -D-木聚糖木糖水解酶、外切-1,4-0 -木糖苷酶或木二糖酶。本文中,a -L-阿拉伯呋喃糖苷酶(EC 3. 2. I. 55)是能夠作用於a -L-阿拉伯呋喃糖苷、含(1,2)和/或(1,3)_和/或(1,5)_鍵的a-L-阿拉伯聚糖、阿拉伯木聚糖和阿拉伯半乳聚糖的任何多肽。所述酶也可以被稱作a-N-阿拉伯呋喃糖苷酶、阿拉伯呋喃糖苷酶或阿拉伯糖苷酶。本文中,a -D-葡糖醛酸糖苷酶(EC 3. 2. I. 139)是能夠催化以下形式反應的任何多肽a -D-葡糖醛酸苷+H2O =醇+D-葡糖醛酸酯。所述酶也被稱作a -葡糖醛酸糖苷酶或a-葡糖苷酸酶。這些酶也可水解可作為木聚糖中取代基存在的4-0-甲基化的葡糖醛酸。替代方式是EC 3.2. I. 131 :木聚糖a-I,2-葡糖醛酸糖苷酶,其催化a-l,2-(4-0-甲基)葡糖醛醯基連接的水解。本文中,乙醯基木聚糖酯酶(EC 3. I. I. 72)是能夠催化木聚糖和木寡糖脫乙醯化的任何多肽。此類多肽可催化來自多聚木聚糖、乙醯化木糖、乙醯化葡萄糖、a -萘基乙酸酯或對硝基苯基乙酸酯的乙醯基水解,但是一般不催化來自於三醯甘油的乙醯基水解。此類多肽一般不作用於乙醯化的甘露聚糖或果膠。本文中,阿魏酸酯酶(EC 3. I. I. 73)是能夠催化以下形式反應的任何多肽阿魏酸基-糖+H2O=阿魏酸酯+糖。糖可以是例如寡糖或多糖。其典型地可以催化來自酯化的糖的4-羥基-3-甲氧基肉桂醯(阿魏醯)基的水解,所述糖通常是「天然」底物中的阿拉伯糖,對硝基苯酚乙酸酯和阿魏酸甲基酯是典型地更弱的底物。所述酶也可以被稱作肉桂醯基酯水解酶,阿魏酸酯酶或羥基肉桂醯基酯酶。也可以被稱作半纖維素附屬酶,因為其 可幫助木聚糖酶和果膠酶分解植物細胞壁半纖維素和果膠。本文中,香豆醯基酯酶(EC 3. I. I. 73)是能夠催化以下形式反應的任何多肽香豆醯基-糖+H2O=香豆酸酯+糖。糖可以是例如寡糖或多糖。所述酶也可以被稱作反式-4-香豆醯基酯酶、反式-對香豆醯基酯酶、對香豆醯基酯酶或對香豆酸酯酶。所述酶也落入EC 3. I. I. 73中,從而也可以被稱作阿魏酸酯酶。本文中,a -半乳糖苷酶(EC 3. 2. I. 22)是能夠催化a -D-半乳糖苷(包括半乳糖寡糖、半乳甘露聚糖、半乳聚糖和阿拉伯半乳聚糖)中末端、非還原性a-D-半乳糖殘基水解的任何多肽。此類多肽也可以能夠水解a-D-巖藻糖苷。所述酶也可以被稱作蜜二糖酶。本文中,P -半乳糖苷酶(EC 3. 2. I. 23)是能夠催化P -D-半乳糖苷中末端非還原性P-D-半乳糖殘基水解的任何多肽。這樣的多肽也可以能夠水解a-L-阿拉伯糖苷。所述酶也可以被稱作外切- (I- > 4)-D-半乳聚糖酶或乳糖酶。本文中,^ -甘露聚糖酶(EC 3. 2. I. 78)是能夠催化甘露聚糖、半乳甘露聚糖和葡甘露聚糖中I,4-P-D-甘露糖苷鍵隨機水解的任何多肽。所述酶也可以被稱作甘露聚糖內切-1,4- P -甘露糖苷酶或內切-1,4-甘露聚糖酶。本文中,@ -甘露糖苷酶(EC 3. 2. I. 25)是能夠催化@ -D-甘露糖苷中末端非還原性P-D-甘露糖殘基水解的任何多肽。所述酶也可以被稱作甘露聚糖酶或甘露糖酶。本發明的組合物可包含任何果膠酶,例如內切多聚半乳糖醛酸酶,果膠甲基酯酶,內切-半乳聚糖酶,P -半乳糖苷酶,果膠乙醯基酯酶,內切-果膠裂合酶,果膠酸裂合酶,a -鼠李糖苷酶,外切-半乳糖醛酸酶,外切多聚半乳糖醛酸酯裂合酶,鼠李半乳糖醛酸聚糖水解酶,鼠李半乳糖醛酸聚糖裂合酶,鼠李半乳糖醛酸聚糖乙醯基酯酶,鼠李半乳糖醛酸聚糖半乳糖醛酸水解酶,木半乳糖醛酸酶。本文中,內切-多聚半乳糖醛酸酶(EC 3. 2. I. 15)是能夠催化果膠酸酯和其他半乳糖醛酸聚糖中l,4-a-D-半乳糖醛酸鍵的隨機水解的任何多肽。所述酶也可以被稱作多聚半乳糖醒酸酶果膠解聚酶,果膠酶,內切多聚半乳糖醒酸酶,果膠酶(pectolase),果膠水解酶,果膠多聚半乳糖醛酸酶,多聚-a -1,4-半乳糖醛酸苷聚糖水解酶,內切半乳糖醛酸酶;內切-D-半乳糖醛酸酶或多聚(I,4-a-D-半乳糖醛酸苷)聚糖水解酶。在本文中,果膠甲基酯酶(EC 3. I. I. 11)是能夠催化下述反應的任何酶果膠+nH2O = n甲醇+果膠酸酯。所述酶也已知為果膠酯酶(pectinesterase),果膠脫甲氧基酶,果膠甲氧基酶,果膠甲基酯酶,果膠酶,果膠酯酶(pectinoesterase)或果膠果醯基水解酶(pectinpectylhydroIase)。在本文中,內切-半乳聚糖酶(EC 3. 2. I. 89)是能夠催化阿拉伯半乳聚糖中1,4-3-D-半乳糖苷鍵的內切水解的任何酶。所述酶也已知為阿拉伯半乳聚糖內切-I,
4-3 -半乳糖苷鍵,內切-I,4- 0 -半乳聚糖酶,半乳聚糖酶,阿拉伯半乳聚糖酶或阿拉伯半乳聚糖4- 3 -D-半乳聚糖水解酶。本文中,果膠乙醯基酯酶在本文中被定義為下述任何酶,所述酶具有催化果膠GaIUA殘基羥基處乙醯基的脫乙醯基作用的乙醯基酯酶活性。本文中,內切-果膠裂合酶(EC 4. 2. 2. 10)是能夠催化(I —4)-a-D-半乳糖醛酸 聚糖甲基酯的清除性切割,得到在其非還原末端具有4_脫氧-6-0-甲基-a -D-半乳-4-糖醒醯基的寡糖。所述酶也可已知為果膠裂合酶,果膠反式消除酶(trans-eliminase),內切果膠裂合酶,多聚甲基半乳糖醛酸反式消除酶,果膠甲基反式消除酶,果膠酶(pectolyase),PL, PNL或PMGL或(I — 4) -6-0-甲基-a -D-半乳糖醛酸聚糖裂合酶。本文中,果膠酸裂合酶(EC 4. 2. 2. 2)是能夠催化(I — 4) - a -D-半乳糖醛酸聚糖的消除性切割,得到在其非還原性末端具有4-脫氧- a -D-半乳-4-糖醛醯基的任何酶。該酶也可以已知為多聚半乳糖醛酸反式消除酶,果膠酸反式消除酶,多聚半乳糖醛酸酯裂合酶,內切果膠甲基反式消除酶,果膠酸反式消除酶,內切半乳糖醛酸酯反式消除酶,果膠酸裂合酶,果膠裂合酶,a-l,4_D-內切多聚半乳糖醛酸裂合酶,PGA裂合酶,PPase-N,內切-a -1,4-多聚半乳糖醛酸裂合酶,多聚半乳糖醛酸裂合酶,果膠反式消除酶,多聚半乳糖醛酸反式消除酶或(I — 4)-a-D-半乳糖醛酸聚糖裂合酶。本文中,a -鼠李糖苷酶(EC 3. 2. I. 40)是能夠催化a a -L-鼠李糖苷或鼠李半乳糖醛酸聚糖中末端非還原性a-L-鼠李糖殘基水解的任何多肽。所述酶也可以已知為a -L-鼠李糖苷酶T,a -L-鼠李糖苷酶N或a -L-鼠李糖苷鼠李糖水解酶。本文中,外切-半乳糖醛酸酶(EC 3. 2. I. 82)是能夠從非還原性末端水解果膠酸、釋放二半乳糖醛酸的任何多肽。酶也可以已知為外切-多聚- a-半乳糖醒酸昔酶(exo-poly-a-galacturonosidase)、外切多聚半乳糖醒酸苷酶(exopolygalacturonosidase)或外切多聚聚半乳糖醒酸苷酶(exopolygalacturanosidase)。本文中,外切-半乳糖醛酸酶(EC 3.2. 1.67)是能夠催化以下的任何多肽(1,
4-0-0-半乳糖醛酸苷)11+1120= (1,4-0-0-半乳糖醛酸苷)11_1+0-半乳糖醛酸酯。所述酶也可以已知為半乳糖醒1,4_ a -半乳糖醒酸苷酶(galacturanl, 4_ a -galacturonidase),外切多聚半乳糖醛酸酶,多聚(半乳糖醛酸酯)水解酶,外切-D-半乳糖醛酸酶,外切-D-半乳糖醛酸聚糖酶,外切多聚-D-半乳糖醛酸酶或多聚(I,4-a-D-半乳糖醛酸苷)半乳糖醛酸水解酶。本文中,外切多聚半乳糖醛酸酯裂合酶(EC 4. 2. 2. 9)是能夠催化從果膠酸(即脫脂化的果膠)的還原末端消除性切割4- (4-脫氧-a -D-半乳-4-糖醛醯基)-D-半乳糖醛酸酯的任何多肽。所述酶可已知為果膠酸二糖裂合酶,果膠酸外切裂合酶,外切果膠酸反式消除酶,外切果膠酸裂合酶,外切多聚半乳糖醛酸-反式-消除酶,PATE,外切-PATEjF切-PGL或(I — 4) - a -D-半乳糖醛酸聚糖還原末端二糖裂合酶。本文中,鼠李半乳糖醛酸聚糖水解酶是能夠在嚴格交替出現的鼠李半乳糖醛酸聚糖結構中以內切方式水解半乳基糖醛酸酸和吡喃鼠李糖基之間鍵的任何多肽,所述鼠李半乳糖醛酸聚糖結構由二糖[(1,2-a-L-鼠李糖基_(1,4)-a-半乳糖醛酸]組成。本文中,鼠李半乳糖醛酸聚糖裂合酶是能夠以內切方式在鼠李半乳糖醛酸聚糖中通過P -消除切割a -L-Rhap-(I — 4) - a -D-GalpA鍵的任何多肽。本文中,鼠李半乳糖醛酸聚糖乙醯基酯酶是能夠催化鼠李半乳糖醛酸聚糖中交替出現的鼠李糖和半乳糖醛酸殘基主鏈的脫乙醯化的任何多肽。本文中,鼠李半乳糖醛酸聚糖半乳糖醛酸水解酶是能夠以外切方式、從嚴格交替出現的鼠李半乳糖醛酸聚糖結構的非還原性末端水解半乳糖醛酸的任何多肽。本文中,木半乳糖醛酸酶是通過以內切方式切割¢-木糖取代的半乳糖醛酸主鏈·而作用於木半乳糖醛酸聚糖的任何多肽。所述酶也可以已知為木半乳糖醛酸聚糖水解酶。本文中,a -L-阿拉伯糖呋喃糖苷酶(EC 3. 2. I. 55)是能夠作用於a -L-阿拉伯呋喃糖苷、含有(1,2)和/或(1,3)_和/或(1,5)_鍵的a-L-阿拉伯聚糖、阿拉伯木聚糖和阿拉伯半乳聚糖的任何多肽。所述酶也可以被稱作a-N-阿拉伯糖呋喃糖苷酶,阿拉伯糖呋喃糖苷酶或阿拉伯糖苷酶。本文中,內切阿拉伯聚糖酶(EC 3. 2. I. 99)是能夠催化1,5_阿拉伯聚糖中1,
5-a -阿拉伯呋喃糖苷鍵內切水解的任何多肽。所述酶也已知為內切阿拉伯糖酶,阿拉伯聚糖內切-I,5- a -L-阿拉伯糖苷酶,內切-I,5- a -L-阿拉伯聚糖酶,內切-a -I,5-阿拉伯聚糖酶;內切-阿拉伯聚糖酶或I,5-a-L-阿拉伯聚糖1,5-a-L-阿拉伯聚糖水解酶。本發明的組合物將一般包含至少一種纖維素酶和/或至少一種半纖維素酶和/或至少一種果膠酶(所述酶之一是根據本發明的多肽)。本發明的組合物可包含纖維二糖水解酶,內切葡聚糖酶和/或3-葡糖苷酶。此類組合物也可以包含一種或多種半纖維素酶和/或一種或多種果膠酶。本發明的組合物中可以存在澱粉酶、蛋白酶、脂肪酶、木質酶、己糖基轉移酶葡糖醛酸糖苷酶中的一種或多種(例如兩種、三種、四種或所有)。「蛋白酶」包括水解肽鍵的酶(肽酶),以及水解肽和其它部分如糖之間鍵的酶(糖肽酶)。許多肽酶根據EC 3. 4表徵,適合在本發明中使用並且通過引用併入本文。一些特定類型的蛋白酶包括半胱氨酸蛋白酶(包括胃蛋白酶,木瓜蛋白酶)和絲氨酸蛋白酶(包括糜蛋白酶,羧肽酶和金屬內切蛋白酶)。「脂肪酶」包括水解脂質、脂肪酸和醯基甘油酯(包括磷酸甘油酯)、脂蛋白、二醯基甘油等等的酶。在植物中,脂質被用作結構組分,來限制水損失和病原體感染。這些脂質包括來自脂肪酸的蠟質,以及角質和木栓素(suberin)。「木質酶」包括能夠水解或分解木質素聚合物結構的酶。能夠分解木質素的酶包括木質素過氧化物酶、錳過氧化物酶、漆酶和阿魏酸酯酶,和在本領域中已知解聚或以其他方式分解木質素聚合物的描述的其他酶。還包括在內的是能夠水解在半纖維素糖(主要是阿拉伯糖)和木質素之間形成的鍵的酶。木質酶包括但不限於以下組的酶木質素過氧化物酶(EC1. 11. 14)、錳過氧化物酶(EC I. 11. I. 13)、漆酶(EC I. 10. 3. 2)和阿魏酸酯酶(EC3. I. I. 73)。「己糖基轉移酶」(2. 4. I-)包括能夠轉移糖基、更特定地轉移幾糖基的酶。除了將糖基從含糖基的供體轉移至另一含糖基的化合物受體以外,所述酶還能夠將糖基轉移至作為受體的水。所述反應也已知為水解反應而不是轉移反應。可以在本發明中使用的己糖基轉移酶的例子是¢-葡聚糖基轉移酶。此類酶可以能夠催化(1,3) (1,4)葡聚糖和/或纖維素和/或纖維素降解產物的降解。「葡糖醛酸糖苷酶」包括催化葡糖醛酸苷(例如P -葡糖醛酸苷)水解得到醇的酶。許多葡糖醛酸糖苷酶已被表徵,並可適合在本發明中使用,例如3 -葡糖醛酸糖苷酶(EC 3. 2. I. 31),透明質酸酶葡糖醛酸糖苷酶(EC3. 2. I. 36),葡糖醛醯基-二硫葡糖胺葡糖醛酸糖苷酶(3. 2. I. 56),苷草酸P -葡糖醛酸糖苷酶(3. 2. I. 128)或a -D-葡糖醛酸糖苷酶(EC 3. 2. I. 139)。
本發明的組合物可包含擴展蛋白多肽或擴展蛋白樣多肽,如膨脹因子(swollenin)(見 Salheimo et al. , Eur. I. Biohem. 269,4202-4211, 2002)或膨脹因子樣多肽。擴展蛋白涉及植物細胞生長期間細胞壁結構的鬆弛。已經提出擴展蛋白破壞纖維素和其他細胞壁多糖之間的氫鍵,但不具有水解活性。認為它們通過這種方式允許纖維素纖維的滑動和細胞壁的擴大。一種擴展蛋白樣蛋白——膨脹因子,含有N端碳水化合物結合模塊家族I結構域(CBD)和C端擴展蛋白樣結構域。就本發明的目的而言,擴展蛋白樣蛋白或膨脹因子樣蛋白可包含此類結構域中的一種或兩種和/或可破壞細胞壁的結構(如破壞纖維素結構),任選地不生產可檢測量的還原糖。本發明的組合物可包含纖維素整合蛋白、支架蛋白或支架樣蛋白的多肽產物,例如分別來自 Clostridium thermocellum 或 Clostridiumcellulolyicum 的 CipA 或 CipC0支架蛋白和纖維素整合蛋白是多功能整合亞基,其可將分解纖維素的亞基組合進多酶複合物中。這通過兩類互補的結構域(即支架蛋白上的內聚結構域(cohesiondomain)和每個酶單元上的錨定結構域(dockerindomain))的相互作用完成。支架蛋白亞基還帶有介導纖維體與其底物結合的纖維素結合模塊(CBM)。就本發明的目的而言,支架蛋白或纖維素整合蛋白可包含此類結構域中的一種或兩種。本發明的組合物可包含纖維素誘導的蛋白或調節蛋白,例如由來自Trichodermareesei/Hypocrea jacorina的cipl或cip2基因或類似基因所編碼的蛋白(見Foreman etal.,J. Biol. Chem. 278 (34) 31988-31997,2003)。這些基因的多肽產物是雙模塊蛋白,其含有纖維素結合模塊和其功能或活性不與已知的糖基水解酶家族相關的結構域。而纖維素結合模塊的存在和這些基因的表達與纖維素酶元件的共同調節表明在生物質降解中具有潛在作用的先前未被認識的活性。本發明的組合物可包含上文提到的多肽種類的任一成員、一個多肽種類的若干成員、或這些多肽種類的任何組合。在本發明的組合物可以由來自以下的多肽(例如酶)組成(1)供應商;(2)克隆基因表達的多肽,例如酶;(3)複合發酵液(例如由培養基中微生物菌株的生長得到的,其中所述菌株向培養基中分泌蛋白和酶);(4)如(3)中生長的菌株的細胞裂解物;和/或(5)植物材料表達的多肽,例如酶。本發明組合物中不同的多肽,例如酶可得自不同的來源。多肽的用途根據本發明的多肽和多肽組合物可用於許多不同的應用中。例如,它們可被用於生產可發酵的糖。可發酵的糖隨後可(作為生物燃料方法的部分)被轉化成沼氣或乙醇、丁醇、異丁醇、2 丁醇或其他合適的物質。或者,多肽及其組合物可(例如在食物製品的生產中,在洗滌劑組合物中,在造紙工業和製漿工業中,和在抗菌配製物中,在藥物製品例如潤喉片、牙膏和漱口水中)用作酶。這些用途中的一些將在下文中更詳細地闡述。在下文所述地用途和方法中,上述組合物的組分可共同(即本身作為單一組合物)或單獨或先後提供。本發明還涉及根據本發明的纖維素酶增強多肽和包含此類酶的組合物在工業方法中的用途。 儘管用這些方法獲得了長期的經驗,但是根據本發明的纖維素酶增強多肽可具有優於目前所使用的酶的大量顯著優點。根據具體的應用,這些優點可包括下述方面,例如更低的生產成本,更高的底物特異性,降低的抗原性,更少的不想要的副活性,在合適的微生物、更合適的pH和溫度範圍中生產時更高的產量,不受疏水的、來自木質素的產物抑制,或更少的產物抑制,或在食品工業情況下最終產物更好的口味或質地,以及食品級別和猶太教戒律方面。原則上,纖維素酶增強多肽或本發明的組合物可以在任何下述方法中使用,所述方法需要處理包含多糖的材料。因此,本發明的多肽或組合物可以在多糖材料的處理中使用。本文中,多糖材料是下述材料,所述材料包含一種或更典型地包含多於一種多糖或者基本由所述多糖組成。典型地,植物和源自它們的材料包含大量非澱粉的多糖材料。因此,本發明的多肽可以用於植物或真菌材料或源自它們的材料的處理。木質纖維素植物非澱粉多糖材料的一個重要的組分是木質纖維素(在本文中也稱作木質纖維素生物質)。木質纖維素是包含纖維素和半纖維素和木質素的植物材料。碳水化合物聚合物(纖維素和半纖維素)與木質素通過氫鍵和共價鍵緊密結合。因此,本發明的多肽可以用於木質纖維素材料的處理。本文中,木質纖維素材料是包含木質纖維素或基本由木質纖維素組成的材料。因此,在用於處理非澱粉的多糖的本發明方法中,非澱粉的多糖可以是木質纖維素材料/生物質。因此,本發明提供了用於處理包含非澱粉多糖的底物的方法,其中所述處理包括纖維素和/或半纖維素和/或果膠物質的降解和/或水解和/或改性。降解在本文上下文中表示導致產生纖維素和/或半纖維素和/或果膠物質的水解產物(即與類似的未經處理的非澱粉多糖中存在的相比,由於處理而存在更短鏈的糖)的處理。因此,降解在本文上下文中可以導致寡糖和/或糖單體的釋放。所有植物都含有非澱粉的多糖,同樣,基本上所有來自植物的多糖材料也含有非澱粉的多糖。因此,在本發明的用於處理包含非澱粉多糖的底物的方法中,所述底物可以以植物或源自植物的材料或包含植物或源自植物的材料的形式提供,例如以植物漿體、植物提取物、食品或其成分、織物、紡織品或衣物。
適合在本發明的方法中使用的木質纖維素生物質包括生物質,並可包括原生生物質(virgin biomass)和/或非原生生物質如農業生物質,商業有機物,建築和拆除碎片,市政固體廢棄物,廢紙和庭院廢棄物。常見的生物質形式包括樹木,灌木從(shrubs)和草,小麥,小麥秸,甘蔗渣,玉米,玉米殼,玉米芯(corn cobs),玉米粒(包括來自玉米粒的纖維),來自穀物如玉米、小麥和大麥研磨(包括溼磨和幹磨)的通常稱作麩或纖維的產物和副產物,以及市政固體廢棄物,廢紙和庭院廢棄物。生物質也可以是,但不限於草本材料,農業殘餘物,林業殘餘物,市政固體廢棄物,廢紙,和紙漿和造紙廠殘餘物。「農業生物質」包括樹枝,灌木(bushes),藤蔓(canes),玉米和玉米殼,能量作物,森林,水果,鮮花,穀物,草,草本作物,樹葉,樹皮,針葉,原木,根,樹苗,短期輪種木本作物(short-rotationWoody crops),灌木叢,柳枝稷,樹木,蔬菜,水果皮,蔓藤(vines),甜菜眾,小麥麩皮(wheatmidlings),燕麥殼,和硬木材或軟木材(不包括帶有有害材料的木材)。另外,農業生物質包括由農業加工產生的有機廢棄物材料,所述農業加工包括農業和林業活動,特定地包括林業木材廢棄物。農業生物質可以是前述任一或其任何組合或混合物。合適的生物質的其他例子是果園底料,樹叢,磨坊廢棄物,城市木材廢棄物,市政廢棄物,伐木廢棄物,森林疏 伐廢棄物,短期輪種木本作物,工業廢棄物,小麥秸,燕麥秸,水稻秸,大麥秸,黑麥秸,亞麻秸,大豆殼,稻殼,水稻秸,玉米谷蛋白飼料,燕麥殼,甘蔗,玉米秸杆,玉米杆,玉米芯,玉米殼,牧場草,磨擦禾,狐尾草;甜菜漿,柑橘果實漿,種子殼,纖維素動物糞便,草坪修剪廢棄物,棉花,海藻,樹木,灌木叢,草,小麥,小麥秸,甘蔗渣,玉米,玉米殼,玉米棒,玉米粒,來自玉米粒的纖維,來自穀物溼磨或幹磨的產物和副產物,市政固體廢棄物,廢紙,庭院廢棄物,草本材料,農業殘餘物,林業殘餘物,市政固體廢棄物,廢紙,紙漿,造紙廠殘餘物,樹枝,灌木,甘蔗,玉米,玉米殼,能源作物,森林,水果,鮮花,穀物,草,草本作物,樹葉,樹皮,針葉,原木,根,樹苗,灌木叢,柳枝稷,樹木,蔬菜,水果皮,藤蔓,甜菜眾,小麥麩皮,燕麥殼,硬木材或軟木材,由農業加工產生的有機廢棄物材料,林業木材廢棄物,或其中任意兩種或更多的組合。除了已經在食物和飼料或造紙和製漿工業中加工的原生生物質或原料以外,生物質/原料可額外地用熱、機械和/或化學改性或此類方法的任何組合預處理,從而增強酶降解。預處理為了以任何本領域已知的方式增強底物對酶水解的可接近性和/或水解半纖維素和/或溶解半纖維素和/或纖維素和/或木質素,在酶處理之前,任選地可用熱、機械、和/或化學改性或此類方法的任何組合對原料預處理。預處理可包括將木質纖維素材料暴露於(熱)水、蒸汽(蒸汽爆破)酸、鹼、溶劑、熱、過氧化物、臭氧、機械擊打、粉碎、研磨或快速降壓,或其中任何兩種或更多的組合。所述化學預處理通常與熱預處理(例如150-220°C之間I到30分鐘)組合。預糖化預處理步驟後,可以使用涉及用酶或酶混合物孵育的液化/水解或預糖化步驟。預糖化步驟可以在許多不同的溫度下進行,但是優選預糖化在最適合要應用的酶混合物的溫度下,或針對要應用的酶預測的酶最適度下進行。預糖化步驟的溫度範圍可以是從約10°C到約 95°C,約 20°C到約 85°C,約 30°C到約 70°C,約 40°C到約 60°C,約 37°C到約 50°C,優選地約37°C到約80 0C,更優選地約60-70 V,進一步更優選地在65°C左右。預糖化混合物的pH可以在從約2. 0到約10. 0,但是優選地約3. 0到約7. 0,更優選地約4. 0到約6. 0,進一步更優選地約4. 0到約5. O。另外,pH可以被調節以最大化酶活性,並且可以通過添加酶來調節。液化/水解或預糖化步驟反應可以進行數分鐘到數小時,例如從約I小時到約120小時,優選地從約2小時到約48小時,更優選地從約2小時到約24小時,最優選地從約2小時到約6小時。纖維素酶處理可進行數分鐘到數小時,例如從約6小時到約120小時,優選地約12小時到約72小時,更優選地約24小時到48小時。糖化本發明提供了由木質纖維素材料生產糖的方法,所述方法包括將本發明的多肽與 木質纖維素材料接觸。此類方法允許由木質纖維素生物質生產游離的糖(單體)和/或寡糖。這些方法涉及用本發明的多肽或組合物將木質纖維素生物質轉化成游離糖和小寡糖。將複合碳水化合物如木質纖維素轉化為糖的方法優選地允許轉化成可發酵的糖。此類方法可以被稱作「糖化」。因此,本發明的方法可導致一種或多種己糖和/或戊糖(如葡萄糖、木糖、阿拉伯糖、半乳糖、半乳糖醛酸、葡糖醛酸、甘露糖、鼠李糖、核糖和果糖中的一種或多種)的釋放。因此,本發明的另一方面包括下述方法,所述方法與其它酶或物理處理(例如溫度和pH) —起利用上文所述本發明的組合物的多肽,將木質纖維素植物生物質轉化成糖和寡糖。儘管組合物已作為單一混合物被討論,但是認為酶可以先後添加,其中溫度、pH和其他條件可以被改變,以提高每種個體酶的活性。或者,可以針對酶混合物測定最適PH和溫度。酶在任何適當的條件下與底物反應。例如,酶可以在約25°C,約30°C,約35°C,約 37°C,約 40°C,約 45°C,約 50°C,約 55°C,約 60°C,約 65°C,約 70°C,約 75°C,約 80°C,約85 °C,約90 V或更高下孵育。也就是說,它們可以在從約20 V到約95 °C下,例如在低到中等離子強度的緩衝液中和/或從低到中性PH下孵育。「中等離子強度」表示對任何單個離子組分而言,緩衝液具有約200毫摩爾(mM)或更少的離子濃度。pH可在從約pH 2. 5,約pH3.0,約 pH 3. 5,約 pH 4.0,約 pH 4. 5,約 pH 5,約 pH 5. 5,約 pH 6,約 pH 6. 5,約 pH 7,約 pH
7.5,約pH 8.0,到約pH 8. 5的範圍內。通常,pH範圍會從約pH 3. 0到約pH 7。為了生產乙醇,優選酸性介質,例如PH = 4,而為了生產沼氣,期望中性pH例如pH = 7。在這些條件下孵育酶組合導致大量糖從木質纖維素釋放或解離。大量表示可利用的糖的至少20%、30%、40%、50%、60%、70%、80%、90%、95% 或更多。多肽(例如酶)可以在微生物、酵母、真菌、細菌或植物中外源產生,然後分離並加入例如木質纖維素原料中。或者,酶可以被生產但不分離,並且將粗製細胞群發酵液或植物材料(如玉米杆)等等可被加入例如原料中。或者,可以處理粗製細胞群或酶生產培養基或植物材料,以預防進一步的微生物生長(例如通過加熱或添加抗微生物劑),然後添加至例如原料中。這些粗製酶混合物可包含生產酶的生物。或者,酶可以在下述發酵中生產,所述發酵施用原料(例如玉米杆)對生產酶的生物提供營養。通過這種方式,生產酶的植物自身可以發揮木質纖維素原料的作用,並且被添加進木質纖維素原料中。糖的發酵可發酵的糖可以被轉化成有用的增值的(value-added)發酵產物,其非限制性例子包括胺基酸、維生素、藥物、動物飼料補充劑、特種化學品(specialty chemicals)、化學品原料、塑料、溶劑、燃料或其他有機聚合物、乳酸和乙醇,包括燃料乙醇。糖尤其可被用作用於原料,用於發酵成化學品、塑料、例如琥珀酸和(生物燃料),包括乙醇、甲醇、丁醇合成液體燃料和沼氣。例如,在本發明的方法中,酶或酶的組合作用於發揮原料作用的木質纖維素底物或植物生物質上,從而將所述複合底物轉化成簡單的糖和寡糖,用於生產乙醇或其它有用的發酵產物。
從生物量釋放的糖可被轉化成有用的發酵產物,例如包括但不限於,胺基酸、維生素、藥物、動物飼料補充劑、特種化學品,化學品原料,塑料,和乙醇,包括燃料乙醇。因此,本發明提供了用於製備發酵產物的方法,所述方法包括a.使用本文所述的方法降解木質纖維素;以及b.對得到的材料進行發酵;由此製備發酵產物。發酵可在需氧或厭氧條件下進行。優選地,所述方法在微需氧或氧受限的條件下進行。厭氧發酵方法在本文中被定義為在不存在氧時運行的,或者其中基本不消耗氧,優選地消耗約5或更少、約2. 5或更少、或約lmmol/L/h或更少氧,並且其中有機分子既作為電子供體又作為電子受體的發酵方法。氧受限的發酵方法是其中氧消耗受到從氣體到液體的氧轉移限制的方法。氧限制程度由進入氣流的量和組成以及使用的發酵設備的實際混合/物料轉移性質決定。優選地,在氧受限條件下進行的方法中,氧消耗速率至少約5. 5,更優選地至少約6,進一步更優選地至少約7mmol/L/h。用於製備發酵產物的方法可任選地包括發酵產物的回收。SSF發酵和糖化也可以按照同時糖化和發酵(SSF)的模式進行。這種模式的優點之一是減少對酶促水解的糖抑制(對纖維素酶的糖抑制由Caminal B&B Vol XXVIIPpl282-1290 描述)。發酵產物可以根據本發明生產的發酵產物包括胺基酸、維生素、藥物、動物飼料補充劑、特種化學品、化學原料、塑料、溶劑、燃料或其他有機聚合物、乳酸和乙醇,包括燃料乙醇(術語「乙醇」被理解為包括乙醇或乙醇和水的混合物)。可以通過本發明的方法生產的特定的增值產物包括但不限於生物燃料(包括乙醇和丁醇和沼氣);乳酸;塑料;特種化學品;有機酸,包括檸檬酸、琥珀酸、延胡索酸、衣康酸和順丁烯二酸;3_羥基-丙酸,丙烯酸;乙酸;1,3-丙烷-二醇;乙烯;丙三醇;溶劑;動物飼料補充劑;藥物,如¢-內醯胺抗生素或頭孢菌素;維生素;胺基酸,如賴氨酸,甲硫氨酸,色氨酸,蘇氨酸和天冬氨酸;工業酶,如蛋白酶,纖維素酶,澱粉酶,葡聚糖酶,乳糖酶,脂肪酶,裂合酶,氧化還原酶,轉移酶或木聚糖酶;和化學原料。沼氣本發明還提供了本文所述的多肽或組合物在用於製備沼氣的方法中的用途。沼氣典型地表示由有機物質(例如含有非澱粉碳水化合物的材料)在不存在氧時生物降解而生產的氣體。沼氣源自生物源材料,並且是一種生物燃料。一種沼氣由可生物降解的材料(例如生物質、糞便或汙水、市政廢棄物和能源作物)的厭氧消化或發酵生產。這種沼氣主要由甲烷和二氧化碳組成。氣體甲烷可以用氧燃燒或氧化。空氣含有21%的氧。該能量釋放允許沼氣被用作燃料。在許多國家中沼氣可被用作低成本燃料,用於任何加熱目的,例如烹飪。其也可以被用在現代廢棄物管理設備中,在那裡其可以被用於運行任何類型的熱引擎,從而產生機械力或電力。微生物沼氣生產的第一步由聚合物和複合底物(例如非澱粉碳水化合物)的酶促降解組成。因此,本發明提供了用於製備沼氣的方法,其中包含非澱粉碳水化合物的底物與·本發明的多肽或組合物接觸,從而產生可發酵的材料,所述可發酵的材料可由生物(例如微生物)轉化成沼氣。在此類方法中,本發明的多肽可由生物提供,所述生物例如是表達此類多肽的微生物。酶在食物製品中的用途本發明的多肽和組合物可在下述方法中使用,所述方法加工植物材料,從而降解或改性植物或真菌材料細胞壁的纖維素或半纖維素或果膠物質組分。此類方法可用於製備食物製品。因此,本發明提供了製備食物製品的方法,所述方法包括在食物製品的製備期間摻入本發明的多肽或組合物。本發明還提供了加工植物材料的方法,所述方法包括將植物材料與本發明的多肽或組合物接觸,從而降解或改性(植物)材料中的纖維素。優選地,植物材料是植物漿體或植物提取物,例如汁液。植物和含有纖維素/半纖維素/果膠物質的材料包括植物漿體、植物部分和植物提取物。在本發明的上下文中,來自植物材料的提取物是可通過提取(機械和/或化學)、加工或其他分離技術源自植物材料的任何物質。提取物可以是汁液、花蜜、鹼或由其製成的濃縮物。植物材料可包含或源自蔬菜,例如胡蘿蔔、芹菜、洋蔥、豆類或豆科植物(大豆、黃豆、豌豆)或水果,例如梨果或帶種子的水果(seed fruit)(蘋果、梨、柑橘等)、葡萄、西紅柿、柑橘(橙、檸檬、枸櫞、蜜桔)、甜瓜、洋李、櫻桃、黑醋慄、紅醋慄、覆盆子、草莓、蔓越莓、菠蘿和其他熱帶水果,樹及其部分(例如花粉,來自松樹),或穀物(燕麥、大麥、小麥、玉米、水稻)。(要被水解的)材料也可以是農業殘餘物,例如甜菜漿、玉米芯(com cobs)、小麥秸、(粉碎的)堅果殼,或可再生材料,例如(廢)紙。本發明的多肽因此可被用於處理植物材料,包括植物漿體和植物提取物。它們也可以被用於處理液體或固體食品或可食用的食品成分,或在植物油、澱粉的提取中使用,或被用作食物中的增稠劑。典型地,本發明的多肽被用作上文所述的組合物/酶製劑。所述組合物通常會被添加至可通過例如機械加工(如擠壓或研磨)植物材料獲得的植物漿體中。組合物與植物的孵育會典型地進行從10分鐘到5小時、例如30分鐘到2小時、優選地約I小時的時間。加工溫度優選地從約10°C到約55°C,例如從約15°C到約25°C,任選地約20°C,每噸要處理的材料可以使用從約IOg到約300g,優選地從約30g到約70g,任選地約50g的酶。使用的所有酶或它們的組合物可以被先後或同時添加至植物漿體中。根據酶製劑的組成,植物材料可首先被浸潰(例如至純淨)或液化。使用本發明的多肽,可以改進加工參數,例如提取產率、提取物粘度和/或提取物品質。或者,或除上文以外,本發明的多肽可以被添加至通過壓榨或液化植物漿體而獲得的粗製汁液中。在劑量、溫度和持續時間方面,粗製汁液的處理應與植物漿體以類似的方式進行。另外,可以包括其他酶,例如先前討論的酶。典型的孵育條件如前一段中所述。一旦用本發明的多肽孵育了粗製汁液,則隨後可以離心或過濾(超濾)汁液以生
產最終產物。用本發明的多肽處理後,可以對(終)產物進行熱處理,例如在約100°C下進行約I分鐘到約I小時,在使本發明多肽部分或完全失活的條件下進行。 含有本發明多肽的組合物也可以在水果泥或蔬菜泥的製備期間使用。在烘焙中,多肽可改善麵團結構,修飾其粘性或柔韌性,改進麵包體積和/或碎屑結構,或賦予更好的質地特徵,例如斷裂品質、成條品質或碎屑品質。本發明因此涉及用於製備麵團或基於穀物的食物製品的方法,所述方法包括向麵團中摻入本發明的多肽或組合物。相對於其中未摻入多肽的麵團或基於穀物的食物製品而言,這可以改進麵團或得自麵團的基於穀物的食物製品的一種或多種特性。根據本發明的基於穀物的食物製品的製備可包括本領域中已知的步驟,例如煮沸、乾燥、油炸、蒸或烘焙獲得的麵團。由煮過的麵團製成的製品是例如煮過的麵條、餃子,由炸過的麵團製成的製品是例如麵包圈、beignets、油炸麵條,由蒸過的麵團製成的製品是例如蒸慢頭和蒸面,由乾燥的麵團製成的製品是義大利麵和乾麵條,由烘焙的麵團製成的製品是麵包、曲奇、蛋糕。術語「經改進的特性」在本文中被定義為相對於其中未摻入根據本發明的多肽的麵團或製品而言,被根據本發明的多肽作用改進的麵團和/或由麵團獲得的製品、尤其是基於穀物的食物製品的任何特性。經改進的特性可包括但不限於,提高的麵團強度,提高的麵團彈性,提高的麵團穩定性,經改進的麵團可加工性,經改進的麵團醒發抗性,降低的麵團粘度,經改進的麵團延伸性,提高的基於穀物的食物製品體積,降低的基於穀物的食物製品發泡性,經改進的烘焙製品碎屑結構,經改進的基於穀物的食物製品的柔軟性,經改進的基於穀物的食物製品的風味,經改進的基於穀物的食物製品的抗老化性(anti-staling)。與義大利麵和麵條類型的基於穀物的製品相關的經改進的特性是例如經改進的硬度,降低的粘度,經改進的凝聚性和降低的烹調損失。經改進的特性可通過添加或不添加本發明的多肽而製備的麵團和/或基於穀物的食物製品的比較來確定。感官品質可以使用烘焙工業中公認的程序來評價,並且可包括使用例如受過訓練的口味測試者小組。術語「麵團」在本文中被定義為足夠堅硬到揉捏或滾動的穀物粉和其他成分的混合物。穀物的例子是小麥、黑麥、玉米、玉蜀黍、大麥、水稻、米粒(groats)、蕎麥和燕麥。小麥在此處和下文中旨在包括Triticum屬的所有種,例如aestivum、durum和/或spelta。合適的其他成分的例子是根據本發明的纖維素酶增強多肽,額外的酶,化學添加劑和/或加工助劑。麵團可以是新鮮的、冷凍的、預製備的或預烘焙的。來自上述成分的麵團的製備是本領域公知的,並且包括將所述成分與加工助劑混合,和一個或多個塑型(moulding)和任選的發酵步驟。凍麵團的製備由Kulp andLorenz在Frozen and Refrigerated Doughsand Batters 中描述。術語「基於穀物的食物製品」在本文中被定義為由麵團製備的任何製品,無論具有軟的特徵還是具有易碎的特徵。可有利地通過本發明生產的基於穀物的食物製品的例子(無論是白色、淺色或深色類型)是麵包(尤其是白麵包、全麥麵包或黑麥麵包),典型地是麵包片或麵包卷的形式,法棍型麵包,義大利麵,麵條,麵包圈,百吉餅,蛋糕,皮塔餅(pitabread),玉米餅(tortillas),墨西哥卷餅(tacos),蛋糕,煎餅,餅乾,曲奇,派皮(piecrusts),蒸麵包(steamed bread)和脆麵包(crispbread)等等。術語「烘焙製品」在本文中被定義為通過烘焙麵團製備的任何基於穀物的食物制
品。 非澱粉多糖(NSP)能夠提高食糜(digesta)的粘度,這可進而降低營養可用度和動物表現。本發明的纖維素酶增強多肽的使用能夠提高磷利用,以及動物食糜期間的用離子礦物質和多肽。對飼料添加特定的養分會改進動物消化並從而降低飼料成本。目前正在使用大量飼料添加劑,並且持續開發出新的概念。使用特定的酶(例如非澱粉碳水化合物降解酶)能夠分解纖維,釋放能量,以及提高蛋白質可消化性,因為纖維分解時有更好的蛋白質可達性。藉此,飼料成本能夠降低,並且飼料中的蛋白質水平也能降低。非澱粉多糖(NSP)事實上也存在於植物來源的所有飼料成分中。NSP利用較差,並且在溶解時能夠顯示對消化的不良影響。外源酶能夠有助於更好地利用這些NSP,並因此降低任何抗營養效應。本發明的非澱粉碳水化合物降解酶可在基於穀物的家禽膳食中被用於該目的,或者在更小的程度上用於豬和其他物種。本發明的非澱粉碳水化合物降解多肽/酶(包含本發明多肽/酶的組合物)可在洗滌劑工業中使用,例如用於從洗衣房中去除基於碳水化合物的汙點。洗滌劑組合物可包含本發明的多肽/酶,另外包含一種或多種纖維素,半纖維素酶,果膠酶,蛋白酶,脂肪酶,角質酶,澱粉酶或碳水化合物酶。酶在洗滌劑組合物中的用途包含本發明多肽或組合物的洗滌劑組合物可以是任何便利的形式,例如糊劑、凝膠、粉末或液體。液體洗滌劑可以是水性的,典型地含有最多約70%的水和從約0到約30%的有機溶劑或非水性材料。此類洗滌劑組合物可例如被配製為手洗洗滌劑組合物或機洗洗滌劑組合物,包括適用於預處理髒汙織物的洗衣添加組合物和漂洗添加的織物柔軟劑組合物,或被配製成用於一般居家硬表面清潔操作的洗滌劑組合物,或被配製用於手洗或機洗的洗碗操作。通常,酶的特性應當與所選擇的洗滌劑相容(例如pH-最適度,與其他酶和/或非酶成分的相容性等等),並且酶應當以有效量存在。洗滌劑組合物可包含表面活性劑,例如陰離子或非離子型表面活性劑,洗滌劑增量組分或複合劑,一種或多種聚合物,漂白系統(例如H2O2源)或酶穩定劑。洗滌劑組合物也可包含任何其他常規的洗滌劑成分,例如護理劑包括粘土,泡沫加強劑,sud抑制劑,抗腐蝕劑,土壤懸浮劑,土壤再沉澱劑,染料,殺菌劑,光學增亮劑,助水溶物,晦暗抑制劑(tarnish inhibitor)或香料。酶在造紙和漿體加工中的用途本發明的多肽可用於造紙和製漿工業,尤其是漂白過程中,以增強被漂白的漿體的亮度,從而可以降低漂白階段中使用的氯,並且提高漿體在再循環造紙方法中的自由度(Eriksson, K. E. L. , Wood Science andTechnology 24(1990) :79-101 ;Paice, et al.,Biotechnol. and Bioeng. 32(1988) :235_239and Pommier et al.,Tappi Journal(1989)187-191)。另外,本發明的多肽或組合物可被用於處理木質纖維素漿體,從而改進其可漂白性。因此可以降低獲得令人滿意的漿體漂白所需要的氯量。本發明的多肽或組合物可被用於下述方法中,所述方法降低含纖維素的織物變得粗糙的速率,或降低含纖維素的織物的粗糙度,所述方法包括用上文所述的多肽或組合物 處理含纖維素的織物。本發明還涉及為有色的含纖維素的織物提供色彩澄清的方法,所述方法包括用上文所述的多肽或組合物處理有色的含有纖維素的織物,和在有色的含纖維素的織物中提供局部變化的方法,所述方法包括用上文所述的多肽或組合物處理有色的含纖維素的織物。本發明的方法可以通過在洗滌期間處理含纖維素的織物來進行。然而,需要時織物的處理也可以在浸泡或漂洗期間進行,或簡單地通過將上文所述的多肽或組合物添加至浸潰或要浸潰織物的水中來進行。其他酶用途另外,本發明的多肽或組合物也可以被用於抗菌配製物中以及藥物製品例如潤喉糖、牙膏和漱口水中。以下實施例闡述本發明
實施例材料和方法DNA 程序除非另有說明,如別處所述進行標準DNA程序(Sambrook et al. , 1989,Molecularcloning a laboratory manual,2nd Ed.,Cold Spring HarborLaboratory Press,ColdSpring Harbor,New York)。使用校正讀碼酶 Physion 聚合酶(Finnzymes)擴增 DNA。限制性酶來自 Invitrogen 或 NewEngland Biolabs0纖維素酶樣品的製備源自Talaromyces emersonii 的纖維素酶在 Aspergillus niger 中表達。如W02004/030468所述產生酶的濃縮濾液。在對含有合適的表達質粒的Aspergillus niger培養後,在4°C下在5000x g下通過對發酵液離心30分鐘,製備無細胞的上清液。任選的可用4N KOH將上清液調至pH = 5並且在2 (瓶頂)過濾器上用抽吸無菌過濾以去除任何真菌材料。而且,上清液可進一步在GF/A Whatmann Glass微纖維過濾器(丨50mni O .)上過濾以去除任何固體。將上清液超濾、濃縮並在4°C下存儲直至使用或在_20°C下冷凍。用於總蛋白測定的方法該方法是使用三氯乙酸(TCA)沉澱蛋白的組合,以去除幹擾物質並允許用雙縮脲比色反應對蛋白濃度進行測定。在雙縮脲反應中,銅(II)離子被還原為銅(I),所述銅(I)離子在鹼性溶液中與肽鍵的氮和碳形成複合物。紫色顏色表示存在蛋白。根據比爾-蘭伯特定律,顏色的強度與蛋白濃度成正比例,因而在546nm下的吸收與蛋白濃度成正比例。使用BSA(牛血清蛋白)進行標準化並且蛋白含量被表示為g蛋白(BSA當量)/L或被表示為mg蛋白(BSA當量)/ml。使用本領域中已知的標準計算方案計算蛋白含量,其通過繪製OD546對具有已知濃度的樣品的濃度的圖,隨後使用從校準線產生的方程計算未知濃度樣品來實現。洗滌的預處理的小麥秸底物的製備可如Linde, M.et al, Biomass and Bioenergy 32 (2008), 326-332 中所述並且可使用如 Schell,D. J. ,Applied Biochemistry and Biotechnology(2003) ,vol. 105-108,pp69-85中所述的裝置,獲得稀酸預處理的小麥秸。用水洗滌預處理的小麥秸直到具有小麥秸的溶液的PH為6.0或更高。濾出洗滌水。對纖維素水解的監測在pH 4. 5的50mM乙酸鈉緩衝液中製備2%經洗滌的酸處理的小麥秸(PWS)乾物質(dm)底物溶液。為進行孵育,使用96孔深孔微量滴定板。每個孔中加入ImL底物。以多個纖維素酶比率製備酶混合物,並將所述酶混合物以相對於每克底物乾物質的固定蛋白劑量添加至底物溶液。將平板以65°C孵育20小時。孵育後,通過加入50 ii I IM氫氧化鈉溶液來終止酶反應。然後將平板以3220rcf離心15分鐘,將上清液稀釋至葡萄糖濃度為40至100 u M。將50 ill稀釋樣品吸入PCR板中並加入150 U L BCA試劑。BCA試劑通過將兩種原液A或B以I lv/v混合而新鮮製備。溶液A由每升水(MQ) 54. 3g Na2CO3>24. 2NaHC03或
I.9g Na2BCA(Sigma D8284)組成。溶液 B 中每升水(MQ)中含有 31. 24mL CuSO4. 5H20 溶液4% (Piercel85 9078)和 I. 26g L-賴氨酸(Sigma L5501)。(終濃度:2. 5mM BCA, 2. 5mMCu,
4.3mM L-賴氨酸,400mM碳酸鹽)。將平板80°C加熱60分鐘。冷卻後,將150 吸入另一平板中並在560nm測量吸光度。通過不加入酶而進行孵育來分析每個平板中的底物背景。對於每一測量而言,將55UM葡萄糖標準品針對乙酸鹽緩衝液進行分析,以計算葡萄糖的摩爾消光係數。使用Pe 11 i er熱循環PCR儀器(PTC200)進行孵育,用微孔板讀數器(TECANSunrise)進行測量。計算通過酶的作用從底物釋放的葡萄糖,如下給出
權利要求
1.多肽,其包含SEQID NO :2中示出的胺基酸序列或SEQ ID NO :1的核苷酸序列編碼的胺基酸序列,或其變體多肽或變體多核苷酸,其中所述變體多肽與SEQ ID NO :2中示出的序列具有至少76%的序列同一性,或所述變體多核苷酸編碼與SEQ ID NO :2中示出的序列具有至少76%序列同一性的多肽。
2.根據權利要求I所述的多肽,其中所述多肽具有降解碳水化合物的活性或幫助降解碳水化合物的活性。
3.根據權利要求I或2所述的多肽,其中所述多肽具有氧化水解酶活性。
4.根據權利要求I到3中任一項所述的多肽,其中所述多肽具有GH61活性。
5.多核苷酸,其包含 (a)SEQ ID NO : I中示出的核苷酸序列;或 (b)與是SEQID NO 1的反向互補體的多核苷酸選擇性雜交的核苷酸序列;或 (c)與SEQID NO : I的核苷酸序列具有至少80%序列同一性的核苷酸序列;或 (d)長度至少約100個核苷酸的(a)、(b)或(c)中定義的核苷酸序列的長度至少約100個核苷酸的片段;或 (e)序列,其是作為遺傳編碼的結果的(a)、(b)、(c)或(d)任一中定義的序列的簡併體;或 (f)核苷酸序列,其為(a)、(b)、(C)、(d)或(e)中任一項所定義的核苷酸序列的反向互補體。
6.根據權利要求5所述的多核苷酸,其編碼根據權利要求I到4中任一項所述的多肽。
7.根據權利要求5或6所述的多核苷酸,其為DNA序列。
8.包含根據權利要求5到7中任一項所述的多核苷酸的核酸構建體。
9.根據權利要求8所述的核酸構建體,其中GC含量為56%或更多,58%或更多,或從58%至 65%。
10.載體,其中包括根據權利要求5到7中任一項所述的多核苷酸序列。
11.細胞,其包含根據權利要求I到4中任一項所述的多肽、根據權利要求5到7中任一項所述的多核苷酸、根據權利要求8或9所述的核酸構建體或根據權利要求10所述的載體。
12.根據權利要求11所述的細胞,其中所述細胞是真核細胞。
13.根據權利要求11所述的細胞,其中所述細胞是真菌細胞。
14.根據權利要求13所述的細胞,其中所述真菌細胞選自由Aspergillus、Trichoderma/Hypocrea、Fusarium、Disporotrichum、Penici 11 ium> Acremonium、Neurospora、Thermoascus、Myceliophtora^ Sporotrichum、Thielavia^ Chryosporium^Fusarium、Humicola、Neurospora 和 Talaromyces 屬構成的組。
15.根據權利要求14所述的細胞,其中所述真菌細胞是Aspergillusoryzae、Aspergillus sojae、Aspergillus nidulans 或 Aspergillus niger 的種。
16.根據權利要求11到15中任一項所述的細胞,其中一個或多個基因被完全或部分破壞、敲除或缺失,其中任選地所述基因編碼蛋白酶。
17.轉基因植物或其部分,其包含根據權利要求5到7中任一項所述的多核苷酸、根據權利要求8或9所述的核酸構建體、根據權利要求10的載體或根據權利要求11-16中任一項所述的細胞,其中任選地所述植物是玉米植物、高粱植物、番茄植物、小麥植物、油籽植物、油菜籽植物、大豆植物、大麥植物、草或菸草植物;或Anacardium、Arachis> ragus、Atropa、Avena、Brassica、Citrus、Citrullus、Capsicum、Carthamus> Cocos、Coffea>ferae>Cucumis>Cucurbita、Daucus、Elaeis、Fragaria、Glycine、Gossypium、Helianthus、Ocallis、Hordeum、Hyoscyamus> Lactuca、Linum、Lolium、Lupinus、Lycopersicon、Malus、Majorana、Medicago、Nicotiana、Olea、Oryza、Panieum、Pannisetum、Persea、eolus、Pistachio、Pisum、Pyrus、Prunus、Raphanus、Ricinus、Secale、Senecio、Sinapis、Sorghum、Theobromus> Trigonella、Triticum、Vicia、Vitis、Vigna 或 Zea 屬的植物。
18.用於製備根據權利要求I到4中任一項所述的多肽的方法,所述多肽具有降解碳水化合物材料和/或水解碳水化合物的活性,所述方法包括在允許所述多肽表達的條件下培 養根據權利要求11到16中任一項所述的細胞,以及任選地,回收所表達的多肽。
19.組合物,其包含(i)根據權利要求I到4中任一項所述的多肽;和(ii)纖維素酶和/或半纖維素酶和/或果膠酶。
20.根據權利要求18所述的組合物,其中所述纖維素酶是纖維二糖水解酶、纖維二糖水解酶I、纖維二糖水解酶11、內切-P -I,4-葡聚糖酶、^ -葡糖苷酶或@ - (I,3) (I,4)-葡聚糖酶。
21.根據權利要求19或20所述的組合物,其中所述半纖維素酶是內切木聚糖酶、3 -木糖苷酶、a-L-阿拉伯呋喃糖苷酶、a-D-葡糖醛酸糖苷酶、乙醯基木聚糖酯酶、阿魏酸酯酶、香豆酸酯酶、a -半乳糖苷酶、3 -半乳糖苷酶、3 -甘露聚糖酶或3 -甘露糖苷酶。
22.根據權利要求19到21中任一項所述的組合物,其中所述果膠酶是內切多聚半乳糖醛酸酶,果膠甲基酯酶,內切-半乳聚糖酶,P -半乳糖苷酶,果膠乙醯基酯酶,內切-果膠裂合酶,果膠酸裂合酶,a -鼠李糖苷酶,外切-半乳糖醛酸酶,外切多聚半乳糖醛酸酯裂合酶,鼠李半乳糖醛酸聚糖水解酶,鼠李半乳糖醛酸聚糖裂合酶,鼠李半乳糖醛酸聚糖乙醯基酯酶,鼠李半乳糖醛酸聚糖半乳糖醛酸水解酶,木半乳糖醛酸酶,a -阿拉伯呋喃糖苷酶或內切-阿拉伯聚糖酶。
23.根據權利要求19到22中任一項所述的組合物,其包含木質酶、擴展蛋白、擴展蛋白樣多肽、膨脹因子或編碼纖維素整合蛋白或纖維素誘導的蛋白質的基因的多肽產物。
24.用於處理包含碳水化合物材料的底物、任選地處理植物材料的方法,所述方法包括使所述底物與根據權利要求I到4中任一項所述的多肽和/或根據權利要求19到23中任一項所述的組合物接觸。
25.根據權利要求24所述的方法,其中所述底物是植物材料,所述植物材料以下述形式提供植物、植物漿體、植物提取物、食品或源於其的成分,或包含植物材料的織物、紡織品或衣物。
26.根據權利要求24和/或權利要求25所述的方法,其中所述處理包括纖維素和/或半纖維素和/或果膠物質的降解和/或改性。
27.根據權利要求I到4中任一項所述的多肽和/或根據權利要求19到23中任一項所述的組合物用於從木質-纖維素材料生產糖的用途。
全文摘要
本發明涉及多肽,所述多肽包含SEQ ID NO2中示出的胺基酸序列或SEQ ID NO1的核苷酸序列編碼的胺基酸序列,或其變體多肽或變體多核苷酸,其中變體多肽與SEQ ID NO2中示出的序列具有至少76%的序列同一性,或變體多核苷酸編碼與SEQ ID NO2中示出的序列具有至少76%序列同一性的多肽。本發明描述了新穎基因的全長編碼序列以及全長功能性多肽的胺基酸序列和所述基因或胺基酸序列的功能等同物。本發明還涉及在工業方法中使用所述多肽的方法。本發明還包括用根據本發明的多核苷酸轉化的適用於生產這些蛋白質的細胞。
文檔編號C07K14/435GK102971419SQ201180033019
公開日2013年3月13日 申請日期2011年6月23日 優先權日2010年6月29日
發明者瑪格特·伊莉莎白·弗蘭克希斯·休恩瓦爾德-貝格曼斯, 威爾伯特·赫爾曼·馬裡·海涅, 埃裡克·皮特·洛斯 申請人:帝斯曼智慧財產權資產管理有限公司

同类文章

一種新型多功能組合攝影箱的製作方法

一種新型多功能組合攝影箱的製作方法【專利摘要】本實用新型公開了一種新型多功能組合攝影箱,包括敞開式箱體和前攝影蓋,在箱體頂部設有移動式光源盒,在箱體底部設有LED脫影板,LED脫影板放置在底板上;移動式光源盒包括上蓋,上蓋內設有光源,上蓋部設有磨沙透光片,磨沙透光片將光源封閉在上蓋內;所述LED脫影

壓縮模式圖樣重疊檢測方法與裝置與流程

本發明涉及通信領域,特別涉及一種壓縮模式圖樣重疊檢測方法與裝置。背景技術:在寬帶碼分多址(WCDMA,WidebandCodeDivisionMultipleAccess)系統頻分復用(FDD,FrequencyDivisionDuplex)模式下,為了進行異頻硬切換、FDD到時分復用(TDD,Ti

個性化檯曆的製作方法

專利名稱::個性化檯曆的製作方法技術領域::本實用新型涉及一種檯曆,尤其涉及一種既顯示月曆、又能插入照片的個性化檯曆,屬於生活文化藝術用品領域。背景技術::公知的立式檯曆每頁皆由月曆和畫面兩部分構成,這兩部分都是事先印刷好,固定而不能更換的。畫面或為風景,或為模特、明星。功能單一局限性較大。特別是畫

一種實現縮放的視頻解碼方法

專利名稱:一種實現縮放的視頻解碼方法技術領域:本發明涉及視頻信號處理領域,特別是一種實現縮放的視頻解碼方法。背景技術: Mpeg標準是由運動圖像專家組(Moving Picture Expert Group,MPEG)開發的用於視頻和音頻壓縮的一系列演進的標準。按照Mpeg標準,視頻圖像壓縮編碼後包

基於加熱模壓的纖維增強PBT複合材料成型工藝的製作方法

本發明涉及一種基於加熱模壓的纖維增強pbt複合材料成型工藝。背景技術:熱塑性複合材料與傳統熱固性複合材料相比其具有較好的韌性和抗衝擊性能,此外其還具有可回收利用等優點。熱塑性塑料在液態時流動能力差,使得其與纖維結合浸潤困難。環狀對苯二甲酸丁二醇酯(cbt)是一種環狀預聚物,該材料力學性能差不適合做纖

一種pe滾塑儲槽的製作方法

專利名稱:一種pe滾塑儲槽的製作方法技術領域:一種PE滾塑儲槽一、 技術領域 本實用新型涉及一種PE滾塑儲槽,主要用於化工、染料、醫藥、農藥、冶金、稀土、機械、電子、電力、環保、紡織、釀造、釀造、食品、給水、排水等行業儲存液體使用。二、 背景技術 目前,化工液體耐腐蝕貯運設備,普遍使用傳統的玻璃鋼容

釘的製作方法

專利名稱:釘的製作方法技術領域:本實用新型涉及一種釘,尤其涉及一種可提供方便拔除的鐵(鋼)釘。背景技術:考慮到廢木材回收後再加工利用作業的方便性與安全性,根據環保規定,廢木材的回收是必須將釘於廢木材上的鐵(鋼)釘拔除。如圖1、圖2所示,目前用以釘入木材的鐵(鋼)釘10主要是在一釘體11的一端形成一尖

直流氧噴裝置的製作方法

專利名稱:直流氧噴裝置的製作方法技術領域:本實用新型涉及ー種醫療器械,具體地說是ー種直流氧噴裝置。背景技術:臨床上的放療過程極易造成患者的局部皮膚損傷和炎症,被稱為「放射性皮炎」。目前對於放射性皮炎的主要治療措施是塗抹藥膏,而放射性皮炎患者多伴有局部疼痛,對於止痛,多是通過ロ服或靜脈注射進行止痛治療

新型熱網閥門操作手輪的製作方法

專利名稱:新型熱網閥門操作手輪的製作方法技術領域:新型熱網閥門操作手輪技術領域:本實用新型涉及一種新型熱網閥門操作手輪,屬於機械領域。背景技術::閥門作為流體控制裝置應用廣泛,手輪傳動的閥門使用比例佔90%以上。國家標準中提及手輪所起作用為傳動功能,不作為閥門的運輸、起吊裝置,不承受軸向力。現有閥門

用來自動讀取管狀容器所載識別碼的裝置的製作方法

專利名稱:用來自動讀取管狀容器所載識別碼的裝置的製作方法背景技術:1-本發明所屬領域本發明涉及一種用來自動讀取管狀容器所載識別碼的裝置,其中的管狀容器被放在循環於配送鏈上的文檔匣或託架裝置中。本發明特別適用於,然而並非僅僅專用於,對引入自動分析系統的血液樣本試管之類的自動識別。本發明還涉及專為實現讀