新四季網

纖維素酶、編碼它們的核酸及其製備和應用的方法

2023-10-26 02:28:12 2


專利名稱::纖維素酶、編碼它們的核酸及其製備和應用的方法纖維素酶、編碼它們的核酸及其製備和應用的方法5政府資助本發明涉及分子和細胞生物學和生物化學。一方面,本發明提供具有纖維素酶活性——例如,內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶活性——的多肽、編碼這些多肽的多核苷酸,以及製備和使用這些多核苷酸和多肽的方法。一方面,本發明涉及具有纖維素酶活性例如內切葡聚糖酶、纖維二15糖水解酶、甘露聚糖酶和/或p-葡糖苷酶活性——包括熱穩定的和耐熱的活性——的多肽,和編碼這些酶的多核苷酸,以及製備和使用這些多核苷酸和多肽。本發明的多肽可用於各種製藥、農業和工業環境中。
背景技術:
:20纖維素是地球上最豐富的可再生資源。它由重複單元是纖維二糖的P-l,4葡萄糖單元的線性鏈組成,纖維二糖是具有如圖5所示結構的葡萄糖二聚體。該高分子通過一組酶進行降解,包括隨機水解纖維素高分子的內切葡聚糖酶(EG)以及從纖維素除去末端纖維二糖殘基的纖維二糖水解酶(CBH)。纖維二糖和纖維寡糖被P-葡糖苷酶(BG)水解成葡萄糖。所有這三種酶對於纖維素完全分解成葡萄糖是25必需的。對於這三種酶的每一種,存在行使相同功能的不同結構的變體。此外,除了不同結構變體外,已知真菌和細菌還產生多種形式的相同結構變體。已知一些厭氧細菌和真菌以多酶複合物的形式產生這些酶,這一事實進一步使該系統複雜化,所述多酶複合物含有都附著於酶支架上的多種酶,分子量在2百萬道爾頓以上。為什麼這樣的酶複合系統對於這樣的簡單分子是必需的?一些30研究者認為該複雜性原因在於底物的頑拗性質。纖維素鏈形成微纖維,其通過相鄰鏈的氫鍵鍵合堆積成晶體基質。該結構對於化學降解或酶促降解是高度耐受的。由於它們對纖維素的酶促攻擊性質,CBH被認為是該晶體纖維素降解中的關鍵酶。與CBH不同,EG具有開放的裂縫,其以垂直角度攻擊纖維素鏈。CBH通過含有活性位點的坑道直接攻擊所述鏈。目前認為,纖維素鏈進入所述坑道,35同時,相鄰的氫鍵鍵合被破壞。一旦纖維二糖水解酶在該底物上建立起"立足點",然後,EG可以進來,並更容易攻擊底物。已知的CBH的一個主要缺陷是其低的催化活性。一些觀點認為,低活性是源於如下事實來自水解的能量被轉化成動能,以破壞氫鍵並使酶能夠沿著底物移動。CBH是外切作用酶並在90個糖基水解酶家族中的6個家族中發現。它們5包括家族5、6、7、9、10和48。家族5含有許多不同類型的糖基水解酶,包括纖維素酶、甘露聚糖酶和木聚糖酶。儘管在該家族中大部分纖維素酶是內切葡聚糖酶,仍存在纖維二糖水解酶的例子,最為人知的是來自熱纖梭菌(C7o^^/"/mAeAvOCe//Mw)的CdO。家族6僅含有內切葡聚糖酶或纖維二糖水解酶,其中纖維二糖水解酶成員比內切葡聚糖酶更多。該酶具有反向機制(invertingmechanism),10並且晶體學研究表明,所述酶具有扭曲的a/l3桶結構,其含有七個而非八個平行的J3鏈。家族7酶也由內切葡聚糖酶和纖維二糖水解酶組成,其中纖維二糖水解酶更多,並且已知的成員僅來自真菌。該酶具有保持機構(retainingmechanism),並且晶體結構示出了P-膠凍巻結構。家族9含有內切葡聚糖酶、纖維二糖水解酶和卩-葡糖苷酶,其中內切葡聚糖酶佔優勢。然而,嗜熱放線菌(77jeAvno6i/Wfl/^OJ)產15生內切/外切-l,4-葡聚糖酶,其晶體結構顯示出(a/a)6桶狀摺疊。該酶具有內切和外切葡聚糖酶CBH的特徵。家族10僅含有2個成員,被描述為纖維二糖水解酶,其餘主要被描述為木聚糖酶。家族10的纖維二糖水解酶和木聚糖酶具有對甲基-傘形基纖維二糖苷的活性。家族48主要含有細菌和厭氧真菌纖維二糖水解酶和內切葡聚糖酶。結構是類似於家族9的(a/a)6桶狀摺疊。20存在對用於公路車輛的較不昂貴和可再生的燃料來源的需求。如果新的燃料來源在燃燒之後產生無害的終產物,則它們將更加有吸引力。乙醇提供了石油基燃料的有吸引力的可替代選擇,並且可以通過衍生自澱粉或木質纖維素的單體糖發酵獲得。然而,目前的經濟學不支持乙醇的廣泛使用,原因在於生產乙醇的高成本。一個目標在於降低成本的研究領域是增加用於從木質纖維素產生可發酵25糖類的酶的技術效率。更有效地消化原料的酶的開發將轉變成降低的乙醇生產成本。更有效的工藝將降低美國對進口油的依賴以及與該依賴性相關的價格波動。使用更清潔的運輸燃料例如生物乙醇還可以降低淨C02排放,其被認為是造成全球變暖的部分原因。30發明概述本發明提供了纖維素酶,例如,內切葡聚糖酶、纖維二糖水解酶和/或P-葡糖苷酶(多種P-葡糖苷酶),以及製備和使用它們的方法。一方面,本發明的酶具有增加的催化速率,以改善底物水解過程。在催化速率上這種增加的效率導致在生產糖類上增加的效率,這可用於工業應用中,例如,如此產生的糖可被微生35物用於乙醇生產。一方面,本發明提供了高活性(例如,具有增加的催化速率)的纖維二糖水解酶、內切葡聚糖酶和P-葡糖苷酶。本發明提供了工業應用(例如,生物物質(biomass)轉化為乙醇),其利用了本發明的具有降低的酶成本的酶,例如,在生物物質轉化為乙醇的過程中降低的成本。因此,本發明提供了由任何生物質生產生物乙醇和含生物乙醇的組合物的有效率的工藝,所述含生物乙醇的組合物包括含有生物乙醇的燃料。5—方面,本發明的酶具有葡聚糖酶例如內切葡聚糖酶活性,例如催化內部內-(3-l,4-和域P-l,3-葡聚糖鍵的水解。一方面,內切葡聚糖酶活性(例如,內切1,4-P-D-葡聚糖4-葡聚糖水解酶活性)包括水解纖維素、纖維素衍生物(例如羧甲基纖維素和羥乙基纖維素)地衣聚糖(lichenin)中的1,4-和域P-l,3-P-D-糖苷鍵、混合的P-l,3葡聚糖中的P-l,4鍵,例如穀類P-D-葡聚糖或木葡聚糖以及含有纖維10質部分的其它植物材料。—方面,本發明的酶具有內切葡聚糖酶(例如,內切-(3-l,4-葡聚糖酶,EC3.2丄4;內切-p-l,3(l)-葡聚糖酶,EC3.2丄6;內切-p-l,3-葡聚糖酶,EC3.2丄39)活性並且可以水解纖維素和葡聚糖中的內部p-l,4-和/或P-l,3-糖苷鍵,以產生較小分子量的葡萄糖和葡萄糖寡聚體。本發明提供了使用本發明的這些酶產生更小分子量15的葡萄糖和葡萄糖寡聚體的方法。—方面,本發明的酶用於產生葡聚糖,例如,由1,4-p-和/或1,3-糖苷鍵接的D-吡喃葡糖形成的多糖。一方面,本發明的內切葡聚糖酶被用在食品工業中如烘焙及水果和蔬菜加工、農業廢物的分解、動物飼料的生產、紙漿和紙的生產、紡織物生產以及家用和工業清潔劑。一方面,通過微生物如真菌和/或細菌,生產20本發明的酶,例如內切葡聚糖酶。—方面,本發明的酶如內切葡聚糖酶被用於水解|3-葡聚糖,p-葡聚糖是穀物主要的非澱粉多糖。根據品種和生長條件,多糖的葡聚糖含量可顯著變化。該多糖的物理化學性質是在氧化條件下產生粘性溶液或者甚至是凝膠。此外,葡聚糖具有高的水結合能力。所有這些特徵給幾個行業帶來了問題,包括釀造、烘焙、25動物營養。在釀造應用中,葡聚糖的存在導致麥芽汁過濾性和形成渾濁的問題。在烘焙應用中(尤其對於曲奇和脆餅),葡聚糖可產生發粘麵團,其難以進行機械加工和減小餅乾尺寸。因此,本發明的酶如內切葡聚糖酶被用於降低含P-葡聚糖的組合物中P-葡聚糖的量,例如,本發明的酶被用在降低溶液或凝膠的粘度的工藝中;用於降低組合物例如含P-葡聚糖的組合物的水結合能力;在釀造工藝中(例30如,用於增加麥芽汁過濾性和降低混濁),用於降低麵團的粘性,例如,用於製作曲奇、麵包、餅乾等等的麵團。此外,碳水化合物(例如,P-葡聚糖)參與烘焙產品的快速再水化,導致鬆脆性損失和縮短的貨架期。因此,本發明的酶,例如內切葡聚糖酶,被用於保持鬆脆性、增加鬆脆性或降低鬆脆性的損失速率,以及增加任何含碳水化合物食35品、飼料或飲料的貨架期,例如含p-葡聚糖的食品、飼料或飲料。本發明的酶,例如內切葡聚糖酶,被用於降低消化道內容物(例如,在動物中,如反芻動物或人中)的粘性,例如,含有穀物膳食的那些。因此,在可選的方面,本發明的酶,例如內切葡聚糖酶,被用於正面影響食品或飼料的可消化性以及動物(例如,人或家畜)生長速率,以及在一方面,被用於產生更高的飼料轉化效率。對於穀物食物的單胃動物飼料應用,p-葡聚糖是消化道內容物的粘性5的促成因素,並且從而負面影響飼料的可消化性和動物生長速率。對於反芻動物,這些P-葡聚糖代表纖維攝入的基本成分,而葡聚糖的更完全的消化將促進更高的飼料轉化效率。因此,本發明提供了含有本發明的內切葡聚糖酶的動物飼料和食品,並且在一方面,這些酶在動物消化道中是有活性的,例如在胃和/或腸中是有活性的。10本發明的酶,例如內切葡聚糖酶,被用於消化纖維素或任何含P-l,4-連接葡聚糖的合成或天然的材料,包括在任何植物材料中發現的那些。本發明的酶,例如內切葡聚糖酶,被用作例如在木材加工、紙槳和/或紙工業中、在紡織品製造中以及在家用和工業清潔劑中和/或在生物物質廢物處理中消化纖維素的商業酶。—方面,本發明提供了含有本發明的酶、多肽或多核苷酸的組合物(例如,15藥物組合物、食物、飼料、藥物、飲食補充物)。這些組合物可以以各種形式加以配製,例如片劑、凝膠、丸劑、植入物、液體、噴劑、粉末、食物、飼料小丸或任何類型的膠囊化形式。本發明提供了分離的或重組的核酸,包括在至少大約10、15、20、25、30、35、40、45、50、75、100、150、200、250、300、350、400、450、500、550、20600、650、700、750、800、850、900、950、1000、1050、1100、1150、1200、1250、1300、1350、1400、1450、1500、1550、1600、1650、1700、1750、1800、1850、1900、1950、2000、2050、2100、2200、2250、2300、2350、2400、2450、2500或更多殘基的區域內,與本發明的示例性核酸具有至少大約50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、2567%、68°/。、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高或完全的(100%)序列同一性的核酸序列,本發明的示例性核酸包括SEQIDNO:l,SEQIDNO:3,SEQIDNO:5,SEQIDNO:7,SEQIDNO:9,SEQIDNO:ll,SEQIDNO:13,SEQIDNO:15,30SEQIDNO:17,SEQIDNO:19,SEQIDNO:21,SEQIDNO:23,SEQIDNO:25,SEQIDNO:27,SEQIDNO:29,SEQIDNO:31,SEQIDNO:33,SEQIDNO:35,SEQIDNO:37,SEQIDNO:39,SEQIDNO:41,SEQIDNO:43,SEQIDNO:45,SEQIDNO:47,SEQIDNO:49,SEQIDNO:51,SEQIDNO:53,SEQIDNO:55,SEQIDNO:57,SEQIDNO:59,SEQEDNO:61,SEQIDNO:63,SEQIDNO:65,35SEQIDNO:67,SEQIDNO:69,SEQIDNO:71,SEQEDNO:73,SEQIDNO:75,SEQIDNO:77,SEQIDNO:79,SEQIDNO:81,SEQIDNO:83,SEQIDNO:85,SEQIDNO:87,SEQIDNO:89,SEQIDNO:91,SEQIDNO:93,SEQIDNO:95,SEQIDNO:97,SEQIDNO:99,SEQIDNO:101,SEQIDNO:103,SEQIDNO:105,SEQIDNO:107,SEQIDNO:109,SEQIDNO:lll,SEQIDNO:113,SEQIDNO:115,SEQIDNO:117,SEQIDNO:119,SEQIDNO:121,SEQIDNO:123,SEQ5IDNO:125,SEQIDNO:127,SEQIDNO:129,SEQIDNO:131,SEQIDNO:133,SEQIDNO:135,SEQIDNO:137,SEQIDNO:139,SEQIDNO:141,SEQIDNO:143,SEQIDNO:145,SEQIDNO:147,SEQIDNO:149,SEQIDNO:151,SEQIDNO:153,SEQIDNO:155,SEQIDNO:157,SEQIDNO:159,SEQIDNO:161,SEQIDNO:163和SEQIDNO:165;也參見下面的表l、2和3、實施例101和4,以及序列表;以及在可選的方面,這些核酸編碼至少一個具有纖維素酶活性例如內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶活性的多肽,或者編碼能夠產生可特異性結合本發明多肽的抗體的多肽,或者,這些核酸可用作鑑別或分離編碼纖維素酶的核酸的探針,或用於抑制表達纖維素酶的核酸的表達(所有這些方面都稱為"本發明的核酸")。一方面,所述序列同一性通過運用15了序列比較算法的分析或通過視覺觀察來確定。本發明的核酸也包括,編碼本發明的示例性酶的分離的或重組的核酸,本發明的示例性酶包括具有如下所示序列的多肽SEQIDNO:2,SEQIDNO:4,SEQIDNO:6,SEQIDNO:8,SEQIDNO:10,SEQIDNO:12,SEQIDNO:14,SEQIDNO:16,SEQIDNO:18,SEQIDNO:20,SEQIDNO:22,SEQIDNO:24,SEQID20NO:26,SEQIDNO:28,SEQIDNO:30,SEQIDNO:32,SEQIDNO:34,SEQIDNO:36,SEQIDNO:38,SEQIDNO:40,SEQIDNO:42,SEQIDNO:44,SEQIDNO:46,SEQIDNO:48,SEQIDNO:50,SEQIDNO:52,SEQIDNO:54,SEQIDNO:56,SEQIDNO:58,SEQIDNO:60,SEQIDNO:62,SEQIDNO:64,SEQIDNO:66,SEQIDNO:68,SEQIDNO:70,SEQIDNO:72,SEQIDNO:74,SEQID25NO:76,SEQIDNO:78,SEQIDNO:80,SEQIDNO:82,SEQIDNO:84,SEQIDNO:86,SEQIDNO:88,SEQIDNO:90,SEQIDNO:92,SEQIDNO:94,SEQIDNO:96,SEQIDNO:98,SEQIDNO:100,SEQIDNO:102,SEQIDNO:104,SEQIDNO:106,SEQIDNO:108,SEQIDNO:110,SEQIDNO:112,SEQIDNO:114,SEQIDNO:116,SEQIDNO:118,SEQIDNO:120,SEQIDNO:122,SEQID30NO:124,SEQIDNO:126,SEQIDNO:128,SEQIDNO:130,SEQIDNO:132,SEQIDNO:134,SEQIDNO:136,SEQIDNO:138,SEQIDNO:140,SEQIDNO:142,SEQIDNO:144,SEQIDNO:146,SEQIDNO:148,SEQIDNO:150,SEQIDNO:152,SEQIDNO:154,SEQIDNO:156,SEQIDNO:158,SEQIDNO:160,SEQIDNO:162,SEQIDNO:164和SEQIDNO:166,也參見下面的表1、352和3、實施例1和4,和序列表,及其子序列和其變體。一方面,該多肽具有纖維素酶活性,例如內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶活性。—方面,本發明提供了編碼纖維素酶的核酸,例如編碼內切葡聚糖酶、纖維二糖水解酶和/或P-葡糖苷酶的核酸,其共同的新穎性在於它們來源於混合培養物。本發明提供了從混合培養物分離的編碼纖維素降解酶的核酸,其包括本發明5的多核苷酸,例如在至少大約50、75、100、150、200、250、300、350、400、450、500、550、600、650、700、750、800、850、卯0、950、1000、1050、1100、1150或更多殘基的區域內,與本發明的示例性核酸具有至少大約10%、15%、20%、25%、30%、35%、40%、45%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、1072%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高或完全的(100%)序列同一性的序列,本發明的示例性核酸例如SEQIDNO:l,SEQIDN0:3,SEQIDNO:5,SEQIDNO:7,SEQIDNO:9,SEQIDNO:ll,SEQIDNO:13,SEQIDNO:15,SEQIDNO:17,SEQIDNO:19,15SEOIDNO:21,SEOIDNO:23,SEQIDNO:25,SEQIDNO:27,SEQIDNO:29,SEQIDNO:35,SEQIDNO:37,SEQIDNO:39,SEQIDNO:45,SEQIDNO:47,SEQIDNO:49,SEQIDNO:55,SEQIDNO:57,SEQIDNO:59,SEQIDNO:65,SEQIDNO:67,SEQIDNO:69,SEQIDNO:75,SEQIDNO:77,SEQIDNO:79,SEQIDNO:85,SEQIDNO:87,SEQIDNO:89,SEQIDNO:95,SEQIDNO:97,SEQIDNO:99,SEQIDNO:101,SEQIDNO:103,SEQIDNO:105,SEQIDNO:107,SEQIDNO:109,SEQIDNO:lll,SEQIDNO:113,SEQIDNO:115,SEQIDNO:117,SEQ25IDNO:119,SEQIDNO:121,SEQIDNO:123,SEQIDNO:125,SEQIDNO:127,SEQIDNO:129,SEQIDNO:131,SEQIDNO:133,SEQIDNO:135,SEQIDNO:137,SEQIDNO:139,SEQIDNO:141,SEQIDNO:143,SEQIDNO:145,SEQIDNO:147,SEQIDNO:149,SEQIDNO:151,SEQIDNO:153,SEQIDNO:155,SEQIDNO:157,SEQIDNO:159,SEQIDNO:161,SEQIDNO:163和30SEQIDNO:165;也參見下面的表1、2和3、實施例1和4,以及序列表。—方面,本發明提供了編碼纖維素酶的核酸,例如編碼內切葡聚糖酶、纖維二糖水解酶和/或P-葡糖苷酶的核酸,包括本發明的示例性多核苷酸序列,也參見下面的表l、2和3、實施例1和4,和序列表,以及由它們編碼的多肽,包括本發明的酶,諸如本發明的示例性多肽,如SEQIDNO:2,SEQIDNO:4,SEQID35NO:6,SEQIDNO:8,SEQIDNO:10,SEQIDNO:12,SEQIDNO:14,SEQIDNO:16,SEQIDNO:18,SEQIDNO:20,SEQIDNO:22,SEQIDNO:24,SEQID20SEQIDNO:21,SEC)IDNO:31'SEQIDNO:41,SEQIDNO:51,SEQIDNO:61,SEQIDNO:71,SEQIDNO:81,SEQIDNO:91:SEQIDNO:23,SEQIDNO:33,SEQIDNO:43,SEQIDNO:53,SEQIDNO:63,SEQIDNO:73,SEQIDNO:83,SEQIDNO:93,NO:26,SEQIDNO:28,SEQIDNO:30,SEQIDNO:32,SEQIDNO:34,SEQIDNO:36,SEQIDNO:38,SEQIDNO:40,SEQIDNO:42,SEQIDNO:44,SEQIDNO:46,SEQIDNO:48,SEQIDNO:50,SEQIDNO:52,SEQIDNO:54,SEQIDNO:56,SEQIDNO:58,SEQIDNO:60,SEQIDNO:62,SEQIDNO:64,SEQID5NO:66,SEQIDNO:68,SEQIDNO:70,SEQIDNO:72,SEQIDNO:74,SEQIDNO:76,SEQIDNO:78,SEQIDNO:80,SEQIDNO:82,SEQIDNO:84,SEQIDNO:86,SEQIDNO:88,SEQIDNO:90,SEQIDNO:92,SEQIDNO:94,SEQIDNO:96,SEQIDNO:98,SEQIDNO:100,SEQIDNO:102,SEQIDNO:104,SEQIDNO:106,SEQIDNO:108,SEQIDNO:llO,SEQIDNO:112,SEQIDNO:114,10SEQIDNO:116,SEQIDNO:118,SEQIDNO:120,SEQIDNO:122,SEQIDNO:124,SEQIDNO:126,SEQIDNO:128,SEQIDNO:130,SEQIDNO:132,SEQIDNO:134,SEQIDNO:136,SEQIDNO:138,SEQIDNO:140,SEQIDNO:142,SEQIDNO:144,SEQIDNO:146,SEQIDNO:148,SEQIDNO:150,SEQIDNO:152,SEQIDNO:154,SEQIDNO:156,SEQIDNO:158,SEQID15NO:160,SEQIDNO:162,SEQIDNO:164和SEQIDNO:166,也參見表1和序列表,其共同的新穎性在於它們來源於共同的來源,例如環境來源。一方面,本發明也提供了編碼纖維素酶的核酸,例如編碼內切葡聚糖酶、纖維二糖水解酶和/或卩-葡糖苷酶的核酸,其共同的新穎性在於它們來源於環境來源,例如混合的環境來源。20—方面,序列比較算法是BLAST2.2.2版本算法,其中過濾設置(filteringsetting)被設置為blastall-pblastp~d"nrpataa"-FF,所有其它選項被設置為預設。本發明的另一方面是分離的或重組的核酸,包括本發明的核酸序列的至少10、15、20、25、30、35、40、45、50、75、100、150、200、250、300、350、400、450、500、550、600、650、700、750、800、850、900、950、1000、1050、251100、1150、1200、1250、1300、1350、1400、1450、1500、1550、1600、1650、1700、1750、1800、1850、1900、1950、2000、2050、2100、2200、2250、2300、2350、2400、2450、2500或更多個連續鹼基、與其基本相同的序列、以及與其互補的序列。—方面,所述分離的或重組的核酸編碼具有纖維素酶活性的多肽,例如,30具有內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶活性的多肽,其是熱穩定的。該多肽在包括如下溫度範圍的條件下可以保持纖維素酶活性大約37。C到大約95'C之間;大約55'C到大約85'C之間;大約70'C到大約95'C之間;或大約9(TC到大約95'C之間。該多肽在如下範圍內的溫度下可以保持纖維素酶活性在大約rC到大約5'C之間,大約5'C到大約15'C之間,大約15'C到大約2535。C之間,大約25'C到大約37'C之間,大約37'C到大約95'C、96'C、97'C、98'C或99。C之間,大約55'C到大約85'C之間,大約70'C到大約75'C之間,或大約90。C到大約99。C,或95'C、96°C、97°C、98'C或99。C,或更高溫度。另一方面,所述分離的或重組的核酸編碼具有纖維素酶活性的多肽,例如,具有內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶活性的多肽,其是耐熱的。該多肽在暴露於如下範圍內的溫度後可以保持纖維素酶活性37'C5以上到大約95'C,或55'C以上到大約85'C的範圍之內的任何溫度。該多肽在暴露於如下範圍內的溫度後可以保持纖維素酶活性在大約1'C到大約5'C之間,大約5'C到大約15'C之間,大約15'C到大約25'C之間,大約25'C到大約37t:之間,大約37'C到大約95°C、96°C、97'C、98'C或99'C之間,大約55。C到大約85'C之間,大約70'C到大約75'C之間,或大約90'C到大約95'C之間,或更高溫度。一方面,10該多肽在暴露於如下範圍內的溫度後保持纖維素酶活性9(TC以上到大約99°C,或95。C、96°C、97°C、98'C或99'C,在大約pH4.5,或更高。本發明提供了分離的或重組的核酸,包括在嚴緊條件下與本發明的核酸雜交的序列,所述本發明的核酸包括本發明的示例性序列,例如如下所示的序列SEQIDNO:l,SEQIDNO:3,SEQIDNO:5,SEQIDNO:7,SEQIDNO:9,SEQID15NO:ll,SEQIDNO:13,SEQIDNO:15,SEQIDNO:17,SEQIDNO:19,SEQIDSEQIDNO:25,SEQIDNO:27,SEQIDNO:29,SEQIDSEQIDNO:35,SEQIDNO:37,SEQIDNO:39,SEQIDSEQIDNO:45,SEQIDNO:47,SEQIDNO:49,SEQIDSEQIDNO:55,SEQIDNO:57,SEQIDNO:59,SEQIDSEQIDNO:65,SEQIDNO:67,SEQIDNO:69,SEQIDSEQIDNO:75,SEQIDNO:77,SEQIDNO:79,SEQIDSEQIDNO:85,SEQIDNO:87,SEQIDNO:89,SEQIDSEQIDNO:95,SEQIDNO:97,SEQIDNO:99'SEQIDNO:101,SEQIDNO:103,SEQIDNO:105,SEQIDNO:107,SEQIDNO:109,25SEQIDNO:lll,SEQIDNO:113,SEQIDNO:115'SEQIDNO:117,SEQIDNO:119,SEQIDNO:121,SEQIDNO:123,SEQIDNO:125,SEQIDNO:127,SEQIDNO:129,SEQIDNO:131,SEQIDNO:133,SEQIDNO:135,SEQIDNO:137,SEQIDNO:139,SEQIDNO:141,SEQIDNO:143,SEQIDNO:145,SEQIDNO:147,SEQIDNO:149,SEQIDNO:151,SEQIDNO:153'SEQIDNO:155'30SEQIDNO:157,SEQIDNO:159,SEQIDNO:161,SEQIDNO:163或SEQIDNO:165(也參見下面的表l、2和3、實施例1和4),或其片段或其子序列。一方面,該核酸編碼具有纖維素酶活性的多肽,例如,具有內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶活性。該核酸的長度可以是至少大約10、15、20、25、30、35、40、45、50、75、100、150、200、250、300、350、400、450、35500、550、600、650、700、750、800、850、900、950、1000、1050、1100、1150、1200或更多殘基,或基因的全長或轉錄物的全長。一方面,嚴緊條件包括洗滌步20NO:21NO:31NO:41NO:51NO:61NO:71NO:81NO:91SEQIDNO:23'SEQIDNO:33,SEQIDNO:43,SEQIDNO:53,SEQIDNO:63,SEQIDNO:73,SEQIDNO:83,SEQIDNO:93,驟,包括在0.2XSSC中在大約65'C的溫度洗滌大約15分鐘。本發明提供了核酸探針,其用於鑑定或分離編碼具有纖維素酶活性——例如內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶活性——的多肽的核酸,其中所述探針含有核酸序列的至少大約10、15、20、25、30、35、40、545、50、55、60、65、70、75、80、85、90、95、100、150、200、250、300、350、400、450、500、550、600、650、700、750、800、850、900、950、1000或更多個連續鹼基,所述核酸序列包括本發明的序列或其片段或其子序列,其中所述探針通過結合或雜交來鑑定核酸。該探針可以包括寡核苷酸,該寡核苷酸含有核酸序列的至少大約10到50、大約20到60、大約30到70、大約40到80或大約6010至ljl00個連續鹼基,所述核酸序列包括本發明的序列或其片段或其子序列。本發明提供了核酸探針,其用於鑑定或分離編碼具有纖維素酶活性——例如內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或p-葡糖苷酶活性——的多肽的核酸,其中所述探針包括含有本發明核酸的至少大約10、15、20、30、40、50、60、70、80、90、100、150、200、250、300、350、400、450、500、550、600、15650、700、750、800、850、900、950、1000或更多殘基所示的序列的核酸,所述本發明核酸例如與本發明的示例性核酸具有至少大約50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、2094%、95%、96%、97%、98%、99%或更高或完全的(100%)序列同一性的多核苷酸。一方面,序列同一性通過運用序列比較算法的分析或通過視覺觀察來確定。在可選的方面中,該探針可以包括寡核苷酸,該寡核苷酸含有本發明的核酸序列或其子序列的至少大約10到50、大約20到60、大約30到70、大約40到80或大約60到IOO個連續鹼基。25本發明提供了擴增引物序列對,其用於擴增(例如,通過PCR)編碼具有纖維素酶活性——例如,內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶活性——的多肽的核酸,其中該引物對能夠擴增含有本發明的序列或其片段或子序列的核酸。擴增引物序列對的一個或每一個成員可以包括寡核苷酸,該寡核苷酸包括該序列的至少大約10到50個或更多個連續鹼基,或者包括該序列30的大約10、U、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36或更多個連續鹼基。本發明提供了擴增引物對,其中所述引物對包括第一成員和第二成員,第一成員具有本發明核酸的大約前(5,)12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36或更多個殘基所示的序列,第二35成員含有第一成員的互補鏈的大約前(5,)12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36或更多個殘基所示的序列。本發明提供了通過擴增產生的編碼纖維素酶的核酸,例如編碼內切葡聚糖酶、纖維二糖水解酶和/或p-葡糖苷酶的核酸,所述擴增例如聚合酶鏈反應(PCR),其中使用本發明的擴增引物對。本發明提供了通過擴增產生的編碼纖維素酶的核5酸,例如編碼內切葡聚糖酶、纖維二糖水解酶和/或P-葡糖苷酶的核酸,所述擴增例如聚合酶鏈反應(PCR),其中使用本發明的擴增引物對。本發明提供了通過擴增製備纖維素酶——例如內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶一一的方法,所述擴增例如聚合酶鏈反應(PCR),其中使用本發明的擴增引物對。一方面,所述擴增引物對從文庫例如基因文庫諸如環境文庫擴增核酸。10本發明提供了擴增核酸的方法,所述核酸編碼具有纖維素酶活性的多肽,例如具有內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶活性的多肽,所述方法包括用能擴增本發明的核酸序列或其片段或子序列的擴增引物序列對擴增模板核酸。本發明提供了包含本發明的核酸或其子序列的表達序列盒。一方面,表達15序列盒可以包含可操作地連接到啟動子上的核酸。啟動子可以是病毒、細菌、哺乳動物或植物啟動子。一方面,植物啟動子可以是馬鈴薯、稻、玉米、小麥、菸草或大麥啟動子。啟動子可以是組成型啟動子。組成型啟動子可以包括CaMV35S。另一方面,啟動子可以是誘導型啟動子。一方面,啟動子可以是組織特異性啟動子或環境調節型或發育調節型啟動於。因此,啟動子可以是,例如種子特異性、20葉特異性、根特異性、莖特異性或脫落誘導啟動子。一方面,表達序列盒可以進一步包括植物或植物病毒表達載體。本發明提供了克隆載體,包括本發明的表達序列盒(例如載體)或本發明的核酸。克隆載體可以是病毒載體、質粒、噬菌體(phage)、噬粒、粘粒(cosmid)、fos-質粒(fosmid)、細菌噬菌體(bacteriophage)或人工染色體。病毒載體可以包25括腺病毒載體、逆轉錄病毒載體或腺相關病毒載體。克隆載體可以包括細菌人工染色體(BAC)、質粒、細菌噬菌體P1衍生載體(PAC)、酵母人工染色體(YAC)或哺乳動物人工染色體(MAC)。本發明提供了包含本發明的核酸或本發明的表達序列盒(例如載體)或本發明的克隆載體的轉化細胞。一方面,轉化細胞可以是細菌細胞、哺乳動物細胞、30真菌細胞、酵母細胞、昆蟲細胞或植物細胞。一方面,植物細胞可以是大豆、油菜籽、含油種子、番茄、甘蔗、穀類、馬鈴薯、小麥、稻、玉米、菸草或大麥細胞。本發明提供了包含本發明核酸或本發明表達序列盒(例如載體)的轉基因非人動物。一方面,該動物是小鼠、大鼠、豬、山羊或綿羊。35本發明提供了包含本發明核酸或本發明表達序列盒(例如載體)的轉基因植物。轉基因植物可以是穀類植物、玉米植物、馬鈴薯植物、番茄植物、小麥植物、含油種子植物、油菜籽植物、大豆植物、水稻植物、大麥植物或菸草植物。本發明提供了包含本發明核酸或本發明表達序列盒(例如載體)的轉基因種子。轉基因種子可以是穀類種子、玉米種子、小麥粒、含油種子、油菜籽、大豆種子、棕櫚核、向日葵種子、芝麻種子、花生或菸草植物種子。5本發明提供了包含與本發明的核酸互補的核酸序列或能與本發明的核酸在嚴緊條件下雜交的核酸序列的反義寡核苷酸。本發明提供了抑制纖維素酶例如內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或p-葡糖苷酶信息在細胞中翻譯的方法,該方法包括給細胞施用反義寡核苷酸或在細胞中表達反義寡核苷酸,所述反義寡核苷酸包括與本發明的核酸互補的核酸序列或能與本發明的核酸在嚴緊10條件下雜交的核酸序列。一方面,所述反義寡核苷酸的長度在大約10到50、大約20到60、大約30到70、大約40到80或大約60到100個鹼基之間,例如長度為10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、IOO或更多個鹼基。本發明提供了抑制纖維素酶例如內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或p-葡糖苷酶信息在細胞中翻譯的方法,該方法包括給細胞施15用反義寡核苷酸或在細胞中表達反義寡核苷酸,所述反義寡核苷酸包括與本發明的核酸互補的核酸序列或能與本發明的核酸在嚴緊條件下雜交的核酸序列。本發明提供了含有本發明的序列的子序列的雙鏈抑制RNA(RNAi或RNA幹擾)分子(包括小幹擾性RNA,或siRNA,用於抑制轉錄,以及微RNA或miRNA,用於抑制翻譯)。在一個方面,siRNA的長度為大約21至24個殘基之間,或大約20至少15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、40、45、50、55、60、65、70、75、80、85、90、95、100或更多個雙鏈核苷酸。本發明提供了抑制纖維素酶例如內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或|3-葡糖苷酶在細胞中的表達,所述方法包括向所述細胞施用雙鏈抑制RNA(siRNA或miRNA)或在所述細胞中表達雙鏈抑制RNA(siRNA25或miRNA),其中所述RNA含有本發明的序列的子序列。本發明提供了分離的或重組的多肽,包括在至少大約10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100、125、150、175、200、225、250、275、300、325、350或更多個殘基的區域內或者在多肽的全長區域內,與本發明的示例性多肽或肽具有至少大約50%、51%、52%、53%、54%、3055%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高或完全的(100%)序列同一性的胺基酸序列。一方面,序列同一性通過運用序列比較算法的分析或通過視覺觀察來確35定。本發明的示例性多肽或肽序列包括SEQIDNO:2,SEQIDNO:4,SEQIDNO:6,SEQDDNO:8,SEQIDNO:IO,SEQIDNO:12,SEQIDNO:14,SEQIDN0:16,SEQIDNO:I8,SEQIDNO:20,SEQIDNO:22,SEQIDNO:24,SEQIDNO:26,SEQIDNO:28,SEQIDNO:30,SEQIDNO:32,SEQIDNO:34,SEQIDNO:36,SEQIDNO:38,SEQIDNO:40,SEQIDNO:42,SEQIDNO:44,SEQIDNO:46,SEQIDNO:48,SEQIDNO:50,SEQIDNO:52,SEQIDNO:54,SEQIDNO:56,5SEQIDNO:58,SEQIDNO:60,SEQIDNO:62,SEQIDNO:64,SEQIDNO:66,SEQIDNO:68,SEQIDNO:70,SEQIDNO:72,SEQIDNO:74,SEQIDNO:76,SEQIDNO:78,SEQIDNO:80,SEQIDNO:82,SEQIDNO:84,SEQIDNO:86,SEQIDNO:88,SEQIDNO:90,SEQIDNO:92,SEQIDNO:94,SEQIDNO:96,SEQIDNO:98,SEQIDNO:100,SEQIDNO:102,SEQIDNO:104'SEQIDNO:106'10SEQIDNO:108'SEQIDNO:llO,SEQIDNO:112,SEQIDNO:114,SEQIDNO:116,SEQIDNO:m,SEQIDNO:120,SEQIDNO:122,SEQIDNO:124,SEQIDNO:126'SEQIDNO:128,SEQIDNO:130,SEQIDNO:132,SEQIDNO:134,SEQIDNO:136,SEQIDNO:138,SEQIDNO:140,SEQIDNO:142,SEQIDNO:144,SEQIDNO:146,SEQIDNO:148,SEQIDNO:150,SEQIDNO:152,15SEQIDNO:154,SEQIDNO:156,SEQIDNO:158,SEQIDNO:160,SEQIDNO:162,SEQIDNO:164和SEQIDNO:166(也參見下面的表1、2禾Q3、實施例l和4,和序列表)及其子序列和其變體。示例性多肽還包括長度為至少大約10、15、20、25、30、35、40、45、50、75、80、85、90、95、100、150、200、250、300、350、400、450、500、550、600或更多個殘基的片段,或者為酶的全長區域20內的片段。本發明的多肽或肽序列包括由本發明的核酸編碼的序列。本發明的多肽或肽序列包括由本發明的抗體特異性結合的多肽或肽(例如,表位),或可產生本發明的抗體的多肽或肽(例如,免疫原)。—方面,本發明的多肽具有至少一種纖維素酶活性,例如內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或p-葡糖苷酶活性。在可選的方面,本發明的多25核苷酸編碼具有至少一種纖維素酶活性的多肽,例如具有內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶活性的多肽。—方面,纖維素酶活性,例如內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶活性,是熱穩定的。多肽在包括如下溫度範圍的條件下可以保持纖維素酶活性,例如內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或卩-葡糖30苷酶活性大約rC到大約5'C之間,大約5'C到大約15'C之間,大約15'C到大約25'C之間,大約25。C到大約37。C之間,大約37X:到大約95。C之間,大約55'C到大約85。C之間,大約7(TC到大約75。C之間,或大約90'C到大約95'C之間,或更高溫度。在另一方面,纖維素酶活性,例如,內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或p-葡糖苷酶活性,可以是耐熱的。該多肽在暴露於如下範圍內的35溫度後可以保持纖維素酶活性,例如內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或p-葡糖苷酶活性37'C以上到大約95'C,或55'C以上到大約85'C的範圍內。一方面,該多肽在pH4.5時暴露於90'C以上到大約95'C的溫度後可以保持纖維素酶活性,例如內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶活性。本發明的另一方面提供了分離的或重組的多肽或肽,包括本發明的多肽或5肽序列、與其基本上相同的序列、與其互補的序列的至少10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100、125、150或更多個連續鹼基。該肽可以是例如免疫原性片段、基序(例如結合位點)、信號序列、前原序歹'J(preprosequence)或活性位點。本發明提供了分離的或重組的核酸,包括編碼具有纖維素酶活性例如,內]0切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或p-葡糖苷酶活性的多肽和信號序列的序列,其中所述核酸包括本發明的序列。信號序列可以來源於另一種纖維素酶,例如,內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶,或者非纖維素酶,例如非內切葡聚糖酶、非纖維二糖水解酶和/或非p-葡糖苷酶(異源)。本發明提供了分離的或重組的核酸,包括編碼具有纖維素酶活性,例如內切葡聚15糖酶、纖維二糖水解酶、甘露聚糖酶和/或(3-葡糖苷酶活性的多肽的序列,其中所述序列不含有信號序列,所述核酸包括本發明的序列。一方面,本發明提供了分離的或重組的多肽,包括本發明的多肽,其缺少信號序列的全部或部分。一方面,所述分離的或重組的多肽可以包括本發明的多肽,其含有異源信號序列,例如異源纖維素酶信號序列如內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖20苷酶信號序列,或非纖維素酶信號序列如非內切葡聚糖酶、非纖維二糖水解酶和/或非P-葡糖苷酶信號序列。—方面,本發明提供了嵌合蛋白,其包括含有本發明的信號序列的第一結構域和至少第二結構域。該蛋白可以是融合蛋白。第二結構域可以包括酶。該酶可以是非酶(non-enzym(S)。25本發明提供了嵌合多肽,包括含有本發明的信號肽(SP)、前原序列和/或催化結構域(CD)的至少第一結構域以及含有異源多肽或肽的第二結構域,其中所述異源多肽或肽不與所述信號肽(SP)、前原序列和/或催化結構域(CD)天然相關。一方面,所述異源多肽或肽不是纖維素酶,例如內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或(3-葡糖苷酶。所述異源多肽或肽可以在所述信號肽(SP)、30前原序列和/或催化結構域(CD)的氨基端、羧基端或兩端。本發明提供了編碼嵌合多肽的分離的或重組的核酸,其中所述嵌合多肽包括含有本發明的信號肽(SP)、前原結構域和/或催化結構域(CD)的至少第一結構域以及含有異源多肽或肽的第二結構域,其中所述異源多肽或肽不與所述信號肽(SP)、前原結構域和/或催化結構域(CD)天然相關。35本發明提供了分離的或重組的信號序列(例如,信號肽),其包括本發明的多肽的殘基1至14、1至15、1至16、1至17、1至18、1至19、1至20、115NO:26NO:36NO:46NO:56NO:66NO:76NO:86NO:96SEQIDNO:28,SEQIDNO:38,SEQIDNO:48,SEQIDNO:58,SEQIDNO:68,SEQIDNO:78'SEQIDNO:88,SEQIDNO:98,SEQIDNO:24,SEQIDSEQIDNO:34,SEQIDSEQIDNO:44,SEQIDSEQIDNO:54,SEQIDSEQIDNO:64,SEQIDSEQIDNO:74,SEQIDSEQIDNO:84,SEQIDSEQIDNO:94,SEQID至21、1至22、1至23、1至24、1至25、1至26、1至27、1至28、1至28、1至30、1至31、1至32、1至33、1至34、1至35、1至36、1至37、1至38、1至40、1至41、1至42、1至43、1至44、1至45、1至46或1至47所示的序列或由本發明的多肽的殘基1至14、1至15、1至16、1至17、1至18、1至19、51至20、1至21、1至22、1至23、1至24、1至25、1至26、1至27、1至28、1至28、1至30、1至31、1至32、1至33、1至34、1至35、1至36、1至37、1至38、1至40、1至41、1至42、1至43、1至44、1至45、1至46或1至47所示的序列組成,本發明的多肽例如示例性的SEQIDNO:2,SEQIDNO:4,SEQIDNO:6,SEQIDNO:8,SEQIDNO:10,SEQIDNO:12'SEQIDNO:14,SEQID10NO:16,SEQIDNO:18,SEQIDNO:20,SEQIDNO:22,SEQIDNO:30,SEQIDNO:32,SEQIDNO:40,SEQIDNO:42,SEQIDNO:50,SEQIDNO:52,SEQIDNO:60,SEQIDNO:62,SEQIDNO:70,SEQIDNO:72,SEQIDNO:80,SEQIDNO:82,SEQIDNO:90,SEQIDNO:92,SEQIDNO:100,SEQIDNO:102,SEQIDNO:104,SEQIDNO:106,SEQIDNO:108,SEQIDNO:110,SEQIDNO:112,SEQIDNO:114,20SEQIDNO:116,SEQIDNO:118,SEQIDNO:120,SEQIDNO:122,SEQIDNO:124,SEQIDNO:I26,SEQIDNO:128,SEQIDNO:130,SEQIDNO:132,SEQIDNO:134,SEQIDNO:136,SEQIDNO:138,SEQIDNO:140,SEQIDNO:142,SEQIDNO:144,SEQIDNO:146,SEQIDNO:148,SEQIDNO:150,SEQIDNO:152,SEQIDNO:154,SEQIDNO:156,SEQIDNO:158,SEQID25NO:160,SEQIDNO:162,SEQIDNO:164或SEQIDNO:166(也參見下面的表1、2和3、實施例1和4,以及序列表)。一方面,本發明提供了信號序列,其包括本發明的多肽的前14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、3064、65、66、67、68、69、70或更多個氨基端殘基。—方面,纖維素酶活性,例如內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或p-葡糖苷酶活性,包括在大約37i:每毫克蛋白大約1到大約1200單位,或每毫克蛋白大約100到大約1000單位的範圍內的比活性。另一方面,纖維素酶活性,例如內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或卩-葡糖苷酶活性,35包括每毫克蛋白從大約100到大約1000單位,或從大約500到大約750單位的比活性。可以選擇地,纖維素酶活性,例如內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶活性,包括在37'C每毫克蛋白從大約1到大約750單位,或每毫克蛋白大約500到大約1200單位的範圍內的比活性。一方面,纖維素酶活性,例如內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶活性,包括在37'C每毫克蛋白從大約1到大約500單位,或每毫克蛋白大約750到大約10005單位的範圍內的比活性。另一方面,纖維素酶活性,例如內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶活性,包括在37。C每毫克蛋白從大約1到大約250單位的範圍內的比活性。可選地,纖維素酶活性,例如內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或卩-葡糖苷酶活性,包括在37'C每毫克蛋白從大約1到大約100單位的範圍內的比活性。10另一方面,耐熱性包括在被加熱到高溫後,保持在37'C時纖維素酶例如內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶的比活性的至少一半。可以選擇地,耐熱性可以包括在被加熱到高溫後,保持在37'C每毫克蛋白從大約1到大約1200單位,或每毫克蛋白大約500到大約1000單位的範圍內的比活性。另一方面,耐熱性可以包括在被加熱到高溫後,保持在37'C每毫克蛋白從大約115到大約500單位的範圍內的比活性。本發明提供了本發明的分離的或重組的多肽,其中所述多肽包括至少一個糖基化位點。一方面,糖基化可以是N-連接糖基化。一方面,多肽可以在畢赤酵母(i^mton'"或裂變酵母(S./w&)中被表達後被糖基化。—方面,多肽可以在包括大約pH6.5、pH6、pH5.5、pH5、pH4.5或pH204的更酸性的條件下保持纖維素酶活性,例如,內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶活性。另一方面,多肽可以在包括大約pH7、pH7.5、pH8.0、pH8.5、pH9、pH9.5、pH10、pH10.5或pH11或更鹼性的條件下保持纖維素酶活性,例如,內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或(3-葡糖苷酶活性。一方面,多肽可以在暴露於包括大約pH6.5、pH6、pH5.5、pH5、pH254.5或pH4的更酸性pH的條件下保持纖維素酶活性,例如,內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或|3-葡糖苷酶活性。另一方面,多肽可以在暴露於包括大約pH7、pH7.5、pH8.0、pH8.5、pH9、pH9.5、pH10、pH10.5或pH11或更鹼性pH的條件下保持纖維素酶活性,例如,內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或p-葡糖苷酶活性。30—方面,本發明的纖維素酶,例如,內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶,在鹼性條件下,例如在腸道如小腸的鹼性條件下,具有活性。一方面,多肽在暴露於胃的酸性pH後保持活性。本發明提供了含有本發明的多肽(包括肽)的蛋白製劑,其中該蛋白製劑包括液體、固體或凝膠。本發明提供了包含本發明的多肽和第二蛋白或結構域的35異二聚體。該異二聚體的第二成員可以是不同的纖為素酶,例如,內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶,不同的酶或另一種蛋白。一方面,第二域結構可以是多肽,異源二聚體可以是融合蛋白。一方面,第二結構域可以是表位(epitope)或標記物(tag)。一方面,本發明提供了包含本發明的多肽的同型二聚體。本發明提供了具有纖維素酶活性例如內切葡聚糖酶、纖維二糖水解酶、甘5露聚糖酶和/或P-葡糖苷酶活性的固定化多肽(包括肽),其中所述固定化多肽包括本發明的多肽、由本發明的核酸編碼的多肽、或含有本發明的多肽和第二結構域的多肽。一方面,多肽可以被固定在細胞、金屬、樹脂、聚合物、陶瓷、玻璃、微電極、石墨顆粒、珠子、凝膠、平板、陣列或毛細管上。本發明還提供了包含本發明的固定化核酸的陣列,包括,例如本發明的探10針。本發明還提供了包含本發明的抗體的陣列。本發明提供了分離的或重組的抗體,其與本發明的多肽或與由本發明的核酸編碼的多肽特異性結合。本發明的這些抗體可以是單克隆或多克隆抗體。本發明提供了包含本發明的抗體的雜交瘤,所述抗體例如,與本發明的多肽或與由本發明的核酸編碼的多肽特異性結合的抗體。本發明提供了編碼這些抗體的核酸。15本發明提供了分離或鑑定具有纖維素酶活性如內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶活性的多肽的方法,該方法包括如下步驟(a)提供本發明的抗體;(b)提供包含多肽的樣品;和(c)將步驟(b)的樣品與步驟(a)的抗體在所述抗體能與所述多肽特異性結合的條件下接觸,從而分離或鑑定具有纖維素酶活性如內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖20苷酶活性的多肽。本發明提供了製備抗纖維素酶抗體——例如抗內切葡聚糖酶抗體、抗纖維二糖水解酶抗體和/或抗P-葡糖苷酶抗體——的方法,該方法包括以足夠的量向非人動物施用本發明的核酸或本發明的多肽或其子序列,所述的量足以產生體液免疫應答,由此製備抗纖維素酶抗體,例如,—抗內切葡聚糖酶抗體V杭纖餘二糖水25解酶抗體和/或抗P-葡糖苷酶抗體。本發明提供了產生抗纖維素酶免疫應答(細胞應答或體液應答)——例如抗內切葡聚糖酶免疫應答、抗纖維二糖水解酶免疫應答和/或抗P-葡糖苷酶免疫應答——的方法,該方法包括以足以產生免疫應答(細胞應答或體液應答)的量向非人動物施用本發明的核酸或本發明的多肽或其子序列。30本發明提供了產生重組多肽的方法,包括如下步驟(a)提供與啟動子可操作地連接的本發明的核酸;和(b)在允許多肽表達的條件下表達步驟(a)的核酸,從而產生重組多肽。一方面,該方法可進一步包括用步驟(a)的核酸轉化宿主細胞,隨後表達步驟(a)的核酸,從而在轉化細胞中產生重組多肽。本發明提供了用於鑑定具有纖維素酶活性如內切葡聚糖酶、纖維二糖水解35酶、甘露聚糖酶和/或p-葡糖苷酶活性的多肽的方法,該方法包括如下步驟(a)提供本發明的多肽;或由本發明的核酸編碼的多肽;(b)提供纖維素酶底物,例如內切葡聚糖酶底物、纖維二糖水解酶底物、甘露聚糖酶底物和/或p-葡糖苷酶底物;和(c)用步驟(b)的底物接觸步驟(a)的多肽或其片段或其變體,並且檢測底物量的降低或反應產物量的增加,其中底物量的降低或反應產物量的增加檢測出具有纖維素酶活性如內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或p-葡5糖苷酶活性的多肽。一方面,底物可以是含纖維素的化合物。本發明提供了用於鑑定纖維素酶底物的方法,如內切葡聚糖酶底物、纖維二糖水解酶底物、甘露聚糖酶底物和/或p-葡糖苷酶底物,包括如下步驟(a)提供本發明的多肽;或由本發明的核酸編碼的多肽;(b)提供測試底物;和(C)用步驟(b)的測試底物接觸步驟(a)的多肽,並且檢測底物量的降低或反應產物10量的增加,其中底物量的降低或反應產物量的增加檢測出作為纖維素酶底物如內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或p-葡糖苷酶的測試底物。本發明提供了確定測試化合物是否與多肽特異性結合的方法,包括如下步驟(a)在允許核酸翻譯為多肽的條件下表達核酸或包含核酸的載體,其中所述核酸包括本發明的核酸,或提供本發明的多肽;(b)提供測試化合物;(c)用測15試化合物接觸多肽;和(d)確定步驟(b)的測試化合物是否與多肽特異性結合。本發明提供了用於鑑定纖維素酶活性如內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶活性的調節劑的方法,包括如下步驟(a)提供本發明的多肽,或由本發明的核酸編碼的多肽;(b)提供測試化合物;和(C)用步驟(b)的測試化合物接觸步驟(a)的多肽,並測定纖維素酶如內切葡聚糖酶、纖20維二糖水解酶、甘露聚糖酶和/或p-葡糖苷酶的活性,其中在存在測試化合物的情況下測定的纖維素酶活性——如內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或p-葡糖苷酶活性——與不存在測試化合物的情況下測定的活性相比的變化,確定了該測試化合物調節纖維素酶活性,如內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶莉或p-葡糖苷酶活性。一方面T纖維素酶活性,例扭內切葡聚糖酶、纖雒25二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶活性,可以通過提供纖維素酶底物,例如內切葡聚糖酶底物、纖維二糖水解酶底物、甘露聚糖酶底物和/或p-葡糖苷酶底物,並檢測底物量的降低或反應產物量的增加,或底物量的增加或反應產物量的降低來測量。與沒有測試化合物時底物或反應產物的量相比,有測試化合物時底物量的降低或反應產物量的增加鑑定出作為纖維素酶如內切葡聚糖酶、纖維二糖30水解酶、甘露聚糖酶和/或P-葡糖苷酶活性的激活劑的測試化合物。與沒有測試化合物時底物或反應產物量相比,有測試化合物時底物量的增加或反應產物量的降低鑑定出作為纖維素酶如內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶活性的活性的抑制劑的測試化合物。本發明提供了計算機系統,該系統包括處理器和數據存儲設備,其中所述35數據存儲設備上已經存儲了本發明的多肽序列或核酸序列(例如由本發明的核酸編碼的多肽或肽)。一方面,計算機系統可以進一步包括序列比較算法和數據存儲設備,其中數據存儲設備上已經存儲了至少一個參考序列。另一方面,序列比較算法包括可指出多態現象(多態性)的電腦程式。一方面,計算機系統可以進一步包括在所述序列中鑑定一個或多個特徵的鑑定器(標識符,identifiers本發明提供了計算機可讀介質,其上已經存儲了本發明的多肽序列或核酸序列。本發5明提供了用於鑑定序列中的特徵的方法,包括如下步驟(a)使用可鑑定序列中的一個或多個特徵的電腦程式讀取序列,其中所述序列包括本發明的多肽序列或核酸序列;和(b)用所述電腦程式鑑定序列中的一個或多個特徵。本發明提供了將第一序列與第二序列進行比較的方法,包括如下步驟(a)通過使用可比較序列的電腦程式讀取第一序列和第二序列,其中第一序列包括本發明的多肽10序列或核酸序列;和(b)用所述電腦程式確定第一序列和第二序列之間的差異。確定第一序列和第二序列之間差異的步驟可以進一步包括鑑定多態性的步驟。一方面,該方法可以進一步包括可鑑定序列中的一個或多個特徵的鑑定器。另一方面,該方法可以包括使用電腦程式讀取第一序列,並鑑定該序列中的一個或多個特徵。15本發明提供了從環境樣品中分離或回收核酸的方法,所述核酸編碼具有纖維素酶活性如內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶活性的多肽,該方法包括如下步驟(a)提供用於擴增編碼具有纖維素酶如內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或p-葡糖苷酶活性的多肽的核酸的擴增引物序列對,其中所述引物對能擴增本發明的核酸;(b)從環境樣品中分離核酸,20或處理環境樣品,以便樣品中的核酸可實現與擴增引物對雜交;和(c)將步驟(a)的擴增引物對與步驟(b)的核酸結合,並從環境樣品中擴增核酸,從而從環境樣品中分離或回收編碼具有纖維素酶如內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或p-葡糖苷酶活性的多肽的核酸。擴增引物序列對的一個或每一成員可以包括寡核苷酸,該寡核苷酸包括本發明的擴增引物序列對,例如,具有本發朋的序25列的至少大約10到50個連續鹼基。本發明提供了從環境樣品中分離或回收核酸的方法,所述核酸編碼具有纖維素酶如內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶活性的多肽,該方法包括如下步驟(a)提供包含本發明的核酸或其子序列的多核苷酸探針;(b)從環境樣品分離核酸,或處理環境樣品,以便樣品中的核酸可實現與步30驟(a)的多核苷酸探針雜交;(c)將步驟(a)的多核苷酸探針與步驟(b)的分離的核酸或處理的環境樣品結合;和(d)分離與步驟(a)的多核苷酸探針特異性雜交的核酸,從而從環境樣品中分離或回收編碼具有纖維素酶如內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶活性的多肽的核酸。環境樣品可以包括水樣品、液體樣品、土壤樣品、空氣樣品或生物樣品。一方面,生物樣品可35以來源於細菌細胞、原生動物細胞、昆蟲細胞、酵母細胞、植物細胞、真菌細胞或哺乳動物細胞。本發明提供了產生編碼具有纖維素酶如內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或)3-葡糖苷酶活性的多肽的核酸變體的方法,該方法包括如下步驟(a)提供包括本發明的核酸的模板核酸;和(b)在模板序列中修飾、刪除或添加一個或多個核苷酸,或進行修飾、刪除和添加的組合,以產生模板核酸的變體。5—方面,該方法可以進一步包括表達變體核酸,以產生變體纖維素酶多肽,如內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶多肽。修飾、添加或刪除通過包括如下方法中的方法來引入,包括易錯PCR、改組(重排,shuffling)、寡核苷酸誘導的定向突變、裝配PCR、有性PCR誘變、體內誘變、盒式誘變、遞歸整體誘變(recursiveensemblemutagenesis)、指數整體誘變、位點特異性誘變、10基因再裝配、基因位點飽和誘變(GSSM)、合成連接重裝配(SLR)、染色體飽和誘變(CSM)或其組合。另一方面,修飾、添加或刪除通過如下方法的方法引入包括重組、遞歸序列重組、硫代磷酸酯修飾的DNA誘變、含尿嘧啶模板誘變、缺口雙重誘變(gappedduplexmutagenesis)、點錯配修復誘變、修復缺陷型宿主株誘變、化學誘變、放射誘變、缺失誘變、限制選擇誘變、限制純化誘變、人工基因15合成、整體誘變、嵌合核酸多聚體生成及其組合。—方面,該方法可以被反覆重複,直到產生與模板核酸編碼的多肽相比具有改變的或不同的活性或者改變的或不同的穩定性的纖維素酶,如內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或(3-葡糖苷酶。一方面,變體纖維素酶多肽,如內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶多肽,是耐熱的,20在暴露於升高的溫度之後可以保持一些活性。另一方面,與模板核酸編碼的纖維素酶如內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或p-葡糖苷酶相比,變體纖維素酶多肽,如內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或|3-葡糖苷酶多肽,具有增加的糖基化。可以選擇地,變體纖維素酶多肽,如內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或p-葡糖苷酶多肽,在高溫下具有纖維素酶話性,25例如內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶活性,其中由模板核酸編碼的纖維素酶,如內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或p-葡糖苷酶,在高溫下沒有活性。一方面,該方法可以被反覆重複,直到產生具有與模板核酸的密碼子使用有所不同的密碼子使用的纖維素酶編碼序列,如內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或l3-葡糖苷酶編碼序列。另一方面,該30方法可以被反覆重複,直到產生具有比模板核酸的信息表達或穩定性更高或更低水平的信息表達或穩定性的纖維素酶基因,如內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或p-葡糖苷酶基因。本發明提供了在編碼具有纖維素酶活性——如內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或p-葡糖苷酶活性——的多肽的核酸中修飾密碼子以增加其35在宿主細胞中的表達的方法,該方法包括如下步驟(a)提供編碼具有纖維素酶活性——如內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶活性一一的多肽的本發明的核酸;和(b)鑑定步驟(a)的核酸中非優選或較不優選的密碼子,用優選的或中度使用(neutrallyused)的密碼子來代替,所述優選或中度使用的密碼子編碼與被取代的密碼子相同的胺基酸,其中優選密碼子是在宿主細胞的基因的編碼序列中過度表現的密碼子,非優選或較不優選密碼子是在宿主細5胞的基因的編碼序列中表現不足的密碼子,從而修飾核酸以增加其在宿主細胞中的表達。本發明提供了在編碼具有纖維素酶活性——如內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶活性——的多肽的核酸中修飾密碼子的方法,該方法包括如下步驟(a)提供本發明的核酸;和(b)鑑定歩驟(a)的核酸中的10密碼子,並用不同的密碼子來代替,所述不同的密碼子編碼與被取代的密碼子相同的胺基酸,從而修飾在編碼纖維素酶如內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或p-葡糖苷酶的核酸中的密碼子。本發明提供了在編碼具有纖維素酶活性——如內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶活性——的多肽的核酸中修飾密碼子以增加其15在宿主細胞中的表達的方法,該方法包括如下步驟(a)提供編碼纖維素酶多肽如內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或p-葡糖苷酶多肽的本發明核酸;和(b)鑑定步驟(a)的核酸中的非優選或較不優選密碼子,並用優選的或中度使用的密碼子來代替,所述優選或中度使用的密碼子編碼與被取代的密碼子相同的胺基酸,其中優選密碼子是在宿主細胞的基因的編碼序列中過度表現的密20碼子,非優選或較不優選密碼子是在宿主細胞的基因的編碼序列中表現不足的密碼子,從而修飾核酸以增加其在宿主細胞中的表達。本發明提供了在編碼具有纖維素酶活性——如內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶活性——的多肽的核酸中修飾密碼子以降低其在宿主細胞中的表達的方法,該方法包括如下步驟(a)提供本發明的核酸;和25(b)鑑定步驟(a)的核酸中的至少一個優選密碼子,並用非優選的或較不優選的密碼子來代替,所述非優選或較不優選的密碼子編碼與被取代的密碼子相同的胺基酸,其中優選密碼子是在宿主細胞的基因的編碼序列中過度表現的密碼子,非優選或較不優選的密碼子是在宿主細胞的基因的編碼序列中表現不足的密碼子,從而修飾核酸以降低其在宿主細胞中的表達。一方面,宿主細胞可以是細菌30細胞、真菌細胞、昆蟲細胞、酵母細胞、植物細胞或哺乳動物細胞。本發明提供了用於產生核酸文庫的方法,所述核酸編碼一系列的被修飾的纖維素酶——例如內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或p-葡糖苷酶——活性位點或底物結合位點,其中被修飾的活性位點或底物結合位點來源於第一核酸,所述第一核酸包含編碼第一活性位點或第一底物結合位點的序列,該方35法包括如下步驟(a)提供第一核酸,其編碼第一活性位點或第一底物結合位點,其中所述第一核酸序列包括在嚴緊條件下與本發明的核酸雜交的序列,所述核酸編碼纖維素酶如內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶活性位點或纖維素酶如內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或卩-葡糖苷酶底物結合位點;(b)提供一組誘變寡核苷酸,其在第一核酸的多個目標密碼子處編碼天然發生的胺基酸變體;和(C)使用該組誘變寡核苷酸,產生一組編碼活5性位點或編碼底物結合位點的變體核酸,其在被誘變的每一胺基酸密碼子處編碼一定範圍的胺基酸變化,從而產生編碼多個被修飾的纖維素酶如內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶活性位點或底物結合位點的核酸文庫。一方面,該方法包括通過包括如下方法中的方法誘變步驟(a)的第一核酸優化的定向進化系統、基因位點飽和誘變(GSSM)、合成連接重裝配(SLR)、易10錯PCR、改組、寡核苷酸誘導的定向突變、裝配PCR、有性PCR誘變、體內誘變、盒式誘變、遞歸整體誘變、指數整體誘變、位點特異性誘變、基因再裝配及其組合。另一方面,該方法包括通過包括如下方法中的方法誘變步驟(a)的第一核酸或變體重組、遞歸序列重組、硫代磷酸酯修飾的DNA誘變、含尿嘧啶模板誘變、缺口雙重誘變、點錯配修復誘變、修復缺陷型宿主株誘變、化學誘變、放射誘變、15缺失誘變、限制選擇誘變、限制純化誘變、人工基因合成、整體誘變、嵌合核酸多聚體生成及其組合。本發明提供了產生小分子的方法,包括如下步驟(a)提供多個能合成或修飾小分子的生物合成酶,其中這些酶中的一種酶包括由本發明的核酸編碼的纖維素酶,如內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或卩-葡糖苷酶;(b)20為步驟(a)的至少一種酶提供底物;和(c)將步驟(b)的底物與這些酶在能促進多個生物催化反應的條件下通過一系列生物催化反應進行反應,以產生小分子。本發明提供了修飾小分子的方法,包括如下步驟(a)提供纖維素酶,如內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或(3-葡糖苷酶,其中該酶包括本發明的多肽,或由本發明的核酸編碼的多肽,或其子序列;(b)提供小分子;和(c)將25步驟(b)的小分子與步驟(a)的酶在能促進由纖維素酶如內切葡聚糖酶、纖維一.糖水解酶、甘露聚糖酶和/或(3-葡糖苷酶催化的酶促反應的條件下進行反應,從而通過纖維素酶如內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶酶促反應修飾小分子。一方面,該方法可以包括為步驟(a)的酶提供多個小分子底物,從而產生通過由纖維素酶如內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶30和/或卩-葡糖苷酶催化的至少一種酶促反應產生的被修飾小分子的文庫。一方面,該方法可以包括多個其它的酶,在有助於這些酶介導的多個生物催化反應的條件下使用這些酶,以形成由多個酶促反應產生的被修飾小分子的文庫。另一方面,該方法可以進一步包括測試該文庫以確定該文庫中是否存在表現出期望活性的特定被修飾小分子的步驟。測試該文庫的步驟可以進一步包括系統地去除所有但保35留一個用於產生文庫中多個被修飾小分子中的一部分的生物催化反應,方法是通過測試被修飾小分子的所述部分中存在或不存在具有期望活性的特定被修飾小分子,鑑定出產生具有期望活性的特定修飾小分子的至少一個特定生物催化反應。本發明提供了確定纖維素酶如內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或(3-葡糖苷酶的功能片段的方法,包括如下步驟(a)提供纖維素酶如內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶,其中該酶包括本發明5的多肽或由本發明的核酸編碼的多肽、或其子序列;和(b)從步驟(a)的序列刪除多個胺基酸殘基,並測試剩餘的子序列的纖維素酶如內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或p-葡糖苷酶活性,從而確定纖維素酶如內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或(3-葡糖苷酶的功能片段。一方面,纖維素酶如內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或p-葡糖苷酶活性通過提供纖維10素酶如內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或p-葡糖苷酶底物並檢測底物量的減少或反應產物量的增加來測量。本發明提供了通過使用實時代謝流(real-timemetabolicflux)分析進行新的或修飾的表型的全細胞工程改造的方法,該方法包括如下步驟(a)通過修飾細胞的遺傳組成產生修飾的細胞,其中所述遺傳組成通過將本發明的核酸加入到15細胞來修飾(b)培養修飾的細胞以產生多個修飾的細胞;(c)通過實時監控步驟(b)的細胞培養物來測量該細胞的至少一個代謝參數;和(d)分析步驟(c)的數據,以確定被測量的參數是否與在類似條件下未修飾細胞中的參照測量值不同,從而使用實時代謝流量分析鑑定細胞中的工程表型。一方面,細胞的遺傳組成可以通過包括在細胞中序列的刪除或序列的修飾,或敲除基因的表達的方法來20修飾。一方面,該方法可以進一步包括選擇含有新的工程表現型的細胞。另一方面,該方法可以包括培養被選擇的細胞,從而產生包含新的工程表型的新細胞株。本發明提供了增加纖維素酶如內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或(3-葡糖苷酶的多肽的耐熱性或熱穩定性的方法,該方法包括糖基化纖維素酶如內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或p-葡糖苷酶的多肽,其中25該多肽包括本發明的多肽或由本發明的核酸序列編碼的多肽的至少三十個連續胺基酸,從而增加纖維素酶如內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或卩-葡糖苷酶的多肽的耐熱性或熱穩定性。一方面,纖維素酶如內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶的比活性可以在大於大約37'C到大約95'C的溫度範圍內是熱穩定的或耐熱的。30本發明提供了在細胞中過量表達重組纖維素酶如內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶的多肽的方法,該方法包括表達含有核酸的載體,該核酸包括本發明的核酸或本發明的核酸序列,其中序列同一性通過使用序列比較算法的分析或通過視覺觀察來確定,其中過量表達通過使用高活性啟動子、雙順反子(dicistronic)載體或通過該載體的基因擴增來實現。35本發明提供了產生轉基因植物的方法,該方法包括如下步驟(a)將異源核酸序列引入細胞中,其中異源核酸序列包括本發明的核酸序列,從而產生轉化的植物細胞;和(b)從轉化的細胞產生轉基因植物。一方面,歩驟(a)可以進一步包括通過植物細胞原生質體的電穿孔或顯微注射引入異源核酸序列。另一方面,歩驟(a)可以進一歩包括通過DNA微粒轟擊(DNAparticlebombardment)將異源核酸序列直接引入植物組織中。可以選擇地,歩驟(a)可以進一歩包括使5用根瘤農桿菌(Jgra6ac/m'ww/M膨/adms)宿主將異源核酸序列引入植物細胞DNA中。一方面,植物細胞可以是甘蔗、甜菜、大豆、番茄、馬鈴薯、玉米、稻、小麥、菸草或大麥細胞。本發明提供了在植物細胞中表達異源核酸序列的方法,該方法包括如下步驟(a)用與啟動子可操作地連接的的異源核酸序列轉化植物細胞,其中異源核10酸序列包括本發明的核酸;(b)在異源核酸序列可在植物細胞中表達的條件下培養所述植物。本發明提供了在植物細胞中表達異源核酸序列的方法,該方法包括如下步驟(a)用與啟動子可操作地連接的的異源核酸序列轉化植物細胞,其中異源核酸序列包括本發明的序列;(b)在異源核酸序列可在植物細胞中表達的條件下培養所述植物。15本發明提供了飼料或食物,其含有本發明的多肽或本發明的核酸編碼的多肽。一方面,本發明提供了食品、飼料、液體如飲料(如果汁或啤酒)、麵包或麵團或麵包產品、或飲料前體(例如,麥芽汁),其含有本發明的多肽。本發明提供了動物的食物或營養補充劑,其含有本發明的多肽,例如,由本發明的核酸編碼的多肽。20—方面,食物或營養補充劑中的多肽可以被糖基化。本發明提供了可食用的酶輸送基質,其含有本發明的多肽,例如,由本發明的核酸編碼的多肽。一方面,該輸送基質包括丸劑。一方面,多肽可被糖基化。一方面,纖維素酶如內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶的活性是耐熱的。另一方面,纖維素酶如內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或|3-葡糖苷酶25的活性是熱穩定的。本發明提供了含有本發明的多肽的食物、飼料或營養補充劑。本發明提供了將纖維素酶如內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶用作動物飲食中的營養補充劑的方法,所述方法包括製備含有纖維素酶如內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶的營養添加物,所述纖維30素酶包含本發明的多肽的至少三十個連續胺基酸;以及向動物施用所述營養添加物。動物可以是人、反芻動物或單胃動物。通過在選自細菌、酵母、植物、昆蟲、真菌和動物的生物體中表達編碼纖維素酶如內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶的多核苷酸,可以製備纖維素酶如內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或|3-葡糖苷酶。所述生物體可選自裂變酵母(Spow6e)、35釀酒酵母(S.cem^/ae)、畢赤酵母(屍/cWa,網加^)、大腸桿菌(£.co//.)、鏈黴菌屬某種(&re^o/^cwsp.)、桿菌屬某種(£flc///Wlysp.)和乳酸桿菌屬某種"ac/o6ac///2^sp.)。本發明提供了可食用的酶輸送基質,其含有熱穩定的重組纖維素酶,例如內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或(3-葡糖苷酶,如本發明的多肽。本發明提供了向動物輸送纖維素酶如內切葡聚糖酶、纖維二糖水解酶、甘露聚糖5酶和/或(3-葡糖苷酶補充劑的方法,所述方法包括製備丸劑形式的可食用的酶輸送基質,其含有粒狀可食用載體以及熱穩定的重組纖維素酶,例如內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或|3-葡糖苷酶,其中所述丸劑容易將包含在其中的纖維素酶如內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶分散入含水介質中,以及向所述動物施用該可食用酶輸送基質。重組纖維素酶,例如10內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或p-葡糖苷酶,可以包括本發明的多肽。纖維素酶,例如內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶,可被糖基化,以在壓丸條件下提供熱穩定性。該輸送基質可以通過對含有穀物胚芽和纖維素酶如內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶的混合物進行壓丸而形成。壓丸條件可包括蒸汽的應用。壓丸條件可包括15應用超過約8(TC的溫度約5分鐘,而該酶保持每毫克蛋白至少大約350到大約900單位的比活性。—方面,本發明提供了藥物組合物,其含有本發明的纖維素酶如內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶,或者本發明的核酸編碼的多肽。一方面,藥物組合物作為助消化劑。20在某些方面,含纖維素化合物與具有纖維素酶如內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶活性的本發明多肽在約pH3.0至9.0、10.0、ll.O或更高的範圍的pH下接觸。在其它方面,含纖維素化合物與纖維素酶例如內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶在約55'C、60°C、65°C、70°C、75°C、80°C、85°C、90。C或更高的溫度下接觸。25本發明的一個或多個方面的細節如附圖和下面的描述所示。本發明的其它特徵、目標和優點將通過說明書和附圖以及權利要求而更加清楚。此處引述的所有出版物、專利、專利申請、GenBank序列和ATCC保藏物均被特意地引入,以作為參考,用於所有目的。30下面的附圖是本發明的方面的例證性說明,而不意圖限制權利要求書所包括的本發明的範圍。圖l是一個計算機系統的框圖。圖2是一個流程圖,該圖示意性說明了用於將新核苷酸或蛋白序列與序列35資料庫進行比較以確定該新序列與資料庫中序列之間的同源性水平的過程的一個方面。圖3是一個流程圖,該圖示意性說明了在計算機中確定兩個序列是否同源的過程的一個方面。圖4是一個流程圖,該圖示意性說明了檢測序列中特徵的存在的鑑定過程300的一個方面。5圖5是纖維二搪結構的示意圖。圖6和7示意性說明了來自纖維己糖的反應產物的TLC分析結果,如在下面的實施例1中所詳細討論的。圖8以圖形數據進行例證性說明,顯示了通過本發明的示例性酶22/22a(CBH)從PASC釋放纖維二糖,如在下面的實施例2所詳細討論的。10圖9以圖形數據進行例證性說明,顯示了通過本發明的示例性酶22/22a(CBH)從AVICELMCC釋放纖維二糖,如在下面的實施例2所詳細討論的。圖10以圖表數據進行了例證性說明,顯示了典型的GIGAMATRIXbreakout,其中表達能夠水解甲基傘形基纖維二糖苷的活性克隆被鑑定,如下面的實施例4所詳細討論的。15圖11以圖表數據進行了例證性說明,通過毛細管電泳(CE)分析顯示了所選擇的酶對磷酸溶脹纖維素(phosphoricacid-swollencellulose,PASC)的活性,如下面的實施例4所詳細討論的。圖12以圖表數據進行了例證性說明,數據來自本發明的示例性酶和亞克隆變體在AVICELMicrocrystallineCellulose(MCC)中的分析,其中通過BCA還原20糖測定來分析反應產物,如下面的實施例4所詳細討論的。圖13以圖表數據進行了例證性說明,數據來自一級GSSM篩選分析,如下面的實施例4所詳細討論的。圖14以圖表數據進行了例證性說明,數據來自二級GSSM篩選分析,如下面的實施例4所詳細討論的。25圖15以圖表數據進行了例證性說明,數據來自混合的或"摻合的"GSSM篩選分析,如下面的實施例4所詳細討論的。在不同的附圖中同樣的標記符號表示同樣的要素。發明詳述30本發明提供了具有纖維素酶活性例如內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶活性的多肽、編碼它們的多核苷酸、以及製備和使用這些多核苷酸和多肽的方法。本發明還提供了纖維素酶,例如內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶,編碼這些酶的多核苷酸、這類多核苷酸和多肽的應用。35—方面,本發明提供了纖維素酶,例如內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶,其具有增強的催化速率,改善了底物水解過程。在催化速率上的這種增加的效率導致在生產糖類上增加的效率,所述糖類隨後可被微生物用於乙醇生產。一方面,產生本發明的酶的微生物與產乙醇微生物一起使用。因此,本發明提供了生產乙醇和製備基於乙醇的"清潔燃料"的方法,例如,用於利用生物乙醇進行的運輸。5—方面,本發明提供了組合物(例如,酶製劑、飼料、藥物、飲食補充物),其包括本發明的酶、多肽或多核苷酸。這些組合物可以以各種形式加以配製,例如液體、凝膠、丸劑、片劑、噴劑、粉末、食物、飼料小丸或包括納米膠囊劑型在內的膠囊劑型。測量纖維素酶活性如內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或卩-10葡糖苷酶活性的分析試驗,例如用於確定多肽是否具有纖維素酶活性,如內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或|3-葡糖苷酶活性的分析試驗,在本領域中是熟知的,並且在本發明的範圍內;參見,例如BakerWL,PanowA,Estimationofcellulaseactivityusingaglucose-oxidase-Cu(II)reducingassayforglucose,JBiochemBiophysMethods.1991Dec,23(4):265-73jSharrockKR,Cellulaseassay15methods:areview,JBiochemBiophysMethods.1988Oct,17(2):81-105;CarderJH,DetectionandquantitationofcellulasebyCongoredstainingofsubstratesinacup-platediffusionassay,AnalBiochem.1986Feb15,153(l):75-9;CanevasciniG.,Acellulaseassaycoupledtocellobiosedehydrogenase,AnalBiochem.1985Jun,147(2):419-27;HuangJS,TangJ,Sensitiveassayforcellulaseanddextranase.Anal20Biochem.1976Jun,73(2):369隱77。本發明使用的反應條件的pH是本發明提供的另一個可變參數。在某些方面,反應的pH在約3.0至約9.0的範圍內。在其它方面,pH為約4.5,或pH為約7.5或pH為約9。在鹼性條件下進行的反應條件也可能是有利的,例如,在本發明的酶的一些工業應用或製藥應用中。25本發明提供了各種形式和配方的本發明的纖維素酶,例如內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或p-葡糖苷酶多肽。在本發明的方法中,本發明的纖維素酶如內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或卩-葡糖苷酶多肽以各種形式和配方使用。例如,純化的纖維素酶如內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶多肽可以用在酶製劑中,該酶製劑在生物乙醇的30生產中或製藥或飲食助劑應用中使用。可選地,本發明的酶可直接用在生產生物乙醇、製備清潔燃料、處理生物廢物、加工食物、液體或詞料等等的各種工藝中。可選地,本發明的纖維素酶,例如內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或p-葡糖苷酶多肽,可使用本領域已知的方法在微生物中表達。在其它方面,本發明的纖維素酶,例如內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/35或P-葡糖苷酶多肽,可在用於本發明的方法之前固定在固體支持物上。將酶固定在固體支持物上的方法在本領域中廣為人知,例如J.Mol.Cat.B:Enzymatic6(1999)29-39;Chivataetal.Biocatalysis:Immobilizedcellsandenzymes,JMol-Cat.37(1986)1-24:Sharmaetal.,ImmobilizedBiomaterialsTechniquesandApplications,Angew.Chem.Int.Ed.Engl.21(1982)837-54:Laskin(Ed.),EnzymesandImmobilizedCellsinBiotechnolog。5核酸、探針和抑制分子(InhibitorvMolecules)本發明提供了分離的和重組的核酸,例如參見下面的表l、2和3,實施例l和4,以及序列表;編碼多肽的核酸,包括本發明的示例性多核苷酸序列,例如,參見表1和序列表;包括表達序列盒,例如含有本發明的核酸的表達載體和各種克隆載體。本發明還包括使用本發明的核酸發現、鑑定或分離新的纖維素酶如內10切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或(3-葡糖苷酶多肽序列的方法。本發明還包括使用本發明的核酸抑制編碼纖維素酶如內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或p-葡糖苷酶的基因和轉錄物的表達的方法。還提供了修飾本發明的核酸的方法,包括通過例如合成連接重裝配、優化的定向進化系統和/或飽和誘變例如基因位點飽和誘變(GSSM)產生本發明的核15酸變體的方法。術語"飽和誘變"、基因位點飽和誘變或"GSSM"包括使用簡併寡核苷酸引物將點突變引入多核苷酸的方法,如在下面所詳細描述的。術語"優化的定向進化系統"或"優化的定向進化"包括用於重新裝配相關的核酸序列的片段的方法,所述的相關核酸序列例如相關的基因,下面對其進行了詳細解釋。術語"合成連接重裝配"或"SLR"包括以非隨機方式連接寡核苷酸片段的方法,20下面進行了詳細解釋。術語"變體"是指在一個或多個鹼基對、密碼子、內含子、外顯子或胺基酸殘基處被(分別地)修飾的本發明的多核苷酸或多肽,然而它們仍然保持本發明的纖維素酶如內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或(3-葡糖苷酶生物學活性。變體可以通過許多種方法產生,包括的方法諸如,例如易錯PCR、改組、寡核苷酸誘導的定向突變、裝配PCR、有性PCR誘變、體內誘變、25盒式誘變、遞歸整體誘變、指數整體誘變、位點特異性誘變、基因再裝配、GSSM及其任意組合。本發明的核酸可以通過,例如cDNA文庫的克隆和表達、通過PCR進行的信息或基因組DNA擴增以及類似的技術來製造、分離和/或操縱。例如,本發明的示例性核酸最初來源於環境來源。因此,一方面,本發明提供了編碼纖維素30酶如內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶的核酸,以及由它們編碼的多肽,其共同的新穎性在於它們來源於共同的來源,例如環境來源、混合的培養物或細菌來源。在本發明方法的實踐中,同源基因可以通過操縱模板核酸加以修飾,如同在文中所描述的。本發明可以與本
技術領域:
已知的任何方法或程序或設備一起實35踐,這些方法、程序或設備在科學和專利文獻中有很好的描述。如本文所使用,短語"核酸"或"核酸序列"是指寡核苷酸、核苷酸、多核苷酸,或者寡核苷酸、核苷酸、多核苷酸中任意一種的片段,或者基因組的或合成來源的DNA或RNA,它們可以是單鏈或雙鏈,並且可以代表正義鏈或反義(互補)鏈,或者是指肽核酸(PNA)或者天然或合成來源的任何DNA樣或RNA樣的物質。短語"核酸"或"核酸序列"包括寡核苷酸、核苷酸、多核苷酸,或5者寡核苷酸、核苷酸、多核苷酸中任意一種的片段,或者基因組的或合成來源的DNA或RNA(例如mRNA、rRNA、tRNA、iRNA),它們可以是單鏈或雙鏈,並且可以代表正義鏈或反義鏈,還包括肽核酸(PNA)或者天然或合成來源的任何DNA樣或RNA樣的物質,例如包括iRNA、核糖核蛋白(例如雙鏈iRNA,例如iRNPs)。該術語包括含有天然核苷酸的己知類似物的核酸,例如寡核苷酸。該術10語也包括具有合成骨架的核酸樣結構,例如參見Mata(1997)Toxicol.Appl.Pharmacol.144:189-197;Strauss-Soukup(1997)Biochemistry36:8692-8698;Samstag(1996)AntisenseNucleicAcidDrugDev6:153-156。"寡核苷酸"或者包括單鏈的多脫氧核苷酸,或者包括兩個互補的多脫氧核苷酸鏈,它們可以是化學合成的。這樣的合成的寡核苷酸沒有5'磷酸,因此如果不在存在激酶的情況下採用15ATP添加磷酸,該合成寡核苷酸便不會連接到另一個寡核苷酸上。合成的寡核苷酸可以連接到沒有被去磷酸化的片段上。特定多肽或蛋白的"編碼序列"或編碼特定多肽或蛋白的"核苷酸序列"是這樣的核酸序列,其當置於合適的調節序列的調控下時被轉錄和翻譯成多肽或蛋白質。術語"基因"意指在產生多肽鏈中所涉及的DNA片段;其包括編碼區之20前的區域和之後的區域(前導區(leader)和尾區(trailer)),以及在適用的情況下,可以包括各個編碼片段(外顯子)之間的間插序列(內含子)。啟動子序列"可操作地連接到"編碼序列上,此時RNA聚合酶可以在啟動子處起始轉錄,將編碼序列轉錄成mRNA。正如此處所用,"可操作地連接(operablylinked)"是指兩個或更多個核酸(例如DNA)片段之間的功能關係。"可操作地連接"可以指轉錄調控25序列與被轉錄序列的功能關係。例如,如果啟動子刺激或調節編碼序列例如本發明的核酸在適當的宿主細胞或其它表達系統中的轉錄,那麼該啟動子便是可操作地連接到編碼序列。通常,可操作地連接到被轉錄序列的啟動子轉錄調控序列與被轉錄序列是物理上相鄰的,即它們是順式作用。然而,一些轉錄調控序列,如增強子,不需要與編碼序列物理相鄰或者位於與編碼序列接近的位置,但這些轉30錄調控序列仍能增強編碼序列的轉錄。正如本文所用,術語"表達序列盒(expressioncassette)"指能影響結構基因(即蛋白編碼序列,例如,編碼本發明的纖維素酶如內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或|3-葡糖苷酶的序列)在與這樣的序列相容的宿主中的表達的核苷酸序列。表達序列盒包括至少一個與多肽編碼序列可操作地連接的啟動35子;並且任選地,可以與其它序列例如轉錄終止信號序列可操作地連接。也可以使用其它的在實現表達的方面必需的或有用的因子,例如增強子、a-因子。因此,表達序列盒也包括質粒、表達載體、重組病毒、任何形式的重組"裸DNA"載體,以及類似物。"載體"包括可以感染、轉染、短暫或永久地轉導細胞的核酸。應該認識到,載體可以是裸核酸、或與蛋白或脂質複合的核酸。該載體任選地包含病毒或細菌核酸和/或蛋白,和/或膜(例如細胞膜、病毒脂質包被等等)。載體包括5但不限於複製子(例如RNA複製子、細菌噬菌體),DNA片段可以連接到這些複製子上從而可被複製。因此,載體包括但不限於RNA、自主複製環狀或線狀DNA或RNA(例如質粒、病毒以及類似物,例如參見美國專利5,217,879),並且包括表達質粒和非表達質粒。在重組微生物或細胞培養物被描述為"表達載體"的宿主的情況下,該載體包括染色體外環狀和線狀DNA,它們可以已經被整合到宿主10染色體中。在載體通過宿主細胞來維持的情況下,該載體或者可以作為自主結構在有絲分裂過程中被細胞穩定地複製,或者被整合進宿主的基因組中。正如此處所用,術語"重組的"包括與"骨架"核酸相鄰的核酸,這些核酸在其天然環境中與該"骨架"核酸是不相鄰的。一方面,為了被富集,核酸表現為在核酸骨架分子群體中有大約5%或更多數量的核酸插入物。本發明的"骨架15分子"包括核酸,如表達載體、自主複製核酸、病毒、整合核酸,以及用於維持或操縱感興趣的核酸插入物的其它載體或核酸。一方面,富集的核酸表現為在重組的骨架分子群體中有大約15%或更多數量的核酸插入物。一方面,富集的核酸表現為在重組的骨架分子群體中有大約50%或更多數量的核酸插入物。一方面,富集的核酸表現為在重組的骨架分子群體中有大約90%或更多數量的核酸插入20物o本發明的一方面是分離的或重組的核酸,包括本發明的序列之一,或者含有本發明的核酸的至少10、15、20、25、30、35、40、50、75、100、150、200、300、400或500或更多個連續鹼基的片段。該分離的或重組的核酸可以包含DNA,包括cDNA、基因組DNA和合成DNA。DNA可以是雙鏈或單鏈,並且如果是單25鏈,可以是編碼鏈或非編碼(反義)鏈。可選地,該分離的或重組的核酸包含RNA。本發明的分離的或重組的核酸可用於製備本發明的多肽之一,或者含有本發明的多肽之一的至少5、10、15、20、25、30、35、40、50、75、100或150或更多個連續胺基酸的片段。因此,本發明的另一方面是分離的或重組的核酸,其編碼本發明的多肽的一種,或者含有本發明的多肽之一的至少5、10、15、20、25、3030、35、40、50、75、100或150或更多個連續胺基酸的片段。這些核酸的編碼序列可以與本發明的核酸之一的編碼序列之一相同或者可以是不同的編碼本發明的多肽之一的編碼序列,所述的多肽具有本發明的多肽之一的至少5、10、15、20、25、30、35、40、50、75、100或150或更多個連續胺基酸,這是遺傳密碼子的冗餘性或簡併性的結果。遺傳密碼子對於本領域技術人員是熟知的,並可以例如在35B.Lewin,GenesVI,OxfordUniversityPress,1997的第214頁上得到。—方面,使用常規技術,例如定點誘變或本領域技術人員熟悉的其它技術,本發明的核酸序列被誘變,以將沉默改變引入本發明的多核苷酸。如本文所使用,"沉默改變(silentchanges)"包括,例如不改變由所述多核苷酸編碼的胺基酸序列的改變。這樣的改變可能是期望的,以通過引入在宿主微生物中頻繁發生的密碼子或密碼子對而增加由宿主產生多肽的水平,該宿主含有編碼所述多肽的10載體。本發明還涉及具有核苷酸改變的多核苷酸,所述核苷酸改變在本發明的多肽中導致胺基酸取代、添加、缺失、融合和截短。使用技術例如定點誘變、隨機化學誘變、外切核酸酶III刪除和其它重組DNA技術,可以導入這樣的核苷酸改變。可選地,這樣的核苷酸改變可以是天然存在的等位基因變體,其通過鑑定在15本文所提供的高嚴緊條件、中度嚴緊條件或低嚴緊條件下特異性雜交到探針的核酸而分離出,所述探針含有本發明的序列(或其互補序列)之一的至少10、15、20、25、30、35、40、50、75、100、150、200、300、400或500或更多個連續鹼基。用於實踐本發明的核酸,不管是RNA、siRNA、miRNA、反義核酸、cDNA、基因組DNA、載體、病毒或其雜合體,都可以從多種來源分離、進行遺傳工程改造、擴增和/或表達/重組產生。從這些核酸產生的重組多肽(例如纖維素酶,如內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶)可以被單獨地分離25或克隆,並且可測試其期望活性。可以使用任何重組表達系統,包括細菌、哺乳動物、酵母、昆蟲或植物細胞表達系統。可以選擇地,這些核酸可以通過熟知的化學合成技術體外合成,正如例如Adams(1983)J.Am.Chem.Soc.105:661;Belousov(1997)NucleicAcidsRes.25:3440-3444;Frenkel(1995)FreeRadic.Biol.Med.19:373-380;Blommers(1994)30Biochemistry33:7886-7896;Narang(1979)Meth.Enzymol.68:90;Brown(1979)Meth.Enzymol.68:109;Beaucage(1981)Tetra.Lett.22:1859;美國專利4,458,066中所描述的。用於操縱核酸的技術,例如亞克隆、標記探針(例如使用Klenow聚合酶的隨機引物標記、切口平移、擴增)、測序、雜交以及類似的技術在科學和專利文35獻中有很好的描述,例如參見Sambrook編著,MOLECULARCLONING:ALABORATORYMANUAL(2NDED.),1-3巻,ColdSpringHarborLaboratory,(1989);CURRENTPROTOCOLSINMOLECULARBIOLOGY,Ausubel,ed.JohnWiley&Sons,Inc.,NewYork(1997);LABORATORYTECHNIQUESINBIOCHEMISTRYANDMOLECULARBIOLOGY:HYBRIDIZATIONWITHNUCLEICACIDPROBES,PartI.TheoryandNucleicAcidPreparation,Tijssen,ed.Elsevier,N.Y.(1993)。5獲得和操縱用於實踐本發明的方法的核酸的另一個有用方法是從基因組樣品中克隆,並且如果期望的話,篩選和再克隆插入物,插入物可以分離或擴增自例如基因組克隆或cDNA克隆。用於本發明的方法中的核酸的來源包括基因組或cDNA文庫,所述文庫可以包含在例如哺乳動物人工染色體(MACs),例如參見美國專利5,721,118;6,025,155;人類人工染色體,例如參見Rosenfeld(1997)10Nat.Genet.15:333-335:酵母人工染色體(YAC);細菌人工染色體(BAC);PI人工染色體,例如參見Woon(1998)Genomics50:306-316;PI來源的載體(PACs),例如參見Kern(1997)Biotechniques23:120-124;粘粒、重組病毒、噬菌體或質粒中。—方面,編碼本發明的多肽的核酸與能指導翻譯出的多肽或其片段的分泌15的前導序列以適當的位置關係進行裝配。本發明提供了融合蛋白和編碼這些融合蛋白的核酸。本發明的多肽可以被融合到異源肽或多肽上,如N-末端鑑定肽,其給予了期望的特性,如增加的穩定性或簡化的純化特性。本發明的肽和多肽也可以作為融合蛋白被合成和表達,其中所述融合蛋白中連接有一個或多個額外的結構域,例如用於產生免疫原性更強20的肽、以便更易於分離重組合成的肽、以便鑑定和分離抗體和表達抗體的B細胞,等等。有利於檢測和純化的結構域包括,例如金屬螯合肽,如多組氨酸標記和組氨酸-色氨酸模塊,其允許在固定的金屬上純化,還包括蛋白A結構域,其允許在固定的免疫球蛋白上純化,還包括在FLAGS延伸/親和純化系統中所使用的結構域(ImmunexCorp,SeattleWA)。在純化結構域和含有基序的肽或多肽之間包含25可切裂的連接子序列有助於純化,這樣的連接子序列例如Xa因子或腸激酶(Iiwitrogen,SanDiegoCA)。例如,表達載體可以包括編碼表位的核酸序列,其連接到六組氨酸殘基上,還連接有硫氧還蛋白和腸激酶切割位點(例如參見Williams(1995)Biochemistry34:1787-1797;Dobeli(1998)ProteinExpr.Purif.12:404-414)。組氨酸殘基有助於檢測和純化,而腸激酶切割位點提供了將表位與融合30蛋白的剩餘部分純化分離開的手段。關於編碼融合蛋白的載體的技術以及融合蛋白的應用在科學和專利文獻中進行了很好的描述,例如參見Kroll(1993)DNACd1.Biol.,12:441-53。存錄湖體虔,35本發明提供了可操作地連接到一個或多個表達(例如轉錄或翻譯)控制序列上的本發明的核酸(例如DNA)序列,所述控制序列例如啟動子或增強子,它們可以指導或調節RNA合成/表達。表達控制序列可以在表達載體中。示例性的細菌啟動子包括lacl、lacZ、T3、T7、gpt、XPR、PL和trp。示例性的真核啟動子包括CMV即時早期啟動子、HSV胸苷激酶啟動子、早期和晚期SV40啟動子、來自逆轉錄病毒的LTR啟動子以及鼠金屬硫蛋白I啟動子。如本文所使用,術語"啟動子"包括能夠驅動編碼序列在細胞中如植物或5動物細胞中轉錄的所有序列。因此,在本發明的構建物中所用的啟動子包括順式作用轉錄控制元件和調節序列,它們涉及調節或調控基因轉錄的時間和/或速率。例如,啟動子可以是順式作用轉錄控制元件,包括增強子、啟動子、轉錄終止子、複製起點、染色體整合序列、5'和3'非翻譯區或內含子序列,它們均涉及轉錄的調節。這些順式作用序列通常與蛋白或其它生物分子互相作用來執行(打開/關閉、10調節、調控等等)轉錄。"組成型"啟動子是那些在大部分環境條件和發育狀態或細胞分化狀態下持續地驅動表達的啟動子。"誘導型"或"可調控型"啟動子在環境條件或發育條件的影響下指導本發明的核酸的表達。可以通過誘導型啟動子影響轉錄的環境條件的實例包括無氧條件、增高的溫度、乾旱或光的存在。"組織特異性"啟動子是僅僅在特定細胞或組織或器官中有活性的轉錄控15制元件,例如在植物或動物的特定細胞或組織或器官中有活性。組織特異性調節可以通過某些內在因子來實現,這些內在因子確保對給定組織特異的蛋白編碼基因被表達。這樣的因子己知存在於哺乳動物和植物中,以便允許特異性組織的發育。適合於在細菌中表達多肽的啟動子包括大腸桿菌lac或trp啟動子、lacl啟20動子、lacZ啟動子、T3啟動子、T7啟動子、gpt啟動子、XPR啟動子和XPL啟動子、來自編碼糖酵解酶如3-磷酸甘油酯激酶(PGK)的操縱子的啟動子、以及酸性磷酸酶啟動子。真核啟動子包括CMV即時早期啟動子、HSV胸苷激酶啟動子、熱激啟動子、早期和晚期SV40啟動子、來自逆轉錄病毒的LTRs、以及小鼠金屬硫蛋白-I啟動子。也可以使用已知在原核或真核細胞或它們的病毒中控制基因表達25的其它啟動子。適合於在細菌中表達多肽或其片段的啟動子包括大腸桿菌/ac或&p啟動子、/ac/啟動子、/acZ啟動子、n啟動子、T7啟動子、g內啟動子、義屍R啟動子和/LPi啟動子、來自編碼糖酵解酶如3-磷酸甘油酯激酶(PGK)的操縱子的啟動子、以及酸性磷酸酶啟動子。真菌啟動子包括a-因子啟動子。真核啟動子包括CMV即時早期啟動子、HSV胸苷激酶啟動子、熱激啟動子、早期和晚期SV40啟動子、30來自逆轉錄病毒的LTRs以及小鼠金屬硫蛋白-I啟動子。也可以使用已知在原核或真核細胞或它們的病毒中控制基因表達的其它啟動子。^織待,性擅欽啟動子本發明提供了可以以組織特異性方式表達的表達序列盒,例如可以以組織35特異性方式表達本發明的纖維素酶如內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶的表達序列盒。本發明也提供了以組織特異性方式表達本發明纖維素酶如內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶的植物或種子。組織特異性可以是種子特異性、莖特異性、葉特異性、根特異性、果實特異性以及類似的方式。術語"植物"包括全植物、植物部分(例如葉、莖、花、根等等)、植物5原生質體、種子和植物細胞以及它們的後代。可以用於本發明的方法中的植物的種類很廣泛,廣泛至能用轉化技術進行處理的高等植物,包括被子植物(單子葉植物和雙子葉植物),以及裸子植物。它們包括各種倍數性水平的植物,包括多倍體、二倍體、單倍體和半合子植物。正如此處所用,術語"轉基因植物"包括異源核酸序列已經被插入到其中的植物或植物細胞,所述異源核酸序列例如本發明10的核酸和各種重組構建物(例如表達序列盒)。—方面,組成型啟動子如CaMV35S啟動子可以被用於在植物或種子的特定部分或在整個植物中的表達。例如,為了過度表達,可以使用植物啟動子片段,其將指導核酸在植物例如再生植物的一些或所有組織中表達。此處,這樣的啟動子被稱作"組成型"啟動子,它們在大部分環境條件和發育或細胞分化狀態下是15有活性的。組成型啟動子的實例包括花椰菜花葉病毒(CaMV)35S轉錄起始區、來自根瘤農桿菌的T-DNA的l'或2'啟動子、以及來自本
技術領域:
已知的多種植物基因的其它轉錄起始區。這樣的基因包括,例如來自擬南芥"ra6Wo/w/s)的ZC77/(Huang(19%)PlantMol.Biol.33:125-139);來自擬南芥的Ca"(GenbankNo.U43147,Zhong(1996)Mol.Gen.Genet.251:196-203);來自甘藍型油菜(&owi'o720"a/7M)的編碼硬酯醯基-醯基載體蛋白去飽和酶的基因(GenbankNo.X74782,Solocombe(1994)PlantPhysiol.104:1167-1176);來自玉米的G屍c/(GenbankNo.X15596;Martinez(1989)J.Mol.Biol.208:551-565);來自玉米的G/c2(GenbankNo.U45855;Manjunath(1997)Plant.Mol.Biol.33:97-112);在美國專利4,962,028;5,633,440中描述的植物啟動子。25本發明使用來自病毒的組織特異性或組成型啟動子,這些啟動子可以包括,例如菸草花葉病毒亞基因組啟動子(Kumagai(1995)Proc.Natl.Acad.Sci.USA92:1679-1683;稻米東格魯杆狀病毒(RTBV),該病毒僅在受感染稻米植物中的韌皮細胞中複製,它的啟動子驅動強的韌皮特異性報導基因的表達;木薯脈帶花葉病毒(CVMV)啟動子,其在導管、葉中軸細胞、根尖中具有最高活性(Verdaguer30(1996)PlantMol.Biol.31:1129-1139)。—方面,植物啟動子指導表達纖維素酶如內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或p-葡糖苷酶的核酸表達於特定組織、器官或細胞類型中(即,組織特異啟動子),或者可以在更加精確的環境或發育控制下或在誘導型啟動子的控制下指導表達纖維素酶如內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡35糖苷酶的核酸的表達。可以影響轉錄的環境條件的例子包括厭氧條件、提高溫度、有光或噴撒化學品/激素。例如,本發明包括玉米的乾旱誘導型啟動子(Busk(1997)如上),馬鈴薯的寒冷、乾旱、高鹽誘導型啟動子(Kirch(1997)PlantMol.Biol.33:897909)。—方面,組織特異性啟動子只在該組織的發育階段的某個時間段內促進轉錄。參見,例如描述擬南芥LEAFY基因啟動子的Blazquez(1998)PlantCell510:79卜800。也見,描述轉錄因子SPL3的Cardon(1997)PlantJ12:367-77,SPL3識別擬南芥(A//w//a"a)的調節植物分生組織形成的基因(meristemidentitygene)API的啟動子區域的保守序列基序;和描述分生組織啟動子elF4的Mandel(1995)PlantMolecularBiology,29巻,995-1004頁。可以使用在特定組織的整個生命周期都具有活性的組織特異性啟動子。一方面,本發明的核酸與主要在棉花纖維細胞10中有活性的啟動子可操作地連接。一方面,本發明的核酸與主要在棉花纖維細胞伸長的階段具有活性的啟動子可操作地連接,例如,Rinehart(1996)supra所描述的。核酸可以與Fbl2A基因啟動子可操作地連接,這樣它將偏好在棉花纖維細胞(Ibid)中表達。也見John(1997)Proc.Natl.Acad.Sci.USA89:5769-5773;John等,美國專利5,608,148和5,602,321,描述了用於構建轉基因棉花植物的棉花纖維15特異性啟動子和方法。也可以使用根特異性啟動子來表達本發明的核酸。根特異性啟動子的例子包括乙醇脫氫酶基因中的啟動子(DeLisle(19%)Int.Rey.Cytol.123:39-60)。也可以使用別的啟動子來表達本發明的核酸,包括,例如,胚珠特異的、胚芽特異的、胚乳特異的、珠柄特異的、種皮特異的啟動子或它們的組合;葉特異的啟動子(見,例如,Busk(1997)PlantJ.11:12851295,描述玉米的葉特20異的啟動子);髮根農桿菌C4gra/jfl"eWMW^'zoge"M)的ORF13啟動子(ORF13啟動子在根部表現出高活性,見,例如Hansen(1997)如上);玉米花粉特異性啟動子(見,例如Guerrero(1990)Mol.Gen.Genet.224:161168);番茄啟動子,其在果實成熟、變老、從葉上脫落的過程中有活性,在花中具有低一些的活性(見,例如,Blume(1997)PlantJ.12:731746);馬鈴薯SK2基因的雌蕊特異性啟動子25(見,例如Ficker(1997)PlantMol.Biol.35:425431);豌豆的Blec4基因,Blec4基因在蔬菜的表皮組織和轉基因苜蓿的花梗頂中具有活性,這使它成為使外源基因靶向表達於活躍地生長的芽或纖維的表皮層的有用工具;胚珠特異的BEL1基因(見,例如,Reiser(1995)Cell83:735-742,GenBank號U39944);和/或Klee,美國專利5,589,583中的啟動子,描述了一種植物啟動子區域,其可導致在分生組30織和/或快速分裂細胞中的高水平轉錄。—方面,經由對植物激素例如植物生長素的暴露便能被誘導的植物啟動子可用於表達本發明的核酸。例如,本發明可以使用大豆(G(ydne/muL.)的植物生長素響應元件E1啟動子片段(AuxREs)(Liu(1997)PlantPhysiol.115:397-407);植物生長素響應的擬南芥GST6啟動子(也對水楊酸和過氧化氫產生響應)(Chen35(1996)PlantJ.10:955-966);菸草的植物生長素誘導的parC啟動子(Sakai(1996)37:906-913);植物生物素響應元件(Streit(1997)Mol.PlantMicrobeInteract.10:933-937);和對應激激素脫落酸產生響應的啟動子(Sheen(1996)Science274:1900-1902)。本發明的核酸也可以與植物啟動子可操作地連接,所述植物啟動子暴露於施用於植物的化學試劑例如除草劑或抗生素,便能夠被誘導。例如,可以使用由5苯磺醯胺除草劑安全劑活化的玉米In2-2啟動子(DeVeylder(1997)PlantCellPhysiol.38:568-577);不同的除草劑安全劑的應用誘導不同的基因表達模式,包括在根中、排水器中和芽尖分生組織中的表達。編碼序列可以處於例如四環素誘導的啟動子的控制下,例如,針對含有燕麥Uve"flsa"wL.)(oat)精氨酸脫羧酶基因的轉基因菸草植物所描述的(Masgrau(1997)PlantJ.11:465-473);或者處於水10楊酸響應元件的控制之下(Stange(1997)PlantJ.11:1315-1324)。使用化學(例如,激素或殺蟲劑)誘導的啟動子,即,對施用于田間的轉基因植物的化學劑發生響應的啟動子,本發明的多肽的表達可以在植物發育的特定階段被誘導。所以,本發明也提供含有可誘導基因的轉基因植物,所述可誘導基因編碼本發明的多肽,其宿主範圍局限於靶向植物種類,例如玉米、稻、大麥、大豆、番茄、小麥、馬15鈴薯或別的作物,並且所述可誘導基因在作物發育的任何階段都可被誘導。本領域技術人員會認識到,組織特異性的植物啟動子可能驅動可操作地連接的序列在不是耙組織的組織中表達。因此,一方面,組織特異性啟動子是驅動在耙組織或細胞類型中產生優勢表達的啟動子,但是也可以導致在別的組織中的一些表達。20本發明的核酸也可以與在暴露於化學試劑時被誘導的植物啟動子可操作地連接。這些試劑包括例如,除草劑、合成的植物生長激素或抗生素,它們可以通過例如噴霧施用於轉基因植物。本發明的產生纖維素酶如內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或(3-葡糖苷酶的核酸的誘導型表達將允許栽培者對具有最佳的纖維素酶如內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或卩-葡糖苷25酶表達和/或活性的植物進行選擇。植物部分的發育也可以因此被控制。這樣,本發明提供了促進植物和植物部分的收穫的方法。例如,在許多實施方式中,玉米的由苯磺醯胺除草劑安全劑活化的玉米In2-2啟動子被使用(DeVeylder(1997)PlantCellPhysiol.38:568-577);應用不同的除草劑安全劑誘導出不同的基因表達模式,包括在根中、排水器中、芽尖分生組織中的表達。本發明的編碼序列也可30以處於四環素誘導的啟動子的控制之下,例如,對含有燕麥Uvem^fl"vaL.)(oat)精氨酸脫羧酶基因的轉基因菸草植物的描述(Masgrau(1997)PlantJ.11:465-473);或者,可以由水楊酸響應元件控制(Stange(1997)PlantJ.11:1315-1324)。在一些方面,適當的多肽表達可能要求在該編碼區域的3'端具有多聚腺苷酸化區域。多聚腺苷酸化區域可以源自天然基因、各種類別的其它植物(或者動35物或其它)基因或者農桿菌T-DNA中的基因。表這載,克虔載體本發明提供包括本發明的核酸例如編碼本發明的纖維素酶如內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶的序列的表達載體和克隆載體。本發明的表達載體和克隆載體可以包括病毒顆粒、杆狀病毒、噬菌體、質粒、噬5菌粒(phagemids)、粘粒、fos-質粒(fosmids)、細菌人工染色體、病毒DNA(例如疫苗、腺病毒、禽痘病毒、偽狂犬病病毒和SV40的衍生物)、Pl衍生的人工染色體、酵母質粒、酵母人工染色體和任何別的對感興趣的特定宿主(例如,杆狀菌、麴黴和酵母)有特異性的載體。本發明的載體可以包括染色體、非染色體和合成的DNA序列。大量的合適的載體對於本領域技術人員都是已知的,並且可以10商業獲得。典型的載體包括細菌pQE載體(Qiagen)、pBLUESCRIPTTM質粒、pNH載體、入-ZAP載體(Stratagene);ptrc99a、PKK223-3、pDR540、pRIT2T(Pharmacia);真核細胞的PXT1、pSG5(S驗gene)、pSVK3、pBPV、pMSG、pSVLSV40(Pharmacia)。然而,也可以使用任何別的質粒或別的載體,只要它們可以在宿主中複製和維持下去。可以在本發明中使用低拷貝數或高拷貝數的載體。15"質粒"可以商購得到,在不受限制的基礎上可以公開獲得,或可以根據已公開的程序用可獲得的質粒來構建。與本文描述的那些質粒等價的質粒在本
技術領域:
是已知的,並且對於普通技術人員是顯而易見的。表達載體可以包括啟動子、用於起始翻譯的核糖體結合位點和轉錄終止子。載體也可以包括用於擴增表達的合適序列。哺乳動物表達載體可以包括複製20原點、任何必需的核糖體結合位點、聚腺苷酸化位點、剪接供體和受體位點、轉錄終止序列、5,側翼非轉錄序列。在一些方面,衍生於SV40剪接子和聚腺苷酸化位點的DNA序列可以用於提供所需要的非轉錄基因元件。在一個方面,表達載體含有一個或多個選擇性標記基因,使得可以對含有該載體的宿主細胞進行選擇。這樣的選擇性標記包括編碼二氫葉酸還原酶的基因25和使得真核細胞培養物具有新黴素抗性的基因、使得大腸桿菌(£.co//)具有四環素或氨苄青黴素抗性的基因和釀酒酵母(S.TRP1基因。啟動子區域可以從任何期望的基因中選擇出來,使用氯黴素轉移酶(CAT)載體或具有選擇標記的別的載體。在一個發明,用於在真核細胞中表達多肽或其片段的載體含有增強子,以30增加表達水平。增強子是DNA的順式作用元件,一般長度為大約10到大約300bp。它們作用於啟動子,增強其轉錄。示例性增強子包括在複製原點下遊側100bp到270bp的SV40增強子、巨細胞病毒早期啟動子增強子、在複製原點下遊側的多瘤增強子,和腺病毒增強子。核酸序列可以通過各種程序插入載體中。一般而言,將插入物和載體用合35適的限制性內切酶消化後,序列可以連接到載體中的所希望的位置。可選擇地,插入物和載體的平末端可以被連接。在本領域己知多種克隆技術,例如在Ausubel和Sambrook中描述的。這樣的程序和別的程序被認為在本領域技術人員的範圍內。載體可以是質粒、病毒顆粒或噬菌體的形式。別的載體包括染色體的、非染色體的和合成的DNA序列,SV40的衍生物;細菌質粒、噬菌體DNA、杆狀病毒、酵母質粒、衍生於質粒和噬菌體DNA的組合的載體、病毒DNA例如牛痘、5腺病毒、禽痘病毒和偽狂犬病病毒DNA。在原核和真核宿主中使用的各種克隆和表達載體被例如Sambrook描述。可以使用的特定的細菌載體包括商業上可獲得的質粒,其包括以下已知的克隆載體的遺傳元件pBR322(ATCC37017)、pKK223-3(PharmaciaFineChemicals,Uppsala,Sweden)、GEM1(PromegaBiotec,Madison,WI,USA)、pQE70、pQE60、10pQE-9(Qiagen)、pD10、psiX174pBluescriptIIKS、pNH8A、pNH16a、pNH18A、pNH46A(Stratagene)、ptrc99a、pKK223-3、pKK233隱3、DR540、pRIT5(Pharmacia)、pKK232-8禾QpCM7。特定的真核載體包括pSV2CAT、pOG44、pXTl、pSG(Stratagene)pSVK3、pBPV、pMSG和pSVL(Pharmacia)。然而,可以使用任何別的載體,只要它可以在宿主細胞中複製和維持。15本發明的核酸可以在表達序列盒、載體或病毒中表達,在植物細胞和種子中短暫地或穩定地表達。一個示例性的短暫表達系統應用了附加體(episomal)表達系統,例如,通過含有超螺旋DNA的附加小染色體的轉錄而在核中產生的花椰菜花葉病毒(CaMV)病毒RNA,見,例如,Covey(1990)Proc.Natl.Acad.Sci.USA87:1633-1637。作為選擇,編碼序列,即本發明的序列的全部或子片段,可以插入20到植物宿主細胞基因組中,而成為該宿主染色體DNA的整合部分。正義和反義轉錄子可以以這種方式被表達。包含本發明的核酸的序列(例如,啟動子或編碼區域)的載體可以包含賦予植物細胞或種子選擇性表型的標記基因。例如,所述標記可以編碼生物殺滅劑抗性,特別是抗生素抗性,例如對卡那黴素、G418、博來黴素、潮黴素或除草劑的抗性,例如對氯磺隆或Basta的抗性。25可以在植物中表達核酸和蛋白的表達載體在本領域中是熟知的,可以包括,例如,根瘤農桿菌的載體、馬鈴薯病毒X(見,例如,Angell(1997)EMBOJ.16:3675-3684)、菸草花葉病病毒(見,例如,Casper(1996)Gene173:69-73)、番茄叢矮病毒(見,例如,Hillman(1989)Virology169:42-50)、菸草蝕紋病毒(見,例如,Dolja(1997)Virology234:243-252)、菜豆金色花葉病毒(見,例如,Morinaga30(1993)Microbiolinhnunol.37:471-476)、花椰菜花葉病毒(見,例如,Cecchini(1997)Mol.PlantMicrobeInteract.10:1094-1101)、玉米Ac/Ds轉座元件(見,例如,Rubin(1997)Mol.Cell.Biol.17:6294-6302;Kunze(1996)Curr.Top.Microbiol.Inimunol.204:161-194),和玉米抑制基因-突變基因(Spm)轉座元件(見,例如Schlappi(1996)PlantMol.Biol.32:717-725);和它們的衍生物。35在一個方面,表達載體可以有兩套複製系統,使其可以在兩種生物中保持,例如在哺乳動物或昆蟲細胞中表達,在原核宿主中克隆和擴增。進一步,對於整合表達載體,該表達載體可以包括至少一個與宿主細胞基因組同源的序列。它可以在該表達構建物的兩側包含兩個同源序列。通過選擇包含入載體的合適的同源序列,可以將該整合載體定位到宿主細胞的特定位置。整合載體的構建在本領域是已知的。5本發明的表達載體也可以包括選擇性的標記基因,以便對已經轉化的細菌株進行選擇,例如,使細菌對藥物,例如氨苄青黴素、氯黴素、紅黴素、卡那黴素、新黴素和四環素產生抗性的基因。選擇性的標記也可以包括生物合成基因,例如在組氨酸、色氨酸和亮氨酸生物合成途徑中的基因。表達載體中的DNA序列被可操縱連接到合適的表達控制序列(一種或多10禾中)(啟動子),以指導RNA合成。具體命名的細菌啟動子包括/flc/、/acZ、r3、T7、砂f、義/V義&和印。真核啟動子包括CMV即時早期啟動子、HSV胸苷激酶啟動子、早期和晚期SV40啟動子、來自逆轉錄病毒的LTRs以及小鼠金屬硫蛋白-I啟動子。選擇合適的載體和啟動子在本領域技術人員的水平之內。表達載體還可以包括用於起始翻譯的核糖體結合位點和轉錄終止子。載體也可以包括用於擴增15表達的合適序列。啟動子區域可以從任何期望的基因中選擇出來,使用氯黴素轉移酶(CAT)載體或具有選擇標記的別的載體。此外,在一個方面,表達載體含有一個或多個選擇性標記基因,以提供用於選擇被轉化的宿主細胞的表型特徵,例如用於真核細胞培養的二氫葉酸還原酶或新黴素抗性,或例如大腸桿菌中的四環素或氨苄青黴素抗性。20哺乳動物表達載體還可以包括複製原點、任何必需的核糖體結合位點、聚腺苷酸化位點、剪接供體和受體位點、轉錄終止序列和5'側翼非轉錄序列。在一些方面,衍生於SV40剪接子的DNA序列和聚腺苷酸化位點可以用於提供所需要的非轉錄基因元件。用於在真核細胞中表達多肽或其片段的載體也可以含有增強子,以增加表25達水平。增強子是DNA的順式作用元件,一般長度為大約10到大約300bp,其作用於啟動子,增強其轉錄。示例性增強子包括在複製起點下遊側100bp到270bp的SV40增強子、巨細胞病毒早期啟動子增強子、在複製起點下遊側的多瘤增強子,和腺病毒增強子。此外,表達載體含有一個或多個選擇性標記基因,使得可以對含有該載體30的宿主細胞進行選擇。這樣的選擇性標記包括編碼二氫葉酸還原酶的基因和使得真核細胞培養物具有新黴素抗性的基因、使得大腸桿菌具有四環素或氨苄青黴素抗性的基因和釀酒酵母(S,c^e他^)7TP;基因。在一些方面中,編碼本發明的多肽之一或含有其至少大約5、10、15、20、25、30、35、40、50、75、100或150或更多個連續胺基酸的片段的核酸與能指導35翻譯出的多肽或其片段的分泌的前導序列以適當的位置關係進行裝配。一方面,該核酸可以編碼融合蛋白,其中本發明的多肽之一或含有其至少大約5、10、15、20、25、30、35、40、50、75、100或150或更多個連續胺基酸的片段被融合到異源肽或多肽,例如N-末端鑑定肽,其給予了期望的特性,如增加的穩定性或簡化的純化特性。合適的DNA序列可以通過各種程序插入載體中。一般而言,將插入物和5載體用合適的限制性內切酶消化後,DNA序列可以連接到載體中的所希望的位置。可選擇地,插入物和載體的平末端可以被連接。多種克隆技術被公開於Ausubeetal.CurrentProtocolsinMolecularBiology,JohnWiley503Sons,Inc.1997禾卩Sambrooketal,MolecularCloning:ALaboratoryManual2ndEd.,ColdSpringHarborLaboratoryPress(1989)。這樣的程序和別的程序被認為在本領域技術人員的範圍10內。載體可以是例如質粒、病毒顆粒或噬菌體的形式。別的載體包括染色體的、非染色體的和合成的DNA序列,SV40的衍生物;細菌質粒、噬菌體DNA、杆狀病毒、酵母質粒、衍生於質粒和噬菌體DNA的組合的載體、病毒DNA例如牛痘、腺病毒、禽痘病毒和偽狂犬病病毒DNA。在原核和真核宿主中使用的各種克隆和15表達載體在Sambrook,etal,MolecularCloning:ALaboratoryManual,2ndEd.,ColdSpringHarbor,N.Y.,(1989)中描述。涼主雄辦飾應本發明也提供了包含本發明的核酸序列的轉化細胞,所述核酸序列例如編20碼本發明的纖維素酶如內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或|3-葡糖苷酶的序列,或本發明的載體。宿主細胞可以是本領域技術人員熟悉的任何宿主細胞,包括原核細胞,真核細胞,例如,細菌細胞、真菌細胞、酵母細胞、哺乳動物細胞、昆蟲細胞或植物細胞。示例性的細菌細胞包括鏈黴菌屬、葡萄球菌屬或桿菌屬的任何種,或者示例性種大腸桿菌、枯草芽孢桿菌(Bac,7/Mss"6"to)、蠟25狀芽孢桿菌(5a"7/wcewiw)、鼠傷寒沙門氏菌(Sa/mow//a0^Wwwn'wm)。示例性的昆蟲細胞包括草地夜蛾屬(S/wcfo/^ra)或果蠅屬(Z>0TO//7a)的任何種,包括果蠅和草地夜蛾(S;x/o;^ra)S/9。示例性的動物細胞包括CHO、COS或黑色素瘤細胞或任何鼠或人的細胞系。合適的宿主的選擇在本領域技術人員的能力範圍內。轉化各種高等植物種類的技術是已知的,在技術和科學文獻中有描30述,見,例如,Weising(1988)Ann.Rey.Genet.22:42卜477;美國專利5,750,870。載體可以使用各種技術導入宿主細胞中,包括轉化、轉染、轉導、病毒感染、基因槍或者Ti介導的基因轉移。具體的方法包括磷酸鈣轉染、DEAE-Dextran介導的轉染、脂轉染法(lipofection)或電穿孔(Davis,L.,Dibner,M.,Battey,I.,BasicMethodsinMolecularBiology,(1986))。35—方面,本發明的核酸或載體導入細胞是為了篩選,所以,所述核酸是以合適於該核酸的後續表達的方式進入細胞。導入的方法大體上由靶細胞類型決定。示例性的方法包括CaPCV沉澱法、脂質體融合、脂轉染法(例如,LIPOFECTINTM)、電穿孔法、病毒感染法,等等。候選的核酸可以穩定,整合到宿主細胞基因組中(例如,用反轉錄病毒導入)或者可以短暫的或穩定的存在於細胞質中(即,通過使用傳統的質粒,利用標準的調控序列、選擇標記,等等)。因為許多藥學上重5要的篩選要求人或模型哺乳動物靶細胞,所以可以使用能夠轉染這些靶的反轉錄病毒載體。在適當的情況下,工程宿主細胞可以在傳統的營養培養基中培養,所述營養培養基經改良而適於激活啟動子、選擇轉化子或擴增本發明的基因。在合適的宿主株被轉化和宿主株生長到合適的細胞密度之後,用合適的方法(例如,溫度10變化或化學誘導)誘導被選擇的啟動子,細胞再培養一段時期,使得它們產生所需的多肽或其片段。細胞可以通過離心收穫,通過物理或化學方法破碎,保留得到的粗提物以用於進一步的純化。被用來表達蛋白質的微生物細胞可以用任何常規方法破碎,包括冷凍-融解循環、超聲波裂解法、機械破碎法或使用細胞裂解試劑。這些方法15為本領域技術人員所熟知。表達的多肽或其片段可以從重組細胞培養物中通過包括硫酸銨或乙醇沉澱、酸提取、陰離子或陽離子交換色譜、磷酸纖維素色譜、疏水作用色譜、親和色譜、羥基磷灰石色譜和凝集素色譜在內的方法回收和純化。假如必要的話,可以應用蛋白質重摺疊來完成多肽的構象。假如需要的話,在最終的純化步驟中可以採用高效液相色譜(HPLC)。20宿主細胞中的構建物可以以傳統方式用於產生由重組序列編碼的基因產物。取決於重組生產方法中所用的宿主,由含有載體的宿主細胞產生的多肽可以糖基化或者非糖基化。本發明的多肽也可以包括或不包括起始甲硫氨酸殘基。也可以採用無細胞的翻譯系統來產生本發明的多肽。無細胞翻譯系統可以應用由DNA構建物轉錄得到的mRNA,所述DNA構建物包括與編碼所述多肽或25其片段的核酸可操作地連接的啟動子。在一些方面,該DNA構建物在進行體外轉錄反應之前可以被線性化。轉錄得到的mRNA然後與合適的無細胞翻譯提取物例如兔網狀細胞提取物溫育,產生所需的多肽或其片段。表達載體可以含有一個或多個選擇性標記基因,為選擇轉化宿主細胞提供表型特徵,例如真核細胞培養物的二氫葉酸還原酶或新黴素抗性,或者例如大腸30桿菌的四環素或氨苄青黴素抗性。含有感興趣多核苷酸如本發明的核酸的宿主細胞可以在傳統的營養培養基中培養,所述營養培養基經改良而適於激活啟動子、選擇轉化子或擴增基因。培養條件例如溫度、pH和類似條件是先前選擇宿主細胞用於表達所使用的培養條件,對於普通技術人員是明顯的。然後,被鑑定為具有指定的酶活性的克隆被測35序,以鑑定編碼具有增強活性的酶的多核苷酸序列。本發明提供了在細胞中過度表達重組纖維素酶如內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶的方法,該方法包括表達含有本發明的核酸的載體,本發明的核酸例如包含在至少約100個殘基的區域內與本發明的示例性序列具有至少約50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、573%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高的序列同一性的核酸序列的核酸,其中序列同一性通過使用序列比較算法的分析或通過視覺觀察來確定;或者在嚴緊條件下與本發明的核酸序列雜交的核酸。過度表達通過任何方式例如使用高活性啟動子、雙順反子(dicistronic)載10體或通過該載體的基因擴增來實現。本發明的核酸可以在任何體外或體內表達系統中被表達或過度表達。任何細胞培養系統可被用於表達或過度表達重組蛋白,包括細菌、昆蟲、酵母、真菌或哺乳動物培養物。通過啟動子、增強子、載體(例如,複製子載體、雙順反子載體的使用(見,例如Gurtu(19%)Biochem.Biophys.Res.Commun.229:295-8))、15培養基、培養系統等等的合適選擇,可以實現過度表達。一方面,使用選擇標記如穀氨醯胺合酶(見,例如Sanders(1987)Dev.Bio1.Stand.66:55-63)在細胞系統中進行的基因擴增被用於過度表達本發明的多肽。宿主細胞可以是本領域技術人員熟悉的任何宿主細胞,包括原核細胞,真核細胞,例如,細菌細胞、真菌細胞、酵母細胞、哺乳動物細胞、昆蟲細胞或植物細胞。合適的宿主的選擇在本領域技20術人員的能力範圍內。載體可以使用各種技術導入宿主細胞中,包括轉化、轉染、轉導、病毒感染、基因槍或者Ti介導的基因轉移。具體的方法包括磷酸鈣轉染、DEAE-Dextran介導的轉染、脂轉染法(lipofection)或電穿孔(Davis,L.,Dibner,M.,Battey,I.,BasicMethodsinMolecularBiology,(1986))。25在適當的情況下,工程宿主細胞可以在傳統的營養培養基中培養,所述營養培養基經改良而適於激活啟動子、選擇轉化子或擴增本發明的基因。在合適的宿主株被轉化和宿主株生長到合適的細胞密度之後,用合適的方法(例如,溫度變化或化學誘導)誘導被選擇的啟動子,細胞再培養一段時期,使得它們產生所需的多肽或其片段。30細胞可以通過離心收穫,通過物理或化學方法破碎,保留得到的粗提物以用於進一步的純化。被用來表達蛋白質的微生物細胞可以用任何常規方法破碎,包括冷凍-融解循環、超聲波裂解法、機械破碎法或使用細胞裂解試劑。這些方法為本領域技術人員所熟知。表達的多肽或其片段可以從重組細胞培養物中通過包括硫酸銨或乙醇沉澱、酸提取、陰離子或陽離子交換色譜、磷酸纖維素色譜、疏35水作用色譜、親和色譜、羥基磷灰石色譜和凝集素色譜在內的方法回收和純化。假如必要的話,可以應用蛋白質重摺疊來完成多肽的構象。假如需要的話,在最終的純化歩驟中可以採用高效液相色譜(HPLC)。各種哺乳動物細胞培養系統也可以被用於表達重組蛋白。哺乳動物表達系統的實例包括猴腎成纖維細胞的COS-7系(由Gluzman,Cell,21:175,1981描述),以及能從相容載體表達蛋白的其它細胞系,如C127、3T3、CHO、HeLa和BHK5細胞系。宿主細胞中的構建物可以以傳統方式用於產生由重組序列編碼的基因產物。根據重組產生方法中所用的宿主,由含有載體的宿主細胞產生的多肽可以糖基化或者非糖基化。本發明的多肽也可以包括或不包括起始甲硫氨酸殘基。可選地,本發明的多肽,或者含有其至少大約5、10、15、20、25、30、1035、40、50、75、100或150或更多個連續胺基酸的片段,可以通過常規肽合成儀合成產生,例如,如下面所討論。在其它方面,通過肽合成,所述多肽的片段或部分可以被用於產生相應的全長多肽;因此,所述片段可用作產生全長多肽的中間物。也可以採用無細胞的翻譯系統來產生本發明的多肽之一或含有其至少大15約5、10、15、20、25、30、35、40、50、75、100或150或更多個連續胺基酸的片段,其應用由DNA構建物轉錄得到的mRNA,所述DNA構建物包括與編碼所述多肽或其片段的核酸可操作地連接的啟動子。在一些方面,該DNA構建物在進行體外轉錄反應之前可以被線性化。轉錄得到的mRNA然後與合適的無細胞翻譯提取物例如兔網狀細胞提取物溫育,產生所需的多肽或其片段。20在本發明的實踐中,本發明的核酸和編碼本發明的纖維素酶如內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或p-葡糖苷酶的核酸,或本發明的修飾的核酸,可以通過擴增來增殖,例如,通過PCR。擴增也可以被用於克隆或修飾本發25明的核酸。因此,本發明提供了用於擴增本發明核酸的擴增引物序列對。本
技術領域:
技術人員能設計用於這些序列的任何部分或全長的擴增引物序列對。—方面,本發明提供了通過本發明的擴增引物對擴增的核酸,所述擴增引物對例如本發明的核酸的大約前(5')12、13、14、15、16、17、18、19、20、21、22、23、24或25或更多個殘基以及互補鏈的大約前(5')15、16、17、18、19、20、3021、22、23、24或25或更多個殘基所示的引物對。本發明提供了用於擴增核酸的擴增引物序列對,所述核酸編碼具有纖維素酶如內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶的多肽,其中所述引物對能夠擴增含有本發明的序列或其片段或子序列的核酸。擴增引物序列對的一個成員或每一成員可以包含寡核苷酸,該寡核苷酸包含所述序列的至少約10至50個或更多個連續鹼基,或所述35序列的約12、13、14、15、16、17、18、19、20、21、22、23、24或25或更多個連續殘基。本發明提供了擴增引物對,其中所述引物對包括第一成員和第二成員,第一成員具有本發明核酸的大約前(5,)12、13、14、15、16、17、18、19、20、21、22、23、24或25或更多個鹼基所示的序列,第二成員具有第一成員的互補鏈的大約前(5,)12、13、14、15、16、17、18、19、20、21、22、23、24或25或更多個鹼基所示的序列。5本發明提供了通過擴增產生的纖維素酶,例如編碼內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或p-葡糖苷酶,所述擴增例如聚合酶鏈反應(PCR),使用本發明的擴增引物對。本發明提供了通過擴增製備纖維素酶,例如內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或(3-葡糖苷酶的方法,所述擴增例如PCR,使用本發明的擴增引物對。一方面,所述擴增引物對從文庫例如基因文庫諸如環10境文庫擴增核酸。擴增反應也可以被用於量化樣品中核酸的量(如細胞樣品中信息的量)、標記核酸(例如將其應用於陣列或印跡)、檢測核酸,或量化樣品中特異性核酸的量。在本發明的一個方面,擴增從細胞或cDNA文庫分離出的信息。技術人員可以選擇和設計合適的寡核苷酸擴增引物。擴增方法在本技術領15域也是己知的,包括,例如聚合酶鏈式反應PCR(例如參見PCRPROTOCOLS,AGUIDETOMETHODSANDAPPLICATIONS,ed.Innis,AcademicPress,N.Y.(1990)和PCRSTRATEGIES(1995),ed.Innis,AcademicPress,Inc.N.Y.,連接酶鏈式反應(LCR)(例如參見Wu(1989)Genomics4:560;Landegren(1988)Science241:1077;Barringer(1990)Gene89:117);轉錄擴增(例如參見Kwoh(1989)Proc.Natl.Acad.20Sci.USA86:1173);和自主維持序列複製(例如參見Guatelli(1990)Proc.Natl.Acad.Sci.USA87:1874);QP複製酶擴增(例如參見Smith(1997)J.Clin.Microbiol.35:1477_1491),自動Q_p複製酶擴增測定法(例如參見Burg(1996)Mol.Cell.Probes10:257-271)和其它的RNA聚合酶介導技術(例如NASBA,Cangene,Mississauga,Ontario);也參見Berger(1987)MethodsEnzymol,152:307-316;Sambrook;Ausubel;25美國專利4,683,195和4,683,202;Sooknanan(1995)Biotechnology13:563-564。確定核酸和多肽的序列同一性本發明提供了核酸,所述核酸包括與本發明的示例性核酸(參見表1、2和3,下面的實施例1和4,以及序列表)在至少大約50、75、100、150、200、30250、300、350、400、450、500、550、600、650、700、750、800、850、900、950、1000、1050、1100、1150、1200、1250、1300、1350、1400、1450、1500、1550或更多殘基的區域內具有至少大約50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、7P/。、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、3583%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高或完全的(100%)序列同一性(同源性)的序列。本發明提供了多肽,該多肽包括與本發明的示例性多肽(參見表l、2和3,下面的實施例1和4,以及序列表)具有至少大約50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、582%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高或完全的(100%)序列同一性的序列。序列同一性(同源性)的程度可以使用任何電腦程式和相關參數來確定,包括本文描述的那些,如BLAST2.2.2或FASTA3.0t78版本,參數為默認值。本發明的核酸序列可以包括本發明的示例性序列和與其基本上相同的序10列的至少10、15、20、25、30、35、40、50、75、100、150、200、300、400或500或更多個連續核苷酸。本發明的核酸序列的同源序列和片段可以指與這些序列具有至少約50°/。、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、1587%、88%、89%、90%、91%、92%、93%、94%、95°/。、96%、97%、98%、99%或更高的序列同一性(同源性)的序列。同源性(序列同一性)可以使用本文所描述的任何電腦程式和參數來確定,包括FASTA3.0t78版本,參數為默認值。同源序列還包括RNA序列,其中尿嘧啶取代本發明核酸序列中的胸腺嘧啶。同源序列可以使用本文描述的任意一種方法獲得,或者從對測序錯誤的糾正中產生。20應該意識到,本發明的核酸序列可以以傳統的單字母格式表示(例如參見Stryer,Lubert.Biochemistry,3rdEd.,W.HFreeman&Co.,NewYork),或以在序列中記錄核苷酸的身份的任何其它格式表示。在各個方面,本文描述的序列比較程序被用於本發明的該方面,即,確定核酸或多肽序列是否在本發明的範圍之內。然而,蛋白和/或核酸序列同一性(同25源性)可以使用本
技術領域:
已知的任何序列比較算法或程序來評價。這樣的算法和程序包括,但不限於,TBLASTN、BLASTP、FASTA、TFASTA和CLUSTALW(參見,例如PearsonandLipman,Proc.Natl.Acad.Sci.USA85(8):2444-2448,1988;Altschul等人,J.Mol.Biol.215(3):403-410,1990;Thompson等人,NucleicAcidsRes.22(2):4673-4680,1994;Higgins等人,MethodsEnzymol.266:383-402,1996;Altschul30等人,j.Mol.Biol.215(3):403-410,1990;Altschul等人,NatureGenetics3:266-272,1993)。一方面,同源性或同一性可以使用序列分析軟體來測量(例如,地址為1710UniversityAvenue,Madison,WI53705的威斯康星大學生物技術中心遺傳學計算機組(GeneticsComputerGroup)的序列分析軟體包)。這樣的軟體通過對各種缺失、35取代和其它的修飾賦予同源性度數來匹配相似的序列。一方面,用於表示兩個或者更多個核酸或者多肽序列之間的關係的術語"同源性"和"同一性",是指當兩個或更多個序列或子序列在某一比較窗口(comparisonwindow)或者指定區域內被比較和聯配以確定最大一致性時,這些序列是相同的,或者具有特定百分比例的相同胺基酸殘基或核苷酸,其可以應用各種序列比較算法或者通過人工聯配和視覺觀察來確定。一方面,對於序列比較,將一個序列作為參考序列,而將測試5序列與之進行比較。當使用序列比較算法時,將測試序列和參考序列輸入到計算機中,指定子序列坐標,如果必要,也指定序列算法程序參數。可以使用默認的程序參數,或者可以指定別的參數。然後基於程序參數,序列比較算法計算出測試序列相對於參考序列的序列同一性百分比。—方面,BLAST和BLAST2.0算法被使用,其分別被描述於Altschul(1997)Nuc.AcidsRes.25:3389-3402,1997和Altschul(1990)J.Mol.Biol.215:403-410,19卯。用於實施BLAST分析的軟體可以通過美國國家生物技術信息中心公開獲得。這一算法涉及首先通過鑑別待詢序列(querys叫uence)中長度為W的短的字串來確定高分序列對(highscoringsequencepairs,HSPs),所述高分序列對在與資料庫15序列中同樣長度的字串聯配時,匹配或者滿足某個正值的閾值T。T是指鄰近字串(neighborhoodword)的分數閾值(Altschul等,如上)。這些初始的鄰近字串被用來啟動搜索以發現包含有它們的更長的HSPs。所述字串沿著每一個序列向兩個方向延伸,只要累積的聯配分數在增加。對於核苷酸序列,使用參數M(—對匹配的殘基的獎勵分數;總是大於0)來計算累積分數。對於胺基酸序列,使用記分20矩陣來計算累計分數。出現下面情況時,字串在各個方向上的延伸便停止累積的聯配分數由達到的最大值下降了數量X;由於一個或者多個記分為負的殘基聯配的累積,累積分數達到0或者0以下;或者延伸到了任一序列的末端。BLAST算法的參數W、T和X決定了聯配的靈敏度和速率。BLASTN程序(對於核苷酸序列)默認的是字串長度(W)為11,期望值(E)為10,M=5,N=-4,對兩25條鏈進行比較。對於胺基酸序列,BLASTP程序默認字串長度為3,期望值(E)為10,BLOSUM62記分矩陣(參見Henikoff和Henikoff(1989)Proc.Natl.Acad.Sci.USA89:10915)聯配(B)為50,期望值(E)為10,M=5,N=-4,對兩條鏈進行比較。BLAST算法也進行兩個序列之間的相似性的統計學分析(參見,例如,30Karlin和Altschul(1993)Proc.Natl.Acad.Sci.USA90:5873)。由BLAST算法提供的一種相似性量度是最小合計概率(smallestsumprobability,P(N)),其表示兩個核苷酸或者胺基酸序列間的匹配將偶然發生的概率。例如,在測試核酸和參考核酸的比較中,如果最小合計概率小於大約0.2,更優選的是在一方面中小於0.01,最優選的是在一方面中小於大約0.001,就認為該核酸與參考序列相似。35—方面,應用基本局域聯配搜索工具("BLAST")來評價蛋白和核酸序列同源性。具體而言,五個特定的BLAST程序可以用來進行以下的任務(1)BLASTP和BLAST3把胺基酸待詢序列與蛋白質序列資料庫進行比較;(2)BLASTN把核苷酸待詢序列與核苷酸序列資料庫進行比較;(3)BLASTX把待詢核苷酸序列(兩條鏈)的六個閱讀框架的概念上的5翻譯產物與蛋白序列資料庫進行比較;(4)TBLASTN把待詢蛋白序列與核苷酸序列資料庫的所有六個閱讀框架(兩條鏈)的翻譯結果進行比較;和(5)TBLASTX把核苷酸待詢序列的六個框架的翻譯結果與核苷酸序列資料庫的六個框架的翻譯結果進行比較。10BLAST程序通過確定相似片段來確定同源序列,所述相似片段在此是指在待查詢的胺基酸或核酸序列與受測序列之間的"高分片段對(high-scoringsegmentpairs)",該受測序列一方面從蛋白或者核酸序列資料庫得到。高分片段對一方面利用記分矩陣來鑑定(即,聯配),很多的記分矩陣在本領域是已知的。一方面,應用的記分矩陣為BLOSUM62矩陣(Gonnet(1992),Science256:1443-1445;15Henikoff和Henikoff(1993),Proteins17:49-61)。較不優選地,在一方面,也可以應用PAM或者PAM250矩陣(參見如,Schwartz和Dayhoff,eds.,1978,Afafn'cesWashingion:NationalBiomedicalResearchFoundation)。BLAST程序通過美國國家醫學圖書館(U.S.NationalLibraryofMedicine)可以獲得。20根據所研究的序列長度和同源性程度,上述算法使用的參數可以被調整。在一些方面,在無用戶的指示的情況下,所述參數使用算法所採用的默認參數。計算機系統和電腦程式產品本發明提供了計算機、計算機系統、計算機可讀取的介質、電腦程式產25品以及其上記錄或存儲了本發明的核酸和多肽序列的類似設備。此外,在實踐本發明的方法中,例如,為了確定和鑑定序列同一性(為了確定核酸是否在本發明的範圍之內)、結構同源性、基序等等,本發明的核酸或多肽序列可以在可通過計算機讀取和訪問的任何介質上存儲、記錄和操作。正如此處所用,詞語"記錄"和"存儲"指在計算機介質上存儲信息的過30程。熟練技術人員能容易地採用任何已知方法,在計算機可讀取的介質上存儲信息,以產生包括本發明的一個或多個核酸和/或多肽序列的產品。正如本文所用,術語"計算機"、"電腦程式"和"處理器"以它們在最廣的普通語境中的含義被使用,包括了所有這樣的設備,例如下面所詳細描述的。特定多肽或蛋白的"編碼序列"或"編碼特定多肽或蛋白的序列"是指當被置於適當的調控序列的控制35下時可被轉錄和翻譯成多肽或蛋白的核酸序列。本發明的多肽包括本發明的示例性序列和與其基本上相同的序列以及前述序列的任一個的子序列(片段)。一方面,基本上相同的、或同源的多肽序列是指與本發明的示例性序列具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、583%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93Q/o、94%、95%、96%、97%、98%、99%或更高或完全的(100%)序列同一性(同源性)的多肽序列。同源性(序列同一性)可以使用本文所描述的電腦程式和參數的任一種進行確定。本發明的核酸或多肽序列可以在可通過計算機讀取和訪問的任何介質10上存儲、記錄和操作。正如此處所用,詞語"記錄"和"存儲"指在計算機介質上存儲信息的過程。熟練技術人員能容易地採用任何目前已知的方法,在計算機可讀取的介質上存儲信息,以產生包括本發明的一個或多個核酸序列、本發明的一個或多個多肽序列的產品。本發明的另一方面是其上記錄有至少2、5、10、15或20或更多個本發明的核酸或多肽序列的計算機可讀取介質。15本發明的另一方面是其上記錄有本發明的一個或多個核酸序列的計算機可讀取介質。本發明的另一方面是其上記錄有本發明的一個或多個多肽序列的計算機可讀取介質。本發明的另一方面是其上記錄有至少2、5、10、15或20或更多個如上面所述的核酸或多肽序列的計算機可讀取介質。計算機可讀取介質包括磁性可讀取介質、光學可讀取介質、電子可讀取介20質和磁/光學介質。例如,計算機可讀取的介質可以是硬碟、軟盤、磁帶、CD-ROM、數位化視頻光碟(DVD)、隨機存取存儲器(RAM)或只讀存儲器(ROM)以及本領域的技術人員己知的其它類型的其它介質。本發明的方面包括系統(例如基於網際網路的系統),例如計算機系統,它們存儲和操縱本文描述的序列信息。計算機系統100的一個實例以框圖形式示意25性地描述在圖1中。正如此處所用,"計算機系統"指硬體部分、軟體部分以及數據存儲部分,它們用於分析本發明的核酸序列的核苷酸序列或本發明的多肽序列。一方面,計算機系統100包括用於處理、訪問和操縱序列數據的處理器。處理器105可以是任何熟知類型的中央處理單元,如來自英特爾公司的奔騰III,或來自Sun、Motorola、Compag、AMD或IBM公司的類似處理器。30—方面,計算機系統100是一個通用的系統,該系統包括處理器105和用於存儲數據的一個或多個內部數據存儲部件110,以及用於檢索數據存儲部件上存儲的數據的一個或多個數據檢索設備。技術人員能容易地意識到,任何一種當前可獲得的計算機系統都是合適的。在一個特定的方面,計算機系統100包括連接到總線上的處理器105,總35線連接到主存儲器115(在一方面,以RAM來實現)和一個或多個內部數據存儲設備110,例如其上已經存儲了數據的硬碟驅動器和/或其它計算機可讀介質。在一些方面,計算機系統100進一歩包括一個或多個數據檢索設備118,用於讀取在內部數據存儲設備110上存儲的數據。數據檢索設備118可以是,例如軟盤驅動器、壓縮磁碟驅動器、磁帶驅動器或能連接到遠程數據存儲系統的數據機(例如通過網際網路)等等。在一些5方面中,內部數據存儲設備110是可移動的計算機可讀介質,例如含有控制邏輯和/或其上記錄的數據的軟盤、壓縮磁碟、磁帶等等。計算機系統100可以有利地包括適當的軟體或用適當的軟體編程,用於當數據存儲部件被插入到數據檢索設備中時從數據存儲部件讀取控制邏輯和/或數據。計算機系統100包括顯示器120,用於給計算機用戶顯示輸出。也應用注10意到,計算機系統100可以被連接到網絡或廣域網中的其它計算機系統125a-c,以便給計算機100提供集中訪問。用於訪問和處理本發明的核酸序列的核苷酸或本發明的多肽序列的軟體(例如,檢索工具、比較工具和建模工具等等)在執行過程中可駐留於主存儲器115中。15在一些方面,計算機系統100可以進一步包括序列比較算法,其用於比較存儲於計算機可讀介質上的本發明核酸序列或本發明多肽序列與存儲於計算機可讀介質上的參考核苷酸或多肽序列。"序列比較算法"指在計算機系統100上執行(本地或遠程)的一種或多種程序,以比較核苷酸序列和數據存儲設備中存儲的其它核苷酸序列和/或化合物。例如,序列比較算法可以將計算機可讀介質上存儲20的本發明的核酸序列的核苷酸序列或本發明的多肽序列與計算機可讀介質上存儲的參考序列進行比較,以鑑定同源性或結構基序。圖2是示意性說明過程200的一個方面的流程圖,該過程用於將新的核苷酸或蛋白序列與序列資料庫進行比較,以便確定新序列和資料庫中的序列之間的同源性水平。序列資料庫可以是存儲於計算機系統100上的個人資料庫,或可以25通過網際網路獲得的公共資料庫如GENBANK。過程200在起始狀態201開始,然後轉到狀態202,其中要被比較的新序列被存儲於計算機系統100的存儲器上。正如上面所討論的,該存儲器可以是任何類型的存儲器,包括RAM或內部存儲設備。然後過程200轉到狀態204,其中打開序列資料庫以進行分析和比較。然30後過程200轉到狀態206,其中資料庫中存儲的第一個序列被讀取到計算機的存儲器中。然後在狀態210進行比較,以確定第一個序列是否與第二個序列相同。重要的是應該注意到,該步驟不限於進行新序列和資料庫中第一個序列之間的精確比較。用於比較兩個核苷酸或蛋白序列的熟知的方法對於本
技術領域:
的普通技術人員是己知的,即使所述兩個核苷酸或蛋白序列不完全相同。例如,可以在一個35序列中引入空位,以提高兩個測試序列之間的同源性水平。控制空位或其它特徵在比較過程中是否被引入到序列中的參數通常由計算機系統的用戶輸入。—旦已經在狀態210進行兩個序列的比較,在決策狀態210就要作出兩個序列是否相同的判斷。當然,術語"相同的"不限於絕對相同的序列。在過程200中,在由用戶輸入的同源性參數範圍內的序列都將被標記為"相同的"。如果作出兩個序列相同的判斷,過程200轉到狀態214,其中來自資料庫5的序列的名稱被顯示給用戶。該狀態通知用戶,具有顯示的名稱的序列滿足所輸入的同源性限制。一旦所存儲序列的名稱被顯示給用戶,過程200轉到決策狀態218,其中作出資料庫中是否存在更多序列的判斷。如果資料庫中不存在更多的序歹lj,那麼過程200在結束狀態220終止。然而,如果資料庫中確實存在更多的序歹廿,那麼過程200轉到狀態224,其中指針被指向資料庫中的下一個序列,以便與10新序列進行比較。以這種方式,將新序列與資料庫中的每一序列聯配並進行比較。應該注意到,如果已經在決策狀態212已經作出了序列不同源的判斷,那麼過程200將立即轉到決策狀態218,以便確定用於比較的資料庫中的任何其它序列是否可利用。因此,本發明的一個方面是計算機系統,該系統包括處理器、其上已經存15儲了本發明核酸序列或本發明的多肽序列的數據存儲設備、其上以可檢索方式存儲了待與本發明的核酸序列或本發明的多肽序列比較的參考核苷酸序列或多肽序列的數據存儲設備、以及用於進行比較的序列比較器。該序列比較器可以指出被比較的序列之間的同源性水平,或鑑定上述的本發明的核酸序列的核酸密碼或者本發明的多肽序列中的結構基序,或者該比較器可以鑑定與這些核酸密碼和多肽20密碼進行比較的序列中的結構基序。在一些方面中,數據存儲設備可以在其上已經存儲了至少2、5、10、15、20、25、30或40個或更多個本發明的核酸序列或本發明的多肽序列的序列。本發明的另一方面是確定本發明的核酸序列或本發明的多肽序列和參考核苷酸序列之間的同源性水平的方法。所述方法包括通過使用確定同源性水平的25電腦程式讀取核酸密碼或多肽密碼以及參考核苷酸或多肽序列,以及用該電腦程式確定核酸密碼或多肽密碼與參考核苷酸或多肽序列之間的同源性水平。所述電腦程式可以是確定同源性水平的許多電腦程式的任何一種,包括本文中具體羅列的那些程序(例如,BLAST2N,具有默認參數或任何調整的參數)。所述方法可以使用上述的計算機系統執行。所述方法還可以如下進行通過使用所述30電腦程式讀取至少2、5、10、15、20、25、30或40個或更多個上述的本發明的核酸序列或本發明的多肽序列,以及確定核酸密碼或多肽密碼與參考核苷酸或多肽序列之間的同源性水平。圖3是示意性說明計算機中實施的過程250的一個方面的流程圖,該過程用於確定兩個序列是否同源。過程250在起始狀態252開始,然後轉到狀態254,35其中要被比較的第一個序列被存儲到存儲器上。然後要被比較的第二個序列在狀態256被存儲到存儲器上。然後過程250轉到狀態260,其中讀取第一個序列中的第一個字符,然後轉到狀態262,其中讀取第二個序列的第一個字符。應該理解到,如果序列是核苷酸序列,那麼字符將通常是A、T、C、G或U。如果序列是蛋白序列,那麼字符一方面可以是單字母胺基酸密碼,以便第一個序列和第二個序列可以被容易地比較。5然後在決策狀態264作出兩個字符是否相同的判斷。如果它們相同,那麼過程250轉到狀態268,其中第一個和第二個序列中的下一個字符被讀取。然後作出該下一個字符是否相同的判斷。如果它們相同,那麼過程250繼續循環,直到兩個字符不相同。如果作出的判斷是這兩個字母不相符,那麼過程250轉到決策狀態274,以確定是否有更多的字符或者序列可以讀取。10如果沒有可讀取的任何更多的字符,那麼過程250轉到狀態276,其中第一個和第二個序列之間的同源性水平被顯示給用戶。同源性水平通過計算序列之間相同的字符在第一個序列的序列總數中的比例來確定。因此,如果第一個100個核苷酸序列中的每一個字符都與第二個序列中的每一個字符聯配,那麼同源性水平將是100%。15可以選擇地,電腦程式可以是這樣的電腦程式,其將本發明所示的核酸序列的核苷酸序列與一個或多個參考核苷酸序列進行比較,以確定本發明的核酸密碼是否在一個或多個位置上與參考核酸序列不同。任選地,這樣的程序記錄,相對於參考多核苷酸序列或者本發明的核酸序列,被插入、刪除或取代的核苷酸的長度和身份。一方面,電腦程式可以是確定本發明的核酸序列是否相對於參20考核苷酸序列含有單核苷酸多態性(SNP)的程序。因此,本發明的另一方面是確定本發明的核酸序列是否在一個或多個核苷酸處與參考核苷酸序列不同的方法,所述方法包括通過使用鑑定核酸序列之間的差異的電腦程式讀取核酸密碼和參考核苷酸序列,並用該電腦程式鑑定核酸密碼和參考核苷酸序列之間的差異。在一些方面,電腦程式是鑑定單核苷酸多25態性的程序。該方法可以通過上面描述的電腦程式和圖3所示意性說明的方法執行。所述方法還可以如下進行通過使用所述電腦程式讀取至少2、5、10、15、20、25、30或40個或更多個本發明核酸序列和參考核苷酸序列,以及用該電腦程式鑑定核酸密碼與參考核苷酸序列之間的差異。在其它方面,基於計算機的系統可以進一步包括鑑定器,其用於鑑定本發30明的核酸序列或本發明的多肽序列中的特徵。"鑑定器"指在本發明的核酸序列或本發明的多肽序列中鑑定某些特徵的一個或多個程序。一方面,鑑定器可以包括在本發明的核酸序列中鑑定開放閱讀框(ORF)的程序。圖4是示意性說明鑑定器過程300的一個方面的流程圖,即用於檢測序列中特徵的存在。過程300在起始狀態302開始,然後轉到狀態304,其中將被檢査35特徵的第一個序列存儲在計算機系統100的存儲器115上。然後過程300轉到狀態306,其中打開序列特徵資料庫。這樣的資料庫包括每一特徵的屬性以及該特徵的名稱的列表。例如,特徵名稱是"起始密碼子",屬性是"ATG"。另一個實例是特徵名稱"TAATAA序列盒",特徵屬性是"TAATAA"。這樣的資料庫的實例由威斯康星大學遺傳學計算機組(UniversityofWisconsinGeneticsComputerGroup)開發。可以選擇地,這些特徵可以是結構多肽基序如a螺旋、J3摺疊,或功能多肽5基序如酶活性位點、螺旋-轉角-螺旋基序或本
技術領域:
技術人員已知的其它基序。—旦在狀態306打開特徵資料庫,過程300就轉到狀態308,其中從資料庫讀取第一個特徵。然後在狀態310將第一個特徵的屬性與第一個序列進行比較。接著在決策狀態316作出在第一個序列中是否發現該特徵的屬性的判斷。如果發現了屬性,那麼過程300轉到狀態318,其中所發現的特徵的名稱被顯示給用戶。10然後,過程300轉到決策狀態320,其中作出資料庫中是否存在更多特徵的判斷。如果不存在更多特徵,那麼過程300在結束狀態324終止。然而,如果資料庫中確實存在更多的特徵,那麼過程300在狀態326讀取下一個序列特徵,循環回到狀態310,其中將下一個特徵的屬性與第一個序列進行比較。應當注意,如果在決策狀態316在第一個序列中沒有發現特徵屬性,那麼過程300直接轉到15決策狀態320,以便確定資料庫中是否存在更多特徵。因此,本發明的另一方面是鑑定本發明的核酸序列或本發明的多肽序列中的特徵的方法,所述方法包括通過使用鑑定其中特徵的電腦程式讀取核酸密碼或多肽密碼,並用該電腦程式鑑定核酸密碼中的特徵。一方面,電腦程式包括鑑定開放閱讀框(ORF)的電腦程式。所述方法可以如下進行通過使用所20述電腦程式讀取本發明的核酸序列或本發明的多肽序列中的一個序列或至少2、5、10、15、20、25、30或40個或更多個序列,以及用該電腦程式鑑定核酸密碼或多肽密碼中的特徵。本發明的核酸序列或本發明的多肽序列可以以多種格式在各種數據處理器程序中存儲和操作。例如,本發明的核酸序列或本發明的多肽序列可以以文本25文件存儲在字處理文件中,如MicrosoftWORD頂或WORDPERFECT,或以ASCII文件存儲在本領域技術人員熟悉的各種資料庫程序中,例如DB2TM、SYBASE或ORACLE。此外,許多電腦程式和資料庫可以被用作序列比較算法、鑑定器或與本發明的核酸序列或本發明的多肽序列進行比較的參考核苷酸序列或多肽序列的來源。下面的羅列不意圖限制本發明,而是提供對本發明的核30酸序列或本發明的多肽序列有用的程序和資料庫的指導。可以使用的程序和資料庫,包括但不限於MACPATTERN(EMBL)、DISCOVERYBASE(MolecularApplicationGroup)、GENEMINE(MolecularApplicationGroup)、LOOK(MolecularApplicationGroup)、MACLOOK(MolecularApplicationGroup)、BLAST和BLAST2(NCBI)、BLASTN和BLASTX35(Altschul等人,J.Mol.Biol.215:403,1990)、FASTA(PearsonandLipman,Proc.Natl.Acad.Sci.USA,85:2444,1988)、FASTDB(Brutlag等人,Comp.App.Biosci.6:237-245,1990)、CATALYST(MolecularSimulationsInc.)、Catalyst/SHAPE(MolecularSimulationsInc.)、Cerius2.DBAccessTM(MolecularSimulationsInc.)、HypoGen(MolecularSimulationsInc.)、INSIGHTIITM(MolecularSimulationsInc.)、DISCOVER(MolecularSimulationsInc.)、CHARMm(Molecular5SimulationsInc.)、FELIXTM(MolecularSimulationsInc.)、DELPHI(MolecularSimulationsInc.)、QuanteMMTM(MolecularSimulationsInc.)、Homology(MolecularSimulationsInc.)、MODELER(MolecularSimulationsInc.)、ISIS(MolecularSimulationsInc.)、Quanta/ProteinDesign(MolecularSimulationsInc.)、WebLab(MolecularSimulationsInc.)、WebLabDiversityExplorer(MolecularSimulations10Inc.)、GeneExplorer(MolecularSimulationsInc.)、SeqFold(MolecularSimulationsInc.)、MDLAvailableChemicalsDirectory資料庫、MDLDrugDataReport資料庫、ComprehensiveMedicinalChemistry資料庫、Derwent'sWorldDrugIndex資料庫、BioByteMasterFile資料庫、Genbank資料庫和Genseqn資料庫。基於本發明的公開內容,許多其它程序和資料庫對於本
技術領域:
的技術人員是顯而易見的。15可以用上述程序檢測的基序包括編碼亮氨酸拉鏈的序列、螺旋-轉角-螺旋基序、糖基化位點、泛素化位點、ct螺旋和P摺疊、編碼指導被編碼的蛋白分泌的信號肽的信號序列、在轉錄調節中涉及的序列如同源框、酸性伸展物(acidicstretches)、酶活性位點、底物結合位點和酶切割位點。20核酸的雜交本發明提供了分離的或重組的核酸,這些核酸與本發明的示例性序列(例如SEQIDNO:l,SEQIDNO:3,SEQIDNO:5,SEQIDNO:7,SEQIDNO:9,SEQIDNO:ll,SEQIDNO:13,SEQIDNO:15,SEQIDNO:17,SEQIDNO:19,SEQIDNO:21,SEQIDNO:23,SEQIDNO:25,SEQIDNO:27,SEQIDNO:29,SEQ25IDNO:31,SEQIDNO:33,SEQIDNO:35,SEQIDNO:37,SEQIDNO:39,SEQIDNO:41,SEQIDNO:43,SEQIDNO:45,SEQIDNO:47,SEQIDNO:49,SEQIDNO:51,SEQIDNO:53,SEQIDNO:55,SEQIDNO:57'SEQIDNO:59,SEQIDNO:61,SEQIDNO:63,SEQIDNO:65,SEQIDNO:67,SEQIDNO:69,SEQIDNO:71,SEQIDNO:73,SEQIDNO:75,SEQIDNO:77,SEQIDNO:79,SEQ30IDNO:81,SEQIDNO:83,SEQIDNO:85,SEQIDNO:87,SEQIDNO:89,SEQIDNO:91,SEQIDNO:93,SEQIDNO:95,SEQIDNO:97,SEQIDNO:99,SEQIDNO:101,SEQIDNO:103,SEQIDNO:105,SEQIDNO:107,SEQIDNO:109,SEQIDNO:lll,SEQIDNO:113,SEQIDNO:115,SEQIDNO:117,SEQIDNO:119,SEQIDNO:121,SEQIDNO:123,SEQIDNO:125,SEQIDNO:127,SEQ35IDNO:129,SEQIDNO:131,SEQIDNO:133,SEQIDNO:135,SEQIDNO:137,SEQIDNO:139,SEQIDNO:141,SEQIDNO:143,SEQIDNO:145'SEQIDNO:147,SEQIDNO:149,SEQIDNO:151,SEQIDNO:153,SEQIDNO:155,SEQIDNO:157,SEQIDNO:159,SEQIDNO:161,SEQIDNO:163或SEQIDNO:165(也參見表1、2和3、下面的實施例1和4,以及序列表))在嚴緊條件下雜交。嚴緊條件可以是高度嚴緊性條件、中度嚴緊性條件和/或低度嚴緊性條件,5包括本文描述的高的和降低的嚴緊性的條件。一方面,正如下面所討論的,洗滌條件的嚴緊性提供了決定核酸是否在本發明範圍內的條件。"雜交"指這樣一個過程,g卩,通過該過程核酸鏈與互補鏈通過鹼基配對而結合。雜交反應可以是靈敏的並且是選擇性的,以便感興趣的特定序列可以被鑑定,甚至在其以低濃度存在的樣品中也可以被鑑定。適度的嚴緊條件(stringent10conditions)可以通過,例如預雜交和雜交溶液中鹽或甲醯胺的濃度來定義,或者通過雜交溫度來定義,這些嚴緊條件在本
技術領域:
是已知的。在可選的方面,嚴緊性可以通過降低鹽的濃度、增加甲醯胺的濃度或升高雜交溫度來增加。在可選擇的方面,本發明的核酸通過它們在各種嚴緊條件(例如強、中等和低嚴緊條件)下雜交的能力來定義,正如本文所示。15—方面,高度嚴緊性下的雜交包括在大約37'C到42'C的溫度下大約50%的甲醯胺。一方面,雜交條件包括在大約301:到35'(:下在大約35%至25%的甲醯胺中降低的嚴緊性條件。一方面,雜交條件包括高度嚴緊性條件,例如,在42'C、在50%甲醯胺、5XSSPE、0.3%SDS中,和200n/ml的剪切和變性鮭精DNA。一方面,雜交條件包括這些降低的嚴緊性條件,但在降低的溫度35匸在35%甲醯胺20中。相應於特定的嚴緊性水平的溫度範圍可以通過計算目標核酸中的嘌呤嘧啶比並相應調節溫度而進一步縮小。上述範圍和條件的變化在本領域中是熟知的。在可以選擇的方面中,本發明的核酸,正如通過它們在嚴緊條件下雜交的能力所定義的,可以在本發明的核酸的大約五個殘基到全長之間;例如它們的長度可以是至少5、10、15、20、25、30、35、40、50、55、60、65、70、75、80、25卯、100、150、200、250、300、350、400、450、500、550、600、650、700、750、800、850、900、950、1000或更多殘基。也包括小於全長的核酸。這些核酸可以用作,例如雜交探針、標記探針、PCR寡核苷酸探針、siRNA或miRNA(單鏈或雙鏈)、反義或編碼抗體結合肽(表位)、基序、活性位點的序列以及類似序列。—方面,本發明的核酸通過它們在高度嚴緊性下雜交的能力定義,高度嚴30緊性包括在大約37'C到42'C的溫度下大約50。/。的甲醯胺的條件。一方面,本發明的核酸通過它們在降低的嚴緊性下雜交的能力定義,降低的嚴緊性包括在大約30'C到35'C在大約35%至25%的甲醯胺中的條件。可以選擇地,本發明的核酸通過它們在高度嚴緊性下雜交的能力定義,高度嚴緊性包括的條件為在42'C、在50%甲醯胺、5XSSPE、0.3。/。SDS中,和封35閉核酸的重複序列,如cot-l或鮭精DNA(例如200n/ml的剪切和變性鮭精DNA)。一方面,本發明的核酸通過它們在降低的嚴緊性條件下雜交的能力定義,降低的嚴緊性條件包括在35'C或42°C的降低溫度下的35%或40%甲醯胺中。在核酸雜交反應中,用於得到特定嚴緊性水平的條件將根據雜交中的核酸的性質變化。例如,所述核酸的雜交區域的長度、互補程度、核苷酸序列組成(例如GC和AT含量)和核酸類型(例如RNA和DNA)可以在選擇雜交條件時加以5考慮。另外的考慮因素是核酸之一是否被固定,例如固定在濾膜上。雜交可以在低度嚴緊性、中度嚴緊性或高度嚴緊性的條件下進行。作為核酸雜交的一個實例,含有固定化的變性核酸的聚合物膜首先在45'C在含有如下成分的溶液中預雜交30分鐘0.9MNaCl、50mMNaH2P04,pH7.0、5.0mMNa2EDTA、0.5%SDS、10XDenhardt,s和0.5mg/ml多核糖腺苷酸。然後在該溶液中加入大約102X107cpm(比活性為4-9X108cpm/ug)的32P末端標記的寡核苷酸探針。在溫育12-16小時後,在室溫下在含有0.5%SDS的IXSET"50mMNaCl、20mMTris鹽酸,pH7.8、lmMNa2EDTA)中將膜洗滌30分鐘,隨後,在該寡核苷酸探針的Tm-l(TC的溫度,在新鮮的1XSET中洗滌30分鐘。然後將膜暴露於放射自顯影膠片,以檢測雜交信號。所有的前述雜交將被認為在高嚴緊性條件下。15雜交後,洗滌濾膜以除去任何非特異性結合的可檢測探針。用於洗滌濾膜的嚴緊性也可以根據如下方面進行變化被雜交的核酸的性質、被雜交的核酸的長度、互補程度、核苷酸序列組成(例如GC和AT含量)和核酸類型(例如RNA和DNA)。逐步增高的嚴緊性條件洗滌的實例如下2XSSC,0.1%SDS,室溫下洗滌15分鐘(低度嚴緊性);O.IXSSC,0.5%SDS,室溫下洗滌30分鐘到1小時20(中度嚴緊性);O.IXSSC,0.5%SDS,雜交溫度和68'C之間洗滌15到30分鐘(高度嚴緊性);和0.15MNaCl,72'C洗滌15分鐘(極高嚴緊性)。最終的低嚴緊性洗滌可以在0.1XSSC在室溫下進行。上述的實例僅僅是可用於洗滌濾膜的一組條件的示例性說明。本領域技術人員將知道,對於不同嚴緊性的洗滌,可以有多種方案。下面給出了一些其它實例。25—方面,雜交條件包括洗滌步驟,其包括在室溫下在含有IX150mMNaCl、20mMTris鹽酸,pH7.8、lmMNa2EDTA、0.5%SDS的溶液中洗滌30分鐘,然後在新鮮溶液中洗滌30分鐘。通過放射自顯影或其它常規技術,鑑定已雜交至探針的核酸。可以對上述方法進行修飾,以鑑定與探針序列具有降低水平的序列同一性30(同源性)的核酸。例如,為了獲得與可檢測的探針具有降低的序列同一性(同源性)的核酸,可以使用較低嚴緊性的條件。例如,雜交溫度可以以5'C的梯度變化從68。C降低到42。C,雜交緩衝液的Na+濃度為大約1M。在雜交後,用2XSSC、0.5y。SDs在雜交溫度下洗滌濾膜。這些條件在高於5crc被認為是"中度"條件,在低於50'C被認為是"低度"條件。特定實例的"中度"雜交條件是當上述雜交35在55。C進行。特定實例的"低度嚴格性"雜交條件是當上述雜交在45'C進行。可以選擇地,雜交可以在含有甲醯胺的緩衝液如6XSSC中在42'C的溫度下進行。在這種情況下,雜交緩衝液中甲醯胺的濃度可以以5%的梯度變化從50%降低到0%,以鑑定與探針具有降低水平的同源性的克隆。在雜交後,用6XSSC、0.5%SDS在5(TC洗滌濾膜。這些條件在高於25%的甲醯胺被認為是"中度"條件,在低於25%甲醯胺被認為是"低度"條件。特定實例的"中度"雜交條件是當上5述雜交在30%甲醯胺中進行。特定實例的"低度嚴格性"雜交條件是當上述雜交在10%甲醯胺中進行。然而,雜交形式的選擇不是關鍵性的——洗滌條件的嚴緊性是決定核酸是否在本發明範圍內的條件。用於鑑定本發明範圍內的核酸的洗滌條件包括,例如在pH7大約0.02M的鹽濃度,至少大約50'C或大約55'C到大約60'C的溫度;或10者在72'C大約0.15MNaCi的鹽濃度下大約15分鐘;或者在至少大約50'C或大約55'C到大約6(TC的溫度下大約0.2XSSC的鹽濃度下大約15到大約20分鐘;或者用溶液將雜交複合物洗滌兩次,所述溶液的鹽濃度為含有0.1%SDS的大約2XSSC,在室溫下洗漆15分鐘,然後用含有0.1%SDS的0.1XSSC在68。C洗滌15分鐘,洗滌兩次;或者等同的條件。參見Sambrook,Tijssen和Ausubel對於SSC15緩衝液和等同條件的描述。這些方法可以被用於分離或鑑定本發明的核酸。例如,前述方法可用於分離或鑑定核酸,所述核酸具有與選自本發明的序列或含有其至少大約IO、15、20、25、30、35、40、50、75、100、150、200、250、300、350、400或500個連續鹼基的片段以及其互補序列之一的核酸序列具有至少大約50%、51%、52%、53%、2054%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%或更高的序列同一性(同源性)的序歹l」。序列同一性(同源性)可以使用聯配算法來測量。例如,同源多核苷酸可以25具有編碼序列,該編碼序列是本文描述的編碼序列之一的天然發生的等位基因變體。當與本發明的核酸比較時,這樣的等位基因變體可以具有一個或多個核苷酸的取代、刪除或添加。另外,上述的方法可用於分離編碼多肽的核酸,所述多肽與本發明的多肽或者包含其至少5、10、15、20、25、30、35、40、50、75、100或150個連續胺基酸的片段具有至少大約99%、至少大約95%、至少大約90%、30至少大約85%、至少大約80%、至少大約75%、至少大約70%、至少大約65%、至少大約60%、至少大約55%或至少大約50%的序列同一性(同源性),正如使用序列聯配算法(例如FASTA3.0t78版本算法,參數為默認值)所確定的。寡核苷酸探針及使用這些寡核苷酸探針的方法35本發明也提供了核酸探針,例如可以用於鑑定、擴增或分離編碼具有纖維素酶如內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶活性的多肽的核酸或其片段,或用於鑑定纖維素酶如內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶的基因。一方面,該探針包括本發明核酸中的至少大約10個連續鹼基。可以選擇地,本發明的探針可以是如本發明核酸中所示序列的至少大約5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、523、24、25、30、35、40、45、50、60、70、80、90、100、110、120、130、150或大約10到50、大約20到60或大約30到70個連續鹼基。這些探針通過結合和/或雜交來鑑定核酸。這些探針可以在本發明的陣列中使用,參見下面的討論,包括例如毛細管陣列。本發明的探針也可以用於分離其它核酸或多肽。可以選擇地,多於一種的探針(其中至少一種探針能與核酸樣品中存在的任何互補序列特異性雜交)可以在擴增反應中使用,以確定樣品是否包含含有本發明的核酸的生物體(例如從中可分離出所述核酸的生物體)。一方面,這些探針包括寡核苷酸。一方面,擴增反應可以包括PCR反應。PCR實驗方案在在Ausubel和Sambrook,supra中有所描述。可選地,擴增可以包括連接酶鏈式反應、3SR或35鏈置換反應(見Barany,R,"TheLigaseChainReactioninaPCRWorld",_PC/M"/iocfecr"d^f//cof//(ms丄:5-16,1991;E.Fahyetah,"Self-sustainedSequenceReplication(3SR):AnIsothermalTranscription-basedAmplificationSystemAlternativetoPCR",PC/Me/Zwtfe^^//oW/ow丄:25國33,1991;以及WalkerG.T.etah,"StrandDisplacementAmplification-anIsothermalinvitroDNAAmplificationTechnique",NucleicAcidResearch22:1691-1696,1992)。在這樣的方法中,將樣品5中的核酸與探針接觸,進行擴增反應,檢測所得到的擴增產物。擴增產物可以通過在反應產物上進行凝膠電泳並用嵌入劑如溴化乙啶染色凝膠來檢測。可以選擇地,可以用放射性同位素標記一種或多種探針,放射性擴增產物的存在在凝膠電泳後通過放射自顯影術來檢測。衍生自本發明核酸的末端附近的序列的探針也可以在染色體步移10(chromosomewalking)方法中使用,以鑑定含有臨近本發明的序列的基因組序列的克隆。這樣的方法允許從宿主生物中分離編碼額外蛋白的基因。—方面,本發明的分離或重組的核酸、與其互補的序列、或含有本發明的序列之一的至少10、15、20、25、30、35、40、50、75、100、150、200、250、300、350、400或500個連續鹼基的片段、或與其互補的序列,被用作探針,以鑑15定和分離相關的核酸。在一些方面,該相關的核酸可以是來自生物體的cDNA或基因組DNA,這些生物體並不是最初從中分離出所述核酸的生物體。例如,其它生物體可以是相關生物體。在這樣的方法中,核酸樣品在允許探針與相關序列特異性雜交的條件下與探針接觸。然後用上面描述的任意一種方法檢測探針與來自相關生物體的核酸的雜交。20通過改變用於鑑定與可檢測探針雜交的核酸例如cDNA或基因組DNA的雜交條件的嚴緊性,可以鑑定並分離與探針具有不同同源性水平的核酸。嚴緊性通過在低於探針的解鏈溫度的變化溫度下進行雜交來改變。解鏈溫度Tm是50%的耙序列與完全互補的探針雜交時的溫度(在確定的離子強度和pH下)。選擇非常嚴緊的條件,使其與特定探針的Tm相等,或比Tm低大約5'C。可以使用下述25公式計算探針的解鏈溫度對於長度在14到70個核苷酸的探針,使用如下公式計算解鏈溫度(Tm):Tm=81.5+16.6(1og[Na+])+0.41(G+C的比例分數)—(600/N),其中N是探針的長度。如果雜交在含有甲醯胺的溶液中進行,解鏈溫度使用如下等式計算Tm=81.530+16.6(1og[Na+])+0.41(G+C的比例分數)—(0.63%甲醯胺)一(600/N),其中N是探針的長度。預雜交在6XSSC、5XDenhardt,s試劑、0.5%SDS、100嗎變性的片段化鮭精DNA或6XSSC、5XDenhardt,s試劑、0.5%SDS、100嗎變性的片段化鮭精DNA、50%甲醯胺中進行。SSC和Denhardt,s溶液的配方已在Sambrook等,supra35中列出。—方面,雜交通過將可檢測探針加入到上面所列出的預雜交溶液中來進行。在探針包括雙鏈DNA的情況下,在加入到雜交溶液之前對探針變性。一方面,將濾膜與雜交溶液接觸充足的時間,以允許探針與含有與其互補的序列或與其同源的序列的cDNA或基因組DNA雜交。對於長度超過200個核苷酸的探針,雜交可以在比Tm低15-25-C的溫度進行。對於更短的探針,如寡核苷酸探針,雜交在5比Tm低5-10'C的溫度進行。一方面,6XSSC中的雜交在大約68t:進行。通常,在含有50%甲醯胺的溶液中的雜交是在大約42'C進行的。抑制纖維素酶的表達本發明提供了與本發明的核酸例如編碼纖維素酶的核酸互補的核酸(例如10本發明的核酸的反義序列),例如包括反義序列、siRNA、miRNA、核酶的核酸。含有反義序列的本分明核酸能抑制編碼纖維素酶的基因的轉運、剪接或轉錄。抑制可通過將基因組DNA或信使RNA作為靶標來實現。作為靶標的核酸的轉錄或功能可以被抑制,例如通過雜交和/或切割。本發明提供的一組示例性的抑制劑包括寡核苷酸,這些寡核苷酸能結合纖維素酶如內切葡聚糖酶、纖維二糖水解酶、15甘露聚糖酶和/或|3-葡糖苷酶基因或信息,在兩種情況下都阻止或抑制纖維素酶如內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或p-葡糖苷酶的產生或功能。結合可通過序列特異性雜交來完成。另一類有用的抑制劑包括引起纖維素酶如內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或(3-葡糖苷酶的信息失活或切割的寡核苷酸。該寡核苷酸可具有引起此類切割的酶活性,如核酶。可以對寡核苷酸進20行化學修飾,或與能切割互補核酸的酶或組分偶聯。可以對許多不同的這樣的寡核苷酸的庫進行篩選來尋找那些具有期望活性的寡核苷酸。因此,本發明提供了在核酸和/或蛋白水平抑制纖維素酶如內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶表達的各種組合物,例如,含有本發明的纖維素酶如內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶序列的反義序列、siRNA、25miRNA和核酶,以及抗纖維素酶抗體,如本發明的抗內切葡聚糖酶抗體、抗纖維二糖水解酶抗體、抗甘露聚糖酶抗體和/或抗P-葡糖苷酶抗體。纖維素酶如內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶表達的抑制可以具有各種工業應用。例如,抑制纖維素酶如內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶的表達可以減慢或防止變壞。一方面,30本發明的抑制纖維素酶如內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或|3-葡糖苷酶的表達和/或活性的組合物的使用,例如抗體、反義寡核苷酸、核酶、siRNA和miRNA的使用,被用於減慢或防止變壞。因此,一方面,本發明提供了方法和組合物,包括將本發明的抗體、反義寡核苷酸、核酶、siRNA和miRNA應用於植物或者植物產品(如,穀物、穀粒、果實、種籽、根、葉等),以阻止或者延緩變35壞。這些組分也可以由植物(如,轉基因植物)或者其它生物(如,用本發明的纖維素酶如內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶的基因轉化的細菌或者其它微生物)表達。用於抑制纖維素酶如內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或(3-葡糖苷酶表達的本發明的組分(例如,反義序列、iRNA、核酶、抗體)可用作藥物組合物,例如,抗病原劑,或用在其它治療中,例如用作抗微生物劑,如用於5沙門氏菌屬。友義寡拔微本發明提供了能結合纖維素酶如內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或l3-葡糖苷酶信息的反義寡核苷酸,一方面,其能通過以mRNA作為靶標10來抑制纖維素酶如內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或p-葡糖苷酶活性。設計反義寡核苷酸的策略在科學和專利文獻中有很好的描述,技術人員能使用本發明的新試劑設計這樣的纖維素酶如內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶寡核苷酸。例如,篩選有效的反義寡核苷酸的基因步移/RNA作圖方法在本
技術領域:
是熟知的,例如參見Ho(2000)MethodsEnzymol.314:15168-183,該文獻描述了RNA作圖分析法,該分析法是基於標準的分子技術,以提供用於有效的反義序列選擇的一種簡單且可靠的方法。也參見Smith(2000)Eur.J.Pharm.Sci.11:191-198。自然發生的核酸被用作反義寡核苷酸。該反義寡核苷酸可以是任意長度;例如,在可選擇的方面,該反義寡核苷酸在大約5到100之間,大約10到80之20間,大約15到60之間,大約18到40之間。最適長度可以通過常規篩選來決定。這些反義寡核苷酸可以以任意濃度存在。最適濃度可通過常規篩選來決定。廣泛種類的合成的、非天然發生的核苷酸和核酸類似物是已知的,它們可以解決這一潛在的問題。例如,可以使用含有非離子骨架的肽核酸(PNAs),如含有N-(2-氨基乙基)甘氨酸單元。也可以使用具有硫代磷酸酯鍵的反義寡核苷酸,正如在如下25文獻中所描述的WO97/03211;WO96/39154;Mata(1997)ToxicolApplPharmacol144:189-197;AntisenseTherapeutics,ed.Agrawal(HumanaPress,Totowa,N丄,1996)。正如上面所描述的,本發明提供的具有合成DNA骨架類似物的反義寡核苷酸也可以包括二硫代磷酸酯、甲基膦酸、氨基磷酸酯、垸基磷酸三酯、氨基磺酸酯、3'-硫代乙縮醛、亞甲基(甲基亞氨)、3'-N-氨基甲酸酯和嗎啉代氨基甲酸酯核30酸。組合化學方法學可用於產生大量能被快速篩選特異性寡核苷酸的寡核苷酸,所述特異性寡核苷酸對任何靶標具有適當的結合親和性和特異性,例如本發明的纖維素酶如內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶正義和反義序列(例如參見Gold(1995)J.,Biol.Chem.270:13581-13584)。35浙縱樣騰本發明提供了能結合纖維素酶如內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶的信息的核酶。這些核酶能抑制纖維素酶如內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶的活性,例如通過以mRNA作為耙標。設計核酶和選擇用於靶向的纖維素酶如內切葡聚糖酶、纖維二糖水解酶、甘5露聚糖酶和/或f3-葡糖苷酶特異性反義序列的策略在科學和專利文獻中有很好的描述,熟練技術人員能使用本發明的新試劑來設計這樣的核酶。核酶通過核酶的耙RNA結合部分來與靶RNA結合,從而發揮作用,核酶的靶RNA結合部分與該RNA上切割靶RNA的酶促部分非常接近。這樣,通過互補的鹼基配對,核酶識別和結合靶RNA,而且一旦結合於正確的位置,便以酶促活性作用來切割靶RNA10和使其失活。如果切割發生在編碼序列中,以這樣的方式切割靶RNA將會破壞其引導合成編碼的蛋白的能力。核酶結合和切割其RNA靶之後,它可以從結合的RNA上釋放出來並且重複切割新的靶。在一些情況下,核酶的酶促性質會優於其它的技術,如反義技術(其中核酸分子僅結合於核酸靶來阻止其轉錄、翻譯或者與其它分子的聯繫),因為實現治15療效果所必要的核酶有效濃度可能低於反義寡聚核苷酸的濃度。這一潛在的優點反映出核酶可以以酶促方式進行作用的能力。因此,單個核酶分子可以切割靶RNA的多個分子。一方面,核酶是高度特異性的抑制物,其抑制作用的特異性不僅依賴於鹼基配對的結合機制,也依賴於該分子抑制與其結合的RNA的表達的機制。艮P,所述抑制是由切割靶RNA引起的,因此特異性定義為靶RNA的切割率與非20靶RNA的切割率的比值。除了涉及鹼基配對的那些因素,這種切割機制還依賴於另外的因素。這樣,核酶作用的特異性比結合於同樣的RNA位點的反義寡聚核苷酸強。本發明的核酶,例如,具有酶活的核酶RNA分子,可以形成錘頭狀基序、髮夾基序,如肝炎S病毒基序、I類內含子基序和/或與RNA引導序列(guide25sequence)相聯繫的RNaseP樣RNA。錘頭狀基序的例子在如Rossi(1992)AidsResearchandHumanRetroviruses8:183中有說明;髮夾基序在H咖pel(1989)Biochemistry28:4929和H咖pel(1990)Nuc.AcidsRes.18:299中有說明;肝炎S病毒基序在Perrotta(1992)Biochemistry31:16中有說明;RNaseP基序在Guetrier-Takada(1983)Cell35:849中有說明;I類內含子在Cech美國專利4,987,07130中有說明。這些特定基序的引述並不是限制性的。本領域技術人員將認識到本發明的核酶,如,本發明的有酶活的RNA分子,可以有與一個或者多個靶基因的RNA區域互補的特異性底物結合位點。本發明的核酶可以在底物結合位點內或者其周圍具有賦予了該分子RNA切割活性的核苷酸序列。35扁f拔f薦"在一個方面,本發明提供了被稱為"RNAi"分子的RNA抑制性分子,其含有本發明的纖維素酶如內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶序列。RNAi分子可以包括雙鏈RNA(dsRNA)分子,例如siRNA和/或miRNA。RNAi分子,例如siRNA和/或miRNA,可抑制纖維素酶如內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或p-葡糖苷酶基因的表達。在一個方面,RNAi5分子如siRNA禾口/或miRNA的長度大約為15、16、17、18、19、20、21、22、23、24、25或更多個核苷酸的雙鏈。本發明不限於任何特殊的作用機制,RNAi可進入細胞中,弓I起相似或相同序列的單鏈RNA(ssRNA)的降解,包括內源性mRNA。當細胞暴露於雙鏈RNA(dsRNA)時,來自同源基因的mRNA被稱為RNA幹擾(RNAi)的過程選擇性地降解。RNAi的一個可能的基本機制是將與特定的基因10序列匹配的雙鏈RNA(dsRNA)打斷成為稱為短的幹擾RNA的短的碎片,它可觸發與其序列匹配的mRNA的降解。在一個方面,本發明的RNAi可用於基因沉默(gene陽silencing)療法中,見,例如Shuey(2002)DrugDiscov.Today7:1040-1046。在一個方面,本發明提供了使用本發明的RNAi如siRNA和/或miRNA選擇性降解RNA的方法。該過程可在體外、離體或體內實施。在一個方面,本發明的RNAi15分子可用來在細胞、器官或動物中產生喪失功能的突變。製備和應用可選擇性降解RNA的RNAi分子如siRNA和/或miRNA的方法在本領域中是為人所熟知的,見,例如美國專利6,506,559;6,5U,824;6,515,109;6,489,127。核酸的修飾——製備本發明的酶變體20本發明提供了產生本發明的核酸的變體的方法,所述本發明的核酸例如那些編碼纖維素酶如內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶的核酸。這些方法可以被重複或者以多種組合使用,以產生具有與模板核酸編碼的纖維素酶如內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或|3-葡糖苷酶有所改變的或不同的活性或有所改變的或不同的穩定性的纖維素酶如內切葡聚糖酶、25纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶。這些方法也可以被重複或以多種組合使用,從而例如在基因/信息表達、信息翻譯或信息穩定性方面產生變化。另一方面,細胞的遺傳組成可以被改變,例如通過同源基因的離體修飾,隨後再將其插入到細胞中。例如,一方面,本發明提供了分離的或重組的核酸,其具有包含SEQID30NO:163的至少一個核苷酸鹼基殘基修飾的序列,其中所述修飾包括下列改變的一個或多個位置265至267的任何一處的核苷酸被修飾為CGT、CGC、CGA、CGG、AGA或AGG;位置307至309的任何一處的核苷酸被修飾為GGT、GGC、GGA或GGG;位置328至330的任何一處的核苷酸被修飾為GGT、GGC、GGA或GGG;位置340至342的任何一處的核苷酸被修飾為TTA、TTG、CTT、CTC、CTA或35CTG;位置469至471的任何一處的核苷酸被修飾為TCT、TCC、TCA、TCG、AGT或AGC;位置1441至1443的任何一處的核苷酸被修飾為TTT或TTC;位置1648至1650的任何一處的核苷酸被修飾為AAT或AAC;或者,位置1768至1770的任何一處的核苷酸被修飾為CGT、CGC、CGA、CGG、AGA或AGG。另一方面,本發明提供了分離的或重組的多肽,其具有包含SEQIDNO:164的至少一個胺基酸殘基修飾的序列,其中所述修飾包括下列改變的一個或多個胺基酸5位置89的甲硫氨酸被修飾為精氨酸;胺基酸位置103的苯丙氨酸被修飾為甘氨酸;胺基酸位置110的脯氨酸被修飾為甘氨酸;胺基酸位置114的酪氨酸被修飾為亮氨酸;胺基酸位置157的丙氨酸被修飾為絲氨酸;胺基酸位置481的色氨酸被修飾為苯丙氨酸;胺基酸位置550的脯氨酸被修飾為天冬醯胺;或者,胺基酸位置590的甘氨酸被修飾為精氨酸。10另一方面,本發明提供了分離的或重組的核酸,其具有包含本發明的示例性序列(例如,SEQIDNO:l、SEQIDNO:3、SEQIDN0:5、SEQIDN0:7、SEQIDNO:9、SEQIDNO:U等等)的核苷酸殘基序列修飾的序列,其中所述修飾包括下列改變的一個或多個SEQIDNO:163的位置265至267的任何一處的相當位置的核苷酸變為CGT、CGC、CGA、CGG、AGA或AGG;SEQIDNO:163的位15置307至309的任何一處的相當位置的核苷酸變為GGT、GGC、GGA或GGG;SEQIDNO:163的位置328至330的任何一處的相當位置的核苷酸變為GGT、GGC、GGA或GGG;SEQIDNO:163的位置340至342的任何一處的相當位置的核苷酸變為TTA、TTG、CTT、CTC、CTA或CTG;SEQIDNO:163的位置469至471的任何一處的相當位置的核苷酸變為TCT、TCC、TCA、TCG、AGT或AGC;20SEQIDNO:163的位置1441至1443的相當位置的核苷酸變為TTT或TTC;SEQIDNO:163的位置1648至1650的任何一處的相當位置的核苷酸變為AAT或AAC;或者,SEQIDNO:163的位置1768至1770的任何一處的相當位置的核苷酸變為CGT、CGC、CGA、CGG、AGA或AGG。另一方面,本發明提供了分離的或重組的核酸,其具有包含本發明的任何核酸的核苷酸殘基序列修飾的序列,其中所25述修飾包括下列改變的一個或多個SEQIDNO:163的位置265至267的任何一處的相當位置的核苷酸變為CGT、CGC、CGA、CGG、AGA或AGG;SEQIDNO:163的位置307至309的任何一處的相當位置的核苷酸變為GGT、GGC、GGA或GGG;SEQIDNO:163的位置328至330的任何一處的相當位置的核苷酸變為GGT、GGC、GGA或GGG;SEQIDNO:163的位置340至342的任何一處的相當位置的30核苷酸變為TTA、TTG、CTT、CTC、CTA或CTG;SEQIDNO:163的位置469至471的任何一處的相當位置的核苷酸變為TCT、TCC、TCA、TCG、AGT或AGC;SEQIDNO:163的位置1441至1443的相當位置的核苷酸變為TTT或TTC;SEQIDNO:163的位置1648至1650的任何一處的相當位置的核苷酸變為AAT或AAC;或者,SEQIDNO:163的位置1768至1770的任何一處的相當位置的核苷酸變為35CGT、CGC、CGA、CGG、AGA或AGG。另一方面,本發明提供了分離的或重組的多肽,其具有包含本發明的示例性序列(例如,SEQIDNO:2、SEQIDNO:4、SEQIDNO:6、SEQIDNO:8、SEQIDNO:10等等)的胺基酸殘基修飾的序列,其中所述修飾包括下列改變的一個或多個SEQIDNO:164的胺基酸位置89的甲硫氨酸相當的胺基酸變為精氨酸;SEQIDNO:164的胺基酸位置103的苯丙氨酸相當的胺基酸變為甘氨酸SEQID5NO:164的胺基酸位置110的脯氨酸相當的胺基酸變為甘氨酸;SEQIDNO:164的胺基酸位置114的酪氨酸相當的胺基酸變為亮氨酸;SEQIDNO:164的胺基酸位置157的丙氨酸相當的胺基酸變為絲氨酸;SEQIDNO:164的胺基酸位置481的色氨酸相當的胺基酸變為苯丙氨酸;SEQIDNO:164的胺基酸位置550的脯氨酸相當的胺基酸變為天冬醯胺;或者,SEQIDNO:164的胺基酸位置590的甘氨酸相當的氨10基酸變為精氨酸。另一方面,本發明提供了分離的或重組的多肽,其具有包含本發明的任何多肽的胺基酸殘基修飾的序列,其中所述修飾包括下列改變的一個或多個SEQIDNO:164的胺基酸位置89的甲硫氨酸相當的胺基酸變為精氨酸;SEQIDNO:164的胺基酸位置103的苯丙氨酸相當的胺基酸變為甘氨酸;SEQIDNO:164的胺基酸15位置110的脯氨酸相當的胺基酸變為甘氨酸;SEQIDNO:164的胺基酸位置114的酪氨酸相當的胺基酸變為亮氨酸;SEQIDNO:164的胺基酸位置157的丙氨酸相當的胺基酸變為絲氨酸;SEQIDNO:164的胺基酸位置481的色氨酸相當的胺基酸變為苯丙氨酸;SEQIDNO:164的胺基酸位置550的脯氨酸相當的胺基酸變為天冬醯胺;或者,SEQIDNO:164的胺基酸位置590的甘氨酸相當的胺基酸變為精氨酸。20本發明的核酸可以通過任何方法來改變。例如,隨機(random或stochastic)方法、或者非隨機、或者"定向進化"的方法,參見如,美國專利6,361,974。基因的隨機突變方法在本領域是已知的,參見如,美國專利5,830,696。例如,可以應用突變劑來對基因進行隨機突變。突變劑包括,如,紫外線或者Y輻射,或者化學誘變劑,如,絲裂黴素,亞硝酸,光活化的補骨脂內酯,它們單獨使用或者25組合使用來誘導DNA的斷裂,其可以通過重組被修復。另外的化學誘變劑包括,如,亞硫酸氫鈉、亞硝酸、羥胺、肼或者甲酸。其它的誘變劑是核苷酸前體的類似物,如,亞硝基胍、5-溴尿嘧啶、2-氨基嘌呤或者吖啶。這些試劑可以加入到PCR反應中替換核苷酸前體,從而突變該序列。也可以應用嵌入試劑如普羅黃素、吖啶黃、奎納克林和類似物。30可以應用分子生物學上的任何技術,如隨機PCR誘變,參見,如,Rice(1992)Proc.Natl.Acad.Sci.USA89:5467-5471;或者組合式多重盒式誘變,參見如,Crameri(1995)Biotechinques18:194-196。可選擇地,核酸,如基因,可以在隨機片段化後重新裝配,參見,如,美國專利6,291,242;6,287,862;6,287,861;5,955,358;5,830,721;5,824,514,5,811,238;5,605,793.。在可選擇的方面,修飾、35增加或者刪除可以通過易錯PCR、改組、寡核苷酸誘導的定點突變、裝配PCR、有性PCR誘變、體內誘變、盒式誘變、遞歸整體誘變、指數整體突變、位點專一性誘變、基因再裝配、基因位點飽和誘變(GSSM)、合成連接重裝配(SLR)、重組、遞歸序列重組(recursives叫uencerecombination)、硫代磷酸酯修飾的DNA誘變、含有尿嘧啶模板的誘變、缺口雙重誘變(gappedduplexmutagenesis),點錯配修復誘變(pointmismatchrepairmutagenesis),修復缺陷型宿主株誘變、化學誘變、5放射誘變、缺失誘變、限制選擇誘變(restriction-selectionmutagenesis)、限制純化誘變(restriction-purificationmutagenesis)、人工基因合成、整體誘變、嵌合核酸多聚體生成、染色體飽和誘變(CSM)和/或者這些方法和其它方法的組合產生。以下的出版物描述了可以整入到本發明的方法中的各種遞歸重組程序和/或方法Stemmer(1999)"Molecularbreedingofvirusesfortargetingandotherclinical10properties"TumorTargeting4:1-4;Ness(1999)NatureBiotechnology17:893-896;Chang(1999)"EvolutionofacytokineusingDNAfamilyshuffling"NatureBiotechnology17:793-797;Minshull(1999)"Proteinevolutionbymolecularbreeding"CurrentOpinioninChemicalBiology3:284-290;Christians(1999)"DirectedevolutionofthymidinekinaseforAZTphosphorylationusingDNAfamilyshuffling"Nature15Biotechnology17:259-264;Crameri(1998)"DNAshufflingofafamilyofgenesfromdiversespeciesacceleratesdirectedevolution"Nature391:288-291;Crameri(1997)"MolecularevolutionofanarsenatedetoxificationpathwaybyDNAshuffling"NatureBiotechnology15:436-438;Zhang(1997)"Directed-evolutionofaneffectivefucosidasefromagalactosidasebyDNAshufflingandscreening"Proc.Natl.Acad.Sci.20USA94:4504-4509;Patten等(1997)"ApplicationsofDNAShufflingtoPharmaceuticalsandVaccines"CurrentOpinioninBiotechnology8:724-733;Crameri等(1996)"Constructionandevolutionofantibody-phagelibrariesbyDNAshuffling"NatureMedicine2:100-103;Gates等(1996)"Affinityselectiveisolationofligandsfrompeptidelibrariesthroughdisplayonalacrepressor'headpiecedimer'"Journalof25MolecularBiology255:373-386;Stemmer(1996)"SexualPCRandAssemblyPCR"In:TheEncyclopediaofMolecularBiology.VCHPublishers,NewYork.447-457頁;Crameri禾卩Stemmer(1995)"Combinatorialmultiplecassettemutagenesiscreatesallthepermutationsofmutantandwildtypecassettes"BioTechniques18:194-195;Stemmer等(1995)"Single-stepassemblyofageneandentireplasmidformlargenumbersof30oligodeoxyribonucleotides,,Gene,164:49-53;Stemmer(1995)"TheEvolutionofMolecularComputation"Science270:1510;Stemmer(1995)"SearchingSequenceSpace"Bio/Technology13:549-553;Stemmer(1994)"RapidevolutionofaproteininvitrobyDNAshuffling"Nature370:389-391;和Stemmer(1994)"DNAshufflingbyrandomfragmentationandreassembly:Invitrorecombinationformolecular35evolution"Proc.Natl.Acad.Sci.USA91:10747-10751。產生多樣性的突變方法包括,例如,定點誘變(Ling等.(1997)"ApproachestoDNAmutagenesis:anoverview"AnalBiochem.254(2):157-178;Dale等(1996)"Oligonucleotide-directedrandommutagenesisusingthephosphorothioatemethod"MethodsMol.Biol.57:369-374;Smith(1985)"Invitromutagenesis"Ann.Rev.Genet.19:423-462;Botstein&Shortle(1985)"Strategiesandapplicationsofinvitro5mutagenesis"Science229:1193-1201;Carter(1986)"Site-directedmutagenesis',Biochem.J.237:1-7;禾口Kunkel(1987)"Theefficiencyofoligonucleotidedirectedmutagenesis"在NucleicAcids&MolecularBiology(Eckstein,F.禾口Lilley,D.M.J.eds.,SpringerVerlag,Berlin));使用含有尿嘧啶的模板的誘變(KunkeK1985)"Rapidandefficientsite-specificmutagenesiswithoutphenotypicselection"Proc.Natl.Acad.10Sci.USA82:488-492;Kunkel等(1987)"Rapidandefficientsite-specificmutagenesiswithoutphenotypicselection"MethodsinEnzymol.154,367-382;和Bass等(1988)"MutantTiprepressorswithnewDNA-bindingspecificities"Science242:240-245);寡核苷酸誘導的定點誘變(MethodsinEnzymol.100:468-500(1983);MethodsinEnzymol.154:329-350(1987);Zoller(1982)"Oligonucleotide-directedmutagenesis15usingM13-derivedvectors:anefficientandgeneralprocedurefortheproductionofpointmutationsinanyDNAfragment"NucleicAcidsRes.10:6487-6500;Zoller&Smith(1983)"Oligonucleotide-directedmutagenesisofDNAfragmentsclonedintoM13vectors"MethodsinEnzymol.100:468-500和Zoller(1987)Oligonucleotide-directedmutagenesis:asimplemethodusingtwooUgonucleotide20primersandasingle-strandedDNAtemplate"MethodsinEnzymol.154:329-350);硫代磷酸酯修飾的DNA誘變(Taylor(1985)"Theuseofphosphorothioate-modifiedDNAinrestrictionenzymereactionstopreparenickedDNA"Nucl.AcidsRes.13:8749-8764;Taylor(1985)"Therapidgenerationofoligonucleotide-directedmutationsathighfrequencyusingphosphorothioate-modifiedDNA"Nucl.AcidsRes.2513:8765-8787(1985);Nakamaye(1986)"InhibitionofrestrictionendonucleaseNciIcleavagebyphosphorothioategroupsanditsapplicationtooligonucleotide-directedmutagenesis"Nucl.AcidsRes.14:9679-9698;Sayers(1988)"Y-TExonucleasesinphosphorothioate-basedoligonucleotide-directedmutagenesis,,Nucl.AsidsRes.16:791-802;和Sayers等(1988)"Strandspecificcleavageof30phosphorothioate-containingDNAbyreactionwithrestrictionendonucleasesinthepresenceofethidiumbromide"Nucl.AcidsRes.16:803-814);使用缺口雙鏈體DNA的誘變(Kramer等(1984)"ThegappedduplexDNAapproachtooligonucleotide-directedmutationconstruction"Nucl.AcidsRes.12:9441-9456;Kramer&Fritz(1987)MethodsinEnzymol."Oligonucleotide-directedconstructionof35mutationsviagappedduplexDNA"154:350-367;Kramer(1988)"ImprovedenzymaticinvitroreactionsinthegappedduplexDNAapproachtooligonucleotide-directedconstructionofmutations"Nucl.AcidsRes.16:7207;禾口Fritz(1988)"Oligonucleotide-directedconstructionofmutations:agappedduplexDNAprocedurewithoutenzymaticreactionsinvitro"Nucl.AcidsRes.16:6987-6999)。可以用於實踐本發明的另外的實驗方案包括點錯配修復(Kramer(1984)"PointMismatchRepair"Cell38:879-887),應用修復缺陷型宿主株的誘變(Carter5等(1985)"Improvedoligonucleotidesite-directedmutagenesisusingMl3vectors"Nucl.AcidsRes.13:4431-4443禾口Carter(1987)"Improvedoligonucleotide-directedmutagenesisusingM13vectors"MethodsinEnzymol.154:382-403),缺失i秀變(Eghtedarzadeh(1986)"Useofoligonucleotidestogeneratelargedeletions"Nucl.AcidsRes.14:5115),限制-選擇和限制-純化(Wells等(1986)"Importanceof10hydrogen-bondformationinstabilizingthetransitionstateofsubtilisin"Phil.Trans.R.Soc.Lond.A317:415-423),通過全基因合成的誘變(Nambiar等(1984)"TotalsynthesisandcloningofagenecodingfortheribonucleaseSprotein"Science223:1299-1301;Sakamar禾卩Khorana(1988)"Totalsynthesisandexpressionofageneforthea-subunitofbovinerodoutersegmentguaninenucleotide-bindingprotein15(transducin)"Nucl.AcidsRes.14:6361-6372;Wells等(1985)"Cassettemutagenesis:anefficientmethodforgenerationofmultiplemutationsatdefinedsites"Gene34:315-323禾口Grundstrom等(1985)"Oligonucleotide-directedmutagenesisbymicroscale'shot-gun'genesynthesis"Nucl.AcidsRes.13:3305-3316),雙鏈斷裂修復(Mandecki(1986),Arnold(1993)"Proteinengineeringforunusualenvironments"20CurrentOpinioninBiotechnology4:450-455."Oligonucleotide-directeddouble-strandbreakrepairinplasmidsofEscherichiacoli:amethodforsite鄰eciflcmutagenesis"Proc.Natl.Acad.Sci.USA,83:7177-7181)。很多以上的方法的另外的細節在MethodsinEnzymology的154巻中有說明,其中也描述了用於解決各種誘變方法中所會遇到的問題的有用策略。25在例如下列的文件中描述了可以用於實踐本發明的實驗方案,如Stemmer的美國專利5,605,793(1997.2.25),"MethodsforInVitroRecombination";Stemmer等的美國專利5,811,238(1998.9.22)"MethodsforGeneratingPolynucleotideshavingDesiredCharacteristicsbyIterativeSelectionandRecombination";Stemmer等的美國專利5,830,721(1998.11.3),"DNAMutagenesisbyRandomFragmentationand30Reassembly";Stemmer等的美國專利5,834,252(1998,11.10),"End-ComplementaryPolymeraseReaction";Minshull等的美國專利5,837,458(1998.11.17)"MethodsandCompositionsforCellularandMetabolicEngineering";WO95/22625,Stemmer禾口Crameri,"MutagenesisbyRandomFragmentationandReassembly,';WO96/33207,Stemmer禾卩Lipschutz,"EndComplementaryPolymeraseChainReaction";WO3597/20078,Stemmer禾口Crameri的"MethodsforGeneratingPolynucleotideshavingDesiredCharacteristicsbyIterativeSelectionandRecombination";WO97/35966,Minshull禾口Stemmer,"MethodsandCompositionsforCellularandMetabolicEngineerin";WO99/41402,Punnonen等,"TargetingofGeneticVaccineVectors";WO99/41383,Punnonen等,"AntigenLibraryImmunization";WO99/41369,Punnonen等,"GeneticVaccineVectorEngineering,,;WO99/41368,Punnonen等,5"OptimizationofImmunomodulatoryPropertiesofGeneticVaccines";EP752008,Stemmer禾BCrameri,"DNAMutagenesisbyRandomFragmentationandReassembly";EP0932670,Stemmer,"EvolvingCellularDNAUptakebyRecursiveSequenceRecombination";WO99/23107,Stemmer等,"ModificationofVirusTropismandHostRangebyViralGenomeShuffling";WO99/21979,Apt等,"Human10PapillomavirusVectors";WO98/31837,delCardayre等,"EvolutionofWholeCellsandOrganismsbyRecursiveSequenceRecombination";WO98/27230,Patten禾卩Stemmer,"MethodsandCompositionsforPolypeptideEngineering";WO98/27230,Stemmer等,"MethodsforOptimizationofGeneTherapybyRecursiveSequenceShufflingandSelection";WO00/00632,"MethodsforGeneratingHighlyDiverse15Libraries";WO00/09679,"MethodsforObtaininginVitroRecombinedPolynucleotideSequenceBanksandResultingSequences";WO98/42832,Arnold等,"PolynucleotideSequencesUsingRandomorDefinedPrimers";WO99/29902,Arnold等,"MethodforCreatingPolynucleotideandPolypeptideSequences";WO98/41653,Vind,"AninVitroMethodforConstructionofaDNALibrary";WO2098/41622,Borchert等,"MethodforConstructingaLibraryUsingDNAShuffling";以及WO98/42727,Pati和Zarling,"S叫uenceAlterationsusingHomologousRecombination"。非隨機或"定向進化"方法包括,例如飽和誘變如基因位點飽和誘變(GSSM)、合成連接重裝配(SLR)或其組合,它們被用於修飾本發明的核酸,以產生具有新的或改變的特性(例如在高度酸性或鹼性條件下的活性,在高溫或10低溫的活性,等等)的纖維素酶,如內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或(3-葡糖苷酶。由修飾的核酸編碼的多肽可以在測試葡聚糖水解或其它活性之前被篩選活性。可以使用任何形式或實驗方案,例如使用毛細管陣列平臺。例如參見美國專利6,361,974;6,280,926;5,939,250。15基微點靜赦或G淑本發明提供了使用基因位點飽和誘變或GSSM製備酶的方法,如在本文中以及美國專利6,171,820和6,579,258所述的。一方面,含有簡併N,N,G/T序列的密碼子引物被用於將點突變引入多核苷酸中,例如纖維素酶如內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶或本發明的抗體,以便產生一組子代20多肽,其中在每一胺基酸位置上可表現出全範圍的單胺基酸取代,取代發生的位置例如酶活性位點中的胺基酸殘基,或將要被修飾的配體結合位點。這些寡核苷酸可以包括相鄰的第一同源序列,簡併N,N,G/T序列,和任選地第二同源序列。由使用這些寡核苷酸而得到的下遊子代翻譯產物包含沿著多肽的每一胺基酸位點上的所有可能的胺基酸變化,這是由於N,N,G/T序列的簡併性包括了所有20個氨25基酸的密碼子。一方面,一個這樣的簡併寡核苷酸(例如包括一個簡併N,N,G/T序列盒)被用於使親本多核苷酸模板中的每一原始密碼子進行完全範圍的密碼子取代。另一方面,使用至少兩個簡併序列盒,或在相同的寡核苷酸中或不同的寡核苷酸中,用於使親本多核苷酸模板中的至少兩個原始密碼子進行完全範圍的密碼子取代。例如,一個寡核苷酸中可以包含一個以上N,N,G/T序列,以便在多於30—個的位點上引入胺基酸突變。這些多個N,N,G/T序列可以直接相鄰,或由一個或多個額外的核苷酸序列分隔開。另一方面,用於引入插入和刪除的寡核苷酸可以單獨使用,或者與含有N,N,G/T序列的密碼子組合使用,以便引入胺基酸插入、刪除和/或取代的任何排列組合。—方面,兩個或更多個連續胺基酸位置的同時誘變是使用含有相鄰35N,N,G/T三聯體的寡核苷酸進行的,即簡併(N,N,G/T)序列。另一方面,使用與N,N,G/T序列相比具有較低簡併性的簡併序列盒。例如,在一些情況下,可能期望(例如,在寡核苷酸中)使用僅包括一個N的簡併三聯體序列,其中所述的N可以在三聯體的第一、第二或第三位置上。在該三聯體的剩餘兩個位置上,可以使用包括任意排列組合的任何其它鹼基。可以選擇地,在一些情況下可能期望使用(例如在寡聚體中)簡併N,N,N三聯體序列。5—方面,使用簡併三聯體(例如N,N,G/T三聯體)允許在多肽中的每一和每個胺基酸位置上系統且容易地產生完全範圍的可能的天然胺基酸(總共20種胺基酸)(在可以選擇的方面,這些方法也包括在每一胺基酸殘基或密碼子、位置產生低於所有可能種類的取代)。例如,對於100個胺基酸的多肽,可以產生2000個不同種類(即每個位置上的20種可能胺基酸X100個胺基酸位置)。通過使用含10有簡併N,N,G/T三聯體的寡核苷酸或一組寡核苷酸,32種不同序列可編碼所有20種可能的天然胺基酸。因此,在其中使用至少一種這樣的寡核苷酸對親本多核苷酸序列進行飽和誘變的反應容器中,產生了編碼20種不同多肽的32種不同的子代多核苷酸。相反,在定點誘變中使用非簡併寡核苷酸在每個反應容器中僅僅導致一種子代多肽。非簡併寡核苷酸可以任選地與所公開的簡併引物組合使用;例15如,非簡併寡核苷酸可以被用於在工作多核苷酸中產生特異性點突變。這提供了產生特異性沉默點突變、導致相應的胺基酸變化的點突變、以及導致產生終止密碼子和多肽片段的相應表達的手段。—方面,每一飽和誘變反應容器含有編碼至少20種子代多肽(例如纖維素酶,如內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或(3-葡糖苷酶)分子的20多核苷酸,以便所有的20種天然胺基酸都會出現在對應於親本多核苷酸中被誘變的密碼子位置的特定胺基酸位置(其它方面使用了少於20個天然的組合)。從每一飽和誘變反應容器產生的32倍簡併的子代多肽可以被克隆擴增(例如使用表達載體克隆到合適的宿主中,例如大腸桿菌宿主中),並進行表達篩選。當單個子代多肽通過篩選鑑定,顯示出有利的特性變化時(當與親本多肽相比時,如在鹼性25或酸性條件下增高的葡聚糖水解活性),可以對其測序以鑑定其中所含的相應的有利胺基酸取代。—方面,如本文所公開的,應用飽和誘變對親本多肽的各個和所有的胺基酸位置進行誘變後,可以在超過一個的胺基酸位置確定出的有利的胺基酸變化。可以產生一個或多個新的子代分子,其含有所有或部分這些有利的胺基酸取代的30組合。例如,如果在多肽的3個胺基酸位置的每一個胺基酸位置處鑑定出2個特異的有利的胺基酸變化,那麼出現的排列就包括每一位置上的3種可能性(與原始胺基酸沒有變化的可能性,以及兩個有利變化中的每一個的可能性)和3個位置。因此,總共有3X3X3或27種可能性,其中包括了先前被檢驗的7種可能性,即6個單點突變(即三個位置的每一個位置有2個)和在任何位置上沒有變化的35點突變。另一方面,位點飽和誘變可以與改組、嵌合、重組和其它誘變方法以及篩選一起使用。本發明提供了以反覆的方式使用任何誘變方法,包括飽和誘變。在一個實例中,任何誘變方法的反覆使用結合篩選使用。本發明還提供了使用專有密碼子引物(含有簡併N,N,N序列)將點突變引入多核苷酸中,以便產生一組子代多肽,其中在每一胺基酸位置上可表現出全範5圍的單胺基酸取代(基因位點飽和誘變(GSSM))。這些寡聚體包括相鄰的第一同源序列,簡併N,N,N序列,以及一方面不必須包括第二同源序列。由使用這些寡聚體而得到的下遊子代翻譯產物包含沿著多肽的每一胺基酸位點上的所有可能的胺基酸變化,這是由於N,N,N序列的簡併性包括了所有20個胺基酸的密碼子。—方面,一個這樣的簡併寡聚體(包括一個簡併N,N,N序列盒)被用於使10親本多核苷酸模板中的每一原始密碼子進行完全範圍的密碼子取代。另一方面,使用至少兩個簡併N,N,N序列盒,或在相同的寡聚體中或不同的寡聚體中,用於使親本多核苷酸模板中的至少兩個原始密碼子進行完全範圍的密碼子取代。因此,一個寡聚體中可以包含一個以上N,N,N序列,以便在多於一個的位點上引入胺基酸突變。這些多個N,N,N序列可以直接相鄰,或由一個或多個額外的核苷酸序列15分隔開。另一方面,用於引入插入和刪除的寡聚體可以單獨使用,或者與含有N,N,N序列的密碼子組合使用,以便引入胺基酸插入、刪除和/或取代的任何排列組合。—方面,使用含有相鄰N,N,N三聯體的寡聚體,即簡併(N,N,N)n序列,進行兩個或更多個連續胺基酸位置的同時誘變是可能的。另一方面,本發明提供了使用與N,N,N序列相比具有較低簡併性的簡併序列盒。例如,在一些情況下可20能期望使用(例如在寡聚體中)僅包括一個N的簡併三聯體序列,其中所述的N可以在三聯體的第一、第二或第三位置上。在三聯體的剩餘兩個位置上,可以使用包括任意排列組合的任何其它鹼基。可以選擇地,在一些情況下可能期望使用(例如在寡聚體中)簡併N,N,N三聯體序列、N,N,G/T或N,N,G/C三聯體序列。—方面,由於若干個原因,使用簡併三聯體(例如N,N,G/T或N,N,G/C三25聯體序列)是有利的。一方面,本發明提供了在多肽中的每一和每個胺基酸位置上系統且相對容易地產生完全範圍的可能的天然胺基酸(總共20種胺基酸)的取代的方法。因此,對於100個胺基酸的多肽,本發明提供了系統且相對容易地產生產生2000個不同種類(即每個位置上的20種可能胺基酸X100個胺基酸位置)的方法。可以理解,通過使用含有簡併N,N,G/T或N,N,G/C三聯體序列的寡聚體,3032種不同序列可編碼所有20種可能的天然胺基酸。因此,在其中使用至少一種這樣的寡聚體對親本多核苷酸序列進行飽和誘變的反應容器中,產生了編碼20種不同多肽的32種不同的子代多核苷酸。相反,在定點誘變中使用非簡併寡聚體在每個反應容器中僅僅導致一種子代多肽。本發明還提供了非簡併寡聚體的使用,其可以任選地與所公開的簡併引物35組合使用。可以理解,在一些情況中,使用非簡併寡聚體在工作多核苷酸中產生特異性點突變是有利的。本發明提供了產生特異性沉默點突變、導致相應的胺基酸變化的點突變、以及導致產生終止密碼子和多肽片段的相應表達的手段。因此,在本發明的一方面,每一飽和誘變反應容器含有編碼至少20種子代多肽分子的多核苷酸,以便所有的20種天然胺基酸都會出現在對應於親本多核苷酸中被誘變的密碼子位置的特定胺基酸位置。從每一飽和誘變反應容器產生的532倍簡併的子代多肽可以被克隆擴增(例如使用表達載體克隆到合適的大腸桿菌宿主中),並進行表達篩選。當單個子代多肽通過篩選鑑定,顯示出有利的特性變化時(當與親本多肽相比時),可以對其測序以鑑定其中所含的相應的有利胺基酸取代。—方面,如本文所公開的,應用飽和誘變對親本多肽的各個和所有的氨基10酸位置進行誘變後,可以在超過一個的胺基酸位置確定出的有利的胺基酸變化。可以產生一個或多個新的子代分子,其含有所有或部分這些有利的胺基酸取代的組合。例如,如果在多肽的3個胺基酸位置的每一個胺基酸位置處鑑定出2個特異的有利的胺基酸變化,那麼出現的排列就包括每一位置上的3種可能性(與原始胺基酸沒有變化的可能性,以及兩個有利變化中的每一個的可能性)和3個位15置。因此,總共有3X3X3或27種可能性,其中包括了先前被檢驗的7種可能性,即6個單點突變(即三個位置的每一個位置有2個)和在任何位置上沒有變化的點突變。除了沿著基因的全序列進行誘變之外,本發明提供了誘變可用於取代多核苷酸序列中任意數量的鹼基的每一個,其中待被誘變的鹼基的數量在一個方面為從15至100,000中的每一個整數。因此,並不是沿著分子誘變每一個位置,可以對每一個或獨立數目的鹼基(在一個方面為總共15至100,000的亞組)進行誘25變。一方面,單獨的核苷酸被用於沿著多核苷酸序列誘變每一個位置或一組位置。待被誘變的3個位置可以是密碼子。使用誘變引物可以引入突變,該誘變引物含有異源序列盒,也稱為誘變序列盒。示例性的序列盒可以具有1至500個鹼基。在這樣的異源序列盒中每一個核苷酸位置可以是N、A、C、G、T、A/C、A/G、A/T、C/G、C/T、G/T、C/G/T、A/G/T、A/C/T、A/C/G或E,其中E是非A、C、30G或T的任何鹼基(E可以被稱為設計寡聚體(designeroligo))。—方面,飽和誘變包括誘變有待誘變的限定多核苷酸序列(其中待誘變的序列長度一方面為約15至100,000個鹼基)中的一整組誘變序列盒(其中每一個序列盒的長度一方面為約1-500個鹼基)。因此,一組突變(從1至100個突變)被引入每一個待誘變的序列盒。在應用一輪飽和誘變的過程中,一組待被引入到35—個序列盒的突變可以與第二組待被引入到第二個序列盒的突變不同或相同。這樣的分組通過缺失、插入、特定密碼子的分組以及特定核苷酸序列盒的分組加以例示。—方面,待被誘變的限定序列包括全基因、通路、cDNA、整個開放閱讀框(ORF)以及整個啟動子、增強子、阻抑物/反式激活蛋白、複製原點、內含子、操縱子或任何多核苷酸功能組。通常,為了此目的,"限定序列(definedsequence)"5可以是15鹼基多核苷酸序列的任何多核苷酸以及長度在15個鹼基和15,000個鹼基的多核苷酸序列(本發明特別指出中間的每一個整數)。選擇密碼子分組時的考慮因素包括由簡併誘變序列盒編碼的胺基酸類型。—方面,可被引入到誘變序列盒中的突變分組,本發明特別提供了在每一個位置編碼2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、1019和20種胺基酸的簡併密碼子取代(使用簡併寡聚體)以及由此編碼的多肽文庫。*成遂體微說"本發明提供了非隨機的基因修飾系統,命名為"合成連接重裝配"或簡單地稱作"SLR",這是一種"定向進化方法",可以產生具有新的或改變的特性的多15肽,例如本發明的纖維素酶如內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或p-葡糖苷酶或本發明的抗體。SLR是將寡核苷酸片段非隨機地連接在一起的一種方法。該方法與隨機寡核苷酸改組不同的地方在於,核酸構件(buildingblocks)沒有被隨意地改組、連接或嵌合,而是被非隨機地裝配。例如參見美國專利6,773,900;6,740,506;6,713,282;206,635,449;6,605,449;6,537,776。一方面,SLR包括下述步驟(a)提供模板多核苷酸,其中模板多核苷酸包含編碼同源基因的序列;(b)提供多個構件多核苷酸,其中這些構件多核苷酸被設計成可在預定的序列處與模板多核苷酸交換重裝配(cross-overreassemble),所述構件多核苷酸包含作為同源基因變體的序列和與變體序列兩側的模板多核苷酸同源的序列;(c)將構件多核苷酸與模板多核苷酸組25合在一起,以便構件多核苷酸與模板多核苷酸交換重裝配,以產生包含同源基因序列變異體的多核苷酸。SLR不依賴於將被重新排列的多核苷酸之間存在高度同源性。因此,該方法可以被用於非隨機地產生包括超過101<)個不同嵌合體的子代分子的文庫(或集合)。SLR可以被用於產生包括超過10^o個不同子代嵌合體的文庫。因此,本發30明的一些方面包括產生一組最終嵌合的核酸分子的非隨機方法,所述最終嵌合的核酸分子具有按設計所選擇的整個裝配次序。該方法包括按設計產生多個特異性核酸構件的步驟,以及裝配這些核酸構件的步驟,這樣可獲得依設計而定的整個裝配次序,所述的多個特異性核酸構件具有可被應用的互相相容的可連接末端。將被裝配的核酸構件的互相相容的可連接末端被認為對於這種類型的有35序裝配是"有用的",如果它們能使這些構件以預定次序結合。因此,核酸構件可以被偶聯的整個裝配次序是由可連接末端的設計來確定。如果使用多於一個的裝配步驟,那麼核酸構件可被偶聯的總裝配次序也由裝配步驟的連續次序來確定。一方面,用酶例如連接酶(例如T4DNA連接酶)處理退火的結構片段,以實現結構片段的共價結合。—方面,寡核苷酸構件的設計通過分析一組祖先核酸序列模板來獲得,所5述祖先核酸模板作為產生最終嵌合的多核苷酸的子代集合的基礎。這些親本寡核苷酸模板因此作為序列信息的來源,它們在將被誘變例如被嵌合或改組的核酸構件的設計中有用。在該方法的一個方面,多個親本核酸模板的序列被聯配,以便選擇一個或多個分界點。這些分界點可以位於同源區域,由一個或多個核苷酸構成。這些分界點優選地由至少兩個祖先模板共享。從而這些分界點可以被用於描10繪將要產生的寡核苷酸構件的邊界,以便重排列親本多核苷酸。在祖先分子中鑑定和選擇的分界點作為最終嵌合的子代分子的裝配中的潛在嵌合點。分界點可以是由至少兩個親本多核苷酸序列分享的同源區域(包括至少一個同源性核苷酸鹼基)。可以選擇地,分界點可以是由至少一半的親本多核苷酸序列分享的同源區域,或者可以是由至少三分之二的親本多核苷酸序列分享的同源區域。甚至更優選地,15有用的分界點是由至少四分之三的親本多核苷酸序列分享的同源區域,或者可以是由幾乎所有的親本多核苷酸序列分享的同源區域。一方面,分界點是由所有親本多核苷酸序列分享的同源區域。—方面,連接再裝配過程被徹底地進行,以便產生含有儘量可能多的子代嵌合多核苷酸的文庫。換句話說,核酸構件的所有可能的有序組合都呈現在最終20嵌合的核酸分子集合中。同時,另一方面,在每一組合中的裝配次序(即各個最終嵌合核酸的5,到3序列中每一構件的裝配次序)是如上所述地遵循預先的設計(或非隨機地)。由於本發明的非隨機特性,大大地降低了不需要的副產品的可能性。另一方面,連接再裝配方法被系統地進行。例如,實施該方法,以便產生25子代分子的系統區分化的文庫,該文庫分成能被系統地篩選的數個部分,例如可以逐個地篩選。換句話說,通過選擇性的和審慎的應用特定的核酸構件,再加上選擇性的和審慎的應用連續的分步驟的裝配反應,本發明使得這樣一種設計可以實現,即可以在各個反應容器中製備出各自特定的一系列子代產物。這樣的設計允許進行系統的檢査和篩選步驟。因此,這些方法允許很可能非常大量的子代分30子以更小的組被系統地檢査。由於其具有以高度變通而又徹底和系統的方式進行嵌合化反應的能力,尤其是當祖先分子之間具有低水平的同源性時,這些方法可以產生包含大量子代分子的文庫(或集合)。由於本發明的連接再裝配的非隨機特性,所產生的子代分子一方面包含有最終嵌合核酸分子的文庫,這些核酸分子具有按設計而選擇的總裝配次序。飽和誘變和優化的定向進化方法也可以被用於產35生不同的子代分子種類。應該意識到,本發明在分界點的選擇、核酸構件的大小和數量以及偶聯的大小和設計方面提供了選擇的自由度和可控制性。進一步,應該意識到,就本發明的可操作性而言,對分子間同源性的要求大大地放寬了。事實上,甚至可以在有很少的分子間同源性或沒有分子間同源性的區域內選擇分界點。例如,由於密碼子的擺動,即密碼子的簡併性,可以將核苷酸取代引入核酸構件,同時又不會改變在相應的祖先模板中最初編碼的胺基酸。可以選擇地,可5以改變密碼子,從而改變對原始胺基酸的編碼。在本發明中,這樣的取代可以被引入到核酸構件中,以便增加分子間同源分界點的發生率,從而使得在構件之間可獲得的偶聯的數量增加,而這又允許產生更多數量的子代嵌合分子。合成基茵棘配10—方面,本發明提供了非隨機的方法,命名為合成基因重裝配,其在一定程度上與隨機改組相關,只是核酸構件不隨機改組、連接或嵌合,而是被非隨機地裝配。例如參見美國專利6,537,776。合成基因重裝配法不依賴於將被改組的多核苷酸之間存在高度同源性。本發明可以被用於非隨機地產生包括超過101個不同嵌合體的子代分子的文庫(或15集合)。可以想像地,合成基因重裝配可以被用於產生包括超過101個不同子代嵌合體的文庫。因此,一方面,本發明提供了產生一組最終嵌合的核酸分子的非隨機方法,所述最終嵌合的核酸分子具有按設計所選擇的整個裝配次序,該方法包括按設計產生多個特異性核酸構件的步驟,以及裝配這些核酸構件的步驟,這樣可獲得依20設計而定的整個裝配次序,所述的多個特異性核酸構件具有可被應用的互相相容的可連接末端。將被裝配的核酸構件的互相相容的可連接末端被認為對於這種類型的有序裝配是"有用的",如果它們能使這些構件以預定次序結合。因此,一方面,核酸構件可以被偶聯的整個裝配次序是由可連接末端的設計來確定,並且如果使用25多於一個的裝配步驟,那麼核酸構件可被偶聯的總裝配次序也由裝配步驟的連續次序來確定。在本發明的一方面,用酶例如連接酶(例如T4DNA連接酶)處理退火的結構片段,以實現結構片段的共價結合。另一方面,核酸構件的設計通過分析一組祖先核酸模板的序列來獲得,所述祖先核酸模板作為產生最終嵌合的多核苷酸的子代集合的基礎。這些祖先核酸30模板因此作為序列信息的來源,它們在將被誘變例如被嵌合或改組的核酸構件的設計中有用。在一個示例中,本發明提供了相關基因的家族和它們編碼的相關產物的家族之間的嵌合。在具體的示例中,編碼的產物是酶。根據本文描述的方法,本發明的纖維素酶如內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶可35以被誘變。因此,根據本發明的一個方面,多個祖先核酸模板序列(例如本發明的多核苷酸)被聯配,以便選擇一個或多個分界點,這些分界點可以位於同源區域。這些分界點可以被用於描繪將要產生的寡核苷酸構件的邊界。因此,在祖先分子中鑑定和選擇的分界點作為子代分子的裝配中的潛在嵌合點。—方面,有用的分界點是由至少兩個祖先模板分享的同源區域(包括至少5—個同源核苷酸鹼基),但分界點可以是由至少一半的祖先模板、至少三分之二的祖先模板、至少四分之三的祖先模板以及一方面可以是由幾乎所有的祖先模板分享的同源區域。甚至仍在一方面,有用的分界點是由所有祖先模板分享的同源區域。—方面,基因再裝配過程被徹底地進行,以便產生含有儘量可能多的文庫。10換句話說,核酸構件的所有可能的有序組合都呈現在最終嵌合的核酸分子集合中。同時,另一方面,在每一組合中的裝配次序(即各個最終嵌合核酸的5'到3序列中每一構件的裝配次序)是設計的(或非隨機地)。由於本發明的非隨機特性,大大地降低了不需要的副產品的可能性。另一方面,基因再裝配過程在所述方法中被系統地進行,以便例如產生子15代分子的系統區分化的文庫,該文庫分成能被系統地篩選的數個部分,例如可以逐個地篩選。換句話說,通過選擇性的和審慎的應用特定的核酸構件,再加上選擇性的和審慎的應用連續的分步驟的裝配反應,本發明使得這樣一種設計可以實現,即可以在各個反應容器中製備出各自特定的一系列子代產物。這樣的設計允許進行系統的檢査和篩選步驟。因此,這些方法允許很可能非常大量的子代分子20以更小的組被系統地檢査。由於其具有以高度變通而又徹底和系統的方式進行嵌合化反應的能力,尤其是當祖先分子之間具有低水平的同源性時,本發明可以產生包含大量子代分子的文庫(或集合)。由於本發明的基因再裝配的非隨機特性,所產生的子代分子一方面包含有最終嵌合核酸分子的文庫,這些核酸分子具有按設計而選擇的總裝配25次序。在特別的方面,這樣的所產生的文庫包括大於103至10100種不同的子代分子種類。—方面,如所述產生的一組最終嵌合的核酸分子包括編碼多肽的多核苷酸。根據一方面,該多核苷酸是基因,其可以是人造基因。根據另一方面,該多核苷酸可以是基因通路,其可以是人造基因通路。本發明產生的一種或更多種人30造基因在本發明中可以摻入人造基因途徑,例如在真核生物體(包括植物)中可操縱的途徑。在另一個示例中,產生構件的步驟的合成屬性允許設計和引入核苷酸(例如一個或多個核苷酸,例如可以是密碼子或內含子或調控序列),這些核苷酸隨後可以在體外過程中(例如通過誘變)或者在體內過程中(例如通過利用宿主生物35體的基因剪接能力)被任選地去除。應該意識到,在許多情況下,除了產生有用的分界點的好處之外,還有許多其它原因也使得可能期望引入這些核苷酸。因此,根據另一方面,核酸構件在本發明中被用於引入內含子。這樣,功能性內含子在本發明中被引入到本發明的人造基因中。功能性內含子在本發明中還可以被引入本發明的人造基因通路中。因此,本發明提供了嵌合多核苷酸的產生,該嵌合多核苷酸是含有一個(或多個)人工引入的內含子的人造基因。5本發明還提供了嵌合多核苷酸的產生,該嵌合多核苷酸是含有一個(或多個)人工引入的內含子的人造基因通路。一方面,人工引入的內含子在一種或多種宿主細胞的基因剪接中發揮作用,其發揮作用的方式與天然發生的內含子在基因剪接中發揮作用的方式在很大程度上是相同的。本發明提供了產生含人造內含子的多核苷酸的方法,該多核苷酸將被引入宿主生物體中,用於重組和/或剪接。10使用本發明產生的人造基因也可作為底物發揮作用,用於與另一核酸重組。同樣,使用本發明產生的人造基因途徑也可作為底物發揮作用,用於與另一核酸重組。一方面,重組由人造的含內含子基因和作為重組夥伴的核酸之間的同源區域促進,或發生在人造的含內含子基因和作為重組夥伴的核酸之間的同源區域。一方面,重組夥伴也可以是本發明產生的核酸,包括人造基因或人造基因途15徑。重組可以由人造基中一個(或多個)人工引入的內含子上存在的同源區域促進,或發生在由人造基中一個(或多個)人工引入的內含子上存在的同源區域。—方面,本發明的合成基因再裝配方法使用多種核酸構件,其每一種一方面具有兩個可連接末端。在每一個核酸構件上的兩個可連接末端可以是兩個平端(即,每一個末端具有零個核苷酸的突出),或者一方面可以是一個平端和一個突20出端,或者一方面可以是兩個突出端。一方面,用於該目的的一個有用的突出端可以是3'突出端或5'突出端。因此,核酸構件可以具有一個3'突出端或可選地具有一個5'突出端或可選地具有兩個3'突出端或可選地具有兩個5'突出端。核酸構件被裝配來形成最終嵌合的核酸分子的整個裝配次序通過有目的試驗設計確定並且是非隨機的。25因此,可以確定概率密度函數(PDF),預測在一個連接反應的每一步中可能發生的遺傳交換事件的總數,其中給定了一套具有確定數目的親本變異體、對20應於每種變體的寡核苷酸、以及在連接反應的每個步驟中的每種變異體的濃度。在確定PDF中應用到的統計學和數學在下面被描述。通過應用這些方法,可以計算這樣的概率密度函數,而且這樣就富集了來源於特定連接反應的具有預定數目的遺傳交換事件的嵌合子代群體。此外,可以預先確定遺傳交換事件的目標數目,然後對該系統進行程序化,以計算在該連接反應的每一個步驟中,每種親本寡聚25核苷酸的起始量,從而得到以遺傳交換事件的預先確定的數目為中心的概率密度函數。這些方法涉及還原性重配、重組和選擇的重複循環應用,通過重組實現編碼多肽的核酸的定向分子進化。該系統允許產生大量的進化出的嵌合序列,其中產生的群體顯著地富集了具有預定數目遺傳交換事件的序列。遺傳交換事件是在嵌合序列中的一個點,在這裡,從一個親本變異體到另一個親本變異體的序列轉30換發生。這樣的點一般是在兩個親本的寡聚核苷酸連接在一起形成單個序列的連接處。這一方法允許計算寡聚核苷酸序列的正確濃度,這樣,序列的最終嵌合群體富集了選定數目的遺傳交換事件。這也提供了對選擇具有預定數目的遺傳交換事件的嵌合突變體的更多控制。此外,這些方法與其他系統相比,提供了一種用於探究大數量的可能蛋白35變異體的方便手段。通過應用在這裡描述的方法,嵌合分子的群體可以富集那些含有特定數目的遺傳交換事件的變異體。因此,儘管在反應中可以仍然產生1013個嵌合分子,但是所選擇的用於進一歩分析的每一個分子很可能具有,例如,僅僅三個遺傳學交換事件。因為得到的子代群體可以傾向於具有預定數目的遺傳交換事件,所以造成嵌合分子之間的功能多樣性的界線減少。當計算出在最初的親本多聚核苷酸中的哪一個可能影響到特定的性質時,便提供了更加可控制的變量。5—方面,該方法通過產生對應於每一個親本序列的片段或者部分的寡聚核苷酸,產生嵌合子代多核苷酸序列。每一個寡核苷酸優選地包括重疊的獨特區域,這樣把所述寡聚核苷酸混合,得到具有以正確順序裝配的寡核苷酸片段的新的變異體。也可參見美國專利6,773,900;6,740,506;6,713,282;6,635,449;6,605,449;6,537,776;6,361,974。10線定爻換事伴本發明的任何過程可以被迭代重複,例如,可以鑑定出編碼本發明的改變的或者新的纖維素酶表型如內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或卩-葡糖苷酶的核酸,再分離,再修飾,再測試活性。這一過程可以重複直到工程化得到所需的表型。例如,完整的生物化學合成代謝或分解代謝途徑可以被工程化到細胞中,例如包括纖維素酶如內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/25或P-葡糖苷酶活性的細胞。類似地,如果確定了某特定寡核苷酸對於所期望的特性(例如新的纖維素酶如內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或卩-葡糖苷酶表型)不會造成任何影響,則可以合成包括這段待除去的序列在內的更大的親本寡核苷酸,從而將這段序列從變量中除去。由於將這段序列合併到更大的序列中,可以避免任30何遺傳交換事件,所以在子代多核苷酸中,這一序列不再有任何變異。確定哪些寡核苷酸與所需的性質最有關係,以及哪些與所需的性質無關的重複實踐可以更有效地探尋所有可能的具有特定性質或者活性的蛋白變異體。沐力微35在各個方面,分子的體內改組在本發明的方法中使用,提供本發明的多肽的變體,例如本發明的抗體、本發明的纖維素酶如內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或p-葡糖苷酶以及類似物。體內改組可以利用細胞重組多聚體的天然特性進行。儘管體內重組是提供分子多樣性的主要天然途徑,但遺傳重組仍然是一種相對複雜的過程,該過程涉及1)同源性識別;2)鏈切割,鏈侵入,和導致產生重組交叉(recombinationchiasma)的代謝歩驟;和最後3)交叉消除,5得到分離的重組分子。交叉的形成需要同源序列的識別。另一方面,本發明包括一種方法,用於由至少第一多核苷酸和第二多核苷酸獲得雜合多核苷酸。本發明也用於產生雜合多核苷酸,通過將共享至少一個部分序列同源的區域的至少第一多核苷酸和第二多核苷酸(例如,一個或兩者都是示例性的纖維素酶,例如本發明的內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶10和/或(3-葡糖苷酶)引入到合適的宿主細胞中實現。部分序列同源的區域促進了導致產生雜合多核苷酸的序列再組織過程。正如此處所用,術語"雜合多核苷酸"是從本發明的方法產生的任何核苷酸序列,其含有來自至少兩個原始多核苷酸序列的序列。這樣的雜合多核苷酸可以來自可促進DNA分子間序列整合的分子間重組事件。此外,這樣的雜合多核苷酸可以來自於分子內還原重配過程,該過程利15用重複序列來改變DNA分子內的核苷酸序列。—方面,體內重裝配集中在"分子間,,的過程上,統稱為"重組";在細菌中,它一般被視為是"RecA-依軟'的現象。本發明可以依賴於宿主細胞的重組過程來重組和重裝配序列,或者依賴於細胞介導還原過程的能力,通過缺失來減少細胞中的準-重複序列的複雜性。該"還原性重配"過程通過"分子內的"、RecA-依賴過程20而發生。在本發明的另一方面,通過還原性重裝配過程,產生新型的多核苷酸。該方法包括產生含有連續序列(起始的編碼序列)的構建物,它們插入到合適的載體中,並且然後將它們引入到合適的宿主細胞。單個分子同一性的重裝配通過在構建物中具有同源性區域的連續序列間的組合過程,或者準-重複單位間的組合過25程而發生。重裝配過程重組和/或降低重複序列的複雜性和程度,並且導致產生新型的分子種類。可以應用各種處理來提高重裝配效率。這些處理包括用紫外光,或者損壞DNA的化學試劑處理,和/或使用表現增高水平的"遺傳不穩定性"的宿主細胞系。因此,這樣的重裝配過程可以涉及同源重組或者準-重複序列指導它們自身進化的天然特性。30重複或者"準重複(quasi-repeated)"序列在遺傳不穩定性中起作用。一方面,"準重複"是並不限於它們起初的單元結構的重複。準重複單元可以在構建物中以序列的排列出現;以相似序列的連續單元出現。一旦連接,在連續序列之間的連接處變得基本上無形,並且得到的構建物的準重複性質在分子水平現在是連續的。細胞在準重複序列之間進行的缺失過程降低了得到的構建物的複雜性。準重35復單位提供了一個實際上沒有限制的模板內容,在模板上可以發生滑移事件。一方面,含有準重複的構建物有效地提供了足夠的分子彈性,缺失(和潛在的插入)事件實際上可以在準重複單元內的任何地方發生。當準重複序列全部以相同方向連接,例如,頭對尾或者反之亦然,細胞就不能區別各個單元。因此,還原過程可以在整個序列中發生。相反地,例如,當所述單元以頭對頭存在,而不是頭對尾,相鄰單元的頭尾倒置,這樣缺失的形成5將有利於不連續單元的失去。因此,優選地,待重裝配序列是處於相同的方向。準重複序列的隨機定向將會導致重裝配效率的損失,而序列的一致定向將會為序列的定向提供最高的效率。然而,雖然具有較少的相同方向的連續序列會降低效率,但是仍然可以為新型分子的有效回收提供足夠的彈性。用定向相同以允許更高效率的準重複序列製備構建物。10應用各種方法中的任何一種,可以將序列裝配成頭對尾的定向,包括以下方法a)可以使用包括poly-A頭和poly-T尾的引物,當製成單鏈時,包括poly-A頭和poly-T尾的引物將提供定向。這通過具有由RNA製備引物的頭幾個鹼基來完成,而且隨後用RNaseH可以很容易去除RNA。15b)可以應用包括獨特的限制酶切割位點的引物。這需要多個位點、一組獨特的序列、和重複的合成和連接步驟。c)引物的內部幾個鹼基可以被硫醇化,並且用外切酶來產生合適的具有尾巴的分子。—方面,重裝配序列的回收依賴於具有下降的重複指數(RI)的克隆載體20的確定。被重裝配的編碼序列可以隨後通過擴增回收。產物被再克隆和表達。具有降低的RI的克隆載體的回收可以這樣被完成,艮口1)應用僅僅當構建物的複雜性下降時才能穩定地維持的載體。2)通過物理程序對縮短的載體進行物理回收。在這一情況下,克隆載體將應用標準的質粒分離程序進行回收,或者在具有低分子量截留的瓊脂糖凝膠或25者柱子上利用標準程序進行大小分離。3)插入物的大小下降時,對含有可以選擇的斷裂基因的載體進行回收。4)應用表達載體以及適當的選擇,使用定向選擇技術。相關的生物體的編碼序列(例如,基因)可以表現出高度的同源性,並且編碼相當多樣化的蛋白產物。這些類型的序列特別可作為準重複序列用在本發明30中。然而,儘管下面所描述的例子證明了幾乎相同的起始編碼序列(準-重複)的再裝配,這一過程並不限於這種幾乎相同的重複。下面的例子展示了本發明的示例性方法。描述了來自三個(3)獨特種的編碼性核酸序列(準-重複)。每一序列編碼具有一套不同特徵的蛋白質。每一個序列在序列的唯一位置只有一個或者幾個鹼基對的不同。準-重複序列分別地或者共35同被擴增並且被連接到隨機的裝配體中,以便所有可能的排列和組合可以在連接的分子群體中獲得。準-重複單位的數目可以通過裝配條件來控制。在構建物中,準-重複單位的平均數目通過重複指數(RI)來定義。—旦形成,構建物可以,或不必按照出版的方法通過瓊脂糖凝膠來按大小分離,插入到克隆載體,並且轉染到合適的宿主細胞中。然後細胞進行繁殖,並且進行"還原性重裝配"。如果需要,還原性重裝配過程的速率可以通過引入DNA5損傷來刺激。RI的降低是通過一種"分子內"的機制在重複序列間形成缺失來介導,還是通過"分子間"的機制由類似重組的事件來介導是不重要的。最終的結果是分子被重裝配,得到所有可能的組合。任選地,本方法包括一個額外的步驟,即對改組的文庫成員進行篩選,以確定個別的改組文庫成員,其具有與一種預定的大分子如蛋白質受體、寡糖、病10毒顆粒或者其它的預定的化合物或者結構結合或者不同方式地相互作用,或者催化特定的反應(如,酶的催化結構域)的能力。從這樣的文庫所鑑定得到的多肽可以用於治療、診斷、研究和相關目的(例如,催化劑,用於增加水溶液的滲透性的溶質等等)和/或可以進行改組和/或選擇的一個或者多個另外的循環。15在另一方面,可以預見,在重組或重裝配之前,或者在重組或重裝配的過程中,通過本發明的方法產生的多核苷酸可以用試劑處理或進行加工,這些處理或加工促進突變引入到原始的多核苷酸中。引入這樣的突變將會增加得到的雜合多核苷酸及由其編碼的多肽的多樣性。促進誘變的試劑和過程可以包括,但不限於(+)-CC-1065,或者合成的類似物如(+)-CC-1065-(N3-腺嘌呤)(參見Sun和20Hurley,(1992);能夠抑制DNA合成的N-乙醯化或者脫乙醯基的4'-氟-4-氨基聯苯加合物(見,例如,vandePoll等(1992)),或者能夠抑制DNA合成的N-乙醯化或者脫乙醯基的4-氨基聯苯加合物(也見,vandePoll等(1992),751-758頁);三價鉻、三價鉻的鹽、可以抑制DNA複製的多環芳香烴(PAH)DNA加合物,如7-溴甲基-苯[a]蒽("BMA")、三(2,3-二溴丙基)磷酸鹽("Tris-BP")、1,2-二溴-3-25氯丙烷("DBCP")、2-溴丙烯醛(2BA)、苯並[a]芘-7,8-二氫二醇-9-10-環氧化物("BPDE")、鈾(II)卣素鹽、N-羥基-2-氨基-3-甲基咪唑[4,5-q-喹啉("N-羥基-IQ")、和N-羥基-2-氨基-l-甲基-6-苯基咪唑[4,5-f]-吡啶("N-羥基-PhIP")。用於減慢或者停止PCR擴增的示例性方法由紫外線(+)-CC-1065和(+)-CC-1065-(N3-腺嘌呤)組成。特別包含的方法是DNA加合物或者來自多核苷酸或者多核苷酸庫的含有DNA30加合物的多核苷酸,在進一步的處理前,其可以通過包括加熱含有所述多核苷酸的溶液的過程進行釋放或者去除。另一方面,本發明涉及產生具有生物活性的重組蛋白,其通過在根據本發明產生雜合或再裝配多核苷酸的條件下處理含有編碼野生型蛋白的雙鏈模板多核苷酸的樣品。35產生,艦辦本發明也提供了用於產生本發明核酸(例如纖維素酶如內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或卩-葡糖苷酶)序列的序列變異體的其它方法。本發明也提供了使用本發明的核酸和多肽分離纖維素酶如內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶的其它方法。一方面,本發明提供了本發明5的纖維素酶如內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶編碼序列(例如基因、cDNA或信息)的變異體,這些變異體可以通過任何方法來產生,如上所描述,例如包括隨意或隨機方法、或非隨機或"定向進化"方法。被分離的變異體可以是天然發生的。變異體也可以在體外產生。變異體也可以應用基因工程技術來產生,如定點誘變、隨機的化學誘變、核酸外切酶III缺10失方法和標準的克隆技術。可選擇地,可以應用化學合成或者修飾方法來產生這樣的變異體、片段、類似物或者衍生物。本領域技術人員也熟悉製備變異體的其它方法。這些方法包括這樣的程序,其中,從天然分離物中獲得的核酸序列經過修飾而產生編碼具有某些特徵的多肽的核酸,所述的特徵使這些多肽在工業或者實驗室應用中具有更高的價值。在這樣的程序中,大量的變異體序列被獲得和表15徵,這些變異體序列與從天然分離物中得到的序列相比,有一個或者多個核苷酸的差異。這些核苷酸的差異可能引起相對於天然分離得到的核酸序列編碼的多肽的胺基酸變化。例如,變異體可以通過易錯PCR產生。在易錯PCR的一個方面中,PCR在DNA聚合酶的複製保真性較低的情況下進行,這樣便在全長的PCR產物中得20到較高的點突變率。易錯PCR在例如,Leung,D.W.,等,Technique,1:11~15,1989和Caldwell,R.C.和JoyceG.R,PCRMethodsApplic.,2:28-33,1992中描述。簡要地說,在這樣的程序中,待誘變的核酸與PCR引物、反應緩衝液、MgCl2、MnCl2、Taq聚合酶以及適當濃度的dNTP混合,在全長的PCR產物中得到高的點突變率。例如,反應可以使用20fino1待誘變的核酸進行,每種PCR引物30pmol,反應緩25衝液包括50mMKCl、lOmMTrisHCl(pH8.3)和0.01%明膠、7mM的MgCl2、0.5mMMnCl2、5units的Taq聚合酶、0.2mMdGTP、0.2mMdATP、ImMdCTP和lmMdTTP。PCR可以進行30個循環,每個循環為94°C1分鐘;45'C1分鐘;和72°C1分鐘。然而,應該意識到,這些參數可以適當地變化。誘變的核酸克隆到一個適當的載體,並評價由誘變核酸編碼的多肽的活性。30—方面,變異體也可以用寡核苷酸誘導的定向突變產生,在任何感興趣的克隆DNA中產生位點特異性的突變。寡核苷酸誘變在,例如,Reidhaar-01son(1988)Science241:53-57中描述。簡要地說,在這樣的程序中,合成多個具有將要被導入被克隆的DNA中的一個或多個突變的雙鏈寡聚核苷酸,將這些寡聚核苷酸插入到待誘變的克隆DNA中。一方面,回收含有誘變DNA的克隆,表達,並評估它們35編碼的多肽的活性。另一種產生變異體的方法是裝配PCR。裝配PCR涉及由小DNA片段的混合物來裝配PCR產物。大量不同的PCR反應在相同的容器中平行地發生,一個反應的產物引發另一個反應的產物。裝配PCR已經被描述,例如在美國專利5,965,408中。—方面,有性PCR誘變是產生本發明的變異體的示例性方法。在有性PCR5誘變的一個方面中,由於基於序列同源性的DNA分子隨機片段化,在不同的但是高度相關的DNA序列的DNA分子之間,在體外強行發生同源重組,然後通過PCR反應的引物延伸,遺傳交換得到固定。有性PCR誘變在,例如,Stemmer(1994)Proc.Natl.Asad.Sci.USA91:10747-10751中描述。簡要地說,在這樣的程序中,多個待重組的核酸用DNase消化,產生具有50到200個核苷酸的平均大小的片段。10純化具有所需的平均大小的片段,重懸於PCR混合物中。在有利於核酸片段重組的條件下進行PCR反應。例如,PCR可以這樣進行將純化的片段重懸於含有0.2mM的各種dNTP、2.2mMMgCl2、50mMKC1、10mM的Tris-HCl,pH9.0以及0.1%的TritonX-100的溶液中,其濃度為10-30ng/pl。以100:1的比例在反應混合物中加入2.5Units的Taq聚合酶,用以下的條件進行PCR:94'C60秒,94°C3015秒,50-55'C30秒,72'C30秒(30-45次),然後72'C進行5分鐘。然而,可以意識到,這些參數可以進行適當的變化。在一些方面,寡聚核苷酸可以被包括在該PCR反應中。在其它方面,DNA聚合酶I的Klenow片段可以用於第一輪PCR反應,而Taq聚合酶可以用於後續的PCR反應。重組序列被分離,並評估它們編碼的多肽的活性。20—方面,變異體也可以通過體內誘變產生。在一些方面,感興趣的序列中的隨機突變通過在細菌菌株中增殖該感興趣的序列而產生,所述細菌菌株例如在一個或者多個DNA修復途徑中具有突變的大腸桿菌菌株。這樣的"突變"菌株具有比野生型親本更高的隨機突變率。在一種這樣的菌株中進行DNA的繁殖,最終可產生DNA中的隨機突變。適於在體內誘變中應用的突變菌株在,例如,PCT公25開號WO91/16427中有描述,其在1991年10月31日公開,題目為"MethodsforPhenotypeCreationfromMultipleGenePopulations"。變異體也可以通過應用盒式誘變產生。在盒式誘變中,雙鏈DNA分子的一個小的區域被不同於天然序列的合成的寡核苷酸"盒"替代。所述寡核苷酸一般含有完全和/或部分隨機的天然序列。30遞歸整體誘變也可以用於產生變異體。遞歸整體誘變是一種用於蛋白質工程(蛋白誘變)的算法,它的開發是為了產生表型相關的突變體組成的多樣性群體,其成員在胺基酸序列上有所不同。該方法應用反饋機制來控制連續多輪的組合式盒式誘變。遞歸整體誘變在如Aikin(1992)Proc.Natl.Acad.Sci.USA89:7811-7815中有描述。35在一些方面,用指數整體誘變產生變異體。指數整體誘變是一個用於產生具有較高百分比的獨特且具功能性的突變體的組合文庫的過程,其中少部分的殘基被隨機化,同時在每一個被改變的位置確認導致功能性蛋白的胺基酸。指數整體誘變在如,Delegrave(1993)BiotechnologyRes.11:1548-1552中有描述。隨機和定點誘變在如,Arnold(1993)CurrentOpinioninBiotechnology4:450-455中有描述。5在一些方面,變異體利用改組方法產生,其中編碼不同的多肽的多個核酸的部分被融合在一起,產生編碼嵌合多肽的嵌合核酸序列,其描述見美國專利5,965,408,其提交於1996年7月9日,題為"MethodofDNAReassemblybyInterruptingSynthesis";以及美國專利5,939,250,其提交於1996年5月22日,題為"ProductionofEnzymesHavingDesiredActivitiesbyMutagenesis。10本發明的多肽的變異體可以是這樣的變異體,其中本發明的多肽的一個或多個胺基酸殘基被保守或非保守胺基酸殘基(一方面,保守胺基酸殘基)取代,這樣取代的胺基酸殘基可以是由遺傳密碼編碼或不被其編碼的胺基酸。—方面,保守取代是那些在多肽中一個給定的胺基酸被另一個具有類似特性的胺基酸取代的取代。一方面,本發明的保守取代包括下列的取代脂肪族氨15基酸如丙氨酸、纈氨酸、亮氨酸和異亮氨酸用另一個脂肪族胺基酸取代;絲氨酸用蘇氨酸取代,或蘇氨酸用絲氨酸取代;酸性殘基如天冬氨酸和穀氨酸用另一個酸性殘基取代;具有醯胺基因的殘基,如天冬醯胺和穀氨醯胺用另一個具有醯胺基因的殘基取代;鹼性殘基如賴氨酸和精氨酸用另一個鹼性殘基來交換;芳香族殘基如苯丙氨酸、酪氨酸用另一個芳香族殘基取代。20其它變異體是那些在本發明的多肽的一個或多個胺基酸殘基中包含有取代基團的變異體。一方面,其它變異體是那些在其中多肽與別的化合物聯接的變異體,所述化合物例如增加多肽的半衰期的化合物(例如聚乙二醇)。其它變異體是那些在其中額外的胺基酸被融合到多肽上的變異體,額外的胺基酸例如前導序歹ij、分泌序列、蛋白原序列(proproteinsequence)或有助於多肽的純化、富集或25穩定的序列。在一些方面,片段、衍生物和類似物保持了與本發明的多肽的相同的生物功能或活性。在其它方面,片段、衍生物或類似物包括蛋白原,這樣,變異體、片段、衍生物或類似物可以通過蛋白原部分的切割來激活,以產生活性多肽。優化密碼子以便在宿主細胞中獲得高水平的蛋白表達本發明提供了修飾編碼纖維素酶如內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶的核酸來改變(例如,優化)密碼子使用的方法。一方面,本發明提供了修飾編碼纖維素酶如內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶的核酸中的密碼子來增加或者降低其在宿主細胞中的表達的方35法。本發明也提供了編碼纖維素酶如內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶的核酸,該核酸經過修飾從而其在宿主細胞中的表達增加,例如,經過這樣的修飾的纖維素酶如內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或l3-葡糖苷酶,以及製備修飾的纖維素酶如內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或p-葡糖苷酶的方法。該方法包括鑑定編碼纖維素酶如內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或p-葡糖苷酶的核酸中的"非優選的"或"較5不優選的"密碼子,並且用編碼相同胺基酸的"優選密碼子"作為替換密碼子替換一個或者多個這些非優選或者較不優選的密碼子,並且在所述核酸中至少一個非優選或較不優選的密碼子被編碼相同胺基酸的優選密碼子替換。優選密碼子是在宿主細胞基因的編碼序列中被較多使用的密碼子,而不優選的或者較不優選的密碼子是指在宿主細胞基因的編碼序列中較少使用的密碼子。10用於表達本發明的核酸、表達序列盒以及載體的宿主細胞包括細菌、酵母、真菌、植物細胞、昆蟲細胞和哺乳動物細胞(參見上面的討論)。因此,本發明提供了在所有這些細胞中優化密碼子使用的方法、密碼子被改變的核酸,以及由所述的密碼子被改變的核酸編碼的多肽。示例性的宿主細胞包括革蘭氏陰性細菌,如大腸桿菌(£sc;iehcWaco);革蘭氏陽性細菌,如鏈黴菌屬(S/repto/w_ycM)、15加氏乳酸桿菌(丄a"o^c///1^gawe〃')、乳酸乳球菌(£ac/ocoaw/ac似)、乳脂乳球菌(Zactococczwcre加o/7's)、枯草芽胞桿菌(5arcv7/"jsi/6""51)、4山人掌桿菌(5a"7/"sceww)。示例性的宿主細胞也包括真核生物體,如,各種酵母,如酵母菌屬(Sacc/jaram;ycessp.),包括酉良酒酵母(Sacc/wromycescerevisz'cre)、粟酒裂殖酵母(ScWmsflccWom少ces戶附&e)、畢赤酵母(屍認"戸,or&)和乳酸克魯維酵母20(A7M嚴eram[yc^/acto)、多形漢森酵母(//1myeww/flpo(y附or//fl)、黑麴黴(J5perg〃/uym'ger)和哺乳動物細胞和細胞系以及昆蟲細胞和細胞系。因此,本發明也包括在這些生物體和物種中表達被優化的核酸和多肽。例如,從細菌細胞中分離出的編碼纖維素酶如內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或p-葡糖苷酶的核酸的密碼子被修飾,以便該核酸在不同於25獲得該纖維素酶如內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或p-葡糖苷酶的細菌的細胞,如酵母、真菌、植物細胞、昆蟲細胞或者哺乳動物細胞中被最優化地表達。優化密碼子的方法在本領域是已知的,參見如,美國專利5,795,737;Baca(2000)Int.J.Parasitol.30:113-118;Hale(1998)ProteinExpr.Purif.12:185-188;Narum(2001)Inect.Immun.69:7250-7253。也參見Narum(2001)Infect.Immun.3069:7250-7253,描述了在小鼠系統中優化密碼子;Outchkourov(2002)ProteinExpr.Purif.24:18-24,描述了在酵母中優化密碼子;Feng(2000)Biochemistry39:15399-15409,描述了在大腸桿菌中優化密碼子;Humphreys(2000)ProteinExpr.Purif20:252-264,描述了大腸桿菌中影響分泌的優化的密碼子使用。35轉基因非人動物本發明提供了轉基因非人動物,其包含本發明的核酸、多肽(例如纖維素酶,如內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或p-葡糖苷酶)、表達序列盒或載體或轉染細胞或轉化細胞。本發明也提供了產生和應用這些轉基因非人動物的方法。轉基因非人類動物可以是,例如包含本發明的核酸的狗、山羊、兔、綿羊、5豬(包括所有的豬(swine)、公豬和相關動物)、牛、大鼠和小鼠。這些動物可以用作例如體內模型來研究纖維素酶如內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或J3-葡糖苷酶的活性,或者作為模型來在體內篩選改變纖維素酶如內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶的活性的試劑。要在轉基因非人動物中表達的多肽的編碼序列可以設計為組成型的,或者在組織特異性、發10育特異性或者可誘導的轉錄調控因子的控制之下。轉基因非人動物可以應用本領域任何已知的方法設計和產生;參見,如,美國專利6,211,428;6,187,992;6,156,952;6,118,044;6,111,166;6,107,541;5,959,171;5,922,854;5,892,070;5,880,327;5,891,698;5,639,940;5,573,933;5,387,742;5,087,571,它們描述了製造和應用轉化的細胞和卵以及轉基因小鼠、15大鼠、兔、羊、豬和牛。也參見,如,Pollock(1999)J.Immunol.Methods231:147-157,描述了在轉基因奶牛動物的乳汁中生產重組蛋白;Baguisi(1999)Nat.Biotechnol.17:456-461,描述了轉基因山羊的產生。美國專利6,211,428,描述了製備和應用在其腦中表達含有DNA序列的核酸構建物的轉基因非人哺乳動物。美國專利5,387,742,描述了把克隆的重組子或者合成的DNA序列注射至小鼠受精卵中,移20植注射的卵至假孕的雌鼠中,並生長成為轉基因鼠,它的細胞表達與阿爾茨海默氏病的病理相關的蛋白。美國專利6,187,992,描述了製備和應用轉基因小鼠。"基因敲除動物"也可以被用於實踐本發明的方法。例如,一方面,本發明的轉基因或修飾動物包括"基因敲除動物",例如"基因敲除小鼠",其被進行了遺傳工程以至於不表達內源基因,該基因被表達本發明纖維素酶如內切葡聚糖25酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶的基因或包含有本發明纖維素酶如內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或(3-葡糖苷酶的融合蛋白的基因代替。轉基因植物和種子30本發明提供了轉基因植物和種子,其包含本發明的核酸、多肽(例如纖維素酶,如內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶)、表達序列盒或載體或轉染或轉化的細胞。本發明也提供了包含本發明的核酸和/或多肽(例如纖維素酶,如內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或p-葡糖苷酶)的植物產品,例如油、種子、葉、提取物和類似物。轉基因植物可以是雙子葉(雙35子葉植物)或單子葉的(單子葉植物)。本發明也提供了製備和應用這些轉基因植物和種子的方法。表達本發明的多肽的轉基因植物或者植物細胞可以按照本領域任何已知的方法構建。參見例如,美國專利6,309,872。本發明的核酸和表達構建物可以通過任何方式導入到植物細胞中。例如,核酸或者表達構建物可以導入到所希望的植物宿主的基因組中,或者,核酸或表達構建物可以是附加體。可以導入到所希望的植物的基因組中,這樣,宿主的纖5維素酶如內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶的產生被內源性的轉錄或者翻譯控制元件調控。本發明也提供了"基因敲除植物",其中例如同源重組導致的基因序列插入破壞了內源性基因的表達。產生"基因敲除"植物的方法在本領域是屬知的,參見,如,Strepp(1998)ProcNatl.Acad.Sci.USA95:4368-4373;Miao(1995)PlantJ7:359-365。參見下面的轉基因植物的討論。10本發明的核酸可以用來將所需的性質賦予基本上任何植物,例如產澱粉的植物,如馬鈴薯、番茄、小麥、大豆、甜菜、玉米、稻、大麥以及類似的植物。本發明的核酸可以用於操作植物的代謝途徑,以優化或者改變宿主的纖維素酶如內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶的表達。這可以改變植物中的纖維素酶如內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖15苷酶的活性。可以選擇地,本發明的纖維素酶如內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或p-葡糖苷酶可以在轉基因植物的生產中被應用,以產生該植物不能天然產生的化合物。這可以降低生產成本或者產生一種新的產物。—方面,生產轉基因植物的第一步涉及製備用於在植物細胞中表達的表達構建物。這些技術在本領域是熟知的。它們可以包括選擇和克隆啟動子、便於核20糖體有效結合mRNA的編碼序列,以及選擇適當的基因終止子序列。一個示例性的組成型啟動子是來自花椰菜花葉病毒的CaMV35S,它一般在植物中導致高水平的表達。其它的啟動子是更特異的,並且對植物內部或者外部環境中的暗示有反應。一個示例性的光誘導的啟動子是來自編碼主要葉綠素a/b結合蛋白的cab基因的啟動子。25—方面,修飾核酸來實現在植物細胞中更強的表達。例如,本發明的序列很可能具有比在植物中更高的A-T核苷酸對百分率,而一些植物優選G-C核苷酸對。因此,編碼序列中的A-T核苷酸可以用G-C核苷酸取代,而不顯著改變胺基酸序列,從而可以增加基因產物在植物細胞中的生產。為了鑑定已經成功整合了轉基因的植物細胞或者組織,可以將選擇性標記30基因加入到基因構建物中。這可能是必要的,因為在植物細胞中完成基因的整合和表達是一個小概率事件,僅僅在較少百分率的靶組織和細胞中發生。選擇性標記基因編碼對試劑有抗性的蛋白,所述試劑一般對植物有毒性,如抗生素或者除草劑。當在含有適當的抗生素或者除草劑的培養基上生長時,只有已經整合了選擇性標記基因的植物細胞可以成活。與其它的插入基因一樣,為了有恰當的功能,35標記基因也需要啟動子和終止序列。—方面,製備轉基因植物或種子包括將本發明的序列以及任選的標記基因整合到目標表達構建物(如,質粒)中,同時設置啟動子和終止子序列。這可以包括通過合適的方法將修飾的基因轉移至植物中。例如,構建物可以應用如電擊轉化和微注射植物細胞原生質體的技術直接引入到植物細胞的基因組DNA中,或者構建物可以應用彈道方法(ballisticmethods),如,DNA微粒轟擊(DNAparticle5bombardment)的方法直接引入到植物組織中。例如,參見如,Christou(1997)PlantMol.Biol.35:197-203;Pawlowski(1996)Mol.Biotechnol.6:17-30;Klein(1987)Nature327:70-73;Talcumi(1997)GenesGenetSyst.72:63-69,討論了應用微粒轟擊引入轉基因到小麥中;以及Adam(1997)如上,應用微粒轟擊引入YAC至植物細胞中。例如,Rinehart(1997)如上,用微粒轟擊來產生轉基因棉花植物。10用於加速微粒的設備在美國專利5,015,580中有說明;而且,可以商購得到BioRad(Biolistics)PDS-2000微粒加速設備;也參見,John,美國專利5,608,148;和Ellis,美國專利5,681,730,描述了微粒介導的裸子植物的轉化。—方面,原生質體可以被固定,並用核酸例如表達構建物注射。儘管源自原生質體的植物再生對於穀類並不容易,但是應用體細胞胚胎發生由原生質體來15源的愈傷組織進行植物再生在豆類中是有可能的。機化組織可以使用基因槍技術用裸DNA轉化,其中,DNA被包裹於鎢微射彈(tungstenmicroprojectiles)上,射出物的大小為細胞大小的1/100,它攜帶DNA深入到細胞和細胞器中。轉化的組織然後被誘導再生,一般通過體細胞胚胎發生技術。這一技術已經在包括玉米和水稻的幾個穀類物種中成功應用。20核酸,例如表達構建物,也可以應用重組病毒引入到植物細胞中。植物細胞可以用病毒載體轉化,如,菸草花葉病毒衍生的載體(Rouwendal(1997)PlantMol.Biol.33:989-999),參見Porta(1996)"Useofviralrepliconsfortheexpressionofgenesinplants",Mol.Biotechnol.5:209-221。可選擇地,核酸,如表達構建物,可以與合適的T-DNA側翼區組合,並25導入到傳統的根瘤農桿菌宿主載體中。根瘤農桿菌宿主的毒力功能將在植物細胞受該細菌感染時,引導構建物和鄰近的標記插入至植物細胞DNA中。根瘤農桿菌介導的轉化技術,包括disarming和應用二元載體,在科學文獻中有詳細的說明。參見,如,Horsch(1984)S"e"ce233:496-498;Fraley(1983)/VocA^Z.JcadSW.80:4803(1983);7hww/e〃o屍/a"",Potrykus,ed.(Springer-Veriag,Berlin301995)。根瘤農桿菌細胞的DNA被包含在細菌染色體中,也被包含在稱為Ti(腫瘤誘導)質粒的另一種結構中。Ti質粒含有一段命名為T-DNA的DNA(20kb長)和一系列毒力(毒性)基因,T-DNA在感染過程中被轉移到植物細胞中,毒力基因則引導所述感染過程。根瘤農桿菌可以通過傷口感染植物當一種植物的根或者莖受傷時,它釋放某種化學信號,作為對這種信號的響應,根瘤農桿菌的35毒力基因被激活,並引發一系列從Ti質粒轉移T-DNA至植物染色體所必需的事件。T-DNA然後通過傷口進入到植物細胞。一個推測是T-DNA—直等到植物DNA複製或者轉錄,然後將自身插入到暴露的植物DNA中。為了應用根瘤農桿菌作為轉基因載體,必須去除T-DNA的腫瘤誘導部分,而保留T-DNA的邊界區域和毒力基因。轉基因然後插入到T-DNA的邊界區域之間,從這裡轉移到植物細胞並且整合到植物的染色體中。5本發明提供了應用本發明的核酸進行包括重要的穀類植物在內的單子葉植物的轉化,參見Hiei(1997)PlantMol.Biol.35:205-218。也參見如,Horsch,Science(1984)233:496;Fraley(1983)Proc.NatlAcad.SciUSA80:4803;Thykjaer(1997)如上;Park(1996)PlantMol.Biol.32:1135-1148,討論了將T-DNA整合到基因組DNA中。也參見D'Halluin,美國專利5,712,135,描述了包含在穀類或者其它單子10葉植物的細胞中的具有功能的基因的DNA的穩定整合過程。—方面,第三步可能涉及完整植物的選擇和再生,所述植物能夠將整合的靶基因傳遞至下一代。這樣的再生技術依賴於在組織培養生長培養基中對某些植物激素的操作。一方面,該方法利用與所需的核苷酸序列一同引入的殺蟲劑和/或除草劑標記。源自培養的原生質體的植物再生在以下文獻中有說明,Evans等,15Pra鄉/a加/so/加'omaweCW&re,Z/aw必ooA:o/iV"WO//Cw/ft^e,124-176頁,MacMillilanPublishingCompany,NewYork,1983;禾qBinding,iegenen3n'owo/屍/aw",屍/aWiVorop/a^y,21-73頁,CRCPress,BocaRaton,1985。再生也可以從植物愈傷組織、外植體、器官或者其中的一部分得到。這樣的再生技術在Klee(1987)Ann.Rev.ofplantPhys.38:467-486中有總體的說明。為了從轉基因組織如未成熟的胚胎20獲得整個植物,它們可以在一系列含有營養物和激素的培養基中在可控制的環境條件下培養,即稱為組織培養的過程。一旦整個植物再生並且產生種子,便開始評測其子代。—方面,在表達序列盒穩定地整入到轉基因植物之後,其可以通過有性雜交(sexualcrossing)引入到其它的植物中。可以應用任何的標準繁殖技術,這依25賴於待雜交的物種。因為本發明核酸的轉基因表達導致表型變化,包含本發明的重組核酸的植物可以和另一植物有性雜交而得到最終產物。因此,本發明的種子可以來自本發明的兩個轉基因植物的雜交,或者來自本發明的植物和其它植物的雜交。當兩個親本植物都表達本發明的多肽(例如纖維素酶,如內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶)時,所需的效應(例如,表達本30發明的多肽來產生一種開花行為被改變的植物)可以被增強。所需的效應通過標準的繁殖方法傳到以後的植物世代中。—方面,本發明的核酸和多肽被表達於或者插入到任何植物或者種子中。本發明的轉基因植物可以是雙子葉植物或者單子葉植物。本發明的單子葉轉基因植物的例子是草,如牧草(藍草,早熟禾屬屍oa),飼料草如羊茅屬,黑麥草屬,35溫帶草,如翦股穎屬C4gra幼'",和穀類,如,小麥、燕麥、黑麥、大麥、水稻、蜀黍和玉米(corn)。本發明的雙子葉轉基因植物的例子是菸草,豆類如羽扇豆,馬鈴薯,甜菜,豌豆,蠶豆和大豆,以及十字花科植物(5row/caceae科),如花椰菜,油菜籽,和緊密相關的模式生物擬南芥"ra6Wo/w/1yf/ia//flmj)。因此,本發明的轉基因植物和種子包括很寬範圍的植物,包括,但不限於,以下屬的物種-腰果屬""acaW/ww)、落花生屬"rac/H^)、天冬屬(Asparag^)、茄屬Ufra;a)、5燕麥屬"ve"a)、芸苔屬(5raw/ca)、柑桔屬(C!7nw)、Cz>m//us、辣椒屬"7a/wi'cwm)、CaW/7am"s、椰子(Coaw)、咖啡(Co#ea)、香瓜屬(Ci/cw/m's)、南瓜屬(CwcM/^!7a)、胡蘿蔔屬(Dawcws)、油棕屬草莓屬(fVagm7'fl)、大豆屬(Gfya、e)、棉屬(Gowy;^ww)、向日葵屬(//e//a"f/n)、//e/ewca〃&、大麥屬(Z/orJeM/n)、天仙子屬(/fyosc戸/mw)、萵苣屬(Za"Mca)、亞麻屬("""w)、黑麥草屬ao//wm)、10羽扇豆屬(丄w//mw)、番茄屬(Z^copery/cow)、蘋果屬(Ma/ws)、木薯屬(Mflm'Ao/)、Mq/oma、苜蓿屬(A/eAcago)、菸草屬(Mco"awa)、木樨欖屬(OZea)、稻屬(Ojza)、稷屬(戶a"/e"m)、狼尾草屬(屍a""&"謂)、鱷梨屬(Perwa)、菜豆屬(屍/jawoto)、P&acWa、豌豆屬(屍&"附)、梨屬(屍,MS)、李屬(Pn/mw)、蘿卡屬(ia;^am^)、蓖麻屬(i!'c/"m)、黑麥屬(Seca/e)、千裡光屬(Se"edo)、S/wa;^、茄屬(So/o"mw)、15高粱屬(5brg/i"m)、7Tieo6rowM"葫蘆巴屬(7Wgowe//a)、小麥屬(rn'"ami)、野豌豆屬(Wc/")、葡糖屬(Wto)、豇豆屬(P7g"a)和玉蜀黍屬(Zea)。在可選擇的實施方式中,本發明的核酸在含有纖維細胞的植物中表達,包括,如,棉、絲棉樹(木棉、吉貝木棉)、沙漠柳、石炭酸灌木、winterfat、輕木(balsa)、薴麻、洋麻、大麻、洛神葵、黃麻、馬尼拉劍麻和亞麻。在可供選擇的20實施方式中,本發明的轉基因植物可以是棉屬(Gw^^'M/n)的成員,包括任何棉禾中(Go,/wm)的成員,如,亞洲棉(G。rZw畫)、草棉(G/^6ac畫)、海島棉(G6aAa&Awe)和陸地棉(G)。本發明也提供了用於產生大量本發明多肽(例如纖維素酶,如內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或p-葡糖苷酶)的轉基因植物。例如,參見25Palingren(1997)TrendsGenet.13:348;Chong(1997)TransgenicRes.6:289-296(利用植物生長素誘導的雙向甘露氨酸合成酶(masl',2')啟動子,應用根瘤農桿菌介導的葉片圓盤(leafdisc)轉化方法在轉基因馬鈴薯植物中生產人乳汁蛋白P-酪蛋白)。應用已知的程序,技術人員可以通過檢測在轉基因植物中轉基因mRNA30或蛋白的增加或減少來篩選本發明的植物。檢測和定量mRNA或蛋白的方法在本領域是熟知的。多肽和肽—方面,本發明提供了分離的或重組的多肽,其與本發明的示例性序列具35有序列同一性(例如至少大約50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高或完全的(100%)序列同一性),本發明的示例性序列例如具有SEQIDNO:2,SEQIDNO:4,SEQIDNO:6,SEQIDNO:8,SEQIDNO:IO,5SEQIDNO:12,SEQIDNO:14,SEQIDNO:16,SEQIDNO:18,SEQIDNO:20,SEQIDNO:22,SEQIDNO:24,SEQIDNO:26,SEQIDNO:28,SEQIDNO:30,SEQIDNO:32,SEQIDNO:34,SEQIDNO:36,SEQIDNO:38,SEQIDNO:40,SEQIDNO:42,SEQIDNO:44,SEQIDNO:46,SEQIDNO:48,SEQIDNO:50,SEQIDNO:52,SEQIDNO:54,SEQIDNO:56,SEQIDNO:58,SEQIDNO:60,10SEQIDNO:62,SEQIDNO:64,SEQIDNO:66,SEQIDNO:68,SEQIDNO:70,SEQIDNO:72,SEQIDNO:74,SEQIDNO:76,SEQIDNO:78,SEQIDNO:80,SEQIDNO:82,SEQIDNO:84,SEQIDNO:86,SEQIDNO:88,SEQIDNO:90,SEQIDNO:92,SEQIDNO:94,SEQIDNO:96,SEQIDNO:98,SEQIDNO:100,SEQIDNO:102,SEQIDNO:104,SEQIDNO:106,SEQIDNO:108,SEQID15NO:110,SEQIDNO:m,SEQIDNO:114,SEQIDNO:116,SEQIDNO:118,SEQIDNO:120,SEQIDNO:122,SEQIDNO:124,SEQIDNO:126,SEQIDNO:128,SEQIDNO:130,SEQIDNO:132,SEQIDNO:134,SEQIDNO:136,SEQIDNO:138,SEQIDNO:140,SEQIDNO:142,SEQIDNO:144,SEQIDNO:146,SEQIDNO:148,SEQIDNO:150,SEQIDNO:152,SEQIDNO:154,SEQID20NO:156,SEQIDNO:158,SEQIDNO:160,SEQIDNO:162,SEQIDNO:164或SEQIDNO:166中所示的序列的蛋白(也參見表l、2和3,下面的實施例1和4,以及序列表)。序列同一性百分比可以在多肽的全長的區域內,或同一性可以在至少大約50、60、70、80、90、100、150、200、250、300、350、400、450、500、550、600、650、700或更多殘基的區域內。25[391a]本發明的多肽也可以比所述的示例性多肽的全長短。在可以選擇的方面,本發明提供了大小範圍在大約5到多肽全長的多肽(肽、片段),例如酶,如纖維素酶,諸如內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或p-葡糖苷酶;示例性的大小為大約5、10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、100、125、150、175、200、250、300、350、400、450、500、550、30600、650、700或更多殘基,這些殘基例如是本發明的示例性纖維素酶如內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶的相鄰殘基。本發明的肽(例如,本發明的示例性多肽的子序列)可以用作,例如標記探針,抗原(免疫原),耐受原,基序,纖維素酶例如內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶活性位點(例如,"催化結構域"),信號序列和/或前原結構域(prepro35domains)。在可選的方面,本發明的具有纖維素酶如內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或p-葡糖苷酶活性的多肽,是一類多肽的成員,該類多肽共享與纖維素酶活性如內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶活性相關的特定結構元件,例如胺基酸殘基。這些共享的結構元件可用於常規產生纖維素酶如內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或p-葡糖苷酶變體。本5發明的纖維素酶如內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶的這些共享結構元件可用於指導本發明的多肽種類範圍內的纖維素酶例如內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或p-葡糖苷酶變體的常規產生。如本文所使用,術語"纖維素酶,如內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶"包括能夠催化纖維素的完全或部分分解和/或水解的任10何多肽或酶(例如,本發明的示例性多肽,也參見下面的表1、2和3,實施例1和4),或者能夠進行纖維素或木素纖維素材料如含有木素纖維素的生物材料的任何修飾的任何多肽或酶。在一些方面,本發明可以具有可選的酶促活性,例如,如在下面的表3中所示。例如,具有如SEQIDNO:164中所示的序列的多肽,由例如SEQIDNO:16315編碼,可以具有鹼性內切葡聚糖酶/纖維素酶活性;具有如SEQIDNO:110中所示的序列的多肽,由例如SEQIDNO:109編碼,可以具有木聚糖酶活性;具有如SEQIDNO:12中所示的序列的多肽,由例如SEQIDNO:11編碼,可以具有NAD結合氧化還原酶活性;具有如SEQIDNO:118中所示的序列的多肽,由例如SEQIDNO:117編碼,可以具有短鏈脫氫酶活性;具有如SEQIDNO:14中所示的序列的20多肽,由例如SEQIDNO:13編碼,可以具有NADH依賴性脫氫酶活性;具有如SEQIDNO:138中所示的序列的多肽,由例如SEQIDNO:137編碼,可以具有肽酶活性;具有如SEQIDNO:162中所示的序列的多肽,由例如SEQIDNO:161編碼,除了纖維素酶活性外還可以具有鹼性內切葡聚糖酶活性;具有如SEQIDNO:42中所示的序列的多肽,由例如SEQIDNO:41編碼,可以具有半胱氨醯tRNA25合成酶活性;具有如SEQIDNO:32中所示的序列的多肽,由例如SEQIDNO:31編碼,可以具有纖維糊精磷酸化酶活性;具有如SEQIDNO:50中所示的序列的多肽,由例如SEQIDNO:49編碼,可以具有fdhd/narq氧化還原酶活性;具有如SEQIDNO:54中所示的序列的多肽,由例如SEQIDNO:53編碼,可以具有自由基S-腺苷蛋氨酸(SAM)活性;具有如SEQIDNO:58中所示的序列的多肽,由例如30SEQIDNO:57編碼,可以具有類似枯草蛋白酶的蛋白酶活性(枯草蛋白酶樣蛋白酶活性);等等,如下所示表3:formulaseeoriginaldocumentpage127tableseeoriginaldocumentpage128tableseeoriginaldocumentpage129ORF011-家族37,38葡糖苷瞎)ORP004-椎定的氧化還原酶39.40ORF004-半胱氨醯tRM合成酶41,4243,44ORF011—ORF006—家族1(&-葡糖苷酶)ORF00Z-家族1(a"47,48蕭耱苷籌)49,60氧化還原酶5,6ORF312-家族6(纖維素酶)1-29MTRRS,VRSSSNKWLVLAGAALLACTALG51,52ORF001-家族5(纖維素酶)1-20MSRGHJLVMLSVLSGAALA53,54ORF002—自由基SAI^族ORF004-家族1(ft"55,58葡糖苷瞎)57,58ORF加1-類似枯直蛋白酶的蛋白酶59,60家族5(纖維親酶)61,62家族5(纖維素酶)ORF114263,64家族5(纖維素鵬)ORF4,-2465,66家族10(木聚糖酶)1"3967.68家族5(纖維親鵬VORF21-23MVWTPARSTLAGSSEIPLMTMNIFPNRKDSRMSL州KLG'LCMMAGTVMVHQMKRREFMU3GAGVAALASTLGVSAMNTLLPR亂WSSTAIRTLMGALMGMVLAPVSAANAMKYIFSYIIMMlUOFIPVYGR34.1.1.6,1-1.163,2.1.213.2."1...3.2.1.2112.1.43.2.1.43.2.1.43.2.1.4200680016175.5勢溢齒被98/148JB;nwnx口口nw口口頭頭知知.w.,*K知未未未未未未未w知w知知^f^知知未未未未未未未未未未tableseeoriginaldocumentpage131未如本文所使用,"胺基酸"或"胺基酸序列"是指寡肽、肽、多肽或蛋白序列,或寡肽、肽、多肽或蛋白序列中任意一種的片段、部分或亞基,以及天然發生的或合成的分子。"胺基酸"或"胺基酸序列"包括寡肽、肽、多肽或蛋白序列,或寡肽、肽、多肽或蛋白序列中任意一種的片段、部分或亞基,以及天然發5生的或合成的分子。如本文所使用,術語"多肽"是指通過肽鍵或修飾的肽鍵即肽等排體(peptideisosteres)彼此結合在一起的胺基酸,可以含有除20個由基因編碼的胺基酸之外的修飾的胺基酸。所述多肽可以通過天然過程,如,翻譯後加工或者通過本領域所熟知的化學修飾技術修飾所述多肽。修飾可以發生在所述多肽的任何地方,包括肽骨架、胺基酸側鏈和氨基端或者羧基端。可以理解,相同10類型的修飾可以在給定的多肽中以相同的或者不同的水平在幾個位點處發生。一個給定的多肽也可以具有很多類型的修飾。修飾包括乙醯化、醯化作用、ADP-核糖基化作用、醯胺化作用、共價連接核黃素、共價連接血紅素組分、共價連接核苷酸或者核苷酸衍生物、共價連接脂質或者脂質衍生物、共價連接磷脂醯肌醇、交聯的環化作用、形成二硫鍵、去甲基作用、形成共價交聯、形成半胱氨酸、形15成焦穀氨酸、甲醯基化作用、"羧化作用、糖基化作用、形成GPI錨、羥基化作用、碘化作用、甲基化作用、肉豆蔻醯基化作用、氧化作用、聚乙二醇化、葡聚體水解酶處理、磷酸化作用、異戊烯作用、外消旋作用、硒化作用、硫酸鹽化作用,和轉移RNA介導胺基酸添加到蛋白質中,如精氨醯化。(參見,如,Creighton,T.E.,Proteins-StructureandMolecularProperties2ndEd.,W.H.Freeman和Company,New20York(1993);PosttranslationalCovalentModificationofProteins,B.C.Johnson,Ed"AcademicPress,NewYork,11-12頁(1983〉)。本發明的肽和多肽也包括所有"模擬物"和"肽模擬物"形式,正如下面進一步詳細描述的。如本文所使用,術語"分離的"意指從其原始環境(例如天然環境,如果該環境是天然存在的話)中分離出的物質(本發明的蛋白或核酸)。例如,在活的25動物中存在的天然發生的多核苷酸或多肽不是分離的,但與該天然系統中的一些或所有的共存物質分離開的同一多核苷酸或多肽是分離的。這樣的多核苷酸可以成為載體的一部分,和/或這樣的多核苷酸或多肽可以是組合物的一部分,但它們仍然是分離的,因為這樣的載體或組合物不是其天然環境的組成部分。正如本文所用,術語"純化的"並不要求絕對的純度;它更確切的說,這意味著是一個相30對定義。從文庫獲得的各核酸可以按慣例純化為電泳同質。從這些克隆獲得的序列不能夠從所述文庫或從總人DNA直接獲得。本發明的純化的核酸已經以至少10、10M咅從該生物體的基因組DNA的剩餘物中純化出來。一方面,術語"純化的"包括核酸,這些核酸已經以至少一個數量級,例如一方面,以兩個或三個,或者,四個或五個數量級的程度從基因組DNA的剩餘物或從文庫或其它序列中被純化出35來。"重組的"多肽或蛋白是指通過重組DNA技術產生的多肽或蛋白;艮P,由用編碼期望多肽或蛋白的外源DNA構建物轉化的細胞產生的多肽或蛋白。"合成的"多肽或蛋白是那些通過化學合成製備的多肽或蛋白。固相化學肽合成方法也可以用於合成本發明的多肽或者片段。這樣的方法自二十世紀六十年代早期起就是本領域已知的方法(Memfield,R.B.,J.Am.Chem.Soc.,85:2149-2154,1963)5(也參見Stewart,J.M.和Young,J.D.,SolidPhasePeptideSynthesis,第二版,PierceChemicalCo.,Rockford,III,11-12頁),並且這些方法已經可以通過商業上可獲得的實驗室肽設計和合成試劑盒(CambridgeResearchBiochemicals)而被應用。這樣的商業上可獲得的實驗室試劑盒一般是利用H.M.Geysen等,Prac.Wa".Aad5W.,t/S4,M:3998(1984)的方法,它們讓肽合成在多個"杆(rods)"或者"釘10(pins)"的頂端進行,而所有的"杆"或者"釘"都被連接到一塊板上。短語"基本上相同(substantiallyidentical)"在用於兩個核酸或多肽時,是指當兩個或更多個序列被比較和聯配(aligned)以尋找最大一致性(maximuncorrespondence)時,它們具有例如至少大約50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、1569%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高的核苷酸或胺基酸殘基(序列)同一性,所述同一性可以使用任意一種已知的序列比較算法測量,或者通過視覺觀察。在可選擇的方面,基本上相同存在於至少大約100或更多個殘基的區域內,最經常地,20在至少大約150至200或更多殘基的區域內所述序列是基本上相同的。在一些方面,本發明的核酸序列可以在多肽編碼區的整個長度範圍內是基本上相同的。此外,"基本上相同的"胺基酸序列可以是通過一個或多個保守或非保守胺基酸的取代、缺失或插入而與參考序列有所不同的序列。在一個方面,取代發生在不是分子的活性位點的位置,或者可選地,取代發生在分子的活性位點的位25置,前提是該多肽基本上保持其功能(酶促)特性。保守的胺基酸取代,例如用一個胺基酸取代另一個相同類別的胺基酸(例如用一個疏水胺基酸,如異亮氨酸、纈氨酸、亮氨酸或甲硫氨酸,取代另一個疏水胺基酸,或用一個極性胺基酸取代另一個極性胺基酸,例如用精氨酸取代賴氨酸、用穀氨酸取代天冬氨酸,或用穀氨醯胺取代天冬醯胺)。可以從例如纖維素酶如內切葡聚糖酶、纖維二糖水解酶、30甘露聚糖酶和/或P-葡糖苷酶多肽中刪除一個或多個胺基酸,從而形成對多肽結構的修飾,而又不會顯著地改變其生物活性。例如,對纖維素酶如內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或p-葡糖苷酶的生物活性來說不需要的氨基或羧基末端胺基酸可以被去除。可以通過任何方法測定本發明的修飾的多肽序列的纖維素酶如內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或p-葡糖苷酶生物活性,35所述方法包括將所述修飾的多肽序列和底物接觸,確定所述修飾的多肽是否在該測定中減少特定底物的量或者增加功能性纖維素酶如內切葡聚糖酶、纖維二糖水解酷、甘露聚糖酶和/或p-葡糖苷酶與底物的酶促反應的生物產物。如本文所使用,"片段"是天然存在的蛋白質的一部分,其可以以至少兩種不同的構象存在。片段可以具有與天然發生的蛋白質相同或基本上相同的胺基酸序列。具有與天然存在的蛋白質有所不同的三維結構的片段也被包括在內。這5樣的一個例子是"原-形式(pro-form)"分子,例如,低活性的蛋白原,其可以通過切割而被修飾,產生具有顯著更高的活性的成熟酶。—方面,本發明提供了本發明的蛋白和肽例如纖維素酶的晶體(三維)結構;其可以使用本領域中熟知的常規方案進行製備並加以分析,例如,在下列文獻中有所描述MacKenzie(1998)Crystalstructureofthefamily7endoglucanaseI10(Cel7B)fromif應/co/flf'/wo/e/wat2.2Aresolutionandidentificationofthecatalyticnucleophilebytrappingofthecovalentglycosyl-enzymeintermediate,Biochem.J.335:409-416;Sakon(1997)Structureandmechanismofendo/exocellulaseE4from77jermoMonos/ora/wsca,Nat.Struct.Biol4:810-818;Vaxrot(1999)Crystalstructureofthecatalyticcoredomainofthefamily6cellobiohydrolaseII,Cel6A,ftom/f謂/co/。15/;wo/em,at1.92Aresolution,Biochem.J.337:297-304;舉例說明並鑑定了特定的結構元件,其可用於指導本發明的纖維素酶變體的常規產生,並用於指導鑑別本發明的範圍內的酶種類。本發明的多肽和肽可以分離自天然來源,可以是合成的,或者可以是重組產生的多肽。肽和蛋白可以在體外或體內重組表達。本發明的肽和多肽可以使用20本
技術領域:
已知的任何方法產生和分離。本發明的多肽和肽也可以使用本
技術領域:
熟知的化學方法全部或部分合成。例如參見Caruthers(1980)NucleicAcidsRes.Symp.Ser.215-223;Horn(1980)NucleicAcidsRes.Symp.Ser.225-232;Banga,A.K.,TherapeuticPeptidesandProteins,Formulation,ProcessingandDeliverySystems(1995)TechnomicPublishingCo.,Lancaster,PA。例如,肽合成可以使25用各種固相技術進行(例如參見Roberge(1995)Science269:202;Memfield(1997)MethodsEnzymol.289:3-13),自動合成可以根據製造商提供的說明書來實施,例如使用ABI431A肽合成儀(PerkinElmer)。本發明的肽和多肽也可以是糖基化的,所述糖基化可以在翻譯後通過化學方法或者通過細胞的生物合成機制而加上,其中後者包括應用已知的糖基化作用30基序,所述糖基化作用基序可以對於所述序列是天然的,或者是作為肽段而被加入的,或者是在核酸編碼序列中加入的。糖基化作用可以是O-連接的或者是N-連接的。〖0404]本發明的肽和多肽,如以上所定義的,包括所有的"模擬物(mimetic)"和"肽模擬物(peptidomimetic)"形式。術語"模擬物"和"肽模擬物"是指具有35與本發明的多肽實質上相同的結構和/或功能特徵的合成的化學化合物。該模擬物或者完全由合成的非天然的胺基酸類似物組成,或者是由部分天然的肽胺基酸和部分非天然的胺基酸類似物構成的嵌合分子。所述模擬物也可以包括任意數量的天然胺基酸保守取代,只要這樣的取代本質上不改變該模擬物的結構和/或活性。對於作為保守性變異體的本發明的多肽或一類本發明的多肽的成員(例如,具有與本發明的示例性序列具有大約50%或更高的序列同一性的成員),常規實驗將可以確定一種模擬物是否在本發明的範圍內,艮P,其結構和/或功能並沒有實質上的5改變。因此,一方面,如果一種模擬組合物具有纖維素酶如內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶的活性,那麼它在本發明的範圍內。本發明的多肽模擬組合物可以包含非天然結構成分的任何組合。在可供選擇的方面,本發明的模擬組合物包括以下三種結構基團中的一種或所有a)不是天然醯胺鍵("肽鍵")連接的殘基連接基團;b)取代天然發生的胺基酸殘基的非10天然殘基;或者c)誘導二級結構擬態(mimicry)的殘基,B卩,可以誘導或者穩定二級結構,如P轉角、y轉角、卩摺疊、a螺旋構象,以及類似的結構。例如,當本發明的多肽的所有殘基或者一些殘基通過非天然肽鍵的化學方式連接時,該多肽可以作為模擬物來表徵。各個肽模擬物殘基可以通過肽鍵、其它的化學鍵或者偶聯方式連接,如,通過戊二醛、N-羥基琥珀醯亞胺酯、雙功能馬來醯亞胺、15N,N'-二環己基碳二亞胺(DCC)或者N,N'-二異丙基碳二亞胺(DIC)連接。可以替代傳統的醯胺鍵("肽鍵")連接的連接基團包括,如,酮基亞甲基(如,-<:(=0)-0^-代替-C(-O)-NH-)、氨基亞甲基(CH2-NH)、次乙基、烯烴(CH=CH)、醚(CH2-0)、硫醚(CH2-S)、四唑(CN4-)、噻唑、逆醯胺(retroamide)、硫代醯胺或者酯(參見女口,Spatola(1983)在ChemistryandBiochemistryofAminoAcids,Peptidesand20Proteins,第7巻,267-357頁,"P印tideBackboneModifications"MarcellDekker,NY)。本發明的多肽也可以通過含有全部或者部分替代了天然發生的胺基酸殘基的非天然胺基酸殘基而被表徵為模擬物。在科學和專利文獻中描述了非天然的殘基;作為天然胺基酸殘基的模擬物的一些典型的非天然化合物及指導在下面有25描述。芳香族胺基酸的模擬物可以通過用以下的取代來產生,如,D-或L-萘基丙氨酸;D-或L-苯基甘氨基,D-或L-2thieneyl丙氨酸;D-或L-l,-2,3-或4-芘基丙氨酸;D-或L-3thieneyl丙氨酸;D-或L-(2-吡啶基)-丙氨酸;D-或L-(3-吡啶基)-丙氨酸;D-或L-(2-吡嗪基)-丙氨酸,D-或L-(4-異丙基)-苯基甘氨酸;D-(三氟甲基)-苯基甘氨酸;D-(三氟甲基)-苯基丙氨酸;D-p-氟-苯基丙氨酸;D-或L-p-二苯基苯30基丙氨酸;D-者L-p-甲氧基-二苯基苯基丙氨酸;D-或L-2-吲哚(烷基)丙氨酸;和,D-或L-烷基丙氨酸,其中的烷基可以是取代的或非取代的甲基、乙基、丙基、己基、丁基、戊基、異丙基、異丁基、仲異基(sec-isotyl)、異戊基或者非酸性胺基酸。非天然胺基酸的芳香環包括,如噻唑基、苯硫基、吡唑基、苯並咪唑基、萘基、呋喃基、吡咯基和吡啶基芳香環。35酸性胺基酸的模擬物可以通過用以下的取代來產生,如,保持有負電荷的非羧酸胺基酸;(膦醯基)丙氨酸;硫酸化的蘇氨酸。羧基側鏈(如,天冬氨醯基或者穀氨醯基)也可以通過與碳二亞胺(R'-N-C-N-R')反應進行選擇性的修飾,所述碳二亞胺如l-環己基-3(2-嗎啉基-(4-乙基)碳二亞胺或者l-乙基-3(4-氮鏡4,4-二甲基戊基)碳二亞胺。天冬氨醯基或者穀氨醯基也可以通過與銨離子反應轉化為天冬醯胺醯基和穀氨醯胺醯基。鹼性胺基酸的模擬物可以通過用如,(除了賴氨酸和5精氨酸外)鳥氨酸、瓜氨酸、或者(胍基)-乙酸,或者(胍基)烷基-乙酸的取代產生,其中烷基如以上定義。腈衍生物(如,含有取代COOH的CN-部分)可以取代天冬醯胺或者穀氨醯胺。天冬醯胺醯基和穀氨醯胺醯基可以脫氨基成為相應的天冬氨醯基或者穀氨醯基。精氨酸殘基模擬物可以通過精氨醯基與例如一種或者多種常規試劑一方面在鹼性的條件下反應而產生,所述的常規試劑包括如苯乙二醛、102,3-丁二酮、1,2-環己二酮或者茚三酮。酪氨酸殘基模擬物可以通過酪氨醯基與例如芳香重氮化合物或者四硝基甲垸反應而產生。N-acetylimidizol和四硝基甲烷可以分別用於形成O-乙醯基酪氨醯物質和3-硝基衍生物。半胱氨酸殘基模擬物可以通過半胱氨醯殘基與例如a-離素乙酸例如2-氯乙酸或者氯乙醯胺和相應的胺反應而產生;得到羧甲基或者羧醯胺甲基衍生物。半胱氨酸殘基模擬物也可以通過半15胱氨醯殘基與例如溴代-三氟丙酮、a-溴-l3-(5-imidozoyl)丙酸;氯乙醯磷酸、N-烷基馬來醯亞胺、3-硝基-2-吡啶基二硫化物;甲基2-吡啶基二硫化物;p-氯汞苯甲酸鹽;2-氯滎-4硝基苯酚,或者,氯-7-硝基苯並-氧雜-l,3-二唑反應而產生。可以通過賴氨醯基與例如琥珀酸或者其它的羧酸酸酐反應而產生賴氨酸模擬物(和改變氨基末端殘基)。賴氨酸和其它的含有a-氨基的殘基模擬物也可以通過與亞氨酸酯20例如methylpicolinimidate、磷酸吡哆醛、吡哆醛、氯硼氫化物、三硝基-苯磺酸、O-甲基異脲、2,4,戊二酮的反應,和與乙醛酸的轉醯胺基酶催化的反應而產生。甲硫氨酸的模擬物可以通過與例如甲硫氨酸亞碸反應而產生。脯氨酸的模擬物包括,例如,2-哌啶酸、四氫噻唑羧酸、3-或4-羥脯氨酸、脫氫脯氨酸、3-或4-甲基脯氨酸,或者3,3,-二甲基脯氨酸。組氨酸殘基模擬物可以通過組氨醯基與例如二乙基25原碳酸酯或對溴苯甲醯甲基溴化物反應而產生。其它的模擬物包括,例如,由脯氨酸和賴氨酸的羥基化作用產生的模擬物;由絲氨醯或者蘇氨醯的羥基的磷酸化作用產生的模擬物;由賴氨酸、精氨酸和組氨酸的a氨基基團的甲基化作用產生的模擬物;由N-末端胺的乙醯化作用而產生的模擬物;由主鏈醯胺殘基的甲基化或用N-甲基胺基酸取代而產生的模擬物;或者,由C-末端羧基的醯胺化而產生的30模擬物。—方面,本發明的多肽的殘基例如胺基酸也可以用相反手性的胺基酸(或者肽模擬物殘基)替代。一方面,任何天然發生的L-構型(也可以被稱為R或者S,取決於化學實體的結構)的任何胺基酸都可用相同化學結構類型但是具有相反手性的胺基酸或者肽模擬物替代,相反手性的胺基酸稱為D-胺基酸,但也可以稱35R-或者S-型。本發明也提供了通過天然過程,如,翻譯後加工(如,磷酸化,醯化以及類似作用)或者通過化學修飾技術來修飾本發明的多肽的方法,以及得到的被修飾的多肽。修飾可以發生在所述多肽的任何地方,包括肽骨架、胺基酸側鏈和氨基端或者羧基端。可以理解,相同類型的修飾可以在已知的多肽中以相同的或者不同的水平在幾個位點處發生。一個給定的多肽也可以具有很多類型的修飾。一5方面,修飾包括乙醯化、醯化作用、ADP-核糖基化作用、醯胺化作用、共價連接核黃素、共價連接血紅素組分、共價連接核苷酸或核苷酸衍生物、共價連接脂質或脂質衍生物、共價連接磷脂醯肌醇、交聯的環化作用、形成二硫鍵、去甲基作用、形成共價交聯、形成半胱氨酸、形成焦穀氨酸、甲醯基化作用、,羧化作用、糖基化作用、形成GPI錨、羥基化作用、碘化作用、甲基化作用、肉豆蔻醯基化10作用、氧化作用、聚乙二醇化、蛋白水解處理、磷酸化作用、異戊烯作用、外消旋作用、硒化作用、硫酸鹽化作用,和轉移RNA介導胺基酸添加到蛋白質中,如精氨醯化。參見,如,Creighton,T.E.,Proteins-StructureandMolecularProperties2ndEd.,W.H.Freeman禾口Company,NewYork(1993);PosttranslationalCovalentModificationofProteins,B.C.Johnson,Ed.,AcademicPress,NewYork,11-12頁15(1983)。固相化學肽合成方法也可以用於合成本發明的多肽或者片段。這樣的方法自二十世紀六十年代早期起就是本領域已知的方法(Merrifield,R.B.,J.Am.Chem.Soc.,85:2149-2154,1963)(也參見Stewart,J.M.和Young,J.D.,SolidPhasePeptideSynthesis,第二版,PierceChemicalCo.,Rockford,III,11-12頁),並且這些方20法近來已經可以通過商業上可獲得的實驗室肽設計和合成試劑盒(CambridgeResearchBiochemicals)而被應用。這樣的商業上可獲得的實驗室試劑盒一般是利用H.M.Geysen等,Proc.Natl.Acad.Sci.,USA,81:3998(1984)的方法,它們讓肽合成在多個"杆(rods)"或者"釘(pins)"的頂端進行,而所有的"杆"或者"釘"都被連接到一塊板上。當使用這樣的系統時,一個板的杆或者釘被倒轉並插入到25另一個板的相應孔或者貯存器中,所述孔或者貯存器含有用於將一種適合的胺基酸附著或固定在杆或釘的頂端的溶液。通過重複這樣的處理步驟,即是,反轉和插入所述杆和釘的頂端至適當的溶液中,將胺基酸構建成所要的肽。此外,大量的可利用的FMOC肽合成系統是可利用的。例如,應用AppliedBiosystems,Inc.的Model431A自動肽合成儀可以在固體支持物上裝配多肽或者片段。這些設備30使得本發明的肽容易獲得,或者通過直接的合成或者通過用其它已知的技術將一系列片段偶聯起來的合成。本發明的多肽包括活性或非活性形式的纖維素酶,例如,內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶。例如,本發明的多肽包括在"成熟"或例如通過蛋白原加工酶如蛋白原轉化酶來產生"活性"的成熟蛋白來加工35前原序列之前的蛋白原。本發明的多肽包括由於其它原因而不具有活性的纖維素酶,如內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶,所述其它原因例如在通過翻譯後加工事件諸如內切或外切肽酶或蛋白酶作用、磷酸化事件、醯胺化、糖基化或硫酸化或二聚化事件等等進行"活化"之前。本發明的多肽包括所有的活性形式,包括酶的活性子序列,例如,催化結構域或活性位點。本發明包括固定化的纖維素酶如內切葡聚糖酶、纖維二糖水解酶、甘露聚5糖酶和/或P-葡糖苷酶,抗纖維素酶抗體如抗內切葡聚糖酶抗體、抗纖維二糖水解酶抗體、抗甘露聚糖酶抗體和/或抗P-葡糖苷酶抗體及其片段。本發明提供了抑制纖維素酶如內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或p-葡糖苷酶活性的方法,例如使用本發明的顯性負突變體或抗纖維素酶抗體,如抗內切葡聚糖酶抗體、抗纖維二糖水解酶抗體、抗甘露聚糖酶抗體和/或抗卩-葡糖苷酶抗體。本發明10包括含有本發明的纖維素酶如內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或p-葡糖苷酶的雜合物(異源複合物),例如融合蛋白、異二聚體等等。本發明的多肽可以在多種不同的條件下具有纖維素酶如內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶活性,例如極端pH和/或溫度、氧化劑以及類似的條件。本發明提供了產生可供選擇的纖維素酶如內切葡聚糖酶、纖15維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶製劑的方法,所述製劑具有不同的催化效率和穩定性,例如針對溫度、氧化劑和改變洗滌條件。一方面,纖維素酶如內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或p-葡糖苷酶變異體可以使用定點誘變和/或隨機誘變的技術來產生。一方面,定向進化可以被用來產生大量不同的具有可供選擇的特異性和穩定性的纖維素酶如內切葡聚糖酶、纖維二糖水解酶、20甘露聚糖酶和/或P-葡糖苷酶變異體。本發明的蛋白也可用作研究試劑,以鑑定纖維素酶如內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶的調節物,例如纖維素酶如內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶活性的激活劑或抑制劑。簡單的說,將測試樣品(化合物、培養液、提取物和類似物)加入到纖維素酶如內切25葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶測定中,以確定它們抑制底物切割的能力。用該方式鑑定的抑制劑可用於工業和研究中,以減少或阻止不期望的蛋白水解。如同纖維素酶如內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶的情況,抑制劑可以被組合以增加活性譜。本發明的酶也可用作消化蛋白質的研究試劑或用在蛋白測序中。例如,為30了使用例如自動測序儀進行測序,可以使用纖維素酶如內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶將多肽破碎成更小的片段。本發明的另一個方面是用於鑑定本發明的片段或變異體的分析方法,所述本發明的片段或變異體保留了本發明的的多肽的酶功能。例如,所述多肽的片段20或變異體可用來催化生物化學反應,這樣的反應表明所述片段或變異體保留了本發明的多肽的酶活性。確定變體或片段是否保留本發明的多肽的酶活性的示例性測定方法包括下面的步驟將多肽片段或變異體與底物分子在允許該多肽片段或變異體發揮作用的條件下接觸,並檢測底物水平的降低或該多肽和底物之間反應的特異反應產物水平的增加。25本發明開發了酶的獨特的催化性質。鑑於生物催化劑(即,純化的或者粗製的酶,非存活的或者存活的細胞)在化學轉化中的應用一般需要確定與特定的起始化合物反應的特定的生物催化劑,本發明應用的經選擇的生物催化劑和反應條件是對於存在於很多起始化合物如小分子中的功能基團具有特異性的。每種生物催化劑對於一種功能基團或者幾種相關的功能基團是特異的,並且可以和含有30這一功能基團的許多起始化合物反應。生物催化反應可以從單一的起始化合物生產出一個群體的衍生物。這些衍生物可以進行另一輪的生物催化反應來產生又一個群體的衍生化合物。通過生物催化的衍生作用的每一次迭代可以產生起始化合物的數千種變化。酶可以在起始化合物的特定位點發生反應而不影響分子的其它部分,該過35程通過傳統的化學方法很難實現。這種高度的生物催化特異性提供了用於在文庫中鑑定單個活性化合物的方法。該文庫是通過用於產生該文庫的一系列生物催化反應來表徵,這也稱為"生物合成歷史"。對該文庫的生物活性的篩選和對生物合成歷史的追蹤確定出產生活性化合物的特定反應順序。重複該反應順序,並確認合成出的化合物的結構。這種確認方式,不同於其它的合成和篩選方法,並不需要固定化技術,化合物可以利用實際上任何類型的篩選分析在溶液中自由合成和5測試。重要的是,注意到酶反應在功能基團上的高度特異性允許"追蹤"特定的酶促反應,由所述酶促反應製備出了生物催化產生的文庫。—方面,許多程序化的步驟可使用自動化機器人來實施,這使得每天可執行數千個生物催化反應和篩選分析,並保證高水平的準確性和可重複性。自動化機器人也可用於篩選纖維素酶活性,以確定多肽是否在本發明的範圍內。結果,10—方面,在幾周內便產生了衍生化合物的文庫,而採用"傳統"的化學或酶促篩選方法則需要幾年的時間。在一個特定的方面,本發明提供了修飾小分子的方法,包括將在此所述的由多核苷酸編碼的多肽或其酶活性片段與小分子接觸,產生修飾的小分子。檢測被修飾的小分子的文庫以確定顯示出所需活性的修飾小分子是否存在於文庫內。15產生具有所需活性的修飾小分子的特異性生物催化反應的鑑定可通過系統性地去除用來產生一部分文庫的每個生物催化反應,然後檢測在這一部分文庫中產生的小分子是否存在具有所需活性的修飾小分子。產生具有所需活性的修飾小分子的特異生物催化反應可任選地被重複。生物催化反應可用一組生物催化劑來進行,它們可與在小分子的結構中發現的各種不同結構部分反應,每個生物催化劑對一20個結構部分或一組相關的結構部分是特異的;每個生物催化劑可與含有各種不同的結構部分的許多不同的小分子反應。勞録艨射娜覆総雜二蘑蕭麟/雞薪薪雜虔號艦歸翁鄉雌眾薪雌25本發明提供了纖維素酶如內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶信號序列(例如信號肽(SPs))、前原(prepro)結構域和催化結構域(CDs)。本發明的SPs、前原結構域和/或CDs可以是分離的或重組的肽或可以是融合蛋白的一部分,例如作為嵌合蛋白中的異源結構域。本發明提供了編碼這些催化結構域(CDs)、前原結構域和信號序列(SPs,例如具有包括本發明的多肽30的氨基末端殘基或由本發明的多肽的氨基末端殘基組成的序列的肽)的核酸。本發明提供了分離或重組的信號序列(例如,信號肽),該信號序列包括下列序列或由下列序列組成,所述序列如本發明的多肽的殘基1到14、1到15、1到16、1到17、1到18、1到19、1到20、1到21、1到22、1到23、1到24、1到25、l至lj26、1到27、1到28、1到28、1到30、1到31、1到32、1到33、135到34、1到35、1到36、1到37、1到38、1到39、1到40、1到41、1到42、1到43、1到44、1到45、1到46或1到47或更多殘基所示的序列,本發明多肽例如,本發明的示例性多肽,也參見表3、下面的實施例1和4以及序列表。例如,上面的表3示出了本發明的示例性信號(前導)序列,例如,對於具有如SEQIDNO:164所示序列的多肽——其例如由SEQIDNO:163編碼,具有的信號序列含有氨基末端30個殘基(或由氨基末端30個殘基組成)或者具有下列序列或由下列5序列組成MSCRTLMSRRVGWGLLLWGGLFLRTGSVTG。其它的信號序列同樣列在表3中。—方面,本發明提供了信號序列,其包括本發明的多肽的前14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、1053、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70或更多個氨基末端殘基。本發明包括具有和沒有信號序列和/或前原序列的多肽。本發明包括具有異源信號序列和/或原前序列的多肽。前原序列(包括用作異源前原結構域的本發明序列)可以位於蛋白質的氨基末端或羧基末端。本發明還包括分離或重組的含有15本發明序列的信號序列、前原序列和催化結構域(例如,活性位點)。所述含有本發明的信號序列的多肽可以是本發明的纖維素酶如內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或p-葡糖苷酶,或另一種纖維素酶,例如內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶,或另一種或其它多肽。鑑定"前原"結構域和信號序列的方法在本領域是熟知的,例如VandeVen(1993)Crit.Rev.20Oncog.4(2):115-136。例如,為了鑑定前原序列,從胞外空間純化出蛋白質,確定其N末端蛋白序列,並將其與未加工的形式進行比較。本發明的纖維素酶如內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或|3-葡糖苷酶信號序列(SP)和/或前原序列可以是分離的或重組的肽,或與另一種纖維素酶如內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶或非纖維25素酶如非內切葡聚糖酶、非纖維二糖水解酶、非甘露聚糖酶和/或非P-葡糖苷酶多肽連接的序列,例如形成融合(嵌合)蛋白。在一個方面,本發明提供了含有本發明的纖維素酶如內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶信號序列的多肽。在一個方面,含有本發明的纖維素酶如內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或(3-葡糖苷酶信號序列SP和/或前原序列的多肽包含與30本發明的纖維素酶如內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或p-葡糖苷酶異源的序列(例如,含有本發明的SP和/或前原序列和來自另一種纖維素酶如內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶或非纖維素酶如非內切葡聚糖酶、非纖維二糖水解酶、非甘露聚糖酶和/或非P-葡糖苷酶蛋白的序列的融合蛋白)。在一個方面,本發明提供了具有異源SP和/或前原序列的本發明的纖35維素酶如內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或(3-葡糖苷酶,例如具有酵母信號序列的序列。本發明的纖維素酶如內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶可以含有存在於載體例如pPIC系列載體(Invitrogen,Carlsbad,CA)中的異源SP和/或前原序列。在一個方面,本發明的SP和/或前原序列在鑑定出新的纖維素酶如內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或p-葡糖苷酶之後被鑑定出來。蛋白被5分選和轉運至其正確的細胞位置的通路通常被稱為蛋白靶向通路(proteintargetingpathways)。在所有這些靶向系統中最重要的元件之一是新合成的多肽的氨基末端上的短的胺基酸序列,稱為信號序列。這種信號序列可指引蛋白至其在細胞中的適合位置,並在轉運過程中或在蛋白到達其最終目的地時被去除。大多數的溶酶體蛋白、膜蛋白或分泌蛋白都具有氨基末端信號序列,這些信號序列標示著它們10將轉位至內質網腔內。信號序列的長度可以為從10至65或更多個胺基酸殘基。識別信號序列的各種方法對於本領域技術人員是已知的。例如,在一個方面,新的纖維素酶如內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或p-葡糖苷酶的信號肽可通過稱為SignalP的方法來鑑定。SignalP應用了既可識別信號肽,又可識別其裂解位點的組合神經網絡。(Nielsen(l997),"Indentificationofprokaryoticand15eukaryoticsignalpeptidesandpredictionoftheircleavagesites"ProteinEngineering,巻10,1,1-6頁)。在一些方面,本發明的纖維素酶如內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或p-葡糖苷酶沒有SP和/或前原序列,或"結構域"。在一個方面,本發明提供了缺少所有或部分的SP和/或前原結構域的本發明的纖維素酶如內切葡聚20糖酶、纖維二糖水解酶、甘露聚糖酶和/或p-葡糖苷酶。在一個方面,本發明提供了編碼來自一種纖維素酶如內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或卩-葡糖苷酶的信號序列(SP)和/或前原序列的核酸序列,其可操作地連接於一種不同的纖維素酶如內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶的核酸序列,或者,可選擇地,來自非纖維素酶如非內切葡聚糖酶、非纖維二糖水25解酶、非甘露聚糖酶和/或非J3-葡糖苷酶蛋白的信號序列(SP)和/或前原結構域可以是期望的。本發明也提供了分離出的或重組的多肽,其含有本發明的信號序列(SP)、前原結構域和/或催化結構域(CD)和異源序列。所述異源序列是與SP、前原結構域和/或CD天然不相關的序列。與SP、前原結構域和/或CD天然不相關的序列30可以在SP、前原結構域和/或CD的氨基末端、羧基末端,和/或SP和/或CD的兩個末端上。在一個方面,本發明提供了分離出的或重組的多肽,其包括(或構成於)含有本發明的信號序列(SP)、前原結構域和/或催化結構域(CD)的多肽,條件是它同與其天然相關的任何序列(例如,纖維素酶如內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶序列)是不連接的。同樣,在一個方面,35本發明提供了編碼這些多肽的分離出的或重組的核酸。因此,在一個方面,本發明的分離出的或重組的核酸包括本發明的信號序列(SP)、前原結構域和/或催化結構域(CD)的編碼序列和異源序列(即,與信號序列(SP)、前原結構域和/或催化結構域(CD)天然不相關的序列)。異源序列可在SP、前原結構域和/或CD編碼序列的3'末端、5'末端和/或兩個末端上。5染爻f詼^)^T^牽^^fii7^坊薪Jlg^艨、好鍵二薪j麻錄浙/或A-薪凝存艨浙嚴文庫—方面,本發明提供了包含本發明的序列的雜合纖維素酶如內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或卩-葡糖苷酶和融合蛋白,包括肽庫。本發明的肽庫可以用於分離目標的肽調節物(如,激活物或者抑制物),如纖維素酶如10內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或p-葡糖苷酶底物、受體、酶。本發明的肽庫可以用於鑑定目標的結合配偶,如,配體,例如,細胞因子、激素以及類似物。一方面,本發明提供了含有本發明的信號序列(SP)、前原序列和/或催化結構域(CD)或其組合以及異源序列的嵌合蛋白質(見上)。—方面,本發明的融合蛋白(如,肽部分)是構象穩定的(相對於線形肽),15對靶標具有更高的結合親和性。本發明提供了本發明的纖維素酶如內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或卩-葡糖苷酶與其它肽的融合,所述其它肽包括已知的肽和隨機的肽。它們可以以這樣一種方式融合,使得所述纖維素酶如內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或卩-葡糖苷酶的結構沒有明顯地被擾舌L,並且該肽在代謝上或者結構構象上是穩定的。這樣便允許獲得這樣的肽庫,20其在細胞內的存在及其數量都是容易監測的。本發明的胺基酸序列變異體可以通過該變異的預先確定的性質來表徵,所述的預先確定的性質也就是將它們與天然發生的形式區分開的特徵,所述的天然發生的形式例如纖維素酶如內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或卩-葡糖苷酶序列的等位基因的或者種間的變異。一方面,本發明的變異體表現出與25天然發生的類似物相同性質的生物活性。可選擇地,可以選擇具有改變的特徵的變異體。一方面,儘管引入胺基酸序列變化的位點或區域是預先決定的,但突變本身並不需要預先決定。例如,為了優化在一個給定位點出現的突變所帶來的性能,可以在目標密碼子或者區域進行隨機誘變,並篩選被表達的纖維素酶如內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶變異體,以尋找所需活30性的優化組合。在具有已知序列的DNA的預先決定的位點產生取代突變的技術是己熟知的,正如在此討論的,例如,M13引物誘變和PCR誘變。突變體的篩選可以通過應用例如葡聚糖水解分析來進行。在可供選擇的方面,胺基酸取代可以是單個殘基;插入可以是大約1到20個胺基酸的水平,儘管可以插入相當大的片段。缺失的範圍可以是大約1到大約20、30、40、50、60、70個殘基或者更多。為了35得到具有優化性質的最終衍生物,替代、缺失、插入或者它們的任何組合都可以被應用。一般地,這些變化是在為數不多的胺基酸上進行,以使分子的改變最小化。然而,在某些情況下,可以容忍更大的改變。本發明提供了纖維素酶如內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶,其中多肽骨架的結構、二級結構或三級結構,例如,a螺旋或P摺疊結構,已被修飾。一方面,電荷或疏水性已被修飾。一方面,側鏈基團已被5修飾。通過選擇較不保守的取代來產生功能或免疫性的實質變化。例如,可以進行這樣的取代,它們將更加顯著地影響發生變化的區域的多肽骨架的結構,例如a螺旋或(3摺疊結構;分子的電荷或疏水位點,其可以是活性位點;或側鏈。本發明提供在本發明的多肽中的取代,其中(a)親水殘基,例如絲氨醯或蘇氨醯,被疏水殘基例如亮氨醯、異亮氨醯、苯基丙氨醯、纈氨醯或丙氨醯取代,或者相10反;(b)半胱氨酸或脯氨酸被任何別的殘基取代,或者相反;(C)具有正電性側鏈的殘基,例如賴氨醯、精氨醯或組氨醯被帶負電的殘基例如穀氨醯或天冬氨醯取代,或者相反;或者(d)具有大體積側鏈的基團,例如苯丙氨酸,被不具側鏈的胺基酸例如甘氨酸取代,或者相反。所述變異體可以表現出相同性質的生物學活性(即,纖維素酶如內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或p-葡糖15苷酶活性),儘管變異體可經選擇來按需改變纖維素酶如內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或p-葡糖苷酶的特徵。—方面,本發明的纖維素酶如內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或j3-葡糖苷酶包括表位(epitopes)或者純化標記、信號序列或其它的融合序歹ij,等。在一方面,本發明的纖維素酶如內切葡聚糖酶、纖維二糖水解酶、甘露20聚糖酶和/或p-葡糖苷酶可以與隨機的肽融合,形成融合多肽。"融合"或者"可操作地連接"在此是指隨機肽和纖維素酶如內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或p-葡糖苷酶連接在一起,其連接方式最小化了對纖維素酶如內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或p-葡糖苷酶的結構的穩定性的破壞,例如,其仍保持纖維素酶如內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡25糖苷酶活性。所述的融合多肽(或者編碼該融合多肽的融合多核苷酸)還可以包含進一歩的成分,包括在多個環(multipleloops)處的多個肽。—方面,所述肽和編碼它們的核酸被隨機化,或者是被完全隨機化的,或者是在它們的隨機化中有偏向,例如,在核苷酸/殘基的總的頻率或者每個位置處的頻率方面有偏向。"隨機化"是指每一核酸和肽分別由實質上隨機的核苷酸和氨30基酸組成。一方面,產生所述肽的所述核酸可以化學合成,從而可以在任何位置整合進任何核苷酸。因此,當所述核酸被表達而形成肽時,任何胺基酸殘基可以整合進任何位置。可以設計合成過程來產生隨機化的核酸,從而允許在所述核酸的長度範圍內形成所有的或大多數的可能組合,由此形成隨機核酸文庫。該文庫可以提供足量的結構多樣的隨機化表達產物群體,可以獲得概率上充分的細胞響35應範圍,從而可以提供一種或多種表現出所需響應的細胞。因此,本發明提供了一個足夠大的相互作用文庫,這樣,其成員中的至少一個將具有使其對於一些分子、蛋白或者其他因子具有親和性的結構。—方面,本發明的纖維素酶如內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或|3-葡糖苷酶是多結構域的酶,其包括信號肽、糖類結合模塊(module)、纖維素酶如內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或(3-葡糖苷酶催化結構5域、連接子(linker)和/或另一個催化結構域。本發明提供了產生可以編碼生物學活性雜合多肽(例如,雜合纖維素酶如內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或p-葡糖苷酵)的嵌合多肽的方法和序列。在一個方面,原始的多核苷酸(例如,本發明的示例性核酸)編碼生物學活性的多肽。一方面,本發明的方法通過利用細胞內過程產生了新的雜合多10肽,所述的細胞內過程可整合原始多核苷酸序列,這樣,得到的雜合多核苷酸編碼證明具有源自但不同於原始生物學活性多肽的活性的多肽(例如,本發明的纖維素酶或抗體)。例如,原始的多核苷酸可以編碼來自或發現於不同微生物的特定酶(例如,纖維素酶)。由來自一個生物體或變異體的第一多核苷酸編碼的酶可以,例如,在特殊的環境條件下,例如,高鹽條件下,有效地發揮功能。來自不同生15物體或變異體的第二多核苷酸編碼的酶可在不同的環境條件下,如超高溫條件下,有效地發揮功能。含有來自第一和第二原始多核苷酸的序列的雜合多核苷酸編碼的酶可以顯示了原始多核苷酸編碼的兩種酶的特性。因此,本發明的雜合多核苷酸編碼的酶可在第一和第二多核苷酸編碼的酶所共有的環境條件下,例如高鹽和極端溫度下,有效地發揮功能。20—方面,由本發明的方法得到的雜合多肽可顯示出在原始酶中不具有的特殊酶活性。例如,在編碼纖維素酶如內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶的多核苷酸重組和/或進行還原性重配後,從得到的由雜合多核苷酸編碼的雜合多肽中可篩選出由各個原始酶獲得的特異非纖維素酶例如非內切葡聚糖酶、非纖維二糖水解酶、非甘露聚糖酶和/或非P-葡糖苷酶活性,例如,水25解酶、肽酶、磷酸化酶等活性。一方面,雜合多肽被篩選以確定那些可區分雜合多肽和原始親本多肽的化學功能性,如雜合多肽發揮作用的溫度、pH或鹽濃度。—方面,本發明涉及一種用於產生具有生物活性的雜合多肽以及篩選具有更高活性的多肽的方法,通過1)以可操縱的連接導入至少第一多聚核苷酸和以可操縱的連接導入至少第二30多聚核苷酸到合適的宿主細胞,所述的至少第一多聚核苷酸和第二多聚核苷酸共有具有部分的序列同源性的至少一個區域;2)在促進序列再組織的條件下培養宿主細胞,得到可操縱連接的雜合多核苷酸;3)表達由所述雜合多核苷酸編碼的雜合多肽;354)在有利於鑑定增強的生物活性的條件下篩選所述的雜合多肽;和5)分離編碼該雜合多肽的多核苷酸。分離和發現纖維素酶本發明提供了分離和發現纖維素酶例如內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或p-葡糖苷酶以及編碼它們的核酸的方法。多核苷酸或酶可以分離5自個體生物體("分離物")、己經生長在成分確定的培養基中的生物體收集物("富集培養物"),或者未經培養的生物體("環境樣品")。生物體可以通過例如體內生物淘選進行分離(參見下面的討論)。應用不依賴於培養物的方法從環境樣品獲得編碼新的生物活性的多核苷酸是最優選的,因為這樣便可接觸到具有生物多樣性的原始來源。多核苷酸或酶也可以分離自許多生物體的任何一種,例如細菌。除10了全細胞之外,多核苷酸或酶也可以分離自來源於這些生物體例如細菌的培養物的粗酶製劑。"環境文庫"可以從環境樣品中獲得,其代表天然發生的生物體的基因組集合,這些"環境文庫"可以用克隆載體完成,所述克隆載體可以在適合的原核宿主中擴增繁殖。因為被克隆的DNA起初是直接從環境樣品中提取的,所以所述15文庫並不限於可以在純培養物中生長的小部分原核生物。另外,存在於這些樣品中的來自環境的DNA的標準化使其可以更加公正地代表存在於原始樣品的所有物種的DNA。這可以大大增加從所述樣品的次要組成中發現令人感興趣的基因的效率,所述次要組成與優勢種相比,其所佔的量可能小几個數量級。—方面,從一個或者多個未經培養的微生物中獲得的基因文庫被篩選以發20現感興趣的活性。編碼感興趣的生物活性分子的潛在途徑首先在原核細胞中以基因表達文庫的形式捕獲。一方面,編碼令人感興趣的活性的多核苷酸從這樣的文庫中分離出來並導入到宿主細胞中。該宿主細胞在促進重組和/或還原性重配的條件下生長,產生潛在的具有新的或者增強的活性的生物分子。可利用基於FACS和基於非光學(例如,磁性)的儀器進行體內生物淘選。25—方面,用載體構建複雜基因文庫,所述載體含有穩定轉錄的RNA的元件。例如,含有這樣的序列將用於增強RNA的穩定性,從而增加它們在細胞中的半衰期,所述序列形成二級結構,例如髮夾結構,其被設計來位於轉錄的RNA區的側翼。用於生物淘選過程中的探針分子由用報告分子標記的寡核苷酸組成,所述報告分子僅在探針與靶分子結合後發螢光。使用幾種轉化技術的一種,這些探針被引入文30庫中的重組細胞。所述探針分子結合到轉錄的靶mRNA,得到DNA/RNA異源雙鏈體分子。探針與靶標結合將產生螢光信號,該信號在篩選過程期間用FACS儀器檢測和分選。—方面,可進行亞克隆以進一步分離感興趣的序列。在亞克隆中,DNA的一部分被擴增、消化——通常是通過限制性酶——以剪切所需的序列,所需的35序列被連接進接受載體中,並被擴增。在亞克隆的每個步驟中,該部分被檢測感興趣的活性,以保證編碼結構蛋白的DNA不被排除。插入物可在亞克隆的任何步驟中被純化,例如在連接入載體之前通過凝膠電泳,或在含有接受載體的細胞和不含有接受載體的細胞被置於選擇性培養基中時,所述培養基含有例如抗生素,其可殺死不含有接受載體的細胞。將cDNA插入物亞克隆進載體中的具體方法在本領域中是為人所熟知的(Sambrook等人,MolecularCloning:ALaboratory5Mannual,第二版,ColdSpringHarborLaboratoryPress(1989))。在另一個方面,本發明的酶是亞克隆。這種亞克隆與親代克隆的差別在於,例如,長度、突變、標誌物(tag)或標記(label)。可以發現、分離或製備所述多核苷酸的微生物包括原核微生物如真細菌和古細菌,低等真核微生物如真菌、一些藻和原生動物。多核苷酸可以是發現於、10分離自或製備於環境樣品,在這種情況下,核酸被回收而不需培養某一種生物體,或者是從一種或者多種培養的生物中回收。在一方面,這樣的微生物可以是適於極端環境的,如,嗜高溫的、嗜冷的、冷育的、嗜鹽的、嗜壓的和嗜酸的。編碼從極端微生物中分離出來的酶的多核苷酸可以被應用。本發明的酶可以超過100'C的溫度有作用,例如在地表溫泉和深海的熱火山口發現的那些,或者在低於O'C的15溫度有作用,例如在北極水域中發現的那些,在飽和的鹽環境下有作用,例如在死海中發現的那些,在pH值在0附近起作用,例如在煤層沉積物和地熱富硫礦泉中發現的那些,或者在pH值超過11下起作用,例如在汙水汙泥中發現的那些。一方面,本發明的酶在很寬的溫度和pH範圍內表現出高活性。如上所述的選擇和分離的多核苷酸被導入進合適的宿主細胞中。合適的宿20主細胞是能夠促進重組和/或還原性重配的任何細胞。被選擇的多核苷酸一方面已經在包括有合適的控制序列的載體中。宿主細胞可以是高等的真核細胞,如哺乳動物細胞,或低等真核細胞,如酵母細胞,或一方面,宿主細胞可以是原核細胞,如細菌細胞。將構建物導入宿主細胞可通過磷酸鈣轉染、DEAE-葡聚糖介導的轉染,或電穿孔來實現。25示例性的宿主包括細菌細胞,如大腸桿菌、鏈黴菌、鼠傷寒沙門氏菌;真菌細胞,如酵母;昆蟲細胞如果蠅S2和草地夜蛾Sy9;動物細胞如CHO、COS或者黑色素瘤細胞;腺病毒和植物細胞;參見上面的討論。通過本文的教導,選擇適合的宿主被認為是在本領域技術人員已知的範圍內。各種哺乳動物細胞培養系統可以用於表達重組蛋白;哺乳動物表達系統的30例子包括猴腎纖維原細胞的COS-7細胞系,其在"SV40-transformedsimiancellss叩portthereplicationofearlySV40mutants"(Gluzman,1981)中有說明,禾卩其它的可以表達相容性載體的細胞系,例如,C127、3T3、CHO、HeLa和BHK細胞系。哺乳動物表達載體將包括複製起點、合適的啟動子和增強子,以及任何必要的核糖體結合位點、多聚腺苷酸化的位點、剪接供體和受體位點、轉錄終止序列,35以及5'側翼的非轉錄序列。源於SV40剪接的DNA序列和多聚腺苷酸化的位點可以用於提供所需的非轉錄的遺傳學元件。另一方面,本發明的核酸、多肽和方法可以用於生物化學途徑中,或用於產生編碼來自一個或者多個操縱子或者基因簇或者其中的部分的生物化學途徑的新的多核苷酸。例如,細菌和很多真核生物具有用於調控基因的協作機制,所述基因的產物涉及相關的過程。基因成簇排列在單一染色體上,在結構上稱為"基5因簇",它們在單個調控序列的控制下一起轉錄,所述調控序列包括起始整個簇的轉錄的單個啟動子。因此,基因簇是指一組或者相同或者相關的相鄰基因,一般是指功能上相關的鄰近的基因(通過基因簇編碼的生物化學途徑的一個例子是聚酮化合物(polyketides))。—方面,基因簇DNA可以從不同的生物體中分離出來並且連接到載體中,10尤其是含有表達調控序列的載體,所述表達控制序列可以控制和調控可檢測蛋白或者來自連接在一起的基因簇的蛋白相關系列活性的產生。對於外源DNA引入具有非常大的容量的載體特別適合用於這樣的基因簇的情況,在這裡通過括大腸桿菌的f-因子(或者致育因子)的例子加以說明。大腸桿菌的f-因子是一種質粒,在接合過程中它能實現自身的高頻率轉移,f-因子對於獲得和穩定擴增大DNA片段,15如來自混合的微生物樣品的基因簇是理想的。一個發明是使用被稱作"fos-質粒"的克隆載體,或者細菌人工染色體(BAC)載體。它們是源於大腸桿菌f因子,可以穩定地整合大的基因組DNA片段。當整合來自混合的未經過培養的環境樣品的DNA時,這就有可能得到以穩定的"環境DNA文庫"形式存在的大的基因組片段。用於本發明的另一類型的載體是黏粒載體。黏粒載體最初是設計用來克隆20和擴增基因組DNA的大片段。應用黏粒載體的克隆在Sambrook等,MolecularCloning:ALaboratoryMannual,第二版,ColdSpringHarborLaboratoryPress(1989)中有詳細說明。一旦連接到適當的載體,含有不同的聚酮化合物合成酶基因簇的兩個或者更多個載體可以引入到適合的宿主細胞中。這些基因簇所共有的具有部分序列同源性的區域將促進導致序列重新組織為雜合基因簇的過程。然後可以對25新的雜合基因簇進行篩選,以尋找在起初的基因簇沒有發現的活性。篩選各種酶活性的方法對於本領域技術人員是已知的,並在本說明書中通篇進行討論,參見,例如下面的實施例l、2和3。當分離本發明的多肽和多核苷酸時,可以使用這樣的方法。—方面,本發明提供了發現和分離纖維素酶如內切葡聚糖酶、纖維二糖水30解酶、甘露聚糖酶和/或P-葡糖苷酶的方法,或者使用全細胞方法修飾這些酶的活性的化合物(參見下面的討論)。可以從基因組DNA文庫篩選編碼纖維素酶如內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶的推定克隆。篩選方法和"在線"監控設備35在實踐本發明的方法時,多種儀器和方法可以與本發明的多肽和核酸一起使用,例如,用來篩選多肽的纖維素酶如內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶活性,用來篩選作為纖維素酶如內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶活性的潛在調節劑的化合物,諸如激活劑或抑制劑,還可以用來篩選與本發明的多肽結合的抗體、與本發明的核酸雜交的核酸,用來篩選表達本發明的多肽的細胞,等等。除了下面詳細描述的用於篩選樣5品的陣列形式以外,也可使用別的形式來實施本發明的方法。這樣的形式包括,例如質譜儀、色譜儀,例如,高通量HPLC和其它形式的液相色譜,和更小的形式,如1536-孔板、384-孔板等等。高通量篩選儀器可被改裝並用來實施本發明的方法,見,例如美國專利申請20020001809;20050272044。10毛潘,厙^本發明的核酸或多肽可被固定或應用於陣列上。陣列可用來篩選或監測組合物(例如,小分子、抗體、核酸等)的文庫,以發現它們結合本發明的核酸或多肽或者調節本發明的核酸或多肽的活性的能力。毛細管陣列,如GIGAMATRIXTM,戴弗薩公司(DiversaCorporation),SanDiego,CA;和描述在例如美國專利申請1520020080350Al;WO0231203A;WO0244336A中的陣列,提供了容納和篩選樣品的可供選擇的裝置。在一個方面,毛細管陣列包括多個毛細管,它們形成具有相互鄰接的毛細管的陣列,其中所述的每個毛細管含有至少一個壁,其限定了一個用以保留樣品的內腔。這個內腔可以是圓柱形的、正方形的、六邊形的或其它任何幾何形狀,只要其壁能夠形成內腔以保留液體或樣品。毛細管陣列的毛細管20可相互靠近聯合在一起形成一個面狀的構造。毛細管可通過融合(例如,當毛細管由玻璃製成時)、粘合、鍵合或面對面的夾合而結合在一起。此外,毛細管陣列可以包括在陣列中相鄰毛細管之間放置的間質材料(interstitialmaterial),從而形成含有多個穿通孔(through-holes)的固體平面裝置。毛細管陣列可由任何數量的毛細管形成,例如,100至4,000,000個毛細管。25進一步,具有大約IOO,OOO或更多個單個毛細管的毛細管陣列可形成標準大小和形狀的Microtiter⑧板,其適合於標準的實驗室設備。通過毛細作用或使用細針的微注射,人工或自動地將腔充滿。隨後可以從毛細管中移出感興趣的樣品以進行進一步的分析或定性。例如,安置細針樣的探頭,使其與選擇的毛細管能夠液體連通,從而可以向腔內加入材料或移走材料。30在單區篩選分析(single-potscreeningassay)中,分析組分在插入到毛細管陣列中之前被混合在一起,產生目的溶液。當至少一部分陣列被浸入目標溶液中時,通過毛細作用充滿內腔。在每個毛細管中的化學或生物學反應和/或活性被監測,以發現可檢測事件。所述的可檢測事件常常被稱為"命中事件(hit)",其常常可以通過光學檢測與產生"非命中事件(non-hit)"的毛細管區分開來。因此,35毛細管陣列可整體地並行檢測"命中事件"。在多區篩選分析(multi-potscreeningassay)中,多肽或核酸,例如,配體可被導入進第一組分中,該組分被導入進毛細管陣列的至少一部分毛細管中。然後將氣泡導入進第一組分後面的毛細管中。然後將第二組分導入進毛細管內,其中所述的第二組分與第一組分通過氣泡相隔。通過在毛細管陣列的兩側施加靜水壓擠破氣泡將第一和第二組分混合在一起。然後監測毛細管陣列中由兩個組分的5反應或非反應而發生的可檢測事件。在結合篩選分析(bindingscreeningassay)中,目標樣品可作為用可檢測顆粒標記的第一液體導入進毛細管陣列的毛細管中,其中為了使可檢測顆粒與內腔結合,毛細管的內腔包被了一種結合材料。然後第一液體可從毛細管中移去,其中結合的可檢測顆粒仍保留在毛細管內,可以將第二液體導入進毛細管內。然10後監測毛細管中由顆粒與第二液體的反應或非反應而發生的可檢測事件。艦或"生激芯/f"本發明的核酸或者多肽可以固定於或者應用於陣列。可以應用陣列來篩選或者監測化合物(例如,小分子、抗體、核酸等等)的文庫,所述篩選或者監測15是針對它們結合本發明的核酸或多肽或者調控本發明的核酸或多肽的活性的能力。例如,在本發明的一方面,一個被監測的參數是纖維素酶如內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或(3-葡糖苷酶基因的轉錄表達。細胞的一種或多種或所有的轉錄物可以通過陣列或"生物晶片"上的固定化核酸與包含細胞轉錄物、或代表細胞轉錄物的核酸、或與細胞轉錄物互補的核酸的樣品的雜交來測定。20通過在微型晶片上應用核酸"陣列",細胞的一些或所有的轉錄物可以同時被定量。可選擇地,包含基因組核酸的陣列也可以用於確定通過本發明的方法製造的新的工程菌株的基因型。"多肽陣列"也可以用於同時定量多種蛋白。本發明可以用任何已知的"陣列"進行實踐,所述"陣列"也指"微陣列"或"核酸陣列"或"多肽陣列"或"抗體陣列"或"生物晶片",或者它們的變體。陣列一般是多個"點"25或者"靶元素",每一個靶元素包括確定數量的一種或多種生物分子,例如,固定於基材表面的確定區域、用於特異結合樣品分子如mRNA轉錄物的寡核苷酸。在此使用的術語"陣列"或"微陣列"或"生物晶片"或"晶片"是多個靶元素,每個靶元素包括固定在基材表面的確定區域上的確定量的一種或多種多肽(包括抗體)或核酸,以下進一步詳細討論。30在實踐本發明的方法時,任何已知的陣列和/或製備和應用陣列的方法都可以被全部或者部分地併入,或者引入它們的變體,例如在下列文獻中說明的美國專利6,277,628;6,277,489;6,261,776;6,258,606;6,054,270;6,048,695;6,045,9%;6,022,963;6,013,440;5,%5,452;5,959,098;5,856,174;5,830,645;5,770,456;5,632,957;5,556,752;5,143,854;5,807,522;5,800,992;5,744,305;5,700,637;355,556,752;5,434,049;還參見,例如,WO99/51773:WO99/09217;WO97/46313;WO96/17958;還參見,例如,Johnston(1998)Curr.Biol.8:R171-R174;Schummer(1997)Biotechinques23:1087-1092;Kern(1997)Biotechniques23:120-124;Solinas-Toldo(1997)Genes,Chromosomes&Cancer20:399-407;Bowtell(1999)NatureGeneticsSupp.21:25-32。也參見公布的美國專利申請20010018642;20010019827;20010016322;20010014449;20010014448;20010012537;520010008765。抗體和基於抗體的篩選方法術語"抗體"包括來源於(derivedfrom)、出自於(modeledafter)或大體20上編碼於(substantiallyencodedby)—個免疫球蛋白基因或多個免疫球蛋白基因的肽或多肽或者其片段,它們能特異地結合於抗原或表位,見例如,FundamentalImmunology,第三版,W.E.Paul,ed.,RavenPress,N.Y.(1993);Wilson(1994)J.Immunol.Methods175:267-273;Yarmush(1992)J.Biochem.Biophys.Methods25:85-97。術語抗體包括結合抗原的部分,即,具有與抗原結合的能力的"抗原結25合位點"(例如,片段、子序列、互補決定區(CDRs)),包括(i)Fab片段,由VL、VH、CL和CHI結構域組成的單價片段;(ii)F(ab')2片段,包括在鉸鏈區由二硫鍵連接的兩個Fab片段的二價片段;(iii)由VH和CHI結構域組成的Fd片段;(iv)由抗體單臂(asinglearm)的VL和VH結構域組成的Fv片段;(v)由VH結構域組成的dAb片段(Ward等,(1989)Nature341:544-546),和(vi)30分離出的互補決定區(CDR)。單鏈抗體也被包括在術語"抗體"中。本發明提供了本發明的酶(例如肽)的片段,包括本發明的多肽的免疫原性片段(例如,子序列)。本發明提供了含有本發明的多肽或肽和佐劑或載體以及類似物的組合物。所述抗體可以在免疫沉澱、染色、免疫親合柱等等中被應用。如果需要的35話,編碼特異抗原的核酸序列可以通過免疫方法獲得,隨後分離出多肽或者核酸,進行擴增或者克隆,將多肽固定在本發明的陣列上。可供選擇的,本發明的方法可以用於修飾由細胞產生的待修飾的抗體的結構,如,抗體的親和性可以增加或者降低。而且,製備或者修飾抗體的能力可以是通過本發明的方法設計細胞表型。免疫、產生和分離抗體(多克隆的或者單克隆的)的方法是本領域技術人員所了解的,並且在科學和專利文獻中有描述,參見,如,Coligan,CURRENT5PROTOCOLSINIMMUNOLOGY,Wiley/Greene,NY(1991);Stites(eds.)BASICANDCLINICALIMMUNOLOGY(第7版)LangeMedicalPublications,LosAltos,CA("Stites");Goding,MONOCLONALANTIBODIES:PRINCIPLESANDPRACTICE(第2版)AcademicPress,NewYork,NY(1986);Kohler(1975)Nature256:495;Harlow(1988)ANTIBODIES,ALABORATORYMANUAL,ColdSpring10HarborPublications,NewYork。除了使用動物的傳統的體內方法外,抗體也可以在體外產生,例如,應用表達重組抗體結合位點的噬菌體展示文庫。參見如,Hoogenboom(1997)TrendsBiotechnol.15:62-70;Katz(1997)A皿u.Rev.Biophys.Biomol.Struct.26:27-45。本發明的多肽或者含有其至少5、10、15、20、25、30、35、40、50、75、15100或150個連續胺基酸的片段,也可用來產生與所述多肽或片段特異結合的抗體。得到的抗體可應用於免疫親和層析程序,以分離或純化多肽,或確定多肽是否存在於生物樣品中。在這樣的程序中,蛋白製備物,如提取物,或生物樣品與能夠同本發明的多肽或者含有其至少5、10、15、20、25、30、35、40、50、75、100或150個連續胺基酸的片段特異結合的抗體接觸。20在免疫親和程序中,所述抗體附著於固體支持物上,如珠子或者其它的柱基質。在所述抗體可以特異地與本發明的多肽或其片段結合的條件下,將所述蛋白製備物與所述抗體接觸。當通過清洗去除非特異結合的蛋白後,特異性結合的多肽被洗脫下來。在生物樣品中蛋白結合所述抗體的能力可以通過使用本領域技術人員所25熟悉的各種方法來確定。例如,結合可以通過用例如螢光試劑、酶標記或者放射性同位素的可檢測標記物來標記所述抗體來確定。可選擇地,所述抗體與所述樣品的結合可以通過應用具有這樣的可檢測標記的二抗來檢測。特定的分析包括ELISA分析、夾心分析、放射免疫分析以及Western印跡。針對本發明的多肽或含有其至少5、10、15、20、25、30、35、40、50、3075、100或150個連續胺基酸的片段產生的多克隆抗體可通過直接將多肽注射進動物中或通過將多肽給予動物,例如非人動物而獲得。這樣獲得的抗體可與多肽本身結合。以這種方式,甚至僅編碼多肽的一個片段的序列也可用來產生可與整個天然多肽結合的抗體。這種抗體然後可用來從表達所述多肽的細胞中分離多肽。為了製備單克隆抗體,可使用可通過連續細胞系培養來產生抗體的任何技35術。實例包括雜交瘤技術(Kohler和Milstein,Nature,256:495-497,1975)、三體瘤技術、人B-細胞雜交瘤技術(Kozbor等人,ImmunologyToday4:72,1983)和EBV-雜交瘤技術(Cole等人,1985,inMonoclonalAntibodiesandCancerTherapy,AlanR.Liss,Inc.,pp.77-96)。用於產生單鏈抗體的技術(美國專利4,946,778)可被改動,以使之適於產生本發明的多肽或含有其至少5、10、15、20、25、30、35、40、50、75、100或5150個連續胺基酸的片段的單鏈抗體。可選擇地是,轉基因小鼠可用來表達這些多肽或其片段的人源化抗體。產生的針對本發明的多肽或含有其至少5、10、15、20、25、30、35、40、50、75、100或150個連續胺基酸的片段的抗體可用於篩選來自其它生物體和樣品的類似多肽。在這些技術中,來自生物體的多肽與抗體接觸,檢測可與抗體特異10結合的多肽。上述的任何程序可用來檢測抗體的結合。一種這樣的篩選分析描述在"MethodsforMeasuringCellulaseActivities",M"/iocfa&£"2>wo/ogy,Vol160,87-116頁中。試劑盒15本發明提供了試劑盒,其包括組合物,例如本發明的核酸、表達序列盒、載體、細胞、轉基因種子或者植物或者植物的一部分、多肽(如纖維素酶)和/或者抗體。所述試劑盒也可以包括如在此所述的用於教導本發明的方法學以及工業、醫療和飲食應用的指導性材料。20全細胞工程和測定代謝參數本發明的方法提供了細胞的全細胞進化或全細胞工程,其通過修飾細胞的遺傳組成開發出具有新的表型,例如,新的或修飾的纖維素酶如內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶活性的新細胞株。參見美國專利申請20040033975。25可以通過向細胞中加入本發明的核酸,例如本發明的酶的編碼序列而修飾遺傳組成。見,例如,WO022卯32;WO0196551。為了探測新的表型,在"實時"或者"在線"的時間範圍內監測被修飾的細胞的至少一種代謝參數。一發麵,多個細胞,如培養細胞物被"實時"或者"在線"監測。一方面,"實時"或者"在線"監測多個代謝參數。代謝參數可以應用30本發明的纖維素酶如內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或p-葡糖苷酶進行監測。代謝流分析(MFA)是以已知的生物化學框架為基礎。以質量守恆定律和細胞內代謝的假穩態假說(PSSH)為基礎,構建線性獨立代謝矩陣。在實踐本發明的方法時,建立代謝網絡,包括35所有途徑底物、產物和中間代謝物的特性,使途徑代謝物互變的所有化學反應的特性,途徑反應的化學計量學,催化反應的所有酶的特性,酶反應動力學,途徑組分之間的調控性相互作用;如變構效應相互作用,酶-酶相互作用等,酶或者酶的任何其它超大分子組織在細胞內的區室化,以及,任何濃度梯度的代謝物、酶或者效應分子的存在,或者它們運動的擴散障礙。5—旦針對給定的細胞株建立了代謝網絡,如果在線代謝數據可用,那麼可以通過矩陣概念引入數學表達來評估細胞內的代謝流。代謝表型依賴於細胞內整個代謝網絡的變化。代謝表型依賴於途徑利用對環境條件、遺傳調控、發育狀態和基因型等等作出的變化。在本發明方法的一個方面,當計算了在線MFA之後,通過研究所述的途徑利用來分析細胞的動力學行為、它們的表型和其它性質。例10如,在酵母發酵中,如果葡萄糖供應增加,氧氣減少,呼吸途徑的利用將會降低和/或者停止,而發酵途徑的利用將佔優勢。在所述的途徑分析之後,細胞培養物的生理狀態的控制將成為可能。通過確定如何改變底物供給、溫度、誘導物的使用等來控制細胞的生理狀態朝著所需的方向進行,本發明的方法可以有助於確定如何操縱發酵。在實踐本發明的方法時,MFA的結果也可以與轉錄物組15(transcriptome)和蛋白質組(proteome)的數據比較,設計實驗和方案用於代謝工程或者基因重排等等。在實踐本發明的方法時,可以產生和檢測到任何經修飾改變的或者新的表型,包括在細胞中新的或者改進的特徵。可以監測代謝或者生長的任何方面。20蕭w腦録赫教在本發明的一方面,工程化的表型包括增加或者降低mRNA轉錄物(如,纖維素酶如內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶信息)的表達或者在細胞中產生新的(如,纖維素酶,如內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶)轉錄物。這一增加或者減少的表達可以通過測25定本發明的纖維素酶如內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或p-葡糖苷酶的存在,或者通過纖維素酶如內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶活性分析來跟蹤。mRNA轉錄物或者信息也可以通過本領域已知的任何方法來檢測或者定量,包括,例如,Northern印跡、定量擴增反應、陣列雜交以及類似的方法。定量擴增反應包括,如,定量PCR,包括,如,定量反轉錄30聚合酶鏈式反應,或者RT-PCR;定量實時RT-PCR,或者"實時動力學RT-PCR"(參見,如,Kreuzer(2001)Br.J.Haematol.114:313-318;Xia(2001)Transplantation72:907-914)。在本發明的一方面,工程化的表型是通過敲除同源基因的表達產生。可以敲除所述基因的編碼序列或者一個或多個轉錄控制元件,如啟動子或者增強子。35這樣,轉錄物的表達可以完全去除或者僅被降低。在本發明的一方面,所述工程化的表型包括增加同源基因的表達。這可以通過敲除負調控元件或者誘變正調控元件而實現,負調控元件包括以順式或者反式起作用的轉錄調控元件。細胞的一種或者多種或者所有的轉錄物可以通過陣列上的固定化核酸與包含細胞轉錄物的樣品,或者與代表細胞轉錄物或和細胞轉錄物互補的核酸的雜交來測定。層微、靡錢廳表這在本發明的一方面,工程化的表型包括增加或者降低多肽(如纖維素酶,如內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或|3-葡糖苷酶)的表達或者在細胞內產生新的多肽。這一增加或者減少的表達可以通過確定存在的纖維素酶如10內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或p-葡糖苷酶的量或者通過纖維素酶如內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶活性分析來跟蹤。也可以通過本領域任何已知的方法來檢測並定量多肽、肽和胺基酸,所述方法包括,如,核磁共振(NMR)、分光光度測定法、射線照像術(蛋白放射性標記)、電泳、毛細管電泳、高效液相色譜(HPLC)、薄層色譜(TLC)、超擴散色15譜,各種免疫學方法,如,免疫沉澱、免疫擴散、免疫電泳、放射性免疫分析(RIAs)、酶聯免疫吸附分析(ELISAs)、免疫螢光分析,凝膠電泳(如,SDS-PAGE)、用抗體染色、螢光激活的細胞分選器(FACS)、熱分解質譜、傅立葉變換紅外光譜測定、拉曼光譜、GC-MS和LC-電噴以及cap-LC-串聯-電噴質譜,已經類似的方法。應用這些方法或者它們的變體也可以篩選新的生物活性,在美國專利6,057,103中有20說明。而且,正如以下詳細討論的,可以應用蛋白陣列測定細胞的一種或者多種或者所有的多肽。工業、能源、藥物和其它應用本發明的多肽(例如,具有纖維素酶如內切葡聚糖酶、纖維二糖水解酶、25甘露聚糖酶和/或(3-葡糖苷酶活性的多肽)可以催化纖維素的降解。本發明的酶是高度選擇性的催化劑。本發明提供了利用本發明的酶的工業方法,例如,在製藥或營養(飲食)補充劑行業、能源工業(例如,製造"清潔"生物燃料)中,在食品和飼料工業中,例如在製造食品和詞料產品以及食品和飼料添加劑的方法中利用本發明的酶。一方面,本發明提供了在醫藥工業中利用本發明的酶的工藝,30例如,以製備藥物或飲食助劑或補充物,或食物補充物和添加劑。此外,本發明提供了在生物乙醇——包括"清潔"燃料——的生產中使用本發明的酶的方法。本發明的酶可以催化具有強烈的立體選擇性、區域選擇性和化學選擇性的反應。本發明的纖維素酶如內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或卩-葡糖苷酶可被工程化,以在各種溶劑中發揮功能,可在極端pH(例如,高pH和35低pH)和極端溫度(例如,高溫和低溫)、極端的鹽度水平(例如,高鹽度和低鹽度)下工作,並可催化同與其天然的生理底物結構上不相關的化合物的反應。生激激處靴贈措生娜備主產本發明提供了生物質(biomass)(例如,木質纖維素材料)轉化成燃料(例如生物醇)和化學品的酶和方法。因此,本發明的組合物和方法提供了使用基於5石油的產品的有效的和持續的可替代選擇。本發明提供了表達本發明的酶的生物體,可用於參與涉及天然生物質轉化的化學循環。一方面,用於轉化的酶和方法可用在酶整體(enzymeensembles)中,用於將纖維素和半纖維素聚合物解聚成可代謝的碳部分。如上所討論,本發明提供了發現和實施最有效的酶的方法,使這些重要的新的"生物質轉化"和可選擇的能源工藝可行。10—方面,本發明的多肽,例如,具有纖維素酶活性,如內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或(3-葡糖苷酶活性的蛋白質,被用在將木質纖維素生物質轉化成醇例如乙醇的方法中。本發明還提供了由含有木質纖維素生物質的組合物生產醇("生物醇")的方法。木質纖維素生物質材料可以從農作物獲得,以食品或飼料生產的副產物獲得,或以木質纖維素廢品獲得,例如植物殘餘和廢15紙。用本發明的多肽處理的合適的植物殘餘的例子包括莖、葉、殼、皮、穗軸(cob)和類似物,以及木材、木屑、木質紙漿和鋸屑。適合用本發明的多肽處理的紙廢品的例子包括廢棄的複印紙、計算機列印紙、筆記本紙、記事本紙、打字機用紙等等,以及報紙、雜誌、紙板和基於紙的包裝材料。—方面,本發明的酶和方法可與從生物質製備醇的更"傳統的"方法一起20使用,例如,這樣的方法,包括通過使乾燥過的木質纖維素材料在反應器中與由強酸和金屬鹽的稀釋溶液組成的催化劑接觸而水解木質纖維素材料;這可以降低纖維素水解的活化能或溫度,以獲得更高的糖產率;參見,例如,美國專利6,660,506;6,423,145。使用本發明的酶的另一種示例性方法包括通過使木質素纖維素材料在一25定的溫度和壓力下在含水介質中經受第一階段的水解步驟而水解含有半纖維素、纖維素和木素的木質纖維素材料,所述溫度和壓力被選擇來實現半纖維素的初步解聚而不將纖維素大部分解聚成葡萄糖。該步驟得到一種漿,其中含水液相含有從半纖維素解聚得到的溶解的單糖,而固相含有纖維素和木素。第二階段水解步驟可以包括使得至少大部分纖維素被解聚的條件,該步驟產生含有溶解的/可溶的30纖維素解聚產物的含水液相。參見,例如,美國專利5,536,325。本發明的酶可以在該示例性方法中的任何階段加入。使用本發明的酶的另一種示例性方法包括通過一個或多個用大約0.4%至2%的強酸進行稀釋酸水解的階段來處理含木質纖維素的生物質材料;以及通過鹼性去木質作用來處理酸水解的生物質材料的未反應的固體木質纖維素成分,以35產生可生物降解的熱塑塑料和衍生產品的前體。參見,例如,美國專利6,409,841。本發明的酶可以在該示例性方法中的任何階段加入。使用本發明的酶的另一種示例性方法包括在預水解反應器中預水解木質纖維素材料;向該固體木質纖維素材料加入酸性液體,製備混合物;將該混合物加熱至反應溫度;維持反應足夠的時間,以將木質纖維素材料分餾成含有至少大約20%的來自木質纖維素材料的木質素的溶解部分以及含有纖維素的固體部分;5當處於或接近其中固體部分中的纖維素變得更易於進行酶促降解的反應溫度時,從固體部分除去溶解部分;以及回收溶解部分。參見,例如,美國專利5,705,369。本發明的酶可以在該示例性方法中的任何階段加入。本發明提供了製備基於液體烴的發動機燃料組合物(例如,用於火花點火發動機)的方法,所述液體烴摻混有利用本發明的酶或方法製備的燃料級醇。一10方面,利用本發明的酶生產的燃料包括,例如液體煤氣-醇混合物或液體天然氣-醇混合物。一方面,共溶劑是生物質衍生的2-甲基四氫呋喃(MTHF)。參見,例如,美國專利6,712,866。用於木質纖維素的酶促降解的方法,例如,用於從木質纖維素材料生產乙醇的方法,還可以包括生物質材料的超聲處理;參見,例如,美國專利6,333,181。15使用本發明的酶製備含有乙醇的生物燃料的另一個示例性方法包括預處理含有木質纖維素給料的原材料,所述木質纖維素給料至少包括半纖維素和纖維素。一方面,所述原材料包括馬鈴薯、大豆(油菜籽)、大麥、黑麥、玉米、燕麥、小麥、甜菜或甘蔗或成分或廢物或食物或飼料生產副產物。原材料("給料")在破壞植物纖維結構的條件下發生反應,以實現半纖維素和纖維素的至少部分水解。20破壞性條件可以包括,例如使原材料在pH0.5至2.5經受18(TC至27(TC的平均溫度大約5秒至60分鐘的時間;或,在pH0.5至2.5經受22(TC至270'C的溫度大約5秒至120秒的時間,或同等條件。這增加了的給料的可利用性,該給料有待本發明的酶例如纖維素酶消化。美國專利6,090,595。用於木質纖維素材料的纖維素酶水解的示例性條件包括在大約30'C至4825'C之間的溫度下和/或大約4.0和6.0之間的pH下反應。其它示例性條件包括在大約30'C至6(TC之間的溫度下和/或大約4.0和8.0之間的pH。動激銜柳會激或麟添雄除了提供用於人類使用的飲食助劑或添加劑、或食物補充物和添加劑,本30發明還提供了使用本發明的多肽和/或本發明的抗體處理動物飼料和食物和食物或飼料添加劑的方法,所述多肽例如具有纖維素酶活性如內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶活性的蛋白質。本發明提供了含有本發明的纖維素酶如內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶和/或本發明的抗體的動物飼料、食物和添加劑。動物可以是任何農場動物或任何動物。35本發明的動物飼料添加劑可以是顆粒狀的酶產品,其可以很容易與飼料成分混合。可選擇地是,本發明的飼料添加劑可形成一種預混合組分。本發明的顆粒狀酶產品可被包被或不包被。酶顆粒的粒徑可與飼料和預混合組分的大小相容。這為將酶整合進飼料中提供了一種安全和方便的手段。可選擇地,本發明的動物飼料添加劑可以是一種穩定過的液體組合物。它可以是水基或油基的漿液。見,例如美國專利6,245,546。5在動物飼料或食物的改善(或者修飾)中,本發明的纖維素酶如內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶可以在體外(通過改變飼料或食物的成分)或在體內加工食物或飼料。本發明的多肽可被加入動物飼料或食物組合物中。—方面,本發明的酶與另一種酶一起加入,例如,P-半乳糖苷酶、過氧化10氫酶、漆酶、其它纖維素酶、內切糖苷酶、內切-p-l,4-漆酶、澱粉葡糖苷酶、其它葡糖苷酶、葡萄糖異構酶、糖基轉移酶、脂酶、磷脂酶、脂氧化酶、卩-漆酶、內切-(3-1,3(4)-漆酶、角質酶、過氧化物酶、澱粉酶、葡糖澱粉酶、果膠酶、還原酶、氧化酶、脫羧酶、酚氧化酶、木質素酶、支鏈澱粉酶、阿拉伯聚糖酶、半纖維素酶、甘露聚糖酶、xylolaccases、木聚糖酶、果膠乙醯酯酶、鼠李半乳糖醛聚糖乙醯酯15酶、蛋白水解酶、肽酶、蛋白酶、多聚半乳糖醛酸酶、鼠李半乳糖醛聚糖酶、半乳聚糖酶、果膠裂解酶、轉穀氨醯胺酶、果膠甲基酯酶、其它纖維二糖水解酶和/或轉穀氨醯胺酶。這些酶消化產物更容易被動物消化。因此,本發明的纖維素酶如內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶有助於飼料或食物的能量的有效利用,或者通過降解纖維素,有助於食物或飼料的消化性。20在另一個方面,本發明的纖維素酶如內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或p-葡糖苷酶通過直接在轉基因飼料作物(如,例如轉基因植物、種子以及類似物)中表達酶而被供給,所述轉基因作物如穀粒、穀類、玉米、大豆、油菜籽、羽扇豆以及類似物。如在上面所討論的,本發明提供了轉基因的植物、植物部分和植物細胞,其含有編碼本發明多肽的核酸序列。在一個方面,核酸被25表達,這樣,本發明的纖維素酶如內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶以可回收的量被產生。纖維素酶如內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或(3-葡糖苷酶可從任何植物或植物部分中被回收。可選擇的是,含有重組多肽的植物或植物部分可用來改善食物或飼料的性質,例如,改善營養價值、可口性等等。30—方面,本發明的酶輸送基質是以分散的多個微粒、小丸或顆粒形式存在。"顆粒"的含義是被壓扁或壓緊的微粒,如通過制丸、擠壓或類似的壓制過程從基質中去除水分。微粒的這種壓縮或壓緊也可促進微粒的微粒內粘聚性。例如,通過在制丸機中將基於穀物的基質制丸來製備顆粒。由此製備的丸被研磨或粉碎成適合用作動物飼料輔料的顆粒大小。由於基質本身被批准用於動物飼料,所以35在動物飼料中它可用作輸送酶的稀釋劑。—方面,包含在本發明酶輸送基質和方法中的纖維素酶如內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶是熱穩定的纖維素酶如內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶,如在本文中所述,以便在升高的溫度和/或蒸汽可能用來製備丸化的酶輸送基質的生產期間抵抗纖維素酶如內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶的滅活。在消化含有5本發明的酶輸送基質的飼料的過程中,水相消化液將引起活性酶的釋放。其它類型的熱穩定酶和熱穩定的營養添加劑也可被摻入輸送基質中,其可在任何類型的含水條件下釋放。—方面,出於許多不同的目的,可以對本發明的酶基質微粒應用包衣,如為了向動物詞料中添加調味劑或營養補充劑,為了在胃內條件下延緩動物飼料補10充劑和酶的釋放,以及類似的目的。一方面,可應用包衣來實現功能性的目的,例如在需要延緩酶從基質微粒中釋放或控制酶將被釋放的條件時。包衣材料的組分可以是這樣的,其可選擇性地被其敏感的試劑(如熱、酸或鹼、酶或其它化學物質)分解。可選擇地是,對不同的這樣的分解劑敏感的兩種或更多種包衣可被連續地應用於基質微粒。15本發明也涉及製備酶釋放基質的方法。根據本發明,該過程包括提供基於穀粒的基材的多個分散顆粒,其顆粒大小適合用作酶釋放基質,其中所述的顆粒包括由本發明的胺基酸序列編碼的纖維素酶,如內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或卩-葡糖苷酶。一方面,該方法包括將酶釋放基質的顆粒壓制或壓縮成微粒,在一個方面是通過制丸來完成。防黴劑和粘聚劑,當被應用時,可在20任何適合的時間被加入,並且在一方面,與基於穀粒的基材以所需的比例在將基於穀粒的基材制丸之前混合。制丸機進料中的含水量在一個方面是上面所示的與最終產物含水量對應的範圍,在一個方面是大約14-15%。一方面,水分以酶的含水製劑形式加入至給料中,使該給料達到此含水量。在制丸機中的溫度在一個方面用蒸汽達到大約82°C。制丸機可在任何條件下進行操作,對給料進行足夠的操25作以提供小丸。對於從含酶組合物中去除水分來說,制丸方法本身是一個很經濟的方法。本發明的組合物和方法可以結合施用益生素進行實踐,益生素是高分子量糖類,如低聚果糖(FOS);低聚半乳糖(GOS)、GRAS(通常認為安全的(GenerallyRecognizedAsSafe))材料。這些益生素可以通過一些益生乳酸菌(LAB)進行代謝。30它們對於大多數小腸微生物是不可消化的。必潘會激微工本發明提供了包含本發明的酶的食物和飼料以及使用本發明的酶處理食物和飼料的方法。本發明的纖維素酶如內切葡聚糖酶、纖維二糖水解酶、甘露聚35糖酶和/或p-葡糖苷酶在食品加工工業中具有大量的應用。本發明提供了水解含纖維素的組合物的方法,所述含纖維素的組合物包括植物細胞、細菌細胞、酵母細胞、昆蟲細胞或動物細胞、或任何植物或植物部分、或任何食物或飼料、廢品等等。例如,本發明提供了含有纖維素酶如內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶的飼料或食物,例如,在飼料、液體諸如飲料(如果汁5或啤酒)、麵包、麵團或麵包產品、或飲品(如啤酒)或飲料前體(如,麥芽汁)中。本發明的食物處理工藝還可以包括使用其它酶的任何組合,其它酶例如色氨酸酶或酪氨酸脫羧酶、漆酶、過氧化氫酶、漆酶、其它纖維素酶、內切糖苷酶、內切-P-l,4-漆酶、澱粉葡糖苷酶、其它葡糖苷酶、葡萄糖異構酶、糖基轉移酶、脂10酶、磷脂酶、脂氧化酶、p-漆酶、內切-p-l,3(4)-漆酶、角質酶、過氧化物酶、澱粉酶、葡糖澱粉酶、果膠酶、還原酶、氧化酶、脫羧酶、酚氧化酶、木質素酶、支鏈澱粉酶、阿拉伯聚糖酶、半纖維素酶、甘露聚糖酶、xylolaccases、木聚糖酶、果膠乙醯酯酶、鼠李半乳糖醛聚糖乙醯酯酶、蛋白水解酶、肽酶、蛋白酶、多聚半乳糖醛酸酶、鼠李半乳糖醛聚糖酶、半乳聚糖酶、果膠裂解酶、轉穀氨醯胺酶、15果膠甲基酯酶、其它纖維二糖水解酶和/或轉穀氨醯胺酶。—方面,本發明提供了用於水解液體(液化的)和顆粒澱粉的酶和方法。這樣的澱粉可以來源於任何來源,例如甜菜、甘蔗、馬鈴薯、玉米、小麥、蜀黍、高梁、黑麥或bulgher。本發明適合於在液化(例如,為了生產生物乙醇)中有用的任何植物澱粉來源如穀物澱粉來源,包括己知可產生適合於液化的澱粉的任何20其它穀物或蔬菜來源。本發明的方法包括液化來自任何天然材料的澱粉(例如,製造生物乙醇),所述的天然材料例如稻、發芽水稻、玉米、大麥、蜀黍、小麥、高梁、馬鈴薯、甜菜、甘蔗和甘薯。液化過程可以充分地水解澱粉以產生糖漿。液化的溫度範圍可以是已知在液化澱粉中有效的任何液化溫度。例如,澱粉的溫度可以在大約8(TC到大約115'C之間,在大約100'C到大約110'C之間,以及大約25105。C到大約108'C之間。除了用於(或用於生產)食物和飼料包括酒精飲料,使用本發明的酶和方法生產的生物乙醇可用作燃料或用於燃料中(例如,汽車燃料),例如,如下所討論。廢欽必潘30本發明提供了用在廢物處理中的酶。本發明的纖維素酶如內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或卩-葡糖苷酶可用於各種廢物處理或相關的工業應用中,例如用在與生物質轉化產生燃料相關的廢物處理中。例如,在一個方面,本發明提供了使用本發明的纖維素酶如內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶的固體和/或液體廢物消化方法。該法可以包括減少基本上未35處理的固體廢物的量和體積。固體廢物可在酶溶液(包括本發明的纖維素酶,如內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶)存在的情況下用酶促消化過程在控制的溫度下進行處理。這種反應不需要添加微生物形成明顯的細菌發酵。固體廢物被轉變為液化的廢物和任何殘餘的固體廢物。得到的液化廢物可與所述的任何殘餘的固化廢物分離。見,例如美國專利5,709,796。—方面,本發明的組合物和方法被用於去除、預防或減少例如動物廢物池5如養豬農場的動物廢物池中、其它動物廢物管理系統中或任何工業或食品加工應用中的氣味。用於生物質(例如,木質纖維素材料)轉化成燃料(例如,生物乙醇)的酶和方法可以結合城市固體廢物材料的處理/再循環,所述城市固體廢物材料包括從城市直接獲得的廢物或者先前填埋隨後回收的城市固體廢物,或者下水道淤泥,10例如含有明顯量的纖維素材料的下水道淤泥塊形式的下水道淤泥。由於下水道淤泥塊通常不含有明顯量的可再循環材料(鋁、玻璃、塑料等等),它們可以用濃硫酸直接處理(以降低廢物的纖維素成分的重金屬含量),並在乙醇生產系統中進行處理。參見,美國專利6,267,309;5,975,439。使用本發明的酶從廢物材料回收有機物質和無機物質的另一種示例性方15法包括通過使之經受熱和壓來對固體有機物質進行滅菌並使之軟化。該示例性方法可以通過首先攪拌廢物材料,然後使之經受熱和壓而進行,熱和壓對其進行滅菌並使其中包含的有機物質軟化。一方面,在壓力下加熱之後,壓力可以從多孔室突然釋放,以向外推動經軟化的有機物質通過容器的孔,從而從固體無機物質分離出有機物質。然後,經軟化的無菌有機物質在發酵室中進行發酵,例如使用20本發明的酶,例如,以形成發酵漿。該發酵槳可通過離心、蒸餾柱和/或厭氧蒸煮器進行進一步加工,以回收燃料如乙醇和甲烷、以及動物飼料補充物。參見,例如美國專利6,251,643。本發明的酶還可以用於降低工業廢物或從畜牧業設備產生的廢物以及類似廢物的氣味的工藝,例如預處理。例如,本發明的酶可用於處理廢物存儲設備25中的動物廢物,以增強大量的有機物質的有效降解,同時氣味減少。該方法還可以包括接種利用硫化物的細菌和消化有機物的細菌以及裂解酶(除了本發明的酶之外)。參見,例如美國專利5,958,758。本發明的酶還可用在移動系統(mobilesystem)例如間歇式反應器(batchtypereactors)中,用於含水有害廢物的生物再補救,例如,如在美國專利5,833,85730中所描述的。間歇式反應器可以是具有循環能力的大的容器,其中通過將營養物輸入反應器中將細菌(例如,表達本發明的酶的細菌)維持在有效的狀態。當流出物可以被輸入反應器中或者反應器被建成為廢水處理系統時,可以採用這樣的系統。本發明的酶還可以用在這樣的處理系統中,該處理系統在小的或臨時的遙遠場所使用,例如,移動式的、大容量、高效的多功能廢水處理系統。35本發明的廢物處理方法可以包括使用其它酶的任何組合,其它酶例如其它纖維素酶如內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶、過氧化氫酶、漆酶、其它纖維素酶、內切糖苷酶、內切-p-l,4-漆酶、澱粉葡糖苷酶、其它葡糖苷酶、葡萄糖異構酶、糖基轉移酶、脂酶、磷脂酶、脂氧化酶、P-漆酶、內切-(3-l,3(4)-漆酶、角質酶、過氧化物酶、澱粉酶、葡糖澱粉酶、果膠酶、還原酶、氧化酶、脫羧酶、酚氧化酶、木質素酶、支鏈澱粉酶、肌醇六磷酸酶、阿拉伯聚5糖酶、半纖維素酶、甘露聚糖酶、xylolaccases、木聚糖酶、果膠乙醯酯酶、鼠李半乳糖醛聚糖乙醯酯酶、蛋白水解酶、肽酶、蛋白酶、多聚半乳糖醛酸酶、鼠李半乳糖醛聚糖酶、半乳聚糖酶、果膠裂解酶、轉穀氨醯胺酶、果膠甲基酯酶、其它纖維二糖水解酶和/或轉穀氨醯胺酶。10去薪微合激本發明提供了含有本發明的一種或多種多肽(例如,具有纖維素酶、內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶活性的酶)的去垢劑組合物,以及製備和使用這些組合物的方法。本發明包括了製備和使用去垢劑組合物的所有方法,見,例如美國專利6,413,928;6,399,561;6,365,561;6,380,147。去垢15劑組合物可以是一個部分和兩個部分的含水組合物、不含水的液體組合物、鑄型固體、顆粒形式、微粒形式、壓縮片劑、凝膠和/或糊劑和漿液的形式。本發明還提供了能夠使用這些去垢劑組合物快速除去總食物類汙垢、或食物殘留的膜以及其它少量食物組分的方法。本發明的酶通過澱粉多糖的催化水解可以促進澱粉染汙的去除。本發明的酶可用於洗碟用去垢劑、紡織品洗滌去垢劑中。20實際的活性酶含量依賴於製造去垢劑組合物的方法,這不是很嚴格的,只要去垢劑溶液具有所需的酶活性。在一個方面,存在於最終溶液中的葡糖苷酶的量的範圍為每克去垢劑組合物大約0.001mg至0.5mg。選擇用於本發明的方法和產品中的特定酶依賴於最終應用的條件,包括產品的物理形式、應用時的pH、應用時的溫度和要被降解或改變的汙垢類型。對於指定的任何一組應用條件,可以25選擇酶以提供最佳的活性和穩定性。在一個方面,本發明的多肽在大約4至大約12的pH範圍內,大約20。C至大約95。C的溫度範圍內是有活性的。本發明的去垢劑可以包括陽離子表面活性劑、半極性的非離子表面活性劑或兩性離子表面活性劑;或其混合物。本發明的酶(例如,具有纖維素酶、內切葡聚糖酶、纖維二糖水解酶、甘30露聚糖酶和/或P-葡糖苷酶活性的酶)可被製成粉末狀和液體的去垢劑,具有的pH在4.0和12.0之間,按重量計為大約0.01%至大約5%(優選0.1%至0.5%)的水平。這些去垢劑組合物也可以包括其它的酶如己知的蛋白水解酶、纖維素酶、脂酶或糖苷內切酶,以及助洗劑和穩定劑。向傳統的洗滌組合物中添加本發明的酶不會造成任何特殊的應用限制。換句話說,適合去垢劑的任何溫度和pH也適用於35本發明的組合物,只要pH在上述範圍內,而溫度在所描述的酶變性溫度之下。另夕卜,本發明的多肽可用於不需要去垢劑的洗滌組合物中,再單獨應用或與助洗劑和穩定劑聯合應用。本發明提供了清潔組合物,包括清潔硬表面的去垢劑組合物、清潔織物的去垢劑組合物、洗碟用組合物、口腔清潔組合物、假牙清潔組合物和隱形眼鏡清潔液。5在一個方面,本發明提供了清洗物體的方法,包括將物體與本發明的多肽在可充分清洗的條件下接觸。本發明的多肽可以作為去垢劑添加劑而被加入。本發明的去垢劑組合物,例如可被配製為含有本發明多肽的手工或機器洗衣的去垢劑組合物。適合用於預處理汙染織物的洗衣添加劑可含有本發明的多肽。織物柔軟劑組合物可含有本發明的多肽。可選擇的是,本發明的多肽可被製成去垢劑組10合物,用於通常的家庭硬表面清洗工作中。在可選擇的方面,本發明的去垢劑添加劑和去垢劑組合物可以包含一種或多種其它的酶,例如蛋白水解酶、脂酶、角質酶、另一種葡糖苷酵、糖酶、另一種纖維素酶、果膠酶、甘露聚糖酶、阿拉伯糖酶、半乳聚糖酶、木聚糖酶、氧化酶,例如,乳糖酶和/或過氧化物酶。所選擇的本發明的酶的特性可與所選擇的去垢劑相容(即,最佳pH,與其它的酶或非酶15成分相容,等),並且,酶是以有效量存在。在一個方面,本發明的酶用來從織物中去掉有惡臭的材料。在實施本發明中可使用的各種去垢劑組合物和製備它們的方法描述在,例如美國專利6,333,301;6,329,333;6,326,341;6,297,038;6,309,871;6,204,232;6,197,070;5,856,164。本發明的去垢劑和相關的方法還可以包括使用其它酶的任何組合,其它酶20例如色氨酸酶或酪氨酸脫羧酶、過氧化氫酶、漆酶、其它纖維素酶、內切糖苷酶、內切-P-l,4-漆酶、澱粉葡糖苷酶、其它葡糖苷酶、葡萄糖異構酶、糖基轉移酶、脂酶、磷脂酶、脂氧化酶、(3-漆酶、內切-P-l,3(4)-漆酶、角質酶、過氧化物酶、澱粉酶、葡糖澱粉酶、果膠酶、還原酶、氧化酶、脫羧酶、酚氧化酶、木質素酶、支鏈澱粉酶、阿拉伯聚糖酶、半纖維素酶、甘露聚糖酶、木糖漆酶、木聚糖酶、果25膠乙醯酯酶、鼠李半乳糖醛聚糖乙醯酯酶、蛋白水解酶、肽酶、蛋白酶、多聚半乳糖醛酸酶、鼠李半乳糖醛聚糖酶、半乳聚糖酶、果膠裂解酶、轉穀氨醯胺酶、果膠甲基酯酶、其它纖維二糖水解酶和/或轉穀氨醯胺酶。必鄉激微鄉30本發明提供了使用本發明的一種或多種多肽處理織物和紡織品的方法,所述多肽例如具有纖維素酶、內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或p-葡糖苷酶活性的酶。本發明的多ftk可以在任何織物處理方法中使用,這些方法在本
技術領域:
是已知的,例如參見美國專利6,077,316。例如,一方面,織物的手感和外觀通過包括用本發明的酶在溶液中接觸織物的方法得到改進。一方面,用溶35液在壓力下處理織物。—方面,本發明的酶在織物的編織過程中或之後應用,或在脫漿階段應用,或在一個或多個其它的織物處理歩驟中應用。在織物的編織過程中,線被施加相當大的機械張力。在機械織布機上進行編織之前,經紗通常用上漿澱粉或澱粉衍生物塗覆,以便提高它們的拉伸強度並防止斷裂。本發明的酶可用於去除這些上漿澱粉或澱粉衍生物。在紡織品已經編織好之後,織物可以繼續進行到脫漿階段。5隨後可以是一個或多個額外的織物加工步驟。脫漿是從紡織品中去除"漿料"的作用過程。在編織之後和進一步加工織物之前,必須去除漿料塗層,以便確保均勻且耐水的效果。本發明提供了一種脫漿方法,包括通過本發明酶的作用對"漿料"進行酶促水解。本發明的酶(如具有纖維素酶、內切葡聚糖酶、纖維二糖水解酶、甘露聚10糖酶和/或卩-葡糖苷酶活性的酶)可作為去汙劑添加劑對織物進行脫漿,所述織物包括含棉織物,所述酶可以例如在含水組合物中。本發明提供了在靛類染色的粗斜紋棉布織物和衣服上產生砂洗外觀的方法。對於服裝製造,織物可以被剪裁併縫紉為衣料或服裝,這些在後來被整理。尤其是,對於粗斜紋布牛仔褲的製造,已經開發了不同的酶促加工方法。粗斜紋棉布服裝的整理(finishing)通常從酶脫15漿步驟開始,在該步驟中服裝經受澱粉分解酶的作用,以便給織物提供柔軟性,使得棉織物更易於進行後面的酶促整理步驟。本發明提供了使用本發明的酶加工(finishing)粗斜紋棉布服裝(例如"生物-石磨方法(bio-stoningprocess)")、酶促脫漿並給織物提供柔軟性的方法。本發明提供了在脫漿和/或整理過程中快速軟化粗斜紋棉布服裝的方法。20本發明還提供了含有本發明的酶(如具有纖維素酶、內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶活性的酶)的消毒劑。本發明的織物或紡織品處理方法還可以包括使用其它酶的任何組合,其它酶例如色氨酸酶或酪氨酸脫羧酶、漆酶、過氧化氫酶、漆酶、其它纖維素酶、內切糖苷酶、內切-P-l,4-漆酶、澱粉葡糖苷酶、其它葡糖苷酶、葡萄糖異構酶、糖基25轉移酶、脂酶、磷脂酶、脂氧化酶、P-漆酶、內切-P-l,3(4)-漆酶、角質酶、過氧化物酶、澱粉酶、葡糖澱粉酶、果膠酶、還原酶、氧化酶、脫羧酶、酚氧化酶、木質素酶、支鏈澱粉酶、阿拉伯聚糖酶、半纖維素酶、甘露聚糖酶、xylolaccases、木聚糖酶、果膠乙醯酯酶、鼠李半乳糖醛聚糖乙醯酯酶、蛋白水解酶、肽酶、蛋白酶、多聚半乳糖醛酸酶、鼠李半乳糖醛聚糖酶、半乳聚糖酶、果膠裂解酶、轉30穀氨醯胺酶、果膠甲基酯酶、其它纖維二糖水解酶和/或轉穀氨醯胺酶。一銜或一欲炎必湮本發明的酶(如具有纖維素酶、內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶活性的酶)可以在紙或紙漿處理或紙脫墨中使用。例如,一35方面,本發明提供了使用本發明的酶的紙處理方法。一方面,本發明的酶可以被用來修飾紙中的澱粉,從而將其轉化為液化形式。另一方面,在化學和酶促脫墨過程中處理再循環影印紙的紙成分。一方面,本發明的酶可以與其它酶一起使用,包括其它纖維素酶(包括其它內切葡聚糖酶、纖維二糖水解酶和/或(3-葡糖苷酶)。木材、紙、紙產品或紙漿可以通過如下三種方法來處理1)在存在本發明的酶的情況下進行離解;2)用脫墨化學品和本發明的酶進行離解,和/或3)在用本發明5的酶浸透後進行離解。與僅僅用纖維素酶處理的紙相比,用本發明的酶處理的循環紙可以具有更高的亮度,這是由於去除了墨粉顆粒。儘管本發明不受任何特定機理的限制,但本發明的酶的效果可能是由於其在紙漿懸浮物中作為表面活性劑的結果。本發明提供了使用本發明的一種或多種多肽處理紙和紙漿的方法。本發明10的多肽可以在任何紙處理或紙漿處理方法中使用,這些方法在本
技術領域:
是熟知的,例如參見美國專利6,241,849;6,066,233;5,582,681。例如,一方面,本發明提供了對含有染料的印刷過的紙進行脫墨和脫色的方法,包括使印刷過的紙變成漿狀物,以得到紙漿,並在存在本發明的酶(也可以加入其它酶)的情況下從紙漿中移去油墨。另一方面,本發明提供了增加紙漿的打漿度的方法,所述紙漿例15如由再生纖維製成的紙漿,這可以通過將含有本發明的酶的酶促混合物(也可以含有其它酶,例如果膠酶)加入到紙漿中,在可引起反應的條件下進行處理,以產生酶促處理的紙漿。酶促處理的紙漿的打漿度相對於再生纖維紙漿的初始打漿度有所增加,光度沒有損失。本發明的紙、木材或紙漿處理或再循環工藝還可以包括使用其它酶的任何20組合,其它酶例如色氨酸酶或酪氨酸脫羧酶、漆酶、過氧化氫酶、漆酶、其它纖維素酶、內切糖苷酶、內切-P-l,4-漆酶、澱粉葡糖苷酶、其它葡糖苷酶、葡萄糖異構酶、糖基轉移酶、脂酶、磷脂酶、脂氧化酶、P-漆酶、內切-p-l,3(4)-漆酶、角質酶、過氧化物酶、澱粉酶、葡糖澱粉酶、果膠酶、還原酶、氧化酶、脫羧酶、酚氧化酶、木質素酶、支鏈澱粉酶、阿拉伯聚糖酶、半纖維素酶、甘露聚糖酶、25xylolaccases、木聚糖酶、果膠乙醯酯酶、鼠李半乳糖醛聚糖乙醯酯酶、蛋白水解酶、肽酶、蛋白酶、多聚半乳糖醛酸酶、鼠李半乳糖醛聚糖酶、半乳聚糖酶、果膠裂解酶、轉穀氨醯胺酶、果膠甲基酯酶、其它纖維二糖水解酶和/或轉穀氨醯胺酶。30微総.術質纖絕素柳艦湮本發明也提供了用於處理木質纖維素纖維的方法,其中所述纖維用本發明的多肽(如具有纖維素酶、內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或卩-葡糖苷酶活性的酶)處理,所述多肽以足以改進纖維特性的量被使用。本發明的酶也可以在由澱粉強化廢紙和紙板生產或再循環木質纖維素材料如紙漿、紙和紙35板的過程中被使用,尤其是在再次製漿或再循環發生在pH高於7的場合,以及本發明的酶可以通過降解強化澱粉來促進廢品離解的場合。本發明的酶可以在由澱粉塗覆的印刷過的紙製備造紙紙槳的過程中有用。該過程可以按照例如WO95/14807中的描述進行。一個示例性的方法包括分解紙以產生紙漿,在所述分解之前、分解過程中或分解之後用澱粉降解酶進行處理,並在分解和酶處理之後從紙漿中分離出油墨顆粒。也參見美國專利6,309,871和本文引述的其它美國專利。5因此,本發明包括用於再循環紙漿的酶促脫墨的方法,其中多肽以足以有效地對纖維表面進行脫墨的量使用。遊造微辭本發明提供了包含本發明的酶的啤酒釀造(例如發酵)方法,所述酶例如10具有纖維素酶、內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或p-葡糖苷酶活性的酶。在一個示例性的方法中,含澱粉的原料被離解,並被加工以形成麥芽。本發明的酶可以在發酵過程中的任意階段使用。例如,本發明的酶可以在大麥麥芽的加工中使用。啤酒釀造的主要原料是大麥麥芽。這可以是一個三階段過程。首先,大麥穀物被浸漬以增加水含量,例如增加到大約40%左右。第二,所述谷15物可以在15-25'C的溫度孵育3到6天以便發芽,此時酶合成在赤黴素的控制下被刺激。酶水平在此期間顯著上升。一方面,本發明的酶在該過程的這個(或任意其它)階段加入。酶的作用導致可發酵的還原糖有所增加。這可以被表示為糖化力(diastaticpower),DP,在12'C糖化力可以在5天內從大約80上升到190。本發明的酶可以在任何啤酒生產方法中使用,例如美國專利5,762,991;205,536,650;5,405,624;5,021,246;4,788,066中所描述的。潛》/7來房邀7"形成欽遊主產流沐遊流動本發明也包括使用本發明的酶(如具有纖維素酶、內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或p-葡糖苷酶活性的酶)的方法,其中所述方法通過除25去在生產作業過程中形成的粘性的、含澱粉的、破壞性流體來增加來自地下形成物(subterraneanformation)的生產流體(productionfluids)的流動;這些流體可以在地下形成物中找到,所述地下形成物包圍著整個井孔。因此,本發明的方法導致生產液體可以從井孔流出。本發明的方法還著眼於破壞性流體的問題,該破壞性流體將來自形成物的生產流體的流動降低到預期流速之下。一方面,本發明30通過將含水流體和本發明的多肽混合在一起配製成酶處理物(使用本發明的酶);將酶處理物泵入到井孔內的期望位置;允許酶處理物降解粘性、含澱粉的、破壞性流體,從而將流體從地下形成物中移出至井筒的表面;以及其中酶處理物可以有效地攻擊含澱粉流體中的ct葡糖苷鍵。本發明的地下形成物酶處理方法還可以包括使用其它酶的任何組合,其它35酶例如色氨酸酶或酪氨酸脫羧酶、漆酶、過氧化氫酶、漆酶、其它纖維素酶、內切糖苷酶、內切-(3-l,4-漆酶、澱粉葡糖苷酶、其它葡糖苷酶、葡萄糖異構酶、糖基轉移酶、脂酶、磷脂酶、脂氧化酶、(3-漆酶、內切-(3-l,3(4)-漆酶、角質酶、過氧化物酶、澱粉酶、葡糖澱粉酶、果膠酶、還原酶、氧化酶、脫羧酶、酚氧化酶、木質素酶、支鏈澱粉酶、阿拉伯聚糖酶、半纖維素酶、甘露聚糖酶、xylolaccases、木聚糖酶、果膠乙醯酯酶、鼠李半乳糖醛聚糖乙醯酯酶、蛋白水解酶、肽酶、蛋5白酶、多聚半乳糖醛酸酶、鼠李半乳糖醛聚糖酶、半乳聚糖酶、果膠裂解酶、轉穀氨醯胺酶、果膠甲基酯酶、其它纖維二糖水解酶和/或轉穀氨醯胺酶。1#^組合#^7汰貪#充欽本發明還提供了含有本發明的纖維素酶(例如,具有纖維素酶、內切葡聚10糖酶、纖維二糖水解酶、甘露聚糖酶和/或p-葡糖苷酶活性的酶)的藥物組合物和飲食補充物(例如,膳食助劑)。纖維素酶活性包括內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或(3-葡糖苷酶活性。一方面,藥物組合物和飲食補充物(例如,飲食助劑)被配製用於經口攝取,例如,可以提高具有高纖維素或木質纖維素成分的食物和飼料的可消化性。15牙周治療化合物可以包括本發明的酶,例如,如在美國專利6,776,979所述。用於治療或預防酸性腸道綜合症的組合物和方法可以包括本發明的酶,例如,如美國專利6,468,964所述。另一方面,創傷敷料、植入物和類似物包括抗微生物(如,抗生素-作用)酶,包括本發明的酶(包括,例如,本發明的示例性序列)。本發明的酶也可用於20藻酸鹽敷料、抗菌防護敷料、燒傷敷料、壓迫繃帶、診斷工具、凝膠敷料、透水性敷料(hydro-selectivedressings)、吸水(泡沫)敷料(hydrocellular(foam)dressings)、水膠敷料、I.V敷料、開刀防護巾(incisedrapes)、低附著敷料(lowadherentdressings)、氣味吸收敷料、石膏繃帶(pastebandages)、術後敷料、傷疤控制、皮膚護理、透明膜敷料和/或傷口閉合。本發明的酶可用於傷口清潔、創面床準備,25以治療壓迫性潰瘍、腿部潰瘍、燒傷、糖尿病足潰瘍、傷疤、IV固定、手術創傷和微創。本發明的酶可用於無菌酶促清創組合物如軟膏中。在各個方面,纖維素酶被配製成片劑、凝膠、藥丸、植入物、液體、噴劑、粉末、食物、飼料球或配製成膠囊化的製劑。30生激欽激鄉在其它方面,本發明的纖維素酶(例如,具有內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或(3-葡糖苷酶活性的酶)可用於生物防禦(例如,破壞含有木質纖維素材料的孢子或細菌)。在生物防禦應用中使用本發明的纖維素酶提供了顯著的益處,因為它們可以被非常迅速地開發,對抗任何目前未知的或未來的生35物戰劑。此外,本發明的纖維素酶可用於受侵襲環境的淨化。一方面,本發明提供了含有具有纖維素酶活性的多肽的生物防禦劑或生物解毒劑,其中所述多肽包括本發明的序列(包括,例如,本發明的示例性序列),或者由本發明的核酸(包括,例如,本發明的示例性序列)編碼的多肽,其中,任選地,所述多肽具有活性,包括切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或|3-葡糖苷酶活性。5參考資料列表1.S咖brook^J.andRu幼ell,D.W.2001.MolecularCloning:ALaboratoryManual.ThirdEdition.CoWSpringHaiborLaboratoryPress,NewYork,2.Benhar,I.Biotechnologicalapplicationsofphageandcelldisplay.BiotechnologyAdvances19,1-13.篇.3.Coutinho,P,NLandHends賊B.Caiboliydrate-AcUveEnzymesserveratURL:http:〃afinb.cnrs-mra.fi/~cazy/CAZY/iiKiex.html.l卿,4.Felix;C.R.andLG.LjungdahL1993.Thecellulosome:the欲ocelMarorga加neofClostridium.Annu.Rov.M咖bioI47:791-819.:79l-819.5.Gray,A.,T.H.Ridhatds041CKrete,J.M.Short,F.Bartoefc^KnowlesIL,LKan>Sw助sonP.E,,andRdwrtsonD.B.2001.Rapidevolutionof.reveisibladenaturationandelevatedmeltingtenqwratureinamicrobialhkoalkanedehalogenase.AdvancedSynthesisandCatalysis343:607-617.6.Guttm旭,A.,F.T.Chen,ItA.Evangelist^andN.Cooke.1996,High-resolutioncapillarygelelectrophoresisofreducingoligosaccharideslabeledwith1-aminopyrene-3,6,8-trisulfonate.Anal.Biochem233:234-242.7.Haijunpaa,V.,A.Telema^A.Koivu^L.Ruohonen,T.T,Teeri,O.Te咖an,andT.Drafc幼be塔1996.Cdlo-oligosaccharidehydrolysisbyceUobiohydrolaseIIfromTridiodermareesei.Associationandrateconstantsderivedfiimananalysisofprogresscurves.Eur.JBiochem240:584-591.8.Himmel,M.E.,M.F.Ruth^andC.E.Wyman.1999.Cellukseforcommodityproductsfro邁cellulosicbiomass.Curr.Opin.Biotechnol10:358-364.9.Kerr,R.A.1998.GEOLOGY:TheNextOilCrisisLoomsLarge—andPerhapsClose.Science28i:1128.10.Kerr,R.A.2000.OILOUTLOOK:USGSOptimisticonWorldOilProspects.Science289:237.11.'King,R.W.,K.D.Lustig,P.T.SUikenberg,T.J.McGany,andM.W.Kirschner.1997.Expressioncloninginthetesttube.Science277:973-974.12.Kuritz,T.l卿.Aneasycolorimetricas幼yforscreeningandqualitativea站essmentofdeiodinationandddialogenationbybacterialcultures,Lett.ApplMicrobiol28:445-447.13.L加dberg,KL.S.,P.L,Krete>G.S.ProvostandJ.M.Short.1993.Theuseofselectioninrecoveryoftransgenictargetsformutationanalysis.Mutat.Res.301:99-105.14.MacBCenzic,L.F.,<3.Sukenbacher,C.Divne,T.A.Jtones,汰F.Woldike,M.Schu!eHS.G.Withers,andG.J.Davi飢l卿.CrystalstrucUireofthefamily7endoglucanaseI(Cel7B)fiotnH咖icolainsolensat2.5Aresolutionandidentificationofthecatalyticnucleophilebytrappingofthecovalentglycosyl-enzymeintermediate.Bioch咖J335:409掘.15.Richardson,T.H.,X.Tan,G.Frey,W.Callen,M.Cabell,D.LamJ.Maoomber,J.M.Short,D,E.Robertson^andC.Miller.2002.A加vel,highperformanceenzymeforstarchliquefactiottDiscoveryandoptimizationofalowpH,thermostablealpha-amylase.JBiolChan277:26501-26507.16.SakoAJ"D.Irwin,D.B.Wil幼n,andP.A.Kaiplus.1997.Structureandmechanismofendo/exocellulaseE4fromThermomonosporafGsca.Nat.Struct.Biol4:810-818.17.Short,J.M.,J,M.Fernandez,J.A.Sorge,andW.D.H咖.1988.LambdaZAP:abacteriophagelambdaexpressionvectorwilhinvivoexcisionproperties.NucleicAcidsRes,16:7583-7600.18.Snustad,D.P.,J.P.Hun^perger,B.MChereskinandJ.Messing.1988.MaizegiutaminesynthetasecDNAs:isolatio"ydirectgeneticselectioninBK:heiichiacoli.Genetics120:1111-1123.19.Varrot,A,,S,Hastrup,MSclmlein,andG.J.Davies.1999.Crystalstructureofthecatalyticcoredomainofthefemily6ceUobiohydrolaseH,CeWAfromHumicolainsol咖,at1.92Aresolution.BiochemJf337:297-304.20.Yano,T.,S.Ouc,and凡Kagamiyama.1998.Directedevolutionofanaspartateaminotransferasewithnewsubstratespecificities.Proc.Natl.Acad.SciU.S.A95:5511-5515.21.Zveriov,V.V.,G.A.Velikodvorskaya,andW,H.Schwann2002.Anowlydescribedceilulosomalcellobiohydrolase,CelO,fiomClostridiumtbennoceUum:inv加tigationoftheexo-modeofhydrolysis,andbindingcapacitytocrystaUinecellulose.Microbiology148:247-255.下面的實施例被提供來進行舉例說明,但並不限制所要求保護的發明。實施例5實施例l:GIGAMATRIXTM篩選—方面,本發明的方法使用Diversa公司專有的GIGAMATRIxTM平臺;參見PCT專利公布WO01/38583;美國專利申請20050046833;20020080350;美國專利6,918,738;設計專利D480,814。例如,一方面,GIGAMATRIX被用於確定多肽是否具有纖維素酶活性以及是否在本發明範圍內的方法中、或者鑑定和分10離具有纖維素酶活性的多肽的方法中。GIGAMATRIX平臺可以包括基於100,000孔的微板的超高通量篩選,該微板具有常規96孔板的尺寸。在本實施例中,基於先前通過CBH示出的活性,使用2種底物,進行GIGAMATRIX篩選。測試了甲基-傘形酮醯纖維二糖苷(MUC)和甲基傘形酮醯乳糖苷(MUL)。篩選了噬粒形式的不同克隆,因為底15物擴散入細胞,並且螢光被認為更容易檢測到。使用缺乏p-半乳糖苷酶的宿主株,以降低對乳糖苷底物的活性。乳糖苷底物產生更少的命中(hit),並且被認為比纖維素底物更具有專一性。此外,乳糖苷底物產生更少的P-葡糖苷酶命中。為了測試在篩選中使用這些底物的可行性,選擇14個文庫,基於下列事實進行篩選這些文庫通過先前的篩選程序產生了內切葡聚糖酶命中。在受篩選的文庫中,存在20來自11個篩選文庫的共50個初步命中。二次篩選由在瓊脂板上植入克隆以及然後將菌落挑選入含有培養基和MUL的384孔板中組成。針對MUL有活性的克隆從非活性克隆的背景中區分開來。然後,各個單獨的克隆過夜生長,測量螢光,並挑選最具活性的命中物用於測序。對命中物的所有的基因組克隆插入物進行測序。總的來說,命中來自幾個25不同的糖基水解酶家族,包括家族l、2、5、6、10和16。發現了幾個其它命中,其中開放的閱讀框不同源於任何已知的糖基水解酶家族。此外,所述命中物的一些編碼GTP環化水解酶基因。表1.GIGAMATRIX侖中的概述tableseeoriginaldocumentpage170tableseeoriginaldocumentpage171tableseeoriginaldocumentpage172縮寫CBM—糖結合模塊(carbohydratebindingmodule)表徵酶和底物活性在GIGAMATRIXTM篩選中發現的39個命中物(參見上面的表1)首先針5對纖維六糖進行篩選,確定對纖維素寡聚體的作用模式。基因組克隆被定義為具有完整的DNA插入物的片段,所述DNA插入潛在地含有多個開放閱讀框。例如,在上面的表1,一個這樣的基因組克隆含有標號為酶22和22a的兩個開放閱讀框,其中所述閱讀框分別具有如SEQIDNO:37和SEQIDNO:35所描述的序列。另一個這樣的基因組克隆含有三個開放閱讀框,其被標號為酶27、27a和27b。亞克10隆衍生自基因組克隆並可以僅含有單個開放閱讀框。基因組克隆在含有抗生素的TB培養基中過夜生長,裂解細胞,通過離心澄清裂解液。用合適的誘導劑誘導,使亞克隆生長至OD600=0.5,然後在裂解細胞並澄清裂解液之前生長額外的3小時。基因組克隆通常比亞克隆具有更低的活性,卻是在大範圍的克隆中評價活性的更方便的途徑。使用薄層色譜(TLC)進行終點反應的初步研究,通常進行24h。還用磷酸溶脹纖維素(PASC)測試酶,磷酸溶脹纖維素是晶體纖維素,其通過酸處理來溶脹而更加不定形。許多從環境文庫克隆出的纖維素酶對PASC是具有活性的,但是釋放纖維5二糖以及纖維三糖和/或葡萄糖。來自GIGAMATRIX發現嘗試的基因組克隆也針對PASC以及針對纖維素底物例如纖維六糖(Seikagaku,Japan)進行了測試。薄層色譜試驗表明,一些基因組克隆能夠水解纖維六糖,如在圖6和7中所闡述。在這些克隆中,許多克隆能夠產生葡萄糖作為最終產物,這與這樣的事實一致它們與包括P-葡糖苷酶在內的糖基水解家族1具有序列同一性。幾種酶產生纖維10二糖和/或更大的片段,但是產物模式的確切性質還不能通過TLC試驗認識清楚,所以,開發了毛細管電泳(CE)方法。實施例2:毛細管電泳在一些方面,毛細管電泳(CE)被用在篩選酶活性的測定中,例如,CE15被用於確定多肽是否具有纖維素酶活性以及是否在本發明的範圍內的方法中,或者用於鑑定和分離具有纖維素酶活性的多肽的方法中。毛細管電泳(CE)提供了快速的運行時間和更高的測定靈敏度的優勢。CE法使用l-氨基芘-3,6,8-三磺酸鹽(APTS)作為螢光團,並針對與糖類和糖寡聚體的應用進行優化(Guttman(1996)High-resolutioncapillarygelelectrophoresisofreducingoligosaccharideslabeledwith20l-amino[rho]yrene-3,6,8-trisulfonate.Anal.Biochem233:234-242)。對纖維六糖顯示出活性的酶經受對磷酸溶脹纖維素以及纖維六糖的測試。基因被亞克隆、表達和使用鎳-螯合柱進行純化。酶與底物溫育lh,並使用10cm或48cm毛細管來分析產物。對於10cm或48cm的毛細管,纖維六糖分別在第2和9分鐘洗脫出。在存在低含量的糖的情況下或者如果在混合物中存在汙染,48cm毛細管能夠更好地25分離產物。實施CE法,對來自GIGAMATRIX發現的酶進行研究,所述酶在TLC檢測下對纖維六糖顯示出良好的活性。酶22/22a(參見上面的表1)顯示出對PASC的良好性能(數據總結於圖8圖中),主要釋放纖維二糖。此外,酶22/22a能夠從AVICELMicrocrystallineCellulose(MCC)(FMCCorporation,Philadelphia,PA)釋放纖維二糖(數據概述於圖309圖中)。序列分析顯示,酶22和酶21具有~92%的同一性,並且屬於糖基水解酶家族5。家族5主要含有內切葡聚糖酶,但存在纖維二糖水解酶的例子。來自熱纖梭菌的CdO已經基於從無定形和晶形纖維素僅釋放纖維二糖的活性被表徵為纖維二糖水解酶(Zverlov(2002)Anewlydescribedcellulosomalcellobiohydrolase,CeIO,fromClostridiumthermocellum:investigationoftheexo-modeofhydrolysis,and35bindingcapacitytocrystallinecellulose.Microbiology148:247-255)。當與來自解纖維素嗜酸耐熱菌UcWo/ZjmnMSce〃i//o/_y"cws)的內切葡聚糖酶比較時,所有這三種酶都具有緊鄰底物結合位點的插入。該插入能夠形成環,其包住底物結合位點,從而將該酶從內切葡聚糖酶轉變為纖維二糖水解酶。當這些酶針對纖維六糖進行測試時,它們主要產生纖維二糖,伴隨更少量的纖維三糖。這些結果通過如下事實加以解釋纖維二糖水解酶具有從纖維六糖底物產生纖維5二糖和纖維三糖的能力(Harju叩aa(1996)Cello-oligosaccharidehydrolysisbycellobiohydrolaseIIfrom7WcAocfer附areese/.Associationandrateconstantsderivedfromananalysisofprogresscurves.Eur.JBiochem240:584-591)。實施例3:基於發現的序列10本發明提供了使用本發明的序列鑑定和分離纖維素酶例如纖維二糖水解酶的方法。在一個示例性的方法中,與含有纖維二糖水解酶的三個糖基水解酶家族的保守區同源的引物被用來篩選衍生自真菌樣品的多核苷酸文庫或DNA。針對家族48保守區設計引物,並篩選96個文庫,得到l個確認的命中。此外,針對家族6和家族7設計引物。用這些引物篩選真菌文庫,對於家族6得到1個命中,15對於家族7得到56個命中。家族7的命中之一被選擇來進行研究,以提取出全長序列。全長序列被成功獲得,並顯示出與微紫青黴素(i^"/a7/!'柳ya"/W"eZ/謂)的外切纖維二糖水解酶I具有73%的同一性。實施例4:具有纖維二糖水解酶活性的酶的遺傳工程化20本實施例描述了本發明的示例性酶的遺傳工程化。該酶可用於生物質向燃料和化學品的轉化中,以及用於製造基於石油的產品的有效和可持續的可替代選擇。該酶可以在生物體(例如,微生物,如細菌)中表達,以參與涉及天然生物質轉化的化學循環。一方面,該酶以"酶裝配體"使用,用於將纖維素和半纖維素聚合物有效解聚成可代謝的碳部分。如上所討論,本發明提供了發現和執行最25有效的酶的方法,以使這些重要的新的"生物質轉化"和可選擇的能源工業工藝可行。使用宏基因組發現法(metagenomicdiscovery)和定向進化的非隨機法(稱為DIRECTEVOLUTION,如在例如美國專利6,939,689所述,其包括基因位點飽和誘變(GSSM)(如上所討論,也參見美國專利6,171,820和6,579,258)以及可調基30因再裝配(TunableGeneReassembly(TGR)(參見,例如美國專利6,537,776)技術。該工作集中於發現和優化用於將纖維素還原成葡萄糖的重要的酶成分——纖維二糖水解酶。使用Diversa公司的GIGAMATRIX高通量表達篩選平臺(如上討論),執行酶發現篩選,以使用甲基傘形酮醯纖維二糖苷作為底物來鑑定纖維二糖水解35酶。總共篩選100個複雜的(複合)環境文庫,得到25個驗證的纖維二糖水解酶命中,其主要來自糖基水解酶家族5和10。這些命中的活性通過AVICELMicrocrystallineCellulose(MCC)(FMCCorporation,Philadelphia,PA)力Q以表徵。基於其性能特徵,一個酶,SEQIDNO:162(由例如SEQIDNO:161編碼)被選擇作為候選,用於利用基於位點飽和誘變(GSSM)技術進行優化。然而,在進行GSSM進化之前,從SEQIDNO:162除去信號序列(胺基酸1到30),並且加入起始甲硫5氨酸。該無信號的序列——下文稱為"野生型"並由SEQIDNO:164(由例如SEQIDNO:163編碼)表示,是親本序列,對其使用GSSM技術進行優化。如上所討論,GSSM技術可以快速將蛋白質中的所有胺基酸以順序方式突變成其它19種胺基酸。使用基於纖維的測定來篩選突變體,並鑑定出表現出單個胺基酸變化的潛在的上遊突變型(upmutants)。這些上遊突變型被組合成新的文庫,該新文庫代表10著上遊突變型的組合。篩選該文庫,結果鑑定出幾種候選酶,可以用於商業化。研究總結GIGAMATRIX篩選GIGAMATRIX(GMx)篩選平臺是基於100,000孔的微板的超高通量方15法,該微板具有常規96孔板的尺寸(詳見階段II應用)。該篩選採用螢光底物。基於先前示出的纖維素酶活性,使用2種底物,進行GMx篩選。甲基-傘形酮醯纖維二糖苷(MUC)用作篩選底物。此外,試滷靈-(3-吡喃葡萄糖苷也被包括在該篩選內,以消除對兩種底物都具有活性並假定為P-葡糖苷酶的克隆。篩選擴增的噬菌體或噬粒形式的目標文庫。使用兩種缺乏P-半乳糖苷酶基20因的宿主株(CEH6&GAL631),以降低對所述底物的內源性宿主活性。選擇100個文庫,基於如下事實進行篩選這些文庫通過以前的篩選程序產生了纖維素酶命中。在篩選的文庫中,在篩選文庫的69個文庫中總共有355個初步命中。二次篩選由在瓊脂板上鋪入克隆以及然後將菌落挑選入含有培養基和甲基傘形酮醯纖維二糖苷(MUC)的384孔板中組成,稱為"breakout"。圖10以顯25示典型的GIGAMATRIX(GMx)breakout的圖形數據加以舉例說明。為得到該數據,針對MUC有活性的克隆(即,能夠水解甲基傘形酮醯纖維二糖苷)從非活性克隆的背景中區分開來。然後,各個單獨的克隆過夜生長,測量螢光,並挑選最具活性的命中物用於測序。在圖10中,X軸表示樣品名稱;Y軸是相對螢光單位。陽性"命中物"被鋪入瓊脂板上,然後將菌落挑選入含有LB+抗生素和50nM30MUC的384孔板中,並過夜生長。表2.GIGAMATRIX(GMx)命中概述酶編開放閱讀框SEOIDNO:克隆家族特徵40SEQIDNO:104(由例如SEQIDNO:103編碼)家族5(纖維素酶)41SEQIDNO:108(由例如SEQIDNO:107編碼)家族5(纖維素酶)42SEQIDNO:112(由例如SEQIDNO:lll編碼)H7SEQIDNO:60(由例如SEQIDNO:59編碼)43SEQIDNO:82(由例如SEQIDNO:81編碼)44SEQIDNO:78(由例如SEQIDNO:77編碼)45SEQIDNO:68(由例如SEQIDNO:67編碼)45aSEQIDNO:70(由例如SEQIDNO:69編碼)46SEQIDNO:74(由例如SEQIDNO:73編碼)47SEQIDNO:110(由例如SEQIDNO:109編碼)48SEQIDNO:106(由例如SEQIDNO:106編碼)49SEQIDNO:66(由例如SEQIDNO:65編碼)50SEQIDNO:72(由例如SEQIDNO:71編碼)51SEQIDNO:80(由例如SEQIDNO:79編碼)H8SEQIDNO:62(由例如SEQIDNO:61編碼)H8aSEQIDNO:64(由例如SEQIDNO:63編碼)52SEQIDNO:76(由例如SEQIDNO:75編碼)53SEQIDNO:160(由例如SEQIDNO:159編碼)54SEQIDNO:88(由例如SEQIDNO:87編碼)55SEQIDNO:148(由例如SEQIDNO:147編碼)56SEQIDNO:90(由例如SEQIDNO:89編碼)57SEQIDNO:152(由例如SEQIDNO:151編碼)58SEQIDNO:150(由例如SEQIDNO:149編碼)59SEQIDNO:154(由例如SEQIDNO:153編碼)H6SEQIDNO:158(由例如SEQIDNO:157編碼)60SEQIDNO:156(由例如SEQIDNO:155編碼)家族5(纖維素酶)家族5(纖維素酶)家族5(纖維素酶)家族5(纖維素酶)家族5(纖維素酶)-ORF2家族26(甘露聚糖酶)-ORF4家族10(木聚糖酶)家族10(木聚糖酶)家族5(纖維素酶)家族10(木聚糖酶)家族5(纖維素酶)家族5(纖維素酶)家族5(纖維素酶)-ORF1家族5(纖維素酶)-ORF4家族5(纖維素酶)家族10(木聚糖酶)家族5(纖維素酶)家族10(木聚糖酶)家族5(纖維素酶)家族5(纖維素酶)家族5(纖維素酶)家族5(纖維素酶)家族5(纖維素酶)家族5(纖維素酶)對來自命中物的所有基因組克隆插入進行測序。如同上面的表1,一些基因組克隆含有一個以上的開放閱讀框。例如,一個這樣的基因組克隆含有兩個開放閱讀框,其編號為酶H8和H8a,其中所述閱讀框分別具有如SEQIDNO:67和5SEQIDNO:69所描述的序列。總共存在來自篩選文庫的17文庫個中的25個糖基水解酶命中。總的來說,命中來自幾個不同的糖基水解酶家族,包括家族5和10。表2(上面)列出了所述命中和它們的身份。發現了幾個其它命中,其中開放閱讀框不同源於任何已知的糖基水解酶家族。此外,所述命中的一些編碼GTP環化水解酶基因,它們在該系統中已知為假陽性,因為無論底物是否降解它們都產生螢光。總體上,該篩選在鑑定對於MUC具有活性的酶中是成功的。魏對在GIGAMATRIXTM篩選中發現的基因進行測序,並分析數據。使用軟5件系統標註開放閱讀框(ORF)。ORF被亞克隆入合適的載體,其中導入有編碼C末端His標籤的DNA。構建物DNA被轉化入合適的大腸桿菌宿主中並表達,用於特徵研究。針對磷酸溶脹纖維素(PASC)篩選基因產物。PASC是通過酸處理溶脹而更加不定形的晶體纖維素。PASC由AVICELMicrocrystallineCellulose(MCC)製備。培養亞克隆,表達並裂解。裂解液與PASC—起溫育,使用二辛可寧10酸(bicinchoninicacid,BCA)還原糖測定法,分析反應產物。選擇最具活性的亞克隆,用於大規模培養和純化。測定這些亞克隆對PASC的比活性。還通過毛細管電泳(CE)分析亞克隆。裂解液與底物溫育30小時。用螢光團l-氨基芘-3,6,8-三磺酸鹽(APTS)衍生化反應產物。使用48cm毛細管分析產物。在第6分鐘洗脫出纖維二糖。圖11以圖形數據進行舉例說明,該數據示出15了通過毛細管電泳(CE)分析得到的所選擇的酶針對PASC的活性。樣品H9至Hl是單獨的克隆。在圖11中,許多樣品具有代表加工酶(processiveenzymes)的反應產物特徵。加工酶被定義為纖維二糖/(葡萄糖+纖維三糖)的比率為IO的酶。兩種最具活性的潛在加工酶對PASC分別具有0.35和0.04U/mg的比活性。20畢赤酵母中的真菌CBH〖0563]新發現的家族6&7真菌纖維二糖水解酶的基因被轉化入畢赤酵母中,並且在固體瓊脂板上鋪展轉化。對於每一個構建物,選擇160個克隆。樣品被培養和誘導,上清與PASC在存在p-葡糖苷酶的情況下一起溫育。使用葡萄糖-氧化酶測定法分析反應產物。糖基水解酶家族6纖維二糖水解酶在畢赤酵母中成功地異源25表達。內切-外切作用纖維素酶野生型酶,在酶篩選中發現的家族9糖基水解酶,是褐色熱單孢菌(7T^mo附o"o^ora/^ca)E4的同源物。E4已經表現出具有內切和外切活性。該30野生型酶的初步測試表明其對於PASC和AVICELMicrocrystallineCellulose(MCC)都具有活性。反應產物的HPLC分析表明主要產物是葡萄糖和纖維二糖。該野生型酶是多結構域蛋白,其包括糖基水解酶家族9催化結構域、家族3纖維素結合結構域以及被認為參與細胞黏附的三個細菌Ig樣結構域。測試該野生型酶的三個另外的亞克隆變體,以確定所述結構域對活性的影響。該野生型酶用下列35結構域進行亞克隆l)單獨的催化結構域(CD);2)催化和糖結構域(catalyticandcarbohydratedomain,CCD);和3)催化和糖結合結構域加上11個下遊胺基酸(CCD+11)。用AVICELMicrocrystallineCellulose(MCC)分析全長蛋白和3個亞克隆變體,反應產物通過BCA還原糖測定法進行分析,數據概述於圖12中的圖形中。圖12闡述的數據是通過野生型酶和截短突變體與AVICELMicrocrystallineCellulose(MCC)在37°C、pH5下溫育74小時的BCA而獲得。CBH1是陽性對照。5陰性對照是無插入物的宿主。該野生型酶,即全長蛋白(SEQIDNO:164,由例如SEQIDNO:163編碼),是最具活性的。該全長蛋白被選擇,用於GSSM進化。催化域和糖結合域被進化。GSSM篩選10GSSM技術(如上討論)被用於快速和順序地將靶蛋白的催化域和糖結合域的胺基酸突變成19種其它的胺基酸。GSSM篩選的目標是鑑定增加對不溶微晶纖維素的水解程度的突變體。開發出機器人篩選方法,從而促進GSSM篩選法。來自突變構建物的DNA被轉化入DH10b宿主細胞。使用自動菌落挑選系統,將各個克隆挑選入含有150pLLB/氨苄青黴素的96孔(淺)板中。在37'C、15400rpm下溫育板24小時。從每個孔轉移出15的培養物到誘導板中。誘導板的每個孔含有135^LLB/氨苄青黴素,其中含有UmMIPTG。誘導板在37'C、400rpm下溫育24小時。離心該板,並丟棄上清。該測定法的自動化部分在此時開始。細胞被機器人裂解和重懸。150nL的裂解緩衝液(125nL水加上25nL含有0.2mg/ml溶菌酶和20單位/mlDNaseI的20BPER)被加入到每一個孔中。從每個孔轉移出15^L裂解物到反應板。反應板的每個孔含有185nL反應混合物(1%AVICELMicrocrystallineCellulose(MCC),50mM乙酸鈉緩衝液,pH5.0)。反應板在37。C、95%的溼度下溫育30小時。在溫育後,離心該板,15nL的上清被轉移到BCA板。BCA板含有50nL試劑A、50^L試劑B和80nL400mM碳酸鹽緩衝液,每孔pH10。用橡膠封條覆蓋該板,25並在8(TC下溫育30分鐘,然後,通過離心冷卻,在A560處讀取吸光值。鐽至少80個隨機突變克隆針對每個胺基酸位點進行篩選。初步GSSMTM篩選數據的例子在圖13中加以圖示闡述。欄6含有野生型樣品,而欄12含有宿主/30載體陰性對照。在與AVICELMicrocrystallineCellulose(MCC)溫育30小時後,從野生型樣品產生的信號為大約0.53,標準偏差為0.07。陰性對照具有0.29的平均信號。具有比陽性對照的平均值加上2倍標準偏差更高的信號的樣品被認為是初步命中。通過該篩選板,大約十個初步命中被選擇用於二次確認篩選。初步命中在二次測定法中被再確認。該測定法與初步篩選相同。然而,樣35品以四份進行試驗。二次GSSM篩選的例子在圖14中圖示闡述。孔E3-H3、A4-D4、A7-D7中的樣品平均而言具有比野生型更高的活性。這12個孔相應於3個命中,因為所述樣品以四份進行試驗。這些樣品是圖13中孔E4、G2和H3中所示的初步命中(板2980-AA89BCA板)。從二次篩選得到77個命中。這些樣品被測序。所述樣品的三十五個具有胺基酸變化,22個具有轉座子插入,而其餘是野生型或具有缺失。5進一歩分析來自二次篩選的命中。將GSSM上遊突變體(upmutants)作圖於褐色熱單孢菌E4的晶體結構上。基於胺基酸位置、胺基酸變化和摺疊改善分數(foldimprovementscore),區分樣品的優先次序。從GSSM篩選選出八個上遊突變體,它們被選擇來進行基因再裝配進化,即可調基因再裝配(TGR),如上所討論的,也參見例如美國專利6,537,776。10表2.選擇用於點定誘變再裝配的上遊突變型tableseeoriginaldocumentpage179上遊突變型的摻混使用基因再裝配(可調基因再裝配(TGR))技術,在上面的表2中示出15的上遊突變型被摻混,以鑑定具有最佳活性的候選。活性測定與GSSM篩選中的相同,只是反應物被進一步稀釋,以考慮到上遊突變型相對於野生型酶具有增加的活性。圖15以圖形數據進行舉例說明,該數據來自混合的或"摻混(blended)"的GSSMTM篩選測定。總之,本發明提供了具有纖維素酶活性的酶,其具有下面的基於SEQID20NO:164(由例如SEQIDNO:163編碼)的序列tableseeoriginaldocumentpage180已經描述了本發明的許多方面。然而,應該理解到可以進行多種變化,而它們並不背離本發明的精神和範圍。因此,其它方面在權利要求的範圍內。權利要求1.分離的或重組的核酸,其包括(a)與如下序列在至少大約20、30、40、50、75、100、150、200、250、300、350、400、450、500、550、600、650、700、750、800、850、900、950、1000、1050、1100、1150或更多個殘基的區域內,具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高或完全的序列同一性的核酸序列SEQIDNO1、SEQIDNO3、SEQIDNO5、SEQIDNO7、SEQIDNO9、SEQIDNO11、SEQIDNO13、SEQIDNO15、SEQIDNO17、SEQIDNO19、SEQIDNO21、SEQIDNO23、SEQIDNO25、SEQIDNO27、SEQIDNO29、SEQIDNO31、SEQIDNO33、SEQIDNO35、SEQIDNO37、SEQIDNO39、SEQIDNO41、SEQIDNO43、SEQIDNO45、SEQIDNO47、SEQIDNO49、SEQIDNO51、SEQIDNO53、SEQIDNO55、SEQIDNO57、SEQIDNO59、SEQIDNO61、SEQIDNO63、SEQIDNO65、SEQIDNO67、SEQIDNO69、SEQIDNO71、SEQIDNO73、SEQIDNO75、SEQIDNO77、SEQIDNO79、SEQIDNO81、SEQIDNO83、SEQIDNO85、SEQIDNO87、SEQIDNO89、SEQIDNO91、SEQIDNO93、SEQIDNO95、SEQIDNO97、SEQIDNO99、SEQIDNO101、SEQIDNO103、SEQIDNO105、SEQIDNO107、SEQIDNO109、SEQIDNO111、SEQIDNO113、SEQIDNO115、SEQIDNO117、SEQIDNO119、SEQIDNO121、SEQIDNO.123、SEQIDNO125、SEQIDNO127、SEQIDNO129、SEQIDNO131、SEQIDNO133、SEQIDNO135、SEQIDNO137、SEQIDNO139、SEQIDNO141、SEQIDNO143、SEQIDNO145、SEQIDNO147、SEQIDNO149、SEQIDNO151、SEQIDNO153、SEQIDNO155、SEQIDNO157、SEQIDNO159、SEQIDNO161、SEQIDNO163或SEQIDNO165,其中所述核酸編碼至少一個具有纖維素酶活性的多肽,並且可選地,所述序列同一性通過運用了序列比較算法的分析或通過視覺觀察來確定;或(b)在嚴緊條件下與包含下列序列的核酸雜交的核酸序列SEQIDNO1、SEQIDNO3、SEQIDNO5、SEQIDNO7、SEQIDNO9、SEQIDNO11、SEQIDNO13、SEQIDNO15、SEQIDNO17、SEQIDNO19、SEQIDNO21、SEQIDNO23、SEQIDNO25、SEQIDNO27、SEQIDNO29、SEQIDNO31、SEQIDNO33、SEQIDNO35、SEQIDNO37、SEQIDNO39、SEQIDNO41、SEQIDNO43、SEQIDNO45、SEQIDNO47、SEQIDNO49、SEQIDNO51、SEQIDNO53、SEQIDNO55、SEQIDNO57、SEQIDNO59、SEQIDNO61、SEQIDNO63、SEQIDNO65、SEQIDNO67、SEQIDNO69、SEQIDNO71、SEQIDNO73、SEQIDNO75、SEQIDNO77、SEQIDNO79、SEQIDNO81、SEQIDNO83、SEQIDNO85、SEQIDNO87、SEQIDNO89、SEQIDNO91、SEQIDNO93、SEQIDNO95、SEQIDNO97、SEQIDNO99、SEQIDNO101、SEQIDNO103、SEQIDNO105、SEQIDNO107、SEQIDNO109、SEQIDNO111、SEQIDNO113、SEQIDNO115、SEQIDNO117、SEQIDNO119、SEQIDNO121、SEQIDNO.123、SEQIDNO125、SEQIDNO127、SEQIDNO129、SEQIDNO131、SEQIDNO133、SEQIDNO135、SEQIDNO137、SEQIDNO139、SEQIDNO141、SEQIDNO143、SEQIDNO145、SEQIDNO147、SEQIDNO149、SEQIDNO151、SEQIDNO153、SEQIDNO155、SEQIDNO157、SEQIDNO159、SEQIDNO161、SEQIDNO163或SEQIDNO165,其中所述核酸編碼具有纖維素酶活性的多肽,並且所述嚴緊條件包括洗滌步驟,所述洗滌步驟包括在0.2XSSC中在大約65℃的溫度洗滌大約15分鐘,並且可選地,所述核酸的長度是至少大約20、30、40、50、60、75、100、150、200、300、400、500、600、700、800、900、1000或更多個殘基,或基因的全長或轉錄物的全長;(c)編碼具有如下所示序列的多肽的核酸序列SEQIDNO2、SEQIDNO4、SEQIDNO6、SEQIDNO8、SEQIDNO10、SEQIDNO12、SEQIDNO14、SEQIDNO16、SEQIDNO18、SEQIDNO20、SEQIDNO22、SEQIDNO24、SEQIDNO26、SEQIDNO28、SEQIDNO30、SEQIDNO32、SEQIDNO34、SEQIDNO36、SEQIDNO38、SEQIDNO40、SEQIDNO42、SEQIDNO44、SEQIDNO46、SEQIDNO48、SEQIDNO50、SEQIDNO52、SEQIDNO54、SEQIDNO56、SEQIDNO58、SEQIDNO60、SEQIDNO62、SEQIDNO64、SEQIDNO66、SEQIDNO68、SEQIDNO70、SEQIDNO72、SEQIDNO74、SEQIDNO76、SEQIDNO78、SEQIDNO80、SEQIDNO82、SEQIDNO84、SEQIDNO86、SEQIDNO88、SEQIDNO90、SEQIDNO92、SEQIDNO94、SEQIDNO96、SEQIDNO98、SEQIDNO100、SEQIDNO102、SEQIDNO104、SEQIDNO106、SEQIDNO108、SEQIDNO110、SEQIDNO112、SEQIDNO114、SEQIDNO116、SEQIDNO118、SEQIDNO120、SEQIDNO122、SEQIDNO124、SEQIDNO126、SEQIDNO128、SEQIDNO130、SEQIDNO132、SEQIDNO134、SEQIDNO136、SEQIDNO138、SEQIDNO140、SEQIDNO142、SEQIDNO144、SEQIDNO146、SEQIDNO148、SEQIDNO150、SEQIDNO152、SEQIDNO154、SEQIDNO156、SEQIDNO158、SEQIDNO160、SEQIDNO162、SEQIDNO164或SEQIDNO166;或(d)與(a)、(b)或(c)互補的核酸序列。2.權利要求1所述的分離的或重組的核酸,其中所述核酸序列包括如下所示的序列SEQIDNO:1、SEQIDNO:3、SEQIDNO:5、SEQIDNO:7、SEQIDNO:9、SEQIDNO:ll、SEQIDNO:13、SEQIDNO:15、SEQIDNO:17、SEQIDNO:19、SEQIDNO:21、SEQIDNO:23、SEQIDNO:25、SEQIDNO:27、SEQIDNO:29、SEQIDNO:31、SEQIDNO:33、SEQIDNO:35、SEQIDNO:37、SEQIDNO:39、SEQIDNO:41、SEQIDNO:43、SEQIDNO:45、SEQIDNO:47、SEQIDNO:49、SEQIDNO:51、SEQIDNO:53、SEQIDNO:55、SEQIDNO:57、SEQIDNO:59、SEQIDNO:61、SEQIDNO:63、SEQIDNO:65、SEQIDNO:67、SEQIDNO:69、SEQIDNO:71、SEQIDNO:73、SEQIDNO:75、SEQIDNO:77、SEQIDNO:79、SEQIDNO:81、SEQIDNO:83、SEQIDNO:85、SEQIDNO:87、SEQIDNO:89、SEQIDNO:91、SEQIDNO:93、SEQIDNO:95、SEQIDNO:97、SEQIDNO:99、SEQIDNO:101、SEQIDNO:103、SEQIDNO:105、SEQIDNO:107、SEQIDNO:109、SEQIDNO:lll、SEQIDNO:113、SEQIDNO:115、SEQIDNO:117、SEQIDNO:119、SEQIDNO:121、SEQIDNO:123、SEQIDNO:125、SEQIDNO:127、SEQIDNO:129、SEQIDNO:131、SEQIDNO:133、SEQIDNO:135、SEQIDNO:137、SEQIDNO:139、SEQIDNO:141、SEQIDNO:143、SEQIDNO:145、SEQIDNO:147、SEQIDNO:149、SEQIDNO:151、SEQIDNO:153、SEQIDNO:155、SEQIDNO:157、SEQIDNO:159、SEQIDNO:161、SEQIDNO:163或SEQIDNO:165。3.權利要求1所述的分離的或重組的核酸,其中所述序列比較算法是BLAST2.2.2版本算法,其中過濾設置被設置為blastall-pblastp^i"nrpataa"-FF,所有其它選項被設置為預設。4.權利要求1所述的分離的或重組的核酸,其中所述纖維素酶活性包括內切葡25聚糖酶活性。5.權利要求1所述的分離的或重組的核酸,其中所述纖維素酶活性包括纖維二糖水解酶活性。6.權利要求1所述的分離的或重組的核酸,其中所述纖維素酶活性包括p-葡糖苷酶或甘露聚糖酶活性。7.權利要求1所述的分離的或重組的核酸,其中所述纖維素酶活性包括內切纖維素酶活性。8.權利要求1所述的分離的或重組的核酸,其中所述纖維素酶活性包括水解葡聚糖,產生更小分子量的多糖或寡聚體。9.權利要求1所述的分離的或重組的核酸,其中所述纖維素酶活性包括催化1,4-P-D-糖苷鍵的水解。10.權利要求9所述的分離的或重組的核酸,其中所述內切纖維素酶活性包括內切-l,4-P-內纖維素酶活性。11.權利要求IO所述的分離的或重組的核酸,其中所述1,4-P-D-糖苷鍵活性包括10纖維素、纖維素衍生物、地衣聚糖或穀物中1,4-p-D-糖苷鍵的水解。12.權利要求11所述的分離的或重組的核酸,其中所述纖維素衍生物包括羧甲基纖維素或羥乙基纖維素。13.權利要求11所述的分離的或重組的核酸,其中所述穀物包含P-D-葡聚糖或木糖葡聚糖。14.權利要求1所述的分離的或重組的核酸,其中所述纖維素酶活性包括催化葡聚糖酶鍵的水解。15.權利要求14所述的分離的或重組的核酸,其中所述纖維素酶活性包括催化(3-l,4-和/或P-l,3-葡聚糖酶鍵的水解。16.權利要求14所述的分離的或重組的核酸,其中所述纖維素酶活性包括催化25內切-葡聚糖鍵的水解。17.權利要求16所述的分離的或重組的核酸,其中所述纖維素酶活性包括催化水解內-l,4-卩-D-葡聚糖4-葡聚糖水解酶活性。18.權利要求16所述的分離的或重組的核酸,其中所述纖維素酶活性包括催化內部的內-p-l,4-葡聚糖酶鍵和/或P-l,3-葡聚糖酶鍵的水解。19.權利要求1所述的分離的或重組的核酸,其中所述纖維素酶活性包括催化內部卩-l,3-葡糖苷鍵的水解。20.權利要求1所述的分離的或重組的核酸,其中所述纖維素酶活性包括水解含吡喃型葡萄糖的多糖。21.權利要求20所述的分離的或重組的核酸,其中纖維素酶活性包括水解含1,4-P-糖苷鍵連接的D-吡喃型葡萄糖的多糖。22.權利要求1所述的分離的或重組的核酸,其中所述纖維素酶活性包括水解纖維素、纖維素衍生物或半纖維素。23.權利要求22所述的分離的或重組的核酸,其中所述纖維素酶活性包括水解10木材或紙漿或木材製品或紙製品中的纖維素或半纖維素。24.權利要求1所述的分離的或重組的核酸,其中所述纖維素酶活性包括催化飼料、食品或飲料中葡聚糖的水解。25.權利要求24所述的分離的或重組的核酸,其中所述飼料、食品或飲料包括基於穀物的動物飼料、麥芽汁或啤酒、麵團、水果或蔬菜。26.權利要求1所述的分離的或重組的核酸,其中所述纖維素酶活性包括催化微生物細胞、真菌細胞、哺乳動物細胞、植物細胞或任何含有纖維素部分的植物材料中葡聚糖的水解。27.權利要求l所述的分離的或重組的核酸,其中所述纖維素酶活性是熱穩定的。28.權利要求27所述的分離的或重組的核酸,其中所述多肽在包括如下的溫度25範圍的條件下保持纖維素酶活性大約37'C到大約95'C之間;或大約55'C到大約85'C之間;或大約70'C到大約75'C之間;或大約70'C到大約95'C之間;或大約90°C到大約95t之間,或者在如下範圍內的溫度下保持纖維素酶活性在大約rc到大約5'C之間,大約5'C到大約15'C之間,大約15'C到大約25'C之間,大約25'C到大約37。C之間,或大約37。C到大約95。C、96'C、97°C、98。C或99'C之間。29.權利要求1所述的分離的或重組的核酸,其中所述纖維素酶活性是耐熱的。30.權利要求29所述的分離的或重組的核酸,其中所述多肽在暴露於如下範圍內的溫度後保持纖維素酶活性37'C以上到大約95'C,55'C以上到大約85'C,或大約70'C到大約75'C之間,或90°C以上到大約95°C,或在暴露於如下範圍內的溫度後保持纖維素酶活性在大約1'C到大約5'C之間,大約5'C到大約15'C之間,大約15'C到大約25'C之間,大約25'C到大約37"之間,或大約37。C到大約95°C、96'C、97°C、98。C或99。C之間。31.核酸探針,其用於鑑定編碼具有纖維素酶活性的多肽的核酸,其中所述探針包含權利要求1所述的序列的至少20、30、40、50、60、75、100或150或更多個連續鹼基,其中所述探針通過結合或雜交鑑定所述核酸,其中,可選地,所述探針包括寡核苷酸,所述寡核苷酸含有至少大約10到50、大約20到60、大約30到70、大約40到80、大約60到100或大約50到150個連續鹼基,其中,可選地,所述探針包括SEQIDNO:1、SEQIDN0:3、SEQIDN0:5、SEQIDN0:7、SEQIDN0:9、SEQIDNO:ll、SEQIDNO:13、SEQIDNO:15中所示的序列的連續鹼基。32.擴增引物對,其用於擴增編碼具有纖維素酶活性的多肽的核酸,其中所述擴15增引物對(a)能夠擴增包含權利要求l所述的序列或其子序列的核酸;或(b)包括第一成員和第二成員,所述第一成員具有SEQIDNO:1、SEQIDNO:3、SEQIDNO:5、SEQIDNO:7、SEQIDNO:9、SEQIDNO:ll、SEQIDNO:13、SEQIDNO:15、SEQIDNO:17、SEQIDNO:19、SEQIDNO:21、SEQIDNO:23、SEQIDNO:25、SEQIDNO:27、SEQIDNO:29、SEQIDNO:31、SEQIDNO:33、SEQIDNO:35、SEQIDNO:37、SEQIDNO:39、SEQIDNO:41、SEQIDNO:43、SEQIDNO:45、SEQIDNO:47、SEQIDNO:49、SEQIDNO:51、SEQIDNO:53、SEQIDNO:55、SEQIDNO:57、SEQIDNO:59、SEQIDNO:61、SEQIDNO:63、SEQIDNO:65、SEQIDNO:67、SEQIDNO:69、SEQIDNO:71、SEQIDNO:73、SEQIDNO:75、SEQIDNO:77、SEQIDNO:79、SEQIDNO:81、SEQIDNO:83、SEQIDNO:85、SEQIDNO:87、SEQIDNO:89、SEQIDNO:91、SEQIDNO:93、SEQIDNO:95、SEQIDNO:97、SEQIDNO:99、SEQIDNO:lOl、SEQIDNO:103、SEQIDNO:105、SEQIDNO:107、SEQIDNO:109、SEQIDNO:lll、SEQIDNO:113、SEQIDNO:115、SEQIDNO:117、SEQIDNO:119、SEQIDNO:121、SEQIDNO:123、SEQIDNO:125、SEQIDNO:127、SEQIDNO:129、SEQIDNO:131、SEQIDNO:133、SEQIDNO:135、SEQIDNO:137、SEQIDNO:139、SEQIDNO:141、SEQIDNO:143、SEQIDNO:145、SEQIDNO:147、SEQIDNO:149、SEQIDNO:151、SEQIDNO:153、SEQIDNO:155、SEQIDNO:157、SEQIDNO:159、SEQIDNO:161、SEQIDNO:163或SEQIDNO:165的大約前(5,)12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30或更多個殘基所示的序列,所述第二成員具有所述第一成員的互補鏈的大約前(5,)12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30或更多個殘基所示的序列,其中,可選地,所述擴增引物對的成員包括寡核苷酸,所述寡核苷酸包括所述序列的至少大約10到50個連續鹼基,或者包括所述序列的大約12、13、14、15、16、517、18、19、20、21、22、23、24、25、26、27、28、29、30或更多個連續鹼基。33.編碼纖維素酶的核酸,其通過使用權利要求32所示的擴增引物對擴增多核苷酸而產生,其中可選地,所述擴增通過聚合酶鏈反應(PCR)進行。34.權利要求33所述的編碼纖維素酶的核酸,其中所述核酸通過擴增基因文庫產生,並且可選地,所述基因文庫是環境文庫。35.分離的或重組的纖維素酶,其由權利要求33所述的編碼纖維素酶的核酸編碼。36.擴增編碼具有纖維素酶活性的多肽的核酸的方法,包括用權利要求32所述的擴增引物對擴增模板核酸。37.表達序列盒,其包含含有權利要求l所述序列的核酸。38.載體,所述載體包含含有權利要求1所述序列的核酸,其中可選地,所述載體包括表達載體。39.克隆載體,其包含含有權利要求l所述序列的核酸,其中,可選地,所述克隆載體包括病毒載體、質粒、噬菌體、噬粒、黏粒、fos-質粒、細菌噬菌體或人工染色體,並且可選地,所述病毒載體包括腺病毒載體、逆轉錄病毒載體或腺相關病毒載體,並且可選地,所述克隆載體包括細菌人工染色體(BAC)、質粒、細菌噬菌體P1衍生載體(PAC)、酵母人工染色體(YAC)或哺乳動物人工染色體(MAC)。40.轉化細胞,其包括含有權利要求1所述序列的核酸、或者權利要求37所述表達序列盒、權利要求38所述載體或權利要求39所述克隆載體,其中可選地,所述細胞是細菌細胞、哺乳動物細胞、真菌細胞、酵母細胞、昆蟲細胞或植物細胞。41.轉基因非人動物,其含有權利要求l所述序列,其中可選地,所述轉基因非人動物是小鼠或大鼠。42.轉基因植物,其含有權利要求l所述序列,其中可選地,所述植物是玉米植物、高粱植物、馬鈴薯植物、番茄植物、小麥植5物、含油種子植物、油菜籽植物、大豆植物、水稻植物、大麥植物、草或菸草植物。43.轉基因種子,其含有權利要求1所述序列,其中可選地,所述種子是玉米種子、小麥粒、含油種子、油菜籽、大豆種子、棕櫚核、向日葵種子、芝麻種子、水稻、大麥、花生或菸草植物種子。44.反義寡核苷酸,其包括與權利要求1所述序列或其子序列互補的核酸序列或能與權利要求1所述序列或其子序列在嚴緊條件下雜交的核酸序列,其中可選地,所述反義寡核苷酸的長度在大約10到50、大約20到60、大約30到70、大約40到80或大約60到100個鹼基之間。45.抑制纖維素酶信息在細胞中翻譯的方法,包括向所述細胞施用反義寡核苷酸或在所述細胞中表達反義寡核苷酸,所述反義寡核苷酸包括與權利要求1所述序列互補的核酸序列或能與權利要求1所述序列在嚴緊條件下雜交的核酸序列。46.雙鏈幹擾RNA(RNAi)分子,其含有權利要求1所述序列的子序列,其中,可選地,所述RNAi包括siRNA或miRNA,並且可選地,所述RNAi分子的長度為大約ll、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26或更多個雙鏈核苷酸。47.抑制纖維素酶在細胞中表達的方法,包括向所述細胞施用權利要求46所述的雙鏈幹擾RNA(RNAi)分子或在所述細胞中表達權利要求46所述的雙鏈幹擾RNA(RNAi)分子。48.分離的或重組的多肽,(i)具有在至少大約20、25、30、35、40、45、50、55、60、75、100、150、200、250、300或更多個殘基的區域內,與SEQIDN0:2、SEQIDNO:4、SEQIDNO:6、SEQIDNO:8、SEQIDNO:10、SEQIDNO:12、SEQIDNO:14、SEQIDNO:16、SEQIDNO:18、SEQIDNO:20、SEQIDNO:22、SEQIDNO:24、SEQIDNO:26、SEQIDNO:28、SEQIDNO:30、SEQIDNO:32、SEQIDNO:34、SEQIDNO:36、SEQIDNO:38、SEQIDNO:40、SEQIDNO:42、SEQIDNO:44、SEQIDNO:46、SEQIDNO:48、SEQIDNO:50、SEQIDNO:52、SEQIDNO:54、SEQIDNO:56、SEQIDNO:58、SEQIDNO:60、SEQIDNO:62、SEQIDNO:64、SEQIDNO:66、SEQIDNO:68、SEQIDNO:70、SEQIDNO:72、SEQIDNO:74、SEQIDNO:76、SEQIDNO:78、SEQIDNO:80、SEQIDNO:82、SEQIDNO:84、SEQIDNO:86、SEQIDNO:88、SEQIDNO:90、SEQIDNO:92、SEQIDNO:94、SEQIDNO:96、SEQIDNO:98、SEQIDNO:亂SEQID5NO:102、SEQIDNO:104、SEQIDNO:106、SEQIDNO:108、SEQIDNO:llO、SEQIDNO:112、SEQIDNO:114、SEQIDNO:116、SEQIDNO:118、SEQIDNO:120、SEQIDNO:122、SEQIDNO:124、SEQIDNO:126、SEQIDNO:128、SEQIDNO:130、SEQIDNO:132、SEQIDNO:134、SEQIDNO:136、SEQIDNO:138、SEQIDNO:140、SEQIDNO:142、SEQIDNO:144、SEQIDNO:146、SEQIDNO:148、SEQIDNO:150、SEQIDNO:152、SEQIDNO:154、SEQIDNO:156、SEQIDNO:158、SEQIDNO:160、SEQIDNO:162、SEQIDNO:164或SEQIDNO:166具有至少大約50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、1592%、93%、94%、95%、96%、97%、98%、99%或更高或100%的序列同一性的胺基酸序列,其中,可選地,所述序列同一性通過運用了序列比較算法的分析或通過視覺觀察來確定,以及可選地,所述序列比較算法是BLAST2.2.2版本算法,其中過濾設置被設置為blastall-pblastp"d"nrpataa"-FF,所有其它選項被設置為預設;(ii)具有由權利要求1所述的核酸編碼的胺基酸序列,其中所述多肽具有纖維素酶活性或具有免疫原性活性,這在於它能夠產生特異性結合具有下列序列的多肽的抗體SEQIDNO:2、SEQIDNO:4、SEQIDNO:6、SEQIDNO:8、SEQIDNO:10、SEQIDNO:12、SEQIDNO:14、SEQIDNO:16、SEQIDNO:18、SEQIDNO:20、SEQIDNO:22、SEQIDNO:24、SEQIDNO:26、SEQIDNO:28、SEQIDNO:30、SEQIDNO:32、SEQIDNO:34、SEQIDNO:36、SEQIDNO:38、SEQIDNO:40、SEQIDNO:42、SEQIDNO:44、SEQIDNO:46、SEQIDNO:48、SEQIDNO:50、SEQIDNO:52、SEQIDNO:54、SEQIDNO:56、SEQIDNO:58、SEQIDNO:60、SEQIDNO:62、SEQIDNO:64、SEQIDNO:66、SEQIDNO:68、SEQIDNO:70、SEQDDNO:72、SEQIDNO:74、SEQIDNO:76、SEQIDNO:78、SEQIDNO:80、SEQIDNO:82、SEQIDNO:84、SEQID30NO:86、SEQIDNO:88、SEQIDNO:90、SEQIDNO:92、SEQIDNO:94、SEQIDNO:96、SEQIDNO:98、SEQIDNO:100、SEQIDNO:102、SEQIDNO:104、SEQIDNO:106、SEQIDNO:108、SEQIDNO:110、SEQIDNO:112、SEQIDNO:114、SEQIDNO:116、SEQIDNO:118、SEQIDNO:120、SEQIDNO:122、SEQIDNO:124、SEQIDNO:126、SEQIDNO:128、SEQIDNO:130、SEQIDNO:132、SEQIDNO:134、SEQIDNO:136、SEQIDNO:138、SEQIDNO:140、SEQIDNO:142、SEQIDNO:144、SEQIDNO:146、SEQIDNO:148、SEQIDNO:150、SEQIDNO:152、SEQIDNO:154、SEQIDNO:156、SEQIDNO:158、SEQIDNO:160、SEQIDNO:162、SEQIDNO:164或SEQIDNO:166;或(iii)具有(i)或(ii)所示胺基酸序列,或者由權利要求1所示核酸編碼的多肽,並且包含至少一個胺基酸殘基保守取代,其中,可選地,保守取代包括脂肪族胺基酸用另一個脂肪族胺基酸取代;絲氨酸用蘇氨酸取代,或蘇氨酸用絲氨酸取代;酸性殘基用另一個酸性殘基取代;具有醯胺基團的殘基用另一個具有醯胺基團的殘基取代;鹼性殘基用另一個鹼性殘基來交換;或芳香族殘基用另一個芳香族殘基取代,或其組合,並且可選地,所述脂肪族殘基包括丙氨酸、纈氨酸、亮氨酸、異亮氨酸或其合成等價物;所述酸性殘基包括天冬氨酸、穀氨酸或其合成等價物;所述包含醯胺基團的殘基包括天冬醯胺、穀氨醯胺或其合成等價物所述鹼性殘基包括賴氨酸、精氨酸或其合成等價物;或者,所述芳香族殘基包括苯丙氨酸、酪氨酸或其合成等價物。49.權利要求48所述的分離的或重組的多肽,其中所述纖維素酶活性包括內切葡聚糖酶活性。50.權利要求48所述的分離的或重組的多肽,其中所述纖維素酶活性包括纖維二糖水解酶活性。51.權利要求48所述的分離的或重組的多肽,其中所述纖維素酶活性包括(3-葡糖苷酶或甘露聚糖酶活性。52.權利要求48所述的分離的或重組的多肽,其中所述纖維素酶活性包括內切25纖維素酶活性。53.權利要求48所述的分離的或重組的多肽,其中所述纖維素酶活性包括水解葡聚糖,產生更小分子量的多糖或寡聚體。54.權利要求48所述的分離的或重組的多肽,其中所述纖維素酶活性包括催化1,4-P-D-糖苷鍵的水解。55.權利要求54所述的分離的或重組的多肽,其中所述內切纖維素酶活性包括內切-l,4-P-內纖維素酶活性。56.權利要求54所述的分離的或重組的多肽,其中所述1,4-P-D-糖苷鍵活性包括纖維素、纖維素衍生物、地衣聚糖或穀物中1,4-P-D-糖苷鍵的水解。57.權利要求56所述的分離的或重組的多肽,其中所述纖維素衍生物包括羧甲基纖維素或羥乙基纖維素。58.權利要求56所述的分離的或重組的多肽,其中所述穀物包括j3-D-葡聚糖或木糖葡聚糖。59.權利要求48所述的分離的或重組的多肽,其中所述纖維素酶活性包括催化0葡聚糖酶鍵的水解。60.權利要求59所述的分離的或重組的多肽,其中所述纖維素酶活性包括催化p-l,4-和/或P-l,3-葡聚糖酶鍵的水解。61.權利要求59所述的分離的或重組的多肽,其中所述纖維素酶活性包括催化內切葡聚糖酶鍵的水解。62.權利要求61所述的分離的或重組的多肽,其中所述纖維素酶活性包括催化水解內-l,4-l3-D-葡聚糖4-葡聚糖水解酶活性。63.權利要求61所述的分離的或重組的多肽,其中所述纖維素酶活性包括催化內部的內-P-l,4-葡聚糖酶鍵和/或P-l,3-葡聚糖酶鍵的水解。64.權利要求48所述的分離的或重組的多肽,其中所述纖維素酶活性包括催化25內部的P-l,3-葡糖苷鍵的水解。65.權利要求48所述的分離的或重組的多肽,其中所述纖維素酶活性包括水解含吡喃型葡萄糖的多糖。66.權利要求65所述的分離的或重組的多肽,其中所述纖維素酶活性包括水解含1,4-|3-糖苷鍵連接的D-吡喃型葡萄糖的多糖。67.權利要求48所述的分離的或重組的多肽,其中所述纖維素酶活性包括水解纖維素、纖維素衍生物或半纖維素。68.權利要求67所述的分離的或重組的多肽,其中所述纖維素酶活性包括水解木材或紙漿或木材製品或紙製品中的纖維素或半纖維素。69.權利要求48所述的分離的或重組的多肽,其中所述纖維素酶活性包括催化飼料、食品或飲料中葡聚糖的水解。70.權利要求69所述的分離的或重組的多肽,其中所述飼料、食品或飲料包括基於穀物的動物飼料、麥芽汁或啤酒、麵團、水果或蔬菜。71.權利要求48所述的分離的或重組的多肽,其中所述纖維素酶活性包括催化10微生物細胞、真菌細胞、哺乳動物細胞、植物細胞或任何含有纖維素部分的植物材料中葡聚糖的水解。72.權利要求48所述的分離的或重組的多肽,其中所述纖維素酶活性是熱穩定的。73.權利要求72所述的分離的或重組的多肽,其中所述多肽在包括如下的溫度範圍的條件下保持纖維素酶活性大約37'C到大約95'C之間;或大約55'C到大約85'C之間;或大約70'C到大約75。C之間;或大約7(TC到大約95'C之間;或大約到大約95'C之間,或者在如下範圍內的溫度下保持纖維素酶活性在大約1'C到大約205'C之間,大約5'C到大約15。C之間,大約15。C到大約25'C之間,大約25'C到大約37'C之間,或大約37'C到大約95t:、96°C、97°C、98'C或99。C之間。74.權利要求48所述的分離的或重組的多肽,其中所述纖維素酶活性是耐熱的。75.權利要求74所述的分離的或重組的多肽,其中所述多肽在暴露於如下範圍內的溫度後保持纖維素酶活性37。C以上到大約95'C,或55'C以上到大約85。C,或大約7(TC到大約75'C,或90'C以上到大約95。C,或在暴露於如下範圍的溫度後保持纖維素酶活性在大約rC到大約5t:之間,大約5'C到大約15'C之間,大約15'C到大約25'C之間,大約25。C到大約37'C之間,或大約37'C到大約95°C、96'C、97°C、3098。C或99'C之間。76.分離的或重組的多肽,所述多肽包括在權利要求48中所述的多肽並且缺乏信號或前導序列或前原序列。77.分離的或重組的多肽,所述多肽包括在權利要求48中所述的多肽並且具有異源信號或前導序列或異源前原序列。78.權利要求48所述的分離的或重組的多肽,其中所述纖維素酶活性包括,在大約37'C的比活性為每毫克蛋白大約100到大約1000單位,每毫克蛋白大約500到大約750單位,每毫克蛋白大約500到大約1200單位,或每亳克蛋白大約750到大約1000單位。79.權利要求48所述的分離的或重組的多肽,其中所述耐熱性包括在被加熱到升高的溫度後保留在37'C時纖維素酶比活性的至少一半的比活性,或者其中所述耐熱性包括在被加熱到升高的溫度後,保持在37'C的每毫克蛋白大約500到大約1200單位的範圍內的比活性。80.權利要求48所述的的分離的或重組的多肽,其中所述多肽包括至少一個糖基化位點,並且可選地,所述糖基化是N連接糖基化,並且可選地,所述多肽在畢赤酵母或裂變酵母中表達後被糖基化。81.權利要求48所述的的分離的或重組的多肽,其中所述多肽在包括大約pH6.5、pH6.0、pH5.5、5.0、pH4.5或4.0或更酸性的條件下或在暴露於包括大約pH6.5、pH6.0、pH5.5、5.0、pH4.5或4.0或更酸性的條件下保持纖維素酶活性。82.權利要求48所述的的分離的或重組的多肽,其中所述多肽在包括大約pH7.5、pH8.0、pH8.5、pH9、pH9.5、pH10或pH10.5或更鹼性的條件下或在暴露於包括大約pH7.5、pH8.0、pH8.5、pH9、pH9.5、pH10或pH10.5或更鹼性的條件下保持纖維素酶活性。83.蛋白製劑,所述蛋白製劑包含在權利要求48中所述的多肽,其中所述蛋白製劑包括液體、固體或凝膠。84.異源二聚體,所述異源二聚體包括在權利要求48中所述的多肽和第二結構域,其中,可選地,所述第二結構域是多肽,所述異源二聚體是融合蛋白,以及可選30地,所述第二結構域包括表位、免疫原性肽或標記物。85.同源二聚體,包括在權利要求48中所述的多肽。86.固定化多肽或固定化核酸,其中所述多肽包括在權利要求48中所述的序列,35或其子序列,或者,所述核酸包括權利要求1所述的核酸,或其子序列,或者權利要求31所述的探針,其中可選地,所述多肽或核酸被固定在細胞、金屬、樹脂、聚合物、陶瓷、玻璃、微電極、石墨顆粒、珠子、凝膠、平板、陣列或毛細管上。87.陣列,包括在權利要求86中所述的固定化多肽或者權利要求86中所述的固定化核酸。88.分離的或重組的抗體,其與權利要求48中所述的多肽特異性結合,其中可選地,所述抗體是單克隆或多克隆抗體。89.雜交瘤,含有與權利要求48中所述的多肽特異性結合的抗體。90.分離或鑑定具有纖維素酶活性的多肽的方法,包括如下步驟-(a)提供權利要求88中所述的抗體;(b)提供包含多肽的樣品;和(c)將步驟(b)的樣品與步驟(a)的抗體在所述抗體能與所述多肽特異性結15合的條件下接觸,從而分離或鑑定具有纖維素酶活性的多肽。91.製備抗纖維素酶抗體的方法,包括(a)以足夠的量向非人動物施用在權利要求1中所述的核酸或其子序列,所述的量足以產生體液免疫應答,從而產生抗纖維素酶抗體,或20(b)以足夠的量向非人動物施用在權利要求48中所述的多肽或其子序列,所述的量足以產生體液免疫應答,從而產生抗纖維素酶抗體。92.產生重組多肽的方法,包括如下步驟(a)提供與啟動子可操縱地連接的核酸,其中所述核酸包含權利要求1所述的序列;和(b)在允許多肽表達的條件下表25達步驟(a)的核酸,從而產生重組多肽,其中可選地,所述方法進一步包括用步驟(a)的核酸轉化宿主細胞,隨後表達步驟(a)的核酸,從而在轉化細胞中產生重組多肽。93.用於鑑定具有纖維素酶活性的多肽的方法,所述方法包括如下步驟30(a)提供在權利要求48中所述的多肽;(b)提供纖維素酶底物;和(c)用步驟(b)的底物接觸所述多肽,並檢測底物量的減少或反應產物量的增加,其中所述底物量的減少或所述反應產物量的增加檢測出具有纖維素酶活性的多肽。94.用於鑑定纖維素酶底物的方法,包括如下步驟-(a)提供在權利要求48中所述的多肽;(b)提供測試底物;和(c)用步驟(b)的測試底物接觸步驟(a)的多肽,並檢測底物量的減少或反應產物量的增加,其中所述底物量的減少或所述反應產物量的增加鑑定出作為纖維素酶底物的測試底物。95.確定測試化合物是否與多肽特異性結合的方法,所述方法包括如下步驟(a)在允許核酸翻譯為多肽的條件下表達所述核酸或包含所述核酸的載體,其中所述核酸具有在權利要求1中所述的序列;(b)提供測試化合物;(C)用所述測試化合物接觸所述多肽;和(d)確定步驟(b)的測試化合物是否與所述多肽特異性結合。96.確定測試化合物是否與多肽特異性結合的方法,所述方法包括如下步驟15(a)提供在權利要求48中所述的多肽;(b)提供測試化合物;(C)用所述測試化合物接觸所述多肽;和(d)確定步驟(b)的測試化合物是否與所述多肽特異性結合。97.鑑定纖維素酶活性的調節劑的方法,所述方法包括如下步驟(a)提供在權利要求48中所述的多肽;(b)提供測試化合物;(c)用步驟(b)的測試化合物接觸步驟(a)的多肽,並測定該葡聚糖酶的活性,其中在存在測試化合物的情況下測定的纖維素酶活性與不存在測試化合物的情25況下的活性相比的變化,提供了該測試化合物調節纖維素酶活性的確定方法。98.權利要求97所述的方法,其中所述纖維素酶活性通過提供纖維素酶底物並檢測所述底物量的減少或反應產物量的增加,或所述底物量的增加或反應產物量的減少來測量,30其中,可選地,與沒有所述測試化合物時底物或反應產物的量相比,有測試化合物時所述底物量的減少或所述反應產物量的增加鑑定出作為纖維素酶活性的激活劑的測試化合物,並且可選地,與沒有所述測試化合物時底物或反應產物的量相比,有測試化合物時所述底物量的增加或所述反應產物量的減少鑑定出作為纖維素酶活性的抑制劑的35測試化合物。99.計算機系統,包括處理器和數據存儲設備,其中所述數據存儲設備上己經存儲了多肽序列或核酸序列,其中所述多肽序列包括在權利要求48中所述的序列,由在權利要求1中所述的核酸編碼的多肽,5其中可選地,所述計算機系統進一步包括序列比較算法和數據存儲設備,其中所述數據存儲設備上已經存儲了至少一個參考序列,或者進一步包括在所述序列中鑑定一個或多個特徵的鑑定器,並且可選地,所述序列比較算法包括指明多態性的電腦程式。100.計算機可讀介質,其上已經存儲了多肽序列或核酸序列,其中所述多肽序列包括在權利要求48中所述的多肽,或者由在權利要求1中所述的核酸編碼的多肽。101.用於鑑定序列中的特徵的方法,所述方法包括如下步驟(a)使用可鑑定序列中的一個或多個特徵的電腦程式讀取所述序列,其中所述序列包括多肽序列或15核酸序列,其中所述多肽序列包括在權利要求48中所述的多肽;由在權利要求l中所述的核酸編碼的多肽;和(b)用所述電腦程式鑑定序列中的一個或多個特徵。102.用於將第一序列與第二序列進行比較的方法,所述方法包括如下步驟(a)通過使用比較序列的電腦程式讀取所述第一序列和所述第二序列,其中所述第一序20列包括多肽序列或核酸序列,其中所述多肽序列包括在權利要求48中所述的多肽或由權利要求1中所述的核酸編碼的多肽;和(b)用所述電腦程式確定所述第一序列和所述第二序列之間的差異,其中可選地,所述方法進一步包括確定所述第一序列和所述第二序列之間的差異的步驟,或者可選地,所述方法進一步包括鑑定多態性的步驟,或者可選地,所述方25法進一步包括使用鑑定序列中的一個或多個特徵的鑑定器,或者可選地,所述方法包括使用電腦程式讀取所述第一序列,並鑑定該序列的一個或多個特徵。103.用於從環境樣品中分離或回收核酸的方法,所述核酸編碼具有纖維素酶活30性的多肽,該方法包括如下步驟(a)提供了在權利要求32中所述的擴增引物對;(b)從所述環境樣品中分離核酸,或處理所述環境樣品以便所述樣品中的核酸易於與所述擴增引物對雜交;和(c)將步驟(b)的核酸與步驟(a)的擴增引物對結合,從所述環境樣品中35擴增出核酸,從而從環境樣品中分離或回收編碼具有纖維素酶活性的多肽的核酸。104.從環境樣品中分離或回收核酸的方法,所述核酸編碼具有纖維素酶活性的多肽,該方法包括如下步驟(a)提供包含權利要求1所述的序列或其子序列的多核苷酸探針,或者權利要求31所述的探針;5(b)從所述環境樣品分離核酸,或處理所述環境樣品,以便所述樣品中的核酸易於與步驟(a)的多核苷酸探針雜交;(c)將步驟(a)的多核苷酸探針與步驟(b)的分離的核酸或處理的環境樣品結合;和(d)分離與步驟(a)的多核苷酸探針特異性雜交的核酸,從而從所述環境樣品10中分離或回收編碼具有纖維素酶活性的多肽的核酸。105.權利要求103或權利要求104所述的方法,其中所述環境樣品包括水樣品、液體樣品、土壤樣品、空氣樣品或生物樣品,並且可選地,所述生物樣品來源於細菌細胞、原生動物細胞、昆蟲細胞、酵母細胞、植物細胞、真菌細胞或哺乳動物細胞。15106.產生編碼具有纖維素酶活性的多肽的核酸變體的方法,包括如下步驟(a)提供包含權利要求l所述的序列的模板核酸;和(b)在所述模板序列中修飾、刪除或添加一個或多個核苷酸,或進行修飾、刪除和添加的組合,以產生所述模板核酸的變體,20其中可選地,所述方法進一步包括表達所述變體核酸,以產生變體纖維素酶多肽,以及可選地,所述的修飾、添加或刪除通過包括如下方法中的方法來引入易錯PCR、改組、寡核苷酸誘導的定向突變、裝配PCR、有性PCR誘變、體內誘變、盒式誘變、遞歸整體誘變、指數整體誘變、位點特異性誘變、基因再裝配、基因位點飽和誘變(GSSM)、合成連接重裝配(SLR)、重組、遞歸序列重組、硫代磷酸酯修飾25的DNA誘變、含尿嘧啶模板誘變、缺口雙鏈體誘變、點錯配修復誘變、修復缺陷型宿主株誘變、化學誘變、放射誘變、缺失誘變、限制選擇誘變、限制純化誘變、人工基因合成、整體誘變、嵌合核酸多聚體生成及其組合,以及可選地,所述方法被迭代重複,直到產生與所述模板核酸編碼的多肽相比具有改變的或不同的活性或者改變的或不同的穩定性的纖維素酶。30107.權利要求106所述的方法,其中所述變體纖維素酶多肽(a)是耐熱的,在暴露於增高的溫度之後仍保持一些活性;(b)與模板核酸編碼的纖維素酶相比,具有增加的糖基化;或(c)在高溫下具有纖維素酶活性,其中由所述模板核酸編碼的纖維素酶在所述高溫下沒有活性。108.權利要求106所述的方法,其中所述方法被迭代重複,直到(a)產生具有與所述模板核酸的密碼子使用有所不同的密碼子使用的纖維素酶編碼序列,或(b)產生具有比所述模板核酸的信息表達或穩定性更高或更低水平的信息表達或穩定性的纖維素酶基因。109.在編碼具有纖維素酶活性的多肽的核酸中修飾密碼子以增加其在宿主細胞中的表達的方法,所述方法包括如下步驟(a)提供編碼具有纖維素酶活性的多肽的核酸,所述核酸包含權利要求1中所述的序列;和10(b)鑑定步驟(a)的核酸中非優選或較不優選的密碼子,用優選的或中度使用的密碼子來代替它,所述優選或中度使用的密碼子編碼與被取代的密碼子相同的胺基酸,其中優選密碼子是在宿主細胞的基因的編碼序列中過度表現的密碼子,非優選或較不優選密碼子是在宿主細胞的基因的編碼序列中表現不足的密碼子,從而修飾所述核酸以增加其在宿主細胞中的表達。110.在編碼纖維素酶多肽的核酸中修飾密碼子的方法,所述方法包括如下步驟(a)提供編碼具有纖維素酶活性的多肽的核酸,所述核酸包含權利要求1中所述的序列;和(b)鑑定步驟(a)的核酸中的密碼子,並用不同的密碼子來代替它,所述不20同的密碼子編碼與被取代的密碼子相同的胺基酸,從而修飾在編碼纖維素酶的核酸中的密碼子。111.在編碼纖維素酶多肽的核酸中修飾密碼子以增加其在宿主細胞中的表達的方法,該方法包括如下步驟25(a)提供編碼纖維素酶多肽的核酸,所述核酸包含權利要求1中所述的序列;和(b)鑑定步驟(a)的核酸中的非優選或較不優選的密碼子,並用優選的或中度使用的密碼子來代替它,所述優選或中度使用的密碼子編碼與被取代的密碼子相同的胺基酸,其中優選密碼子是在宿主細胞的基因的編碼序列中過度表現的密碼子,非優30選或較不優選密碼子是在宿主細胞的基因的編碼序列中表現不足的密碼子,從而修飾所述核酸以增加其在宿主細胞中的表達。112.在編碼具有纖維素酶活性的多肽的核酸中修飾密碼子以降低其在宿主細胞中的表達的方法,該方法包括如下步驟-35(a)提供編碼纖維素酶多肽的的核酸,所述核酸包含在權利要求1中所述的序列;禾口(b)鑑定步驟(a)的核酸中的至少一個優選密碼子,並用非優選的或較不優選的密碼子來代替它,所述非優選或較不優選的密碼子編碼與被取代的密碼子相同的胺基酸,其中優選密碼子是在宿主細胞的基因的編碼序列中過度表現的密碼子,非優選5或較不優選的密碼子是在宿主細胞的基因的編碼序列中表現不足的密碼子,從而修飾所述核酸以降低其在宿主細胞中的表達,其中可選地,所述宿主細胞是細菌細胞、真菌細胞、昆蟲細胞、酵母細胞、植物細胞或哺乳動物細胞。113.用於產生核酸文庫的方法,所述核酸編碼多個被修飾的纖維素酶活性位點或底物結合位點,其中所述被修飾的活性位點或底物結合位點來源於第一核酸,所述第一核酸包含編碼第一活性位點或第一底物結合位點的序列,該方法包括如下步驟-(a)提供第一核酸,其編碼第一活性位點或第一底物結合位點,其中所述第一核酸序列包括在嚴緊條件下與如下所示序列雜交的序列SEQIDNO:l、SEQID15NO:3、SEQIDNO:5、SEQIDNO:7、SEQIDNO:9、SEQIDNO:ll、SEQIDNO:13、SEQIDNO:15、SEQIDNO:17、SEQIDNO:19、SEQIDNO:21、SEQIDNO:23、SEQIDNO:25、SEQIDNO:27、SEQIDNO:29、SEQIDNO:31、SEQIDNO:33、SEQIDNO:35、SEQIDNO:37、SEQIDNO:39、SEQIDNO:41、SEQIDNO:43、SEQIDNO:45、SEQIDNO:47、SEQIDNO:49、SEQIDNO:51、SEQIDNO:53、SEQIDNO:55、SEQ20IDNO:57、SEQIDNO:59、SEQIDNO:61、SEQIDNO:63、SEQ翻0:65、SEQIDNO:67、SEQIDNO:69、SEQIDNO:71、SEQIDNO:73、SEQIDNO:75、SEQIDNO:77、SEQIDNO:79、SEQIDNO:81、SEQIDNO:83、SEQIDNO:85、SEQIDNO:87、SEQIDNO:89、SEQIDNO:91、SEQIDNO:93、SEQIDNO:95、SEQIDNO:97、SEQIDNO:99、SEQIDNO:101、SEQIDNO:103、SEQIDNO:105、SEQIDNO:107、SEQID25NO:109、SEQIDNO:lll、SEQIDNO:113、SEQIDNO:115、SEQIDNO:117、SEQIDNO:119、SEQIDNO:121、SEQIDNO:123、SEQIDNO:125、SEQIDNO:127、SEQIDNO:129、SEQIDNO:131、SEQIDNO:133、SEQIDNO:135、SEQIDNO:137、SEQIDNO:139、SEQIDNO:141、SEQIDNO:143、SEQIDNO:145、SEQIDNO:147、SEQIDNO:149、SEQIDNO:151、SEQIDNO:153、SEQIDNO:155、SEQIDNO:157、30SEQIDNO:159、SEQIDNO:161、SEQIDNO:163或SEQIDNO:165或其子序列,並且所述核酸編碼纖維素酶活性位點或纖維素酶底物結合位點;(b)提供一組誘變寡核苷酸,其在所述第一核酸的多個目標密碼子處編碼天然發生的胺基酸變體;和(c)使用該組誘變寡核苷酸,產生一組編碼活性位點或編碼底物結合位點的變35體核酸,其在被誘變的每一胺基酸密碼子處編碼一定範圍的胺基酸變化,從而產生編碼多個被修飾的纖維素酶活性位點或底物結合位點的核酸文庫,其中可選地,誘變寡核苷酸或變體核酸通過如下方法中的方法產生優化的定向進化系統、基因位點飽和誘變(GSSM)或合成連接重裝配(SLR)、易錯PCR、改組、寡核苷酸誘導的定向突變、裝配PCR、有性PCR誘變、體內誘變、盒式誘變、5遞歸整體誘變、指數整體誘變、位點特異性誘變、基因再裝配、重組、遞歸序列重組、硫代磷酸酯修飾的DNA誘變、含尿嘧啶模板誘變、缺口雙鏈體誘變、點錯配修復誘變、修復缺陷型宿主株誘變、化學誘變、放射誘變、缺失誘變、限制選擇誘變、限制純化誘變、人工基因合成、整體誘變、嵌合核酸多聚體生成及其組合。114.用於產生小分子的方法,包括如下步驟(a)提供多個能合成或修飾小分子的生物合成酶,其中所述酶中的一種酶包括由包含權利要求1所述序列的核酸編碼的纖維素酶;(b)為步驟(a)的至少一種酶提供底物;和(c)將步驟(b)的底物與所述酶在能促進多個生物催化反應的條件下通過一系15列生物催化反應進行反應,以產生小分子。115.用於修飾小分子的方法,所述方法包括如下步驟(a)提供纖維素酶,其中所述酶包括在權利要求48中所述的多肽,或由包含權利要求1所述核酸序列的核酸編碼的多肽;20(b)提供小分子;和(c)將步驟(b)的小分子與步驟(a)的酶在能促進由所述纖維素酶催化的酶促反應的條件下進行反應,從而通過纖維素酶酶促反應修飾小分子,其中可選地,步驟(b)包括為步驟(a)的酶提供多個小分子底物,從而產生由所述纖維素酶催化的至少一種酶促反應產生的被修飾小分子的文庫;25並且可選地,所述方法進一步包括提供多個其它的酶,在有助於所述酶介導的多個生物催化反應的條件下使用這些酶,以形成由多個酶促反應產生的被修飾小分子的文庫;並且可選地,所述方法進一步包括測試所述文庫的步驟,以確定所述文庫中是否存在表現出期望活性的特定被修飾小分子,其中可選地,測試所述文庫的步驟進一步30包括系統性地去除所有但保留一個用於產生在所述文庫中的多個被修飾小分子中的一部分小分子的生物催化反應,方法是通過測試被修飾小分子的所述部分中存在或不存在具有期望活性的特定被修飾小分子,鑑定產生具有期望活性的特定修飾小分子的至少一個特定生物催化反應。116.用於確定纖維素酶的功能片段的方法,包括如下步驟(a)提供纖維素酶,其中該酶包括在權利要求48中所述的多肽、或由權利要求l所述的核酸編碼的多肽;和(b)從步驟(a)的序列刪除多個胺基酸殘基,並測試剩餘的子序列的纖維素酶活性,從而確定纖維素酶的功能片段,5其中可選地,所述纖維素酶活性通過提供纖維素酶底物並檢測所述底物量的減少或反應產物量的增加來測量。117.通過使用實時代謝流分析來獲得新的或修飾的表型的全細胞工程的方法,該方法包括如下步驟10(a)通過修飾細胞的遺傳組成來製備修飾的細胞,其中所述的遺傳組成通過將包含權利要求1所述序列的核酸加入到所述細胞中來修飾;(b)培養所述修飾的細胞以產生多個修飾細胞;(c)通過實時監控步驟(b)的細胞培養物測量所述細胞的至少一個代謝參數;和15(d)分析步驟(c)的數據,以確定測量的參數是否與在類似條件下未修飾細胞中的參照測量值不同,從而使用實時代謝流分析鑑定細胞中的工程表現型,其中可選地,所述細胞的遺傳組成通過包括在所述細胞中刪除序列或修飾序列,或敲除基因的表達的方法來修飾,以及可選地,所述方法進一步包括選擇含有新的工程表現型的細胞,20以及可選地,所述方法進一步包括培養所選擇的細胞,從而產生包含新的工程表型的新細胞株。118.分離出的或重組的信號或前導序列,其由(a)權利要求48所述的胺基酸序列或(b)SEQIDNO:2、SEQIDNO:4、SEQIDNO:6、SEQIDNO:8、SEQIDNO:IO、25SEQIDNO:12、SEQIDNO:14、SEQIDNO:16、SEQIDNO:18、SEQIDNO:20、SEQIDNO:22、SEQIDNO:24、SEQIDNO:26、SEQIDNO:28、SEQIDNO:30、SEQIDNO:32、SEQIDNO:34、SEQIDNO:36、SEQIDNO:38、SEQIDNO:40、SEQIDNO:42、SEQIDNO:44、SEQIDNO:46、SEQIDNO:48、SEQIDNO:50、SEQIDNO:52、SEQIDNO:54、SEQIDNO:56、SEQIDNO:58、SEQIDNO:60、SEQIDNO:62、SEQID30NO:64、SEQIDNO:66、SEQIDNO:68、SEQIDNO:70、SEQIDNO:72、SEQIDNO:74、SEQIDNO:76、SEQIDNO:78、SEQIDNO:80、SEQIDNO:82、SEQIDNO:84、SEQIDNO:86、SEQIDNO:88、SEQIDNO:90、SEQIDNO:92、SEQIDNO:94、SEQIDNO:96、SEQIDNO:98、SEQIDNO:100、SEQIDNO:102、SEQIDNO:104、SEQIDNO:106、SEQIDNO:108、SEQIDNO:110、SEQIDNO:112、SEQIDNO:114、SEQ35IDNO:116、SEQIDNO:118、SEQIDNO:120、SEQIDNO:122、SEQIDNO:124、SEQIDNO:126、SEQIDNO:128、SEQIDNO:130、SEQIDNO:132、SEQIDNO:134、SEQIDNO:136、SEQIDNO:138、SEQIDNO:140、SEQIDNO:142、SEQIDNO:144、SEQIDNO:146、SEQIDNO:148、SEQIDNO:150、SEQIDNO:152、SEQIDNO:154、SEQIDNO:156、SEQIDNO:158、SEQIDNO:160、SEQIDNO:162、SEQIDNO:1645或SEQIDNO:166所述的胺基酸序列的氨基末端殘基1至14、1至15、1至16、I至17、1至18、1至19、1至20、1至21、1至22、1至23、1至24、1至25、1至26、1至27、1至28、1至29、1至30、1至31、1至32、1至33、1至34、1至35、1至36、1至37、1至38、1至40、1至41、1至42、1至43或1至44所示的胺基酸序列組成。119.嵌合多肽,其含有至少第一結構域和至少第二結構域,所述至少第一結構域含有具有權利要求118所示胺基酸序列的信號肽(SP)或前導序列,所述至少第二結構域含有異源的多肽或肽,其中所述異源多肽或肽與所述信號肽(SP)或前導序列不是天然相關的,15並且可選地,所述異源多肽或肽不是纖維素酶,以及可選地,所述異源多肽或肽是在所述信號肽(SP)或前導序列的氨基末端、羧基末端或兩個末端上。120.編碼嵌合多肽的分離出的或重組的核酸,其中所述嵌合多肽含有至少第一結構域和至少第二結構域,所述至少第一結構域含有具有權利要求118所示胺基酸序20列的信號肽(SP)或前導序列,所述至少第二結構域含有異源的多肽或肽,其中所述異源多肽或肽與所述信號肽(SP)或前導序列不是天然相關的。121.分離的或重組的核酸,其包含編碼具有纖維素酶活性的多肽和信號序列的序列,其中所述核酸包含權利要求l所述的序列。122.權利要求121所述的分離的或重組的核酸,其中所述信號序列來源於另一種纖維素酶或非纖維素酶。123.分離的或重組的核酸,其包含編碼具有纖維素酶活性的多肽的序列,其中30所述序列不含有信號序列,並且所述核酸包含權利要求l所述的序列。124.增加纖維素酶多肽的耐熱性或熱穩定性的方法,所述方法包括對纖維素酶進行糖基化,其中所述多肽包括在權利要求48中所示的多肽或由權利要求1所示核酸編碼的多肽的至少30個連續胺基酸,從而增加所述纖維素酶的耐熱性或熱穩定性。125.在細胞中過表達重組纖維素酶的方法,包括表達含有權利要求1所示核酸序列的載體,其中所述過表達通過使用高活性的啟動子、雙順反子載體或通過所述載體的基因擴增來完成。126.製備轉基因植物的方法,所述方法包括如下步驟-5(a)將異源核酸序列導入細胞中,其中所述異源核酸序列包括權利要求1所述的序列,從而產生轉化的植物細胞;(b)從所述轉化的細胞產生轉基因植物,其中可選地,步驟(a)進一步包括通過植物細胞原生質體的電穿孔或顯微注射導入所述異源核酸序列,10以及可選地,步驟(a)包括通過DNA微粒轟擊或通過使用根瘤農桿菌宿主將所述異源核酸序列直接導入植物組織中。127.在植物細胞中表達異源核酸序列的方法,所述方法包括如下步驟(a)用與啟動子可操縱地連接的異源核酸序列轉化所述植物細胞,其中所述異15源核酸序列包括權利要求I所述的序列(b)在其中所述異源核酸序列在所述植物細胞中表達的條件下培養所述植物。128.水解、分解或破壞含葡聚糖或纖維素的組合物的方法,包括下面的步驟(a)提供權利要求48中所示的具有纖維素酶活性的多肽,或由權利要求1所示的20核酸編碼的多肽;(b)提供含有纖維素或葡聚糖的組合物;和(c)將步驟(a)的多肽與步驟(b)的組合物在一定條件下接觸,其中所述纖維素酶水解、分解或破壞所述含葡聚糖或纖維素的組合物,其中可選地,所述組合物包括植物細胞、細菌細胞、酵母細胞、昆蟲細胞或動物25細胞,以及可選地,所述多肽具有內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或卩-葡糖苷酶活性。129.麵團或麵包產品,其含有權利要求48所示的多肽或權利要求1所示的核酸30編碼的多肽,其中可選地,所述多肽具有纖維素酶、內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶活性。130.改進麵團的方法,包括將麵團或麵包產品與權利要求48中所示的至少一種多肽或權利要求1所示的核酸編碼的多肽在足以改進所述麵團的條件下接觸。131.飲料,其含有權利要求48所示的多肽或權利要求1所示的核酸編碼的多肽,其中可選地,所述多肽具有內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶活性。132.生產飲料的方法,其包括向飲料或飲料前體在足以降低所述飲料粘度的條5件下施用至少一種權利要求48所示的多肽或權利要求1所示的核酸編碼的多肽,其中可選地,所述飲料或飲料前體是麥芽汁或啤酒。133.食物、詞料或營養補充劑,其含有權利要求48所示的多肽或權利要求1所示的核酸編碼的多肽,其中可選地,所述多肽具有纖維素酶、內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或p-葡糖苷酶活性。134.利用纖維素酶作為動物飲食中的營養補充劑的方法,所述方法包括製備含有纖維素酶的營養補充劑,所述纖維素酶包含權利要求48所示多肽或者由權利要求1所示核酸編碼的多肽的至少三十個連續胺基酸;和15向動物施用所述營養補充劑,以增加包含在被所述動物消化的飼料或食物中的木聚糖的利用,其中,可選地,所述動物是人,或者所述動物是反芻動物或單胃動物,以及可選地,所述纖維素酶通過在選自細菌、酵母、植物、昆蟲、真菌和動物的生物體中表達編碼所述纖維素酶的多核苷酸而製備出來,以及可選地,所述生物體選20自裂變酵母、釀酒酵母、畢赤酵母、大腸桿菌、鏈黴菌屬某種、桿菌屬某種和乳酸桿菌屬某種。135.可食用的酶輸送基質或丸,其含有熱穩定的重組纖維素酶,所述重組纖維素酶含有權利要求48所示的多肽或權利要求1所示的核酸編碼的多肽,其中可選地,所述多肽具有纖維素酶、內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或p-葡糖苷酶活性。136.將纖維素酶補充物輸送至動物的方法,所述方法包括製備可食用的酶輸送基質或丸,所述基質或丸包括顆粒狀的可食用載體和熱穩定的重組纖維素酶,其中所述的丸容易將包含在其中的纖維素酶分散至含水介質中,並且所述重組的纖維素酶含有權利要求48所示的多肽或權利要求1所示的核酸編碼的多肽;以及將所述可食用的酶輸送基質或丸給予所述動物,其中可選地,所述顆粒狀的可食用載體包括選自穀物胚芽、去油的穀物胚芽、乾草、苜蓿、梯牧草、大豆殼、向日葵籽粉和小麥粗粉的載體,以及可選地,所述可食用載劑包括去油的穀物胚芽,以及可選地,所述纖維素酶被糖基化以便提供在制丸條件下的熱穩定性,以及可選地,所述輸送基質通過將含有穀物胚芽和纖維素酶的混合物制丸而形成,以及可選地,所述制丸條件包括應用蒸汽,以及可選地,所述的制丸條件包括應5用超過大約80°C的溫度大約5分鐘,所述酶保留每毫克酶至少350至大約900單位的比活性。137.纖維素組合物或纖維素衍生的組合物,其包含權利要求48所示的多肽或權利要求1所示的核酸編碼的多肽,其中可選地,所述多肽具有纖維素酶、內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或p-葡糖苷酶活性。138.木材、紙漿或木製品,其含有權利要求48所示的纖維素酶或權利要求1所示的核酸編碼的纖維素酶,其中可選地,所述纖維素酶的活性包括內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶活性。139.紙、紙漿或紙產品,其包含權利要求48所示的多肽或權利要求1所示的核酸編碼的多肽,其中可選地,所述多肽具有纖維素酶、內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶活性。140.降低紙、木材或木製品中纖維素含量的方法,包括使所述紙、木材或木製品與權利要求48所示的纖維素酶或權利要求1所示的核酸編碼的纖維素酶接觸,其中可選地,所述纖維素酶的活性包括內切葡聚糖酶;纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶活性。141.去街劑組合物,其含有權利要求48所示的纖維素酶或權利要求1所示的核酸編碼的纖維素酶,其中可選地,所述多肽被配製成不含水的液體組合物、鑄型固體、顆粒形式、微粒形式、壓縮片劑、凝膠、糊劑或漿液的形式,以及可選地,所述纖維素酶的活性包括內切葡聚糖酶、纖維二糖水解酶、甘露聚30糖酶和/或(3-葡糖苷酶活性。142.藥物組合物或飲食補充物,其含有權利要求48所示的纖維素酶或權利要求1所示的核酸編碼的纖維素酶,其中可選地,所述纖維素酶被配製成片劑、凝膠、藥丸、植入物、液體、噴劑、35粉末、食物、飼料球或配製成膠囊化的製劑,以及可選地,所述纖維素酶的活性包括內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶活性。143.燃料,其含有權利要求48所示的多肽或權利要求1所示的核酸編碼的多肽,其中可選地,所述多肽具有活性,包括纖維素酶、內切葡聚糖酶、纖維二糖水解酶、5甘露聚糖酶和/或P-葡糖苷酶活性,其中可選地,所述燃料來源於植物材料,其任選地包括馬鈴薯、大豆(油菜籽)、大麥、黑麥、玉米、燕麥、小麥、甜菜或甘蔗,以及可選地,所述燃料包括生物乙醇或汽油-乙醇混合物。144.製備燃料的方法,包括使含有纖維素或可發酵糖類的組合物與權利要求48所示的多肽或權利要求1所示的核酸編碼的多肽接觸,其中可選地,所述含有纖維素或可發酵糖類的組合物包括植物、植物產品或植物衍生物,以及可選地,所述植物或植物產品包括甘蔗植物或植物產品、甜菜或糖用甜菜、小麥、玉米、大豆、馬鈴薯、水稻或大麥,15其中可任選地,所述多肽具有活性,包括纖維素酶、內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶活性,以及可選地,所述燃料包括生物乙醇或汽油-乙醇混合物。145.製備生物乙醇的方法,包括使含有纖維素或可發酵糖類的組合物與權利要20求48所示的多肽或權利要求1所示的核酸編碼的多肽接觸,其中可選地,所述含有纖維素或可發酵糖類的組合物包括植物、植物產品或植物衍生物,以及可選地,所述植物或植物產品包括甘蔗植物或植物產品、甜菜或糖用甜菜、小麥、玉米、大豆、馬鈴薯、水稻或大麥,其中可選地,所述多肽具有活性,包括纖維素酶、內切葡聚糖酶、纖維二糖水解25酶、甘露聚糖酶和/或P-葡糖苷酶活性。146.酶裝配體,其用於將纖維素和半纖維素聚合物解聚成可代謝的碳部分,包括權利要求48所示的多肽或權利要求1所示的核酸編碼的多肽,其中可選地,所述多肽具有活性,包括纖維素酶、內切葡聚糖酶、纖維二糖水解30酶、甘露聚糖酶和/或|3-葡糖苷酶活性。147.加工含有木質纖維素的生物質材料的方法,包括使含有纖維素或可發酵糖類的組合物與權利要求48所示的多肽或權利要求1所示的核酸編碼的多肽接觸,其中可選地,所述含有木質纖維素的生物質材料是來源於農作物,是食品或飼料35生產的副產物,是木素纖維素廢品,或者是植物殘餘或廢紙或廢紙品,並且可選地,所述多肽具有活性,包括纖維素酶、內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或p-葡糖苷酶活性,以及可選地,所述植物殘餘包括莖、葉、殼、皮、穗軸、木材、木屑、木漿和鋸屑,以及可選地,所述廢紙品包括廢棄的或用過的複印紙、計算機列印紙、筆記本紙、記事本紙、打字機用紙、報紙、雜質、硬紙和基於紙的包裝材料,以及可選地,所述生物質材料的加工產生生物乙醇。148.飲食產品,其含有權利要求48所示的多肽或權利要求1所示的核酸編碼的10多肽,其中可選地,所述飲食產品包括牛奶、冰淇淋、奶酪或酸酪,以及可選地,所述多肽具有活性,包括纖維素酶、內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或P-葡糖苷酶活性。149.改善飲食產品的質地和風味的方法,其包括下列步驟(a)提供權利要求1548所示的多肽或權利要求1所示的核酸編碼的多肽;(b)提供飲食產品;和(c)使步驟(a)的多肽和步驟(b)的飲食產品在其中所述纖維素酶可以改善所述飲食產品的質地和風味的條件下接觸。150.紡織品或織物,其含有權利要求48所示的多肽或權利要求1所示的核酸編20碼的多肽,其中可選地,所述紡織品或織物包括含纖維素的纖維,以及可選地,所述多肽具有活性,包括纖維素酶、內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或卩-葡糖苷酶活性。151.處理固體或液體動物廢物的方法,包括下面的步驟(a)提供權利要求48所示的多肽或權利要求1所示的核酸編碼的多肽,其中可選地,所述多肽具有活性,包括纖維素酶、內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或p-葡糖苷酶活性;(b)提供固體或液體動物廢物;和(c)使步驟(a)的多肽和步驟(b)的固體或液體廢物在其中所述酶可以處理30所述廢物的條件下接觸。152.加工過的廢品,其包含權利要求48所示的多肽或權利要求1所示的核酸編碼的多肽,其中可選地,所述多肽具有活性,包括纖維素酶、內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或p-葡糖苷酶活性。153.消毒劑,其含有具有纖維素酶活性的多肽,其中所述多肽包括權利要求48所示的序列,或者權利要求1所示的核酸編碼的多肽,其中可選地,所述多肽具有活性,包括內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或p-葡糖苷酶活性。154.生物防禦劑或生物解毒劑,其含有具有纖維素酶活性的多肽,其中所述多5肽包括權利要求48所示的序列,或者權利要求1所示的核酸編碼的多肽,其中可選地,所述多肽具有活性,包括內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或p-葡糖苷酶活性。155.分離的或重組的核酸,其具有包含對SEQIDNO:163的至少一個核苷酸鹼10基殘基修飾的序列,其中所述修飾包括下列改變的一個或多個位置265至267的任何一處的核苷酸被修飾,變為CGT、CGC、CGA、CGG、AGA或AGG;位置307至309的任何一處的核苷酸被修飾,變為GGT、GGC、GGA或GGG;位置328至330的任何一處的核苷酸被修飾,變為GGT、GGC、GGA或GGG;15位置340至342的任何一處的核苷酸被修飾,變為TTA、TTG、CTT、CTC、CTA或CTG;位置469至471的任何一處的核苷酸被修飾,變為TCT、TCC、TCA、TCG、AGT或AGC;位置1441至1443的任何一處的核苷酸被修飾,變為TTT或TTC;20位置1648至1650的任何一處的核苷酸被修飾,變為AAT或AAC;或者位置1768至1770的任何一處的核苷酸被修飾,變為CGT、CGC、CGA、CGG、AGA或AGG。156.分離的或重組的多肽,其具有包含對SEQIDNO:164的至少一個胺基酸殘25基修飾的序列,其中所述修飾包括下列改變的一個或多個胺基酸位置89的甲硫氨酸被修飾為精氨酸;胺基酸位置103的苯丙氨酸被修飾為甘氨酸;胺基酸位置110的脯氨酸被修飾為甘氨酸;胺基酸位置114的酪氨酸被修飾為亮氨酸;30胺基酸位置157的丙氨酸被修飾為絲氨酸;胺基酸位置481的色氨酸被修飾為苯丙氨酸;胺基酸位置550的脯氨酸被修飾為天冬醯胺;或胺基酸位置590的甘氨酸被修飾為精氨酸。157.分離的或重組的核酸,其具有包含對下列序列的核苷酸殘基序列修飾的序歹!j:SEQIDNO:l、SEQIDNO:3、SEQIDNO:5、SEQIDNO:7、SEQIDNO:9、SEQIDNO:ll、SEQIDNO:13、SEQIDNO:15、SEQIDNO:17、SEQIDNO:19、SEQIDNO:21、SEQIDNO:23、SEQIDNO:25、SEQIDNO:27、SEQIDNO:29、SEQIDNO:31、SEQIDNO:33、SEQIDNO:35、SEQIDNO:37、SEQIDNO:39、SEQIDNO:41、SEQIDNO:43、SEQIDNO:45、SEQIDNO:47、SEQIDNO:49、SEQIDNO:51、SEQIDNO:53、SEQIDNO:55、SEQIDNO:57、SEQIDNO:59、SEQIDNO:61、SEQIDNO:63、SEQIDNO:65、SEQIDNO:67、SEQIDNO:69、SEQIDNO:71、SEQIDNO:73、SEQIDNO:75、SEQIDNO:77、SEQIDNO:79、SEQIDNO:81、SEQIDNO:83、SEQIDNO:85、SEQIDNO:87、SEQIDNO:89、SEQIDNO:91、SEQIDNO:93、SEQIDNO:95、10SEQIDNO:97、SEQIDNO:99、SEQIDNO:101、SEQIDNO:103、SEQIDNO:105、SEQIDNO:107、SEQIDNO:109、SEQIDNO:lll、SEQIDNO:113、SEQIDNO:115、SEQIDNO:117、SEQIDNO:119、SEQIDNO:121、SEQIDN0.123、SEQIDNO:125、SEQIDNO:127、SEQIDNO:129、SEQIDNO:131、SEQIDNO:133、SEQIDNO:135、SEQIDNO:137、SEQIDNO:139、SEQIDNO:141、SEQIDNO:143、SEQIDNO:145、SEQIDNO:147、SEQIDNO:149、SEQIDNO:151、SEQIDNO:153、SEQIDNO:155、SEQIDNO:157、SEQIDNO:159、SEQIDNO:161、SEQIDNO:163或SEQIDNO:165,其中所述修飾包括下列改變的一個或多個-SEQIDNO:163的位置265至267的任何一處的相當的核苷酸變為CGT、CGC、CGA、CGG、AGA或AGG;20SEQIDNO:163的位置307至309的任何一處的相當的核苷酸變為GGT、GGC、GGA或GGG;SEQIDNO:163的位置328至330的任何一處的相當的核苷酸變為GGT、GGC、GGA或GGG;SEQIDNO:163的位置340至342的任何一處的相當的核苷酸變為TTA、TTG、25CTT、CTC、CTA或CTG;SEQIDNO:163的位置469至471的任何一處的相當的核苷酸變為TCT、TCC、TCA、TCG、AGT或AGC;SEQIDNO:163的位置1441至1443的任何一處的相當的核苷酸變為TTT或TTC;SEQIDNO:163的位置1648至1650的任何一處的相當的核苷酸變為AAT或AAC;或者SEQIDNO:163的位置1768至1770的任何一處的相當的核苷酸變為CGT、CGC、CGA、CGG、AGA或AGG。158.分離的或重組的核酸,其具有包含對權利要求1所示核酸的核苷酸殘基序列修飾的序列,其中所述修飾包括下列改變的一個或多個SEQIDNO:163的位置265至267的任何一處的相當的核苷酸變為CGT、CGC、CGA、CGG、AGA或AGG;SEQIDNO:163的位置307至309的任何一處的相當的核苷酸變為GGT、GGC、5GGA或GGG;SEQIDNO:163的位置328至330的任何一處的相當的核苷酸變為GGT、GGC、GGA或GGG;SEQIDNO:163的位置340至342的任何一處的相當的核苷酸變為TTA、TTG、CTT、CTC、CTA或CTG;10SEQIDNO:163的位置469至471的任何一處的相當的核苷酸變為TCT、TCC、TCA、TCG、AGT或AGC;SEQIDNO:163的位置1441至1443的任何一處的相當的核苷酸變為TTT或TTC;SEQIDNO:163的位置1648至1650的任何一處的相當的核苷酸變為AAT或AAC;或者SEQIDNO:163的位置1768至1770的任何一處的相當的核苷酸變為CGT、CGC、CGA、CGG、AGA或AGG。159.分離的或重組的多肽,其具有包含對下列序列的胺基酸殘基修飾的序列SEQIDNO:2、SEQIDNO:4、SEQIDNO:6、SEQIDNO:8、SEQIDNO:10、SEQIDNO:12、SEQIDNO:14、SEQIDNO:16、SEQIDNO:18、SEQIDNO:20、SEQIDNO:22、SEQIDNO:24、SEQIDNO:26、SEQIDNO:28、SEQIDNO:30、SEQIDNO:32、SEQIDNO:34、SEQIDNO:36、SEQIDNO:38、SEQIDNO:40、SEQIDNO:42、SEQIDNO:44、SEQIDNO:46、SEQIDNO:48、SEQIDNO:50、SEQIDNO:52、SEQIDNO:54、SEQIDNO:56、SEQIDNO:58、SEQIDNO:60、SEQIDNO:62、SEQIDNO:64、SEQIDNO:66、SEQIDNO:68、SEQIDNO:70、SEQIDNO:72、SEQIDNO:74、SEQIDNO:76、SEQIDNO:78、SEQIDNO:80、SEQIDNO:82、SEQIDNO:84、SEQIDNO:86、SEQIDNO:88、SEQIDNO:90、SEQIDNO:92、SEQIDNO:94、SEQIDNO:96、SEQIDNO:98、SEQIDNO:IOO、SEQIDNO:102、SEQIDNO:104、SEQIDNO:106、SEQIDNO:108、SEQIDNO:110、SEQIDNO:112、SEQIDNO:114、SEQIDNO:116、SEQIDNO:118、SEQIDNO:120、SEQIDNO:122、SEQIDNO:124、SEQIDNO:126、SEQIDNO:128、SEQIDNO:130、SEQIDNO:132、SEQIDNO:134、SEQIDNO:136、SEQIDNO:138、SEQIDNO:140、SEQIDNO:142、SEQIDNO:144、SEQIDNO:146、SEQEDNO:148、SEQIDNO:150、SEQIDNO:152、SEQIDNO:154、SEQIDNO:156、SEQIDNO:158、SEQIDNO:160、SEQIDNO:162、SEQIDNO:164或SEQIDNO:166,其中所述修飾包括下列改變的一個或多個-SEQIDNO:164的胺基酸位置89的甲硫氨酸相當的胺基酸變為精氨酸;SEQIDNO:164的胺基酸位置103的苯丙氨酸相當的胺基酸變為甘氨酸;SEQIDNO:164的胺基酸位置110的脯氨酸相當的胺基酸變為甘氨酸;5SEQIDNO:164的胺基酸位置114的酪氨酸相當的胺基酸變為亮氨酸;SEQIDNO:164的胺基酸位置157的丙氨酸相當的胺基酸變為絲氨酸;SEQIDNO:164的胺基酸位置481的色氨酸相當的胺基酸變為苯丙氨酸;SEQIDNO:164的胺基酸位置550的脯氨酸相當的胺基酸變為天冬醯胺;或SEQIDNO:164的胺基酸位置590的甘氨酸相當的胺基酸變為精氨酸。160.分離的或重組的多肽,其具有包含對權利要求48所示多肽的胺基酸殘基修飾的序列,其中所述修飾包括下列改變的一個或多個-SEQIDNO:164的胺基酸位置89的甲硫氨酸相當的胺基酸變為精氨酸;SEQIDNO:164的胺基酸位置103的苯丙氨酸相當的胺基酸變為甘氨酸;SEQIDNOa64的胺基酸位置110的脯氨酸相當的胺基酸變為甘氨酸;SEQIDNO:164的胺基酸位置114的酪氨酸相當的胺基酸變為亮氨酸;SEQIDNO:164的胺基酸位置157的丙氨酸相當的胺基酸變為絲氨酸;SEQIDNO:164的胺基酸位置481的色氨酸相當的胺基酸變為苯丙氨酸;SEQIDNO:164的胺基酸位置550的脯氨酸相當的胺基酸變為天冬醯胺;或SEQIDNO:164的胺基酸位置590的甘氨酸相當的胺基酸變為精氨酸。161.權利要求48所述的分離的或重組的多肽,其中所述多肽具有如下所示的序列(i)SEQIDNO:164,具有鹼性內切葡聚糖酶/纖維素酶活性;25(ii)SEQIDNO:110,具有木聚糖酶活性;(iii)SEQIDNO:12,具有NAD結合氧化還原酶活性;(iv)SEQIDNO:118,具有短鏈脫氫酶活性;(v)SEQIDNO:14,具有NADH依賴性脫氫酶活性;(vi)SEQIDNO:138,具有肽酶活性;(vii)SEQIDNO:162,具有鹼性內切葡聚糖酶活性;(viii)SEQIDNO:42,具有半胱氨醯tRNA合成酶活性;(viii)SEQIDNO:32,具有纖維糊精磷酸化酶活性;(ix)SEQIDNO:50,具有fdhd/narq氧化還原酶活性;(x)SEQIDNO:54,具有自由基S-腺苷蛋氨酸(SAM)甲基轉移酶活性;或35(xi)SEQIDNO:58,具有枯草蛋白酶樣蛋白酶活性。全文摘要本發明涉及分子和細胞生物學和生物化學。一方面,本發明提供具有纖維素酶活性如內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或β-葡糖苷酶活性的多肽,編碼這些多肽的多核苷酸,以及製備和使用這些多核苷酸和多肽的方法。一方面,本發明涉及多肽纖維素酶活性,例如內切葡聚糖酶、纖維二糖水解酶、甘露聚糖酶和/或β-葡糖苷酶活性,包括熱穩定和耐熱的活性,以及編碼這些酶的多核苷酸,以及製備和使用這些多核苷酸和多肽的方法。本發明的多肽可以被用於各種藥物、農業、食物和飼料加工和工業環境中。文檔編號C12P21/06GK101175860SQ200680016175公開日2008年5月7日申請日期2006年1月13日優先權日2005年3月15日發明者D·百隆,J·耿斯奇,M·迪凱科申請人:維萊尼姆公司

同类文章

一種新型多功能組合攝影箱的製作方法

一種新型多功能組合攝影箱的製作方法【專利摘要】本實用新型公開了一種新型多功能組合攝影箱,包括敞開式箱體和前攝影蓋,在箱體頂部設有移動式光源盒,在箱體底部設有LED脫影板,LED脫影板放置在底板上;移動式光源盒包括上蓋,上蓋內設有光源,上蓋部設有磨沙透光片,磨沙透光片將光源封閉在上蓋內;所述LED脫影

壓縮模式圖樣重疊檢測方法與裝置與流程

本發明涉及通信領域,特別涉及一種壓縮模式圖樣重疊檢測方法與裝置。背景技術:在寬帶碼分多址(WCDMA,WidebandCodeDivisionMultipleAccess)系統頻分復用(FDD,FrequencyDivisionDuplex)模式下,為了進行異頻硬切換、FDD到時分復用(TDD,Ti

個性化檯曆的製作方法

專利名稱::個性化檯曆的製作方法技術領域::本實用新型涉及一種檯曆,尤其涉及一種既顯示月曆、又能插入照片的個性化檯曆,屬於生活文化藝術用品領域。背景技術::公知的立式檯曆每頁皆由月曆和畫面兩部分構成,這兩部分都是事先印刷好,固定而不能更換的。畫面或為風景,或為模特、明星。功能單一局限性較大。特別是畫

一種實現縮放的視頻解碼方法

專利名稱:一種實現縮放的視頻解碼方法技術領域:本發明涉及視頻信號處理領域,特別是一種實現縮放的視頻解碼方法。背景技術: Mpeg標準是由運動圖像專家組(Moving Picture Expert Group,MPEG)開發的用於視頻和音頻壓縮的一系列演進的標準。按照Mpeg標準,視頻圖像壓縮編碼後包

基於加熱模壓的纖維增強PBT複合材料成型工藝的製作方法

本發明涉及一種基於加熱模壓的纖維增強pbt複合材料成型工藝。背景技術:熱塑性複合材料與傳統熱固性複合材料相比其具有較好的韌性和抗衝擊性能,此外其還具有可回收利用等優點。熱塑性塑料在液態時流動能力差,使得其與纖維結合浸潤困難。環狀對苯二甲酸丁二醇酯(cbt)是一種環狀預聚物,該材料力學性能差不適合做纖

一種pe滾塑儲槽的製作方法

專利名稱:一種pe滾塑儲槽的製作方法技術領域:一種PE滾塑儲槽一、 技術領域 本實用新型涉及一種PE滾塑儲槽,主要用於化工、染料、醫藥、農藥、冶金、稀土、機械、電子、電力、環保、紡織、釀造、釀造、食品、給水、排水等行業儲存液體使用。二、 背景技術 目前,化工液體耐腐蝕貯運設備,普遍使用傳統的玻璃鋼容

釘的製作方法

專利名稱:釘的製作方法技術領域:本實用新型涉及一種釘,尤其涉及一種可提供方便拔除的鐵(鋼)釘。背景技術:考慮到廢木材回收後再加工利用作業的方便性與安全性,根據環保規定,廢木材的回收是必須將釘於廢木材上的鐵(鋼)釘拔除。如圖1、圖2所示,目前用以釘入木材的鐵(鋼)釘10主要是在一釘體11的一端形成一尖

直流氧噴裝置的製作方法

專利名稱:直流氧噴裝置的製作方法技術領域:本實用新型涉及ー種醫療器械,具體地說是ー種直流氧噴裝置。背景技術:臨床上的放療過程極易造成患者的局部皮膚損傷和炎症,被稱為「放射性皮炎」。目前對於放射性皮炎的主要治療措施是塗抹藥膏,而放射性皮炎患者多伴有局部疼痛,對於止痛,多是通過ロ服或靜脈注射進行止痛治療

新型熱網閥門操作手輪的製作方法

專利名稱:新型熱網閥門操作手輪的製作方法技術領域:新型熱網閥門操作手輪技術領域:本實用新型涉及一種新型熱網閥門操作手輪,屬於機械領域。背景技術::閥門作為流體控制裝置應用廣泛,手輪傳動的閥門使用比例佔90%以上。國家標準中提及手輪所起作用為傳動功能,不作為閥門的運輸、起吊裝置,不承受軸向力。現有閥門

用來自動讀取管狀容器所載識別碼的裝置的製作方法

專利名稱:用來自動讀取管狀容器所載識別碼的裝置的製作方法背景技術:1-本發明所屬領域本發明涉及一種用來自動讀取管狀容器所載識別碼的裝置,其中的管狀容器被放在循環於配送鏈上的文檔匣或託架裝置中。本發明特別適用於,然而並非僅僅專用於,對引入自動分析系統的血液樣本試管之類的自動識別。本發明還涉及專為實現讀