脂環酸芽孢桿菌的多肽的製作方法

2023-06-02 11:40:56

專利名稱：脂環酸芽孢桿菌的多肽的製作方法
技術領域：
本發明涉及以保藏號DSM 15716保藏的細菌脂環酸芽孢桿菌的基因組包含的多核苷酸所編碼的功能性和有效的多肽。本發明還涉及編碼這些多肽或促進其表達的多核苷酸和這些多核苷酸的構建體以及製備多肽的方法。本發明還涉及包含該多肽和多核苷酸的組合物以及該多肽的用途。本發明還涉及以保藏號DSM 15716保藏的脂環酸芽孢桿菌屬細菌。
背景技術：
一些來源於脂環酸芽孢桿菌屬的酶是已知的，例如Matzke等；Genecloning，nucleotide sequence and biochemical properties of a cytoplasmiccyclomaltodextrinase(neopullulanase)from Alicyclobacillusacidocaldarius ATCC 2700；reclassification of a group of enzymes，提交(MAR-1999)給EMBL/GenBank/DDBJ資料庫或Koivula等，Cloning andsequencing of a gene encoding acidophilic amylase from Bacillusacidocaldarius.J.Gen.Microbiol.1392399(1993)或Bartolucci等，Thioredoxin from Bacillus acidocaldariuscharacterization，high-levelexpression in Escherichia coli and molecular modeling，Biochem.J.328277(1997)或Tsuruoka等，Collagenolytic Serine-Carboxyl Proteinase fromAlicyclobacillus sendainensis Strain NTAP-1Purification，Characterization，Gene Cloning，and Heterologous Expression，遞交(MAY-2002)給EMBL/GenBank/DDBJ資料庫；Eckert K. Schneider E.，A thermoacidophilic endoglucanase(ceIB)from Alicyclobacillusacidocaldarius displays high sequence similarity to arabinofuranosidasesbelonging to family 51 of glycosyl hydrolases；Eur.J.Biochem.，2703593-3602，2003所述。
尋找新酶時，還已知通過對可能的候選者進行特定的酶測定來篩選這類新酶。該方法受到酶可獲得性的限制，而且不能鑑定活性尚不了解的功能性酶或多肽。
此外，全基因組測序是從給定的微生物獲得所有基因信息的已知方法，例如Fleischmann等，Whole genome sequences and assembly ofHaemophilus influenzae Rd；Nature 269496-512；(1995)所述。
大部分工業用途的酶是微生物分泌至培養基中的酶。然而，只有小部分微生物的基因組編碼分泌蛋白。例如僅有約4％的枯草芽孢桿菌(Bacillussubtilis)基因組或其最近親屬編碼分泌蛋白(Van Dijl等Protein transportpathways in Bacillus subtilisa genome-based road map；《「Bacillussubtilis and its closest relatives」-From genes to cells》；337-355頁；A.L.Sonenshein編；ASM Press 2002)。
基因組測序的一個缺點是所獲得序列的絕大多數編碼非分泌蛋白。
還已知的是信號捕獲——使用與缺乏自身信號的額外的細胞報導基因所形成的融合物來鑑定含有編碼信號肽的核苷酸的基因的方法(WO01/77315)。
發明概述本發明者發現了在低pH(約4-5)和高溫(50-60℃)下生長的脂環酸芽孢桿菌菌株，即脂環酸芽孢桿菌DSM 15716。因為已知菌株和DSM15716菌株之間的系統發生距離是顯著的，並且其生長條件與工業酶若干應用的條件類似，因此該菌株很有意義。
微生物基因組包含數千個不同基因，一些編碼多肽，一些編碼RNA。微生物基因組中僅有限數量的基因編碼服務於微生物的外部目的並由微生物分泌至周圍培養基中的功能性多肽。從這類多肽能夠以可觀數量在連續過程中產生而不破壞產生該多肽的細胞來看，這類多肽對工業是有意義的。
鑑定和提供由以保藏號DSM 15716保藏的脂環酸桿菌分泌的對脂環酸桿菌具有功能性目的的多肽是本發明的目的，因為這類多肽不僅可用於工業目的，而且可以以工業相關的方法和數量產生它們。
一方面本發明提供分離的成熟功能性多肽，其與可得自以保藏號DSM15716保藏的脂環酸芽孢桿菌屬細菌的相應分泌多肽有至少90％的同一性並表現相同的功能。
另一方面本發明提供細菌穀氨酸肽酶(EC 3.4.23.19)。
另一方面本發明提供編碼本發明多肽的多核苷酸、包含編碼多肽的多核苷酸的核苷酸構建體，其中與一個或多個在宿主細胞中指導多肽產生的控制序列有效連接、包含本發明核苷酸構建體的重組體表達載體和包含本發明核苷酸構建體的重組宿主細胞。
另一方面本發明提供製備本發明多肽的方法，包括(a)培養包含編碼本發明多肽的核苷酸序列的菌株，所述菌株能夠表達並分泌多肽，和(b)回收多肽。
另一方面本發明提供包含本發明多肽的組合物和製備這樣的組合物的方法，包括將本發明的多肽與賦形劑混合。
另一方面本發明提供包含本發明多核苷酸的組合物和製備這樣的組合物的方法，包括將本發明的多核苷酸與賦形劑混合。
另一方面本發明提供本發明多肽或包含所述多肽的組合物在多種應用中的用途。
另一方面本發明涉及以保藏號DSM 15716保藏的細菌脂環酸芽孢桿菌。
最後一方面本發明提供包括本發明多肽胺基酸序列和本發明多核苷酸核苷酸序列信息的電子儲藏媒體。
序列列表本申請包含序列列表形式的信息，其附屬於申請並在伴隨該申請的數據載體中提交。數據載體的內容在本文全部引入作為參考。SEQ ID NO1到SEQ ID NO25中編碼成熟多肽的區域編碼SEQ ID NO26到SEQ IDNO50的成熟多肽。因此SEQ ID NO1的編碼成熟多肽的區域編碼SEQID NO26中包含的成熟多肽序列，SEQ ID NO2的編碼成熟多肽的區域編碼SEQ ID NO27中包含的成熟多肽，等等。
發明詳述定義本文使用的術語「同一性」旨在理解為兩個胺基酸序列或兩個核苷酸序列間的同源性。就本發明而言，通過使用Vector NTI程序7.1版中的AlignX測定兩個胺基酸序列間的同一性程度(Informax inc.，7600Wisconsin Avenue，Suite#1100，Bethesda，MD 20814，USA)。使用ClustalW算法(Nucleic Acid Research，22(22)4673-4680，1994)進行胺基酸比對。使用以下的附加參數缺口打開罰分為10，缺口延伸罰分為0.05，缺口分離罰分範圍為8。配對比對參數為Ktuple＝1，缺口罰分＝3，缺口長度打開罰分＝10，缺口延伸罰分＝0.1，窗口大小＝5和對角線＝5。使用與上述相同的算法和軟體包測定兩個核苷酸序列間的同一性程度，例如使用下面的設定缺口罰分為10且缺口長度罰分為10。配對比對參數為Ktuple＝3，缺口罰分＝3和窗口＝20。
本發明上下文中使用的術語「功能性多肽」是指可由細胞表達並分泌的多肽，其組成能夠按照其設計的由細胞來執行的功能運作的運作單元。任選的，多肽可能需要輔因子以實現預期的功能。功能性多肽的一個實例為催化活性多肽或在細胞周圍環境中幫助細胞催化反應的酶。另一實例可以是作為信號物質的多肽。其他的實例為作為環境參數(細胞周圍環境中的化學品)傳感器(受體)的多肽，或是針對其他生物(抗微生物(多)肽)的多肽，或促進細胞結構完整性的多肽。
本文使用的術語胺基酸序列或多肽部分的「成熟區域」是指胺基酸序列或多肽的部分或區域或結構域或片段，其為成熟的功能性多肽。
本文使用的術語「編碼成熟多肽的核苷酸序列區域」是指從編碼成熟多肽第一個胺基酸的三聯體算起到編碼成熟多肽最後一個胺基酸的最後三聯體的核苷酸序列區域。
本文使用的術語「分泌多肽」應理解為在細胞中表達後被轉運並釋放到周圍細胞外培養基中的多肽或結合/嵌入細胞膜使得至少多肽的一部分暴露於周圍細胞外培養基中的多肽。
本發明的多肽本發明涉及與可從以保藏號DSM 15716保藏的脂環酸芽孢桿菌獲得的分泌多肽相類似的多肽。具體而言，本發明提供成熟的功能性多肽，所述多肽與從以保藏號DSM 15716保藏的脂環酸芽孢桿菌獲得的相應分泌多肽具有至少90％的同一性，並表現相同的功能。
此外，令人驚奇的是脂環酸芽孢桿菌DSM 15716表達的SEQ ID NO27的穀氨酸肽酶是第一個從細菌中分離的穀氨酸肽酶。因此，本發明還提供細菌穀氨酸肽酶(EC 3.4.23.19)。
本發明的多肽特別是是由脂環酸芽孢桿菌DSM 15716為了對該特定細胞發揮功能的目的而分泌的多肽。
在脂環酸芽孢桿菌DSM 15716基因組的數千個可能的基因中，該基因組的多肽編碼了包含在SEQ ID NO26到SEQ ID NO50中的25個分泌功能性成熟多肽，其被確定為功能性的，即由選定的宿主細胞翻譯為功能性多肽。
因此，脂環酸芽孢桿菌DSM 15716表達並分泌SEQ ID NO26到SEQNO50中包含的功能性成熟多肽，並且在特定菌株的基因組中，SEQ IDNO1到SEQ ID NO25的編碼成熟多肽的區域為編碼SEQ ID NO26到SEQ NO50中包含的成熟多肽的基因。在另一個具體的實施方案中，可表達所有編碼SEQ ID NO26到SEQ NO50中包含的成熟多肽的基因，並且可在培養大腸桿菌宿主時分泌其相應的成熟多肽，所述大腸桿菌用包含SEQ ID NO1到SEQ ID NO25的編碼成熟多肽的區域的多核苷酸轉化。通過比較這25個多肽序列與已知序列的序列同源性或同一性注釋多肽的具體功能。25個分泌功能性多肽中至少15個確定為酶。
具體而言，分離的多肽選自
(a)具有與選自SEQ ID NO26到SEQ ID NO50中所包含成熟多肽的胺基酸序列有至少90％同一性的胺基酸序列的多肽，和(b)在高嚴格度條件下與選自下述多核苷酸探針雜交的核苷酸序列編碼的多肽，所述多核苷酸探針選自(i)SEQ ID NO1到SEQ ID NO25編碼成熟多肽的區域的核苷酸序列互補鏈，(ii)SEQ ID NO1到SEQ ID NO25編碼成熟多肽的區域的核苷酸序列中所包含的cDNA序列的互補鏈；其中多肽顯示SEQ ID NO26到SEQ ID NO50中相應成熟多肽的功能。
在一個具體的實施方案中，本發明多肽選自以DSM保藏號15716保藏的脂環酸芽孢桿菌分泌並由本發明者分離的酶，即由酸性內切葡聚糖酶、酸性纖維素酶、穀氨酸肽酶、多銅氧化酶、絲氨酸羧基蛋白酶、絲氨酸蛋白酶、HtrA樣絲氨酸蛋白酶、二硫化物異構酶、γ-D-穀氨醯-L-二胺基酸內肽酶、內-β-N-乙醯氨基葡糖苷酶、肽醯脯氨醯異構酶、酸性磷酸酯酶、植酸酶、磷脂酶C、多糖脫乙醯酶、木聚糖脫乙醯酶和亞硫酸鹽氧化酶組成的酶組。
本發明還提供選自以下的分離的酶(a)含有下述胺基酸序列的酶，所述胺基酸序列與以DSM保藏號15716保藏的脂環酸芽孢桿菌菌株分泌的選自酸性內切葡聚糖酶或酸性纖維素酶、穀氨酸肽酶、多銅氧化酶、絲氨酸羧基蛋白酶、絲氨酸蛋白酶或HtrA樣絲氨酸蛋白酶、二硫化物異構酶、γ-D-穀氨醯-L-二胺基酸內肽酶、內-β-N-乙醯氨基葡糖苷酶、肽醯脯氨醯異構酶、酸性磷酸酯酶或植酸酶或磷脂酶C、多糖脫乙醯酶或木聚糖脫乙醯酶和亞硫酸鹽氧化酶的成熟酶胺基酸序列具有至少90％同一性，和(b)由在高嚴格度條件下與選自下述多核苷酸探針雜交的核苷酸序列所編碼的酶，所述多核苷酸探針選自(i)以DSM保藏號15716保藏的脂環酸芽孢桿菌包含的核苷酸序列的互補鏈，所述核苷酸序列編碼由該菌株分泌的選自酸性內切葡聚糖酶或酸性纖維素酶、穀氨酸肽酶、多銅氧化酶、絲氨酸羧基蛋白酶、絲氨酸蛋白酶或HtrA樣絲氨酸蛋白酶、二硫化物異構酶、γ-D-穀氨醯-L-二胺基酸內肽酶、內-β-N-乙醯氨基葡糖苷酶、肽醯脯氨醯異構酶、酸性磷酸酯酶或植酸酶或磷脂酶C、多糖脫乙醯酶或木聚糖脫乙醯酶和亞硫酸鹽氧化酶的成熟酶；(ii)以DSM保藏號15716保藏的脂環酸芽孢桿菌包含的核苷酸序列包含的cDNA序列的互補鏈，所述核苷酸序列編碼由該菌株分泌的選自酸性內切葡聚糖酶或酸性纖維素酶、穀氨酸肽酶、多銅氧化酶、絲氨酸羧基蛋白酶、絲氨酸蛋白酶或HtrA樣絲氨酸蛋白酶、二硫化物異構酶、γ-D-穀氨醯-L-二胺基酸內肽酶、內-β-N-乙醯氨基葡糖苷酶、肽醯脯氨醯異構酶、酸性磷酸酯酶或植酸酶或磷脂酶C、多糖脫乙醯酶或木聚糖脫乙醯酶和亞硫酸鹽氧化酶的成熟酶，其中該酶具有選自酸性內切葡聚糖酶或酸性纖維素酶、穀氨酸肽酶、多銅氧化酶、絲氨酸羧基蛋白酶、絲氨酸蛋白酶或HtrA樣絲氨酸蛋白酶、二硫化物異構酶、γ-D-穀氨醯-L-二胺基酸內肽酶、內-β-N-乙醯氨基葡糖苷酶、肽醯脯氨醯異構酶、酸性磷酸酯酶或植酸酶或磷脂酶C、多糖脫乙醯酶或木聚糖脫乙醯酶和亞硫酸鹽氧化酶的功能。
在具體的實施方案中，該酶是選自以下的分離的酶(a)具有與選自SEQ ID NO26到SEQ ID NO40中所包含成熟酶的胺基酸序列具有至少90％同一性的胺基酸序列的酶，和(b)在高嚴格度條件下與選自以下的多核苷酸探針雜交的核苷酸序列所編碼的酶，所述多核苷酸探針選自(i)SEQ ID NO1到SEQ ID NO15編碼成熟酶的區域的核苷酸序列互補鏈，(ii)SEQ ID NO1到SEQ ID NO15編碼成熟酶的區域的核苷酸序列中所包含的cDNA序列的互補鏈；其中該酶具有SEQ ID NO26到SEQ ID NO40中包含的相應成熟多肽的功能。
本發明的多肽為分離的多肽，本發明的多肽製品優選包含以重量計最多90％的其天然結合的其他多肽材料(優選更低百分比的其他多肽材料，例如以重量計最多80％，以重量計最多60％，以重量計最多50％，以重量計最多40％，以重量計最多30％，以重量計最多20％，以重量計最多10％，以重量計最多9％，以重量計最多8％，以重量計最多6％，以重量計最多5％，以重量計最多4％，以重量計最多3％，以重量計最多2％，以重量計最多1％和以重量計最多1/2％)。因此，優選本發明分離的多肽至少92％純度，即以重量計本發明多肽構成製品中存在的總多肽材料的至少92％，並優選更高的百分數，例如至少94％純度，至少95％純度，至少96％純度，至少96％純度，至少97％純度，至少98％純度，至少99％和最多99.5％純度。具體而言，優選本發明多肽為「基本純淨的形式」，即多肽製品基本不含與之天然結合的其他多肽材料。這可通過例如用熟知的重組方法製備本發明多肽來實現。
本發明多肽可合成製造、天然產生或二者組合。在具體的實施方案中，本發明多肽可得自微生物例如原核細胞、古細菌細胞或真核細胞。還可通過遺傳工程修飾細胞。
在具體的實施方案中，本發明多肽為在約10℃到約80℃範圍內，特別是約20℃到60℃範圍內的溫度下顯示最佳酶活性的酶。
在具體的實施方案中，本發明多肽為在高至100℃，特別是高至80℃，更特別高至60℃的溫度下功能穩定的酶。
在具體的實施方案中，本發明多肽為表現選自SEQ ID NO26到SEQID NO50中所包含成熟酶的至少20％，特別是至少40％，例如至少50％，特別是至少60％，例如至少70％，更特別至少80％，例如至少90％，最特別至少95％，例如大約或至少100％酶活性的酶。
具體而言，分離的成熟功能性多肽與得自以保藏號DSM 15716保藏的脂環酸芽孢桿菌細菌的相應的分泌多肽具有至少90％同一性並顯示相同的功能，且特別地，本發明的多肽包含、含有與選自SEQ ID NO26到SEQID NO50中所包含成熟多肽的多肽序列具有至少90％同一性的胺基酸序列或由該胺基酸序列組成。同一性百分比具體為至少95％，例如至少96％，例如至少97％，更特別至少98％，例如至少99％或甚至100％同一性。
在另一具體的實施方案中，同一性百分比為至少50％，特別是至少60％，特別是至少65％，特別是至少70％，特別是至少75％，特別是至少80％，甚至更特別至少85％同一性。
在具體的實施方案中，本發明多肽的胺基酸序列與SEQ ID NO26到SEQ ID NO50中所包含成熟多肽最多存在10個胺基酸(例如10個胺基酸)的差異，特別是最多5個胺基酸(例如5個胺基酸)，例如最多4個胺基酸(例如4個胺基酸)，例如最多3個胺基酸(例如3個胺基酸)，特別是最多2個胺基酸(例如2個胺基酸)，例如1個胺基酸的差異。
本發明多肽可以是分離自天然來源(如脂環酸芽孢桿菌DSM 15716菌株或另一野生型菌株)的野生型多肽，然而本發明還包括人工變體，其中例如通過在所述多肽上添加、替代和/或缺失一個或多個胺基酸突變本發明多肽，同時保留多肽功能和/或其他性質。因此，本發明多肽可以是人工變體，其中對含有SEQ ID NO26和SEQ ID NO50中所包含成熟多肽或由其組成的胺基酸序列進行至少一個胺基酸替換、缺失和/或插入。
本發明的多肽還包括本文所述胺基酸序列的功能性片段和編碼本文所述胺基酸序列功能性片段的核酸，包括以DSM保藏號15716保藏的脂環酸芽孢桿菌菌株分泌的成熟酶片段，如本文所述，包括在DSM保藏號15716下保藏的脂環酸芽孢桿菌菌株分泌的選自酸性內切葡聚糖酶、酸性纖維素酶、穀氨酸肽酶、多銅氧化酶、絲氨酸羧基蛋白酶、絲氨酸蛋白酶、HtrA樣絲氨酸蛋白酶、二硫化物異構酶、γ-D-穀氨醯-L-二胺基酸內肽酶、內-β-N-乙醯氨基葡糖苷酶、肽醯脯氨醯異構酶、酸性磷酸酯酶、植酸酶、磷脂酶C、多糖脫乙醯酶、木聚糖脫乙醯酶和亞硫酸鹽氧化酶的酶片段。
可通過本領域公知的標準技術構建人工變體，通常接著進行篩選和/或鑑定。標準技術包括經典誘變，例如Gerhardt等(1994)所述通過UV輻射細胞或用化學誘變劑處理細胞；WO 97/07205所述的體內基因改組；Stemmer，(1994)或WO 95/17413所述的體外改組，如Eisenstadt E.等(1994)所述的隨機誘變；Poulsen等(1991)所述的PCR技術；J.E.Ness等，NatureBiotechnology，卷17，893-896頁(1999)所述的家族改組；Sambrook等(1989)，Sambrook等，《Molecular Cloning，A Laboratory Manual》，ColdSpring Harbor，NY.所述的定向誘變。核苷酸替代概述可見於例如Ford等，1991，《Protein Expression and Purification 2》，95-107頁。
這些標準遺傳工程方法還可用於從編碼本發明一個或多個親本酶的基因製備變體核苷酸序列的變種文庫、在適當的宿主細胞中表達酶變體和選擇優選的變體。可使用本領域公知的一些技術(Reetz MT；Jaeger KE，《Biocatalysis-from Discovery to Application》，Fessner WD編，卷200，31-57頁(1999)；Stemmer，Nature，卷370，389-391頁，1994；Zhao和Arnold，Proc.Natl.Acad.Sci.，USA，卷94，7997-8000頁，1997或Yano等，Proc.Natl.Acad.Sci.，USA，卷95，5511-5515頁，1998)建立變種文庫。
在本發明具體的實施方案中，胺基酸變化(人工變體及野生型酶中)是次要的性質，即不顯著影響蛋白質摺疊和/或活性的保守胺基酸替代；一般1到約30個的小量缺失；氨基或羧基端的小量延伸，例如一個氨基端甲硫氨酸殘基；上至約20-25個殘基的小接頭肽；或通過改變淨電荷或另一功能促進純化的小量延伸，例如多組氨酸束、抗原表位或結合結構域。
保守替代的實例在鹼性胺基酸(精氨酸、賴氨酸和組氨酸)、酸性胺基酸(穀氨酸和天冬氨酸)、極性胺基酸(穀氨醯胺和天冬醯胺)、疏水性胺基酸(亮氨酸、異亮氨酸、纈氨酸和甲硫氨酸)、芳香族胺基酸(苯丙氨酸、色氨酸和酪氨酸)和小胺基酸(甘氨酸、丙氨酸、絲氨酸和蘇氨酸)之內。通常不改變和/或損害蛋白質功能的胺基酸替代為本領域公知，並描述於例如H.Neurath和R.L.Hill，1979，《The Proteins》，AcademicPress，New York。最常出現的交換為丙氨酸/絲氨酸、纈氨酸/異亮氨酸、天冬氨酸/穀氨酸、蘇氨酸/絲氨酸、丙氨酸/甘氨酸、丙氨酸/蘇氨酸、絲氨酸/天冬醯胺、丙氨酸/纈氨酸、絲氨酸/甘氨酸、酪氨酸/苯丙氨酸、丙氨酸/脯氨酸、賴氨酸/精氨酸、天冬氨酸/天冬醯胺、亮氨酸/異亮氨酸、亮氨酸/纈氨酸、丙氨酸/穀氨酸和天冬氨酸/甘氨酸以及相反的交換。
在具體的實施方案中，胺基酸交換具有改變多肽理化性質的性質。例如優選進行改善酶熱穩定性、改變底物特異性、改變最佳pH等的胺基酸變化。
具體而言，本發明多肽(特別是選自SEQ ID NO26到SEQ ID NO50中所包含的成熟多肽的多肽)中這類產生人工變體的替換、缺失和/或插入的數目為最多10，例如最多9，例如最多8，更優選最多7，例如最多6，例如最多5，最優選最多4，例如最多3，例如最多2，特別是最多1。
在具體的實施方案中，人工變體為與親本酶相比在動物(包括人)中具有改變的(優選降低的)免疫原性，特別是變應原性的變體。本文中的術語「免疫原性」應理解為將人工變體施用(包括靜脈、皮膚、皮下、口腔和氣管內給藥)於動物時能夠引起改變的(特別是降低的)免疫應答。本文中的術語「免疫應答」是指施用人工變體引起動物體內免疫球蛋白例如IgE、IgG和IgM水平的改變或動物體內細胞因子水平的改變。定位蛋白質免疫原/抗原表位、製備具有改變免疫原性變體的方法和測定免疫應答的方法為本領域公知，並描述於例如WO 92/10755、WO 00/26230、WO00/26354和WO 01/31989。本文中的術語「變應原性」應理解為人工變體引起動物改變，特別是降低產生IgE的能力以及結合來自所述動物IgE的能力。特別是由對動物氣管內施用多肽變體引起的變應原性是特別有意義的(亦稱為呼吸變應原性)。
在另一實施方案中，本發明多肽為由至少在高嚴格度條件下，特別是非常高嚴格度條件下與選自以下的多核苷酸探針雜交的核苷酸序列編碼的多肽(i)選自SEQ ID NO1到SEQ ID NO25編碼成熟多肽的區域的核苷酸序列的互補鏈，(ii)選自SEQ ID NO1到SEQ ID NO25編碼成熟多肽的區域的核苷酸序列中所包含cDNA序列的互補鏈；(iii)編碼具有SEQ ID NO26到SEQ ID NO50中所包含相應成熟多肽的功能的分泌多肽的(i)或(ii)的片段(J.Sambrook，E.F.Fritsch，和T.Maniatus，1989，《MolecularCloning，A Laboratory Manual》，第二版，Cold Spring Harbor，NewYork)。
具體而言，本發明的多肽由包含選自SEQ ID NO1到SEQ ID NO25編碼成熟多肽區域的核苷酸序列或由於遺傳密碼簡併性而與之不同的序列的多核苷酸編碼。更具體地，本發明多肽由選自SEQ ID NO1到SEQ IDNO25編碼成熟多肽區域的核苷酸序列或由於遺傳密碼簡併性而與之不同的序列組成的多核苷酸編碼。
SEQ ID NO1到SEQ ID NO25編碼成熟多肽區域的核苷酸序列或其亞序列，以及SEQ ID NO26到SEQ ID NO50所包含的成熟多肽或其片段的胺基酸序列可用於設計根據本領域熟知的方法從不同種屬菌株中鑑定並克隆編碼本發明酶的DNA的多核苷酸探針。具體而言，這類探針可用於與目的屬或種的基因組或cDNA雜交，隨後進行標準Southern印跡以鑑定並分離其中相應的基因。這類探針可遠短於整個序列，但是長度應至少為15個，優選至少25個，更優選至少35個核苷酸，例如長度至少為70個核苷酸。然而，多核苷酸探針長度優選為至少100個核苷酸。例如，多核苷酸探針長度可至少為200個核苷酸，長度至少為300個核苷酸，長度至少為400個核苷酸或長度至少為500個核苷酸。可使用更長的探針例如長度至少600個核苷酸，長度至少700個核苷酸，長度至少800個核苷酸或長度至少900個核苷酸長度的多核苷酸探針。DNA和RNA探針都可以使用。通常標記(例如用32P、3H、35S、生物素或抗生物素蛋白)探針以檢測相應的基因。
因此，可從這些其他生物製備的基因組DNA或cDNA文庫篩選與上述探針雜交並編碼本發明酶的DNA。可通過瓊脂糖或聚丙烯醯胺凝膠電泳或其他分離技術分離來自這些其他生物的基因組或其他DNA。可以將來自文庫的DNA或分離的DNA轉移並固定在硝酸纖維素或其他合適的載體材料上。為了鑑定克隆或DNA(所述DNA與選自SEQ ID NO1到SEQ IDNO25編碼成熟多肽區域的核苷酸具有必須的同源性和/或同一性或與之同源和/或同一)，在Southern印跡中使用帶有固定的DNA的載體材料。
就本發明而言，雜交表明核苷酸序列在高到非常高嚴格度雜交條件下與標記的多核苷酸探針雜交，所述探針又與選自SEQ ID NO1到SEQ IDNO25編碼成熟多肽的核苷酸序列雜交。可使用X射線膠片或本領域公知的其他方法檢測在這些條件下與多核苷酸探針雜交的分子。本文使用術語「多核苷酸探針」時都應理解為這類探針包含至少15個核苷酸。
在一個值得注意的實施方案中，多核苷酸探針為選自SEQ ID NO1到SEQ ID NO25編碼成熟多肽區域的核苷酸序列的互補鏈。
在另一個值得注意的實施方案中，多核苷酸探針為編碼選自SEQ IDNO26到SEQ ID NO50酶的核苷酸序列的互補鏈。在另一值得注意的實施方案中，多核苷酸探針為選自SEQ ID NO1到SEQ ID NO25編碼成熟多肽區域的核苷酸序列成熟多肽編碼區的互補鏈。
對於長度至少為100個核苷酸的長探針，高到非常高嚴格度條件定義為42℃下根據標準Southern印跡操作在5×SSPE，1.0％ SDS，5×Denhardt雜交溶液，100μg/ml剪切並變性的鮭精DNA中預雜交和雜交。優選地，至少100個核苷酸的長探針不含有多於1000個核苷酸。對至少100個核苷酸長度的長探針，載體材料最終用0.1×SSC，0.1％SDS在60℃(高嚴格度)洗滌三次，每次15分鐘，特別是用0.1×SSC，0.1％SDS在68℃(非常高嚴格度)下洗滌三次，每次15分鐘。
儘管並非特別優選，還可考慮使用較短的探針例如從約15個到99個核苷酸長度(如從約15到約70個核苷酸長度)的探針。對於這類短探針，嚴格條件定義為在比使用根據Bolton和McCarthy(1962，Proceedings ofthe National Academy of Sciences USA 481390)算法計算的Tm低5℃到10℃下，在0.9M NaCl、0.09M Tris-HCl pH 7.6、6mM EDTA、0.5％NP-40、1×Denhardt雜交溶液、1mM焦磷酸鈉、1mM磷酸二氫鈉、0.1mM ATP和0.2mg/ml酵母RNA中按照標準Southern印跡操作預雜交、雜交和雜交後洗滌。
對於約15個核苷酸到99個核苷酸長度的短探針，載體材料在6×SCC加0.1％SDS中洗滌一次(15分鐘)並使用6×SSC在比計算的Tm低5℃到10℃下洗滌兩次，每次15分鐘。
SEQ ID NO26酸性內切葡聚糖酶或酸性纖維素酶在一具體的實施方案中，本發明多肽為酸性內切葡聚糖酶或酸性纖維素酶，所述內切葡聚糖酶或酸性纖維素酶包含與得自脂環酸芽孢桿菌特別是以DSM保藏號15716保藏的脂環酸芽孢桿菌菌株的酸性內切葡聚糖酶或酸性纖維素酶，更特別是SEQ ID NO26包含的成熟酸性內切葡聚糖酶或酸性纖維素酶有至少90％，特別是至少95％，更特別至少96％，更特別至少97％，更特別至少98％，更特別至少99％或最特別100％同一性的胺基酸序列或由其組成。更具體地，成熟酸性內切葡聚糖酶或酸性纖維素酶包含SEQ ID NO26位置25到959的序列或由其組成。本文中酸性內切葡聚糖酶定義為內水解(特別是在酸性條件下)纖維素、地衣澱粉、或穀物β-D-葡聚糖中1，4-β-D-糖苷鍵的酶。本文中酸性纖維素酶定義為內水解(特別是在酸性條件下)纖維素中1，4-β-D-糖苷鍵的酶。
SEQ ID NO27穀氨酸肽酶在一具體的實施方案中，本發明多肽為穀氨酸肽酶，所述穀氨酸肽酶包含與得自脂環酸芽孢桿菌特別是以DSM保藏號15716保藏的脂環酸芽孢桿菌菌株的穀氨酸肽酶，更特別是SEQ ID NO27包含的成熟穀氨酸肽酶有至少90％，特別是至少95％，更特別至少96％，更特別至少97％，更特別至少98％，更特別至少99％或最特別100％同一性的胺基酸序列或由其組成。更具體地，成熟穀氨酸肽酶包含SEQ ID NO27位置33到272的序列或由其組成。本文中穀氨酸肽酶定義為水解蛋白質或肽並包含保守活性位點殘基Q和E的酶。
穀氨酸肽酶(PepG)(EC 3.4.23.19)先前歸類為天冬氨醯蛋白酶(A4)但被MEROPS(http://merops.sanger.ac.uk/)重新歸類，其公開了「作為Fujinaga，Cherney，Oyama，Oda James(2004)出色文章The molecularstructure and catalytic mechanism of a novel carboxyl peptidase fromScytalidium lignicolum.PubMed的結果，我們目前認識到了第六種肽酶催化類型穀氨酸肽酶。已知的穀氨酸肽酶均屬於以前的A4家族，現在稱為G1家族。」(Fujinaga M，Cherney MM，Oyama H，Oda K，James MN.；The molecular structure and catalytic mechanism of a novel carboxylpeptidase from Scy-talidium lignicolum；Proc.Natl.Acad.Sci.U.S.A.；101(10)；3364-9頁；Epub 01-Mar-2004；09-Mar-2004.)SEQ ID NO27多肽為穀氨酸肽酶還來自以下證實活性位點殘基Q和E在SEQ ID NO27中為保守的多序列比對。
CLUSTAL W(1.81)multiple sequence alignmentSWISSPROT_P24665MKFSTILTGSLFATAALAAPLTEKRRA--RKEARAAGKRHS---NPPYIPGSDKEILK-LTREMBL_Q9P8R1 MKFSIVAATALLAGSAVAAPGTALRQA--RAVKRAARTHGN---PVKYVEGPTN------TREMBL_Q00551 MKYATVVAALLGANAALGARFTEKRRE--RNEARLARRSGSVRLPATNSEGVAIDAAESRSWISSPROT_P15369------------------------------------------------------------TREMBL_Q00550 MKYTAALAALVTLAAAAPTDGIIDIGDGVKLVPREPRAHTRLERLRTFRRGLMEGLESGETREMBL_Q8X1C5 ------------------------------------------------------------SEQ ID NO.27MNGTSVWKASGIAAASCLTAAALLAWP--HATSTLDASPAIFHAPRHALSPNTSPKPNSV
¤¤¤¤¤¤¤¤¤¤¤¤¤SWISSPROT_P24665NGTTNEEYSSNWAGAVLI----GDGYTKVTGEFTVPSVSAGSSGSSGYGGGYGYWKNKRQTREMBL_Q9P8R1 --KTDVSYSSNWAGAVLV----GTGYTSVTGTFTAPSPSTAGSGS---------------TREMBL_Q00551 NDTTNVEYSSNWAGAVLI----GSGYKSVTGIFVVPTPKSPGSGN---------------SWISSPROT_P15369------TVESNWGGAILI----SGDFDTVSATANVPSATGASGGSS--------------TREMBL_Q00550 RNSSDVSYDSNWAGAVKI----GTGLNDVTGTIVVPTPSVPSGGSST-------------TREMBL_Q8X1C5 ----------NWAGAVLTSPPSGSTFTSVSAQFTVPSPSLPQGSQQ--------------SEQ ID NO.27QAQNFGWSASNWSGYAVT----GSTYNDITGSWIVPAVSPSKRSTYS-------------**.** ::. .*: ..
SWISSPROT_P24665TREMBL_Q9P8R1 TREMBL_Q00551 SWISSPROT_P15369TREMBL_Q00550 TREMBL_QBX1C5 SEQ ID NO.27:*:**** . ::* * * ::*** :**::. ::.* SWISSPROT_P24665TREMBL_Q9P8R1 TREMBL_Q00551 SWISSPROT_P15369TREMBL_Q00550 TREMBL_Q8X1C5 SEQ ID NO.27* : .: .: : * . .. : : : .*** *SWISSPROT_P24665---LVAFADFG-SVTFTNAEATSGGSTVGPSDATVMDIEQDGSVLTETSVSG-DSVTVTYTREMBL_Q9PBR1 ---LVQFANFG-TVTFTGASATQNGESVGVTGAQIIDLQQN-SVLTSVSTSS-NSVTVKYTREMBL_Q00551 ---LVPFANFG-TVTFTGAEATTSSGTVTAADATLIDIEQNGEVLTSVTVSG-STVTVKYSWISSPROT_P15369SDEFVPFASFSPAVEFTDCSVTSDGESVSLDDAQITQVIINNQDVTDCSVSG-TTVSCSYTREMBL_Q00550 --- ---LVNFADFD-TVTFKDCSPSVSG-------STIVDIRQSLEVLTECSTTGTTTVTCEYTREMBL_Q8X1C5 ------------------------------------------------------------SEQ ID NO.27---IATLANYG-ETTFDPGTVNGGNPGFTLSDAGYMVQNNAVVSVPSAPDSDTDGFNVAYSWISSPROT_P24665V---------TREMBL_Q9P8R1 V---------TREMBL_Q00551 V---------SWISSPROT_P15369V---------TREMBL_Q00550 VG--------TREMBL_Q8X1C5 ----------SEQ ID NO.27GSNQPSPPAS
SWISSPROTP24665黑麴黴(Aspergillus niger)ASPERGILLOPEPSIN II；SEQ ID NO55TREMBL_Q9P8R1核盤菌(Sclerotinia sclerotiorum)內肽酶EapC；SEQ ID NO56TREMBLQ00551(Cryphonectria parasitica)內肽酶EapC；SEQ ID NO57SWISSPROTP15369(Scytalidium lignicolum)scytalidoglutamic肽酶；SEQ ID NO58TREMBL-Q00550(Cryphonectria parasitica)內肽酶EapB；SEQ ID NO59TREMBL_Q8X1C5(Talaromyces emersonii)胃蛋白酶抑制品不敏感酸性蛋白酶(片段)；SEQ ID NO60SEQ ID NO27本發明序列o＝形成Swissprot P24665活性位點的胺基酸/＝形成Swissprot P24665二硫鍵的半胱氨酸殘基¤＝從Swissprot P24665酶原去除的前肽因此，本發明者鑑定並分離了已知的第一個來自細菌的(G1)穀氨酸肽酶，特別是在低pH和高溫下有活性的穀氨酸肽酶。最近親緣為真菌G1蛋白酶(例如Aspergillopepsin II)。
另外，令人驚奇的是該穀氨酸肽酶由於分子中缺乏二硫鍵而與大多數已知的真菌穀氨酸肽酶不同。與例如公開了由兩個通過二硫鍵交聯的肽組成的已知真菌穀氨酸肽酶的SEQ ID NO55相比，SEQ ID NO27包含的穀氨酸肽酶僅含有一個半胱氨酸，因此蛋白酶結構中不含二硫鍵。因此，脂環酸芽孢桿菌特別是以DSM保藏號15716保藏的脂環酸芽孢桿菌穀氨酸肽酶缺少第二前肽，因此其產生少需要一個成熟步驟。這對細胞製備是有益的。
SEQ ID NO28或SEQ ID NO35多銅氧化酶在一具體的實施方案中，本發明多肽為多銅氧化酶，所述多銅氧化酶包含與得自脂環酸芽孢桿菌特別是以DSM保藏號15716保藏的脂環酸芽孢桿菌菌株的多銅氧化酶，更特別是SEQ ID NO28或35包含的成熟多銅氧化酶有至少90％，特別是至少95％，更特別至少96％，更特別至少97％，更特別至少98％，更特別至少99％或最特別100％同一性的胺基酸序列或由其組成。更具體地，成熟多銅氧化酶包含SEQ ID NO28位置26到315或SEQ ID NO35位置50到597的序列或由之組成。本文中多銅氧化酶定義為至少具有三個光譜差異銅中心的蛋白質。多銅氧化酶可以是氧化多種不同類型酚和二胺的漆酶、抗壞血酸氧化酶、氧化多種無機和有機物質的血漿銅藍蛋白或失去結合銅能力從而通過細菌周質中重金屬螯合介導重金屬抗性的蛋白質部分。
SEQ ID NO29或SEQ ID NO30絲氨酸羧基蛋白酶在一具體的實施方案中，本發明酶為絲氨酸羧基蛋白酶，所述絲氨酸羧基蛋白酶包含與得自脂環酸芽孢桿菌，特別是以DSM保藏號15716保藏的脂環酸芽孢桿菌菌株的絲氨酸羧基蛋白酶，更特別是SEQ ID NO29或30包含的成熟絲氨酸羧基蛋白酶有至少90％，特別是至少95％，更特別至少96％，更特別至少97％，更特別至少98％，更特別至少99％或最特別100％同一性的胺基酸序列或由其組成。更具體地，成熟絲氨酸羧基蛋白酶包含SEQ ID NO29位置190到626或SEQ ID NO30位置25到533的序列或由其組成。本文中絲氨酸羧基蛋白酶定義為屬於EC 3.4.21.100(pseudomonapepsin)類酶的蛋白酶，所述水解酶摺疊類似枯草菌素的摺疊，具有獨特的絲氨酸-穀氨酸-天冬氨酸催化三聯體以及氧陰離子洞中存在天冬氨酸殘基。如果催化位點胺基酸存在於序列中且其顯示與MEROPS絲氨酸蛋白酶家族53肽序列相似的肽序列，則該多肽序列可歸類於絲氨酸羧基肽酶。
SEQ ID NO31絲氨酸蛋白酶或HtrA樣絲氨酸蛋白酶在一具體的實施方案中，本發明多肽為絲氨酸蛋白酶或HtrA樣絲氨酸蛋白酶，所述絲氨酸蛋白酶或HtrA樣絲氨酸蛋白酶包含與得自脂環酸芽孢桿菌，特別是以DSM保藏號15716保藏的脂環酸芽孢桿菌菌株的絲氨酸蛋白酶或HtrA樣絲氨酸蛋白酶，更特別是SEQ ID NO31包含的成熟絲氨酸蛋白酶羧基蛋白酶有至少90％，特別是至少95％，更特別至少96％，更特別至少97％，更特別至少98％，更特別至少99％或最特別100％同一性的胺基酸序列或由其組成。更具體地，成熟絲氨酸蛋白酶包含SEQID NO31位置42到411的序列或由其組成。本文中絲氨基蛋白酶定義為水解蛋白質或肽且催化位點包含絲氨酸殘基的酶。HtrA樣蛋白酶定義為在提高的溫度下降解細菌細胞細胞外區室中受損蛋白質的酶。
SEQ ID NO32二硫化物異構酶在一具體的實施方案中，本發明多肽為二硫化物異構酶，所述二硫化物異構酶包含與得自脂環酸芽孢桿菌，特別是在DSM保藏號15716下保藏的脂環酸芽孢桿菌菌株的二硫化物異構酶，更特別是SEQ ID NO32包含的成熟二硫化物異構酶有至少90％，特別是至少95％，更特別至少96％，更特別至少97％，更特別至少98％，更特別至少99％或最特別100％同一性的胺基酸序列或由其組成。更具體地，成熟二硫化物異構酶包含SEQ IDNO32位置31到212的序列或由其組成。本文中二硫化物異構酶定義為催化蛋白質鏈內和鏈間二硫鍵重排以形成天然結構的酶。
SEQ ID NO33γ-D-穀氨醯-L-二胺基酸內肽酶在一具體的實施方案中，本發明多肽為γ-D-穀氨醯-L-二胺基酸內肽酶，所述γ-D-穀氨醯-L-二胺基酸內肽酶包含與得自脂環酸芽孢桿菌，特別是在DSM保藏號15716下保藏的脂環酸芽孢桿菌菌株的γ-D-穀氨醯-L-二胺基酸內肽酶，更特別是SEQ ID NO33包含的成熟γ-D-穀氨醯-L-二胺基酸內肽酶有至少90％，特別是至少95％，更特別至少96％，更特別至少97％，更特別至少98％，更特別至少99％或最特別100％同一性的胺基酸序列或由其組成。更具體地，成熟γ-D-穀氨醯-L-二胺基酸內肽酶包含SEQ ID NO33位置30到266序列或由其組成。本文中γ-D-穀氨醯-L-二胺基酸內肽酶定義為水解L-丙氨酸-γ-D-穀氨醯-l-(L)內消旋二胺基庚二酸-(L)-D-丙氨酸中與(L)內消旋二胺基庚二酸結合的γ-D-穀氨醯的酶。需要(L)內消旋二胺基庚二酸基團的ω氨基和ω羧基是未替代的。
SEQ ID NO34內-β-N-乙醯氨基葡糖苷酶在具體的實施方案中，本發明多肽為內-β-N-乙醯氨基葡糖苷酶，所述內-β-N-乙醯氨基葡糖苷酶包含與得自脂環酸芽孢桿菌，特別是在DSM保藏號15716下保藏的脂環酸芽孢桿菌菌株的內-β-N-乙醯氨基葡糖苷酶，更特別是SEQ ID NO34包含的成熟內-β-N-乙醯氨基葡糖苷酶有至少90％，特別是至少95％，更特別至少96％，更特別至少97％，更特別至少98％，更特別至少99％或最特別100％同一性的胺基酸序列或由其組成。更具體地，成熟內-β-N-乙醯氨基葡糖苷酶包含SEQ ID NO34位置27到768的序列或由其組成。本文中內-β-N-乙醯氨基葡糖苷酶定義為水解原核細胞壁肽聚糖雜聚物中N-乙醯-D-葡糖胺和N-乙醯胞壁酸間1，4-β-鍵的酶。
SEQ ID NO36肽基脯氨醯異構酶在一具體的實施方案中，本發明多肽為肽基脯氨醯異構酶，所述肽基脯氨醯異構酶包含與得自脂環酸芽孢桿菌，特別是在DSM保藏號15716下保藏的脂環酸芽孢桿菌菌株的肽基脯氨醯異構酶，更特別是SEQ ID NO36包含的成熟肽基脯氨醯異構酶有至少90％，特別是至少95％，更特別至少96％，更特別至少97％，更特別至少98％，更特別至少99％或最特別100％同一性的胺基酸序列或由其組成。更具體地，成熟肽基脯氨醯異構酶包含SEQ ID NO36位置30到246的序列或由其組成。本文中肽基脯氨醯異構酶定義為通過催化寡肽中脯氨酸亞胺肽鍵順反異構化加速蛋白質摺疊的酶。
SEQ ID NO37酸性磷酸酯酶或植酸酶或磷脂酶C在一具體的實施方案中，本發明多肽為酸性磷酸酯酶或植酸酶或磷脂酶C，所述酸性磷酸酯酶或植酸酶或磷脂酶C包含與得自脂環酸芽孢桿菌，特別是在DSM保藏號15716下保藏的脂環酸芽孢桿菌菌株的酸性磷酸酯酶或植酸酶或磷脂酶C，更特別是SEQ ID NO37包含的成熟酸性磷酸酯酶或植酸酶或磷脂酶C有至少90％，特別是至少95％，更特別至少96％，更特別至少97％，更特別至少98％，更特別至少99％或最特別100％同一性的胺基酸序列或由其組成。更具體地，成熟酸性磷酸酯酶或植酸酶或磷脂酶C包含SEQ ID NO37位置28到608序列或由其組成。酸性磷酸酯酶定義為將正磷酸單酯水解為醇和磷酸的酶。本文中植酸酶定義為從肌醇六磷酸上除去磷酸基團的酶。磷脂酶C定義為將磷酸卵磷脂水解為1，2-二醯基甘油和膽鹼的酶。
SEQ ID NO38或SEQ ID NO39多糖脫乙醯酶在一具體的實施方案中，本發明多肽為多糖脫乙醯酶或木聚糖脫乙醯酶，所述多糖脫乙醯酶或木聚糖脫乙醯酶包含與得自脂環酸芽孢桿菌，特別是在DSM保藏號15716下保藏的脂環酸芽孢桿菌菌株的多糖脫乙醯酶或木聚糖脫乙醯酶，更特別是SEQ ID NO33或39包含的成熟多糖脫乙醯酶或木聚糖脫乙醯酶有至少90％，特別是至少95％，更特別至少96％，更特別至少97％，更特別至少98％，更特別至少99％或最特別100％同一性的胺基酸序列或由其組成。更具體地，成熟多糖脫乙醯酶或木聚糖脫乙醯酶包含SEQ ID NO38位置26到251或SEQ ID NO39位置22到324的序列或由其組成。本文中多糖脫乙醯酶定義為通過水解從特異的乙醯化多糖上去除乙醯殘基的酶。木聚糖脫乙醯酶定義為從乙醯化木聚糖上去除乙醯基團的酶。
SEQ ID NO40亞硫酸鹽氧化酶在一具體的實施方案中，本發明多肽為亞硫酸鹽氧化酶，所述亞硫酸鹽氧化酶包含與得自脂環酸芽孢桿菌，特別是在DSM保藏號15716下保藏的脂環酸芽孢桿菌菌株的亞硫酸鹽氧化酶，更特別是SEQ ID NO40包含的成熟亞硫酸鹽氧化酶有至少90％，特別是至少95％，更特別至少96％，更特別至少97％，更特別至少98％，更特別至少99％或最特別100％同一性的胺基酸序列或由其組成。更具體地，成熟亞硫酸鹽氧化酶包含SEQ IDNO40位置30到214的序列或由其組成。亞硫酸鹽氧化酶定義為將亞硫酸氧化為硫酸的酶。
SEQ ID NO41功能性多肽在一具體的實施方案中，本發明多肽為功能性多肽，所述功能性多肽包含與SEQ ID NO41，特別是SEQ ID NO41包含的成熟功能性多肽有至少90％，特別是至少95％，更特別至少96％，更特別至少97％，更特別至少98％，更特別至少99％或最特別100％同一性的胺基酸序列或由其組成。更具體地，成熟功能性多肽包含SEQ ID NO41位置22到257的序列或由其組成。
SEQ ID NO42功能性多肽在一具體的實施方案中，本發明多肽為功能性多肽，所述功能性多肽包含與SEQ ID NO42，特別是SEQ ID NO42包含的成熟功能性多肽有至少90％，特別是至少95％，更特別至少96％，更特別至少97％，更特別至少98％，更特別至少99％或最特別100％同一性的胺基酸序列或由其組成。更具體地，成熟功能性多肽包含SEQ ID NO42位置25到1130的序列或由其組成。
SEQ ID NO43功能性多肽在一具體的實施方案中，本發明多肽功能性多肽，所述功能性多肽為包含與SEQ ID NO43，特別是SEQ ID NO43包含的成熟功能性多肽有至少90％，特別是至少95％，更特別至少96％，更特別至少97％，更特別至少98％，更特別至少99％或最特別100％同一性的胺基酸序列或由其組成。更具體地，成熟功能性多肽包含SEQ ID NO43位置42到248的序列或由其組成。
SEQ ID NO44功能性多肽在一具體的實施方案中，本發明多肽為功能性多肽，所述功能性多肽包含與SEQ ID NO44，特別是SEQ ID NO44包含的成熟功能性多肽有至少90％，特別是至少95％，更特別至少96％，更特別至少97％，更特別至少98％，更特別至少99％或最特別100％同一性的胺基酸序列或由其組成。更具體地，成熟功能性多肽包含SEQ ID NO44位置26到172的序列或由其組成。
SEQ ID NO45功能性多肽在一具體的實施方案中，本發明多肽為功能性多肽，所述功能性多肽包含與SEQ ID NO45，特別是SEQ ID NO45包含的成熟功能性多肽有至少90％，特別是至少95％，更特別至少96％，更特別至少97％，更特別至少98％，更特別至少99％或最特別100％同一性的胺基酸序列或由其組成。更具體地，成熟功能性多肽包含SEQ ID NO45位置31到242的序列或由其組成。
SEQ ID NO46功能性多肽在一具體的實施方案中，本發明多肽為功能性多肽，所述功能性多肽包含與SEQ ID NO46，特別是SEQ ID NO64包含的成熟功能性多肽有至少90％，特別是至少95％，更特別至少96％，更特別至少97％，更特別至少98％，更特別至少99％或最特別100％同一性的胺基酸序列或由其組成。更具體地，成熟功能性多肽包含SEQ ID NO46位置25到280的序列或由其組成。
SEQ ID NO47功能性多肽在一具體的實施方案中，本發明多肽為功能性多肽，所述功能性多肽包含與SEQ ID NO47，特別是SEQ ID NO47包含的成熟功能性多肽有至少90％，特別是至少95％，更特別至少96％，更特別至少97％，更特別至少98％，更特別至少99％或最特別100％同一性的胺基酸序列或由其組成。更具體地，成熟功能性多肽包含SEQ ID NO47位置26到478的序列或由其組成。
SEQ ID NO48功能性多肽在一具體的實施方案中，本發明多肽為功能性多肽，所述功能性多肽包含與SEQ ID NO48，特別是SEQ ID NO48包含的成熟功能性多肽有至少90％，特別是至少95％，更特別至少96％，更特別至少97％，更特別至少98％，更特別至少99％或最特別100％同一性的胺基酸序列或由其組成。更具體地，成熟功能性多肽包含SEQ ID NO48位置20到340的序列或由其組成。
SEQ ID NO49功能性多肽在一具體的實施方案中，本發明多肽為功能性多肽，所述功能性多肽包含與SEQ ID NO49，特別是SEQ ID NO49包含的成熟功能性多肽有至少90％，特別是至少95％，更特別至少96％，更特別至少97％，更特別至少98％，更特別至少99％或最特別100％同一性的胺基酸序列或由其組成。更具體地，成熟功能性多肽包含SEQ ID NO49位置30到341的序列或由其組成。
SEQ ID NO50功能性多肽在一具體的實施方案中，本發明多肽為功能性多肽，所述功能性多肽包含與SEQ ID NO50，特別是SEQ ID NO50包含的成熟功能性多肽有至少90％，特別是至少95％，更特別至少96％，更特別至少97％，更特別至少98％，更特別至少99％或最特別100％同一性的胺基酸序列或由其組成。更具體地，成熟功能性多肽包含SEQ ID NO50位置29到400的序列或由其組成。
多核苷酸本發明還涉及多核苷酸，特別是包含編碼本發明多肽的核苷酸序列或由其組成的分離多核苷酸。在一具體的實施方案中，核苷酸序列在SEQ IDNO1到SEQ ID NO25中公開，包括由於遺傳密碼簡併性而與之存在差異的核苷酸序列。在另一實施方案中，本發明多核苷酸為包含選自SEQ IDNO1到SEQ ID NO25編碼成熟多肽區域的核苷酸序列或由其組成的修飾核苷酸序列，所述修飾核苷酸序列與SEQ ID NO1到SEQ ID NO25包含的親本核苷酸序列相比包含至少一個修飾/突變。
用於分離和/或克隆編碼酶的核苷酸序列的技術為本領域公知，包括從基因組DNA中分離、由cDNA製備或它們的組合。可通過例如使用熟知的聚合酶鏈式反應(PCR)或抗體篩選表達文庫檢測有共享結構特徵的克隆DNA片段來從這些基因組DNA中克隆本發明的核苷酸序列。參閱如Innis等，1990，《PCRA Guide to Methods and Application》，AcademicPress，New York。可使用其他擴增操作例如連接酶鏈反應(LCR)、連接激活轉錄(LAT)和基於核苷酸序列的擴增(NASBA)。
可通過基因工程中使用的將核苷酸序列從其天然位置重新定位於其再產生的不同位點的標準克隆方法獲得核苷酸序列。克隆方法可包括切除並分離包含編碼多肽的核苷酸序列的所需片段、將片段插入載體分子和將重組體載體整合進核苷酸序列的多拷貝或克隆在其中複製的宿主細胞。核苷酸序列可以是基因組、cDNA、RNA、半合成的、合成來源的或其任意組合。
具體的多核苷酸包含與選自SEQ ID NO1到SEQ ID NO25編碼成熟多肽區域的核苷酸序列有至少50％同一性的核苷酸序列，優選由其組成。具體而言，核苷酸序列與選自SEQ ID NO1到SEQ ID NO25編碼成熟多肽區域的核苷酸序列有至少65％同一性，更特別至少70％同一性，更特別至少80％同一性，更特別至少90％同一性，更特別至少95％同一性，更特別至少96％同一性，更特別至少97％同一性，更特別至少98％同一性，更特別至少99％同一性或最特別100％同一性。特別的，核苷酸序列包含選自SEQ ID NO1到SEQ ID NO25編碼成熟多肽區域的核苷酸序列。在更特別的實施方案中，核苷酸序列由選自SEQ ID NO1到SEQID NO25編碼成熟多肽區域的核苷酸序列組成。
具體而言，多核苷酸包括編碼選自以下的成熟酶的核苷酸序列酸性內切葡聚糖酶或酸性纖維素酶、穀氨酸肽酶、多銅氧化酶、絲氨酸羧基蛋白酶、絲氨酸蛋白酶或HtrA樣絲氨酸蛋白酶、二硫化物異構酶、γ-D-穀氨醯-L-二胺基酸內肽酶、內-β-N-乙醯氨基葡糖苷酶、肽醯脯氨醯異構酶、酸性磷酸酯酶或植酸酶或磷脂酶C、多糖脫乙醯酶或木聚糖脫乙醯酶和亞硫酸鹽氧化酶，或與編碼選自以DSM保藏號15716保藏的脂環酸芽孢桿菌菌株所分泌的酸性內切葡聚糖酶或酸性纖維素酶、穀氨酸肽酶、多銅氧化酶、絲氨酸羧基蛋白酶、絲氨酸蛋白酶或HtrA樣絲氨酸蛋白酶、二硫化物異構酶、γ-D-穀氨醯-L-二胺基酸內肽酶、內-β-N-乙醯氨基葡糖苷酶、肽醯脯氨醯異構酶、酸性磷酸酯酶或植酸酶或磷脂酶C、多糖脫乙醯酶或木聚糖脫乙醯酶和亞硫酸鹽氧化酶的成熟酶的核苷酸序列有至少50％同一性，特別的至少65％同一性，更特別至少70％同一性，更特別至少80％同一性，更特別至少90％同一性，更特別至少95％同一性，更特別至少96％同一性，更特別至少97％同一性，更特別至少98％同一性，更特別至少99％同一性或最特別100％同一性的核苷酸序列，優選由其組成。
SEQ ID NO1在一具體的實施方案中，本發明的多核苷酸編碼酸性內切葡聚糖酶或酸性纖維素酶，並包含與SEQ ID NO1位置73到2877的核苷酸序列有至少70％同一性，更特別至少80％同一性，更特別至少90％同一性，更特別至少95％同一性，更特別至少96％同一性，更特別至少97％同一性，更特別至少98％同一性，更特別至少99％同一性或最特別100％同一性的核苷酸序列或由其組成。
SEQ ID NO2在一具體的實施方案中，本發明的多核苷酸編碼穀氨酸肽酶，並包含與SEQ ID NO2位置97到816的核苷酸序列有至少70％同一性，更特別至少80％同一性，更特別至少90％同一性，更特別至少95％同一性，更特別至少96％同一性，更特別至少97％同一性，更特別至少98％同一性，更特別至少99％同一性或最特別100％同一性的核苷酸序列或由其組成。
SEQ ID NO3和10在一具體的實施方案中，本發明的多核苷酸編碼多銅氧化酶，並包含與SEQ ID NO1位置76到945或SEQ ID NO10位置148到1791的核苷酸序列有至少70％同一性，更特別至少80％同一性，更特別至少90％同一性，更特別至少95％同一性，更特別至少96％同一性，更特別至少97％同一性，更特別至少98％同一性，更特別至少99％同一性或最特別100％同一性的核苷酸序列或由其組成。
SEQ ID NO4和5在一具體的實施方案中，本發明的多核苷酸編碼絲氨酸羧基蛋白酶，並包含與SEQ ID NO4位置568到1878或SEQ ID NO5位置73到1599的核苷酸序列有至少70％同一性，更特別至少80％同一性，更特別至少90％同一性，更特別至少95％同一性，更特別至少96％同一性，更特別至少97％同一性，更特別至少98％同一性，更特別至少99％同一性或最特別100％同一性的核苷酸序列或由其組成。
SEQ ID NO6在一具體的實施方案中，本發明的多核苷酸編碼絲氨酸蛋白酶或HtrA樣絲氨酸蛋白酶，並包含與SEQ ID NO6位置124到1233的核苷酸序列有至少70％同一性，更特別至少80％同一性，更特別至少90％同一性，更特別至少95％同一性，更特別至少96％同一性，更特別至少97％同一性，更特別至少98％同一性，更特別至少99％同一性或最特別100％同一性的核苷酸序列或由其組成。
SEQ ID NO7在一具體的實施方案中，本發明的多核苷酸編碼二硫化物異構酶，並包含與SEQ ID NO7位置91到633的核苷酸序列有至少70％同一性，更特別至少80％同一性，更特別至少90％同一性，更特別至少95％同一性，更特別至少96％同一性，更特別至少97％同一性，更特別至少98％同一性，更特別至少99％同一性或最特別100％同一性的核苷酸序列或由其組成。
SEQ ID NO8在一具體的實施方案中，本發明的多核苷酸編碼γ-D-穀氨醯-L-二胺基酸內肽酶，並包含與SEQ ID NO8位置88到798的核苷酸序列有至少70％同一性，更特別至少80％同一性，更特別至少90％同一性，更特別至少95％同一性，更特別至少96％同一性，更特別至少97％同一性，更特別至少98％同一性，更特別至少99％同一性或最特別100％同一性的核苷酸序列或由其組成。
SEQ ID NO9在一具體的實施方案中，本發明的多核苷酸編碼內-β-N-乙醯氨基葡糖苷酶，並包含與SEQ ID NO9位置79到2304的核苷酸序列有至少70％同一性，更特別至少80％同一性，更特別至少90％同一性，更特別至少95％同一性，更特別至少96％同一性，更特別至少97％同一性，更特別至少98％同一性，更特別至少99％同一性或最特別100％同一性的核苷酸序列或由其組成。
SEQ ID NO11在一具體的實施方案中，本發明的多核苷酸編碼肽醯脯氨醯異構酶，並包含與SEQ ID NO9位置88到735的核苷酸序列有至少70％同一性，更特別至少80％同一性，更特別至少90％同一性，更特別至少95％同一性，更特別至少96％同一性，更特別至少97％同一性，更特別至少98％同一性，更特別至少99％同一性或最特別100％同一性的核苷酸序列或由其組成。
SEQ ID NO12在一具體的實施方案中，本發明的多核苷酸編碼酸性磷酸酯酶或植酸酶或磷脂酶C，並包含與SEQ ID NO12位置82到1824的核苷酸序列有至少70％同一性，更特別至少80％同一性，更特別至少90％同一性，更特別至少95％同一性，更特別至少96％同一性，更特別至少97％同一性，更特別至少98％同一性，更特別至少99％同一性或最特別100％同一性的核苷酸序列或由其組成。
SEQ ID NO13和14在一具體的實施方案中，本發明的多核苷酸編碼多糖脫乙醯酶或木聚糖脫乙醯酶，並包含與SEQ ID NO13位置76到750或SEQ ID NO14位置64到972的核苷酸序列有至少70％同一性，更特別至少80％同一性，更特別至少90％同一性，更特別至少95％同一性，更特別至少96％同一性，更特別至少97％同一性，更特別至少98％同一性，更特別至少99％同一性或最特別100％同一性的核苷酸序列或由其組成。
SEQ ID NO15在一具體的實施方案中，本發明的多核苷酸編碼亞硫酸鹽氧化酶，並包含與SEQ ID NO15位置88到642的核苷酸序列有至少70％同一性，更特別至少80％同一性，更特別至少90％同一性，更特別至少95％同一性，更特別至少96％同一性，更特別至少97％同一性，更特別至少98％同一性，更特別至少99％同一性或最特別100％同一性的核苷酸序列或由其組成。
SEQ ID NO16在一具體實施方案中，本發明的多核苷酸編碼成熟功能性多肽，並包含與SEQ ID NO16位置64到771的核苷酸序列具有至少70％同一性，更特別至少80％同一性，更特別至少90％同一性，更特別至少95％同一性，更特別至少96％同一性，更特別至少97％同一性，更特別至少98％同一性，更特別至少99％同一性或最特別100％同一性的核苷酸序列或由其組成。
SEQ ID NO17在一具體實施方案中，本發明的多核苷酸編碼成熟功能性多肽，並包含與SEQ ID NO17位置73到3390的核苷酸序列具有至少70％同一性，更特別至少80％同一性，更特別至少90％同一性，更特別至少95％同一性，更特別至少96％同一性，更特別至少97％同一性，更特別至少98％同一性，更特別至少99％同一性或最特別100％同一性的核苷酸序列或由其組成。
SEQ ID NO18在一具體實施方案中，本發明的多核苷酸編碼成熟功能性多肽，並包含與SEQ ID NO18位置124到744的核苷酸序列具有至少70％同一性，更特別至少80％同一性，更特別至少90％同一性，更特別至少95％同一性，更特別至少96％同一性，更特別至少97％同一性，更特別至少98％同一性，更特別至少99％同一性或最特別100％同一性的核苷酸序列或由其組成。
SEQ ID NO19在一具體實施方案中，本發明的多核苷酸編碼成熟功能性多肽，並包含與SEQ ID NO19位置76到516的核苷酸序列具有至少70％同一性，更特別至少80％同一性，更特別至少90％同一性，更特別至少95％同一性，更特別至少96％同一性，更特別至少97％同一性，更特別至少98％同一性，更特別至少99％同一性或最特別100％同一性的核苷酸序列或由其組成。
SEQ ID NO20在一具體實施方案中，本發明的多核苷酸編碼成熟功能性多肽，並包含與SEQ ID NO20位置91到726的核苷酸序列具有至少70％同一性，更特別至少80％同一性，更特別至少90％同一性，更特別至少95％同一性，更特別至少96％同一性，更特別至少97％同一性，更特別至少98％同一性，更特別至少99％同一性或最特別100％同一性的核苷酸序列或由其組成。
SEQ ID NO21在一具體實施方案中，本發明的多核苷酸編碼成熟功能性多肽，並包含與SEQ ID NO21位置73到540的核苷酸序列具有至少70％同一性，更特別至少80％同一性，更特別至少90％同一性，更特別至少95％同一性，更特別至少96％同一性，更特別至少97％同一性，更特別至少98％同一性，更特別至少99％同一性或最特別100％同一性的核苷酸序列或由其組成。
SEQ ID NO22在一具體實施方案中，本發明的多核苷酸編碼成熟功能性多肽，並包含與SEQ ID NO22位置76到1431的核苷酸序列具有至少70％同一性，更特別至少80％同一性，更特別至少90％同一性，更特別至少95％同一性，更特別至少96％同一性，更特別至少97％同一性，更特別至少98％同一性，更特別至少99％同一性或最特別100％同一性的核苷酸序列或由其組成。
SEQ ID NO23在一具體實施方案中，本發明的多核苷酸編碼成熟功能性多肽，並包含與SEQ ID NO23位置58到1020的核苷酸序列具有至少70％同一性，更特別至少80％同一性，更特別至少90％同一性，更特別至少95％同一性，更特別至少96％同一性，更特別至少97％同一性，更特別至少98％同一性，更特別至少99％同一性或最特別100％同一性的核苷酸序列或由其組成。
SEQ ID NO24在一具體實施方案中，本發明的多核苷酸編碼成熟功能性多肽，並包含與SEQ ID NO24位置88到1023的核苷酸序列具有至少70％同一性，更特別至少80％同一性，更特別至少90％同一性，更特別至少95％同一性，更特別至少96％同一性，更特別至少97％同一性，更特別至少98％同一性，更特別至少99％同一性或最特別100％同一性的核苷酸序列或由其組成。
SEQ ID NO25在一具體實施方案中，本發明的多核苷酸編碼成熟功能性多肽，並包含與SEQ ID NO25位置85到1197的核苷酸序列具有至少70％同一性，更特別至少80％同一性，更特別至少90％同一性，更特別至少95％同一性，更特別至少96％同一性，更特別至少97％同一性，更特別至少98％同一性，更特別至少99％同一性或最特別100％同一性的核苷酸序列或由其組成。
修飾編碼本發明多肽的核苷酸序列對於合成多肽可能是必需的，所述多肽包含與選自SEQ ID NO26到SEQ ID NO50包含的成熟多肽的胺基酸序列相比至少有一個替代、缺失和/或插入的胺基酸序列。
對本領域技術人員顯而易見的是，為保持酶的功能可製造這樣的修飾，即修飾在對酶功能至關重要的區域外進行。因此對功能必需的胺基酸殘基優選不受修飾(如替換)。可根據本領域已知的方法例如位點定向誘變或丙氨酸分區誘變(見例如Cunningham和Wells，1989，Science 2441081-1085)鑑定功能必需的胺基酸殘基。可通過對以核磁共振分析、晶體學或光親和標記之類的技術(見例如de Vos等，1992，Science 255306-312；Smith等，1992，Journal of Molecular Biology 224899-904；Wlodaver等，1992，FEBS Letters 30959-64)確定的三維結構進行分析來確定底物-酶相互作用位點。
此外，可通過引入核苷酸替代來修飾編碼本發明酶的核苷酸序列，所述替代不產生由該核苷酸序列編碼的酶的另一胺基酸序列，但是符合將用於產生該酶的宿主生物相應的密碼子選擇。
可使用任何本領域已知的方法通過位點定向誘變完成向核苷酸序列中引入將一個核苷酸與另一核苷酸交換的突變。特別有用的是利用帶有目的插入片段的超螺旋、雙鏈DNA載體和含有目的突變的兩個合成引物的操作。分別與載體相反鏈互補的寡核苷酸引物通過Pfu DNA聚合酶在溫度循環中延伸。引物整合產生含有交錯切口的突變質粒。溫度循環後用對甲基化和半甲基化DNA特異的Dpn I處理產物以消化親代DNA模板並選擇含有突變的合成DNA。也可使用其他本領域已知的方法。關於核苷酸替代的一般描述可查看例如Ford等，1991，《Protein Expression and Purification》295-107。
本發明還涉及含有編碼本發明多肽的核苷酸序列並與選自(i)SEQ ID NO1到SEQ ID NO25編碼成熟多肽的區域的核苷酸序列互補鏈，(ii)包含在選自SEQ ID NO1到SEQ ID NO25編碼成熟多肽的區域的核苷酸序列中的cDNA序列的互補鏈；(iii)編碼具有SEQ ID NO26到SEQ ID NO50中包含的成熟多肽相應功能的分泌成熟多肽的(i)或(ii)的片段的多核苷酸探針在高嚴格度條件下，特別是非常高嚴格度條件(J.Sambrook，E.F.Fritsch，和T.Maniatus，1989，《Molecular Cloning，ALaboratory Manual》，第二版，Cold Spring Harbor，New York)下雜交的核苷酸序列(優選由其組成)的多核苷酸。
應該理解關於核苷酸序列雜交的內容和細節將與本文題為「本發明多肽」的小節中討論的雜交方面相同或類似。
本發明還包括適用於電子設備，優選數碼設備的儲存媒體，所述裝置含有本發明多肽胺基酸序列或本發明多核苷酸核苷酸序列的信息，具體的為本發明任何多肽或多核苷酸序列為電子或數字形式，例如二進位代碼或其他數字代碼。合適的儲存介質可以是用於電子設備和計算設備的磁碟或光碟，且信息可具體地以數字形式儲存在儲存媒體中。
核苷酸構建體本發明還涉及含有與一個或多個控制序列有效連接的本發明核苷酸序列的核酸構建體，所述控制序列在與控制序列兼容的條件下指導編碼序列在適當的宿主細胞內表達。
可以以多種方式操作編碼本發明多肽的核苷酸序列，以便提供多肽的表達。插入載體前的核苷酸序列的操作可能是需要的或者是必要的，這取決於表達載體。利用重組DNA方法來修飾核苷酸序列的技術是本領域眾所周知的。
控制序列可以是適當的啟動子序列——被宿主細胞識別用於表達核苷酸序列的核苷酸序列。啟動子序列含有介導多肽表達的轉錄控制序列。啟動子可以是在所選擇的宿主細胞內表現出轉錄活性的任何核苷酸序列，包括突變、截短和雜合啟動子，並且可以從編碼細胞外或者細胞內的與宿主細胞同源或者異源的的多肽的基因得到。
用於指導本發明核酸構建體轉錄(特別是在細菌宿主細胞中)的適當的啟動子實例為從大腸桿菌乳糖操縱子、天藍色鏈黴菌(Streptomycescoelicolor)瓊脂糖酶基因(dagA)、枯草芽孢桿菌果聚糖蔗糖酶(sacB)、地衣芽孢桿菌(Bacillus licheniformis)α-澱粉酶基因(amyL)、嗜熱脂肪芽孢桿菌(Bacillus stearothermophilus)麥芽糖(maltogenic)澱粉酶基因(amyM)、解澱粉芽孢桿菌(Bacillus amyloliquefaciens)α-澱粉酶基因(amyQ)、地衣芽孢桿菌青黴素酶基因(penP)、枯草芽孢桿菌xylA和xylB基因和原核β-內醯胺酶基因(Villa-Kamaroff等，1978，Proceedings of theNational Academy of Sciences USA 753727-3731)得到的啟動子以及tac啟動子(DeBoer等，1983，Proceedings of the National Academy of SciencesUSA 8021-25)。其他的啟動子描述於Scientific American，1980，24274-94中″Useful proteins from recombinant bacteria″和Sambrook等，1989，上文。
用於指導本發明核酸構建體在絲狀真菌宿主細胞內轉錄的適當啟動子有從米麴黴(Aspergillus oryzae)TAKA澱粉酶、米赫根毛黴(Rhizomucormiehei)天冬氨酸蛋白酶、黑麴黴中性α-澱粉酶、黑麴黴酸穩定α-澱粉酶、黑麴黴或者泡盛麴黴(Aspergillus awamori)葡糖澱粉酶(glaA)、米赫根毛黴脂酶、米麴黴鹼性蛋白酶、米麴黴丙糖磷酸異構酶、構巢麴黴(Aspergillusnidulans)乙醯胺酶和尖鐮孢(Fusarium oxysporum)胰蛋白酶樣蛋白酶(WO96/00787)基因得到的啟動子，以及NA2-tpi啟動子(從黑麴黴中性α-澱粉酶和米麴黴丙糖磷酸異構酶得到的雜合啟動子)和它們的突變、截短和雜合啟動子。
在酵母宿主中有用的啟動子得自釀酒酵母(Saccharomyces cerevisiae)烯醇化酶(ENO-1)基因、釀酒酵母半乳糖激酶(GAL1)基因、釀酒酵母醇脫氫酶/甘油醛-3-磷酸脫氫酶(ADH2/GAP)基因和釀酒酵母3-磷酸甘油酸酯激酶基因。其他可用於酵母宿主細胞的啟動子由Romanos等，1992，Yeast 8423-488描述。
控制序列還可以是適當的轉錄終止序列——被宿主細胞識別以終止轉錄的序列。終止子序列與編碼酶的核苷酸序列3』末端有效連接。在所選擇的宿主細胞內具有功能的任何終止子均可用於本發明。
用於絲狀真菌宿主細胞的優選的終止子得自米麴黴TAKA澱粉酶、黑麴黴葡糖澱粉酶、構巢麴黴臨氨基苯甲酸核合酶、黑麴黴α-葡糖苷酶和尖鐮孢胰蛋白酶樣蛋白酶基因。
用於酵母宿主細胞的優選的終止子得自釀酒酵母烯醇化酶、釀酒酵母細胞色素C(CYC1)和釀酒酵母甘油醛-3-磷酸脫氫酶基因。其他可用於酵母宿主細胞的終止子由Romanos等，1992，上文，描述。
控制序列還可以是適宜的前導序列——對宿主細胞進行翻譯而言重要的mRNA非翻譯區。前導序列與編碼多肽的核苷酸序列的5′末端有效連接。在所選擇的宿主細胞內具有功能的任何前導序列均可用於本發明。
用於絲狀真菌宿主細胞的優選的前導序列是從米麴黴TAKA澱粉酶和構巢麴黴丙糖磷酸異構酶基因得到的前導序列。
適用於酵母宿主細胞的前導序列可得自釀酒酵母烯醇化酶(ENO-1)、釀酒酵母3-磷酸甘油酸酯激酶、釀酒酵母α-因子和釀酒酵母醇脫氫酶/甘油醛-3-磷酸脫氫酶(ADH2/GAP)基因。
控制序列還可以是聚腺苷酸化序列，即與核苷酸序列的3′末端有效連接並且轉錄後作為向轉錄的mRNA添加聚腺苷酸殘基的信號而被宿主細胞識別的序列。在所選擇的宿主細胞內具有功能的任何聚腺苷酸化序列均可用於本發明。
用於絲狀真菌宿主細胞的優選的聚核苷酸化序列得自米麴黴TAKA澱粉酶、黑麴黴葡糖澱粉酶、構巢麴黴鄰氨基苯甲酸合酶、尖鐮孢胰蛋白酶樣蛋白酶和黑麴黴α-葡糖苷酶基因。
可用於酵母宿主細胞的聚腺苷酸化序列由Guo和Sherman，1995，Molecular Cellular Biology 155983-5990描述。
控制序列還可以是信號肽編碼區，其編碼的胺基酸序列與多肽的氨基末端連接並且指導編碼的酶進入細胞的分泌途徑。在核苷酸序列編碼序列的5′末端可以天然的含有信號肽編碼區，該信號肽編碼區於翻譯閱讀框內與編碼所分泌多肽的編碼區片段天然連接。另外，編碼序列的5′末端可以含有對於編碼序列而言為外來的信號肽編碼區。在編碼區天然不含有信號肽編碼區時，可能需要外來的信號肽編碼區。另外，外來的信號肽編碼區可簡單地替換天然的信號肽編碼區以增強酶的分泌。然而，能夠指導表達的酶進入所選擇宿主細胞的分泌途徑的任何信號肽編碼區都可用於本發明。
對於細菌宿主細胞，有效的信號肽編碼區來自於芽孢桿菌NCIB 11837maltogenic澱粉酶、嗜熱脂肪芽孢桿菌α-澱粉酶、地衣芽孢桿菌枯草桿菌蛋白酶、地衣芽孢桿菌β-內醯胺酶、嗜熱脂肪芽孢桿菌中性蛋白酶(nprT、nprS、nprM)和枯草芽孢桿菌prsA基因的信號肽編碼區。其他信號肽由Simonen和Palva，1993，Microbiological Reviews 57109-137描述。
對於絲狀真菌宿主細胞，有效的信號肽編碼區來自於米麴黴TAKA澱粉酶、黑麴黴中性澱粉酶、黑麴黴葡糖澱粉酶、米赫根毛黴天冬氨酸蛋白酶、孤獨腐質黴(Humicola insolens)纖維素酶和柔毛腐質黴(Humicolalanuginosa)脂酶基因的信號肽編碼區。
可用於酵母宿主細胞的信號肽得自釀酒酵母α-因子和釀酒酵母轉化酶。其他有用的信號肽編碼區由Romanos等，1992，上文，描述。
控制序列還可以是編碼位於酶氨基端的胺基酸序列的前肽編碼區。產生的多肽可命名為酶原或多肽原。多肽原通常是非活性的並可通過從多肽原上催化或自身催化切除前肽轉化為成熟活性多肽。前肽編碼區可從枯草芽孢桿菌鹼性蛋白酶(aprE)、枯草芽孢桿菌中性蛋白酶(nprT)、釀酒酵母α-因子、米赫根毛黴天冬氨酸蛋白酶和Myceliophthora thermophila漆酶(WO 95/33836)基因獲得。
在多肽氨基端同時存在信號肽和前肽區時，前肽區位於緊鄰多肽氨基端而信號肽區位於緊鄰前肽區氨基端。在酵母中可使用ADH2系統或GAL1系統。在絲狀真菌中，可使用TAKAα-澱粉酶啟動子、黑麴黴葡糖澱粉酶啟動子和米麴黴葡糖澱粉酶啟動子作為調節序列。
調節序列的其他實例為允許基因擴增的調節序列。在真核系統中包括存在氨甲喋呤時擴增的二氫葉酸還原酶基因和有重金屬時擴增的金屬硫蛋白基因。在這些情況下，編碼多肽的核苷酸序列應與調節序列有效連接。
重組表達載體本發明還涉及包含發明的核酸構建體的重組表達載體。上述多種核苷酸和控制序列可連接在一起產生重組表達載體，其可以包括一個或多個便利的限制性酶切位點，以便允許編碼多肽的核苷酸序列在此種位點進行插入或替代。另外，本發明的核苷酸序列可以通過將該核酸序列或者含有該序列的核酸構建體插入到用於表達的恰當載體中來表達。在構建表達載體時，編碼序列定位於載體，以致於編碼序列與用於表達的恰當控制序列有效連接。
重組表達載體可以是能夠方便地進行重組DNA操作並且能夠引起核苷酸序列表達的任何載體(例如質粒或者病毒)。載體的選擇通常依賴於載體和欲導入載體的宿主細胞的兼容性。載體可以是線性的或者閉合環狀質粒。
載體可以是自主複製載體，即作為染色體外實體存在的載體，其複製不依賴於染色體的複製，例如質粒、染色體外遺傳因子、微型染色體或者人工染色體。
載體可含有保證自我複製的任何手段。另外，載體可以是導入宿主細胞原整合進入基因組並且與整合進入的染色體一起複製的載體。此外，可以使用單一載體或質粒、或共同含有欲被導入宿主細胞基因組的全部DNA的兩個或多個載體或質粒，或使用轉座子。
本發明的載體優選含有便於選擇轉化細胞的一個或多個選擇標記。選擇標記是其產物能夠提供殺生物劑或病毒抗性、重金屬抗性、從原養型到自養型等等的基因。
細菌選擇標記物的實例為來自枯草芽孢桿菌或地衣芽孢桿菌的dal基因，或賦予抗生素抗性如氨苄青黴素、卡那黴素、氯黴素或四環素抗性的標記物。適用於酵母宿主細胞的標記物為ADE2、HIS3、LEU2、LYS2、MET3、TRP1和URA3。在絲狀真菌宿主細胞中使用的選擇標記物包括(但不限於)，amdS(乙醯胺酶)、argB(鳥氨酸氨甲醯基轉移酶)、bar(膦絲菌素乙醯轉移酶)、hygB(潮黴素磷酸轉移酶)、niaD(硝酸鹽還原酶)、pyrG(乳清酸核苷-5′-磷酸脫羧酶)、sC(硫酸腺苷醯轉移酶)、trpC(鄰氨基苯甲酸合酶)，以及它們的等效物。
在麴黴屬細胞中優先使用的是構巢麴黴或者米麴黴的amdS和pyrG基因和吸水鏈黴菌(Streptomyces hygroscopicus)的bar基因。
本發明的載體優選含有允許載體穩定整合到宿主細胞基因組中的元件或者允許載體在細胞內不依賴基因組而自主複製的元件。
為了整合進入宿主細胞基因組，載體可依賴於編碼多肽的核苷酸序列或者載體中用於通過同源重組或者非同源重組將載體穩定整合進入基因組的任何其它元件。另外，載體可以包含用於通過同原重組指導整合進入宿主細胞基因組的附加核苷酸序列。附加核苷酸序列使載體能夠在染色體上的精確位置整合進入宿主細胞基因組。為了提高在精確位置整合的可能性，整合元件應優選含有足夠數量的核苷酸，例如100至1,500個鹼基對，優選400至1,500個鹼基對，並且最優選800至1,500個鹼基對，它們與相應的靶序列高度同源以便增強同源重組的概率。整合元件可以是與宿主細胞基因組中的靶序列同源的任何序列。此外，整合元件可以是非編碼的或者編碼的核苷酸序列。另一方面，載體可以通過非同源重組的方式整合進入宿主細胞的基因組。
為了自主複製，載體還可包含使得載體能夠在所述宿主細胞中自主複製的複製起點。細菌複製起點的實例為允許在大腸桿菌中複製的pBR322、pUC19、pACYC177和pACYC184和允許在芽孢桿菌中複製的pUB110、pE194、pTA1060和pAMβ1質粒複製起點。用於酵母宿主細胞的複製起點實例為兩微米複製起點ARS1、ARS4，ARS1和CEN3的組合以及ARS4和CEN6的組合。
複製起點可以是具有突變的複製起點，所述突變使其在宿主細胞中溫度敏感地發揮功能(見例如Ehrlich，1978，Proceedings of the NationalAcademy of Sciences USA 751433)。
可向宿主細胞中插入多於一個拷貝的本發明核苷酸序列以增加基因產物產生。可通過將至少一個附加拷貝的序列整合進宿主細胞基因組來提高核苷酸序列拷貝數，或通過在核苷酸序列中包含可擴增的選擇標記基因使細胞中含有擴增拷貝的該選擇標記，從而可通過在有適當選擇劑時培養細胞選擇核苷酸序列的附加拷貝。
用於連接上述元件以構建本發明重組表達載體的操作為本領域技術人員熟知(見例如Sambrook等，1989，上文)。
重組宿主細胞本發明還涉及含有本發明核酸構建體的重組宿主細胞，該細胞有利於多肽的重組產生。將含有本發明核苷酸序列的載體導入宿主細胞，以便載體以作為先前描述的染色體整合體或者自主複製的染色體外載體而得以維持。
宿主細胞可以是單細胞微生物(如原核生物)或非單細胞微生物(如真核生物)。
有用的單細胞細胞是細菌細胞，例如革蘭氏陽性菌，包括(但不僅限於)芽孢桿菌細胞，例如嗜鹼芽孢桿菌(Bacillus alkalophilus)、解澱粉芽孢桿菌、短芽孢桿菌(Bacillus brevis)、環狀芽孢桿菌(Bacilluscirculans)、Bacillus clausii、凝結芽孢桿菌(Bacillus coagulans)、Bacilluslautus、遲緩芽孢桿菌(Bacillus lentus)、地衣芽孢桿菌、巨大芽孢桿菌(Bacillus megaterium)、嗜熱脂肪芽孢桿菌、枯草芽孢桿菌和蘇雲金芽孢桿菌(Bacillus thuringiensis)或鏈黴菌細胞，例如變鉛青鏈黴菌(Streptomyces lividans)或鼠灰鏈黴菌(Streptomyces murinus)或革蘭氏陰性菌例如大腸桿菌和假單胞菌屬(Pseudomonas sp.)。在優選的實施方案中，細菌宿主細胞為遲緩芽孢桿菌、地衣芽孢桿菌、嗜熱脂肪芽孢桿菌或枯草芽孢桿菌細胞。在另一優選的實施方案中，芽孢桿菌細胞為嗜鹼芽孢桿菌。
可通過例如原生質體轉化(見例如Chang和Cohen，1979，MolecularGeneral Genetics 168111-115)、使用感受態細胞(見例如Young和Spizizin，1961，Journal of Bacteriology 81823-829，或Dubnau和Davidoff-Abelson，1971，Journal of Molecular Biology 56209-221)、電穿孔(見例如Shigekawa和Dower，1988，Biotechniques 6742-751)或接合(見例如Koehler和Thorne，1987，Journal of Bacteriology 1695771-5278)完成將載體引入細菌宿主細胞。
宿主細胞可以是真核生物，例如哺乳動物、昆蟲、植物或真菌細胞。
在優選的實施方案中，宿主細胞為真菌細胞。本文使用「真菌」包括子囊菌門(Ascomycota)、壺菌門(Chytridiomycota)和接合菌門(Zygomycota)(如Hawksworth等在《Ainsworth and Bisby′s Dictionaryof The Fungi》，第8版，1995，CAB International，University Press，Cambridge，UK，中所定義)，以及卵菌門(Oomycota)(如Hawksworth等1995，同前，171頁，所引用)和所有的有絲分裂孢子真菌(Hawksworth等1995，同前)。在更優選的實施方案中，真菌宿主細胞為酵母細胞。本文使用「酵母」包括產子囊酵母(Endomycetales)、產擔孢子酵母和屬於半知菌類(Fungi imperfect)(酵母菌)的酵母。由於酵母的分類將來可能發生變化，就本發明而言，酵母如《Biology and Activities of Yeast》(Skinner，F.A.，Passmore，S.M.，和Davenport，R.R.編輯，Soc.App.Bacteriol.Symposium Series No.9，1980)所述定義。
在更優選的實施方案中，酵母宿主細胞為假絲酵母(Candida)、漢遜屬(Hansenula)、克魯維屬(Kluyveromyces)、畢赤屬(Pichia)、酵母屬(Saccharomyces)、類酵母屬(Schizosaccharomyces)或Yarrowia細胞。
在最優選的實施方案中，酵母宿主細胞為卡爾酵母(Saccharomycescarlsbergensis)、釀酒酵母、糖化酵母(Saccharomyces diastaticus)、Saccharomyces douglasii、克魯弗酵母(Saccharomyces kluyveri)、諾地酵母(Saccharomyces norbensis)或Saccharomyces oviformis細胞。在另一最優選的實施方案中，酵母宿主細胞為乳酸克魯維酵母(Kluyveromyceslactis)細胞。在另一最優選的實施方案中，酵母宿主細胞為Yarrowialipolytica細胞。
在另一個更加優選的實施方案中，真菌宿主細胞是絲狀真菌細胞。「絲狀真菌」包括真菌門(Eumycota)和卵菌門(如Hawksworth等1995，同前定義)細分的所有絲狀形式。絲狀真菌以由殼多糖、纖維素、葡聚糖、脫乙醯殼多糖、甘露聚糖和其它複合多糖組成的菌絲體壁為特徵。通過菌絲延長進行營養生長並且碳的分解代謝是專性需氧的。相反，諸如釀酒酵母之類的酵母的營養生長是通過單細胞菌體的出芽完成並且碳的分解代謝可通過發酵進行。
在甚至更加優選的實施方案中，絲狀真菌宿主細胞是(但不限於)枝頂孢屬(Acremonium)、麴黴屬(Aspergillus)、鐮刀菌屬(Fusarium)、腐質黴屬(Humicola)、毛黴屬(Mucor)、毀絲黴屬(Myceliophthora)、脈孢菌屬(Neurospora)、青黴屬(Penicillium)、梭孢殼屬(Thielavia)、Tolypocladium或者木黴屬(Trichoderma)種類的細胞。
在最優選的實施方案中，絲狀真菌宿主細胞是泡盛麴黴、臭麴黴(Aspergillus foetidus)、日本麴黴(Aspergillus japonicus)、構巢麴黴、黑麴黴或者米麴黴細胞。在另一個最優選的實施方案中，絲狀真菌宿主細胞是杆孢狀鐮孢(Fusarium bactridioides)、Fusarium cerealis、Fusariumcrookwellense、大刀鐮孢(Fusarium culmorum)、禾本科鐮孢(Fusariumgraminearum)、禾赤鐮孢(Fusarium graminum)、異孢鐮孢(Fusariumheterosporum)、合歡木鐮孢(Fusarium negundi)、尖鐮孢、多枝鐮孢(Fusarium reticulatum)、粉紅鐮孢(Fusarium roseum)、接骨木鐮孢(Fusarium sambucinum)、膚色鐮孢(Fusarium sarcochroum)、擬分枝孢鐮孢(Fusarium sporotrichioides)、硫色鐮胞(Fusarium sulphureum)、Fusarium torulosum、Fusarium trichothecioides或者Fusarium venenatum的細胞。在一個甚至最優選的實施方案中，絲狀真菌母細胞是Fusariumvenenatum(Nirenberg sp.nov.)細胞。在另一個最優選的實施方案中，絲狀真菌宿主細胞是孤獨腐質黴、柔毛腐質黴、米黑毛黴(Mucor miehei)、Myceliophthora thermophila、粗糙脈孢菌(Neurospora crassa)、產紫青黴(Penicillium purpurogenum)、Thielavia terrestris、Trichodrma harzianum、康寧木黴(Trichoderma koningii)、Trichoderma longibrachiatum、Trichoderma reesei或者綠色木黴(Trichoderma viride)的細胞。
真菌細胞可以通過包括原生質體形成、原生質體轉化和細胞壁回收的過程以本質上已知的方式進行轉化。轉化麴黴屬細胞的適宜的操作在EP238023和Yelton等，1984，Proceedings of the National Academy ofSciences USA 811470-1474中有所描述。轉化鐮刀菌屬物種的適宜的方法在Malardier等，1989，Gene 78147-156和WO 96/00787中有所描述。可以使用Becker和Guarente，在Abelson，J.N.和Simon，M.I.，編，「Guideto Yeast Genetics and Molecular Biology」，《Methods in Enzymology》，194卷，182-187頁，Academic Press，Inc.，New York；Ito等，1983，Journalof Bacteriology 153163；和Hinnen等，1978，Proceedings of the NationalAcademy of Sciences USA 751920中描述的操作轉化酵母。
供體菌株本發明還提供以保藏號DSM 15716保藏的脂環酸芽孢桿菌屬細菌和含有該微生物的組合物。
製備酶多肽的方法本發明還涉及用於產生本發明酶的方法，該方法包括(a)培養含有編碼本發明酶的核苷酸序列的菌株，所述菌株能夠表達並分泌該酶，和(b)回收該酶。在一具體的實施方案中，該菌株為野生型菌株，例如脂環酸芽孢桿菌DSM 15716，而在另一實施方案中該菌株為如上所述的重組宿主細胞。
在本發明這些方法中，使用本領域已知的方法將細胞在適於生產酶的營養培養基中培養。例如，細胞可以通過在實驗室或者工業發酵罐中，在適宜的培養基上以及允許多肽表達和/或分離的條件下進行搖瓶培養、小規模或者大規模發酵(包括連續、批式、補料分批式或者固態發酵)。使用本領域已知的操作，在含有碳源和氮源和無機鹽的適宜的營養培養基中進行培養。適宜的培養基可以從商品供應商得到或者根據公布的組合物(例如American Type Culture Collection的目錄中所公布的)進行配製。如果酶分泌到營養培養基中，則可從培養基中直接回收酶。
可使用本領域已知的方法回收產生的多肽。例如可通過包括(但不限於)離心、過濾、抽提、噴霧乾燥、蒸發或者沉澱的常規操作從營養培養基中回收多肽。
可通過本領域已知的多種方法，包括(但不限於)層析(例如離子交換層析、親和層析、疏水層析、層析聚焦和大小排阻層析)、電泳方法(例如製備型等電聚焦電泳)、差異溶解性(如硫酸銨沉澱)、SDS-PAGE，或者抽提(例如見《蛋白質純化》，J.-C.Janson和Lars Ryden編，VCHPublishers，New York，1989)對本發明多肽進行純化。
本發明方法還包括在脂環酸芽孢桿菌DSM 15716樣品上進行的WO01/77315A1的TAST方法，即通過將脂環酸芽孢桿菌DSM 15716基因組的基因(例如來自基因文庫的基因)與編碼無信號報告子的基因(例如β-內醯胺酶)經由轉座子標籤融合，在顯示報告子存在的培養基(如含氨苄青黴素的培養基)上培養包含與編碼無信號報告子的基因(例如β-內醯胺酶)經由轉座子標籤融合的脂環酸芽孢桿菌DSM 15716基因的宿主細胞克隆，檢測分泌報告子的克隆並分離該克隆中含有的脂環酸芽孢桿菌DSM15716基因和多肽。
當在顯示報告子存在的培養基(如含氨苄青黴素的培養基)上培養包含與編碼無信號報告子的基因(例如β-內醯胺酶)經由轉座子標籤融合的脂環酸芽孢桿菌DSM 15716基因的宿主細胞克隆時，只有表達並分泌報告子(例如β-內醯胺酶)的克隆會被檢測(例如存活)。然而，只有與報告子基因融合的基因具有在宿主菌株中能被識別的完整啟動子和核糖體結合位點(即是真實生活中由細胞表達以產生多肽的基因)，並且報告子被翻譯從而合成的多肽被轉運穿過細胞質膜並正確摺疊時，才分泌報告子。因此，向選擇的宿主細胞中插入融合基因時，檢測到報告子存在的克隆(例如氨苄青黴素抗性)會含有來自脂環酸芽孢桿菌DSM 15716的編碼功能性分泌多肽的基因。
轉基因植物本發明還涉及用編碼本發明酶的核苷酸序列轉化以表達並生產該酶的轉基因植物、植物局部或植物細胞。在一個實施方案中，可以使用植物作為產生可回收數量酶的宿主。可以從植物或植物局部回收酶。另外，可以使用含有重組酶的植物或植物局部用於改善食物或飼料的品質(例如改善營養價值、味道和流變性質)或破壞抗營養因子。具體可以使用表達酶的植物或植物局部作為用於產生燃料醇或生物乙醇的改善的起始材料。
轉基因植物可以是雙子葉的(雙子葉植物)或單子葉的(單子葉植物)。單子葉植物實例為草，例如草場草(青草，Poa)，飼料草如羊茅屬(festuca)、黑麥草屬(Lolium)、temperate grass如Agrostis和穀類如小麥、燕麥、黑麥、大麥、稻、高粱和玉蜀黍(玉米)。
雙子葉植物實例為菸草、豆類(如羽扇豆、馬鈴薯、甜菜、豌豆、豆和大豆)和十字花科植物(芸苔(Brassicaceae)科)(如花椰菜、rape seed和密切相關的模式生物擬南芥(Arabidopsis thaliana))。
植物局部的實例為莖、愈傷組織、葉、根、果實、種子和塊莖。特定的植物組織例如葉綠體、質外體、線粒體、液泡、過氧化物酶體和細胞質也認為是植物局部。此外，認為無論來源於什麼組織的植物細胞是植物局部。
本發明範圍還包括這類植物、植物局部和植物細胞的後代。
可按照本領域已知方法構建表達本發明酶的轉基因植物或植物細胞。簡言之，通過將一個或多個編碼本發明酶的表達構建體整合進植物宿主基因組並將產生的修飾的植物或植物細胞繁殖為轉基因植物或植物細胞。
便利的表達構建體為包含與適當調節序列有效連接的編碼本發明酶的核酸序列的核酸構建體，所述調節序列是在選擇的植物或植物局部中表達核酸序列所必需的。此外，表達構建體還可包含用於鑑定整合入表達構建體的宿主細胞的選擇標記和向所述植物中引入該構建體時必需的DNA序列(後者依賴於待使用的DNA引入方法)。
調節序列(如啟動子和終止子序列和任選的信號或轉運序列)的選擇依賴於例如期望何時、何處和如何表達酶。例如，編碼本發明酶的基因表達可以是組成型或誘導型的，或可以是發育特異、階段或組織特異的，且基因產物可以靶向至特定組織或植物局部，例如種子或葉。調節序列由例如Tague等，1988，Plant Physiology 86506描述。
關於組成型表達可使用35S-CaMV啟動子(Franck等，1980，Cell 21285-294)。器官特異啟動子可以是例如來自儲藏庫組織，如種子、馬鈴薯塊莖和果實(Edwards Coruzzi，1990，Ann.Rev.Genet 24275-303)或來自代謝庫組織，如分生組織(Ito等，1994，Plant Mol.Biol.24863-878)的啟動子，種子特異啟動子如來自稻的谷蛋白、谷醇溶蛋白、球蛋白或清蛋白啟動子(Wu等，1998，Plant and Cell Physiology 39885-889)，來自豆球蛋白B4的蠶豆(Vicia faba)啟動子和來自蠶豆的未知種子蛋白質基因(Con rad等，1998，Journal of Plant Physiology 152708-711)，來源於種子油體蛋白質的啟動子(Chen等，1998，Plant and Cell Physiology 39935-941)，來源於歐洲油菜(Brassica napus)的儲藏蛋白napA啟動子和本領域已知的任何其他種子特異啟動子(如描述於WO 91/14772的)。此外，啟動子可以是葉特異的啟動子，例如來源於稻或番茄的rbcs啟動子(Kyozuka等，1993，Plant Physiology 102991-1000)、小球藻病毒腺嘌呤甲基轉移酶基因啟動子(Mitra和Higgins，1994，Plant Molecular Biology2685-93)或來源於稻的aldP基因啟動子(Kagaya等，1995，Molecular andGeneral Genetics 248668-674)或傷誘導啟動子如馬鈴薯pin2啟動子(Xu等，1993，Plant Molecular Biology 22573-588)。
還可使用啟動子增強子元件以便在植物中更高表達本發明的酶。例如，啟動子增強子元件可以是置於啟動子和編碼本發明酶的核苷酸序列之間的內含子。例如Xu等，1993(上文)公開了稻肌動蛋白1基因的第一個內含子增強表達的用途。
標記基因和表達構建體的任何其他部分可選自可從本領域獲得的那些。
根據本領域已知的常規技術將核酸構建體整合進植物基因組，所述技術包括農桿菌介導的轉化、病毒介導的轉化、顯微注射、粒子轟擊、生物射彈轉化和電穿孔(Gasser等，1990，Science 2441293；Potrykus，1990，BiolTechnology 8535；Shimamoto等，1989，Nature 338274)。
目前，根瘤農桿菌介導的基因轉移是選擇用於產生轉基因雙子葉植物的方法(綜述見Hooykas和Schilperoort，1992，Plant Molecular Biology 1915-38)。然而其也可用於轉化單子葉植物，儘管通常優選其他轉化方法用於單子葉植物。目前，選擇用於產生轉基因單子葉植物的方法為粒子轟擊(轉化DNA包被的顯微金或鎢顆粒)胚愈傷組織或發育中的胚(Christou，1992，Plant Journal 2275-281；Shimamoto，1994，Current OpinionBiotechnology 5158-162；Vasil等，1992，BiolTechnology 10667-674)。用於轉化單子葉植物的另一方法如Omirulleh等，1993，Plant MolecularBiology 21415-428所述的基於原生質體轉化。
轉化之後，根據本領域熟知的方法選擇其中整合了表達構建體的轉化體並再生為完整的植株。
本發明還涉及生產本發明酶的方法，包括(a)在有助於酶產生的條件下培養含有編碼本發明酶的核苷酸序列的轉基因植物或植物細胞和(b)回收酶。
包含多肽的組合物及其製備方法本發明提供包含本發明多肽並優選含有賦形劑的組合物以及製備這類組合物的方法，包括將本發明的多肽與賦形劑混和。組合物具體包含至少兩種不同的本發明多肽，優選至少3種，更優選至少5種，更優選至少10種，更優選至少15種，更優選至少20種。最優選該組合物包含發酵脂環酸芽孢桿菌DSM 15716樣品或其突變體(其中缺失或添加了一個或多個基因)時分泌的所有多肽。
在具體的實施方案中，本發明多肽為組合物的主要(多肽)組分，例如單一組分組合物。上下文中賦形劑應理解為用於配製組合物的任何輔助劑或化合物，包括溶劑、載體、穩定劑等。
組合物還可包含一個或多個額外的酶，例如氨肽酶、澱粉酶、糖酶、羧肽酶、過氧化氫酶、纖維素酶、殼多糖酶、角質酶(cutinase)、環糊精糖基轉移酶、脫氧核糖核酸酶、酯酶、α-半乳糖苷酶、β-半乳糖苷酶、葡糖澱粉酶、α-葡糖苷酶、β-葡糖苷酶、haloperoxidase、轉化酶、漆酶、脂肪酶、甘露糖苷酶、氧化酶、果膠分解酶、肽穀氨醯胺酶、過氧化物酶、植酸酶、多酚氧化酶、蛋白水解酶、核糖核酸酶、轉穀氨醯胺酶或木聚糖酶。
可根據本領域已知方法製備組合物並且可以是液體或固體組合物的形式。例如，可以使用本領域已知的配製多肽和/或藥品的方法配製酶組合物，例如配製成包衣或未包衣的顆粒或微粒。因此本發明多肽可以以顆粒(優選無塵顆粒)、液體(特別是穩定化的液體)、漿液或受保護的多肽形式提供。對於某些應用，優選將多肽固定在固體基質上。
可使用本領域已知方法穩定欲包含在組合物中的多肽，例如通過添加抗氧化劑或還原劑以限制多肽氧化來穩定組合物中的多肽，或可通過添加多聚體如PVP、PVA、PEG或其他已知有益於多肽在固體或液體組合物中穩定的合適的多聚體來穩定多肽。
在另一實施方案中，本發明組合物為洗滌劑組合物，其除本發明多肽外還包含表面活性劑和選自增量組分(如沸石)、漂白劑(如過碳酸鹽)、漂白增強劑(如TAED或NOBS)、抑泡劑、芳香劑的任選化合物。
在另一實施方案中本發明組合物為飼料組合物，其除本發明多肽外還包含穀類或穀物產品。
在另一實施方案中本發明組合物為包含本發明多肽的食品組合物，例如麵包師麵粉組合物、釀造產品、果汁、油或豬油產品。
在另一實施方案中本發明組合物包含多糖或多糖混合物並包含本發明多肽。
在另一實施方案中本發明組合物為果漿組合物，其除本發明多肽外還還有果肉。
在另一實施方案中本發明組合物為殺生物組合物，其除本發明多肽外還含有氧化還原酶增強劑。
多肽或含有多肽的組合物用途另一方面，本發明提供本發明多肽或多核苷酸或含有所述多肽或多核苷酸的組合物在多種應用中的用途，特別是(技術)方法例如用在工業或家庭的方法、下文為了商業研究目的進行的方法。因此本發明包含包括在(技術)工業、研究或家庭過程中使用本發明多肽或本發明多核苷酸的方法。
在一個實施方案中，本發明多肽或組合物用於清潔纖維織物。
在另一實施方案中，本發明多肽或組合物用於製備食品或飼料添加劑。
在另一實施方案中，本發明多肽或組合物用於處理lignolosic材料和果肉。
洗滌劑公開內容本發明多肽可添加到洗滌劑組合物中從而成為其組分。
本發明洗滌劑組合物可配製為例如手工或機器洗衣洗滌劑組合物(包含適用於預處理髒汙織物的洗衣添加劑組合物和漂洗添加的織物柔順劑組合物)，或可配製為用於一般家庭硬表面清潔操作的洗滌劑組合物，或為手工或機器洗碗機操作配製。
特別的，本發明提供包含本發明多肽的洗滌劑添加劑。該洗滌劑添加劑和洗滌劑組合物可包含一種或多種其他酶，例如蛋白酶、脂肪酶、cutinase、澱粉酶、糖酶、纖維素酶、果膠酶、甘露聚糖酶、阿拉伯糖酶、半乳聚糖酶、木聚糖酶、氧化酶例如漆酶和/或過氧化物酶。
通常所選擇的酶的性質應與選擇的洗滌劑兼容(即最適pH，與其他的酶或非酶成份兼容)，且該酶應以有效數量存在。
蛋白酶合適的蛋白酶包括動物、植物或微生物來源的蛋白酶。優選微生物來源。包括化學修飾或蛋白質工程的突變體。蛋白酶可以是絲氨酸蛋白酶或金屬蛋白酶，優選鹼性微生物蛋白酶或胰蛋白酶樣蛋白酶。鹼性蛋白酶的實例為枯草桿菌蛋白酶，特別是來自芽孢桿菌的蛋白酶，例如枯草桿菌蛋白酶Novo、枯草桿菌蛋白酶Carlsberg、枯草桿菌蛋白酶309、枯草桿菌蛋白酶147和枯草桿菌蛋白酶168(描述於WO 89/06279)。胰蛋白酶樣蛋白酶為胰蛋白酶(如豬或牛來源的)和WO 89/06270和WO94/25583描述的鐮刀菌蛋白酶。
有用的蛋白酶實例為WO 92/19729、WO 98/20115、WO 98/20116和WO 98/34946描述的變體，特別是在一個或多個下面位置具有替換的變體27、36、57、76、87、97、101、104、120、123、167、170、194、206、218、222、224、235和274。
優選的市售蛋白酶包括Alcalase、Savinase、Primase、Duralase、Esperase和Kannase(Novozymes A/S)、Maxatase、Maxacal、Maxapem、Properase、Purafect、Purafect OxP、FN2和Fun3(Genencor International Inc.)。
脂肪酶合適的脂肪酶包括細菌或真菌來源的脂肪酶。包括化學修飾或蛋白質工程突變體。有用的脂肪酶實例包括來自腐質黴屬(同物異名Thermomyces)的脂肪酶(例如來自EP 258 068和EP 305 216所述柔毛腐質黴(T.lanuginosus)或來自WO 96/13580描述的孤獨腐質黴)，假單胞菌脂肪酶(例如來自產鹼假單胞菌(P.alcaligenes)或類產鹼假單胞菌(P.pseudoalcaligenes)(EP 218 272)、洋蔥假單胞菌(P.cepacia)(EP 331 376)、施氏假單胞菌(P.stutzeri)(GB 1,372,034)、螢光假單胞菌(P.fluorescens)、假單胞菌屬菌株SD 705(WO 95/06720和WO 96/27002)、P.wisconsinensis(WO 96/12012))，芽孢桿菌脂肪酶(例如來自枯草芽孢桿菌(Dartois等(1993)，Biochemica et Biophysica Acta，1131，253-360)、嗜熱脂肪芽孢桿菌(JP 64/744992)或短小芽孢桿菌(WO 91/16422))。
其他實例為脂肪酶變體例如WO 92/05249、WO 94/01541、EP 407225、EP 260105、WO 95/35381、WO 96/00292、WO 95/30744、WO 94/25578、WO 95/14783、WO 95/22615、WO 97/04079和WO 97/07202中所描述的脂肪酶變體。
優選的市售脂肪酶包括LipolaseTM、Lipolase UltraTM和Lipex(Novozymes A/S)。
澱粉酶適合的澱粉酶(α和/或β)包括細菌或真菌來源的澱粉酶。包括化學修飾和蛋白質工程突變體。澱粉酶包括例如得自芽孢桿菌(例如地衣芽孢桿菌特定菌株，更詳細描述於GB 1,296,839)的α-澱粉酶。
有用的澱粉酶實例為WO 94/02597、WO 94/18314、WO 96/23873和WO 97/43424描述的變體，特別是在一個或多個下面位置有替換的變體15、23、105、106、124、128、133、154、156、181、188、190、197、202、208、209、243、264、304、305、391、408和444。
市售的澱粉酶為DuramylTM、TermamylTM、FungamylTM和BANTM(Novozymes A/S)、RapidaseTM和PurastarTM(來自Genencor InternationalInc.)。
纖維素酶合適的纖維素酶包括細菌和真菌來源的纖維素酶。包括化學修飾或蛋白質工程突變體。合適的纖維素酶包括來自芽孢桿菌屬、假單胞菌屬、腐質黴屬、鐮刀菌屬、梭孢殼屬(Thielavia)、枝頂孢屬(Acremonium)的纖維素酶，例如由US 4,435,307、US 5,648,263、US 5,691,178、US 5,776,757和WO 89/09259中公開的孤獨腐質黴、Myceliophthorathermophila和尖鐮孢產生的真菌纖維素酶。
特別合適的纖維素酶為具有顏色保護優點的鹼性或中性纖維素酶。這類纖維素酶的實例為EP 0 495 257、EP 0 531 372、WO 96/11262、WO96/29397、WO 98/08940中描述的纖維素酶。其他實例為如WO 94/07998、EP 0 531 315、US 5,457,046、US 5,686,593、US 5,763,254、WO 95/24471、WO 98/12307和PCT/DK98/00299描述的纖維素酶變體。
市售纖維素酶包括Celluzyme和Carezyme(Novozymes)、Clazinase和Puradax HA(Genencor International Inc.)和KAC-500(B)(KaoCorporation)。
過氧化物酶/氧化酶合適的過氧化物酶/氧化酶包括植物、細菌或真菌來源的過氧化物酶/氧化酶。包括化學修飾或蛋白質工程的突變體。有用的過氧化物酶實例包括來自鬼傘屬(Coprinus)(例如來自C.cinereus)的過氧化物酶和WO 93/24618，WO 95/10602，and WO 98/15257中描述的它的變體。
市售過氧化物酶包括Guardzyme(Novozymes A/S)。
可通過添加含有一個或多個酶的獨立添加劑或通過添加含有所有酶的組合添加劑使洗滌劑組合物中含有洗滌劑酶。本發明的洗滌添加劑(即獨立添加劑或組合添加劑)可配製為顆粒、液體、漿體等。優選的洗滌添加劑製品為顆粒(特別是無塵顆粒)、液體(特別是穩定液體)或漿體。
可如US 4,106,991和4,661,452所公開產生無塵顆粒並可任選地通過本領域已知方法包被。蠟包衣材料的實例為平均分子量1000到2000的聚環氧乙烷產品(聚乙二醇，PEG)；具有16到50環氧乙烷單元的乙氧基壬基苯酚；乙氧基脂肪醇(其中醇含有12到20碳原子且其中有15到80個環氧乙烷單位)；脂肪醇；脂肪酸和單和雙和三脂肪酸甘油酯。適於流化床技術應用的產膜包裹材料實例在GB 1483591中給出。可根據現有技術例如通過添加多元醇(如丙二醇)、糖或糖醇、乳酸或硼酸穩定液體酶製品。可根據EP 238,216描述的方法製備受保護的酶。
本發明的洗滌劑組合物可以是任何便利的形式，例如棒、片劑、粉末、顆粒劑、泥膏劑或液體。液體洗滌劑可以是水性的(通常含有上至70％的水和0-30％的有機溶劑)或非水性的。
洗滌劑組合物包含一種或多種表面活性劑，其可以是非離子(包括半極性)的和/或陰離子的和/或陽離子的和/或兩性離子的。表面活性劑通常以按重量計從0.1％到60％的水平存在。
洗滌劑通常包含從約1％到約40％的陰離子表面活性劑，例如線性烷基笨磺酸鹽、α-烯烴磺酸鹽、磺基硫酸鹽(脂肪醇硫酸鹽)、醇乙氧基黃酸鹽、仲鏈烷磺酸鹽、α-磺基脂肪酸甲酯、烷基或烯基琥珀酸或肥皂。
洗滌劑通常包含從約0.2％到約40％非離子表面活性劑例如醇乙氧基化物、乙氧基壬基苯酚、烷基聚糖苷、烷基二甲基氧化胺、乙氧基脂肪酸單乙醇胺、脂肪酸單乙醇胺、多羥基烷基脂肪醯胺或葡糖胺N-醯基N-烷基衍生物(″glucamides″)。
洗滌劑可含有0-65％洗滌劑增量組分或絡合劑，例如沸石、二磷酸鹽、三磷酸鹽、磷酸鹽、碳酸鹽、檸檬酸鹽、次氮基三乙酸、乙二胺四乙酸、二乙烯三胺五乙酸、烷基或烯基琥珀酸、可溶矽酸鹽或分層矽酸鹽(例如來自Hoechst的SKS-6)。
洗滌劑可含有一種或多種多聚體。實例為羧甲基纖維素、聚乙烯替砒咯烷酮、聚乙二醇、聚乙烯醇、聚乙烯吡啶-N-氧化物、聚乙烯基咪唑、聚羧酸酯例如聚丙烯酸酯、馬來酸/丙烯酸共聚物和十二烷基異丁烯酸/丙烯酸共聚物。
洗滌劑可包含漂白系統，其可包含與過酸形式的漂白激活劑(例如四乙醯乙二胺或壬醯氧苯磺酸鹽)組合的H2O2來源(例如過硼酸鹽或過碳酸鹽)。另外，漂白系統可以包含例如醯胺、二醯亞胺或碸類型的過氧酸。
本發明洗滌劑組合物的酶可以使用常規穩定劑穩定，所述穩定劑例如多元醇(如丙二醇或甘油)、糖或糖醇、乳酸、硼酸或硼酸衍生物(如芳香族硼酸酯)或苯基硼酸衍生物(如4-甲醯苯基硼酸)，且組合物可以如例如WO 92/19709和WO 92/19708所示配製。
洗滌劑還可以包含其他便利的洗滌成分，例如織物調節劑(包括粘土、發泡劑、抑泡劑、防蝕劑、土壤懸浮劑、抗土壤沉澱劑、染料、殺菌劑、增量劑、助水溶物、抑鏽劑或香料)。
目前考慮可以向洗滌劑組合物中以對應於每升洗滌液0.01-100mg酶蛋白質，優選每升洗滌液0.05-5mg酶蛋白質，特別是每升洗滌液0.1-1mg酶蛋白質的數量添加任何酶，特別是本發明的酶。
本發明的酶可以附加地整合進WO 97/07202公開的洗滌製劑中，WO97/07202在本文中整體引入作為參考。保藏的微生物申請人根據國際承認用於專利程序目的的微生物保藏的布達佩斯條約將下面的微生物保藏於德意志微生物保藏中心(Deutsche Sammlung vonMikroorganismen und Zellkulturen GmbH)，MascheroderWeg 1b，D-38124 Braunschweig，德國2003年6月30脂環酸芽孢桿菌CS81嗜熱嗜酸菌；DSM保藏號15716。
實施例實施例1鑑定脂環酸芽孢桿菌DSM 15716分泌的功能性多肽構建基因組文庫通過使用標準分子生物學技術(Ausuble等，1995《Current protocolsin molecular biology》，John Wiley and Sons出版)製備脂環酸芽孢桿菌DSM 15716的染色體DNA。用Sau3A部分酶切製備的DNA並在瓊脂糖凝膠上分離。洗脫、沉澱並在適當的緩衝液中重懸3到8千鹼基的片段。
通過使用Stratagene ZAP ExpressTM預消化載體試劑盒和StratageneZAP ExpressTM預消化Gigapack克隆試劑盒(Bam HI預消化的)(Stratagene Inc.，USA)按照製造商說明/推薦製備基因組文庫。產生的λZAP包含38000pfu，選擇其中10000用於大量酶切。混和產生的70000個大腸桿菌菌落並使用Qiagen Spin Mini prep試劑盒(Qiagen，德國)製備質粒。在離心管中用1體積份的醋酸鈉pH 5和2體積份的96％乙醇在4℃以20000rpm沉澱約1ml含有質粒DNA的洗脫液，用70％v/v乙醇洗滌，在室溫乾燥並重懸於200μl TE緩衝液中。脂環酸芽孢桿菌基因組文庫的質粒庫DNA的DNA濃度為5.2μg/μl。
構建和製備轉座子WO 01/77315A1中描述的轉座子輔助的信號捕獲(TAST)方法的原理為通過轉座子標籤將選定的基因組中所有基因與編碼無信號β-內醯胺酶的基因融合。因此當在含氨苄青黴素的培養基上培養包含與編碼無信號β-內醯胺酶基因經由轉座子標籤融合的基因組基因的宿主細胞克隆時，只有表達並分泌β-內醯胺酶的克隆能夠存活。然而，只有與β-內醯胺酶基因融合的基因具有在宿主細胞中能被識別的完整啟動子和核糖體結合位點(即真實生活中由細胞表達以產生多肽的基因)，並且β-內醯胺酶被翻譯從而合成的多肽被轉運穿過細胞質膜並正確摺疊時，才分泌β-內醯胺酶。因此，當向選定的宿主細胞中插入融合基因時，具氨苄青黴素抗性的克隆含有編碼功能性分泌多肽的基因。
通常使用TAST方法時，甚至不必須表達整個基因。當用轉座子給基因加標籤時，基因N末端部分作為為蛋白質融合物表達，顯示該基因包含完整的轉錄、翻譯和分泌序列。因此認為基因N末端部分作為蛋白質融合物的表達通常足夠確保整個基因的表達和分泌。
因此可推斷通過TAST方法獲得的基因事實上的確編碼分泌功的能性多肽。
構建含有β-內醯胺酶報告子基因的SigA4轉座子按照WO 01/77315A1的說明，使用標準分子生物學技術完成含有無信號β-內醯胺酶基因轉座子的構建。最初使用proofreading聚合酶(PfuTurbo，Stratagene，USA)從載體pUC19中PCR擴增無信號β-內醯胺酶。產生的PCR片段含有NotI和EcoRI限制性位點以便於克隆。從Finnzymes，OY(Espo芬蘭)獲得含有Entranceposon和抗生素抗性標記物CAT(編碼轉座子氯黴素抗性)的質粒pEntranceposon(Camr)。質粒用限制酶NotI和EcoRI消化，凝膠純化並與含有無信號β-內醯胺酶的片段連接。將連接物轉化進電感受態DH10B細胞中並通過限制性分析鑑定含有有無信號β-內醯胺酶重組質粒的大腸桿菌克隆，命名為SigA2。
為了製備轉座子，構建SigA2的更小的衍生物，其缺乏編碼β-內醯胺酶的bla基因使用兩個寡核苷酸引物SigA2NotU-P 5′-TCG CGA TCCGTT TTC GCA TTT ATC GTG AAA CGC T-3′(SEQ ID NO51)和SigA2NotD-P 5′-CCG CAA ACG CTG GTG AAA GTA AAA GAT GCTGAA-3′(SEQ ID NO52)(其結合在SigA2的bla基因起點和末端指向外側)PCR擴增不含有bla基因的SigA2。重連該PCR反應中產生的約3.6kb的擴增產物並轉化進合適的大腸桿菌菌株。從能夠在氯黴素LB上生長而不能在氨苄青黴素LB上生長的轉化體中分離3.6kb的質粒。該質粒保留了所有兩個BgIII位點並缺少活性bla基因並稱為pSig4。
用BgIII消化60微升濃度為0.3微克/微升的pSig4質粒DNA製品並在瓊脂糖凝膠上分離。洗脫2kb的SigA2轉座子DNA條帶並根據銷售商說明使用GFXTMPCR、DNA和凝膠條帶純化試劑盒(Amersham PharmaciaBiotech Inc，美國)純化並用200微升EB緩衝液洗脫。
C.轉座子標記從pSigA4製得的轉座子帶有5』截短的編碼其分泌信號被去除的內醯胺酶的bla基因。只有當蛋白質分泌進入周質時，β-內醯胺酶才能給予大腸桿菌氨苄青黴素抗性，而β-內醯胺酶的細胞質表達不能賦予氨苄青黴素抗性。不含信號序列時，β-內醯胺酶不能轉運到周質從而克隆不能在含有氨苄青黴素的培養基上生長。無信號β-內醯胺酶基因以轉座子邊緣和β-內醯胺酶編碼區之間存在連續的開放讀碼框的方式包含在轉座子內。由此，修飾的轉座子轉座進入編碼分泌蛋白的基因時能夠引起與靶基因的框內融合。這導致了分泌進入大腸桿菌周質時給予對氨苄青黴素抗性的融合基因產物。如果轉座子甚至框內整合進入編碼非分泌蛋白的基因，其各自的宿主不會成為氨苄青黴素抗性的。
為了體外轉座子標記脂環酸芽孢桿菌文庫，含有約2,6μg DNA的4或8微升SigA2轉座子與1微升脂環酸芽孢桿菌基因組文庫質粒庫DNA的DNA濃縮物和2微升Finnzymes MuA轉座酶(0,22微克/微升)和5微升Finnzymes OY(Espoo，芬蘭)5×緩衝液以50微升的總體積混和並在30℃孵育3,5小時，然後在75℃熱激10分鐘。通過加入5微升3M醋酸鈉pH5和110微升96％乙醇並在20000rpm離心30分鐘沉澱DNA。洗滌並乾燥沉澱並用10微升TE緩衝液重懸。
D.轉化和選擇在Biorad Gene Pulse設備(50uF，25mAmp，1.8kV)中用5微升轉座子標記的質粒庫電穿孔轉化電感受態大腸桿菌DH108細胞，與1ml SOC培養基混和，在37℃預孵育1小時並塗布在含有25微升/毫升氨苄青黴素、50微升/毫升卡那黴素、10微升/毫升氯黴素的LB上並孵育2-3天。從轉化體中選擇了1056個菌落並使用Qiaprep 96 Turbo Biorobot試劑盒根據供應商說明製備質粒。
E、質粒製備和測序在一個反應中使用從上遊讀入轉座子標記基因的A2up引物AGCGTTTGCGGCCGCGATCC(SEQ ID NO53)並在另一反應中使用從下遊讀入轉座子標記基因的B引物TTATTCGGTCGAAAAGGATCC(SEQ ID NO54)測序1056個轉座子標記的質粒。
F、序列組合和註解使用PhredPhrap程序(Brent Ewing，LaDeana Hillier，Michael C.Wendl和Phil Green，Base-calling of automated sequencer traces usingphred 1.Accuracy assessment(1998)Genome Research 8175-185；BrentEwing和Phil Green，Base-calling of automated sequencer traces usingphred 11.Error probabilities(1998)Genome Research 8186-194)將得到的序列裝配為重疊群。隨後用BLASTX 2.0a19MP-WashU[1998年7月14日][Build linux-x86 1851441998年7月30日]程序比較獲得的重疊群和得自標準公開DNA和蛋白質序列資料庫的序列(Gish，Warren(1994-1997)，未發表；Gish，Warren和David J.States(1993)。通過資料庫相似度搜索鑑定蛋白質編碼區。Nat.Genet.3266-72)。
獲得的序列是編碼完整和功能性多肽的功能基因，如上文解釋由於它們是作為氨苄青黴素抗性克隆獲得的。
實施例2通過同源性確定功能通過與功能已知的基因或多肽序列比較註解SEQ ID NO26到SEQID NO50多肽的功能。將本發明多肽與來自公開和內部重疊群資料庫的一列最相關序列比較。隨後使用BLASTX 2.Oa19MP-WashU[1998年7月14]程序比較重疊群(SEQ ID NO26到SEQ ID NO50來自其中)和可以得自標準公開DNA和蛋白質序列資料庫的序列。仔細分析SEQ IDNO26到SEQ ID NO40與它們最相關的來自其他資料庫的功能已知序列的序列比對使得可能以胺基酸同一性程度為基礎預測這些多肽的功能。甚至當總胺基酸同一性為40％時(通常難以進行好的預測)，我們可以通過仔細分析並解讀多肽序列催化位點或重要區域的胺基酸殘基來預測SEQ ID NO26到SEQ ID NO40的功能。當已知序列催化位點的胺基酸殘基也存在於本發明多肽中時，結合充分的總胺基酸同一性可以推出來自脂環酸芽孢桿菌DSM 15716的多肽具有與已知序列相同的功能。
實施例3製備SEQ ID NO26到SEQ ID NO50的多肽為了製備SEQ ID NO26到SEQ ID NO50的多肽，通過將編碼開放讀碼框的DNA與適於在合適的宿主菌株(例如大腸桿菌、枯草芽孢桿菌、地衣芽孢桿菌或Bacillus clausii或脂環酸芽孢桿菌衍生物)中表達基因的啟動子、核糖體結合位點和終止子融合以表達SEQ ID NO1到SEQ IDNO25包含的編碼這些多肽的基因。啟動子可以是誘導型啟動子或組成型啟動子。SEQ ID NO26到SEQ ID NO50的任何信號序列可以用另一細菌的適當信號肽交換。表達構建體可以是質粒或線性DNA的部分。可以通過重組將其整合進入宿主菌株的染色體或其可以以質粒存在於宿主細胞中。然後在適合的培養基中以所需體積培養帶有目的基因的轉化細胞。如果使用誘導型啟動子，通過加入誘導劑起始基因表達。否則不需要誘導劑且培養細胞直到產生合適數量的來自目的基因的蛋白質。收集培養物並用標準方法回收蛋白質。
實施例4測定絲氨酸羧基蛋白酶活性可以對在適當緩衝液中合成並分泌絲氨酸羧基蛋白酶的宿主菌株的培養液或細胞裂解液測定該活性。將適當體積的這類樣品點在瓊脂糖平板上，所述平板含有不溶性顯色底物AZCL膠原(MegazymeTM)或Azocoll(Sigma-Aldrich)和適合的酸性pH緩衝液，如pH3-5。平板在適當的溫度(如55℃)孵育適當的時間(如一天)。活性顯示為斑點周圍藍色的色圈。作為AZCL膠原或Azocoll的備選方案，向瓊脂平板添加未標記的膠原，其中酶活性以亮區測定。添加胃蛋白酶抑制劑不能抑制絲氨酸羧基蛋白酶的蛋白酶活性。作為備選方案，可以如Tsuruoka N，Nakayama T，Ashida M，Hemmi H，Nakao M，Minakata H，Oyama H，Oda K，NishinoT；″Collagenolytic serine-carboxyl proteinase from Alicyclobacillussendaiensis strain NTAP-1purification，characterization，gene cloning，and heterologous expression.″Appl Environ Microbiol.卷69(1)；162-169頁；2003年1月所述測量含有絲氨酸羧基蛋白酶樣品的活性。
實施例5測定多銅氧化酶活性可以如Schneider等，《Enzyme and Microbial Technology 25》，(1999)502-508頁所述用在適當緩衝液中合成並分泌多銅氧化酶的宿主菌株的培養液或細胞裂解液測定該活性。
例如將適當體積(可以是15微升)的這類樣品點在瓊脂糖平板上，所述平板含有在適當緩衝液(例如pH 5.5，0.1M醋酸鈉緩衝液)中合適濃度(例如1mM)的ABTS(2，2′-聯氮雙-3-乙基苯並噻唑啉-6-硫酸)。將該平板在適當溫度(如55℃)孵育適當時間(如16小時)。活性顯示為樣品周圍綠色區域。該測定法用於上清液和提取物。
實施例6測定絲氨酸蛋白酶活性可以對在適當緩衝液中合成並分泌絲氨酸蛋白酶的宿主菌株的培養液或細胞裂解液測定該活性。將適當體積的這類樣品點在瓊脂糖平板上，所述平板含有不溶性顯色底物AZCL酪蛋白(MegazymeTM)或AZCL-膠原(MegazymeTM)和適當pH的適當緩衝液。平板在適當的溫度(如55℃)孵育適當的時間(如一天)。活性顯示為斑點周圍藍色的色圈。作為AZCL酪蛋白或AZCL膠原(MegazymeTM)的備選方案，可以使用未標記的酪蛋白或未標記的膠原。在點了未標記膠原或未標記酪蛋白的平板上，存在絲氨酸蛋白酶時形成亮區。
實施例7測定穀氨酸肽酶活性可以對在適當緩衝液中合成並分泌穀氨酸肽酶的宿主菌株的培養液或細胞裂解液測定該活性。將適當體積的這類樣品點在瓊脂糖平板上，所述平板含有不溶性顯色底物AZCL膠原(MegazymeTM)和適合的酸性pH緩衝液，如pH3-5。平板可以在適當的溫度(如55℃)孵育適當的時間(如一天)。活性顯示為斑點周圍藍色的色圈。作為AZCL膠原的備選方案，可以使用未標記膠原。在點了未標記膠原的平板上，存在穀氨酸肽酶時形成亮區。特定測試SEQ ID NO27穀氨酸肽酶後，用20微升培養液在pH3.4的0.1％AZCL膠原(MegazymeTM)LB-PG瓊脂平板上以斑點測試測定活性。將平板在55℃孵育(過夜)且活性顯示為斑點周圍藍色的色圈。
SEQ ID NO27包含的穀氨酸肽酶顯示與屬於現在被MEROPS重新分類為G1肽酶家族(PepG)(EC 3.4.23.19)的A4家族肽酶顯著的序列相似性，參閱上文描述SEQ ID NO27的小節和Fujinaga M，Cherney MM，Oyama H，Oda K，James MN.；The molecular structure and catalyticmechanism of a novel carboxyl peptidase from Scytalidium lignicolum；Proc.Natl.Acad.Sci.U.S.A.；101(10)；3364-9頁；Epub 2004年3月1日；2004年3月9日。
該家族包括其活性位點有保守的Q和E的肽酶序列。這兩個殘基在SEQ ID NO27包含的穀氨酸肽酶中均保守。由此SEQ ID NO27包含的穀氨酸肽酶是G1家族的第一個細菌多肽，該家族之前僅包括真菌肽酶。
SEQ ID NO27特別與G1家族肽酶的參考序列比較黑麴黴aspergillopepsin II(SEQ ID NO55；Swissprot P24665；Takahashi，K.；Inoue，H.；Sakai，K.；Kohama，T.；Kitahara，S.；Takishima，K.；Tanji，M.；Athauda，S.B.P.；Takahashi，T.；Akanuma，H.；Mamiya，G.；Yamasaki，M；The primary structure of Aspergillus niger acid proteinase A.；J.Biol.Chem.；卷266；19480頁；1991)。該多肽含有信號肽(aa1-aa18)和兩個前肽(aa 19-58和aa 99-109)，其在分泌後成熟時被去除。成熟時形成輕鏈和重鏈，其通過半胱氨酸殘基間的二硫鍵交聯。(Inoue，H.；Kimura，T.；Makabe，O.；Takahashi，K.；The gene and deduced protein sequences ofthe zymogene of Aspergillus niger acid proteinase A；J.Biol.Chem.；卷266；19484頁；1991)。SEQ ID NO27缺失了與第二個前肽(aa99-109)類似的胺基酸和對應於SEQ ID NO55交聯的半胱氨酸殘基的胺基酸(見比對)。之前只描述有真菌G1肽酶缺失半胱氨酸殘基(Maita，T.；Nagata，S.；Matsuda，G.；Maruta，S.；Oda，K.；Murao，S.；Tsuru，D.；Complete aminoacid sequence of Scytalidium lignicolum acid protease B；J.Biochem.；卷95；465頁；1984)。
SEQ ID NO55和SEQ ID NO27的比對
SWISSPROT_P24665MKFSTILTGS-LFATAALAAPLTEKRRARKEARAAGKRHSNPPYIPGSDKEILKLNGTTNSeq ID No.27MNGTSVWKASGIAAASCLTAAALLAWPHATSTLDASPAIFHAPRHALSPNTSPKPNSVQA¤¤¤¤¤¤¤¤¤¤¤:
SWISSPROT_P24665EEY---SSNWAGAVLIGDGYTKVTGEFTVPSVSAGSSGSSGYGGGYGYWKNKRQSEEYCASeq ID No.27QNFGWSASNWSGYAVTGSTYNDITGSWIVPAVSP----------------SKR--STYS-: * :
SWISSPROT_P24665SAWVGIDGDTCETAILQTGVDFCYEDGQTSYDAWYEWYPDYAYDFSDITISEGDSIKVTVSeq ID No.27SSWIGIDG-FNNSDLIQTGTEQDYVNGHAQYDAWWEILPAPETVISNMTIAPGDRMSAHI:*SWISSPROT_P24665EATSKSSGSATVENLTTGQSVTHTFSGNVEGDLCETNAEWIVEDFESGDSLVAFADFGSVSeq ID No.27HNNGNGTWTITLTDVTRNETFSTTQSYSGPG----SSAEWIQEAPEIGGRIATLANYGETSWISSPROT_P24665TFTNAEATSG--GSTVGPSDAT--------------------------------------Seq ID No.27TFDPGTVNGGNPGFTLVPTRATWCRTTRSCLCRPHPTRIPTASTWPTAPTSRAHRPPDPRSWISSPROT_P24665-----VMDIEQDGSVLTETSVSGDSVTVTYV------------Seq ID No.27RSRRPCMEAQGPASFFARTLAPSRDVAAHAPQGHRPSALVRRA*＝形成Swissprot P24665活性位點的胺基酸＝形成Swissprot P24665二硫鍵的半胱氨酸殘基¤＝從Swissprot P24665酶原去除的前肽實施例8測定酸性β-葡聚糖酶活性可以對在適當緩衝液中合成並分泌β-葡聚糖酶的宿主菌株的培養液或細胞裂解液測定該活性。將適當體積的這類樣品點在瓊脂糖平板上，所述平板含有不溶性顯色底物AZCL β-葡聚糖(MegazymeTM)和適合的酸性pH緩衝液，如pH3-5。平板在適當的溫度(如55℃)孵育適當的時間(如一天)。活性顯示為斑點周圍藍色的色圈。
實施例9測定酸性磷酸酶活性可以將在適當緩衝液中在適當pH和適當溫度(如55℃)合成並分泌酸性磷酸酶的宿主菌株的適當體積培養液或細胞裂解液與對硝基苯酚磷酸(pNPP)一起孵育以測定酶活性。酶促反應的產物為對硝基苯酚和無機磷酸鹽或在合適的反應時間後加入Pi.NaOH以終止磷酸酶實驗並形成對硝基苯酚鹽。405nm處光學測量對硝基苯酚鹽的吸光度。作為備選方案，使用在適當緩衝液中在適當pH和適當溫度(如55℃)合成並分泌酸性磷酸酶的宿主菌株的適當體積培養液或細胞裂解液用EnzChek酸性磷酸酶測定試劑盒(E-12020)(Molecular Probes Europe BV；PoortGebouw，Rijnsburgerweg 10；2333 AA Leiden，The Netherlands)測量酶活性。
實施例10測定多糖脫乙醯酶活性使用在適當緩衝液中適當溫度(如55℃)下合成並分泌多糖脫乙醯酶的宿主菌株的適當體積培養液或細胞裂解液測定活性。可使用細菌的胞壁質、N，N′-二乙醯殼二糖(Sigma)或半乳糖pentaacetate(Sigma)或/和乙酸纖維素(Sigma)作為該類型酶的底物。可以用適合酶物理需要的醋酸測定試劑盒(Biopharm)測量通過酶從底物中釋放的醋酸(Kosugi A，Murashima K，和Doi RH；Xylanase and Acetyl Xylan Esterase Activities of XynA，a KeySubunit of the Clostridium cellulovorans Cellulosome for XylanDegradation；Appl.Environm.I Microbiol.；卷68；6399-6402頁；2002)。
實施例11測定內-β-N-乙醯氨基葡糖苷酶活性使用在合適緩衝液(如pH3-5)適當溫度(如55℃)下合成並分泌內-β-N-乙醯氨基葡糖苷酶的宿主菌株的適當體積培養液或細胞裂解液，根據MH Rashid，M Mori和J Sekiguchi；Glucosaminidase of Bacillus subtiliscloning，regulation，primary structure and biochemical characterization；Microbiology；卷141；2391-2404頁；1995測定該活性。
實施例12測定肽醯脯氨醯異構酶活性使用在合適緩衝液適當溫度(如55℃)下合成並分泌多糖脫乙醯酶的宿主菌株的適當體積培養液或細胞裂解液測定該活性。可根據Fischer，G.，Bang，H.和Mech，C.；Determination of enzymatic catalysis for thecis-trans-isomerization of peptide binding in proline-containing peptides.；Biomed.Biochim.Acta；卷43；1101-1111頁；1984測定活性。可對該實驗進行適當的改進以適合特異的肽醯脯氨醯異構酶，如SEQ ID NO36中包含的酶。
實施例13測定酸性纖維素酶活性可對在合適的緩衝液中合成並分泌酸性纖維素酶的宿主菌株培養液或細胞裂解液測試該活性。將適當體積的這類樣品點在瓊脂糖平板上，所述平板含有不溶性顯色底物AZCL-HE纖維素(MegazymeTM)和酸性pH(如pH為3-5)的適當緩衝液。平板在適當的溫度(如55℃)孵育適當的時間(如一天)。酸性纖維素酶的存在顯示為斑點周圍藍色的色圈。
實施例14測定木聚糖脫乙醯酶活性使用在合適緩衝液中適當溫度(如55℃)下合成並分泌多糖脫乙醯酶的宿主菌株的適當體積培養液或細胞裂解液測定木聚糖脫乙醯酶活性。木聚糖脫乙醯酶活性由從乙醯化木聚糖(通過Johnson等，1988(Johnson，K.G.，J.D.Fontana和C.R.Mackenzie.1988 Measurement of acetylxylanesterase in Streptomyces.Methods Enzymol.160551-560)的方法由birchwood木聚糖製備)中釋放的醋酸測量。可以用適合酶物理需要的醋酸測定試劑盒(Biopharm)測量通過酶從底物中釋放的醋酸(Kosugi A，Murashima K，和Doi RH；Xylanase and Acetyl Xylan Esterase Activities ofXynA，a Key Subunit of the Clostridium cellulovorans Cellulosome forXylan Degradation；Appl.Environm.I Microbiol.；卷68；6399-6402頁；2002)。
實施例15測定植酸酶活性可對在合適的緩衝液中合成並分泌植酸酶的宿主菌株培養液或細胞裂解液測試植酸酶活性。將適當體積的這類樣品用0.1M醋酸鈉和適當緩衝液中的0.01％Tween-20，pH 5.5稀釋，該緩衝液可以是pH 3.0到3.5的HCl、pH 4.0到5.5的醋酸鈉、pH 6.0到6.5的嗎啉代乙磺酸(MES)和pH 7.0到9.0的Tris-HCl，並進一步在底物溶液(含5mM植酸鈉[Sigma]的0.1M醋酸鈉和0.01％Tween-20[pH 5.5]，並在37℃預孵育)中稀釋26倍，以起始反應。37℃30分鐘後，加入等體積10％的三氯醋酸終止反應。通過加入等體積鉬酸試劑測量游離的無機磷酸，100ml試劑含有7.3g FeSO4，1.0g(NH4)6Mo7O24·4H2O和3.2ml H2SO4。750nm處測量吸光度(Vmax微孔板讀數器；Molecular Devices)(Lassen SF；Breinholt J；OstergaardPR；Brugger R；Bischoff A；Wyss M；Fuglsang CC；Expression，genecloning.and characterization of five novel phytases from fourbasidiomycete fungiPeniophora Iycii，Agrocybe pediades，a Ceriporia sp.，and Trametes pubescens；Appl.Environ.Micr.；67；4701-4707頁；2001)。
實施例16測定磷脂酶活性可對在合適的緩衝液中合成並分泌磷脂酶的宿主菌株培養液或細胞裂解液測試磷脂酶活性。向適當體積的這類樣品中添加卵磷脂。在恆定的pH和溫度下水解卵磷脂並根據中和釋放的脂肪酸時的滴定劑(0.1N NaOH)消耗率測定磷脂酶活性。底物為大豆卵磷脂(L-α-Phosphotidyl-膽鹼)且條件為pH 8.00，40.0℃，反應時間2分鐘。單位(LEU)相對於標準定義。
實施例17在枯草芽孢桿菌中表達穀氨酸肽酶基因(SEQ ID NO2)通過PCR將來自蛋白酶SAVINASETMTM(也稱為地衣芽孢桿菌枯草桿菌蛋白酶309，來自Novozymes A/S)的信號肽與編碼穀氨酸肽酶的基因(SEQ ID NO2)框內融合。通過同源重組將編碼產生的編碼序列的DNA整合進入枯草芽孢桿菌宿主細胞基因組。在三元啟動子體系(如WO99/43835所述)控制下表達基因構建體，所述體系由來自地衣芽孢桿菌α-澱粉酶基因(amyL)、解澱粉芽孢桿菌α-澱粉酶基因(amyQ)的啟動子和包含穩定化序列的蘇雲金芽孢桿菌cryIIIa啟動子組成。使用編碼氯黴素乙醯轉移酶的基因作為標記物(在例如Diderichsen等，A useful cloningvector for Bacillus subtilis.Plasmid，30，312頁，1993中描述)。
通過DNA測序分析氯黴素抗性轉化體以確認構建體的正確DNA序列。選擇了一個這樣的克隆。
在旋轉搖床上於帶有擋板的500ml Erlenmeyer搖瓶中發酵穀氨酸肽酶(SEQ ID NO2)表達克隆，每個所述搖瓶含有100ml添加了6mg/l氯黴素的PS-1培養基。克隆在37℃發酵6天並在3、4、5和6天時取樣並分析蛋白水解活性。用20微升培養液在pH3.4的0.1％AZCL膠原(MegazymeTM)LB-PG瓊脂平板上以斑點測試測定活性(參閱實施例7)。將平板在55℃孵育(過夜)且活性顯示為斑點周圍的藍色色圈。
實施例18來自脂環酸芽孢桿菌的A4家族蛋白酶的純化和表徵純化將培養液離心(20000xg，20分鐘)並從沉澱上小心倒出上清液。組合的上清液通過Seitz EKS板過濾以去除剩餘的芽孢桿菌宿主細胞。用檸檬酸將EKS濾出液調節至pH 4.0並在水浴中攪拌加熱至70℃。溶液達到70℃時(從25℃到70℃大概用去15分鐘)，立刻將溶液置於冰上。該熱激處理產生一些沉澱，其用另一Seitz EKS濾板過濾去除。向第二次EKS濾出液中添加硫酸銨至1.6M的終濃度並將混合物加至用20mMCH3COOH/NaOH，1.6M(NH4)2SO4，pH 4.5平衡的Butyl Toyopearl S柱上。用平衡緩衝液大致洗滌Butyl柱後，用相同緩衝液中的線性(NH4)2SO4梯度(1.6到0M)洗脫酶。分析來自柱的級分的蛋白酶活性(使用pH4.0測定緩衝液和37℃測定溫度)並合併具有活性的級分。將合併的級分轉移至20mM CH3COOH/NaOH，pH 5.5的G25葡聚糖凝膠柱並應用於相同緩衝液平衡的SOURCE 30Q柱。用平衡緩衝液大致洗滌SOURCE 30Q柱後，用相同緩衝液中的線性NaCl梯度(0到0.5M)洗脫蛋白酶。分析來自柱的級分的蛋白酶活性(pH4.0，37℃)並合併具有活性的級分。用1％(w/v)活性炭對帶有輕微顏色的合併物處理5分鐘，並用0.45pm的濾膜去除炭。濾出液的純度用SDS-PAGE分析，其中在考馬斯染色凝膠上只看到一個條帶。
測定使用Protazyme OL(交聯並染色的膠原)測定法。通過溫和攪拌將Protazyme OL片劑(來自Megazyme)懸於2.0ml 0.01％ Triton X-100。在Eppendorf離心管中混和500微升該懸液和500微升測定緩衝液並置於冰上。加入20微升蛋白酶樣品(稀釋於0.01％Triton X-100)。通過將Eppendorf離心管轉移至Eppendorf熱混和儀起始測定，混和儀設定為測定溫度。管在Eppendorf熱混和儀中最高搖動率(1400rpm)下孵育15分鐘。通過將管移回冰浴上終止孵育。然後將管在冰冷的離心機中離心數分鐘，將200微升上清液轉移至微孔滴定板並在650nm處讀出OD650。測定包括空白緩衝液(代替酶)。OD650(酶)-OD650(空白緩衝液)為蛋白酶活性測量值。
蛋白酶測定法
底物Protazyme OL片劑(Megazyme T-PROL)。
溫度受控的。
測定緩衝液100mM琥珀酸、100mM HEPES、100mM CHES、100mMCABS、1mM CaCl2、150mM KCl、0.01％Triton X-100，用HCl或NaOH調節至pH值2.0、3.0、4.0、5.0、6.0、7.0、8.0、9.0、10.0、11.0和12.0。
表徵pH活性、pH穩定性和溫度穩定性使用上述蛋白酶測定法獲得pH活性譜、pH穩定性譜以及pH3.0的溫度活性譜。為了測定pH穩定譜，用測定緩衝液5×稀釋蛋白酶並在37℃孵育2小時。孵育後測定剩餘活性前通過用pH3測定緩衝液稀釋將樣品轉移到pH3.0。
37℃的pH活性譜

PH穩定性譜(37℃2小時後的剩餘活性)

溫度活性譜(pH 3.0時)

其他特徵由SDS-PAGE測定的A4蛋白酶的相對分子量為Mr＝26kDa.
實施例19在枯草芽孢桿菌中表達酸性纖維素基因(SEQ ID NO1)通過PCR將來自TermamylTM(Novozymes)的信號肽與編碼酸性纖維素酶的基因(SEQ ID NO1)框內融合。通過同源重組將編碼產生的編碼序列的DNA整合進入枯草芽孢桿菌宿主細胞基因組。在三元啟動子體系(如WO 99/43835所述)控制下表達基因構建體，所述體系由來自地衣芽孢桿菌α-澱粉酶基因(amyL)、解澱粉芽孢桿菌α-澱粉酶基因(amyQ)的啟動子和包含穩定化序列的蘇雲金芽孢桿菌crailla啟動子組成。使用編碼氯黴素乙醯轉移酶的基因作為標記物(在例如Diderichsen等，A usefulcloning vector for Bacillus subtilis.Plasmid，30，312頁，1993中描述)。
通過DNA測序分析氯黴素抗性轉化體以確認構建體的正確DNA序列。選擇了一個這樣的克隆。
在旋轉搖床上於帶有擋板的500ml Erlenmeyer搖瓶中發酵酸性纖維素酶(SEQ ID NO1)表達克隆，每個所述搖瓶含有100ml添加了6mg/l氯黴素的PS-1培養基。克隆在37℃發酵3天並在1、2和3天時取樣並分析纖維素酶活性。用20微升培養液在pH3.4的0.1％AZCL-HE纖維素酶(MegazymeTM)LB-PG瓊脂平板上以斑點測試測定活性。將平板在55℃孵育(過夜)且活性顯示為斑點周圍的藍色色圈。
附加說明(PCT/RO/134表)關於「專家意見」的聲名保藏的微生物保藏號保藏日期DSM 15176 2003年6月30日關於PCT/RO/134表所列的保藏微生物，我們需要所謂的專家意見在歐洲專利受權公告之前，或如果該申請已被駁回、撤消或視為撤消的情況下，自申請日期二十年內，保藏的微生物樣品只提供給樣品請求人指定的獨立專家(參見EPC細則28(4))。並且就澳大利亞而言，同樣請求專家意見，參見澳大利亞法規1991No 71細則3.25。同時，在加拿大我們請求只批准由委員會指定的獨立專家有權獲得保藏的微生物樣品。
Bagsvaerd，2005年1月5日諾和酶股份有限公司Morten Birkeland，專利律師序列表序列表110諾和酶股份有限公司120脂環酸芽孢桿菌的多肽130NZ 1040616060170PatentIn版本3.221012112877212DNA213脂環酸芽孢桿菌屬220
221misc_feature222(1)..(2877)223CDS220
221misc_feature222(1)..(72)223sig_peptide220
221misc_feature222(73)..(2877)223mat_peptide4001ttgaagactc gatggtcagg tgcgctggct gtgctcatcg ccctcggaac gggtgcctcg 60cccgcttggg ccagtgtcca cagcgcggcc acgcacgcaa aggcgcacgt cggcgtgcgc120gctgcggata tggccgcagc gtccatgtcg gccgagattc agattctgca cgacgcgctc180acggcttccg agctgtcgtc cgtccaggcc gcggcacagg ccgccgccaa cctgcctgcc240tccacgtggg tgagctggct gtatccgagc gcctcctcgc cgagcgccgc acagacgcag300
acggcgcagg ccctgggcgc gctcctcacc ttggtcacgt atggcgccgt cgcagacgat 360ggccaaaaca tcgcacagaa tttgcaaacc cttcagtcga cttcgccgct cttatcgccc 420gcggccgtct cgatgttcta tcaaaacttc ttcgtgctcg tcggccaatc gtccaaatcc 480gtgctttcgg gccaggcaac cacctccacc gccggccacg ccctcgccca agcggccgcg 540ctgacgccac agctcgccgc gtacctgcgc caatccggtc tttcgccgga cgatctcgcc 600cgcgcctacg tgagctttgc ctccgccgtg gattcgcagg gcgcggcgca aacggctctc 660ctgacgcgca tctgcaccaa catcctgggc tttggcgcgc cgacctccac ggcgaccatc 720accgtcaacg ccgcggcgaa ccttggacag gtgccgacca ccgcgtttgg cctgaacgcg 780gccgtgtggg acagcggtct caactcccag accgtcatct ccgaggtgca agcgctccac 840cccgccctca tccgctggcc cggaggctcc atctcggacg tgtacaattg ggagaccaac 900acgcggaacg acggcggcta cgtgaatccc gacgacacgt ttgatcactt catgcagttt 960gtgaatgccg tcggctccac gcctatcatc acggtcaact acggcaccgg cacgccacag1020ctcgccgccg actgggtgaa gtacgccgac gtgacccacc acgacaacgt catgtattgg1080gaaattggca acgagattta cggcaacggt tactacaacg gcaacgggtg ggaggcggac1140gatcacgccg tggccggcca gccgcaaaaa ggcaaccctg gtttaagccc gcaggcgtac1200gcgcaaaacg ccctgcagtt catcaaggcg atgcgcgccg aggacccgtc catcaagatt1260ggggccgtgc tcacgatgcc gtacaactgg ccgtggggcg cgaccgtgaa cggcaacgac1320gactggaata ccgtcgtcct gaaggcgctc gggccctaca tcgattttgt ggacgtgcac1380tggtaccccg agacgcccgg gcaggagacc gacgccggcc tgctcgccga cacagatcaa1440atccccgcca tggtggcgga gctcaagcgc gaagtgaaca cctacgccgg atcgaacgcg1500aagaacatcc aaatctttgt gaccgagacc aacagcgtat cgtacaaccc cggcgagcag1560tcgaccaacc tgcctgaagc gctcttcttg gcggacgatc tcaccgggtt catccaggcc1620
ggcgcggcca acgtcgactg gtgggatctg ttcaacggcg ccgaggacaa ctacacaagc1680ccgagcctct acggccagaa cctgtttggc gattatggac tcttgtcctc cggccagacc1740acgcaaaacg gttggcagga gccgcccgcc aacacgccgc ttccgcccta caatggcttc1800cagctggtct cggatttcgc gcagcccggc gacacgatgc tcggctccac cacgtcgcag1860agcgccatcg acgtgcacgc cgtgcgcaag ccgaatggcg acatttcgct catgctcgtc1920aatcgcagcc catccgccat ctacagcgcc aacctgaacg tgctcgggtt cgggccgttt1980gtcgtgacac atgcgctcgc gtacggtgaa ggctcgagcc gcgtggcgcc catgccggtt2040cttcccgtcc ccggcgcgcc catcaagctc atgccctaca gcgggatcga tctcaccctg2100cacccgctca ttccggcgcc acacgccgcc gcgcaggtga ccgatacgct cacgctgtct2160tcgcccacgg tgacggccgg cggtgcggag acgctctccg cctcgttcca ggcggatcga2220ccggttcatc acgccacggt ggagctcgag ctgtatgact cgacgaacga tctcgtcgcc2280acccacaccg tctcggatgt cgatcttcag ccgggatcgg ccacaagcga gacgtggagt2340ttcaccgcac cggccgcgaa cggcaattac cgcgttgagg cgtttgtgtt tgacccggtg2400acgggcgcga cgtacgacgc ggacacgcag ggcgcggttc tgaccgtcaa ccagccgcct2460caggcgacct acggcgacat cgtgacgaaa gacacggtca tcacggtgaa cgggacgacg2520tacgacgttc cggcacctga tgcgggcggg cactatccgt cggggacgaa tatttcggtg2580gcacccgggg acacggtgac cgtgcagacg acgtttgtca acgtctcatc gacggacgcg2640ctgcagaacg ggctcatcga catggaagtg gacggatcga acggggccat cctgcagaaa2700tactggccga gcacgactct tttgcctggc caatcggaga cggtgacggc gacgtggcaa2760gtgcctgcga atgtggcggc cggaacgtac ccgctcaact tccaggcctt caacacgagc2820agctggacgg gaaactgtta cttcacaaac ggtggcgtgg tcaacttcgt gatcagc 2877
2102211816212DNA213脂環酸芽孢桿菌屬220
221misc_feature222(1)..(816)220
221misc_feature222(1)..(96)223sig_peptide220
221misc_feature222(97)..(816)223mat_peptide4002atgaacggca cctcagtctg gaaagcgtca ggcatcgcag ccgcctcgtg cctgacagcc 60gcggcacttc tcgcctggcc ccacgccaca tccacgttgg acgcgtcgcc cgccatcttc120cacgcgccgc ggcacgcgct ctcgcccaac accagcccga aaccgaacag cgtccaggca180cagaactttg gttggtcggc gtcgaactgg tcgggatatg ccgtgaccgg cagcacgtac240aacgacatca caggcagttg gattgtgcct gcggtgagcc catccaagag aagcacgtac300tcttcgagct ggatcggcat cgacgggttc aacaacagcg atctcattca aaccggcacg360gagcaggact atgtcaacgg tcacgcgcag tacgacgcct ggtgggaaat cctccccgcc420cccgagacgg tcatctcgaa catgaccatc gccccgggcg accggatgag cgcgcacatc480cacaacaacg gcaacggaac ctggacgatt acgttgacgg acgtgacccg caacgagacg540ttctccacca cgcagtcgta ctcgggccct ggctcgtcgg ccgagtggat ccaggaggcg600ccggagatcg gcggccggat cgccacgctc gccaactacg gcgagaccac gttcgatccc660ggcaccgtaa acggcggcaa cccaggtttt accctgtccg acgcgggcta catggtgcag720
aacaacgcgg tcgtgtctgt gccgtccgca cccgactcgg ataccgacgg cttcaacgtg780gcctacggct ccaaccagcc gagcccaccg gcctcc 8162103211945212DNA213脂環酸芽孢桿菌屬220
221misc_feature222(1)..(945)223CDS220
221misc_feature222(1)..(75)223sig_peptide220
221misc_feature222(76)..(945)223mat_peptide4003atgagaagac gcatgtcagg ctttgcgacg ggccttggca tcgcggcggg gctcgccctc 60agttccgccc tcgccgcgcc gttcttccac gccgggaacg cgtccgcggc gtcgacgatg120tcgatggcgc cgacgagcac catgggcgcc ctgcccgcgc ccgaaggcgt gccggacgca180ggcccgctgt cgatcacgcc cgaggtcatt cgccaacaac aggctgacgc tgtccgggtc240atggacgaag aaggcctgaa gccacagatc ctctccggcg acatcaagcg attcaccctc300accgcgagcc aggtgaactg gtatttgtac cccggcaaag cggtcgtcgc gtgcggctac360aacggccaag tgcctggccc ggtcctccgc gtgcgcgtgg gcgatcgcgt ccaaatcctc420ctgagaaacg agctgaacga gcccaccacg ctgcacatcc agggcctcga tctgccggcg480
tcgcagttgg gaatcggaga cgtcaccgaa tcccccatcc ctccgggcgg cgaacgcctg540tacagcttca ccgtgacgcc acagatggtg ggcacccacc tgtacgagag cggcacggat600atggccagcg agatcgaccc aaggactgca cggggtgctg ctcgtcgatc cggcccgggg660atccctttat ccccaggcga aggtggacgc gctcttcgag atcgacgcgt ggatggtgga720cggatcgacc accgaaaacg cgtttggcct ggacggcaag ccgtatcccg acgcgcccga780actgacggtg ccgtacggca gccgcgtggt gctgcgcatc gtcaacgcga gcgggatgtg840ctaccacgcc atgcacctgc acgagacgac gttttggctg ctggcggaag acgggcaccc900cctcgccaag ccgcggccga tgaacgtgct cgccatcgcg ccagg94521042111878212DNA213脂環酸芽孢桿菌屬220
221misc_feature222(1)..(1878)223CDS220
221misc_feature222(1)..(66)223sig_peptide220
221misc_feature222(67)..(567)223前肽220
221misc_feature222(568)..(1878)223mat_peptide
4004atgggcttgt ggaaacggct ggcgctcggc gtgcctgcgg cacttagcat gctcgcggtt 60ggggtgcctg tgatgagcgc ggacaccgtg gaggctgcgc cgcttgcgaa tccttcaacg 120gaaaatgcgc aggatatggg gccggcgagt gggagccaga cggtgacggc atccatcatt 180ttgcgtgtgc agaatccgac ggcgctgcag aactacattc aagagacgga gacaccgggc 240agtccgctgt accataagtt cttgacgacg gcgcagttcg ctcagcagta cgcgccttcg 300gcggcgaccc ttcagcagat tgagcaggag cttcagggct atgggctcca ggtcgtgaat 360gtcgacgcgg atcacctgga catgcaggtt cagggcacag ttcagcagtt tgacaacgcg 420ttcaacaccg tgatcgacct gtttaaggca aacgggcaca tcttccgcgc gccgaagaag 480ccgccgcaga tcccggtggc gcttctcacc aacgtgctcg ccgtggtggg actcgatacg 540gcacaggcgg cgcagtcgct cacggtgaag acgccgaacg tcgcgggtgt gccttcgccc 600aaggtggtgc ttccgcaggg aggcagcacg gcgacgggca cgccagggag ctacacggtt 660ggggatacgg cgaatcgcta cgacatcaac ccactctatc agaagggtat cacgggcaag 720ggcgagacca tcggcattgt gacgctgtcg agctttaatc cgcaggatgc ctacacctac 780tggcagggca ttgggctgaa ggtggctcca aaccgcatcc agatggtgaa tgtggacggc 840ggtggccaga tggatgatgg atcggtcgag acgacgctgg acgtggaaca gtcgggcggt 900ttggcgccgg acgccaacgt cgtggtgtac gacgcgccga atacggatca gggcttcatc 960gatgcgttct accaggcggt ctcggacaac caggcggatt ccctctcggt gagctgggga1020cagcctgaaa tcgattacct gccgcagatg aaccaaggcc agtcgtatgt ggatgagctc1080ctcgccttca cccaggcgtt catggaggcg gcggctcagg gcatttccat gtacgcggcc1140gcgggggatt caggcgccta cgacacggcg cgcgacttcc cgccctccga tggcttcacc1200acgccgctca gcgtggactt tcccgcctcc gacccgtaca tcacggctgc gggaggcacg1260acggtaccgt tcaccgcaaa gttctcgctc ggcacggtca acatcacgca ggagcagccc1320
tggtcgtggc aataccttca aaacctcggc taccaagggc tcttctccgt gggcacaggc1380ggtggcgtga gcgtcatctt cccgcgcccg tggtatcagc tcggcgtggg cggcatgcaa1440aatagcgcgg ccaatcaggc cttcaccgac tcgcagggcg ttttgtacgg atcgcccttc1500acgtacaacc tgccgagcaa ttacgcgggc cggaatctgc cggacatctc catggatgct1560gatccggaga cgggctatct ggtctactgg agcgcgggcg gtggctggat tgcgggctac1620ggcgggacga gcttcgtggc gccgcagttg aacggtatca cggcgctcat tgatcaggag1680gtccatgggc gagtgggctt cctcaatccg ctgctgtaca ccctgttgac gcaaggggtc1740caaggtgggg cgcagccgtt ccacgacatc acgacgggga acaactggta ttggaatgcg1800gtgcctggtt acgatccggc ctcgggcgtg ggcacgccgg acgtcgcgaa cttggcgcag1860gacatcgcat cgctgaga 187821052111599212DNA213脂環酸芽孢桿菌屬220
221misc_feature222(1)..(1599)223CDS220
221misc_feature222(1)..(72)223sig_peptide220
221misc_feature222(73)..(1599)223mat_peptide4005
atgcgagcgc tcgcacattt ggccattggc gccatcgcgt ccggcgtttt cgctgcacct 60gtcgcttttg cctcgccggt tcaggaacgc gtggtggtgg cctcgcccga tccgcggacg 120cgtagcgttc acgcggatgg cgaaatttca ccgtcgcagc cgatgcactt ggtcattacg 180cttcgcctgc gccacgaggc gcagctcgag cagctgattc gagacctgta cacgccggga 240tcgcccgatg caggtcactt cttgacgccc gcggcgttta acgcggcgta tgcaccgacg 300gctgaggacg tgcaggccgt ggtccagggg ctgcgcgcat acggcctccg cgttgagccg 360acggtaaatc ccatggtgct gaccgtgagt ggacgggccc gcgacgtcga gcgagcgttt 420ggcgtgcatg agctccaatt tgggcgcgga gctggcgcat ggtacgcccc ggatggtgcg 480gccacgctgc ctgcaccgct cgccgcgcgc gtgtcggccg tggtaggcct gacgagcgac 540gcgatggagc gccacctcgt cctggcgcac gtcgcgccgg caggaggtgg ctacacgccc 600gcgcaaattc agcgcgccta cgactatacg ccgctctaca gccaatacat ggggcgcgga 660caggtcattg cggtggtgac ttccggctcg gtgctccgct ccgacctgct cgcgttcgat 720cgcgccttcg ggcttccgaa tccggtggtg cgccagcggg tgatcgacgg atcgtccacg 780tctcccgacg acgagaccac cctcgactgc gagtgggcgc atgccatcgc gccgacggca 840tcgctcgccg tgtacgaggc cgctcaaccg gacgcgcagt cgttcatcga tgcgtttgcc 900caggtggcgg cggacgatgg cgcgcatgtg gtcacgacga gttggggagc gcccgagtcg 960gagaccgacg cggcgaccat gcaggcggag caccagatct tcatgcagat ggccgcccag1020gggcagagcg tgttcgccgc ggcgggcgac agcggatcgt cggacggaac aagcgggacg1080gacgtcgact atccgtcgtc ggatccgtat gtcaccgcgt gtggcgggac gaggctcgtt1140cttggtgcgg gtgcaaagcg gctgcaggag acggcgtggg ccgacacggg cggcggcgcg1200agctcggtgt acggagagcc gtggtggcaa tatggcccgg gcgtgccgca gacgggctat1260cggcagacgt gcgacgtcgc cctgaacgcc gatccggcca cgggctacga tttcatctat1320
gagggtcagt gggaggtggc cggggggacg agctttgtcg cgccgatgat ggccgcgacg1380tttgcgctca tcgaccaagc gcgtgccctc gaaggtaagc cacccgttgg gctcgcagac1440gtcggcatct atgcgatggc gcgcaacgcg tcctacgcgc cgtacgcatt ccacgacatc1500acggccggat cgaacggcgc gtacagcgcg ggcccgggat gggatcatcc aaccggcttt1560ggttccatcg acgcgtacta ctttttgcac gggctcgac 159921062111233212DNA213脂環酸芽孢桿菌屬220
221misc_feature222(1)..(1233)223CDS220
221misc_feature222(1)..(123)223sig_peptide220
221misc_feature222(124)..(1233)223mat_peptide4006atgcggcgtc gacgttggga ttacgaggac tggccgagtg agaacaggcg tgtcggcgtg 60tggctcgcga gcgggaccgc gctgcttgcc atctgctaca tcctcggcat ctggacgggt120gcggcgctca cgcgcggtca ttcccagacg accgtggaat acgttcctcc ccagacgggc180aacaccgcga gcacgtccgg atcgctcacg ccgatcccgg gcgtcgagga cacgaccata240gtgacgcaga tttataaccg agtgaaaaat agcatcttta ccattacggc cgtctccgga300ggcaagccga cgtcgagcga cgcagaagaa gatatcggca cggggttcct gatcgatcac360
aacggcgatc tcttgaccaa cgcgcatgtc gtcggatcgg ccacaacggt ccaggtgtcc 420ggggacaacc gccaattcgt cggccgcgtg attgacgccg accagctgga cgatctcgcc 480atcgttcgca tcccggcgcc caaatcgctg gaaccgctgc cgttgggatc ggtgaagtcg 540cttcagccgg gcagcctggt catcgccatc ggcaacccgt ttgagctgac ctcgagcgtc 600agctcgggca tcgtgagcgg actcaaccgg tcgatgtccg agtcgaacgg gcacgtgatg 660aacggcatga tccagacgga cgcgccgctc aaccctggaa attcgggagg cccgctgctc 720aacgcggcag gacaggtcgt cggcatcaac acgctgatcg aaagccctat cgaggggtcc 780atcggcattg gctttgccat tcctatcgac cggtttatcc agctcgagcc agaattgctc 840gccggcaaac ccgtcgcgca cgcctggctc ggcatcgagg gaatggacat cgacaacctg 900atgcgtcaag cgctgcactt gcctgtggcc tcgggcgtct atgtgaccga agtgaccccg 960ggcggccccg ccgcgaaagc ggggctgcgc ggagattcga acgcggccaa gttgaacagt1020ctaagccagt cggccaatcc gtacgcgctg ctcaagggga acggggacat catcgtcggg1080attgacggca agcaggtctc cagcatcgaa cagttgacgc aggatatcaa ccaagatcaa1140ccgggtcaga cggtggtgct caccgtgttg cgcgcaggca aaaccctgca cgtgcgcgtc1200acgctcggga cctggccatc cagccaaaat ccg 12332107211633212DNA213脂環酸芽孢桿菌屬220
221misc_feature222(1)..(633)223CDS220
221misc_feature222(1)..(90)223sig_peptide220
221misc_feature222(91)..(633)223mat_peptide4007atgcgcaggt cttggagcgt gctcatggcc gtttgcatgt cttggttggc ggtggggtgt 60ggcacgcctg caaactcgtt gtcacaagcg accgctgcgt ctggaaggca cgcgccgcac120cccctcgtgt ttcagaacct cacaggtgcc atgaacgagg ggcaggatcc ccggtgggac180ccgaaagcgg ctcccacggg tgtctacgac gacgtgaccg tggtcacagc gagtggccga240caggaggtgc tctccgttcg ggatgcgccg ctcctgttcg cagcgtactg gtgccctcac300tgccagcgca cactgcagct tctcacgtcg attgaatcac gcctgaagca aaagcccatt360cttgtgaacg tcggctatcc tccgggcacg acactgcaga ccgcggcgcg catcgcgcgc420gaggagtctc aagttcttca cttggcgccg ttccaagagg tctttatctt gaatcctgat480gcaggggatc gatacgcccc gctagggtac ccaacactcg ctttttatcg cgccgggcga540gattggacgc tgtacggtga acatcgagcg tctatttggg aaaaggccct gtccgaatcg600acatcaaaag cgtacaatgg cagcgaggaa tca 6332108211798212DNA213脂環酸芽孢桿菌屬220
221misc_feature222(1)..(798)223CDS
220
221misc_feature222(1)..(87)223sig_peptide220
221misc_feature222(88)..(798)223mat_peptide4008atggatgaga tgaacattcg atcttggtgt gtcgctgctt gtaccgtagc cttgacaagc 60gccgtgggcg cgacgaccgc gttcgcgcag acggtgaccg tacaacccgg acaatcgctc120tggaccatcg cacgcgcaca cgggatgccc gttcagttgg tggcgtccgc caatccgcag180tacaatccgc tgaatctccc tgttggtgcg accgtcacac ttcccagtct caaggacgtg240gctgtgcagc cgggcgactc cctgtttctg atcggcaggc aatatggcgt gtcgctcgcc300gagatgttgg ccgcaaaccc gaacgtggat ccattgaatc tgcaagtggg ttcaagtgtg360cgtgttcccc ttgcatcatc ttcgaccaag agctccacag tttctgccca tgttgccgca420tccacgcccg aaaactccaa caacctgtac tggttggagc gcgtcattca cgcggaggcc480ggcggagaat cgctgcaggc acaaatcgcc gtggccgacg tcattctcca tcgcatggcc540gcgggtggat acgggagcac ggtgcaacaa gtggtcttcc aagtgagcga cgggcactac600caattcgaga gtgtcgcaaa cggttcgatt tacggtcagc cagacgcaca aaacgtgcag660gctgctctcg acgcgttgaa cggagacgat gtcgtcccag gcgcgttggt cttctacaac720cccgcgcaga cgccttccgg aagttgggtt tggcaacaac ctgtggtcgc tcatatcggt780catctcgtgt ttgcgaag 79821092112304212DNA213脂環酸芽孢桿菌屬
220
221misc_feature222(1)..(2304)223CDS220
221misc_feature222(1)..(78)223sig_peptide220
221misc_feature222(79)..(2304)223mat_peptide4009gtgaagacgc atcgcctgct cgcggtcgcg gcactgcctg caacagtgct gttgacaacg 60ccggcgcccg cgctggctga gacctcgagc tcgcagagcg cttcggcgcc gtcgctgaac120gtgccggtcg ctgccctgac cctcgcgggt gttcaatcgt atcccatgct gagctacgga180tccacgggcg tgtacgtgga aattttgcag aacgccctga atgccctggg ctatgacgtg240ggacaagcca gcgggctgtt cgacgccacc acgcaggccg aagtgaaggc ttttcagcag300gcgatgggcc tgcagacgga cggcattgtg ggtcccctga cctggggggc tttggcgaag360gcggtggccg attatcgcca ggtgatgacc gtactctcca gtcgcagctc gctggttcag420caagtcgaat ggaagcgcat cgtatggaac ggcaggttga tttcgaagcc catcggcttc480acgtaccagg ggacagcgta catgcccatt tggtacgtca tgcaggcgct tagcaaggcg540ggcattgcga gcacgtggca gggaggggtt tggacgctca cgccgcccgg aggtcagacc600gtgaattacg gaaagatctc gtacgggccg ggcagtgcgg ccatcgccat cggccagacc660gtggtcgcca atgtgcccgc ggtggtgtac cctgatccgg catccggaaa gctcacgacc720ttcatgcctg tttggtacgt catgaacgcg ttgcagcggc tgggcatcgg ttcgacgtgg780
cagggaaccg agtgggacat gaagccagct cccgtcgtga tcgagacggg cgatccgtcg 840aacaacacca ccgggtcaga tcccgcgaac agcacgggca acggcaccgg gaactcgacg 900ggcaacgcca cgggcgccgt gccaggcggc aataccgtga cgaacgtcac cacgggctcg 960tccaacgtca ccggcaactc gacgggcaac agtttgggga actcgacggg caacagcttg1020ggcaacagca cgtcgaacgc gacgggcaat gccaccggca acaccaccgg gaatgcgacc1080ggcaattcca cgggcacgag cagcgggtcg ttcacgaatg tcgacctgcg ctatccggcg1140ccgtccaaca tcaatgcgca gagcatcaac cagtttctgc tgcagaacag ctcgccgctc1200aatgggctgg gcaattcgtt catggacgcc cagaacctgt acagcgtcga cgccaactac1260cttgtctcgc acgccatcct cgagagtgcg tgggggcaaa gccaaattgc ccttcagaag1320aacaatctgt ttggctacgg cgcttacgat tcgaaccccg gacaggatgc gggcgtattc1380ccgagcgacg actacgccat ccgattcgag gcgtggaccg tgcgcatgaa ctacctcacg1440ccgggcgcga gcttgtacgt gacgccgacg ctcagcggaa tgaacgtgaa ctacgccaca1500gccaagacct gggcaagcgg cattgcggcc atcatgacgc agtttgcgag ctccgtcgga1560tcgaacgtga atgcgtacgt gcagtacacg ccgtccaaca atccgcccgc tccgagatcg1620acagcggaac cggtgtacta catgaacggc gcgcaagggg taacgcagca ggatccgtat1680tacccgaatg gcggcgttcc gtactacccg accatcgcgc agggtgagaa tcagcagttc1740tttggccagc taagtgtcgg cagcttcggt caacccgtgg tggaggttca gcagttcctg1800aaccggacca tcaacgcggg gctgaccgtg gacgggcagt ttggcccgct gacgcaggcc1860gcggtcgaga agttccagtc gcaggtcatg cacatgtcga acccgaacgg catttggacg1920ttcagcatgt gggtccagta catccagcct tctcagtcga acgccaatct catcccggct1980gggaccaccg tgaaaattga ccaggtcgcc gagggcatgg cgggcccgta cgtcgtgcct2040tggtaccacg tggtgggcta tggctgggtc gactcgcagt atatcaagtt gaccaacgtg2100
tatcgcgtca ttgtgcagaa cccggccgga acggccacca ccattcccgt ctaccaggtg2160ggcaacctgt cttcggtatt gctcaatctg cacagcggag actgggtggt tgccaactca2220gcgcagccct cgggcggcgt gtacaccatt cagattgcgg ctcaggatcc accgtgtcga2280acggctacgc cgccgggacg ctct 2304210102111791212DNA213脂環酸芽孢桿菌屬220
221misc_feature222(1)..(1791)223CDS220
221misc_feature222(1)..(147)223sig_peptide220
221misc_feature222(148)..(1791)223mat_peptide40010atgatggccc acgatagatt ggacaggcga gtgaatgaga ggaggcaagc catgcgacgc 60gcggcaaaat gggcaatcgc ccttggcacg acggcagtgg tggctggtgt cagcagcgtg120ttcgcacttc gcagtgtgcg agaagcaaac ctgaatccca acgcccctct cgcgaacgtg180cccgggcctc agggcgccta tacgcccatc agcgcgcttc agcccgtcgt tccgaaaaac240gcgcggatcg accactacac gctgacggcg gaatcccgca cactgaccgt cggcggccat300gccctgcaag ccatgacgtt caacggcacc gcgccagggc cgttgcttgt ggcccatcaa360ggcgacgtcg tgaaggtcac ggtgcacaac cgcctctccg tccctctgac cattcactgg420
cacggcatcg cggtgcccgg cgcggaagac ggcgtccctg gtgtcacgca aaacccaatt 480ccgcctggcg ggagctacac gtacgagttt caggttaacc agcccggaac gtactggtac 540cactcgcacg aggcgagctt tgaagaggtg ggcctcgggt tgtacggcgc cttcgtcgtt 600ctgcccaaac gggcggtcca tccggccgat cgcgactaca cgctcgtcct gcacgagtgg 660ccgaccgcat ccaccgcgca gacgatgatg gcgaacctca aggctgggaa cttgggattc 720tcagcgaaag gcgaatccgc aggcatgggc ggcatgggca tgcaacaaaa cggggacatg 780aacggcatgg gcatgatggg cgcggcggac ggcacgggtc agggaggaaa tagcgcgagc 840gacatcgcgc acgtgttgcc tggccccccg cttcaactga acggtttttc gccgaccgca 900aacgattggg ctgcgcttga cgaaatggcg ggcatgtatg acgccttcac ggtgaatcag 960aacgcgagcg gtacaacgct cttgccagcc aagccgggac agctcgttcg gcttcgcatc1020gtgaacagcg gcaacatgac acacctgttc acgctggtcg gcgcaccgtt tcgcgtcgtg1080gcgctcgacg gccacgacat tgccaacccc ggttggatcc gcggcgtctt gcttcccgtc1140ggcgctgcag agcgatacga catcgaattt cgcgtgccaa agtccggggc cgcattcctt1200gtgtgcgccg atcccgacac gactgcacag cgcgagcttc gcgccgccat cggtctgccc1260gacgcctggt cacaattcaa ggagacggat gcagcgagcc ttgaacgagc gccgtggttc1320gactttacac actatggcag cggcaggctg cccggcgaag ccgtgttccg cctgcatcag1380gcgtatcagg tacgctacaa catgaagctc accgtcggca tgtcgatgaa cggcatggtg1440tacgccatca acggcaaggt ctttccgaac atcccgccca tcgtcgtgcg aaagggcgac1500gccgtcctgg tccacatcgt gaacgacagc ccctacattc acccgatgca tctgcacgga1560cacgactttc aagtgctgac gcgcgatggg aaacctgtct ccggaagccc catcttcctg1620gacaccttgg acgtgttccc cggcgagagc tacgacatcg cgtttcgcgc cgacaacccg1680ggtttatgga tgtttcactg tcacgatctc gaacacgccg cggccggtat ggacgtcatg1740
gtccagtacg cgggcatccg cgatccctac ccgatgagcg agatgtcgga g 179121011211735212DNA213脂環酸芽孢桿菌屬220
221misc_feature222(1)..(735)223CDS220
221misc_feature222(1)..(87)223sig_peptide220
221misc_feature222(88)..(735)223mat_peptide40011atgaaacgtc ggaccttgct tgcgggcatc acgctggcgg cgctcgtcgc ggtggcgggc 60tgtggcacgc cggccggtaa caccgcctcg ccggacaaca cagcgaactt gtcgaacacg120aacgcgccgg acacgctgtc caatgaaacc ggccagacgc tcgatacggc caacccgccg180tacctgcaca cgtcgaccga gcagtggaag agcatgccga agatgttcat caacccgaac240aagacctatg acgccattgt ccacaccaat tacgggacgt tcaccatcca gctgttcgcc300aaagacgcgc ccatcacggt gaacaacttc gtgttcctgg cagagcacaa cttctaccac360gattgcacgt tcttccgcat cgtgaagaac ttcgtgattc aaacgggcga tcctcgcaac420gacggtaccg gcggcccggg ctacaccatc ccagatgaac tcagccatca ggtgccattc480acgaagggca ttgtcgcgat ggccaacacg ggccagccgc acacgggcgg aagccagttt540
ttcatctgca cggccaatga cacgcaggtc ttccagccgc ccaacaatcg ctatacggaa600ttcggccgcg tgatctccgg aatggacgtg atcgacaaga ttgccgccat cccggtgacc660gaaaacccca tgacgcagga agacagctat cctctgaaga ctgcgtacat cgagtcgatt720caaattcaag aatcg 735210122111824212DNA213脂環酸芽孢桿菌屬220
221misc_feature222(1)..(1824)223CDS220
221misc_feature222(1)..(81)223sig_peptide220
221misc_feature222(82)..(1824)223mat_peptide40012gtgaagaagg gaaagagatg gtccgccgcg ctcgcgacgt ccgtggccct gtttgccacc 60ctgtcgcccc aagcgctcgc cagcgacacc gtggttccgc aagtgaacac gctcacgccc120attcatcacc tcgtcgtcat cttcgacgag aacgtctcct ttgatcacta tttcgccacc180tatccgaacg ccgccaatcc agccggcgag ccgccctttt acgccgcgcc gggcaccccg240agcgtcaatg gcctgtccgg aagccttctc acgcacaatc ccaacggcgt gaatccgcag300cgcctcgacc gttcccaagc cgtgacgccg gacatgaacc acaactacac gccggagcag360caggccgtgg acgggggccg catggataac tttatcaata cggtcggccg cggaaatccc420
atcgatctcg actactacga cggaaacacg gtcaccgcgc tctggtatta cgcgcaacac 480ttcgccttga acgacaacgc gtactgcacg cagtacggcc cgtctacgcc tggcgccatc 540aacctgattt cgggcgacac cgcgggagcg acggtttatt cttcaagtga gaccagcggc 600gccgcacaag tcgtgccacc cggcagcaaa aactttccga atgccgtgac gccaaacggc 660gtcgacatcg gcgacatcga tccctactac gacagcgcct ccaaaggcat gaccatggcg 720atggccggca aaaacatcgg cgacctgtta aacgcgaagg gggtcacctg gggctggttc 780cagggcggct ttgcaaatcc gaacgccaag gacaacaata tcgccggcac agatgaaacc 840accgattaca gcgcacacca tgagccgttc cagtattatg cgtctacggc aaatccgaat 900catctgccgc ctacgagcgt ggcgatgatc gggcgcacgg atcaggcaaa ccaccagtac 960gacatcacga atttcttcca agcattgcaa aacggaaaca tgcccgccgt gagtttcctg1020aaagctcccg aatacgaaga cggtcacgcc ggctattccg atcccctcga cgaacagcgc1080tggctggtcc agaccatcaa tcaaatcgag gcgtcgcccg attggtcctc caccgccatc1140atcatcacct atgacgactc ggatggttgg tacgatcacg tcatgcctcc gctcgtgaac1200ggatcgagcg acaaggccgt ggacgtgctc ggtggcacgc cggttctgca aaacgggacc1260gacagggcgg gctatggacc gcgggtgccg ttcctcgtca tctcgcccta cgccaaacac1320aattttgtcg ataacacgct catcgaccag acttccgttc tgcggttcat cgaggagaac1380tggggcctcg gctcgttggg cccagcgtcg tacgactcgc tcgccggatc gatcatgaac1440atgtttgact ggaacacgca gaacccgcct gtgtttctcg atccgacgac cggtgaaccc1500gtgtccccag atatgcagcc ggaggtcatt cgcggcacca cgtatctcag cctgaatcac1560tacgctcaaa acctcgatgt cgtgctgcaa acctctcggg ggatggcgcg gttctcctac1620gaggggcacg aggtcgagat cgacgagcgt tccgggcttg tccgggtcga tggcgaagcg1680gtccatctca aggcgcctct tgtgcgggtg gacggcgtat ggatggtgcc cgtagaggaa1740
atggattcgc tcattggggc cacgctgcac acctacaccg acggtcatct cacctactat1800ctcttttctc cgcaagacgc ccat 182421013211750212DNA213脂環酸芽孢桿菌屬220
221misc_feature222(1)..(750)223CDS220
221misc_feature222(1)..(75)223sig_peptide220
221misc_feature222(76)..(750)223mat_peptide40013atgctgagct tgtggaagcg aatccgaacg ggaacactct cacttctggc tgcatgcgcg 60tgcgcgctgt cggcgatggg cgctggggca ggatgggtgc atgcggctga gtcccaagcg120caagccccaa gggccattta caaggtggac acgaaggaaa aggtggtcgc tctcacgttc180gacatctcat gggggcaccg cacgcccgaa ccggttctcg agacactcaa gaagtgcggc240gtgaccaagg cgacgttttt cctgagcggt ccttggacca tgcaccacgc ggacatcgca300aagaaaatca aggcgatggg ctacgaaatt ggcagccatg ggtacctgca caaggactat360tccaattacc cggactcttg gattcgagaa caggcgatgc tcgcagacaa ggccattcaa420caggtcactg gggtcaagcc gaagctgttc aggacgccaa atggcgactt gaatccgcgc480
gtcatccgct gcctgacgag catgggctac acggtggtcc aatggaacac cgattcgctt540gactggaaaa acccaggcgt cgacgcgatc gtcaaccgcg tcacgaagcg cgtggtgcct600ggcgatatca tcctgatgca cgcgagcgac tcgtccaaac agattgtgga ggccctgccg660cgcatcattg aatcgcttcg gcagcagggc taccggttcg tcaccgtctc cgagctgttg720gcgggcgcca gcgttcaatc caaggtccag 75021014211972212DNA213脂環酸芽孢桿菌屬220
221misc_feature222(1)..(972)223CDS220
221misc_feature222(1)..(63)223sig_peptide220
221misc_feature222(64)..(972)223mat_peptide40014atgcggaaga cggctgcagg cgcgtgcgcc ctggcgctga tgggggtctt gggcggttgg 60gcgggcgcgg ccggcacggc ggtgaacgcg cacgcgccgg cggcgtcggc gccaagtgtt120tcggcacatg tgtgggaaga agtcagccgc acgtggggaa cgcttcccgt cgatgcccgc180cacgacggcg tgtggcacaa catccccggt ttgtcaggct ttgcgctcga cacggcggcg240agcgagcgcg agaccgcgcg gcgccatgac ggcgcgctcc acctggtatg gcgaaccctt300ccgccgaagc gaagactcgg agacctttcg cccgacgtga tttaccgcgg ccccgcgcag360
gagaagtcgg tggcgctgat ggtgaatgtg tcctggggcg atgcgtacgt gcccaggatg420cttgaggtgc tgcgcagcgc gcacgtgaag gccacgtttt tcgtggacgg cgcgtttgcg480aagaagttcc ccgatctcgt ccgcgcgatg gcgcgagacg ggcacgcggt cgagtcccac540ggctttggac acccagactt tcgccggctg agcgacgcga agctcgccgc ccagcttgac600gagacgaatc gagtgctcgc cggcatcacg ggcaaggttc cacggctcat cgcgcctccg660gccggatcgt atgatgcgcg cctggctccg ctggcgcatt cgcggcgcat gtacgccatc720ctgtggaccg cggataccgt ggactggaaa aacccgcctg cggatgtcat cgtccaacgc780gttcagcgcg gtgcggaacc cggcgcgttg atcctgatgc atcccacggc gcccacggcg840gaggccctgc ctgatgtgat ccgctggctc gaggggcacg gttatcggct gaaaacggtg900gaggacgtga tcgacgaacg cccagcggtc acccctccga cgacgctggc gaacgagacg960ttccacagcg cg97221015211642212DNA213脂環酸芽孢桿菌屬220
221misc_feature222(1)..(642)223CDS220
221misc_feature222(1)..(87)223sig_peptide220
221misc_feature222(88)..(642)223mat_peptide
40015atgatgcgtt ggaattggaa ggttgctgtg ggatcgttgg cgttggccgc actgggcgca 60ggggcggcgg tgtcgccggt gtttgcggcg gcgaagtcgt cgaaggccgc gcagtcccac120gcagaggcga gcgcggcagt cgtgatggct gggaagctgt acggcaacat tccgaacgtc180accattcgcg gcgtggaagc tgggaaggcg ccgtgggtcg tggacggatc gtaccagctg240aagagcaacc tgttcacggc gagtgggaag tggctcatca ttccgaagca gggctatatg300gagaacggtc agccggttcc ggccaaaatt ggcggcacga cgaacaacat tccggccgtc360ggggccgaaa tcacgtttgc aaacgcggcg cccattgtgt tgccgccggt caagctgtcg420agccaaggtg acttctcgtt ccacgacgcc atccagtggc cgaagggtgc cgcgcagccg480gtcatcctga ttgggcccga gaagaacggt cagctcgtcg cgtggtttgc ggcgtcggac540ttcctcgccg actacggcca ggcgacgggc atgggcggcg gatgggtgaa cgcggcgcat600ccagagactc ccgtgcggca cacccacctc gcttcgaaga ag 64221016211771212DNA213脂環酸芽孢桿菌屬220
221misc_feature222(1)..(771)223CDS220
221misc_feature222(1)..(63)223sig_peptide220
221misc_feature222(64)..(771)
223mat_peptide40016atgaactggg cgcgtgtcgg cgcgtgggta tccacctggc tggtggctac ggcgcttgga 60gctggctgtg ggacggcttc gcaagagcat ccgtccaaca cctccacgtc agatcaccgc120gttgcgcccg cggcgccagg cggctccgcc tcgatgcaaa accggcatat tctgcaggag180ccgctgccgc gtggcgtgaa aacggaaacg gatttgtaca actggctttt atggcagaga240ctcgccgaga tcaacaatcc ggcgcagggt gaaatctgcc tggacgccgc atgcaagatt300gcggccaccg tcttttctgg cccggccaag gccgcggccg gcacgcctgt cactctggtg360gcgttttcgc cgcgggcggg ttggcaggtg ctcgtgggtc cgctgcccca gtcggacaac420cctccgcgtc aagcacaatc catcacaggc cagtctgcgc gactacccgc gcaaagaggg480cgtatgcgtc gttcaaaccc acgaaatcga ctggtactgg attcaggacg gacacctgca540gctgatgcgt cagccgcgcg catgacgcgt cagctaaggc gatccgccag ctcgacgaac600gcgtcgagat cgcgcagggc aaagtcgatg gcgcgctgcc aaaagtcagg ttgcgtgaga660tccgcaccga tgtgtttttg ggccagatcc tcgacccgca tgcgaccggt gtcgcgaagc720aacgccacat acttgtccgc aaatcccgtg ccttccgctg aggccatggc a 771210172113390212DNA213脂環酸芽孢桿菌屬220
221misc_feature222(1)..(3390)223CDS220
221misc_feature222(1)..(72)
223sig_peptide220
221misc_feature222(73)..(3390)223mat_peptide40017ttgaaacgca cactgagtgg cattgcttca gctgcaattg ttctgggtgc gattagcccg 60atggcgtttg cgcagacctc gtccagcggt ctcacgccgg ccggtcagtt gcctatcgtc 120gtcaatggac aggttctgtc gaacccgtat gagatggtgg gcatggactc cggcaacaag 180acgggcttct tcccgattta ctactttgac caggcgcttg aaaagattgg catcacggcg 240acctggaatg gtgcaaccca cacctgggcg ctgacggact ccaacgtcaa tgcttcgaac 300gtccaagtcg cgggtggtat gggcacgggg aacaccacgg tgaccctgaa cggcacgccg 360attaagatgt tctacaccca ggttgcgaag gacccggcgg gtggcccggt cacgacgtat 420atgccgattt actatatcaa caacatcctg agtgcgcttg ggatccatgg aacctttagc 480ggacagacgg gtctcaacat taccaccggg cagacgcttg ccggtagcct gagtgccatc 540acggtgacgg gggcgacgag cggtacgggg acctcttcga gcccggctgt ggcgttgaat 600aacggcaagg ttacgctctc gacgactctg acggattcga atggcaatcc gattggcaac 660gcggcggtca ccttcaactt ctctgaatat ggtgcgctgc cttcgaatgc gccgacggtc 720accaatgcgt cgggtgcgac aattccggcg accaccggct cgacggctta tcagtacacg 780gtctacacca actccagcgg tgtggcttcg atcacggtgt ctgggcccgt tggcttgacc 840tacgcatacc aggtgactgc gacggcgccg atcagcaatg gcagcaatca aatgattagc 900agccagccgg cgtatgtcga gtttgtcgcc aacaaccagg cgggtattgc gccgtacggc 960acggcttctc aaccgtactc ggcttcgctg ggtaccgcag ttcccatcac ggtgattttg1020ccgccgggtg cgaacggtca gccgcaggcg aatgtgctcg tgaccctgtc gctgagcaac1080
ccgaatggtg gcaccaacta tgcatacttc accaactcgt cgggtgcgaa tctgggcacg1140caaatccagg tgacgaccaa ctcgtcgggt gtggcgcaag cgtgggtcag cgacgcgaac1200gcgcagcctg ttgtcgtgac ggccaatgtg tcgaatgcga ccaatgtcag caacacttcg1260gtgagcacct acctgaactt tggtcaggca ggcgtgccag catcgatcgc caattacaac1320gatccgtatt cggctttggt ggccaacggt cagcagccgc tcgccggtac gacggtgacg1380attacgggta cgctcgtaga cgctgcaggc aacccggtgg ccaacggtca ggtgcttgta1440accggctcgt cgtccagcgg cgacttcggc tatgtcacga cgtccaacgg caagagcacg1500acgaccgact tcccgagcgt gggtacgttg cagcctggtc agcctgtgag ctccgcgctg1560ggtgacgtca tcacggcgga tgcgaacggc aacttctcgt tgcaagtcac agacacgcag1620aacgagcaag ccagcctgac gttctactcg gtgagcaacg gggtcattag cccggtgggg1680gtcattaaga ccgacacgct gaaattcgca gtgaacaatc agctgtcgac cattgcgctg1740ggtgcgacgg acgctcaagc ggacggcaac cagtacacga atctgacggg tctcacgggt1800tcggacaatg cgccggtgcc ggtgtatgtg gatccgcaga atccgtcggg cacaatggtg1860accaatcaga gcatcaccta tacgctcagc gtcagcagcg gcgacatcgt gggcattggc1920tctggtgcgt atctggcgcc gaccaatgcg aacaacagca cgattccgat caacagcggc1980aacggcctca gctccgtcca ggtcacggtc acggcattgg gcaacaacca ataccagatc2040tcggtgcccg gtcagcaagg cgtgttgacg acctcgtcgc ctgactttac ggtgctggtg2100aaaggctcga cgggttcgac gaagctgacg gtcagctccg gctcactctc gtcgacggca2160accatcacct tcacgtcgag caacccgacg gtggtggcta gcctgacgcc agtttcctcg2220gtgttggcgg ctggtcagaa cgagacggtc accttcaccg tggaagatgc agatggcaat2280ccggtgagcg gtaatacgca ggttgccatc acggcgcatg acagcaatga tccgttgtgg2340atcaccgcag tgaatggcac aaacttgagc gagtatgaga cgattaatgg tgctgcaacg2400
tctgtcagca cgccgattcc gctcggtacg agttcgtatg caacctctgg tggttctacg2460ctctacccgg cttacacgaa cagcgggtac tttaagaatg gtgtgagcat cagcggtgtc2520gtatcgtggg atggtacggt gggcgatcca atctacgtca ccaccaactc gcaaggccaa2580gtcacgctga ccttgcaaaa cggcaacgtg acctattttg acggaaacaa caccacgttg2640tcgaatggca tcagcgttgc cggtacgagc ggaagtgaag ggttctacac atattcgagc2700gataccgcag cgacagcgtc ggatcttaca aatatgggcg tgttggtcat tggtcaagcc2760aatggtgacg cttcaacgtc gctcggaacg atttacatcg gcagtggtgg tgctacgcag2820acaccggccg ccttcaccta cgtggatgcc aataaccact cttacacgta ctcgaacacg2880agcgatacat ttacggtatc tagcacccag agtgttagcg gtggcaacta tgcgatcaca2940agcttcacgc cagttggagg tactgcaact tctacaatcc cgagtggcgt gagcgtaaat3000agctcgacgg gtacggtttc ggtgtcccaa aacgctgcag tcggtacgta caccgtgagc3060tattacctga acggcgtcac tgaatccact ggcacgttca aggtgtactc cggcagcggt3120gtggctccta cagagatcac tggctcgtca gtgacggttc ctgctgcaac gtactcgggt3180acgttgaaag tcacggtaag caacggtggt tcgccgctgt acgtgaacgt taccgctgga3240gaatcggcca atgcggtggc tgcagctatt tacaacgcgc ttgtcaatgc caatatcagc3300ggagatacct tctctgtttc gggttcgaca gtcagcgtga ccgctgcgag cggttcgccc3360acgctcacag ttgtcgatgc gaccaatttc 339021018211744212DNA213脂環酸芽孢桿菌屬220
221misc_feature222(1)..(744)
223CDS220
221misc_feature222(1)..(123)223sig_peptide220
221misc_feature222(124)..(744)223mat_peptide40018gtgcgaatta tgaaagtttt gggatggatt ttggtaccgt atatcatgct gtttattcag 60tgggggcgaa tgaacagaat tctgcgtttt gccggttcat tgtgggcatt aattgtcttc120gcgaacacgg tgtatatgat tcgaggaaac acaccgcgga acgcatcaac ggtaagcgct180acaacttctt tggttaattc gacgaatagt tcacaggtag caaagcaaga gcaaaactcg240agtacgtctc ccgctcataa gtctacgaac tcattgcaac atgcgcaaca tcaagctgct300acgacttcat cttctcagtc gaagttacga tatatcccgt ttcacacata cgggaaggta360ggagacttgg aaattagagt taactccctg cagcaagtta agagtgtggg gtacgacggg420ataggtgaaa ccgcaaatgg tgcgttttgg gttatcaaca tcaccataag aaatgacgga480tccactccta tggaggtcgt tgatggcata ttccatttgc agaacttaaa cgggaacgtt540tatcagccgg attctactgc tgagatatat gcaaatacaa attcagggac tattccgacc600gacctcaacc ctggtgtgtc catgacgaca aatctcgtat ttgatatgcc ggattttatg660acatatggtc acgtcgggca gcattactca cttgtcgctt ccatgggttt cttcgggtca720gatgaaacga cgtatgctct tccg 74421019211516212DNA213脂環酸芽孢桿菌屬
220
221misc_feature222(1)..(516)223CDS220
221misc_feature222(1)..(75)223sig_peptide220
221misc_feature222(76)..(516)223mat_peptide40019atgaaccgca aatccatgtt gtctgtgttg ggtgtggcag ccgcagtagc cctgatggtg 60acgggctgtg gcacggccaa cagcacgaac aacacggcgt cgagcggtgc ggccagcaca120gccgtcacgg tgaagcacga gcacaagggg gccaatgctt cgaagacaga gacgaagcag180accgaagcga agtcgtcgaa caaggctgga gaaacggcga agtcgtcggt gaagctcacg240gccccggtgg caggcgcgac ggtgacggcc ggcggcacgc tgaaggtgag cggccaagtg300tcgtcgaacc tcgcgaagaa ggacgtgcaa attacgttga caaatagcgc gaagaaggtg360ctcgtgcagc agatcgtcgg tacgaatagc accggcgcat tcgtggacac gctcaagctt420ccaaagtacc ttgggaaagc cggaagcgac ctgacgctgt cggtgtccgt cgttggcgaa480aatggagtcg taagcacctt gtcgctgcac gtgaag 51621020211726212DNA213脂環酸芽孢桿菌屬220
221misc_feature222(1)..(726)223CDS220
221misc_feature222(1)..(90)223sig_peptide220
221misc_feature222(91)..(726)223mat_peptide40020atgaggcgcg cggttcgtat actagctgcg ctactgtttg ggctggcgac ggtaacagcc 60acattgatgt tcgtgcctca ggcaagagcg gccacggtga caggagcgtt ggcgcaatcg120caagtggtgt ccattacggg cggctacaac acgacgacac agatgtatga gcagacgggt180cagcaaaccg tcgttacgaa ttggaccttt tctcttcaac aaactgtcaa ccaaaacaac240gagaatccgt cctacgctca atgcacagtc ttggcgggaa accagcaggt aacgtgcacg300tcggacgcta cgaataacgg tgcaatttgc acatccccct atcctggagc tattgacaag360caatgcacga acctgattgg gttcactgga aacatatcag tgagttcgca aaacggcaat420ccaacgttca ctttttctct tccgagcatc gacccgagta ccatgaagcc agttgggatc480tttgtgacgc ctgagacgat ctatggtcag atgggaacag ggtccgaaag ttatttaagc540tcaggtcaat ctggaggatg gtcatttaac ttttccaacg tctcagatcc tcaagattgg600tattttctcc ttgagttttt ggcgaatcca attgtcgcgg ccattgctgt gcccaccact660caaacggttc cgatttatag ctgggtcacc accacggttt ggcaccccgt tcaaatttcc720tacagc 72621021211540
212DNA213脂環酸芽孢桿菌屬220
221misc_feature222(1)..(540)223CDS220
221misc_feature222(1)..(72)223sig_peptide220
221misc_feature222(73)..(540)223mat_peptide40021gtggttcgga tgcgcaagcg gttgggactt gttctgagta tggtgacatc tgtgttggtt 60ggatgtggcg cttcacatcc gtctccattg aaccaagaca aatctttgtt gacgtggaac120gctgctaaac acgaggtgcg gtggaaagtg gtcgccggcg acggacgcgc aaacggcggt180atgaacttcg atggctatgc caatggcagt atgacactgg tcgtgccgat tgggtggcgc240gtcgtgatcg actttgacaa tgccagtttg atgccgcaca gcgcgatggt ggtgccttac300ggagatcgcg aacgctccaa cttcgacgca acgatggttg cgtttccagg cgcagaaacg360cccaatccgt cacagggaga ccctcaaggg acgcatcggg atgtcatctt cactgctgcg420aaggtgggaa cgtatgccct cgtctgcggg gtcccgggtc acgcgctggc gggaatgtgg480gatcagcttg tggtgtccga tgaagcgaaa cacccgtccc ttcgcgtgca acgcgactca540210222111431212DNA213脂環酸芽孢桿菌屬
220
221misc_feature222(1)..(1431)223CDS220
221misc_feature222(1)..(75)223sig_peptide220
221misc_feature222(76)..(1431)223mat_peptide40022atggcggttc gtagagcgtg gcttctggcg cccttgtgcg cgagcagtct ggtcgtcccg 60gcctcggtgc aggccggatt ggcccaggga catggcagct tttcgacggt tcgcgtgtcc120gtggggacgt cgagttccct gtccgtcccc gcgctgattc agggaaacga aacgtacatt180ccgctgtggg acctcatgca ggtgctccat cagctcggct tcaccgcgac gtgggcgaag240ggccaattca gcgtttcggc cccgccatcg gtgccgatgg acgaggcgcc tgggccagcg300ggcaaaggcg gggcgctcgt ggtgctcgac gggcaagtcg tggaacaggt gccgacggtc360atcgccacgc caccgggggc ggccacccct gaggtgtttc tgccgctcac gaacgcggag420gagatcctcg gtcggttggg cattcaggcc agcgcgaccg gcaatcaggt gaacctcgac480gcgtcggctg tgccccaggc gcttcccaac cagcaggtgg ctgtgtggaa cgtgcttgcc540gctgttgcgt ccgatctcgg cgtgtcgacc gcgccagccg ggccgagtcc ctacgccgac600ttgccgacag cctcgccggc gtggggcgcg gtggaggcgg ccattcgtct gggctggtat660tcgcccttat ccgcgtcgtc atccggcgcg tttcaaccca tcacgtgggc gcaaacggca720tccattctgt ggaatgcgct cggcatttca cagcaggacg cggcgtacca gccaggcgga780tcgccgacgg cgtgggcgag cgcccttggc cttgttccag aaaactggga tccagcgtcg840
tacatgaccg cgcaggaatt ggacaccttg gcgtcgaatt tgcacgaatg tctgcaagga 900gatgtcgaaa cgggcgccaa cacgtggcgg ctctggtatc cgccggctga cgaagtggag 960gctaccctcc agtcgggagg cgggcagtcg ctgttcacct cgaccgctga cgcgcaggcc1020gccatctcgt cagcctacca attcttcaat cagcttgtgg tcacaagagt cggccaaggg1080tatgtcgtca ccgttccctc tgtgcctgag ggatatgggt ttgccacctt ttctgcgctc1140ggcggtgtgg cttaccagac gacacccggc ggtccgtgga cggtcgtgcc cgtgctggac1200acgcgcgacg tctccatccc ggccaagggc cgtctcagtg tcaaggttcc cgcgcagggc1260atcaccatca cgtggaatca gatgatgcca tcgctgggcg gaacggtggc catgggcgcg1320ctccaggtgt cgcctggacc cagcgggcct tcggtcgagc gcttgaatat cgtcacaccg1380aacttacctc cggtccttcc gtcgtccgtc acttctacgc aaccgcagtc a 1431210232111020212DNA213脂環酸芽孢桿菌屬220
221misc_feature222(1)..(1020)223CDS220
221misc_feature222(1)..(57)223sig_peptide220
221misc_feature222(58)..(1020)223mat_peptide40023
gtgaatcgac agtggaggct agcggtggcg acttctgccg tcgcggccag cctcgcgggg 60tgtggagcac cggacctcgc ggcgatgcgg ccgacggtcc aaaagtctgc ggtactcgtg 120gaggtcgtgg gcgcgccgcc gtttgcgccc tcagcttcac aactgggaac ggcaggggcc 180acctccgtcg aggtggttca cgttgccctt ggcgaatggc agtctgtcgc ggcccacgca 240ttggcgaagg ggcaattgac aggggtcatg gtcgtgtgcg acgacgcgaa cgccgtcgcg 300tctggcctca accaacttgc tgccgaccat cccgacgttc gctttctcgt ggtcagcaac 360tggccggctt cgcaaatcac ctccggaaac gtggaagacg tcgcacagga tcctgtggcc 420gtcgcttaca gcattggcgc gctgtgcgga gactggatcg cgagctcaac gtcgacgagc 480ggagcggtat acagcggcgt gcccagcatc gtctacgcgc cgcgcggtgc gaccgtggct 540gaacaaaaag ccttcttcac gggtctgtat caggcgaacc ccaatgtccg ggtcgtcgcg 600cttccgcagc ccgctgcgca gagcctgtcg agctatgggt acgcggtgga tttgggtgtg 660gtaggcgggt ctcctgcggc aggggaactg tcggcgcttc gcagtgccgc ccccgcctgg 720gctgcttttg gaacgtcgcc gatcgctggc tttgcgattt ctcctggcca tctgtcgtcg 780tcggaggccg tgcaagcatt ccaggcgctc gtgtcgccgg acgcgtggca ctcgggtgag 840catctcgtgc tcgacttgtc ttcggtggcc ttcgacgaca agcaggtgcc cgcgaccgtc 900atcgcggcgt gggccaagct ggaggtcaac gcgatcgcgg ctgcagcgca atcgaacgcg 960gccttcgcgt cactgccgcc gagcgtgcgc tcggacctcg ccaatgcgtt tcatttgtca1020210242111023212DNA213脂環酸芽孢桿菌屬220
221misc_feature222(1)..(1023)
223CDS220
221misc_feature222(1)..(87)223sig_peptide220
221misc_feature222(88)..(1023)223mat_peptide40024atggtcatgc gcactcggtg gattcgatgg atggctttgg ctctcgcagt ctgtgtctgg 60ctcagcccgt ttcccttctc gtggggcgcg acgagcctcg acgctgatct tccacaaccc120acgattccgc catccgcgtg gagcaacctc aatcaggact ggaaggacct tcagcgcttg180gcgcaaaaca cagtgccgcc ctcgaaagag agcagccaga cccacgcgcc cacacacaag240tcatcgcaac cgcctgccca agtcccgcaa gggccgctcg tcggggtcgg cgatacgggc300gaagcggccc ggtggttaaa cgaagccttg gccgtgctcg gctatttgcc cgccgtcttc360tctcccgcgg cgcagacgtc cacccgtcag gtgcggctcg cactcgcggc gagcgccgag420catcagacgc tcgtgcccat cccaggctcg tttcaacttc tgtatcacgc gccaagctcg480tgggtggcgc tctggtccgc cgacgaagac acgccgatca cggagggcgc cgtcatggcg540tttgaagcac aacatcacct gggcgtggat ggcattgccg ggccggacgt cattcatgcg600ctggcgcagg ccctcgccgg caatgagacg gcagaaaagg cgccctacag ctacatcctg660gtgaccacgt cgttgcccga gacgctcgaa ctctgggtga atggccagct tgtcctcaaa720tcgctgtgca acacaggcat cgcgcagtca cccacgccgt atggcacgta cggcgtctac780gtgcagtaca cgtcgcagga aatgaagggc aaggatccgg acggcacgcc ctacgacgat840cccggcgttc catgggtgag ctacttctac aaaggttgcg cggtccacgg tttcctgcgg900gcaaagtacg gctttcccca gagcctcggt tgcgtggaac tgccgtatgc cgcggccaaa960
acggtgttct cctatacgca catcggcacg cttgtcaccg tcaccgcctc cccgctttcc1020gcg 1023210252111197212DNA213脂環酸芽孢桿菌屬220
221misc_feature222(1)..(1197)223CDS220
221misc_feature222(1)..(84)223sig_peptide220
221misc_feature222(85)..(1197)223mat_peptide40025atggataggc tgctgaacaa caaggtggcg cttcgcctga ccgcgctcgt cctcgcgtgc 60attctctggc tcgccgtgca cgcggagcag gggtcggggt cctccgcgtc cacgggagtg120accgagtcgt tcgagctgcc ggtgcgggtg gaaacctcgg ccgacgaggt gttggtgtct180caagttccga ccatcaccgc ccgggtgacg acgaacctgt tgagcctgcc gacgctggcc240tcggatatga tgaaagccga gatcgtcgcg gacgccgaaa atctgggccc gggcacgtac300acgttgcacg tggcggccgt caacatgcct gcaggggtgc gatcgtacac gctaacgcct360tccaccatca cggtgacgtt ggagcccaaa gtgacggtgg agcgaacggt gcgggtgaac420gtggtcggca cgccagggca gggatatgtc ctcggcaagc ccgagctcgg cgcgggggtc480
gtcgaggtct cgggcgccga atccagtgtg caggccgtgg ccgaggtggc gggcgtcgtg 540gacgcgagcg gcctgtcgca gacggcgacc aagctcgtcg agttgttgcc gcttgaccaa 600gcgggcaagg cggtgccggg tgtgacggtc acgccatccg cgatttcggt cacgctgccg 660atcacgtccg ccaatcaggc ggtgaagctg acgcctgcgg tcaccggcag ccctgcgcct 720ggatacgccg tcgcctcggt gcacctggag cccgcgagcg ctgtggaaca ggggctagcg 780gccagccagc ttccgcagcg cgggctcctc gtgcccatcg acgtcactgg attgaaccgg 840cccacgacgg tgtcggtccc ggtgccgctt ttgccgggga tgacgagcgt ttcgcccacg 900gcagtgacgg ccgtgatcga cgtggagccg tccgccgtct acaccgtttc gaacgtcccg 960gtggccatca cgggcgcgac gggtgtcaag ctggtgacgc ctcggaccgt gaatgtcacg1020gtgacgggga tcgaggccga cgtgcgcgcg gtggagaggg atccggccgc ggtgcaggcg1080tttgtggacg cgaccgggtt gacacatggc tcggcgacgc tgcccgattc aaattcgtct1140gctgtcctgt ctcttgtgat ccggccacgg gaaaggcgta agcgaacaca tgtagtg 119721026211959212PRT213脂環酸芽孢桿菌屬220
221SIGNAL222(1)..(24)220
221mat_peptide222(25)..(959)223酸性內切葡聚糖酶或酸性纖維素酶40026Met Lys Thr Arg Trp Ser Gly Ala Leu Ala Val Leu Ile Ala Leu Gly-20 -15 -10
Thr Gly Ala Ser Pro Ala Trp Ala Ser Val His Ser Ala Ala Thr His-5 -1 1 5Ala Lys Ala His Val Gly Val Arg Ala Ala Asp Met Ala Ala Ala Ser10 15 20Met Ser Ala Glu Ile Gln Ile Leu His Asp Ala Leu Thr Ala Ser Glu25 30 35 40Leu Ser Ser Val Gln Ala Ala Ala Gln Ala Ala Ala Asn Leu Pro Ala45 50 55Ser Thr Trp Val Ser Trp Leu Tyr Pro Ser Ala Ser Ser Pro Ser Ala60 65 70Ala Gln Thr Gln Thr Ala Gln Ala Leu Gly Ala Leu Leu Thr Leu Val75 80 85Thr Tyr Gly Ala Val Ala Asp Asp Gly Gln Asn Ile Ala Gln Asn Leu90 95 100Gln Thr Leu Gln Ser Thr Ser Pro Leu Leu Ser Pro Ala Ala Val Ser105 110 115 120Met Phe Tyr Gln Asn Phe Phe Val Leu Val Gly Gln Ser Ser Lys Ser125 130 135Val Leu Ser Gly Gln Ala Thr Thr Ser Thr Ala Gly His Ala Leu Ala140 145 150Gln Ala Ala Ala Leu Thr Pro Gln Leu Ala Ala Tyr Leu Arg Gln Ser155 160 165
Gly Leu Ser Pro Asp Asp Leu Ala Arg Ala Tyr Val Ser Phe Ala Ser170 175 180Ala Val Asp Ser Gln Gly Ala Ala Gln Thr Ala Leu Leu Thr Arg Ile185 190 195 200Cys Thr Asn Ile Leu Gly Phe Gly Ala Pro Thr Ser Thr Ala Thr Ile205 210 215Thr Val Asn Ala Ala Ala Asn Leu Gly Gln Val Pro Thr Thr Ala Phe220 225 230Gly Leu Asn Ala Ala Val Trp Asp Ser Gly Leu Asn Ser Gln Thr Val235 240 245Ile Ser Glu Val Gln Ala Leu His Pro Ala Leu Ile Arg Trp Pro Gly250 255 260Gly Ser Ile Ser Asp Val Tyr Asn Trp Glu Thr Asn Thr Arg Asn Asp265 270 275 280Gly Gly Tyr Val Asn Pro Asp Asp Thr Phe Asp His Phe Met Gln Phe285 290 295Val Asn Ala Val Gly Ser Thr Pro Ile Ile Thr Val Asn Tyr Gly Thr300 305 310Gly Thr Pro Gln Leu Ala Ala Asp Trp Val Lys Tyr Ala Asp Val Thr315 320 325His His Asp Asn Val Met Tyr Trp Glu Ile Gly Asn Glu Ile Tyr Gly330 335 340
Asn Gly Tyr Tyr Asn Gly Asn Gly Trp Glu Ala Asp Asp His Ala Val345 350 355 360Ala Gly Gln Pro Gln Lys Gly Asn Pro Gly Leu Ser Pro Gln Ala Tyr365 370 375Ala Gln Asn Ala Leu Gln Phe Ile Lys Ala Met Arg Ala Glu Asp Pro380 385 390Ser Ile Lys Ile Gly Ala Val Leu Thr Met Pro Tyr Asn Trp Pro Trp395 400 405Gly Ala Thr Val Asn Gly Asn Asp Asp Trp Asn Thr Val Val Leu Lys410 415 420Ala Leu Gly Pro Tyr Ile Asp Phe Val Asp Val His Trp Tyr Pro Glu425 430 435 440Thr Pro Gly Gln Glu Thr Asp Ala Gly Leu Leu Ala Asp Thr Asp Gln445 450 455Ile Pro Ala Met Val Ala Glu Leu Lys Arg Glu Val Asn Thr Tyr Ala460 465 470Gly Ser Asn Ala Lys Asn Ile Gln Ile Phe Val Thr Glu Thr Asn Ser475 480 485Val Ser Tyr Asn Pro Gly Glu Gln Ser Thr Asn Leu Pro Glu Ala Leu490 495 500Phe Leu Ala Asp Asp Leu Thr Gly Phe Ile Gln Ala Gly Ala Ala Asn505 510 515 520
Val Asp Trp Trp Asp Leu Phe Asn Gly Ala Glu Asp Asn Tyr Thr Ser525 530 535Pro Ser Leu Tyr Gly Gln Asn Leu Phe Gly Asp Tyr Gly Leu Leu Ser540 545 550Ser Gly Gln Thr Thr Gln Asn Gly Trp Gln Glu Pro Pro Ala Asn Thr555 560 565Pro Leu Pro Pro Tyr Asn Gly Phe Gln Leu Val Ser Asp Phe Ala Gln570 575 580Pro Gly Asp Thr Met Leu Gly Ser Thr Thr Ser Gln Ser Ala Ile Asp585 590 595 600Val His Ala Val Arg Lys Pro Asn Gly Asp Ile Ser Leu Met Leu Val605 610 615Asn Arg Ser Pro Ser Ala Ile Tyr Ser Ala Asn Leu Asn Val Leu Gly620 625 630Phe Gly Pro Phe Val Val Thr His Ala Leu Ala Tyr Gly Glu Gly Ser635 640 645Ser Arg Val Ala Pro Met Pro Val Leu Pro Val Pro Gly Ala Pro Ile650 655 660Lys Leu Met Pro Tyr Ser Gly Ile Asp Leu Thr Leu His Pro Leu Ile665 670 675 680Pro Ala Pro His Ala Ala Ala Gln Val Thr Asp Thr Leu Thr Leu Ser685 690 695
Ser Pro Thr Val Thr Ala Gly Gly Ala Glu Thr Leu Ser Ala Ser Phe700 705 710Gln Ala Asp Arg Pro Val His His Ala Thr Val Glu Leu Glu Leu Tyr715 720 725Asp Ser Thr Asn Asp Leu Val Ala Thr His Thr Val Ser Asp Val Asp730 735 740Leu Gln Pro Gly Ser Ala Thr Ser Glu Thr Trp Ser Phe Thr Ala Pro745 750 755 760Ala Ala Asn Gly Asn Tyr Arg Val Glu Ala Phe Val Phe Asp Pro Val765 770 775Thr Gly Ala Thr Tyr Asp Ala Asp Thr Gln Gly Ala Val Leu Thr Val780 785 790Asn Gln Pro Pro Gln Ala Thr Tyr Gly Asp Ile Val Thr Lys Asp Thr795 800 805Val Ile Thr Val Asn Gly Thr Thr Tyr Asp Val Pro Ala Pro Asp Ala810 815 820Gly Gly His Tyr Pro Ser Gly Thr Asn Ile Ser Val Ala Pro Gly Asp825 830 835 840Thr Val Thr Val Gln Thr Thr Phe Val Asn Val Ser Ser Thr Asp Ala845 850 855Leu Gln Asn Gly Leu Ile Asp Met Glu Val Asp Gly Ser Asn Gly Ala860 865 870
Ile Leu Gln Lys Tyr Trp Pro Ser Thr Thr Leu Leu Pro Gly Gln Ser875 880 885Glu Thr Val Thr Ala Thr Trp Gln Val Pro Ala Asn Val Ala Ala Gly890 895 900Thr Tyr Pro Leu Asn Phe Gln Ala Phe Asn Thr Ser Ser Trp Thr Gly905 910 915 920Asn Cys Tyr Phe Thr Asn Gly Gly Val Val Asn Phe Val Ile Ser925 930 93521027211272212PRT213脂環酸芽孢桿菌屬220
221SIGNAL222(1)..(32)220
221mat_peptide222(33)..(272)223天冬氨醯蛋白酶40027Met Asn Gly Thr Ser Val Trp Lys Ala Ser Gly Ile Ala Ala Ala Ser-30 -25 -20Cys Leu Thr Ala Ala Ala Leu Leu Ala Trp Pro His Ala Thr Ser Thr-15 -10 -5 -1Leu Asp Ala Ser Pro Ala Ile Phe His Ala Pro Arg His Ala Leu Ser
1 5 10 15Pro Asn Thr Ser Pro Lys Pro Asn Ser Val Gln Ala Gln Asn Phe Gly20 25 30Trp Ser Ala Ser Asn Trp Ser Gly Tyr Ala Val Thr Gly Ser Thr Tyr35 40 45Asn Asp Ile Thr Gly Ser Trp Ile Val Pro Ala Val Ser Pro Ser Lys50 55 60Arg Ser Thr Tyr Ser Ser Ser Trp Ile Gly Ile Asp Gly Phe Asn Asn65 70 75 80Ser Asp Leu Ile Gln Thr Gly Thr Glu Gln Asp Tyr Val Asn Gly His85 90 95Ala Gln Tyr Asp Ala Trp Trp Glu Ile Leu Pro Ala Pro Glu Thr Val100 105 110Ile Ser Asn Met Thr Ile Ala Pro Gly Asp Arg Met Ser Ala His Ile115 120 125His Asn Asn Gly Asn Gly Thr Trp Thr Ile Thr Leu Thr Asp Val Thr130 135 140Arg Asn Glu Thr Phe Ser Thr Thr Gln Ser Tyr Ser Gly Pro Gly Ser145 150 155 160Ser Ala Glu Trp Ile Gln Glu Ala Pro Glu Ile Gly Gly Arg Ile Ala165 170 175Thr Leu Ala Asn Tyr Gly Glu Thr Thr Phe Asp Pro Gly Thr Val Asn
180 185 190Gly Gly Asn Pro Gly Phe Thr Leu Ser Asp Ala Gly Tyr Met Val Gln195 200 205Asn Asn Ala Val Val Ser Val Pro Ser Ala Pro Asp Ser Asp Thr Asp210 215 220Gly Phe Asn Val Ala Tyr Gly Ser Asn Gln Pro Ser Pro Pro Ala Ser225 230 235 24021028211315212PRT213脂環酸芽孢桿菌屬220
221SIGNAL222(1)..(25)220
221mat_peptide222(26)..(315)223多銅氧化酶40028Met Arg Arg Arg Met Ser Gly Phe Ala Thr Gly Leu Gly Ile Ala Ala-25 -20 -15 -10Gly Leu Ala Leu Ser Ser Ala Leu Ala Ala Pro Phe Phe His Ala Gly-5 -1 1 5Asn Ala Ser Ala Ala Ser Thr Met Ser Met Ala Pro Thr Ser Thr Met10 15 20Gly Ala Leu Pro Ala Pro Glu Gly Val Pro Asp Ala Gly Pro Leu Ser
25 30 35Ile Thr Pro Glu Val Ile Arg Gln Gln Gln Ala Asp Ala Val Arg Val40 45 50 55Met Asp Glu Glu Gly Leu Lys Pro Gln Ile Leu Ser Gly Asp Ile Lys60 65 70Arg Phe Thr Leu Thr Ala Ser Gln Val Asn Trp Tyr Leu Tyr Pro Gly75 80 85Lys Ala Val Val Ala Cys Gly Tyr Asn Gly Gln Val Pro Gly Pro Val90 95 100Leu Arg Val Arg Val Gly Asp Arg Val Gln Ile Leu Leu Arg Asn Glu105 110 115Leu Asn Glu Pro Thr Thr Leu His Ile Gln Gly Leu Asp Leu Pro Ala120 125 130 135Ser Gln Leu Gly Ile Gly Asp Val Thr Glu Ser Pro Ile Pro Pro Gly140 145 150Gly Glu Arg Leu Tyr Ser Phe Thr Val Thr Pro Gln Met Val Gly Thr155 160 165His Leu Tyr Glu Ser Gly Thr Asp Met Ala Ser Glu Ile Asp Pro Arg170 175 180Thr Ala Arg Gly Ala Ala Arg Arg Ser Gly Pro Gly Ile Pro Leu Ser185 190 195Pro Gly Glu Gly Gly Arg Ala Leu Arg Asp Arg Arg Val Asp Gly Gly
200 205 210 215Arg Ile Asp His Arg Lys Arg Val Trp Pro Gly Arg Gln Ala Val Ser220 225 230Arg Arg Ala Arg Thr Asp Gly Ala Val Arg Gln Pro Arg Gly Ala Ala235 240 245His Arg Gln Arg Glu Arg Asp Val Leu Pro Arg His Ala Pro Ala Arg250 255 260Asp Asp Val Leu Ala Ala Gly Gly Arg Arg Ala Pro Pro Arg Gln Ala265 270 275Ala Ala Asp Glu Arg Ala Arg His Arg Ala Arg280 285 29021029211626212PRT213脂環酸芽孢桿菌屬220
221SIGNAL222(1)..(32)220
221PROPEP222(33)..(189)220
221mat_peptide222(190)..(626)223絲氨酸羧基蛋白酶40029Met Gly Leu Trp Lys Arg Leu Ala Leu Gly Val Pro Ala Ala Leu
-185 -180 -175Ser Met Leu Ala Val Gly Val Pro Val Met Ser Ala Asp Thr Val-170 -165 -160Glu Ala Ala Pro Leu Ala Asn Pro Ser Thr Glu Asn Ala Gln Asp-155 -150 -145Met Gly Pro Ala Ser Gly Ser Gln Thr Val Thr Ala Ser Ile Ile-140 -135 -130Leu Arg Val Gln Asn Pro Thr Ala Leu Gln Asn Tyr Ile Gln Glu-125 -120 -115Thr Glu Thr Pro Gly Ser Pro Leu Tyr His Lys Phe Leu Thr Thr-110 -105 -100Ala Gln Phe Ala Gln Gln Tyr Ala Pro Ser Ala Ala Thr Leu Gln Gln-95 -90 -85Ile Glu Gln Glu Leu Gln Gly Tyr Gly Leu Gln Val Val Asn Val Asp-80 -75 -70Ala Asp His Leu Asp Met Gln Val Gln Gly Thr Val Gln Gln Phe Asp-65 -60 -55Asn Ala Phe Asn Thr Val Ile Asp Leu Phe Lys Ala Asn Gly His Ile-50 -45 -40Phe Arg Ala Pro Lys Lys Pro Pro Gln Ile Pro Val Ala Leu Leu Thr-35 -30 -25 -20Asn Val Leu Ala Val Val Gly Leu Asp Thr Ala Gln Ala Ala Gln Ser
-15 -10 -5Leu Thr Val Lys Thr Pro Asn Val Ala Gly Val Pro Ser Pro Lys Val-1 1 5 10Val Leu Pro Gln Gly Gly Ser Thr Ala Thr Gly Thr Pro Gly Ser Tyr15 20 25Thr Val Gly Asp Thr Ala Asn Arg Tyr Asp Ile Asn Pro Leu Tyr Gln30 35 40 45Lys Gly Ile Thr Gly Lys Gly Glu Thr Ile Gly Ile Val Thr Leu Ser50 55 60Ser Phe Asn Pro Gln Asp Ala Tyr Thr Tyr Trp Gln Gly Ile Gly Leu65 70 75Lys Val Ala Pro Asn Arg Ile Gln Met Val Asn Val Asp Gly Gly Gly80 85 90Gln Met Asp Asp Gly Ser Val Glu Thr Thr Leu Asp Val Glu Gln Ser95 100 105Gly Gly Leu Ala Pro Asp Ala Asn Val Val Val Tyr Asp Ala Pro Asn110 115 120 125Thr Asp Gln Gly Phe Ile Asp Ala Phe Tyr Gln Ala Val Ser Asp Asn130 135 140Gln Ala Asp Ser Leu Ser Val Ser Trp Gly Gln Pro Glu Ile Asp Tyr145 150 155Leu Pro Gln Met Asn Gln Gly Gln Ser Tyr Val Asp Glu Leu Leu Ala
160 165 170Phe Thr Gln Ala Phe Met Glu Ala Ala Ala Gln Gly Ile Ser Met Tyr175 180 185Ala Ala Ala Gly Asp Ser Gly Ala Tyr Asp Thr Ala Arg Asp Phe Pro190 195 200 205Pro Ser Asp Gly Phe Thr Thr Pro Leu Ser Val Asp Phe Pro Ala Ser210 215 220Asp Pro Tyr Ile Thr Ala Ala Gly Gly Thr Thr Val Pro Phe Thr Ala225 230 235Lys Phe Ser Leu Gly Thr Val Asn Ile Thr Gln Glu Gln Pro Trp Ser240 245 250Trp Gln Tyr Leu Gln Asn Leu Gly Tyr Gln Gly Leu Phe Ser Val Gly255 260 265Thr Gly Gly Gly Val Ser Val Ile Phe Pro Arg Pro Trp Tyr Gln Leu270 275 280 285Gly Val Gly Gly Met Gln Asn Ser Ala Ala Asn Gln Ala Phe Thr Asp290 295 300Ser Gln Gly Val Leu Tyr Gly Ser Pro Phe Thr Tyr Asn Leu Pro Ser305 310 315Asn Tyr Ala Gly Arg Asn Leu Pro Asp Ile Ser Met Asp Ala Asp Pro320 325 330Glu Thr Gly Tyr Leu Val Tyr Trp Ser Ala Gly Gly Gly Trp Ile Ala
335 340 345Gly Tyr Gly Gly Thr Ser Phe Val Ala Pro Gln Leu Asn Gly Ile Thr350 355 360 365Ala Leu Ile Asp Gln Glu Val His Gly Arg Val Gly Phe Leu Asn Pro370 375 380Leu Leu Tyr Thr Leu Leu Thr Gln Gly Val Gln Gly Gly Ala Gln Pro385 390 395Phe His Asp Ile Thr Thr Gly Asn Asn Trp Tyr Trp Asn Ala Val Pro400 405 410Gly Tyr Asp Pro Ala Ser Gly Val Gly Thr Pro Asp Val Ala Asn Leu415 420 425Ala Gln Asp Ile Ala Ser Leu Arg430 43521030211533212PRT213脂環酸芽孢桿菌屬220
221SIGNAL222(1)..(24)220
221mat_peptide222(25)..(534)223絲氨酸羧基蛋白酶40030Met Arg Ala Leu Ala His Leu Ala Ile Gly Ala Ile Ala Ser Gly Val
-20 -15 -10Phe Ala Ala Pro Val Ala Phe Ala Ser Pro Val Gln Glu Arg Val Val-5 -1 1 5Val Ala Ser Pro Asp Pro Arg Thr Arg Ser Val His Ala Asp Gly Glu10 15 20Ile Ser Pro Ser Gln Pro Met His Leu Val Ile Thr Leu Arg Leu Arg25 30 35 40His Glu Ala Gln Leu Glu Gln Leu Ile Arg Asp Leu Tyr Thr Pro Gly45 50 55Ser Pro Asp Ala Gly His Phe Leu Thr Pro Ala Ala Phe Asn Ala Ala60 65 70Tyr Ala Pro Thr Ala Glu Asp Val Gln Ala Val Val Gln Gly Leu Arg75 80 85Ala Tyr Gly Leu Arg Val Glu Pro Thr Val Asn Pro Met Val Leu Thr90 95 100Val Ser Gly Arg Ala Arg Asp Val Glu Arg Ala Phe Gly Val His Glu105 110 115 120Leu Gln Phe Gly Arg Gly Ala Gly Ala Trp Tyr Ala Pro Asp Gly Ala125 130 135Ala Thr Leu Pro Ala Pro Leu Ala Ala Arg Val Ser Ala Val Val Gly140 145 150Leu Thr Ser Asp Ala Met Glu Arg His Leu Val Leu Ala His Val Ala
155 160 165Pro Ala Gly Gly Gly Tyr Thr Pro Ala Gln Ile Gln Arg Ala Tyr Asp170 175 180Tyr Thr Pro Leu Tyr Ser Gln Tyr Met Gly Arg Gly Gln Val Ile Ala185 190 195 200Val Val Thr Ser Gly Ser Val Leu Arg Ser Asp Leu Leu Ala Phe Asp205 210 215Arg Ala Phe Gly Leu Pro Asn Pro Val Val Arg Gln Arg Val Ile Asp220 225 230Gly Ser Ser Thr Ser Pro Asp Asp Glu Thr Thr Leu Asp Cys Glu Trp235 240 245Ala His Ala Ile Ala Pro Thr Ala Ser Leu Ala Val Tyr Glu Ala Ala250 255 260Gln Pro Asp Ala Gln Ser Phe Ile Asp Ala Phe Ala Gln Val Ala Ala265 270 275 280Asp Asp Gly Ala His Val Val Thr Thr Ser Trp Gly Ala Pro Glu Ser285 290 295Glu Thr Asp Ala Ala Thr Met Gln Ala Glu His Gln Ile Phe Met Gln300 305 310Met Ala Ala Gln Gly Gln Ser Val Phe Ala Ala Ala Gly Asp Ser Gly315 320 325Ser Ser Asp Gly Thr Ser Gly Thr Asp Val Asp Tyr Pro Ser Ser Asp
330 335 340Pro Tyr Val Thr Ala Cys Gly Gly Thr Arg Leu Val Leu Gly Ala Gly345 350 355 360Ala Lys Arg Leu Gln Glu Thr Ala Trp Ala Asp Thr Gly Gly Gly Ala365 370 375Ser Ser Val Tyr Gly Glu Pro Trp Trp Gln Tyr Gly Pro Gly Val Pro380 385 390Gln Thr Gly Tyr Arg Gln Thr Cys Asp Val Ala Leu Asn Ala Asp Pro395 400 405Ala Thr Gly Tyr Asp Phe Ile Tyr Glu Gly Gln Trp Glu Val Ala Gly410 415 420Gly Thr Ser Phe Val Ala Pro Met Met Ala Ala Thr Phe Ala Leu Ile425 430 435 440Asp Gln Ala Arg Ala Leu Glu Gly Lys Pro Pro Val Gly Leu Ala Asp445 450 455Val Gly Ile Tyr Ala Met Ala Arg Asn Ala Ser Tyr Ala Pro Tyr Ala460 465 470Phe His Asp Ile Thr Ala Gly Ser Asn Gly Ala Tyr Ser Ala Gly Pro475 480 485Gly Trp Asp His Pro Thr Gly Phe Gly Ser Ile Asp Ala Tyr Tyr Phe490 495 500Leu His Gly Leu Asp
50521031211360212PRT213脂環酸芽孢桿菌屬220
221SIGNAL222(1)..(41)220
221mat_peptide222(42)..(411)223蛋白酶或HtrA樣絲氨酸蛋白酶40031Met Arg Arg Arg Arg Trp Asp Tyr Glu Asp Trp Pro Ser Glu Asn Arg-40 -35 -30Arg Val Gly Val Trp Leu Ala Ser Gly Thr Ala Leu Leu Ala Ile Cys-25 -20 -15 -10Tyr Ile Leu Gly Ile Trp Thr Gly Ala Ala Leu Thr Arg Gly His Ser-5 -1 1 5Gln Thr Thr Val Glu Tyr Val Pro Pro Gln Thr Gly Asn Thr Ala Ser10 15 20Thr Ser Gly Ser Leu Thr Pro Ile Pro Gly Val Glu Asp Thr Thr Ile25 30 35Val Thr Gln Ile Tyr Asn Arg Val Lys Asn Ser Ile Phe Thr Ile Thr40 45 50 55Ala Val Ser Gly Gly Lys Pro Thr Ser Ser Asp Ala Glu Glu Asp Ile
60 65 70Gly Thr Gly Phe Leu Ile Asp His Asn Gly Asp Leu Leu Thr Asn Ala75 80 85His Val Val Gly Ser Ala Thr Thr Val Gln Val Ser Gly Asp Asn Arg90 95 100Gln Phe Val Gly Arg Val Ile Asp Ala Asp Gln Leu Asp Asp Leu Ala105 110 115Ile Val Arg Ile Pro Ala Pro Lys Ser Leu Glu Pro Leu Pro Leu Gly120 125 130 135Ser Val Lys Ser Leu Gln Pro Gly Ser Leu Val Ile Ala Ile Gly Asn140 145 150Pro Phe Glu Leu Thr Ser Ser Val Ser Ser Gly Ile Val Ser Gly Leu155 160 165Asn Arg Ser Met Ser Glu Ser Asn Gly His Val Met Asn Gly Met Ile170 175 180Gln Thr Asp Ala Pro Leu Asn Pro Gly Asn Ser Gly Gly Pro Leu Leu185 190 195Asn Ala Ala Gly Gln Val Val Gly Ile Asn Thr Leu Ile Glu Ser Pro200 205 210 215Ile Glu Gly Ser Ile Gly Ile Gly Phe Ala Ile Pro Ile Asp Arg Phe220 225 230Ile Gln Leu Glu Pro Glu Leu Leu Ala Gly Lys Pro Val Ala His Ala
235 240 245Trp Leu Gly Ile Glu Gly Met Asp Ile Asp Asn Leu Met Arg Gln Ala250 255 260Leu His Leu Pro Val Ala Ser Gly Val Tyr Val Thr Glu Val Thr Pro265 270 275Gly Gly Pro Ala Ala Lys Ala Gly Leu Arg Gly Asp Ser Asn Ala Ala280 285 290 295Lys Leu Asn Ser Leu Ser Gln Ser Ala Asn Pro Tyr Ala Leu Leu Lys300 305 310Gly Asn Gly Asp Ile Ile Val Gly31521032211211212PRT213脂環酸芽孢桿菌屬220
221SIGNAL222(1)..(30)220
221mat_peptide222(31)..(212)223二硫化物異構酶40032Met Arg Arg Ser Trp Ser Val Leu Met Ala Val Cys Met Ser Trp Leu-30 -25 -20 -15
Ala Val Gly Cys Gly Thr Pro Ala Asn Ser Leu Ser Gln Ala Thr Ala-10 -5 -1 1Ala Ser Gly Arg His Ala Pro His Pro Leu Val Phe Gln Asn Leu Thr5 10 15Gly Ala Met Asn Glu Gly Gln Asp Pro Arg Trp Asp Pro Lys Ala Ala20 25 30Pro Thr Gly Val Tyr Asp Asp Val Thr Val Val Thr Ala Ser Gly Arg35 40 45 50Gln Glu Val Leu Ser Val Arg Asp Ala Pro Leu Leu Phe Ala Ala Tyr55 60 65Trp Cys Pro His Cys Gln Arg Thr Leu Gln Leu Leu Thr Ser Ile Glu70 75 80Ser Arg Leu Lys Gln Lys Pro Ile Leu Val Asn Val Gly Tyr Pro Pro85 90 95Gly Thr Thr Leu Gln Thr Ala Ala Arg Ile Ala Arg Glu Glu Ser Gln100 105 110Val Leu His Leu Ala Pro Phe Gln Glu Val Phe Ile Leu Asn Pro Asp115 120 125 130Ala Gly Asp Arg Tyr Ala Pro Leu Gly Tyr Pro Thr Leu Ala Phe Tyr135 140 145Arg Ala Gly Arg Asp Trp Thr Leu Tyr Gly Glu His Arg Ala Ser Ile150 155 160
Trp Glu Lys Ala Leu Ser Glu Ser Thr Ser Lys Ala Tyr Asn Gly Ser165 170 175Glu Glu Ser18021033211266212PRT213脂環酸芽孢桿菌屬220
221SIGNAL222(1)..(29)220
221mat_peptide222(30)..(266)223γ-D-穀氨醯-L-二胺基酸內肽酶40033Met Asp Glu Met Asn Ile Arg Ser Trp Cys Val Ala Ala Cys Thr Val-25 -20 -15Ala Leu Thr Ser Ala Val Gly Ala Thr Thr Ala Phe Ala Gln Thr Val-10 -5 -1 1Thr Val Gln Pro Gly Gln Ser Leu Trp Thr Ile Ala Arg Ala His Gly5 10 15Met Pro Val Gln Leu Val Ala Ser Ala Asn Pro Gln Tyr Asn Pro Leu20 25 30 35Asn Leu Pro Val Gly Ala Thr Val Thr Leu Pro Ser Leu Lys Asp Val40 45 50
Ala Val Gln Pro Gly Asp Ser Leu Phe Leu Ile Gly Arg Gln Tyr Gly55 60 65Val Ser Leu Ala Glu Met Leu Ala Ala Asn Pro Asn Val Asp Pro Leu70 75 80Asn Leu Gln Val Gly Ser Ser Val Arg Val Pro Leu Ala Ser Ser Ser85 90 95Thr Lys Ser Ser Thr Val Ser Ala His Val Ala Ala Ser Thr Pro Glu100 105 110 115Asn Ser Asn Asn Leu Tyr Trp Leu Glu Arg Val Ile His Ala Glu Ala120 125 130Gly Gly Glu Ser Leu Gln Ala Gln Ile Ala Val Ala Asp Val Ile Leu135 140 145His Arg Met Ala Ala Gly Gly Tyr Gly Ser Thr Val Gln Gln Val Val150 155 160Phe Gln Val Ser Asp Gly His Tyr Gln Phe Glu Ser Val Ala Asn Gly165 170 175Ser Ile Tyr Gly Gln Pro Asp Ala Gln Asn Val Gln Ala Ala Leu Asp180 185 190 195Ala Leu Asn Gly Asp Asp Val Val Pro Gly Ala Leu Val Phe Tyr Asn200 205 210Pro Ala Gln Thr Pro Ser Gly Ser Trp Val Trp Gln Gln Pro Val Val215 220 225
Ala His Ile Gly His Leu Val Phe Ala Lys230 23521034211768212PRT213脂環酸芽孢桿菌屬220
221SIGNAL222(1)..(26)220
221mat_peptide222(27)..(768)223內-β-N-乙醯氨基葡糖苷酶40034Met Lys Thr His Arg Leu Leu Ala Val Ala Ala Leu Pro Ala Thr Val-25 -20 -15Leu Leu Thr Thr Pro Ala Pro Ala Leu Ala Glu Thr Ser Ser Ser Gln-10 -5 -1 1 5Ser Ala Ser Ala Pro Ser Leu Asn Val Pro Val Ala Ala Leu Thr Leu10 15 20Ala Gly Val Gln Ser Tyr Pro Met Leu Ser Tyr Gly Ser Thr Gly Val25 30 35Tyr Val Glu Ile Leu Gln Asn Ala Leu Asn Ala Leu Gly Tyr Asp Val40 45 50Gly Gln Ala Ser Gly Leu Phe Asp Ala Thr Thr Gln Ala Glu Val Lys55 60 65 70
Ala Phe Gln Gln Ala Met Gly Leu Gln Thr Asp Gly Ile Val Gly Pro75 80 85Leu Thr Trp Gly Ala Leu Ala Lys Ala Val Ala Asp Tyr Arg Gln Val90 95 100Met Thr Val Leu Ser Ser Arg Ser Ser Leu Val Gln Gln Val Glu Trp105 110 115Lys Arg Ile Val Trp Asn Gly Arg Leu Ile Ser Lys Pro Ile Gly Phe120 125 130Thr Tyr Gln Gly Thr Ala Tyr Met Pro Ile Trp Tyr Val Met Gln Ala135 140 145 150Leu Ser Lys Ala Gly Ile Ala Ser Thr Trp Gln Gly Gly Val Trp Thr155 160 165Leu Thr Pro Pro Gly Gly Gln Thr Val Asn Tyr Gly Lys Ile Ser Tyr170 175 180Gly Pro Gly Ser Ala Ala Ile Ala Ile Gly Gln Thr Val Val Ala Asn185 190 195Val Pro Ala Val Val Tyr Pro Asp Pro Ala Ser Gly Lys Leu Thr Thr200 205 210Phe Met Pro Val Trp Tyr Val Met Asn Ala Leu Gln Arg Leu Gly Ile215 220 225 230Gly Ser Thr Trp Gln Gly Thr Glu Trp Asp Met Lys Pro Ala Pro Val235 240 245
Val Ile Glu Thr Gly Asp Pro Ser Asn Asn Thr Thr Gly Ser Asp Pro250 255 260Ala Asn Ser Thr Gly Asn Gly Thr Gly Asn Ser Thr Gly Asn Ala Thr265 270 275Gly Ala Val Pro Gly Gly Asn Thr Val Thr Asn Val Thr Thr Gly Ser280 285 290Ser Asn Val Thr Gly Asn Ser Thr Gly Asn Ser Leu Gly Asn Ser Thr295 300 305 310Gly Asn Ser Leu Gly Asn Ser Thr Ser Asn Ala Thr Gly Asn Ala Thr315 320 325Gly Asn Thr Thr Gly Asn Ala Thr Gly Asn Ser Thr Gly Thr Ser Ser330 335 340Gly Ser Phe Thr Asn Val Asp Leu Arg Tyr Pro Ala Pro Ser Asn Ile345 350 355Asn Ala Gln Ser Ile Asn Gln Phe Leu Leu Gln Asn Ser Ser Pro Leu360 365 370Asn Gly Leu Gly Asn Ser Phe Met Asp Ala Gln Asn Leu Tyr Ser Val375 380 385 390Asp Ala Asn Tyr Leu Val Ser His Ala Ile Leu Glu Ser Ala Trp Gly395 400 405Gln Ser Gln Ile Ala Leu Gln Lys Asn Asn Leu Phe Gly Tyr Gly Ala410 415 420
Tyr Asp Ser Asn Pro Gly Gln Asp Ala Gly Val Phe Pro Ser Asp Asp425 430 435Tyr Ala Ile Arg Phe Glu Ala Trp Thr Val Arg Met Asn Tyr Leu Thr440 445 450Pro Gly Ala Ser Leu Tyr Val Thr Pro Thr Leu Ser Gly Met Asn Val455 460 465 470Asn Tyr Ala Thr Ala Lys Thr Trp Ala Ser Gly Ile Ala Ala Ile Met475 480 485Thr Gln Phe Ala Ser Ser Val Gly Ser Asn Val Asn Ala Tyr Val Gln490 495 500Tyr Thr Pro Ser Asn Asn Pro Pro Ala Pro Arg Ser Thr Ala Glu Pro505 510 515Val Tyr Tyr Met Asn Gly Ala Gln Gly Val Thr Gln Gln Asp Pro Tyr520 525 530Tyr Pro Asn Gly Gly Val Pro Tyr Tyr Pro Thr Ile Ala Gln Gly Glu535 540 545 550Asn Gln Gln Phe Phe Gly Gln Leu Ser Val Gly Ser Phe Gly Gln Pro555 560 565Val Val Glu Val Gln Gln Phe Leu Asn Arg Thr Ile Asn Ala Gly Leu570 575 580Thr Val Asp Gly Gln Phe Gly Pro Leu Thr Gln Ala Ala Val Glu Lys585 590 595
Phe Gln Ser Gln Val Met His Met Ser Asn Pro Asn Gly Ile Trp Thr600 605 610Phe Ser Met Trp Val Gln Tyr Ile Gln Pro Ser Gln Ser Asn Ala Asn615 620 625 630Leu Ile Pro Ala Gly Thr Thr Val Lys Ile Asp Gln Val Ala Glu Gly635 640 645Met Ala Gly Pro Tyr Val Val Pro Trp Tyr His Val Val Gly Tyr Gly650 655 660Trp Val Asp Ser Gln Tyr Ile Lys Leu Thr Asn Val Tyr Arg Val Ile665 670 675Val Gln Asn Pro Ala Gly Thr Ala Thr Thr Ile Pro Val Tyr Gln Val680 685 690Gly Asn Leu Ser Ser Val Leu Leu Asn Leu His Ser Gly Asp Trp Val695 700 705 710Val Ala Asn Ser Ala Gln Pro Ser Gly Gly Val Tyr Thr Ile Gln Ile715 720 725Ala Ala Gln Asp Pro Pro Cys Arg Thr Ala Thr Pro Pro Gly Arg Ser730 735 74021035211597212PRT213脂環酸芽孢桿菌屬
220
221SIGNAL222(1)..(49)220
221mat_peptide222(50)..(597)223多銅氧化酶220
221MISC_FEATURE222(139)..(139)223推定的銅結合位點220
221MISC_FEATURE222(141)..(141)223推定的銅結合位點220
221MISC_FEATURE222(181)..(181)223推定的銅結合位點220
221MISC_FEATURE222(183)..(183)223推定的銅結合位點220
221MISC_FEATURE222(514)..(514)223推定的銅結合位點220
221MISC_FEATURE222(566)..(566)223推定的銅結合位點40035Met Met Ala His Asp Arg Leu Asp Arg Arg Val Asn Glu Arg Arg Gln-45 -40 -35
Ala Met Arg Arg Ala Ala Lys Trp Ala Ile Ala Leu Gly Thr Thr Ala-30 -25 -20Val Val Ala Gly Val Ser Ser Val Phe Ala Leu Arg Ser Val Arg Glu-15 -10 -5Ala Asn Leu Asn Pro Asn Ala Pro Leu Ala Asn Val Pro Gly Pro Gln-1 1 5 10 15Gly Ala Tyr Thr Pro Ile Ser Ala Leu Gln Pro Val Val Pro Lys Asn20 25 30Ala Arg Ile Asp His Tyr Thr Leu Thr Ala Glu Ser Arg Thr Leu Thr35 40 45Val Gly Gly His Ala Leu Gln Ala Met Thr Phe Asn Gly Thr Ala Pro50 55 60Gly Pro Leu Leu Val Ala His Gln Gly Asp Val Val Lys Val Thr Val65 70 75His Asn Arg Leu Ser Val Pro Leu Thr Ile His Trp His Gly Ile Ala80 85 90 95Val Pro Gly Ala Glu Asp Gly Val Pro Gly Val Thr Gln Asn Pro Ile100 105 110Pro Pro Gly Gly Ser Tyr Thr Tyr Glu Phe Gln Val Asn Gln Pro Gly115 120 125Thr Tyr Trp Tyr His Ser His Glu Ala Ser Phe Glu Glu Val Gly Leu130 135 140
Gly Leu Tyr Gly Ala Phe Val Val Leu Pro Lys Arg Ala Val His Pro145 150 155Ala Asp Arg Asp Tyr Thr Leu Val Leu His Glu Trp Pro Thr Ala Ser160 165 170 175Thr Ala Gln Thr Met Met Ala Asn Leu Lys Ala Gly Asn Leu Gly Phe180 185 190Ser Ala Lys Gly Glu Ser Ala Gly Met Gly Gly Met Gly Met Gln Gln195 200 205Asn Gly Asp Met Asn Gly Met Gly Met Met Gly Ala Ala Asp Gly Thr210 215 220Gly Gln Gly Gly Asn Ser Ala Ser Asp Ile Ala His Val Leu Pro Gly225 230 235Pro Pro Leu Gln Leu Asn Gly Phe Ser Pro Thr Ala Asn Asp Trp Ala240 245 250 255Ala Leu Asp Glu Met Ala Gly Met Tyr Asp Ala Phe Thr Val Asn Gln260 265 270Asn Ala Ser Gly Thr Thr Leu Leu Pro Ala Lys Pro Gly Gln Leu Val275 280 285Arg Leu Arg Ile Val Asn Ser Gly Asn Met Thr His Leu Phe Thr Leu290 295 300Val Gly Ala Pro Phe Arg Val Val Ala Leu Asp Gly His Asp Ile Ala305 310 315
Asn Pro Gly Trp Ile Arg Gly Val Leu Leu Pro Val Gly Ala Ala Glu320 325 330 335Arg Tyr Asp Ile Glu Phe Arg Val Pro Lys Ser Gly Ala Ala Phe Leu340 345 350Val Cys Ala Asp Pro Asp Thr Thr Ala Gln Arg Glu Leu Arg Ala Ala355 360 365Ile Gly Leu Pro Asp Ala Trp Ser Gln Phe Lys Glu Thr Asp Ala Ala370 375 380Ser Leu Glu Arg Ala Pro Trp Phe Asp Phe Thr His Tyr Gly Ser Gly385 390 395Arg Leu Pro Gly Glu Ala Val Phe Arg Leu His Gln Ala Tyr Gln Val400 405 410 415Arg Tyr Asn Met Lys Leu Thr Val Gly Met Ser Met Asn Gly Met Val420 425 430Tyr Ala Ile Asn Gly Lys Val Phe Pro Asn Ile Pro Pro Ile Val Val435 440 445Arg Lys Gly Asp Ala Val Leu Val His Ile Val Asn Asp Ser Pro Tyr450 455 460Ile His Pro Met His Leu His Gly His Asp Phe Gln Val Leu Thr Arg465 470 475Asp Gly Lys Pro Val Ser Gly Ser Pro Ile Phe Leu Asp Thr Leu Asp480 485 490 495
Val Phe Pro Gly Glu Ser Tyr Asp Ile Ala Phe Arg Ala Asp Asn Pro500 505 510Gly Leu Trp Met Phe His Cys His Asp Leu Glu His Ala Ala Ala Gly515 520 525Met Asp Val Met Val Gln Tyr Ala Gly Ile Arg Asp Pro Tyr Pro Met530 535 540Ser Glu Met Ser Glu54521036211245212PRT213脂環酸芽孢桿菌屬220
221SIGNAL222(1)..(29)220
221mat_peptide222(30)..(246)223肽醯脯氨醯異構酶40036Met Lys Arg Arg Thr Leu Leu Ala Gly Ile Thr Leu Ala Ala Leu Val-25 -20 -15Ala Val Ala Gly Cys Gly Thr Pro Ala Gly Asn Thr Ala Ser Pro Asp-10 -5 -1 1Asn Thr Ala Asn Leu Ser Asn Thr Asn Ala Pro Asp Thr Leu Ser Asn
5 10 15Glu Thr Gly Gln Thr Leu Asp Thr Ala Asn Pro Pro Tyr Leu His Thr20 25 30 35Ser Thr Glu Gln Trp Lys Ser Met Pro Lys Met Phe Ile Asn Pro Asn40 45 50Lys Thr Tyr Asp Ala Ile Val His Thr Asn Tyr Gly Thr Phe Thr Ile55 60 65Gln Leu Phe Ala Lys Asp Ala Pro Ile Thr Val Asn Asn Phe Val Phe70 75 80Leu Ala Glu His Asn Phe Tyr His Asp Cys Thr Phe Phe Arg Ile Val85 90 95Lys Asn Phe Val Ile Gln Thr Gly Asp Pro Arg Asn Asp Gly Thr Gly100 105 110 115Gly Pro Gly Tyr Thr Ile Pro Asp Glu Leu Ser His Gln Val Pro Phe120 125 130Thr Lys Gly Ile Val Ala Met Ala Asn Thr Gly Gln Pro His Thr Gly135 140 145Gly Ser Gln Phe Phe Ile Cys Thr Ala Asn Asp Thr Gln Val Phe Gln150 155 160Pro Pro Asn Asn Arg Tyr Thr Glu Phe Gly Arg Val Ile Ser Gly Met165 170 175Asp Val Ile Asp Lys Ile Ala Ala Ile Pro Val Thr Glu Asn Pro Met
180 185 190 195Thr Gln Glu Asp Ser Tyr Pro Leu Lys Thr Ala Tyr Ile Glu Ser Ile200 205 210Gln Ile Gln Glu Ser21521037211608212PRT213脂環酸芽孢桿菌屬220
221SIGNAL222(1)..(27)220
221mat_peptide222(28)..(608)223酸性磷酸酯酶或植酸酶或磷脂酶C40037Met Lys Lys Gly Lys Arg Trp Ser Ala Ala Leu Ala Thr Ser Val Ala-25 -20 -15Leu Phe Ala Thr Leu Ser Pro Gln Ala Leu Ala Ser Asp Thr Val Val-10 -5 -1 1 5Pro Gln Val Asn Thr Leu Thr Pro Ile His His Leu Val Val Ile Phe10 15 20Asp Glu Asn Val Ser Phe Asp His Tyr Phe Ala Thr Tyr Pro Asn Ala25 30 35Ala Asn Pro Ala Gly Glu Pro Pro Phe Tyr Ala Ala Pro Gly Thr Pro
40 45 50Ser Val Asn Gly Leu Ser Gly Ser Leu Leu Thr His Asn Pro Asn Gly55 60 65Val Asn Pro Gln Arg Leu Asp Arg Ser Gln Ala Val Thr Pro Asp Met70 75 80 85Asn His Asn Tyr Thr Pro Glu Gln Gln Ala Val Asp Gly Gly Arg Met90 95 100Asp Asn Phe Ile Asn Thr Val Gly Arg Gly Asn Pro Ile Asp Leu Asp105 110 115Tyr Tyr Asp Gly Asn Thr Val Thr Ala Leu Trp Tyr Tyr Ala Gln His120 125 130Phe Ala Leu Asn Asp Asn Ala Tyr Cys Thr Gln Tyr Gly Pro Ser Thr135 140 145Pro Gly Ala Ile Asn Leu Ile Ser Gly Asp Thr Ala Gly Ala Thr Val150 155 160 165Tyr Ser Ser Ser Glu Thr Ser Gly Ala Ala Gln Val Val Pro Pro Gly170 175 180Ser Lys Asn Phe Pro Asn Ala Val Thr Pro Asn Gly Val Asp Ile Gly185 190 195Asp Ile Asp Pro Tyr Tyr Asp Ser Ala Ser Lys Gly Met Thr Met Ala200 205 210Met Ala Gly Lys Asn Ile Gly Asp Leu Leu Asn Ala Lys Gly Val Thr
215 220 225Trp Gly Trp Phe Gln Gly Gly Phe Ala Asn Pro Asn Ala Lys Asp Asn230 235 240 245Asn Ile Ala Gly Thr Asp Glu Thr Thr Asp Tyr Ser Ala His His Glu250 255 260Pro Phe Gln Tyr Tyr Ala Ser Thr Ala Asn Pro Asn His Leu Pro Pro265 270 275Thr Ser Val Ala Met Ile Gly Arg Thr Asp Gln Ala Asn His Gln Tyr280 285 290Asp Ile Thr Asn Phe Phe Gln Ala Leu Gln Asn Gly Asn Met Pro Ala295 300 305Val Ser Phe Leu Lys Ala Pro Glu Tyr Glu Asp Gly His Ala Gly Tyr310 315 320 325Ser Asp Pro Leu Asp Glu Gln Arg Trp Leu Val Gln Thr Ile Asn Gln330 335 340Ile Glu Ala Ser Pro Asp Trp Ser Ser Thr Ala Ile Ile Ile Thr Tyr345 350 355Asp Asp Ser Asp Gly Trp Tyr Asp His Val Met Pro Pro Leu Val Asn360 365 370Gly Ser Ser Asp Lys Ala Val Asp Val Leu Gly Gly Thr Pro Val Leu375 380 385Gln Asn Gly Thr Asp Arg Ala Gly Tyr Gly Pro Arg Val Pro Phe Leu
390 395 400 405Val Ile Ser Pro Tyr Ala Lys His Asn Phe Val Asp Asn Thr Leu Ile410 415 420Asp Gln Thr Ser Val Leu Arg Phe Ile Glu Glu Asn Trp Gly Leu Gly425 430 435Ser Leu Gly Pro Ala Ser Tyr Asp Ser Leu Ala Gly Ser Ile Met Asn440 445 450Met Phe Asp Trp Asn Thr Gln Asn Pro Pro Val Phe Leu Asp Pro Thr455 460 465Thr Gly Glu Pro Val Ser Pro Asp Met Gln Pro Glu Val Ile Arg Gly470 475 480 485Thr Thr Tyr Leu Ser Leu Asn His Tyr Ala Gln Asn Leu Asp Val Val490 495 500Leu Gln Thr Ser Arg Gly Met Ala Arg Phe Ser Tyr Glu Gly His Glu505 510 515Val Glu Ile Asp Glu Arg Ser Gly Leu Val Arg Val Asp Gly Glu Ala520 525 530Val His Leu Lys Ala Pro Leu Val Arg Val Asp Gly Val Trp Met Val535 540 545Pro Val Glu Glu Met Asp Ser Leu Ile Gly Ala Thr Leu His Thr Tyr550 555 560 565Thr Asp Gly His Leu Thr Tyr Tyr Leu Phe Ser Pro Gln Asp Ala His570 575 580
21038211250212PRT213脂環酸芽孢桿菌屬220
221SIGNAL222(1)..(25)220
221mat_peptide222(26)..(251)223多糖脫乙醯酶或術聚糖脫乙醯酶40038Met Leu Ser Leu Trp Lys Arg Ile Arg Thr Gly Thr Leu Ser Leu Leu-25 -20 -15 -10Ala Ala Cys Ala Cys Ala Leu Ser Ala Met Gly Ala Gly Ala Gly Trp-5 -1 1 5Val His Ala Ala Glu Ser Gln Ala Gln Ala Pro Arg Ala Ile Tyr Lys10 15 20Val Asp Thr Lys Glu Lys Val Val Ala Leu Thr Phe Asp Ile Ser Trp25 30 35Gly His Arg Thr Pro Glu Pro Val Leu Glu Thr Leu Lys Lys Cys Gly40 45 50 55Val Thr Lys Ala Thr Phe Phe Leu Ser Gly Pro Trp Thr Met His His60 65 70
Ala Asp Ile Ala Lys Lys Ile Lys Ala Met Gly Tyr Glu Ile Gly Ser75 80 85His Gly Tyr Leu His Lys Asp Tyr Ser Asn Tyr Pro Asp Ser Trp Ile90 95 100Arg Glu Gln Ala Met Leu Ala Asp Lys Ala Ile Gln Gln Val Thr Gly105 110 115Val Lys Pro Lys Leu Phe Arg Thr Pro Asn Gly Asp Leu Asn Pro Arg120 125 130 135Val Ile Arg Cys Leu Thr Ser Met Gly Tyr Thr Val Val Gln Trp Asn140 145 150Thr Asp Ser Leu Asp Trp Lys Asn Pro Gly Val Asp Ala Ile Val Asn155 160 165Arg Val Thr Lys Arg Val Val Pro Gly Asp Ile Ile Leu Met His Ala170 175 180Ser Asp Ser Ser Lys Gln Ile Val Glu Ala Leu Pro Arg Ile Ile Glu185 190 195Ser Leu Arg Gln Gln Gly Tyr Arg Phe Val Thr Val Ser Glu Leu Leu200 205 210 215Ala Gly Ala Ser Val Gln Ser Lys Val Gln220 22521039211324212PRT213脂環酸芽孢桿菌屬
220
221SIGNAL222(1)..(21)220
221mat_peptide222(22)..(324)223多糖脫乙醯酶或木聚糖脫乙醯酶40039Met Arg Lys Thr Ala Ala Gly Ala Cys Ala Leu Ala Leu Met Gly Val-20 -15 -10Leu Gly Gly Trp Ala Gly Ala Ala Gly Thr Ala Val Asn Ala His Ala-5 -1 1 5 10Pro Ala Ala Ser Ala Pro Ser Val Ser Ala His Val Trp Glu Glu Val15 20 25Ser Arg Thr Trp Gly Thr Leu Pro Val Asp Ala Arg His Asp Gly Val30 35 40Trp His Asn Ile Pro Gly Leu Ser Gly Phe Ala Leu Asp Thr Ala Ala45 50 55Ser Glu Arg Glu Thr Ala Arg Arg His Asp Gly Ala Leu His Leu Val60 65 70 75Trp Arg Thr Leu Pro Pro Lys Arg Arg Leu Gly Asp Leu Ser Pro Asp80 85 90Val Ile Tyr Arg Gly Pro Ala Gln Glu Lys Ser Val Ala Leu Met Val95 100 105
Asn Val Ser Trp Gly Asp Ala Tyr Val Pro Arg Met Leu Glu Val Leu110 115 120Arg Ser Ala His Val Lys Ala Thr Phe Phe Val Asp Gly Ala Phe Ala125 130 135Lys Lys Phe Pro Asp Leu Val Arg Ala Met Ala Arg Asp Gly His Ala140 145 150 155Val Glu Ser His Gly Phe Gly His Pro Asp Phe Arg Arg Leu Ser Asp160 165 170Ala Lys Leu Ala Ala Gln Leu Asp Glu Thr Asn Arg Val Leu Ala Gly175 180 185Ile Thr Gly Lys Val Pro Arg Leu Ile Ala Pro Pro Ala Gly Ser Tyr190 195 200Asp Ala Arg Leu Ala Pro Leu Ala His Ser Arg Arg Met Tyr Ala Ile205 210 215Leu Trp Thr Ala Asp Thr Val Asp Trp Lys Asn Pro Pro Ala Asp Val220 225 230 235Ile Val Gln Arg Val Gln Arg Gly Ala Glu Pro Gly Ala Leu Ile Leu240 245 250Met His Pro Thr Ala Pro Thr Ala Glu Ala Leu Pro Asp Val Ile Arg255 260 265Trp Leu Glu Gly His Gly Tyr Arg Leu Lys Thr Val Glu Asp Val Ile270 275 280
Asp Glu Arg Pro Ala Val Thr Pro Pro Thr Thr Leu Ala Asn Glu Thr285 290 295Phe His Ser Ala30021040211214212PRT213脂環酸芽孢桿菌屬220
221SIGNAL222(1)..(29)220
221mat_peptide222(30)..(214)223亞硫酸鹽氧化酶40040Met Met Arg Trp Asn Trp Lys Val Ala Val Gly Ser Leu Ala Leu Ala-25 -20 -15Ala Leu Gly Ala Gly Ala Ala Val Ser Pro Val Phe Ala Ala Ala Lys-10 -5 -1 1Ser Ser Lys Ala Ala Gln Ser His Ala Glu Ala Ser Ala Ala Val Val5 10 15Met Ala Gly Lys Leu Tyr Gly Asn Ile Pro Asn Val Thr Ile Arg Gly20 25 30 35Val Glu Ala Gly Lys Ala Pro Trp Val Val Asp Gly Ser Tyr Gln Leu
40 45 50Lys Ser Asn Leu Phe Thr Ala Ser Gly Lys Trp Leu Ile Ile Pro Lys55 60 65Gln Gly Tyr Met Glu Asn Gly Gln Pro Val Pro Ala Lys Ile Gly Gly70 75 80Thr Thr Asn Asn Ile Pro Ala Val Gly Ala Glu Ile Thr Phe Ala Asn85 90 95Ala Ala Pro Ile Val Leu Pro Pro Val Lys Leu Ser Ser Gln Gly Asp100 105 110 115Phe Ser Phe His Asp Ala Ile Gln Trp Pro Lys Gly Ala Ala Gln Pro120 125 130Val Ile Leu Ile Gly Pro Glu Lys Asn Gly Gln Leu Val Ala Trp Phe135 140 145Ala Ala Ser Asp Phe Leu Ala Asp Tyr Gly Gln Ala Thr Gly Met Gly150 155 160Gly Gly Trp Val Asn Ala Ala His Pro Glu Thr Pro Val Arg His Thr165 170 175His Leu Ala Ser Lys Lys180 18521041211257212PRT213脂環酸芽孢桿菌屬
220
221SIGNAL222(1)..(21)220
221mat_peptide222(22)..(257)223功能性多肽40041Met Asn Trp Ala Arg Val Gly Ala Trp Val Ser Thr Trp Leu Val Ala-20 -15 -10Thr Ala Leu Gly Ala Gly Cys Gly Thr Ala Ser Gln Glu His Pro Ser-5 -1 1 5 10Asn Thr Ser Thr Ser Asp His Arg Val Ala Pro Ala Ala Pro Gly Gly15 20 25Ser Ala Ser Met Gln Asn Arg His Ile Leu Gln Glu Pro Leu Pro Arg30 35 40Gly Val Lys Thr Glu Thr Asp Leu Tyr Asn Trp Leu Leu Trp Gln Arg45 50 55Leu Ala Glu Ile Asn Asn Pro Ala Gln Gly Glu Ile Cys Leu Asp Ala60 65 70 75Ala Cys Lys Ile Ala Ala Thr Val Phe Ser Gly Pro Ala Lys Ala Ala80 85 90Ala Gly Thr Pro Val Thr Leu Val Ala Phe Ser Pro Arg Ala Gly Trp95 100 105Gln Val Leu Val Gly Pro Leu Pro Gln Ser Asp Asn Pro Pro Arg Gln
110 115 120Ala Gln Ser Ile Thr Gly Gln Ser Ala Arg Leu Pro Ala Gln Arg Gly125 130 135Arg Met Arg Arg Ser Asn Pro Arg Asn Arg Leu Val Leu Asp Ser Gly140 145 150 155Arg Thr Pro Ala Ala Asp Ala Ser Ala Ala Arg Met Thr Arg Gln Leu160 165 170Arg Arg Ser Ala Ser Ser Thr Asn Ala Ser Arg Ser Arg Arg Ala Lys175 180 185Ser Met Ala Arg Cys Gln Lys Ser Gly Cys Val Arg Ser Ala Pro Met190 195 200Cys Phe Trp Ala Arg Ser Ser Thr Arg Met Arg Pro Val Ser Arg Ser205 210 215Asn Ala Thr Tyr Leu Ser Ala Asn Pro Val Pro Ser Ala Glu Ala Met220 225 230 235Ala210422111130212PRT213脂環酸芽孢桿菌屬220
221SIGNAL222(1)..(24)
220
221mat_peptide222(25)..(1130)223功能性多肽40042Met Lys Arg Thr Leu Ser Gly Ile Ala Ser Ala Ala Ile Val Leu Gly-20 -15 -10Ala Ile Ser Pro Met Ala Phe Ala Gln Thr Ser Ser Ser Gly Leu Thr-5 -1 1 5Pro Ala Gly Gln Leu Pro Ile Val Val Asn Gly Gln Val Leu Ser Asn10 15 20Pro Tyr Glu Met Val Gly Met Asp Ser Gly Asn Lys Thr Gly Phe Phe25 30 35 40Pro Ile Tyr Tyr Phe Asp Gln Ala Leu Glu Lys Ile Gly Ile Thr Ala45 50 55Thr Trp Asn Gly Ala Thr His Thr Trp Ala Leu Thr Asp Ser Asn Val60 65 70Asn Ala Ser Asn Val Gln Val Ala Gly Gly Met Gly Thr Gly Asn Thr75 80 85Thr Val Thr Leu Asn Gly Thr Pro Ile Lys Met Phe Tyr Thr Gln Val90 95 100Ala Lys Asp Pro Ala Gly Gly Pro Val Thr Thr Tyr Met Pro Ile Tyr105 110 115 120Tyr Ile Asn Asn Ile Leu Ser Ala Leu Gly Ile His Gly Thr Phe Ser
125 130 135Gly Gln Thr Gly Leu Asn Ile Thr Thr Gly Gln Thr Leu Ala Gly Ser140 145 150Leu Ser Ala Ile Thr Val Thr Gly Ala Thr Ser Gly Thr Gly Thr Ser155 160 165Ser Ser Pro Ala Val Ala Leu Asn Asn Gly Lys Val Thr Leu Ser Thr170 175 180Thr Leu Thr Asp Ser Asn Gly Asn Pro Ile Gly Asn Ala Ala Val Thr185 190 195 200Phe Asn Phe Ser Glu Tyr Gly Ala Leu Pro Ser Asn Ala Pro Thr Val205 210 215Thr Asn Ala Ser Gly Ala Thr Ile Pro Ala Thr Thr Gly Ser Thr Ala220 225 230Tyr Gln Tyr Thr Val Tyr Thr Asn Ser Ser Gly Val Ala Ser Ile Thr235 240 245Val Ser Gly Pro Val Gly Leu Thr Tyr Ala Tyr Gln Val Thr Ala Thr250 255 260Ala Pro Ile Ser Asn Gly Ser Asn Gln Met Ile Ser Ser Gln Pro Ala265 270 275 280Tyr Val Glu Phe Val Ala Asn Asn Gln Ala Gly Ile Ala Pro Tyr Gly285 290 295Thr Ala Ser Gln Pro Tyr Ser Ala Ser Leu Gly Thr Ala Val Pro Ile
300 305 310Thr Val Ile Leu Pro Pro Gly Ala Asn Gly Gln Pro Gln Ala Asn Val315 320 325Leu Val Thr Leu Ser Leu Ser Asn Pro Asn Gly Gly Thr Asn Tyr Ala330 335 340Tyr Phe Thr Asn Ser Ser Gly Ala Asn Leu Gly Thr Gln Ile Gln Val345 350 355 360Thr Thr Asn Ser Ser Gly Val Ala Gln Ala Trp Val Ser Asp Ala Asn365 370 375Ala Gln Pro Val Val Val Thr Ala Asn Val Ser Asn Ala Thr Asn Val380 385 390Ser Asn Thr Ser Val Ser Thr Tyr Leu Asn Phe Gly Gln Ala Gly Val395 400 405Pro Ala Ser Ile Ala Asn Tyr Asn Asp Pro Tyr Ser Ala Leu Val Ala410 415 420Asn Gly Gln Gln Pro Leu Ala Gly Thr Thr Val Thr Ile Thr Gly Thr425 430 435 440Leu Val Asp Ala Ala Gly Asn Pro Val Ala Asn Gly Gln Val Leu Val445 450 455Thr Gly Ser Ser Ser Ser Gly Asp Phe Gly Tyr Val Thr Thr Ser Asn460 465 470Gly Lys Ser Thr Thr Thr Asp Phe Pro Ser Val Gly Thr Leu Gln Pro
475 480 485Gly Gln Pro Val Ser Ser Ala Leu Gly Asp Val Ile Thr Ala Asp Ala490 495 500Asn Gly Asn Phe Ser Leu Gln Val Thr Asp Thr Gln Asn Glu Gln Ala505 510 515 520Ser Leu Thr Phe Tyr Ser Val Ser Asn Gly Val Ile Ser Pro Val Gly525 530 535Val Ile Lys Thr Asp Thr Leu Lys Phe Ala Val Asn Asn Gln Leu Ser540 545 550Thr Ile Ala Leu Gly Ala Thr Asp Ala Gln Ala Asp Gly Asn Gln Tyr555 560 565Thr Asn Leu Thr Gly Leu Thr Gly Ser Asp Asn Ala Pro Val Pro Val570 575 580Tyr Val Asp Pro Gln Asn Pro Ser Gly Thr Met Val Thr Asn Gln Ser585 590 595 600Ile Thr Tyr Thr Leu Ser Val Ser Ser Gly Asp Ile Val Gly Ile Gly605 610 615Ser Gly Ala Tyr Leu Ala Pro Thr Asn Ala Asn Asn Ser Thr Ile Pro620 625 630Ile Asn Ser Gly Asn Gly Leu Ser Ser Val Gln Val Thr Val Thr Ala635 640 645Leu Gly Asn Asn Gln Tyr Gln Ile Ser Val Pro Gly Gln Gln Gly Val
650 655 660Leu Thr Thr Ser Ser Pro Asp Phe Thr Val Leu Val Lys Gly Ser Thr665 670 675 680Gly Ser Thr Lys Leu Thr Val Ser Ser Gly Ser Leu Ser Ser Thr Ala685 690 695Thr Ile Thr Phe Thr Ser Ser Asn Pro Thr Val Val Ala Ser Leu Thr700 705 710Pro Val Ser Ser Val Leu Ala Ala Gly Gln Asn Glu Thr Val Thr Phe715 720 725Thr Val Glu Asp Ala Asp Gly Asn Pro Val Ser Gly Asn Thr Gln Val730 735 740Ala Ile Thr Ala His Asp Ser Asn Asp Pro Leu Trp Ile Thr Ala Val745 750 755 760Asn Gly Thr Asn Leu Ser Glu Tyr Glu Thr Ile Asn Gly Ala Ala Thr765 770 775Ser Val Ser Thr Pro Ile Pro Leu Gly Thr Ser Ser Tyr Ala Thr Ser780 785 790Gly Gly Ser Thr Leu Tyr Pro Ala Tyr Thr Asn Ser Gly Tyr Phe Lys795 800 805Asn Gly Val Ser Ile Ser Gly Val Val Ser Trp Asp Gly Thr Val Gly810 815 820Asp Pro Ile Tyr Val Thr Thr Asn Ser Gln Gly Gln Val Thr Leu Thr
825 830 835 840Leu Gln Asn Gly Asn Val Thr Tyr Phe Asp Gly Asn Asn Thr Thr Leu845 850 855Ser Asn Gly Ile Ser Val Ala Gly Thr Ser Gly Ser Glu Gly Phe Tyr860 865 870Thr Tyr Ser Ser Asp Thr Ala Ala Thr Ala Ser Asp Leu Thr Asn Met875 880 885Gly Val Leu Val Ile Gly Gln Ala Asn Gly Asp Ala Ser Thr Ser Leu890 895 900Gly Thr Ile Tyr Ile Gly Ser Gly Gly Ala Thr Gln Thr Pro Ala Ala905 910 915 920Phe Thr Tyr Val Asp Ala Asn Asn His Ser Tyr Thr Tyr Ser Asn Thr925 930 935Ser Asp Thr Phe Thr Val Ser Ser Thr Gln Ser Val Ser Gly Gly Asn940 945 950Tyr Ala Ile Thr Ser Phe Thr Pro Val Gly Gly Thr Ala Thr Ser Thr955 960 965Ile Pro Ser Gly Val Ser Val Asn Ser Ser Thr Gly Thr Val Ser Val970 975 980Ser Gln Asn Ala Ala Val Gly Thr Tyr Thr Val Ser Tyr Tyr Leu Asn985 990 995 1000Gly Val Thr Glu Ser Thr Gly Thr Phe Lys Val Tyr Ser Gly Ser
1005 1010 1015Gly Val Ala Pro Thr Glu Ile Thr Gly Ser Ser Val Thr Val Pro1020 1025 1030Ala Ala Thr Tyr Ser Gly Thr Leu Lys Val Thr Val Ser Asn Gly1035 1040 1045Gly Ser Pro Leu Tyr Val Asn Val Thr Ala Gly Glu Ser Ala Asn1050 1055 1060Ala Val Ala Ala Ala Ile Tyr Asn Ala Leu Val Asn Ala Asn Ile1065 1070 1075Ser Gly Asp Thr Phe Ser Val Ser Gly Ser Thr Val Ser Val Thr1080 1085 1090Ala Ala Ser Gly Ser Pro Thr Leu Thr Val Val Asp Ala Thr Asn1095 1100 1105Phe21043211248212PRT213脂環酸芽孢桿菌屬220
221SIGNAL222(1)..(41)220
221mat_peptide222(42)..(248)223功能性多肽
40043Met Arg Ile Met Lys Val Leu Gly Trp Ile Leu Val Pro Tyr Ile Met-40 -35 -30Leu Phe Ile Gln Trp Gly Arg Met Asn Arg Ile Leu Arg Phe Ala Gly-25 -20 -15 -10Ser Leu Trp Ala Leu Ile Val Phe Ala Asn Thr Val Tyr Met Ile Arg-5 -1 1 5Gly Asn Thr Pro Arg Asn Ala Ser Thr Val Ser Ala Thr Thr Ser Leu10 15 20Val Asn Ser Thr Asn Ser Ser Gln Val Ala Lys Gln Glu Gln Asn Ser25 30 35Ser Thr Ser Pro Ala His Lys Ser Thr Asn Ser Leu Gln His Ala Gln40 45 50 55His Gln Ala Ala Thr Thr Ser Ser Ser Gln Ser Lys Leu Arg Tyr Ile60 65 70Pro Phe His Thr Tyr Gly Lys Val Gly Asp Leu Glu Ile Arg Val Asn75 80 85Ser Leu Gln Gln Val Lys Ser Val Gly Tyr Asp Gly Ile Gly Glu Thr90 95 100Ala Asn Gly Ala Phe Trp Val Ile Asn Ile Thr Ile Arg Asn Asp Gly105 110 115Ser Thr Pro Met Glu Val Val Asp Gly Ile Phe His Leu Gln Asn Leu
120 125 130 135Asn Gly Asn Val Tyr Gln Pro Asp Ser Thr Ala Glu Ile Tyr Ala Asn140 145 150Thr Asn Ser Gly Thr Ile Pro Thr Asp Leu Asn Pro Gly Val Ser Met155 160 165Thr Thr Asn Leu Val Phe Asp Met Pro Asp Phe Met Thr Tyr Gly His170 175 180Val Gly Gln His Tyr Ser Leu Val Ala Ser Met Gly Phe Phe Gly Ser185 190 195Asp Glu Thr Thr Tyr Ala Leu Pro200 20521044211172212PRT213脂環酸芽孢桿菌屬220
221SIGNAL222(1)..(25)220
221mat_peptide222(26)..(172)223功能性多肽40044Met Asn Arg Lys Ser Met Leu Ser Val Leu Gly Val Ala Ala Ala Val-25 -20 -15 -10Ala Leu Met Val Thr Gly Cys Gly Thr Ala Asn Ser Thr Asn Asn Thr
-5 -1 1 5Ala Ser Ser Gly Ala Ala Ser Thr Ala Val Thr Val Lys His Glu His10 15 20Lys Gly Ala Asn Ala Ser Lys Thr Glu Thr Lys Gln Thr Glu Ala Lys25 30 35Ser Ser Asn Lys Ala Gly Glu Thr Ala Lys Ser Ser Val Lys Leu Thr40 45 50 55Ala Pro Val Ala Gly Ala Thr Val Thr Ala Gly Gly Thr Leu Lys Val60 65 70Ser Gly Gln Val Ser Ser Asn Leu Ala Lys Lys Asp Val Gln Ile Thr75 80 85Leu Thr Asn Ser Ala Lys Lys Val Leu Val Gln Gln Ile Val Gly Thr90 95 100Asn Ser Thr Gly Ala Phe Val Asp Thr Leu Lys Leu Pro Lys Tyr Leu105 110 115Gly Lys Ala Gly Ser Asp Leu Thr Leu Ser Val Ser Val Val Gly Glu120 125 130 135Asn Gly Val Val Ser Thr Leu Ser Leu His Val Lys140 14521045211242212PRT213脂環酸芽孢桿菌屬
220
221SIGNAL222(1)..(30)220
221mat_peptide222(31)..(242)223功能性多肽40045Met Arg Arg Ala Val Arg Ile Leu Ala Ala Leu Leu Phe Gly Leu Ala-30 -25 -20 -15Thr Val Thr Ala Thr Leu Met Phe Val Pro Gln Ala Arg Ala Ala Thr-10 -5 -1 1Val Thr Gly Ala Leu Ala Gln Ser Gln Val Val Ser Ile Thr Gly Gly5 10 15Tyr Asn Thr Thr Thr Gln Met Tyr Glu Gln Thr Gly Gln Gln Thr Val20 25 30Val Thr Asn Trp Thr Phe Ser Leu Gln Gln Thr Val Asn Gln Asn Asn35 40 45 50Glu Asn Pro Ser Tyr Ala Gln Cys Thr Val Leu Ala Gly Asn Gln Gln55 60 65Val Thr Cys Thr Ser Asp Ala Thr Asn Asn Gly Ala Ile Cys Thr Ser70 75 80Pro Tyr Pro Gly Ala Ile Asp Lys Gln Cys Thr Asn Leu Ile Gly Phe85 90 95
Thr Gly Asn Ile Ser Val Ser Ser Gln Asn Gly Asn Pro Thr Phe Thr100 105 110Phe Ser Leu Pro Ser Ile Asp Pro Ser Thr Met Lys Pro Val Gly Ile115 120 125 130Phe Val Thr Pro Glu Thr Ile Tyr Gly Gln Met Gly Thr Gly Ser Glu135 140 145Ser Tyr Leu Ser Ser Gly Gln Ser Gly Gly Trp Ser Phe Asn Phe Ser150 155 160Asn Val Ser Asp Pro Gln Asp Trp Tyr Phe Leu Leu Glu Phe Leu Ala165 170 175Asn Pro Ile Val Ala Ala Ile Ala Val Pro Thr Thr Gln Thr Val Pro180 185 190Ile Tyr Ser Trp Val Thr Thr Thr Val Trp His Pro Val Gln Ile Ser195 200 205 210Tyr Ser21046211180212PRT213脂環酸芽孢桿菌屬220
221SIGNAL222(1)..(24)220
221mat_peptide
222(25)..(180)223功能性多肽40046Val Val Arg Met Arg Lys Arg Leu Gly Leu Val Leu Ser Met Val Thr-20 -15 -10Ser Val Leu Val Gly Cys Gly Ala Ser His Pro Ser Pro Leu Asn Gln-5 -1 1 5Asp Lys Ser Leu Leu Thr Trp Asn Ala Ala Lys His Glu Val Arg Trp10 15 20Lys Val Val Ala Gly Asp Gly Arg Ala Asn Gly Gly Met Asn Phe Asp25 30 35 40Gly Tyr Ala Asn Gly Ser Met Thr Leu Val Val Pro Ile Gly Trp Arg45 50 55Val Val Ile Asp Phe Asp Asn Ala Ser Leu Met Pro His Ser Ala Met60 65 70Val Val Pro Tyr Gly Asp Arg Glu Arg Ser Asn Phe Asp Ala Thr Met75 80 85Val Ala Phe Pro Gly Ala Glu Thr Pro Asn Pro Ser Gln Gly Asp Pro90 95 100Gln Gly Thr His Arg Asp Val Ile Phe Thr Ala Ala Lys Val Gly Thr105 110 115 120Tyr Ala Leu Val Cys Gly Val Pro Gly His Ala Leu Ala Gly Met Trp125 130 135
Asp Gln Leu Val Val Ser Asp Glu Ala Lys His Pro Ser Leu Arg Val140 145 150Gln Arg Asp Ser15521047211477212PRT213脂環酸芽孢桿菌屬220
221SIGNAL222(1)..(25)220
221mat_peptide222(26)..(477)223功能性多肽40047Met Ala Val Arg Arg Ala Trp Leu Leu Ala Pro Leu Cys Ala Ser Ser-25 -20 -15 -10Leu Val Val Pro Ala Ser Val Gln Ala Gly Leu Ala Gln Gly His Gly-5 -1 1 5Ser Phe Ser Thr Val Arg Val Ser Val Gly Thr Ser Ser Ser Leu Ser10 15 20Val Pro Ala Leu Ile Gln Gly Asn Glu Thr Tyr Ile Pro Leu Trp Asp25 30 35Leu Met Gln Val Leu His Gln Leu Gly Phe Thr Ala Thr Trp Ala Lys40 45 50 55
Gly Gln Phe Ser Val Ser Ala Pro Pro Ser Val Pro Met Asp Glu Ala60 65 70Pro Gly Pro Ala Gly Lys Gly Gly Ala Leu Val Val Leu Asp Gly Gln75 80 85Val Val Glu Gln Val Pro Thr Val Ile Ala Thr Pro Pro Gly Ala Ala90 95 100Thr Pro Glu Val Phe Leu Pro Leu Thr Asn Ala Glu Glu Ile Leu Gly105 110 115Arg Leu Gly Ile Gln Ala Ser Ala Thr Gly Asn Gln Val Asn Leu Asp120 125 130 135Ala Ser Ala Val Pro Gln Ala Leu Pro Asn Gln Gln Val Ala Val Trp140 145 150Asn Val Leu Ala Ala Val Ala Ser Asp Leu Gly Val Ser Thr Ala Pro155 160 165Ala Gly Pro Ser Pro Tyr Ala Asp Leu Pro Thr Ala Ser Pro Ala Trp170 175 180Gly Ala Val Glu Ala Ala Ile Arg Leu Gly Trp Tyr Ser Pro Leu Ser185 190 195Ala Ser Ser Ser Gly Ala Phe Gln Pro Ile Thr Trp Ala Gln Thr Ala200 205 210 215Ser Ile Leu Trp Asn Ala Leu Gly Ile Ser Gln Gln Asp Ala Ala Tyr220 225 230
Gln Pro Gly Gly Ser Pro Thr Ala Trp Ala Ser Ala Leu Gly Leu Val235 240 245Pro Glu Asn Trp Asp Pro Ala Ser Tyr Met Thr Ala Gln Glu Leu Asp250 255 260Thr Leu Ala Ser Asn Leu His Glu Cys Leu Gln Gly Asp Val Glu Thr265 270 275Gly Ala Asn Thr Trp Arg Leu Trp Tyr Pro Pro Ala Asp Glu Val Glu280 285 290 295Ala Thr Leu Gln Ser Gly Gly Gly Gln Ser Leu Phe Thr Ser Thr Ala300 305 310Asp Ala Gln Ala Ala Ile Ser Ser Ala Tyr Gln Phe Phe Asn Gln Leu315 320 325Val Val Thr Arg Val Gly Gln Gly Tyr Val Val Thr Val Pro Ser Val330 335 340Pro Glu Gly Tyr Gly Phe Ala Thr Phe Ser Ala Leu Gly Gly Val Ala345 350 355Tyr Gln Thr Thr Pro Gly Gly Pro Trp Thr Val Val Pro Val Leu Asp360 365 370 375Thr Arg Asp Val Ser Ile Pro Ala Lys Gly Arg Leu Ser Val Lys Val380 385 390Pro Ala Gln Gly Ile Thr Ile Thr Trp Asn Gln Met Met Pro Ser Leu395 400 405
Gly Gly Thr Val Ala Met Gly Ala Leu Gln Val Ser Pro Gly Pro Ser410 415 420Gly Pro Ser Val Glu Arg Leu Asn Ile Val Thr Pro Asn Leu Pro Pro425 430 435Val Leu Pro Ser Ser Val Thr Ser Thr Gln Pro Gln Ser440 445 45021048211340212PRT213脂環酸芽孢桿菌屬220
221SIGNAL222(1)..(19)220
221mat_peptide222(20)..(340)223功能性多肽40048Met Asn Arg Gln Trp Arg Leu Ala Val Ala Thr Ser Ala Val Ala Ala-15 -10 -5Ser Leu Ala Gly Cys Gly Ala Pro Asp Leu Ala Ala Met Arg Pro Thr-1 1 5 10Val Gln Lys Ser Ala Val Leu Val Glu Val Val Gly Ala Pro Pro Phe15 20 25Ala Pro Ser Ala Ser Gln Leu Gly Thr Ala Gly Ala Thr Ser Val Glu
30 35 40 45Val Val His Val Ala Leu Gly Glu Trp Gln Ser Val Ala Ala His Ala50 55 60Leu Ala Lys Gly Gln Leu Thr Gly Val Met Val Val Cys Asp Asp Ala65 70 75Asn Ala Val Ala Ser Gly Leu Asn Gln Leu Ala Ala Asp His Pro Asp80 85 90Val Arg Phe Leu Val Val Ser Asn Trp Pro Ala Ser Gln Ile Thr Ser95 100 105Gly Asn Val Glu Asp Val Ala Gln Asp Pro Val Ala Val Ala Tyr Ser110 115 120 125Ile Gly Ala Leu Cys Gly Asp Trp Ile Ala Ser Ser Thr Ser Thr Ser130 135 140Gly Ala Val Tyr Ser Gly Val Pro Ser Ile Val Tyr Ala Pro Arg Gly145 150 155Ala Thr Val Ala Glu Gln Lys Ala Phe Phe Thr Gly Leu Tyr Gln Ala160 165 170Asn Pro Asn Val Arg Val Val Ala Leu Pro Gln Pro Ala Ala Gln Ser175 180 185Leu Ser Ser Tyr Gly Tyr Ala Val Asp Leu Gly Val Val Gly Gly Ser190 195 200 205Pro Ala Ala Gly Glu Leu Ser Ala Leu Arg Ser Ala Ala Pro Ala Trp
210 215 220Ala Ala Phe Gly Thr Ser Pro Ile Ala Gly Phe Ala Ile Ser Pro Gly225 230 235His Leu Ser Ser Ser Glu Ala Val Gln Ala Phe Gln Ala Leu Val Ser240 245 250Pro Asp Ala Trp His Ser Gly Glu His Leu Val Leu Asp Leu Ser Ser255 260 265Val Ala Phe Asp Asp Lys Gln Val Pro Ala Thr Val Ile Ala Ala Trp270 275 280 285Ala Lys Leu Glu Val Asn Ala Ile Ala Ala Ala Ala Gln Ser Asn Ala290 295 300Ala Phe Ala Ser Leu Pro Pro Ser Val Arg Ser Asp Leu Ala Asn Ala305 310 315Phe His Leu Ser32021049211341212PRT213脂環酸芽孢桿菌屬220
221SIGNAL222(1)..(29)220
221mat_peptide222(30)..(341)223功能性多肽
40049Met Val Met Arg Thr Arg Trp Ile Arg Trp Met Ala Leu Ala Leu Ala-25 -20 -15Val Cys Val Trp Leu Ser Pro Phe Pro Phe Ser Trp Gly Ala Thr Ser-10 -5 -1 1Leu Asp Ala Asp Leu Pro Gln Pro Thr Ile Pro Pro Ser Ala Trp Ser5 10 15Asn Leu Asn Gln Asp Trp Lys Asp Leu Gln Arg Leu Ala Gln Asn Thr20 25 30 35Val Pro Pro Ser Lys Glu Ser Ser Gln Thr His Ala Pro Thr His Lys40 45 50Ser Ser Gln Pro Pro Ala Gln Val Pro Gln Gly Pro Leu Val Gly Val55 60 65Gly Asp Thr Gly Glu Ala Ala Arg Trp Leu Asn Glu Ala Leu Ala Val70 75 80Leu Gly Tyr Leu Pro Ala Val Phe Ser Pro Ala Ala Gln Thr Ser Thr85 90 95Arg Gln Val Arg Leu Ala Leu Ala Ala Ser Ala Glu His Gln Thr Leu100 105 110 115Val Pro Ile Pro Gly Ser Phe Gln Leu Leu Tyr His Ala Pro Ser Ser120 125 130Trp Val Ala Leu Trp Ser Ala Asp Glu Asp Thr Pro Ile Thr Glu Gly
135 140 145Ala Val Met Ala Phe Glu Ala Gln His His Leu Gly Val Asp Gly Ile150 155 160Ala Gly Pro Asp Val Ile His Ala Leu Ala Gln Ala Leu Ala Gly Asn165 170 175Glu Thr Ala Glu Lys Ala Pro Tyr Ser Tyr Ile Leu Val Thr Thr Ser180 185 190 195Leu Pro Glu Thr Leu Glu Leu Trp Val Asn Gly Gln Leu Val Leu Lys200 205 210Ser Leu Cys Asn Thr Gly Ile Ala Gln Ser Pro Thr Pro Tyr Gly Thr215 220 225Tyr Gly Val Tyr Val Gln Tyr Thr Ser Gln Glu Met Lys Gly Lys Asp230 235 240Pro Asp Gly Thr Pro Tyr Asp Asp Pro Gly Val Pro Trp Val Ser Tyr245 250 255Phe Tyr Lys Gly Cys Ala Val His Gly Phe Leu Arg Ala Lys Tyr Gly260 265 270 275Phe Pro Gln Ser Leu Gly Cys Val Glu Leu Pro Tyr Ala Ala Ala Lys280 285 290Thr Val Phe Ser Tyr Thr His Ile Gly Thr Leu Val Thr Val Thr Ala295 300 305Ser Pro Leu Ser Ala310
21050211399212PRT213脂環酸芽孢桿菌屬220
221SIGNAL222(1)..(28)220
221mat_peptide222(30)..(399)223功能性多肽40050Met Asp Arg Leu Leu Asn Asn Lys Val Ala Leu Arg Leu Thr Ala Leu-25 -20 -15Val Leu Ala Cys Ile Leu Trp Leu Ala Val His Ala Glu Gln Gly Ser-10 -5 -1 1Gly Ser Ser Ala Ser Thr Gly Val Thr Glu Ser Phe Glu Leu Pro Val5 10 15Arg Val Glu Thr Ser Ala Asp Glu Val Leu Val Ser Gln Val Pro Thr20 25 30 35Ile Thr Ala Arg Val Thr Thr Asn Leu Leu Ser Leu Pro Thr Leu Ala40 45 50Ser Asp Met Met Lys Ala Glu Ile Val Ala Asp Ala Glu Asn Leu Gly55 60 65Pro Gly Thr Tyr Thr Leu His Val Ala Ala Val Asn Met Pro Ala Gly
70 75 80Val Arg Ser Tyr Thr Leu Thr Pro Ser Thr Ile Thr Val Thr Leu Glu85 90 95Pro Lys Val Thr Val Glu Arg Thr Val Arg Val Asn Val Val Gly Thr100 105 110 115Pro Gly Gln Gly Tyr Val Leu Gly Lys Pro Glu Leu Gly Ala Gly Val120 125 130Val Glu Val Ser Gly Ala Glu Ser Ser Val Gln Ala Val Ala Glu Val135 140 145Ala Gly Val Val Asp Ala Ser Gly Leu Ser Gln Thr Ala Thr Lys Leu150 155 160Val Glu Leu Leu Pro Leu Asp Gln Ala Gly Lys Ala Val Pro Gly Val165 170 175Thr Val Thr Pro Ser Ala Ile Ser Val Thr Leu Pro Ile Thr Ser Ala180 185 190 195Asn Gln Ala Val Lys Leu Thr Pro Ala Val Thr Gly Ser Pro Ala Pro200 205 210Gly Tyr Ala Val Ala Ser Val His Leu Glu Pro Ala Ser Ala Val Glu215 220 225Gln Gly Leu Ala Ala Ser Gln Leu Pro Gln Arg Gly Leu Leu Val Pro230 235 240Ile Asp Val Thr Gly Leu Asn Arg Pro Thr Thr Val Ser Val Pro Val
245 250 255Pro Leu Leu Pro Gly Met Thr Ser Val Ser Pro Thr Ala Val Thr Ala260 265 270 275Val Ile Asp Val Glu Pro Ser Ala Val Tyr Thr Val Ser Asn Val Pro280 285 290Val Ala Ile Thr Gly Ala Thr Gly Val Lys Leu Val Thr Pro Arg Thr295 300 305Val Asn Val Thr Val Thr Gly Ile Glu Ala Asp Val Arg Ala Val Glu310 315 320Arg Asp Pro Ala Ala Val Gln Ala Phe Val Asp Ala Thr Gly Leu Thr325 330 335His Gly Ser Ala Thr Leu Pro Asp Ser Asn Ser Ser Ala Val Leu Ser340 345 350 355Leu Val Ile Arg Pro Arg Glu Arg Arg Lys Arg Thr His Val Val360 365 3702105121134212DNA213引物SigA2NotU-P40051tcgcgatccg ttttcgcatt tatcgtgaaa cgct 342105221133212DNA213引物SigA2NotD-P
40052ccgcaaacgc tggtgaaagt aaaagatgct gaa 332105321120212DNA213引物A2up40053agcgtttgcg gccgcgatcc202105421121212DNA213引物B40054ttattcggtc gaaaaggatc c 2121055211282212PRT213黑麴黴220
221SIGNAL222(1)..(18)220
221PROPEP222(19)..(59)220
221CHAIN222(60)..(98)220
221PROPEP
222(99)..(109)220
221CHAIN222(110)..(282)220
221MOD_RES222(110)..(110)220
221DISULFID222(115)..(139)220
221DISULFID222(127)..(210)40055Met Lys Phe Ser Thr Ile Leu Thr Gly Ser Leu Phe Ala Thr Ala Ala1 5 10 15Leu Ala Ala Pro Leu Thr Glu Lys Arg Arg Ala Arg Lys Glu Ala Arg20 25 30Ala Ala Gly Lys Arg His Ser Asn Pro Pro Tyr Ile Pro Gly Ser Asp35 40 45Lys Glu Ile Leu Lys Leu Asn Gly Thr Thr Asn Glu Glu Tyr Ser Ser50 55 60Asn Trp Ala Gly Ala Val Leu Ile Gly Asp Gly Tyr Thr Lys Val Thr65 70 75 80Gly Glu Phe Thr Val Pro Ser Val Ser Ala Gly Ser Ser Gly Ser Ser85 90 95
Gly Tyr Gly Gly Gly Tyr Gly Tyr Trp Lys Asn Lys Arg Gln Ser Glu100 105 110Glu Tyr Cys Ala Ser Ala Trp Val Gly Ile Asp Gly Asp Thr Cys Glu115 120 125Thr Ala Ile Leu Gln Thr Gly Val Asp Phe Cys Tyr Glu Asp Gly Gln130 135 140Thr Ser Tyr Asp Ala Trp Tyr Glu Trp Tyr Pro Asp Tyr Ala Tyr Asp145 150 155 160Phe Ser Asp Ile Thr Ile Ser Glu Gly Asp Ser Ile Lys Val Thr Val165 170 175Glu Ala Thr Ser Lys Ser Ser Gly Ser Ala Thr Val Glu Asn Leu Thr180 185 190Thr Gly Gln Ser Val Thr His Thr Phe Ser Gly Asn Val Glu Gly Asp195 200 205Leu Cys Glu Thr Asn Ala Glu Trp Ile Val Glu Asp Phe Glu Ser Gly210 215 220Asp Ser Leu Val Ala Phe Ala Asp Phe Gly Ser Val Thr Phe Thr Asn225 230 235 240Ala Glu Ala Thr Ser Gly Gly Ser Thr Val Gly Pro Ser Asp Ala Thr245 250 255Val Met Asp Ile Glu Gln Asp Gly Ser Val Leu Thr Glu Thr Ser Val260 265 270Ser Gly Asp Ser Val Thr Val Thr Tyr Val
275 28021056211252212PRT213核盤菌220
221MISC_FEATURE222(1)..(252)223內肽酶EapC40056Met Lys Phe Ser Ile Val Ala Ala Thr Ala Leu Leu Ala Gly Ser Ala1 5 10 15Val Ala Ala Pro Gly Thr Ala Leu Arg Gln Ala Arg Ala Val Lys Arg20 25 30Ala Ala Arg Thr His Gly Asn Pro Val Lys Tyr Val Glu Gly Pro Thr35 40 45Asn Lys Thr Asp Val Ser Tyr Ser Ser Asn Trp Ala Gly Ala Val Leu50 55 60Val Gly Thr Gly Tyr Thr Ser Val Thr Gly Thr Phe Thr Ala Pro Ser65 70 75 80Pro Ser Thr Ala Gly Ser Gly Ser Ala Trp Val Gly Ile Asp Gly Asp85 90 95Thr Cys Gly Thr Ala Ile Leu Gln Thr Gly Ile Asp Trp Asp Lys Ser100 105 110
Gly Asn Ser Ile Thr Tyr Asp Ala Trp Tyr Glu Trp Tyr Pro Asp Tyr115 120 125Ala Tyr Asp Phe Ser Gly Ile Ser Ile Ser Ala Gly Asp Ser Ile Lys130 135 140Val Thr Val Thr Ala Ser Ser Lys Thr Thr Gly Thr Ala Thr Val Asp145 150 155 160Asn Leu Thr Lys Gly Lys Ser Val Thr His Thr Phe Ser Gly Gly Val165 170 175Asp Gly Asp Leu Cys Glu Tyr Asn Ala Glu Trp Ile Val Glu Asp Phe180 185 190Glu Glu Gly Ser Ser Leu Val Gln Phe Ala Asn Phe Gly Thr Val Thr195 200 205Phe Thr Gly Ala Ser Ala Thr Gln Asn Gly Glu Ser Val Gly Val Thr210 215 220Gly Ala Gln Ile Ile Asp Leu Gln Gln Asn Ser Val Leu Thr Ser Val225 230 235 240Ser Thr Ser Ser Asn Ser Val Thr Val Lys Tyr Val245 25021057211269212PRT213Cryphonectria parasitica220
221MISC_FEATURE222(1)..(269)
223內肽酶EapC40057Met Lys Tyr Ala Thr Val Val Ala Ala Leu Leu Gly Ala Asn Ala Ala1 5 10 15Leu Gly Ala Arg Phe Thr Glu Lys Arg Arg Glu Arg Asn Glu Ala Arg20 25 30Leu Ala Arg Arg Ser Gly Ser Val Arg Leu Pro Ala Thr Asn Ser Glu35 40 45Gly Val Ala Ile Asp Ala Ala Glu Ser Arg Asn Asp Thr Thr Asn Val50 55 60Glu Tyr Ser Ser Asn Trp Ala Gly Ala Val Leu Ile Gly Ser Gly Tyr65 70 75 80Lys Ser Val Thr Gly Ile Phe Val Val Pro Thr Pro Lys Ser Pro Gly85 90 95Ser Gly Asn Thr Glu Tyr Ala Ala Ser Ala Trp Val Gly Ile Asp Gly100 105 110Asp Thr Ala Gln Asn Ser Ile Leu Gln Thr Gly Val Asp Phe Tyr Val115 120 125Glu Gly Ser Ser Val Ala Tyr Asp Ala Trp Tyr Glu Trp Tyr Pro Asp130 135 140Tyr Ala Tyr Asp Phe Ser Gly Ile Ser Ile Ser Ala Gly Asp Thr Ile145 150 155 160
Lys Val Thr Val Thr Ala Thr Thr Thr Thr Ser Gly Thr Ala Val Val165 170 175Glu Asn Val Thr Lys Gly Thr Thr Val Thr His Thr Phe Thr Gly Gln180 185 190Ser Ala Ala Leu Gln Glu Leu Asn Ala Glu Trp Ile Val Glu Asp Phe195 200 205Glu Glu Gly Asp Glu Leu Val Pro Phe Ala Asn Phe Gly Thr Val Thr210 215 220Phe Thr Gly Ala Glu Ala Thr Thr Ser Ser Gly Thr Val Thr Ala Ala225 230 235 240Asp Ala Thr Leu Ile Asp Ile Glu Gln Asn Gly Glu Val Leu Thr Ser245 250 255Val Thr Val Ser Gly Ser Thr Val Thr Val Lys Tyr Val260 26521058211204212PRT213Scytalidium lignicolum220
221MISC_FEATURE222(1)..(204)223scytalidoglutamic肽酶40058Thr Val Glu Ser Asn Trp Gly Gly Ala Ile Leu Ile Gly Ser Asp Phe1 5 10 15
Asp Thr Val Ser Ala Thr Ala Asn Val Pro Ser Ala Thr Gly Ala Ser20 25 30Gly Gly Ser Ser Ala Ala Trp Val Gly Ile Asp Gly Asp Thr Cys Gln35 40 45Thr Ala Ile Leu Gln Thr Gly Phe Asp Trp Tyr Gly Asp Gly Thr Tyr50 55 60Asp Ala Trp Tyr Glu Trp Tyr Pro Glu Val Ser Asp Asp Phe Ser Gly65 70 75 80Ile Thr Ile Ser Glu Gly Asp Ser Ile Gln Met Ser Val Thr Ala Thr85 90 95Ser Asp Thr Ser Gly Ser Ala Thr Leu Glu Asn Leu Thr Thr Gly Gln100 105 110Lys Val Ser Lys Ser Phe Ser Asn Glu Ser Ser Gly Leu Cys Arg Thr115 120 125Asn Ala Glu Phe Ile Ile Glu Asp Phe Glu Glu Cys Asn Ser Asp Gly130 135 140Ser Asp Glu Phe Val Pro Phe Ala Ser Phe Ser Pro Ala Val Glu Phe145 150 155 160Thr Asp Cys Ser Val Thr Ser Asp Gly Glu Ser Val Ser Leu Asp Asp165 170 175Ala Gln Ile Thr Gln Val Ile Ile Asn Asn Gln Asp Val Thr Asp Cys180 185 190Ser Val Ser Gly Thr Thr Val Ser Cys Ser Tyr Val
195 20021059211268212PRT213Cryphonectria parasitica220
221MISC_FEATURE222(1)..(268)223內肽酶EapB40059Met Lys Tyr Thr Ala Ala Leu Ala Ala Leu Val Thr Leu Ala Ala Ala1 5 10 15Ala Pro Thr Asp Gly Ile Ile Asp Ile Gly Asp Gly Val Lys Leu Val20 25 30Pro Arg Glu Pro Arg Ala His Thr Arg Leu Glu Arg Leu Arg Thr Phe35 40 45Arg Arg Gly Leu Met Glu Gly Leu Glu Ser Gly Glu Arg Asn Ser Ser50 55 60Asp Val Ser Tyr Asp Ser Asn Trp Ala Gly Ala Val Lys Ile Gly Thr65 70 75 80Gly Leu Asn Asp Val Thr Gly Thr Ile Val Val Pro Thr Pro Ser Val85 90 95Pro Ser Gly Gly Ser Ser Thr Ala Lys Tyr Ala Ala Ser Ala Trp Val100 105 110
Gly Ile Asp Gly Asp Thr Cys Thr Ser Ala Ile Leu Gln Thr Gly Val115 120 125Asp Phe Tyr Ala Gly Arg Gly Gly Val Ser Phe Asp Ala Trp Tyr Glu130 135 140Trp Tyr Pro Asn Tyr Ala Tyr Asp Phe Ser Gly Phe Ser Val Ser Ala145 150 155 160Gly Asp Thr Ile Val Met Thr Ala Ser Ala Ser Ser Leu Lys Ala Gly165 170 175Thr Val Thr Leu Glu Asn Ser Thr Thr Gly Lys Lys Val Thr Gln Ser180 185 190Phe Ser Ala Glu Ser Ser Glu Leu Cys Glu Tyr Asn Ala Glu Trp Ile195 200 205Val Glu Asp Phe Glu Ser Gly Ser Ser Leu Val Asn Phe Ala Asp Phe210 215 220Asp Thr Val Thr Phe Lys Asp Cys Ser Pro Ser Val Ser Gly Ser Thr225 230 235 240Ile Val Asp Ile Arg Gln Ser Leu Glu Val Leu Thr Glu Cys Ser Thr245 250 255Thr Gly Thr Thr Thr Val Thr Cys Glu Tyr Val Gly260 26521060211147212PRT213埃默森籃狀菌
220
221MISC_FEATURE222(1)..(147)40060Asn Trp Ala Gly Ala Val Leu Thr Ser Pro Pro Ser Gly Ser Thr Phe1 5 10 15Thr Ser Val Ser Ala Gln Phe Thr Val Pro Ser Pro Ser Leu Pro Gln20 25 30Gly Ser Gln Gln Ala Ser Ser Ala Ser Ala Trp Val Gly Ile Asp Gly35 40 45Asp Thr Tyr Thr Asn Ala Ile Leu Gln Thr Gly Val Asp Phe Asn Val50 55 60Asp Thr Asn Gly Gln Val Ser Tyr Asp Ala Trp Tyr Glu Trp Tyr Pro65 70 75 80Asp Tyr Ala His Asp Phe Thr Gly Ile Ser Phe Gln Ser Gly Asp Val85 90 95Val Ser Val Ser Val Thr Ser Ser Ser Asn Ser Glu Gly Thr Ala Val100 105 110Ile Glu Asn Leu Thr Asn Gly Gln Lys Val Thr Lys Thr Leu Ser Ala115 120 125Pro Ser Ser Ser Ala Thr Leu Gly Gly Gln Asn Ala Glu Trp Ile Val130 135 140Glu Asp Phe14權利要求
1.分離的成熟功能性多肽，其與可從以保藏號DSM 15716保藏的脂環酸芽孢桿菌屬細菌獲得的相應分泌多肽具有至少90％的同一性並表現相同的功能。
2.細菌穀氨酸肽酶(EC 3.4.23.19)。
3.權利要求1的多肽，所述多肽選自(a)含有與SEQ ID NO26到SEQ ID NO50所包含成熟多肽的序列具有至少90％同一性的胺基酸序列的多肽；(b)由核苷酸序列編碼的多肽，所述核苷酸序列在高嚴格條件下與選自以下的多核苷酸探針雜交(i)編碼成熟多肽的SEQ ID NO1到SEQ ID NO25區域的核苷酸序列的互補鏈；(ii)編碼成熟多肽的SEQ ID NO1到SEQ ID NO25區域的核苷酸序列中所包含cDNA序列的互補鏈；(c)SEQ ID NO26到SEQ ID NO50中所包含成熟多肽的片段，且其中該多肽具有SEQ ID NO26到SEQ ID NO50中所包含的相應成熟多肽的功能。
4.權利要求1的多肽，其中該多肽為具有選自以下功能的酶酸性內切葡聚糖酶、酸性纖維素酶、天冬氨醯蛋白酶、多銅氧化酶、絲氨酸羧基蛋白酶、絲氨酸蛋白酶、HtrA樣絲氨酸蛋白酶、二硫化物異構酶、γ-D-穀氨醯-L-二胺基酸內肽酶、內-β-N-乙醯氨基葡糖苷酶、肽醯脯氨醯異構酶、酸性磷酸酯酶、植酸酶、磷脂酶C、多糖脫乙醯酶、木聚糖脫乙醯酶和亞硫酸鹽氧化酶。
5.權利要求4的酶，其選自(a)含有與SEQ ID NO26到SEQ ID NO40所包含成熟多肽的胺基酸序列具有至少90％同一性的胺基酸序列的酶；(b)由核苷酸序列編碼的酶，所述核苷酸序列在高嚴格條件下與選自以下的多核苷酸探針雜交，所述多核苷酸探針選自(i)編碼成熟酶的SEQ ID NO1到SEQ ID NO15區域的核苷酸序列的互補鏈；(ii)編碼成熟多肽的SEQ ID NO1到SEQ ID NO15區域的核苷酸序列中所包含cDNA序列的互補鏈；(c)SEQ ID NO26到SEQ ID NO40中所包含成熟酶的片段，且其中該酶具有SEQ ID NO26到SEQ ID NO40中所包含的相應成熟多肽的功能。
6.權利要求1的多肽，其中嚴格度條件非常高。
7.權利要求1的多肽，其中編碼多肽的多核苷酸由選自編碼成熟多肽的SEQ ID NO1到SEQ ID NO25區域的核苷酸序列或由於遺傳密碼簡併性而與之不同的序列組成。
8.權利要求4的酶，其表徵為從以保藏號DSM 15716保藏的脂環酸芽孢桿菌菌株獲得的酸性內切葡聚糖酶或酸性纖維素酶。
9.權利要求8的酸性內切葡聚糖酶或酸性纖維素酶，其包含SEQ IDNO26包含的成熟酸性內切葡聚糖酶或酸性纖維素酶或由其組成。
10.權利要求9的酸性內切葡聚糖酶或酸性纖維素酶，其包含SEQ IDNO26位置25到959的序列或由其組成。
11.權利要求2的穀氨酸肽酶，其表徵為蛋白酶結構中不含二硫鍵。
12.權利要求2中的穀氨酸肽酶，可從以保藏號DSM 15716保藏的脂環酸芽孢桿菌菌株獲得。
13.權利要求12的穀氨酸肽酶，其包含SEQ ID NO27中包含的成熟天冬氨醯蛋白酶或由其組成。
14.權利要求13的穀氨酸肽酶，其包含SEQ ID NO27位置33到272的序列或由其組成。
15.權利要求4的酶，其表徵為可從以保藏號DSM 15716保藏的脂環酸芽孢桿菌菌株獲得的多銅氧化酶。
16.權利要求15的多銅氧化酶，其包含SEQ ID NO28或SEQ ID NO35中包含的成熟多銅氧化酶或由其組成。
17.權利要求16的穀氨酸肽酶，其包含SEQ ID NO28位置26到315或SEQ ID NO35位置50到597的序列或由其組成。
18.權利要求4的酶，表徵為可從以保藏號DSM 15716保藏的脂環酸芽孢桿菌菌株獲得的絲氨酸羧基蛋白酶。
19.權利要求18的絲氨酸羧基蛋白酶，其包含SEQ ID NO29或SEQID NO30中包含的成熟絲氨酸羧基蛋白酶或由其組成。
20.權利要求19的絲氨酸羧基蛋白酶，其包含SEQ ID NO29位置190到626或SEQ ID NO30位置25到533的序列或由其組成。
21.權利要求4的酶，表徵為可從以保藏號DSM 15716保藏的脂環酸芽孢桿菌菌株獲得的氨酸蛋白酶或HtrA樣絲氨酸蛋白酶。
22.權利要求21的絲氨酸蛋白酶或HtrA樣絲氨酸蛋白酶，其包含SEQ ID NO31中包含的成熟絲氨酸蛋白酶或HtrA樣絲氨酸蛋白酶或由其組成。
23.權利要求22的絲氨酸蛋白酶或HtrA樣絲氨酸蛋白酶，其包含SEQID NO31位置42到411的序列或由其組成。
24.權利要求4的酶，表徵為可從以保藏號DSM 15716保藏的脂環酸芽孢桿菌菌株獲得的二硫化物異構酶。
25.權利要求24的二硫化物異構酶，其包含SEQ ID NO32中包含的成熟二硫化物異構酶或由其組成。
26.權利要求25的二硫化物異構酶，其包含SEQ ID NO32位置42到411的序列或由其組成。
27.權利要求4的酶，表徵為可從以保藏號DSM 15716保藏的脂環酸芽孢桿菌菌株獲得的γ-D-穀氨醯-L-二胺基酸。
28.權利要求27的γ-D-穀氨醯-L-二胺基酸，其包含SEQ ID NO33中包含的成熟γ-D-穀氨醯-L-二胺基酸或由其組成。
29.權利要求28的γ-D-穀氨醯-L-二胺基酸，其包含SEQ ID NO33從位置30到266的序列或由其組成。
30.權利要求4的酶，表徵為可從以保藏號DSM 15716保藏的脂環酸芽孢桿菌菌株獲得的內-β-N-乙醯氨基葡糖苷酶。
31.權利要求30的內-β-N-乙醯氨基葡糖苷酶，其包含SEQ ID NO34中包含的成熟內-β-N-乙醯氨基葡糖苷酶或由其組成。
32.權利要求31的內-β-N-乙醯氨基葡糖苷酶，其包含SEQ ID NO34位置27到768的序列或由其組成。
33.權利要求4的酶，表徵為可從以保藏號DSM 15716保藏的脂環酸芽孢桿菌菌株獲得的肽醯脯氨醯異構酶。
34.權利要求33的肽醯脯氨醯異構酶，其包含SEQ ID NO36中包含的成熟肽醯脯氨醯異構酶或由其組成。
35.權利要求34的肽醯脯氨醯異構酶，其包含SEQ ID NO36從位置30到246的序列或由其組成。
36.權利要求4的酶，表徵為可從以保藏號DSM 15716保藏的脂環酸芽孢桿菌菌株獲得的酸性磷酸酯酶或植酸酶或磷脂酶C。
37.權利要求36的酸性磷酸酯酶或植酸酶或磷脂酶C，其包含SEQ IDNO37中包含的成熟酸性磷酸酯酶或植酸酶或磷脂酶C或由其組成。
38.權利要求37的酸性磷酸酯酶或植酸酶或磷脂酶C，其包含SEQ IDNO37位置28到608的序列或由其組成。
39.權利要求4的酶，表徵為可從以保藏號DSM 15716保藏的脂環酸芽孢桿菌菌株獲得的多糖脫乙醯酶或木聚糖脫乙醯酶。
40.權利要求39的多糖脫乙醯酶或木聚糖脫乙醯酶，其包含SEQ IDNO38或SEQ ID NO39中包含的成熟多糖脫乙醯酶或木聚糖脫乙醯酶或由其組成。
41.權利要求40的多糖脫乙醯酶或木聚糖脫乙醯酶，其包含SEQ IDNO38位置26到251或SEQ ID NO39位置22到324的序列或由其組成。
42.分離的酶，其選自(a)含有下述胺基酸序列的酶，所述胺基酸序列與以DSM保藏號15716保藏的脂環酸芽孢桿菌菌株分泌的選自酸性內切葡聚糖酶或酸性纖維素酶、天冬氨醯蛋白酶、多銅氧化酶、絲氨酸羧基蛋白酶、絲氨酸蛋白酶或HtrA樣絲氨酸蛋白酶、二硫化物異構酶、γ-D-穀氨醯-L-二胺基酸內肽酶、內-β-N-乙醯氨基葡糖苷酶、肽醯脯氨醯異構酶、酸性磷酸酯酶或植酸酶或磷脂酶C、多糖脫乙醯酶或木聚糖脫乙醯酶和亞硫酸鹽氧化酶的成熟酶胺基酸序列具有至少90％同一性；(b)由在高嚴格度條件下與下述多核苷酸探針雜交的核苷酸序列所編碼的多肽，所述多核苷酸探針選自(i)以DSM保藏號15716保藏的脂環酸芽孢桿菌包含的核苷酸序列的互補鏈，所述核苷酸序列編碼由該菌株分泌的選自酸性內切葡聚糖酶或酸性纖維素酶、天冬氨醯蛋白酶、多銅氧化酶、絲氨酸羧基蛋白酶、絲氨酸蛋白酶或HtrA樣絲氨酸蛋白酶、二硫化物異構酶、γ-D-穀氨醯-L-二胺基酸內肽酶、內-β-N-乙醯氨基葡糖苷酶、肽醯脯氨醯異構酶、酸性磷酸酯酶或植酸酶或磷脂酶C、多糖脫乙醯酶或木聚糖脫乙醯酶和亞硫酸鹽氧化酶的成熟酶；(ii)以DSM保藏號15716保藏的脂環酸芽孢桿菌包含的核苷酸序列包含的cDNA序列的互補鏈，所述核苷酸序列編碼由該菌株分泌的選自酸性內切葡聚糖酶或酸性纖維素酶、天冬氨醯蛋白酶、多銅氧化酶、絲氨酸羧基蛋白酶、絲氨酸蛋白酶或HtrA樣絲氨酸蛋白酶、二硫化物異構酶、γ-D-穀氨醯-L-二胺基酸內肽酶、內-β-N-乙醯氨基葡糖苷酶、肽醯脯氨醯異構酶、酸性磷酸酯酶或植酸酶或磷脂酶C、多糖脫乙醯酶或木聚糖脫乙醯酶和亞硫酸鹽氧化酶的成熟酶，(c)成熟酶片段，所述酶為以DSM保藏號15716保藏的脂環酸芽孢桿菌菌株分泌的選自酸性內切葡聚糖酶或酸性纖維素酶、天冬氨醯蛋白酶、多銅氧化酶、絲氨酸羧基蛋白酶、絲氨酸蛋白酶或HtrA樣絲氨酸蛋白酶、二硫化物異構酶、γ-D-穀氨醯-L-二胺基酸內肽酶、內-β-N-乙醯氨基葡糖苷酶、肽醯脯氨醯異構酶、酸性磷酸酯酶或植酸酶或磷脂酶C、多糖脫乙醯酶或木聚糖脫乙醯酶和亞硫酸鹽氧化酶；其中該酶具有選自酸性內切葡聚糖酶或酸性纖維素酶、天冬氨醯蛋白酶、多銅氧化酶、絲氨酸羧基蛋白酶、絲氨酸蛋白酶或HtrA樣絲氨酸蛋白酶、二硫化物異構酶、γ-D-穀氨醯-L-二胺基酸內肽酶、內-β-N-乙醯氨基葡糖苷酶、肽醯脯氨醯異構酶、酸性磷酸酯酶或植酸酶或磷脂酶C、多糖脫乙醯酶或木聚糖脫乙醯酶和亞硫酸鹽氧化酶的功能。
43.以保藏號DSM 15716保藏的細菌菌株。
44.含有權利要求1-42的多肽的組合物。
45.權利要求44的組合物，包含至少兩種權利要求1-42的不同多肽，優選至少3種，更優選至少5種，更優選至少10種，更優選至少15種，更優選至少20種權利要求1-42的不同多肽。
46.權利要求44的組合物，包含發酵脂環酸芽孢桿菌DSM 15716或其突變體樣品時分泌的所有多肽，所述突變體中缺失或添加了一個或多個基因。
47.權利要求44的組合物，其還包含一個或多個額外的酶。
48.權利要求44的組合物，表徵為除多肽外還含有表面活性劑的洗滌劑組合物。
49.權利要求44的組合物，表徵為除多肽外還含有穀類或穀物產品的飼料組合物。
50.權利要求44的組合物，表徵為食品組合物。
51.權利要求44的組合物，還包含多糖或多糖混合物。
52.製備權利要求44的組合物的方法，包括將權利要求1-42的多肽與賦形劑混和。
53.多核苷酸，其具有編碼權利要求1-42中任一項定義的多肽的核苷酸序列。
54.包含權利要求53的多核苷酸的組合物。
55.包含權利要求53定義的核苷酸序列的核酸構建體，所述核苷酸序列與一個或多個指導多肽在宿主細胞中產生的控制序列有效連接。
56.包含權利要求55的核酸構建體的重組表達載體。
57.包含權利要求55的核酸構建體的重組宿主細胞。
58.用於產生權利要求1-42的多肽的方法，包括(a)培養菌株以產生多肽，所述菌株的野生型形式能夠產生該多肽；和(b)回收該多肽。
59.用於產生權利要求1-42的多肽的方法，包括(a)在有助於產生多肽的條件下培養權利要求45定義的重組宿主細胞；和(b)回收多肽。
60.權利要求59的方法，包括(i)將脂環酸芽孢桿菌DSM 15716基因組的基因與編碼無信號報告子的基因通過轉座子標籤融合，(ii)在顯示報告子存在的培養基中培養含有脂環酸芽孢桿菌DSM 15716融合基因的宿主細胞克隆，(iii)檢測分泌報告子的克隆和(iv)分離該克隆中含有的脂環酸芽孢桿菌DSM 15716的基因和多肽。
61.適用於電子設備的存儲媒體，其包含權利要求1-42的多肽的胺基酸序列或權利要求53的多核苷酸的核苷酸序列的信息。
62.包括在工業或家庭技術方法中使用權利要求1-42的多肽或權利要求53的多核苷酸的方法。
全文摘要
公開了分離的成熟功能性多肽，其與可得自以保藏號DSM 15716保藏的細菌脂環酸芽孢桿菌的相應分泌多肽有至少90％的同一性並表現相同的功能。
文檔編號C12N15/53GK1930285SQ200580007078
公開日2007年3月14日申請日期2005年1月6日優先權日2004年1月6日
發明者R·惠爾廷, S·F·拉森, P·R·奧斯特伽德申請人:諾和酶股份有限公司

首页

算命

星座

感情

婚姻

風水

文化

生活

生肖

百科

解夢

娛樂

社會

脂環酸芽孢桿菌的多肽的製作方法

一種新型多功能組合攝影箱的製作方法

壓縮模式圖樣重疊檢測方法與裝置與流程

個性化檯曆的製作方法

一種實現縮放的視頻解碼方法

基於加熱模壓的纖維增強PBT複合材料成型工藝的製作方法

一種pe滾塑儲槽的製作方法

釘的製作方法

直流氧噴裝置的製作方法

新型熱網閥門操作手輪的製作方法

用來自動讀取管狀容器所載識別碼的裝置的製作方法