具有分解纖維增強活性的多肽及其編碼多核苷酸的製作方法
2023-05-23 09:07:11 2
>PCT/RO/134表(1992年7月)關於微生物保藏的說明(細則13之二)PCT/RO/134表(1992年7月)關於微生物保藏的說明(細則13之二)PCT/RO/134表(1992年7月)序列表110諾維信股份有限公司(NOVOZYMESBIOTECH,INC.)120具有分解纖維增強活性的多肽及其編碼多核苷酸13010587.204-WO15060/540,6611512004-01-3016078170PatentInversion3.221012111846212DNA213Thielaviaterrestris4001aattgaaggagggagtggcggagtggccaccaagtcaggcggctgtcaactaaccaagga60tgggaacagttcggctcgccttgcccgagggcagcgttccctgatggggacgaaccatgg120gactggggtcagctgctgtataaaagttcaaatcgatgatctctcagatggcgctgctgg180ggtgttctgcgcttttccatcctcgcaacctggtatcccactagtccagcgttcggcacc240atgaagtcgttcaccattgccgccttggcagccctatgggcccaggaggccgccgcccac300gcgaccttccaggacctctggattgatggagtcgactacggctcgcaatgtgtccgcctc360ccggcgtccaactcccccgtcaccaatgttgcgtccgacgatatccgatgcaatgtcggc420acctcgaggcccaccgtcaagtgcccggtcaaggccggctccacggtcacgatcgagatg480caccaggttcgcacgcctctctgcgtaggccccccagctactatatggcactaacacgac540ctccagcaacctggcgaccggtcttgcgccaacgaggctatcggcggcgaccactacggc600cccgtaatggtgtacatgtccaaggtcgatgacgcggtgacagccgacggttcatcgggc660tggttcaaggtgttccaggacagctgggccaagaacccgtcgggttcgacgggcgacgac720gactactggggcaccaaggacctcaactcgtgctgcggcaagatgaacgtcaagatcccc780gaagacatcgagccgggcgactacctgctccgcgccgaggttatcgcgctgcacgtggcc840gccagctcgggcggcgcgcagttctacatgtcctgctaccagctgaccgtgacgggctcc900ggcagcgccaccccctcgaccgtgaatttcccgggcgcctactcggccagcgacccgggc960atcctgatcaacatccacgcgcccatgtcgacctacgtcgtcccgggcccgaccgtgtac1020gcgggcggctcgaccaagtcggctggcagctcctgctccggctgcgaggcgacctgcacg1080gttggttccggccccagcgcgacactgacgcagcccacctccaccgcgaccgcgacctcc1140gcccctggcggcggcggctccggctgcacggcggccaagtaccagcagtgcggcggcacc1200ggctacactgggtgcaccacctgcgctgtaagttccctcgtgatatgcagcggaacaccg1260tctggactgttttgctaactcgcgtcgtagtccgggtctacctgcagcgccgtctcgcct1320ccgtactactcgcagtgcctctaagccgggagcgcttgctcagcgggctgctgtgaagga1380gctccatgtccccatgccgccatggccggagtaccgggctgagcgcccaattcttgtata1440tagttgagttttcccaatcatgaatacatatgcatctgcatggactgttgcgtcgtcagt1500ctacatcctttgctccactgaactgtgagaccccatgtcatccggaccattcgatcggtg1560ctcgctctaccatctcggttgatgggtctgggcttgagagtcactggcacgtcctcggcg1620gtaatgaaatgtggaggaaagtgtgagctgtctgacgcactcggcgctgatgagacgttg1680agcgcggcccacactggtgttctgtaagccagcacacaaaagaatactccaggatggccc1740atagcggcaaatatacagtatcagggatgcaaaaagtgcaaaagtaaggggctcaatcgg1800ggatcgaacccgagacctcgcacatgacttatttcaagtcaggggt18462102211326212PRT213Thielaviaterrestris4002MetLysSerPheThrIleAlaAlaLeuAlaAlaLeuTrpAlaGlnGlu151015AlaAlaAlaHisAlaThrPheGlnAspLeuTrpIleAspGlyValAsp202530TyrGlySerGlnCysValArgLeuProAlaSerAsnSerProValThr354045AsnValAlaSerAspAspIleArgCysAsnValGlyThrSerArgPro505560ThrValLysCysProValLysAlaGlySerThrValThrIleGluMet65707580HisGlnGlnProGlyAspArgSerCysAlaAsnGluAlaIleGlyGly859095AspHisTyrGlyProValMetValTyrMetSerLysValAspAspAla100105110ValThrAlaAspGlySerSerGlyTrpPheLysValPheGlnAspSer115120125TrpAlaLysAsnProSerGlySerThrGlyAspAspAspTyrTrpGly130135140ThrLysAspLeuAsnSerCysCysGlyLysMetAsnValLysIlePro145150155160GluAspIleGluProGlyAspTyrLeuLeuArgAlaGluValIleAla165170175LeuHisValAlaAlaSerSerGlyGlyAlaGlnPheTyrMetSerCys180185190TyrGlnLeuThrValThrGlySerGlySerAlaThrProSerThrVal195200205AsnPheProGlyAlaTyrSerAlaSerAspProGlyIleLeuIleAsn210215220IleHisAlaProMetSerThrTyrValValProGlyProThrValTyr225230235240AlaGlyGlySerThrLysSerAlaGlySerSerCysSerGlyCysGlu245250255AlaThrCysThrValGlySerGlyProSerAlaThrLeuThrGlnPro260265270ThrSerThrAlaThrAlaThrSerAlaProGlyGlyGlyGlySerGly275280285CysThrAlaAlaLysTyrGlnGlnCysGlyGlyThrGlyTyrThrGly290295300CysThrThrCysAlaSerGlySerThrCysSerAlaValSerProPro305310315320TyrTyrSerGlnCysLeu3252103211880212DNA213Thielaviaterrestris4003accccgggatcactgcccctaggaaccagcacacctcggtccaatcatgcggttcgacgc60cctctccgccctcgctcttgcgccgcttgtggctggccacggcgccgtgaccagctacat120catcggcggcaaaacctatcccggctacgagggcttctcgcctgcctcgagcccgccgac180gatccagtaccagtggcccgactacaacccgaccctgagcgtgaccgacccgaagatgcg240ctgcaacggcggcacctcggcagagctcagcgcgcccgtccaggccggcgagaacgtgac300ggccgtctggaagcagtggacccaccagcaaggccccgtcatggtctggatgttcaagtg360ccccggcgacttctcgtcgtgccacggcgacggcaagggctggttcaagatcgaccagct420gggcctgtggggcaacaacctcaactcgaacaactggggcaccgcgatcgtctacaagac480cctccagtggagcaacccgatccccaagaacctcgcgccgggcaactacctcatccgcca540cgagctgctcgccctgcaccaggccaacacgccgcagttctacgccgagtgcgcccagct600ggtcgtctccggcagcggctccgccctgcccccgtccgactacctctacagcatccccgt660ctacgcgccccagaacgaccccggcatcaccgtgagtgggcttccgttccgcggcgagct720ctgtggaaatcttgctgacgatgggctaggttgacatctacaacggcgggcttacctcct780acaccccgcccggcggccccgtctggtctggcttcgagttttaggcgcattgagtcgggg840gctacgaggggaaggcatctgttcgcatgagcgtgggtac8802104211478212PRT213Thielaviaterrestris4004MetArgPheAspAlaLeuSerAlaLeuAlaLeuAlaProLeuValAla151015GlyHisGlyAlaValThrSerTyrIleIleGlyGlyLysThrTyrPro202530GlyTyrGluGlyPheSerProAlaSerSerProProThrIleGlnTyr354045GlnTrpProAspTyrAsnProThrLeuSerValThrAspProLysMet505560ArgCysAsnGlyGlyThrSerAlaGluLeuSerAlaProValGlnAla65707580GlyGluAsnValThrAlaValTrpLysGlnTrpThrHisGlnGlnGly859095ProValMetValTrpMetPheLysCysProGlyAspPheSerSerSer100105110HisGlyAspGlyLysGlyTrpPheLysIleAspGlnLeuGlyLeuTrp115120125GlyAsnAsnLeuAsnSerAsnAsnTrpGlyThrAlaIleValTyrLys130135140ThrLeuGlnTrpSerAsnProIleProLysAsnLeuAlaProGlyAsn145150155160TyrLeuIleArgHisGluLeuLeuAlaLeuHisGlnAlaAsnThrPro165170175GlnPheTyrAlaGluCysAlaGlnLeuValValSerGlySerGlySer180185190AlaLeuProProSerAspTyrLeuTyrSerIleProValTyrAlaPro195200205GlnAsnAspProGlyIleThrValAspIleTyrAsnGlyGlyLeuThr210215220SerTyrThrProProGlyGlyProValTrpSerGlyPheGluPheMet225230235240ArgPheAspAlaLeuSerAlaLeuAlaLeuAlaProLeuValAlaGly245250255HisGlyAlaValThrSerTyrIleIleGlyGlyLysThrTyrProGly260265270TyrGluGlyPheSerProAlaSerSerProProThrIleGlnTyrGln275280285TrpProAspTyrAsnProThrLeuSerValThrAspProLysMetArg290295300CysAsnGlyGlyThrSerAlaGluLeuSerAlaProValGlnAlaGly305310315320GluAsnValThrAlaValTrpLysGlnTrpThrHisGlnGlnGlyPro325330335ValMetValTrpMetPheLysCysProGlyAspPheSerSerSerHis340345350GlyAspGlyLysGlyTrpPheLysIleAspGlnLeuGlyLeuTrpGly355360365AsnAsnLeuAsnSerAsnAsnTrpGlyThrAlaIleValTyrLysThr370375380LeuGlnTrpSerAsnProIleProLysAsnLeuAlaProGlyAsnTyr385390395400LeuIleArgHisGluLeuLeuAlaLeuHisGlnAlaAsnThrProGln405410415PheTyrAlaGluCysAlaGlnLeuValValSerGlySerGlySerAla420425430LeuProProSerAspTyrLeuTyrSerIleProValTyrAlaProGln435440445AsnAspProGlyIleThrValAspIleTyrAsnGlyGlyLeuThrSer450455460TyrThrProProGlyGlyProValTrpSerGlyPheGluPhe46547047521052111000212DNA213Thielaviaterrestris4005ctcctgttcctgggccaccgcttgttgcctgcactattggtagagttggtctattgctag60agttggccatgcttctcacatcagtcctcggctcggctgccctgcttgctagcggcgctg120cggcacacggcgccgtgaccagctacatcatcgccggcaagaattacccggggtgggtag180ctgattattgagggcgcattcaaggttcataccggtgtgcatggctgacaaccggctggc240agataccaaggcttttctcctgcgaactcgccgaacgtcatccaatggcaatggcatgac300tacaaccccgtcttgtcgtgcagcgactcgaagcttcgctgcaacggcggcacgtcggcc360accctgaacgccacggccgcaccgggcgacaccatcaccgccatctgggcgcagtggacg420cacagccagggccccatcctggtgtggatgtacaagtgcccgggctccttcagctcctgt480gacggctccggcgctggctggttcaagatcgacgaggccggcttccacggcgacggcgtc540aaggtcttcctcgacaccgagaacccgtccggctgggacatcgccaagctcgtcggcggc600aacaagcagtggagcagcaaggtccccgagggcctcgcccccggcaactacctcgtccgc660cacgagttgatcgccctgcaccaggccaacaacccgcagttctacccggagtgcgcccag720gtcgtcatcaccggctccggcaccgcgcagccggatgcctcatacaaggcggctatcccc780ggctactgcaaccagaatgacccgaacatcaaggtgagatccaggcgtaatgcagtctac840tgctggaaagaaagtggtccaagctaaaccgcgctccaggtgcccatcaacgaccactcc900atccctcagacctacaagattcccggccctcccgtcttcaagggcaccgccagcaagaag960gcccgggacttcaccgcctgaagttgttgaatcgatggag10002106211516212PRT213Thielaviaterrestris4006MetLeuLeuThrSerValLeuGlySerAlaAlaLeuLeuAlaSerGly151015AlaAlaAlaHisGlyAlaValThrSerTyrIleIleAlaGlyLysAsn202530TyrProGlyTyrGinGlyPheSerProAlaAsnSerProAsnValIle354045GlnTrpGlnTrpHisAspTyrAsnProValLeuSerCysSerAspSer505560LysLeuArgCysAsnGlyGlyThrSerAlaThrLeuAsnAlaThrAla65707580AlaProGlyAspThrIleThrAlaIleTrpAlaGlnTrpThrHisSer859095GlnGlyProIleLeuValTrpMetTyrLysCysProGlySerPheSer100105110SerCysAspGlySerGlyAlaGlyTrpPheLysIleAspGluAlaGly115120125PheHisGlyAspGlyValLysValPheLeuAspThrGluAsnProSer130135140GlyTrpAspIleAlaLysLeuValGlyGlyAsnLysGlnTrpSerSer145150155160LysValProGluGlyLeuAlaProGlyAsnTyrLeuValArgHisGlu165170175LeuIleAlaLeuHisGlnAlaAsnAsnProGlnPheTyrProGluCys180185190AlaGlnValValIleThrGlySerGlyThrAlaGlnProAspAlaSer195200205TyrLysAlaAlaIleProGlyTyrCysAsnGlnAsnAspProAsnIle210215220LysValProIleAsnAspHisSerIleProGlnThrTyrLysIlePro225230235240GlyProProValPheLysGlyThrAlaSerLysLysAlaArgAspPhe245250255ThrAlaMetLeuLeuThrSerValLeuGlySerAlaAlaLeuLeuAla260265270SerGlyAlaAlaAlaHisGlyAlaValThrSerTyrIleIleAlaGly275280285LysAsnTyrProGlyTyrGlnGlyPheSerProAlaAsnSerProAsn290295300ValIleGlnTrpGlnTrpHisAspTyrAsnProValLeuSerCysSer305310315320AspSerLysLeuArgCysAsnGlyGlyThrSerAlaThrLeuAsnAla325330335ThrAlaAlaProGlyAspThrIleThrAlaIleTrpAlaGlnTrpThr340345350HisSerGlnGlyProIleLeuValTrpMetTyrLysCysProGlySer355360365PheSerSerCysAspGlySerGlyAlaGlyTrpPheLysIleAspGlu370375380AlaGlyPheHisGlyAspGlyValLysValPheLeuAspThrGluAsn385390395400ProSerGlyTrpAspIleAlaLysLeuValGlyGlyAsnLysGlnTrp405410415SerSerLysValProGluGlyLeuAlaProGlyAsnTyrLeuValArg420425430HisGluLeuIleAlaLeuHisGlnAlaAsnAsnProGlnPheTyrPro435440445GluCysAlaGlnValValIleThrGlySerGlyThrAlaGlnProAsp450455460AlaSerTyrLysAlaAlaIleProGlyTyrCysAsnGlnAsnAspPro465470475480AsnIleLysValProIleAsnAspHisSerIleProGlnThrTyrLys485490495IleProGlyProProValPheLysGlyThrAlaSerLysLysAlaArg500505510AspPheThrAla5152107211681212DNA213Thielaviaterrestris4007atgctcgcaaacggtgccatcgtcttcctggccgccgccctcggcgtcagtggccactac60acctggccacgggttaacgacggcgccgactggcaacaggtccgtaaggcggacaactgg120caggacaacggctacgtcggggatgtcacgtcgccacagatccgctgtttccaggcgacc180ccgtccccggccccatccgtcctcaacaccacggccggctcgaccgtgacctactgggcc240aaccccgacgtctaccaccccgggcctgtgcagttttacatggcccgcgtgcccgatggc300gaggacatcaactcgtggaacggcgacggcgccgtgtggttcaaggtgtacgaggaccat360cctacctttggcgctcagctcacatggcccagcacgggcaagagctcgttcgcggttccc420atccccccgtgcatcaagtccggctactacctcctccgggcggagcaaatcggcctgcac480gtcgcccagagcgtaggcggagcgcagttctacatctcatgcgcccagctcagcgtcacc540ggcggcggcagcaccgagccgccgaacaaggtggccttccccggcgcttacagtgcgacg600gacccgggcattctgatcaacatctactaccctgttcccacgtcctaccagaaccccggc660ccggccgtcttcagctgctga6812108211452212PRT213Thielaviaterrestris4008MetLeuAlaAsnGlyAlaIleValPheLeuAlaAlaAlaLeuGlyVal151015SerGlyHisTyrThrTrpProArgValAsnAspGlyAlaAspTrpGln202530GlnValArgLysAlaAspAsnTrpGlnAspAsnGlyTyrValGlyAsp354045ValThrSerProGlnIleArgCysPheGlnAlaThrProSerProAla505560ProSerValLeuAsnThrThrAlaGlySerThrValThrTyrTrpAla65707580AsnProAspValTyrHisProGlyProValGlnPheTyrMetAlaArg859095ValProAspGlyGluAspIleAsnSerTrpAsnGlyAspGlyAlaVal100105110TrpPheLysValTyrGluAspHisProThrPheGlyAlaGlnLeuThr115120125TrpProSerThrGlyLysSerSerPheAlaValProIleProProCys130135140IleLysSerGlyTyrTyrLeuLeuArgAlaGluGlnIleGlyLeuHis145150155160ValAlaGlnSerValGlyGlyAlaGlnPheTyrIleSerCysAlaGln165170175LeuSerValThrGlyGlyGlySerThrGluProProAsnLysValAla180185190PheProGlyAlaTyrSerAlaThrAspProGlyIleLeuIleAsnIle195200205TyrTyrProValProThrSerTyrGlnAsnProGlyProAlaValPhe210215220SerCysMetLeuAlaAsnGlyAlaIleValPheLeuAlaAlaAlaLeu225230235240GlyValSerGlyHisTyrThrTrpProArgValAsnAspGlyAlaAsp245250255TrpGlnGlnValArgLysAlaAspAsnTrpGlnAspAsnGlyTyrVal260265270GlyAspValThrSerProGlnIleArgCysPheGlnAlaThrProSer275280285ProAlaProSerValLeuAsnThrThrAlaGlySerThrValThrTyr290295300TrpAlaAshProAspValTyrHisProGlyProValGlnPheTyrMet305310315320AlaArgValProAspGlyGluAspIleAsnSerTrpAsnGlyAspGly325330335AlaValTrpPheLysValTyrGluAspHisProThrPheGlyAlaGln340345350LeuThrTrpProSerThrGlyLysSerSerPheAlaValProIlePro355360365ProCysIleLysSerGlyTyrTyrLeuLeuArgAlaGluGlnIleGly370375380LeuHisValAlaGlnSerValGlyGlyAlaGlnPheTyrIleSerCys385390395400AlaGlnLeuSerValThrGlyGlyGlySerThrGluProProAsnLys405410415ValAlaPheProGlyAlaTyrSerAlaThrAspProGlyIleLeuIle420425430AsnIleTyrTyrProValProThrSerTyrGlnAsnProGlyProAla435440445ValPheSerCys4502109211960212DNA213Thielaviaterrestris4009atgaagggacttttcagtgccgccgccctctccctggccgtcggccaggcttcggcccat60tacatcttccagcaactctccatcaacgggaaccagtttccggtgtaccaatatattcgc120aagaacaccaattataacagtcccgttaccgatctcacgtccgacgatcttcggtgcaat180gtcggcgcccagggtgctgggacagacaccgtcacggtgaaggccggcgaccagttcacc240ttcacccttgacacccctgtttaccaccaggggcccatctccatctacatgtccaaggcc300ccgggcgcggcgtcagactacgatggcagcggcggctggttcaagatcaaggactggggc360ccgactttcaacgccgacggcacggccacctgggacatggccggctcatacacctacaac420atcccgacctgcattcccgacggcgactatctgctccgcatccagtcgctggccatccac480aacccctggccggcgggcatcccgcagttctacatctcctgcgcccagatcaccgtgacc540ggcggcggcaacggcaaccctggcccgacggccctcatccccggcgccttcaaggacacc600gacccgggctacacggtgaacatctacacgaacttccacaactacacggttcccggcccg660gaggtcttcagctgcaacggcggcggctcgaacccgcccccgccggtgagtagcagcacg720cccgcgaccacgacgctggtcacgtcgacgcgcaccacgtcctccacgtcctccgcctcg780acgccggcctcgaccggcggctgcaccgtcgccaagtggggccagtgcggcggcaacggg840tacaccggctgcacgacctgcgcggccgggtccacctgcagcaagcagaacgactactac900tcgcagtgcttgtaagggaggccgcaaagcatgaggtgtttgaagaggaggagaggggtc96021010211608212PRT213Thielaviaterrestris40010MetLysGlyLeuPheSerAlaAlaAlaLeuSerLeuAlaValGlyGln151015AlaSerAlaHisTyrIlePheGlnGlnLeuSerIleAsnGlyAsnGln202530PheProValTyrGlnTyrIleArgLysAsnThrAsnTyrAsnSerPro354045ValThrAspLeuThrSerAspAspLeuArgCysAsnValGlyAlaGln505560GlyAlaGlyThrAspThrValThrValLysAlaGlyAspGlnPheThr65707580PheThrLeuAspThrProValTyrHisGlnGlyProIleSerIleTyr859095MetSerLysAlaProGlyAlaAlaSerAspTyrAspGlySerGlyGly100105110TrpPheLysIleLysAspTrpGlyProThrPheAsnAlaAspGlyThr115120125AlaThrTrpAspMetAlaGlySerTyrThrTyrAsnIleProThrCys130135140IleProAspGlyAspTyrLeuLeuArgIleGlnSerLeuAlaIleHis145150155160AsnProTrpProAlaGlyIleProGlnPheTyrIleSerCysAlaGln165170175IleThrValThrGlyGlyGlyAsnGlyAsnProGlyProThrAlaLeu180185190IleProGlyAlaPheLysAspThrAspProGlyTyrThrValAsnIle195200205TyrThrAsnPheHisAsnTyrThrValProGlyProGluValPheSer210215220CysAsnGlyGlyGlySerAsnProProProProValSerSerSerThr225230235240ProAlaThrThrThrLeuValThrSerThrArgThrThrSerSerThr245250255SerSerAlaSerThrProAlaSerThrGlyGlyCysThrValAlaLys260265270TrpGlyGlnCysGlyGlyAsnGlyTyrThrGlyCysThrThrCysAla275280285AlaGlySerThrCysSerLysGlnAsnAspTyrTyrSerGlnCysLeu290295300MetLysGlyLeuPheSerAlaAlaAlaLeuSerLeuAlaValGlyGln305310315320AlaSerAlaHisTyrIlePheGlnGlnLeuSerIleAsnGlyAshGln325330335PheProValTyrGlnTyrIleArgLysAsnThrAsnTyrAsnSerPro340345350ValThrAspLeuThrSerAspAspLeuArgCysAsnValGlyAlaGln355360365GlyAlaGlyThrAspThrValThrValLysAlaGlyAspGlnPheThr370375380PheThrLeuAspThrProValTyrHisGlnGlyProIleSerIleTyr385390395400MetSerLysAlaProGlyAlaAlaSerAspTyrAspGlySerGlyGly405410415TrpPheLysIleLysAspTrpGlyProThrPheAsnAlaAspGlyThr420425430AlaThrTrpAspMetAlaGlySerTyrThrTyrAsnIleProThrCys435440445IleProAspGlyAspTyrLeuLeuArgIleGlnSerLeuAlaIleHis450455460AsnProTrpProAlaGlyIleProGlnPheTyrIleSerCysAlaGln465470475480IleThrValThrGlyGlyGlyAsnGlyAsnProGlyProThrAlaLeu485490495IleProGlyAlaPheLysAspThrAspProGlyTyrThrValAsnIle500505510TyrThrAsnPheHisAsnTyrThrValProGlyProGluValPheSer515520525CysAsnGlyGlyGlySerAsnProProProProValSerSerSerThr530535540ProAlaThrThrThrLeuValThrSerThrArgThrThrSerSerThr545550555560SerSerAlaSerThrProAlaSerThrGlyGlyCysThrValAlaLys565570575TrpGlyGlnCysGlyGlyAsnGlyTyrThrGlyCysThrThrCysAla580585590AlaGlySerThrCysSerLysGlnAsnAspTyrTyrSerGlnCysLeu5956006052101121117212PRT213Thielaviaterrestris220221MISC_FEATURE222(1)..(1)223Xaa=Ile或Leu220221MISC_FEATURE222(16)..(16)223Xaa=Ile或Leu40011XaaProAlaSerAsnSerProValThrAsnValAlaSerAspAspXaa151015Arg2101221113212PRT213Thielaviaterrestris220221MISC_FEATURE222(1)..(1)223Xaa=Ile或Leu220221MISC_FEATURE222(5)..(5)223Xaa=Ile或Leu220221MISC_FEATURE222(11)..(12)223Xaa=Ile或Leu40012XaaProGluAspXaaGluProGlyAspTyrXaaXaaArg15102101321117212PRT213Thielaviaterrestris40013CysProGlySerPheSerSerCysAspGlySerGlyAlaGlyTrpPhe151015Lys2101421112212PRT213Thielaviaterrestris220221MISC_FEATURE222(1)..(1)223Xaa=Ile或Leu40014XaaAspGluAlaGlyPheHisGlyAspGlyValLys15102101521110212PRT213Thielaviaterrestris220221MISC_FEATURE222(1)..(2)223Xaa=任何胺基酸220221MISC_FEATURE222(8)..(9)223Xaa=Ile或Leu40015XaaXaaAlaProGlyAsnTyrXaaXaaArg15102101621122212DNA213構巢麴黴(Aspergillusnidulans)40016gtgccccatgatacgcctccgg222101721126212DNA213構巢麴黴(Aspergillusnidulans)40017gagtcgtatttccaaggctcctgacc262101821124212DNA213構巢麴黴(Aspergillusnidulans)40018ggaggccatgaagtggaccaacgg242101921145212DNA213黑麴黴(Aspergillusniger)40019caccgtgaaagccatgctctttccttcgtgtagaagaccagacag452102021145212DNA213黑麴黴(Aspergillusniger)40020ctggtcttctacacgaaggaaagagcatggctttcacggtgtctg452102121144212DNA213黑麴黴(Aspergillusniger)40021ctatatacacaactggatttaccatgggcccgcggccgcagatc442102221144212DNA213黑麴黴(Aspergillusniger)40022gatctgcggccgcgggcccatggtaaatccagttgtgtatatag442102321117212PRT213Thielaviaterrestris220221MISC_FEATURE222(1)..(1)223Xaa=Ile或Leu220221MISC_FEATURE222(16)..(16)223Xaa=Ile或Leu40023XaaProAlaSerAsnSerProValThrAsnValAlaSerAspAspXaa151015Arg2102421113212PRT213Thielaviaterrestris220221MISC_FEATURE222(1)..(1)223Xaa=Ile或Leu220221MISC_FEATURE222(5)..(5)223Xaa=Ile或Leu220221MISC_FEATURE222(11)..(12)223Xaa=Ile或Leu40024XaaProGluAspXaaGluProGlyAspTyrXaaXaaArg15102102521128212DNA213Thielaviaterrestris220221misc_feature222(20)..(20)223N=A,C,G,或T220221misc_feature222(26)..(26)223N=A,C,G,或T40025cctccaactcccccgtcacnaaygtngc282102621127212DNA213Thielaviaterrestris220221misc_feature222(19)..(19)223N=A,C,G,或T220221misc_feature222(22)..(22)223N=A,C,G,或T40026ggcgcggaggaggtartcnccnggytc272102721116212PRT213Thielaviaterrestris40027SerGlyAlaGlyTrpPheLysIleAspGluAlaGlyPheHisGlyAsp151015210282118212PRT213Thielaviaterrestris220221MISC_FEATURE2226)..(7)223Xaa=Ile或Leu40028AlaProGlyAsnTyrXaaXaaArg152102921111212PRT213Thielaviaterrestris40029AlaProGlyAsnTyrLeuIleArgHisGluLeu15102103021111212PRT213Thielaviaterrestris40030AlaProGlyAsnTyrLeuValArgHisGluLeu1510210312119212PRT213Thielaviaterrestris40031GlyAlaGlyTrpPheLysIleAspGlu152103221127212DNA213Thielaviaterrestris220221misc_feature222(19)..(19)223R=A或G220221misc_feature222(22)..(22)223H=A,C,或T220221misc_feature222(25)..(25)223Y=C或T40032cggcgcgggctggtttaarathgayga272103321132212DNA213Thielaviaterrestris220221misc_feature222(21)..(21)223R=A或G220221misc_feature222(24)..(24)223N=A,C,G,或T220221misc_feature222(27)..(27)223N=A,C,G,或rT220221misc_feature222(30)..(30)223N=A,C,G,或T40033agttcatggcgaatcagatarttnccnggngc322103421125212DNA213Thielaviaterrestris40034cttggtaccgagctcggatccacta252103521125212DNA213Thielaviaterrestris40035atagggcgaattgggccctctagat252103621132212DNA213Thielaviaterrestris40036acaactggatttaccatgcggttcgacgcctc322103721133212DNA213Thielaviaterrestris40037gtcagtcacctctagttactaaaactcgaagcc332103821121212DNA213Thielaviaterrestris40038catgccatggatgcttctcac212103921125212DNA213Thielaviaterrestris40039ccttaattaatcaggcggtgaagtc252104021132212DNA213Thielaviaterrestris40040tcgtcggggacaactttgtacaaaaaagttgg322104121127212DNA213Thielaviaterrestris40041cccctgttgaaacatgttttttcaacc272104221116212DNA213Thielaviaterrestris40042gtaaaacgacggccag162104321125212DNA213大腸桿菌(Escherichiacoli)220221misc_feature222(24)..(27)223V=A,C,或G220221misc_feature222(25)..(25)223N=A,C,G,或T40043tttttttttttttttttttttttvn252104421127212DNA213大腸桿菌(Escherichiacoli)40044ggggacaactttgtacaaaaaagttgg272104521127212DNA213大腸桿菌(Escherichiacoli)40045aaaggtaggatggtcctcgtacacctt272104621136212DNA213Thielaviaterrestris40046actggattaccatgctcgcaaacggtgccatcgtct362104721138212DNA213Thielaviaterrestris40047tcacctctagttaattaatcagcagctgaagacggccg382104821131212DNA213Thielaviaterrestris40048actggatttaccatgaagtcgttcaccattg312104921131212DNA213Thielaviaterrestris40049agtcacctctagttagaggcactgcgagtag312105021132212DNA213Thielaviaterrestris40050acaactggatttaccatgcggttcgacgcctc322105121133212DNA213Thielaviaterrestris40051gtcagtcacctctagttactaaaactcgaagcc332105221127212DNA213Thielaviaterrestris40052actggattaccatgcttctcacatcag272105321130212DNA213Thielaviaterrestris40053agtcacctctagttatcaggcggtgaagtc302105421131212DNA213Thielaviaterrestris40054actggattaccatgaagggacttttcagtgc312105521131212DNA213Thielaviaterrestris40055agtcacctctagttagaggcactgcgagtag312105621129212DNA213裡氏木黴(Trichodermareesei)40056aacgttaattaaggaatcgttttgtgttt292105721129212DNA213裡氏木黴(Trichodermareesei)40057agtactagtagctccgtggcgaaagcctg292105821126212DNA213裡氏木黴(Trichodermareesei)40058actagtcgaccgaatgtaggattgtt262105921119212DNA213裡氏木黴(Trichodermareesei)40059tgaccatggtgcgcagtcc192106021126212DNA213裡氏木黴(Trichodermareesei)40060cgatcgtctccctatgggtcattacc262106121128212DNA213裡氏木黴(Trichodermareesei)40061actagttaattaagctccgtggcgaaag282106221124212DNA213大腸桿菌(Escherichiacoli)40062gggttcgaattcatttaaacggct242106321124212DNA213大腸桿菌(Escherichiacoli)40063gggagcgctcaatattcatctctc242106421126212DNA213大腸桿菌(Escherichiacoli)40064ggtcgcggaggcgatggatgcgatcg262106521126212DNA213大腸桿菌(Escherichiacoli)40065cgatcgcatccatcgcctccgcgacc262106621134212DNA213Thielaviaterrestris40066cgcggactgcgcaccatgaagtcgttcaccattg342106721131212DNA213Thielaviaterrestris40067tcgccacggagcttagaggcactgcgagtag312106821123212DNA213Thielaviaterrestris40068gcccatggaccatgctcgcaaac232106921123212DNA213Thielaviaterrestris40069cctctagttaattaatcagcagc232107021123212DNA213Thielaviaterrestris40070gcccatggaccatgaagggactt232107121123212DNA213Thielaviaterrestris40071cctctagttaattaattacaagc232107221119212DNA213裡氏木黴(Trichodermareesei)40072ggatgaagctcattagccg192107321131212DNA213煙麴黴(Aspergillusfumigatus)40073actggatttaccatgagattcggttggctcg312107421131212DNA213煙麴黴(Aspergillusfumigatus)40074agtcacctctagttactagtagacacggggc31210752113060212DNA213煙麴黴(Aspergillusfumigatus)40075atgagattcggttggctcgaggtggccgctctgacggccgcttctgtagccaatgcccag60gtttgtgatgctttcccgtcattgtttcggatatagttgacaatagtcatggaaataatc120aggaattggctttctctccaccattctacccttcgccttgggctgatggccagggagagt180gggcagatgcccatcgacgcgccgtcgagatcgtttctcagatgacactggcggagaagg240ttaaccttacaacgggtactgggtgggttgcgacttttttgttgacagtgagctttcttc300actgaccatctacacagatgggaaatggaccgatgcgtcggtcaaaccggcagcgttccc360aggtaagcttgcaattctgcaacaacgtgcaagtgtagttgctaaaacgcggtggtgcag420acttggtatcaactggggtctttgtggccaggattcccctttgggtatccgtttctgtga480gctatacccgcggagtctttcagtccttgtattatgtgctgatgattgtctctgtatagc540tgacctcaactccgccttccctgctggtactaatgtcgccgcgacatgggacaagacact600cgcctaccttcgtggcaaggccatgggtgaggaattcaacgacaagggcgtggacatttt660gctggggcctgctgctggtcctctcggcaaatacccggacggcggcagaatctgggaagg720cttctctcctgatccggttctcactggtgtacttttcgccgaaactatcaagggtatcca780agacgcgggtgtgattgctactgccaagcattacattctgaatgaacaggagcatttccg840acaggttggcgaggcccagggatatggttacaacatcacggagacgatcagctccaacgt900ggatgacaagaccatgcacgagttgtacctttggtgagtagttgacactgcaaatgagga960ccttgattgatttgactgacctggaatgcaggccctttgcagatgctgtgcgcggtaaga1020ttttccgtagacttgacctcgcgacgaagaaatcgctgacgaaccatcgtagctggcgtt1080ggcgctgtcatgtgttcctacaatcaaatcaacaacagctacggttgtcaaaacagtcaa1140actctcaacaagctcctcaaggctgagctgggcttccaaggcttcgtcatgagtgactgg1200agcgctcaccacagcggtgtcggcgctgccctcgctgggttggatatgtcgatgcctgga1260gacatttccttcgacgacggactctccttctggggcacgaacctaactgtcagtgttctt1320aacggcaccgttccagcctggcgtgtcgatgacatggctgttcgtatcatgaccgcgtac1380tacaaggttggtcgtgaccgtcttcgtattccccctaacttcagctcctggacccgggat1440gagtacggctgggagcattctgctgtctccgagggagcctggaccaaggtgaacgacttc1500gtcaatgtgcagcgcagtcactctcagatcatccgtgagattggtgccgctagtacagtg1560ctcttgaagaacacgggtgctcttcctttgaccggcaaggaggttaaagtgggtgttctc1620ggtgaagacgctggttccaacccgtggggtgctaacggctgccccgaccgcggctgtgat1680aacggcactcttgctatggcctggggtagtggtactgccaacttcccttaccttgtcacc1740cccgagcaggctatccagcgagaggtcatcagcaacggcggcaatgtctttgctgtgact1800gataacggggctctcagccagatggcagatgttgcatctcaatccaggtgagtgcgggct1860cttagaaaaagaacgttctctgaatgaagttttttaaccattgcgaacagcgtgtctttg1920gtgtttgtcaacgccgactctggagagggtttcatcagtgtcgacggcaacgagggtgac1980cgcaaaaatctcactctgtggaagaacggcgaggccgtcattgacactgttgtcagccac2040tgcaacaacacgattgtggttattcacagtgttgggcccgtcttgatcgaccggtggtat2100gataaccccaacgtcactgccatcatctgggccggcttgcccggtcaggagagtggcaac2160tccctggtcgacgtgctctatggccgcgtcaaccccagcgccaagaccccgttcacctgg2220ggcaagactcgggagtcttacggggctcccttgctcaccgagcctaacaatggcaatggt2280gctccccaggatgatttcaacgagggcgtcttcattgactaccgtcactttgacaagcgc2340aatgagacccccatttatgagtttggccatggcttgagctacaccacctttggttactct2400caccttcgggttcaggccctcaatagttcgagttcggcatatgtcccgactagcggagag2460accaagcctgcgccaacctatggtgagatcggtagtgccgccgactacctgtatcccgag2520ggtctcaaaagaattaccaagtttatttacccttggctcaactcgaccgacctcgaggat2580tcttctgacgacccgaactacggctgggaggactcggagtacattcccgaaggcgctagg2640gatgggtctcctcaacccctcctgaaggctggcggcgctcctggtggtaaccctaccctt2700tatcaggatcttgttagggtgtcggccaccataaccaacactggtaacgtcgccggttat2760gaagtccctcaattggtgagtgacccgcatgttccttgcgttgcaatttggctaactcgc2820ttctagtatgtttcactgggcggaccgaacgagcctcgggtcgttctgcgcaagttcgac2880cgaatcttcctggctcctggggagcaaaaggtttggaccacgactcttaaccgtcgtgat2940ctcgccaattgggatgtggaggctcaggactgggtcatcacaaagtaccccaagaaagtg3000cacgtcggcagctcctcgcgtaagctgcctctgagagcgcctctgccccgtgtctactag306021076211863212PRT213煙麴黴(Aspergillusfumigatus)40076MetArgPheGlyTrpLeuGluValAlaAlaLeuThrAlaAlaSerVal151015AlaAsnAlaGlnGluLeuAlaPheSerProProPheTyrProSerPro202530TrpAlaAspGlyGlnGlyGluTrpAlaAspAlaHisArgArgAlaVal354045GluIleValSerGlnMetThrLeuAlaGluLysValAsnLeuThrThr505560GlyThrGlyTrpGluMetAspArgCysValGlyGlnThrGlySerVal65707580ProArgLeuGlyIleAsnTrpGlyLeuCysGlyGlnAspSerProLeu859095GlyIleArgPheSerAspLeuAsnSerAlaPheProAlaGlyThrAsn100105110ValAlaAlaThrTrpAspLysThrLeuAlaTyrLeuArgGlyLysAla115120125MetGlyGluGluPheAsnAspLysGlyValAspIleLeuLeuGlyPro130135140AlaAlaGlyProLeuGlyLysTyrProAspGlyGlyArgIleTrpGlu145150155160GlyPheSerProAspProValLeuThrGlyValLeuPheAlaGluThr165170175IleLysGlyIleGlnAspAlaGlyValIleAlaThrAlaLysHisTyr180185190IleLeuAsnGluGlnGluHisPheArgGlnValGlyGluAlaGlnGly195200205TyrGlyTyrAsnIleThrGluThrIleSerSerAsnValAspAspLys210215220ThrMetHisGluLeuTyrLeuTrpProPheAlaAspAlaValArgAla225230235240GlyValGlyAlaValMetCysSerTyrAsnGlnIleAsnAsnSerTyr245250255GlyCysGlnAsnSerGlnThrLeuAsnLysLeuLeuLysAlaGluLeu260265270GlyPheGlnGlyPheValMetSerAspTrpSerAlaHisHisSerGly275280285ValGlyAlaAlaLeuAlaGlyLeuAspMetSerMetProGlyAspIle290295300SerPheAspAspGlyLeuSerPheTrpGlyThrAsnLeuThrValSer305310315320ValLeuAsnGlyThrValProAlaTrpArgValAspAspMetAlaVal325330335ArgIleMetThrAlaTyrTyrLysValGlyArgAspArgLeuArgIle340345350ProProAsnPheSerSerTrpThrArgAspGluTyrGlyTrpGluHis355360365SerAlaValSerGluGlyAlaTrpThrLysValAsnAspPheValAsn370375380ValGlnArgSerHisSerGlnIleIleArgGluIleGlyAlaAlaSer385390395400ThrValLeuLeuLysAsnThrGlyAlaLeuProLeuThrGlyLysGlu405410415ValLysValGlyValLeuGlyGluAspAlaGlySerAsnProTrpGly420425430AlaAsnGlyCysProAspArgGlyCysAspAsnGlyThrLeuAlaMet435440445AlaTrpGlySerGlyThrAlaAsnPheProTyrLeuValThrProGlu450455460GlnAlaIleGlnArgGluValIleSerAsnGlyGlyAsnValPheAla465470475480ValThrAspAsnGlyAlaLeuSerGlnMetAlaAspValAlaSerGln485490495SerSerValSerLeuValPheValAsnAlaAspSerGlyGluGlyPhe500505510IleSerValAspGlyAsnGluGlyAspArgLysAsnLeuThrLeuTrp515520525LysAsnGlyGluAlaValIleAspThrValValSerHisCysAsnAsn530535540ThrIleValValIleHisSerValGlyProValLeuIleAspArgTrp545550555560TyrAspAsnProAsnValThrAlaIleIleTrpAlaGlyLeuProGly565570575GlnGluSerGlyAsnSerLeuValAspValLeuTyrGlyArgValAsn580585590ProSerAlaLysThrProPheThrTrpGlyLysThrArgGluSerTyr595600605GlyAlaProLeuLeuThrGluProAsnAsnGlyAsnGlyAlaProGln610615620AspAspPheAsnGluGlyValPheIleAspTyrArgHisPheAspLys625630635640ArgAsnGluThrProIleTyrGluPheGlyHisGlyLeuSerTyrThr645650655ThrPheGlyTyrSerHisLeuArgValGlnAlaLeuAsnSerSerSer660665670SerAlaTyrValProThrSerGlyGluThrLysProAlaProThrTyr675680685GlyGluIleGlySerAlaAlaAspTyrLeuTyrProGluGlyLeuLys690695700ArgIleThrLysPheIleTyrProTrpLeuAsnSerThrAspLeuGlu705710715720AspSerSerAspAspProAsnTyrGlyTrpGluAspSerGluTyrIle725730735ProGluGlyAlaArgAspGlySerProGlnProLeuLeuLysAlaGly740745750GlyAlaProGlyGlyAsnProThrLeuTyrGlnAspLeuValArgVal755760765SerAlaThrIleThrAsnThrGlyAsnValAlaGlyTyrGluValPro770775780GlnLeuTyrValSerLeuGlyGlyProAsnGluProArgValValLeu785790795800ArgLysPheAspArgIlePheLeuAlaProGlyGluGlnLysValTrp805810815ThrThrThrLeuAsnArgArgAspLeuAlaAsnTrpAspValGluAla820825830GlnAspTrpValIleThrLysTyrProLysLysValHisValGlySer835840845SerSerArgLysLeuProLeuArgAlaProLeuProArgValTyr8508558602107721130212DNA213煙麴黴(Aspergillusfumigatus)40077ggactgcgcaccatgagattcggttggctc302107821130212DNA213煙麴黴(Aspergillusfumigatus)40078tcgccacggagcttactagtagacacgggg30權利要求1.具有增強的纖維素分解活性的分離多肽,包括[ILMV]-P-X(4,5)-G-X-Y-[ILMV]-X-R-X-[EQ]-X(4)-[HNQ]和[FW]-[TF]-K-[AIV],其中X是任何胺基酸,X(4,5)是在4或5個連續位置的任何胺基酸,以及X(4)是在4個連續位置的任何胺基酸。2.權利要求1的分離多肽,進一步包括H-X(1,2)-G-P-X(3)-[YW]-[AILMV],[EQ]-X-Y-X(2)-C-X-[EHQN]-[FILV]-X-[ILV],或H-X(1,2)-G-P-X(3)-[YW]-[AILMV]和[EQ]-X-Y-X(2)-C-X-[EHQN]-[FILV]-X-[ILV],其中X是任何胺基酸,X(1,2)是在1個位置或2個連續位置的任何胺基酸,X(3)是在3個連續位置的任何胺基酸,以及X(2)是在2個連續位置的任何胺基酸。3.包括編碼權利要求1或2所述多肽的核苷酸序列的分離多核苷酸。4.核酸構建體,其包括與指導所述多肽在表達宿主中產生的一個或多個調控序列可操作連接的權利要求4所述的多核苷酸。5.包括權利要求4的核酸構建體的重組表達載體。6.包括權利要求4的核酸構建體的重組宿主細胞。7.用於生產權利要求1或2所述的多肽的方法,包括(a)在有助於生產該多肽的條件下培養細胞;以及(b)回收該多肽。8.具有增強的纖維素分解活性的分離多肽,選自(a)具有與SEQIDNO2的第20至326位胺基酸、SEQIDNO4的第18至240位胺基酸、SEQIDNO6的第20至258位胺基酸、SEQIDNO8的第19至226位胺基酸、或SEQIDNO10的第20至304位胺基酸、SEQIDNO4的第18至240位胺基酸、SEQIDNO6的第20至258位胺基酸、SEQIDNO8的第19至226位胺基酸、或SEQIDNO10的第20至304位胺基酸有至少75%同一性的胺基酸序列的多肽;(b)由至少在中等嚴謹條件下與下列雜交的多核苷酸編碼的多肽(i)SEQIDNO1的第388至1332位核苷酸、SEQIDNO3的第98至821位核苷酸、SEQIDNO5的第126至978位核苷酸、SEQIDNO7的第55至678位核苷酸、或SEQIDNO9的第58至912位核苷酸,(ii)包含於SEQIDNO1的第388至1332位核苷酸、SEQIDNO3的第98至821位核苷酸、或SEQIDNO5的第126至978位核苷酸中的cDNA序列、或包括SEQIDNO7的第55至678位核苷酸或SEQIDNO9的第58至912位核苷酸的基因組DNA序列,或(iii)(i)或(ii)的互補鏈;以及(c)包括SEQIDNO2的第20至326位胺基酸、SEQIDNO4的第18至240位胺基酸、SEQIDNO6的第20至258位胺基酸、SEQIDNO8的第19至226位胺基酸、或SEQIDNO10的第20至304位胺基酸、SEQIDNO4的第18至240位胺基酸、SEQIDNO6的第20至258位胺基酸、SEQIDNO8的第19至226位胺基酸、或SEQIDNO10的第20至304位胺基酸中一個或多個胺基酸保守取代、缺失、和/或插入的變體。9.權利要求8的多肽,具有與SEQIDNO2的第20至326位胺基酸、SEQIDNO4的第18至240位胺基酸、SEQIDNO6的第20至258位胺基酸、SEQIDNO8的第19至226位胺基酸、或SEQIDNO10的第20至304位胺基酸有至少75%同一性的胺基酸序列。10.權利要求9的多肽,具有與SEQIDNO2的第20至326位胺基酸、SEQIDNO4的第18至240位胺基酸、SEQIDNO6的第20至258位胺基酸、SEQIDNO8的第19至226位胺基酸、或SEQIDNO10的第20至304位胺基酸有至少80%同一性的胺基酸序列。11.權利要求10的多肽,具有與SEQIDNO2的第20至326位胺基酸、SEQIDNO4的第18至240位胺基酸、SEQIDNO6的第20至258位胺基酸、SEQIDNO8的第19至226位胺基酸、或SEQIDNO10的第20至304位胺基酸有至少85%同一性的胺基酸序列。12.權利要求11的多肽,具有與SEQIDNO2的第20至326位胺基酸、SEQIDNO4的第18至240位胺基酸、SEQIDNO6的第20至258位胺基酸、SEQIDNO8的第19至226位胺基酸、或SEQIDNO11的第20至304位胺基酸有至少90%同一性的胺基酸序列。13.權利要求12的多肽,具有與SEQIDNO2的第20至326位胺基酸、SEQIDNO4的第18至240位胺基酸、SEQIDNO6的第20至258位胺基酸、SEQIDNO8的第19至226位胺基酸、或SEQIDNO12的第20至304位胺基酸有至少95%同一性的胺基酸序列。14.權利要求13的多肽,具有與SEQIDNO2的第20至326位胺基酸、SEQIDNO4的第18至240位胺基酸、SEQIDNO6的第20至258位胺基酸、SEQIDNO8的第19至226位胺基酸、或SEQIDNO13的第20至304位胺基酸有至少97%同一性的胺基酸序列。15.權利要求8-14中任一項的多肽,包括SEQIDNO2、SEQIDNO4、SEQIDNO6、SEQIDNO8、或SEQIDNO10的胺基酸序列。16.權利要求8-15中任一項的多肽,其由SEQIDNO2、SEQIDNO4、SEQIDNO6、SEQIDNO8、或SEQIDNO10;或其具有增強的纖維素分解活性的片段組成。17.權利要求16的多肽,由SEQIDNO2、SEQIDNO4、SEQIDNO6、SEQIDNO8、或SEQIDNO10組成。18.權利要求16的多肽,由SEQIDNO2的第20至326位胺基酸、SEQIDNO4的第18至240位胺基酸、SEQIDNO6的第20至258位胺基酸、SEQIDNO8的第19至226位胺基酸、或SEQIDNO10的第20至304位胺基酸組成。19.權利要求8的多肽,其由至少在中等嚴謹條件下與下列雜交的多核苷酸編碼(i)SEQIDNO1的第388至1332位核苷酸、SEQIDNO3的第98至821位核苷酸、SEQIDNO5的第126至978位核苷酸、SEQIDNO7的第55至678位核苷酸、或SEQIDNO9的第58至912位核苷酸,(ii)包含於SEQIDNO1的第388至1332位核苷酸、SEQIDNO3的第98至821位核苷酸、或SEQIDNO5的第126至978位核苷酸中的cDNA序列、或包括SEQIDNO7的第55至678位核苷酸或SEQIDNO9的第58至912位核苷酸的基因組DNA序列,或(iii)(i)或(ii)的互補鏈。20.權利要求19的多肽,其由至少在中-高嚴謹條件下與下列雜交的多核苷酸編碼(i)SEQIDNO1的第388至1332位核苷酸、SEQIDNO3的第98至821位核苷酸、SEQIDNO5的第126至978位核苷酸、SEQIDNO7的第55至678位核苷酸、或SEQIDNO9的第58至912位核苷酸,(ii)包含於SEQIDNO1的第388至1332位核苷酸、SEQIDNO3的第98至821位核苷酸、或SEQIDNO5的第126至978位核苷酸中的cDNA序列、或包括SEQIDNO7的第55至678位核苷酸或SEQIDNO9的第58至912位核苷酸的基因組DNA序列,或(iii)(i)或(ii)的互補鏈。21.權利要求20的多肽,其由至少在高嚴謹條件下與下列雜交的多核苷酸編碼(i)SEQIDNO1的第388至1332位核苷酸、SEQIDNO3的第98至821位核苷酸、SEQIDNO5的第126至978位核苷酸、SEQIDNO7的第55至678位核苷酸、或SEQIDNO9的第58至912位核苷酸,(ii)包含於SEQIDNO1的第388至1332位核苷酸、SEQIDNO3的第98至821位核苷酸、或SEQIDNO5的第126至978位核苷酸中的cDNA序列、或包括SEQIDNO7的第55至678位核苷酸或SEQIDNO9的第58至912位核苷酸的基因組DNA序列,或(iii)(i)或(ii)的互補鏈。22.權利要求8的多肽,其中該多肽是包括SEQIDNO2的第20至326位胺基酸、SEQIDNO4的第18至240位胺基酸、SEQIDNO6的第20至258位胺基酸、SEQIDNO8的第19至226位胺基酸、或SEQIDNO10的第20至304位胺基酸中一個或多個胺基酸的保守取代、缺失、和/或插入的變體。23.權利要求8的多肽,其由在包含於大腸桿菌NRRLB-30699中的質粒pEJG120、包含於大腸桿菌NRRLB-30813的質粒pTter61C、包含於大腸桿菌NRRLB-30812中的質粒pTter61D、包含於大腸桿菌NRRLB-30814中的質粒pTter61E、或包含於大腸桿菌NRRLB-30811中的質粒pTter61G中的多核苷酸編碼。24.包括編碼權利要求8-23中任一項的多肽的核苷酸序列的分離多核苷酸。25.權利要求24的分離多核苷酸,其在SEQIDNO1、3、5、7、或9的成熟多肽編碼序列中具有至少一個突變,其中該突變的核苷酸序列編碼由SEQIDNO2的第20至326位胺基酸、SEQIDNO4的第18至240位胺基酸、SEQIDNO6的第20至258位胺基酸、SEQIDNO8的第19至226位胺基酸、或SEQIDNO10的第20至304位胺基酸組成的多肽。26.核酸構建體,其包括與指導所述多肽在表達宿主中產生的一個或多個調控序列可操作連接的權利要求24所述的多核苷酸。27.包括權利要求26的核酸構建體的重組表達載體。28.包括權利要求26的核酸構建體的重組宿主細胞。29.用於生產權利要求8-23中任一項的多肽的方法,包括(a)在有助於生產該多肽的條件下培養其野生型能夠生產該多肽的細胞;以及(b)回收該多肽。30.用於生產權利要求8-23中任一項的多肽的方法,包括(a)在有助於生產該多肽的條件下培養包括含有編碼該多肽的核苷酸序列的核酸構建體的宿主細胞;以及(b)回收該多肽。31.用於生產親代細胞的突變體的方法,其包括斷裂或缺失編碼權利要求8-23中任一項的多肽的核苷酸序列,其導致該突變體比所述母細胞生產更少的該多肽。32.通過權利要求31的方法生產的突變體細胞。33.權利要求32的突變體細胞,其進一步包括編碼天然或異源蛋白質的基因。34.用於生產蛋白質的方法,包括(a)在有助於生產該蛋白質的條件下培養權利要求33的突變體細胞;以及(b)回收該蛋白質。35.權利要求24的分離多核苷酸,其通過(a)在中等嚴謹條件下使DNA群與下列雜交(i)SEQIDNO1的第388至1332位核苷酸、SEQIDNO3的第98至821位核苷酸、SEQIDNO5的第126至978位核苷酸、SEQIDNO7的第55至678位核苷酸、或SEQIDNO9的第58至912位核苷酸,(ii)包含於SEQIDNO1的第388至1332位核苷酸、SEQIDNO3的第98至821位核苷酸、或SEQIDNO5的第126至978位核苷酸中的cDNA序列、或包括SEQIDNO7的第55至678位核苷酸或SEQIDNO9的第58至912位核苷酸的基因組DNA序列,或(iii)(i)或(ii)的互補鏈;以及(b)分離所述雜交的多核苷酸,其編碼具有分解纖維增強活性的多肽來獲得。36.權利要求35的分離多核苷酸,其通過(a)在中-高嚴謹條件下使DNA群與下列雜交(i)SEQIDNO1的第388至1332位核苷酸、SEQIDNO3的第98至821位核苷酸、SEQIDNO5的第126至978位核苷酸、SEQIDNO7的第55至678位核苷酸、或SEQIDNO9的第58至912位核苷酸,(ii)包含於SEQIDNO1的第388至1332位核苷酸、SEQIDNO3的第98至821位核苷酸、或SEQIDNO5的第126至978位核苷酸中的cDNA序列、或包括SEQIDNO7的第55至678位核苷酸或SEQIDNO9的第58至912位核苷酸的基因組DNA序列,或(iii)(i)或(ii)的互補鏈;以及(b)分離該編碼具有分解纖維增強活性的多肽的雜交多核苷酸來獲得。37.權利要求36的分離多核苷酸,其通過(a)在高嚴謹條件下使DNA群與下列雜交(i)SEQIDNO1的第388至1332位核苷酸、SEQIDNO3的第98至821位核苷酸、SEQIDNO5的第126至978位核苷酸、SEQIDNO7的第55至678位核苷酸、或SEQIDNO9的第58至912位核苷酸,(ii)包含於SEQIDNO1的第388至1332位核苷酸、SEQIDNO3的第98至821位核苷酸、或SEQIDNO5的第126至978位核苷酸中的cDNA序列、或包括SEQIDNO7的第55至678位核苷酸或SEQIDNO9的第58至912位核苷酸的基因組DNA序列,或(iii)(i)或(ii)的互補鏈;以及(b)分離雜交多核苷酸,其編碼具有分解纖維增強活性的多肽來獲得。38.用於生產具有突變核苷酸序列的多核苷酸的方法,包括(a)將至少一個突變導入SEQIDNO1的成熟多肽編碼序列,其中該突變的核苷酸序列編碼由SEQIDNO2的第20至326位胺基酸、SEQIDNO4的第18至240位胺基酸、SEQIDNO6的第20至258位胺基酸、SEQIDNO8的第19至226位胺基酸、或SEQIDNO10的第20至304位胺基酸組成的多肽;以及(b)回收包括該突變的核苷酸序列的多核苷酸。39.通過權利要求38的方法生產的突變的多核苷酸。40.用於生產多肽的方法,包括(a)在有助於生產該多肽的條件下培養包括權利要求39的突變的多核苷酸的細胞;以及(b)回收該多肽。41.包含編碼蛋白的基因的核酸構建體,所述基因編碼與由SEQIDNO1的第330至387位核苷酸、SEQIDNO3的第47至97位核苷酸、SEQIDNO5的第69至125位核苷酸、SEQIDNO7的第1至54位核苷酸、或SEQIDNO9的第1至57位核苷酸組成的編碼信號肽的核苷酸序列可操作連接,其中該基因與該核苷酸序列是異源的。42.包括權利要求41的核酸構建體的重組表達載體。43.包括權利要求41的核酸構建體的重組宿主細胞。44.用於生產蛋白質的方法,包括(a)在有助於生產該蛋白質的條件下培養權利要求43的重組宿主細胞;以及(b)回收該蛋白質。45.用於生產權利要求1、2、和8-23中任一項的多肽的方法,包括(a)在有助於生產該多肽的條件下培養轉基因植物或植物細胞,其包括編碼本發明的具有增強的纖維素分解活性的多肽的多核苷酸;以及(b)回收該多肽。46.轉基因的植物、植物部分或植物細胞,其已經用編碼權利要求1、2和8-23中任一項的多肽的多核苷酸轉化。47.包括權利要求1、2、和8-23中任一項的具有增強的纖維素分解活性的多肽、纖維素分解活性和表面活性劑的清潔劑組合物。48.用於降解或轉換纖維素物質的方法,其包括在存在有效量的權利要求1、2、和8-23中任一項的具有增強的纖維素分解活性的多肽時,用有效量的纖維素分解蛋白質處理纖維素物質,其中存在該具有增強的纖維素分解活性的多肽與缺少該具有增強的纖維素分解活性的多肽相比增加了纖維素物質的降解。49.權利要求48的方法,其中該纖維素物質選自草本物質、農業殘餘物、林業殘餘物、城市固體廢物、廢紙、以及紙漿和造紙廠殘餘物。50.權利要求48的方法,其中該纖維素物質是玉米秸。51.權利要求48-50中任一項的方法,其中該一種或多種纖維素分解酶選自纖維素酶、葡聚糖內切酶、纖維二糖水解酶、和β-葡糖苷酶。52.權利要求48-51中任一項的方法,進一步包括用選自半纖維素酶、酯酶、蛋白酶、漆酶、過氧化物酶、或其混合物的有效量的一種或多種酶處理纖維素物質。53.權利要求48-52中任一項的方法,其中該方法是預處理過程。54.權利要求48-52中任一項的方法,其中該方法是同時糖化和發酵過程(SSF)中的步驟。55.權利要求48-52中任一項的方法,其中該方法是混合水解和發酵過程(HHF)中的步驟。56.權利要求48-55中任一項的方法,進一步包括回收降解的纖維素物質。57.權利要求53的方法,其中該降解的纖維素物質是糖。58.權利要求54的方法,其中該糖選自葡萄糖、木糖、甘露糖、半乳糖和阿拉伯糖。59.權利要求48的方法,其中該纖維素分解蛋白質和/或具有增強的纖維素分解活性的多肽以含有或不含有細胞的發酵液形式存在。60.用於生產有機物質的方法,包括(a)在存在有效量的權利要求1、2、和8-23中任一項具有增強的纖維素分解活性的多肽時,用有效量的纖維素分解蛋白質糖化纖維素物質,其中存在該具有增強的纖維素分解活性的多肽與缺少該具有增強的纖維素分解活性的多肽相比增加了纖維素物質的降解;(b)用一種或多種發酵微生物發酵步驟(a)的糖化的纖維素物質;以及(c)從該發酵物回收有機物質。61.權利要求60的方法,其中該纖維素物質選自草本物質、農業殘餘物、林業殘餘物、城市固體廢物、廢紙、以及紙漿和造紙廠殘餘物。62.權利要求60的方法,其中該纖維素物質是玉米秸。63.權利要求60-62中任一項的方法,其中所述的一種或多種纖維素分解酶選自纖維素酶、葡聚糖內切酶、纖維二糖水解酶、和β-葡糖苷酶。64.權利要求60-63中任一項的方法,進一步包括用選自半纖維素酶、酯酶、蛋白酶、漆酶、過氧化物酶、或其混合物的有效量的一種或多種酶處理纖維素物質。65.權利要求64的方法,其中該酯酶是脂肪酶、磷脂酶、角質酶或其混合物。66.權利要求60-65中任一項的方法,其中在同時糖化和發酵中同時進行步驟(a)和(b)。67.權利要求60-66中任一項的方法,其中該有機物質是醇類、有機酸、酮類、胺基酸或氣體。68.權利要求67的方法,其中所述醇類是阿拉伯糖醇、丁醇、乙醇、甘油、甲醇、1,3-丙二醇、山梨糖醇或木糖醇。69.權利要求67的方法,其中所述有機酸是乙酸、醋酮酸、己二酸、抗壞血酸、檸檬酸、2,5二酮-D-葡糖酸、甲酸、富馬酸、葡糖二酸、葡糖酸、葡糖醛酸、戊二酸、3-羥基丙酸、衣康酸、乳酸、蘋果酸、丙二酸、草酸、丙酸、琥珀酸或木糖酸。70.權利要求67的方法,其中所述酮類是丙酮。71.權利要求67的方法,其中所述胺基酸是天冬氨酸、穀氨酸、甘氨酸、賴氨酸、絲氨酸或蘇氨酸。72.權利要求67的方法,其中所述氣體是甲烷、氫氣、二氧化碳和一氧化碳。73.權利要求60的方法,其中該纖維素分解蛋白質和/或具有增強的纖維素分解活性的多肽以含有或不含有細胞的發酵液形式存在。全文摘要本發明涉及具有分解纖維增強活性的分離多肽和編碼該多肽的分離多核苷酸。本發明也涉及包括該多核苷酸的核酸構建體、載體、和宿主細胞以及生產和使用該多肽的方法。文檔編號C12N1/21GK1980953SQ200580010730公開日2007年6月13日申請日期2005年1月28日優先權日2004年1月30日發明者金伯利·布朗,保羅·哈裡斯,伊莉莎白·扎雷特斯基,愛德華·雷,埃琳娜·弗拉森科,基思·麥克法蘭,艾爾弗雷多·洛佩茲德利昂申請人:諾維信股份有限公司