新四季網

環噻唑黴素生物合成功能基因簇的製作方法

2024-04-06 05:21:05

專利名稱:環噻唑黴素生物合成功能基因簇的製作方法
技術領域:
本發明涉及一種基因工程技術領域的基因簇,具體是一種環噻唑黴素生物合成功 能基因簇。
背景技術:
硫肽類抗生素是一類通常由微生物次級代謝產生的多肽類抗生素,具有如下結 構特點(Chem Rev(2005) 105,685 714)富含經高度修飾且含硫的大環形多肽;在空間 結構的中心位置是一個被三位或者四位噻唑環取代的含氮雜環(如吡啶和脫水哌啶);在 這個中心雜環的周圍分布著眾多被修飾過的異分子間形成的環狀胺基酸殘基,包括噻唑, 噁唑,脫氫胺基酸。除了諸多的結構共性之外,大多數硫肽類抗生素的生物活性也有共同 的特點幾乎對革蘭氏陰性菌沒有毒性,而是通過幹擾蛋白質的合成來抑制革蘭氏陽性 菌的生長。具體到醫學和農業領域的應用上來說,硫肽類抗生素所覆蓋的領域非常的廣 泛硫連絲菌素thiostr印ton能夠抑制核糖體合成蛋白(J Mol Biol (1998) 276,391 404),還能誘導變鉛鏈黴菌中TipA蛋白的大量合成(J Bacteriol (1989) 171,1459 1466);環噻唑黴素cyclothiazomycin則是一種具有潛在應用前景的腎素抑制劑(renin inhibitor),同時對水稻胡麻等農作物致病真菌也有殺滅作用(J Antibiot (1991) 44, 582-8 ;Bioorg MedChem(2006) 14,8259-70);在硫肽類抗生素這個大家族中,有相當多 的成員對各種高耐藥性致病菌株都有抑制作用,包括MRSA(methicil 1 in-resistant Staphylococcus aureus), PRSP(penicillin-resistant Streptococcus pneumoniae) 禾口 VRE(vancomycin-resistant enterococci)(Chem Rev(2005) 105, 685 714 ;Chem Biol (2009) 16,141 147)。在細菌細胞內部,普通的L型胺基酸殘基,是通過何種方式經由哪些酶類催化, 進行哪些生物化學反應,形成分子間的芳香環從而構建出複雜的空間結構,最終表現出 各種不同的生物活性硫肽類抗生素正是引發這一系列有趣問題的經典代表,一直以來, 有機化學家們都致力於在實驗室中人工合成這種高度修飾的多肽(Angew Chem Int Ed Engl (2007) 46,7930 7954)。相較之下,生物學家們對之生物合成途徑的研究成果就要匱 乏的多,這與之在醫藥農業領域的應用潛力極不相稱。很長時間以來,對於硫肽類抗生素體 內合成的研究都僅僅止步於體內餵養實驗的範圍內(J. Am. Chem. Soc. (1993) 115,7992 8001 ;J. Am. Chem. Soc. (1996) 118,11363 11368 ;Bioorg Med Chem(1996)4,1135 1147),直到最近兩年,隨著多個核糖體合成肽類抗生素基因簇的克隆和報導,隨著基因組 測序的進行,越來越多的可能編碼硫肽類抗生素合成酶的基因簇出現在科學家的視線裡 (Proc NatlAcad Sci U S A (2008) 105,5879 5884),為此類抗生素分子合成機制的深入 研究奠定了一定的基礎。同時也為基於生物合成機制開展生物工程的實踐探索打開了通 道。環噻唑黴素(cyclothiazomycin,CLT)是一種較為特別的硫肽類抗生素,它的結 構特點非常鮮明唯一擁有三環結構的硫肽(unique tricyclic structure),且在中心pyridine環的取代基團上,CLT並沒有典型硫肽的2-和3-噻唑環取代,而是代之以丙氨 酸衍生出來的分子間環形殘基(R-),游離的羧基端也因為碳硫鍵的存在而呈現出半游離狀 態,且分子內並非都是還原狀態的噻唑環,而是包含了 3個噻唑環和3個噻唑啉。環噻唑 黴素具有相當的抑制人體腎素的活性,且對很多農作物真菌病也有殺滅作用,所以環噻唑 黴素的應用潛力相當大。通過DNA重組技術可以對抗生素化學結構進行改造,提高效價、 擴大抗菌譜、降低毒性,同時對調節基因的遺傳工程改造還可以提高抗生素的產量,這方 面的先驅Hopwood等利用來自不同鏈黴菌菌株的結構基因轉移產生出新的雜合的抗生素 (Nature (1985) 314,642 644)。抗生素生物合成的相關基因,包括結構基因,抗性基因以 及調節基因一般都成簇存在(Annu. Rev. Microbiol. (1989) 43,173 206)。環噻唑黴素的 生物合成方面的研究未見任何報導。經對現有技術的文獻檢索發現,尚未見到與本發明的環噻唑黴素生物合成基因簇 有
關的報導。

發明內容
本發明的目的在於克服現有技術的不足,提供一種環噻唑黴素生物合成功能基因 簇、重組載體及宿主。本發明的基因簇包含了環噻唑黴素生物合成的所有遺傳元件,實現了 環噻唑黴素的生物合成。本發明是通過以下的技術方案實現的本發明涉及一種環噻唑黴素生物合成基因簇,該基因簇包含分別編碼如下胺基酸 序列的17個基因,所述胺基酸序列具體為=SEQ ID N0:2、SEQ ID N0:3、SEQ ID N0:4、SEQ IDNO :5、SEQ ID NO :6、SEQ ID NO :7、SEQ ID NO :8、SEQ ID NO :9、SEQ ID NO :10、SEQ ID N0:11、SEQ ID NO 12,SEQ ID NO 13,SEQ ID NO 14,SEQ ID NO 15,SEQID NO : 16、SEQ ID NO :17、SEQ ID NO :18。進一步地,所述環噻唑黴素生物合成基因簇包含如下17個基因,所述17個基因的 鹼基序列具體為(I)SEQ ID NO :1 第 16526 16705 位所示鹼基序列、(2) SEQ ID NO :1 第 14372 16411 位所示鹼基序列、(3) SEQ ID NO :1 第 16870 18555 位所示鹼基序列、(4) SEQ ID NO :1第1邪93 2O533位所示鹼基序列、(5) SEQ ID NO :1 第 11730 14354 位所示鹼基序列、(6) SEQ ID NO :1 第 10733 11755 位所示鹼基序列、(7) SEQ ID NO :1第%01 IO625位所示鹼基序列、(8) SEQ ID NO 1第4875 5妨2位所示鹼基序列、(9) SEQ ID NO 1第4404 4了36位所示鹼基序列、(IO)SEQ ID NO :1 第 20695 21204 位所示鹼基序列、(Il)SEQ ID NO :1 第 1857 2747 位所示鹼基序列、(12) SEQ ID NO :1 第 6629 9424 位所示鹼基序列、(13) SEQ ID NO :1 第 2829 4262 位所示鹼基序列、(14) SEQ ID NO :1 第 5867 6442 位所示鹼基序列、
(15) SEQ ID NO 1 第 21712 22153 位所示鹼基序列、(16) SEQ ID NO :1 第 1182 1541 位所示鹼基序列、(17) SEQ ID NO :1 第 21248 21601 位所示鹼基序列。所述環噻唑黴素生物合成基因簇的鹼基序列如SEQ ID NO=I所示。與現有技術相比,本發明具有如下的有益效果本發明得到的基因簇通過異源表 達的方式在異源宿主變鉛青鏈黴菌1326中實現了環噻唑黴素的生產,異源表達生測抑菌 圈和發酵物提取物的質譜檢測都證實了該基因簇在異源宿主中的功能性,也即其包含了環 噻唑黴素生物合成的所有遺傳元件。


圖1為環噻唑黴素的化學結構圖;圖2為環噻唑黴素的生物活性測定結果圖;圖3為10-22發酵物甲醇提取物的Q-TOF檢測的離子流圖;圖4為圖3的離子流提取放大以及同位素豐度示意圖;圖5為環噻唑黴素分子的簡單示意圖;圖6為二級質譜分析圖;圖7為環噻唑黴素基因簇的結構圖;圖8為異源表達定位出環噻唑黴素的完整合成基因簇圖;圖9為異源表達的1326: :pJTU4892發酵提取物質譜分析圖;圖10為環噻唑黴素生物合成途徑示意圖。
具體實施例方式下面結合具體實施例,進一步闡述本發明。應理解,這些實施例僅用於說明本發明 而不用於限制本發明的範圍。下列實施例中未註明具體條件的實驗方法,通常按照常規條 件,例如 Sambrook 等分子克隆實驗室手冊(New York Co Id Spring Harbor Laboratory Press, 1989)中所述的條件,或按照製造廠商所建議的條件。實施例1環噻唑黴素生物合成功能基因簇的獲得本實施例中的環噻唑黴素生物合成功能基因簇的序列如SEQ ID NO :1所示,得到該基因簇的步驟如下步驟一,環噻唑黴素產生菌吸水鏈黴菌10-22總DNA的提取接種10-22至TSBY(10. 3%蔗糖)培養基於含有彈簧的三角瓶中30°C培養48h。 離心收集菌體,重懸於 5ml SET 緩衝液中(75mM NaCl, 25mM EDTA pH8. 0,20mM Tris-HCl ρΗ7· 5)。加入100 μ 1溶菌酶溶液(50mg/ml),置37°C約60分鐘。溶菌後然後加入140 μ 1 蛋白酶K溶液(20mg/ml)混均勻,再加600 μ 1 10% SDS,通過顛倒混勻,置55°C溫浴2h,期 間偶爾顛倒幾次。再加入2ml 5M NaCl,徹底混勻,冷卻置37°C後,加入5ml氯仿,於室溫輕 輕混勻。20°C、4500g離心15分鐘。轉移上清至新管中,加入0. 6倍體積的異丙醇顛倒混 勻,約3分鐘後用玻棒挑取至含70%乙醇的新管中洗滌,重複2次,空氣中乾燥,溶解在TE 中。
步驟二,吸水鏈黴菌10-22菌基因組文庫的構建(1)吸水鏈黴菌10-22總DNA的部分酶解和大片段DNA的回收 將提取的10-22總DNA用Sau3AI部分酶解,用1 %低熔點瓊脂糖凝膠,在裝有0. 5 倍 TBE 電泳緩衝液的脈衝場電泳(Pulse Field Gel Electrophoresis, PFGE, Bio-Rad) 中分離。回收約40kb大小的DNA片段。用熱敏的鹼性磷酸酶(APex Heat-Lab i 1 e AlkalinePhosphatase, EPICENTRE Biotechnologies 公司)處理是末端去磷酸化,供和載 體的連接及包裝轉染用。(2)連接和包裝將處理好的10-22基因組DNA (大小約40kb)和經BamHI酶切並用CIAP處理的柯 斯質粒PHZ1358按照1 1分子數比例用T4連接酶(NEB公司)連接。將在冰上溶解的噬
(MaxPlax Lambda Packing Extracts, EPICENTRE Biotechnologies ^W]) 加入連接產物中,混勻,避免產生氣泡,短暫離心,在30°C中溫浴90分鐘,再加入另一份包 裝蛋白,繼續溫浴90分鐘後加入噬菌體稀釋緩衝液(Phage Dilution Buffer, lOOmM NaCl, IOmM MgCiaOmM Tris-HCl ρΗ8· 3)至 lml,並加入 25 μ 1 氯仿,4°C保存。(3)轉染與保存將大腸桿菌EPI300(見表2-1)培養至OD6tltl = 0. 8 1. 0作為感受態菌,可在4°C 保存72h。將包裝產物與感受態菌混合,37°C溫浴20分鐘後塗含阿伯拉抗生素的LB平板。 37°C培養過夜。挑取單克隆至含抗生素的LB培養基96孔板中繼續培養18小時,加入滅菌 的甘油至終濃度20%,於-70°C中保存。步驟三,基因組文庫的篩選採用PCR的方法從基因組文庫中篩選所需要的柯斯質粒。為篩選基因組文庫,從 每個板的96孔孔中取出等量菌液混合,接種培養,提取質粒為一個模板進行PCR篩選,在得 到的陽性平板中,從每排的12個孔中取出等量菌液混合,接種培養,提取質粒為一個模板 進行PCR篩選。然後在那些陽性的排中進行單個的PCR篩選,直至篩出所有陽性克隆。步驟四,環噻唑黴素生物合成基因簇分析在異源宿主1326 (Antimicrob Agents Chemother (1992) 36 (5) 1119 ? 124)中一 系列表達載體的實驗結果表明,環噻唑黴素基因簇主要由兩大部分組成,一部分是負責環 噻唑黴素框架結構形成的8個蛋白CltB/C/D/E/F/G/M/N,另一部分則是一些輔助抗生素合 成的因子,包括轉錄調節因子、轉運蛋白,以及可能幫助基因簇發生水平遷移的轉座酶等。在環噻唑黴素的合成基因簇中,有一個巨大的操縱子(operon) :cltD/C/A/B/E/ F/G,這一特徵和其他已知基因簇的硫肽類抗生素非常相像(Chem Biol (2009) 16,141 147),和其他同樣也是核糖體合成的多肽類抗生素的基因分布也相當類似(Proc Natl Acad SciU S A (2008) 105,5879 5884);考慮到在原核生物中,一個操縱子編碼的產物在 空間分布上聚合在一起的可能性很大,故而可認為這6個蛋白組成一個大的合酶系統,將 前體肽CltA包圍在其中,對其進行翻譯後修飾,這個後修飾的過程包括固定CLT前體、Ser 和Thr的脫水、Cys脫水環化形成噻唑啉、進一步脫水形成噻唑、中心位置吡啶環的合成、遊 離的羧基端硫酯鍵的形成、前導肽的切除和最終產物的釋放。在CLT的基因簇中發現了兩個調節蛋白,CltH/P,這在已報導的硫肽類抗生素基因 簇中的唯一的(Chem Biol (2009) 16,141 147 ;Proc Natl Acad Sci U S A(2009) 106 (8),2549 2553)。其中CltH隸屬於LuxR轉錄調節因子家族,與多烯類抗生素nystatin 生物合成基因簇中的正調節因子NysI有32%的同源性(J Bacteriol (2004) 186 (5), 1345-54)。CltP則與一個屬於XRE家族的DNA結合蛋白/轉錄調節因子有43%的同源 性。CltO是基因簇中唯一的一個轉運蛋白,也是目前已知硫肽基因簇中唯一一個轉運 蛋白,它包含一個糖轉運家族的結構域(a sugar-transport family domain),但是無 法判斷出明顯的底物識別區域,該區域在Iantibiotic前體肽的延伸過程中是必需的 (Biochemistry (2008) 47 (28),7352 7363)。CLT生物合成基因簇還有一個很特徵,在其中 散布著4個轉座酶,其中有兩對,Cltl/L以及CltQ/L,正好分別將主體框架合成酶(I和L) 以及所有的合成酶(Q和L)包圍在其中。這種在硫肽類抗生素中罕見的現象說明CLT的生 物合成基因簇很可能部分或者全部都源自種屬間的水平基因轉移。步驟五,環噻唑黴素生物合成途徑推導通過基於精確的異源表達的基因簇組成蛋白分析以及CltM/N的缺失表達突變株 產素分析,我們對環噻唑黴素的合成途徑推導見圖10,首先應該是各個胺基酸殘基自身的 脫水和環化。其中,CltE和CltF負責了 Ser和Thr脫水生成Dha和Dhb (見圖5中的反 應c),這個過程在Iantibiotics的生物合成途徑中已有報導。CltB和CltC則與MccB17, streptolysin S(Proc Natl Acad Sci U S A(2008)105,5879 5884)和thiocillins(Proc Natl AcadSci U S A (2009) 106 (8),2549 2553)基因簇中負責胺基酸殘基間異源環合成 的酶同源。而CltB中,兩個不同的domain則很可能在噻唑類環形成的過程中扮演不同的 角色DFU181在空間上固定住前體肽,YcaO則將目標殘基進行脫水環化(見圖10中的反應 a) οCltC也包含了兩個domain,兩個都屬於mcbC-like domain家族,從環噻唑黴素中 噻唑啉和噻唑環的分布特徵來看,很可能兩個domain特異識別一對並排的噻唑啉為底物, 而僅有其中一個domain對N端的噻唑啉催化使之脫氫生成噻唑,而保持另一個C端的噻唑 啉還原狀態不變(見圖10中的反應b)。如此往復,造成了環噻唑黴素分子結構中不尋常的 噻唑啉和噻唑並存的狀態(見圖10中的數字標識8)。 硫肽類抗生素的結構特徵之一就是取代吡啶或者是脫水哌啶(Chem Rev(2005) 105,685 714),那麼在CLT的合成過程中,哌啶很有可能扮演一個中間 產物的角色。體外實驗已經證明一個分子間異源的DA反應(an intramolecular hetero-Diel-Alder reaction)能夠合成一個哌啶環(見圖10中的反應d)。同源性比 較分析揭示了 CltD也是一個雙結構域組成的蛋白,值得注意的是,其N端與一個肽酶(a putative peptidase M14, carboxyp印tidase Α)有41%的相似性。這個肽酶結構域的發 現在硫肽基因簇中尚屬首次,它表明LP的切除很可能由該亞基來完成。而CltD的C端則 被YcaO家族結構域佔據,這個前文中已經討論被認為是環化脫水酶的一個亞基,因此我們 推測該結構域在吡啶的形成中也執行類似的功能即將參與哌啶形成的幾個胺基酸殘基固 定在一個相鄰的位置上進行DA反應成環後再脫水,從而生成了一個脫水哌啶的中間產物 9(見圖10)。在Thio和thiocillins的基因簇功能探討中,LP的切除普遍都被認為是成 熟抗生素合成的最後一步,而在CLT的生物合成中,由於兩種不同功能的結構域共存於一 個ORF中,因此我們相信這個肽鏈剪切過程發生在吡啶的合成過程中。CltG與已知蛋白沒 有明顯的同源性,在這裡可能是催化LP被切除後的脫氨基過程(見圖10中的反應e)。
CLT的化學結構中還有另一個不尋常的硫醚鍵存在,它是由脫水的S5和C18兩個殘基組成,跟Iantibiotics中常見的β位硫醚鍵不同,這裡是C18上的硫元素和S5上α 位的碳原子之間形成的叔碳硫醚鍵(tertiary thioester)(具體見圖1)。在Iantibiotic 的生物合成過程中,分子間的硫醚鍵是由Cys上的硫通過麥可加成(Michael Addition) 的方式加到摺疊後處於臨近位置的Ser和Thr上的β位碳上去的[Org Lett (2007) 9 (17), 3343-6]。CLT中這個α位上的硫醚鍵很可能源自β位的硫醚鍵,是通過一個重排反應生 成的(見圖10中的反應g)。基因簇中的CltN與EthD有34 %的序列同源性,EthD是一個能夠將石油汙 染物乙基叔丁基醚(ETBE)降解的細胞色素P-450基因簇中一個必需的蛋白。在EthD 缺失的情況下,基因簇中的其他基因不能夠回補一株ETBE缺陷菌株的降解活性(J Bacteriol (2001) 183 (22),6551-7)。雖然EthD的生物學功能並沒有解釋清楚,但是它參與 的反應中出現了叔丁基的身影,這給了我們一些啟示CltN很可能就是負責重排生成這個 叔碳硫醚鍵的催化蛋白。而與之共處於一個操縱子之中的CltM,則可能就是參與到上述的 麥可加成中的蛋白(見圖10中的反應f)。與前面討論的大分子蛋白不同,無論是CltM 還是CltN都是小分子酶,都沒有類似YcaO的固定結構域,這意味著已經完成吡啶合成後的 未成熟CLT已經正確摺疊到合適的位置,使得S5和C18得以相鄰,以供上述兩個蛋白完成 催化叔碳硫醚鍵形成的功能。經過上述後修飾過程,成熟的環噻唑黴素被切掉前提肽後結 合到轉運蛋白CtlO上,運輸至胞外執行抗菌功能。步驟六,環噻唑黴素生物合成基因簇中基因的製備以環噻唑黴素生物合成基因簇的序列SEQ ID NO 1為模板,設計引物,採用PCR方 法可分別得到如下17個基因(1)負責環噻唑黴素前體多肽生物合成的結構基因1個cltA ;所述基因cltA, 位於SEQ ID NO :1的第16526 16705位;編碼的蛋白的序列如SEQ ID NO :2所示;功 能編碼環噻唑黴素前體肽。PCR擴增引物序列為F (5 』 ATGGAGAAGGAACTCGTCCT 3 』)和 R (5,TCAGCAGCAACAGCACGAGCA 3,),擴增條件為 95 °C 5 分鐘,95°C 30 秒 60 °C 30 秒 72 °C 30 秒共30個循環,最後72 °C 5分鐘。(2)負責環噻唑黴素翻譯後修飾的酶基因cltB,位於SEQ ID NO 1的第14372 16411位,編碼的蛋白的序列如SEQ ID NO 3所示;功能編碼NADH氧化酶,該氧化酶負責 催化噻唑啉脫氫生成噻唑。PCR擴增引物序列為F (5 』 GTGACCGTGACCGACACCGCCGC3,)和 R(5,TCACGGGAACGGGTGCGG3,),擴增條件為 95°C 5 分鐘,95°C 30 秒 64°C 30 秒 72°C 90 秒共 30個循環,最後72 °C 5分鐘。(3)負責環噻唑黴素翻譯後修飾的酶基因cltC,位於SEQ ID NO 1的第16870 18555位,編碼的蛋白的序列如SEQ ID NO :4所示;功能編碼環化肽酶,該酶負責催化中央 吡啶的環化和前導鏈的切除。PCR擴增所用引物序列為F(5』GTGGCCGACGCGGACGCCGACA 3』) 和 R(5,TCACCATGTCAGCGGCAT3,),擴增條件為 95°C 5 分鐘,95°C 30 秒 64°C 30 秒 72°C 90 秒共30個循環,最後72 °C 5分鐘。(4)負責環噻唑黴素翻譯後修飾的酶基因cltD,位於SEQ ID NO 1的第18593 20533位,編碼的蛋白的序列如SEQ ID NO :5所示;功能編碼胺基酸(絲氨酸/蘇氨酸) 脫水酶的核苷酸序列,該酶負責催化絲氨酸和蘇氨酸的脫水。PCR擴增所用引物序列為F (5,ATGGCCGTGACAATCGCCAGA 3,)和 R (5,CTAGTCATCGAGGACCACGAC 3,),擴增條件為 95 °C 5 分鐘,95°C 30秒62 °C 30秒72 °C 120秒共30個循環,最後72 °C 5分鐘。(5)負責環噻唑黴素翻譯後修飾的酶基因cltE,位於SEQ ID NO 1的第11730 14354位,編碼的蛋白的序列如SEQ ID NO :6所示;功能編碼胺基酸脫水酶的核苷酸序列, 該酶負責催化絲氨酸和蘇氨酸的脫水。PCR擴增所用弓I物序列為F (5 』 ATGACCGAGAACCACACCA 3,)禾口 R(5『 TCAAGCGGGCCGCTGTCGTTCT 3,),擴增條件為 95°C 5 分鐘,95°C 30 秒 62°C 30 秒 720 C 180秒共30個循環,最後72°C 5分鐘。(6)負責環噻唑黴素翻譯後修飾的酶基因cltF,位於SEQ ID NO :1的第 10733 11755位,編碼的蛋白的序列如SEQ ID NO 7所示;功能編碼脫氨基酶的核苷 酸序列,該酶負責催化完成形成吡啶的最後一個脫氨基步驟。PCR擴增所用引物序列為 F(5『 ATGCCGGAGAACGACAGC 3,)和 R(5,TCACGAGGCGGCCAGTGCCT 3,),擴增條件為 95°C 5 分 鍾,95°C 30秒64°C 30秒72 °C 40秒共30個循環,最後72 °C 5分鐘。(7)負責環噻唑黴素翻譯後修飾的酶基因cltG,位於SEQ ID NO :1的第 9501 10625位,編碼的蛋白的序列如SEQ ID NO :8所示;功能編碼LuxR家族的 轉錄調節蛋白,該酶參與了環噻唑黴素合成的調節過程。PCR擴增所用引物序列為 F (5,GTGGCACCGTGGGCCGAG 3,)禾口 R(5,TCAGCCGGCTCCGCCGGC 3,),擴增條件為 95°C 5 分 鍾,95°C 30秒68 °C 100秒共30個循環,最後72 °C 5分鐘。(8)負責環噻唑黴素翻譯後修飾的酶基因cltM,位於SEQ ID NO=I的第4875 5462位,編碼的蛋白的序列如SEQ ID NO :14所示;功能編碼的蛋白該酶參與了環噻 唑黴素中硫醚鍵的形成。PCR擴增所用引物序列為F (5 』 GTGCGCTGCGACTTCCGGT 3 』)和 R(5『TCATCGACGACACGGTTCA 3,),擴增條件為 95°C 5 分鐘,95°C 30 秒 64°C 30 秒 72°C 30 秒 共30個循環,最後72°C5分鐘。(9)負責環噻唑黴素翻譯後修飾的酶基因cltN,位於SEQ ID NO=I的第4404 4736位,編碼的蛋白的序列如SEQ ID NO :15所示;功能編碼類似ETBE降解相關蛋白 (Ethyltert-butyl ether degradation EthD),該酶可能參與了環噻唑黴素中硫醚鍵的形 成。PCR 擴增所用弓丨物序列為 F (5,ATGATCATTACGCTCAAGC 3,)和 R (5,TCATCGGCCGTCGATGACT 3,),擴增條件為95°C 5分鐘,95°C 30秒58°C 30秒72°C 30秒共30個循環,最後72°C 5分 鍾。(10)負責環噻唑黴素翻譯後修飾的酶基因cltJ,位於SEQ ID NO 1的第20695 21204位,編碼的蛋白的序列如SEQ ID NO 11所示;功能環氧化物水解酶,該酶可能參與 了環噻唑黴素中硫醚鍵的形成。PCR擴增所用引物序列為F(5』 ATGCGCCGGCACCGCTCGA 3』) 禾口 R (5,CTACCTCGACCGGACGAT 3,),擴增條件為 95 °C 5 分鐘,95°C 30 秒 60 °C 30 秒 72 °C 30 秒共30個循環,最後72 °C 5分鐘。(11)負責環噻唑黴素生物合成的調節基因cltP,位於SEQ ID NO 1的第1857 2747位;編碼的蛋白的序列如SEQ ID NO :17所示;功能XRE family轉錄調節因子,該因子 參與了環噻唑黴素合成的調節過程。PCR擴增所用弓I物序列為F (5』 ATGATCGTTGCCATGGCGGA 3,)禾口 R(5『 TCAGGTTGCTGCAAGCAGGTGC 3,),擴增條件為 95°C 5 分鐘,95°C 30 秒 62°C 30 秒 72 0C 50秒共30個循環,最後72 °C 5分鐘。(12)負責環噻唑黴素生物合成的調節基因cltH,位於SEQ ID NO 1的第6629 9424位;編碼的蛋白的序列如SEQ ID NO 9所示;功能LuxR家族的轉錄調節蛋白。PCR 擴增所用引物序列為 F(5』 ATGATCGTTGCCATGGCGGA 3』)和 R(5』 TTGACCTCAGTCGATCGAATCG 3,),擴增條件為95°C 5分鐘,95°C 30秒62°C 30秒72°C 150秒共30個循環,最後72°C 5 分鐘。(13)環噻唑黴素生物合成後負責產物運輸的轉運蛋白基因cltO,位於SEQ ID NO 1的第2829 4262位;編碼的蛋白的序列如SEQ ID NO 16所示;功能轉運蛋白,負責環 噻唑黴素生成後的外運過程。PCR擴增所用弓I物序列為F (5 』 GTGAGTGCATGCAACGGACCT 3 』) 禾口 R (5,TCAATCGAGTGCCTCCGT 3,),擴增條件為 95 °C 5 分鐘,95°C 30 秒 62 °C 30 秒 72 °C 90 秒共30個循環,最後72 °C 5分鐘。(14)轉座酶基因cltl,位於SEQ ID NO :1的第5867 6442位;編碼 的蛋白的序列如SEQ ID NO :10所示;功能轉座酶。PCR擴增所用引物序列為 F (5,ATGGGCCGCCTGCGCGTT3,)和 R (5,TCATCCGTCCGTGCCCGCC 3,),擴增條件為 95 °C 5 分 鍾,95°C 30秒68 °C 60秒30個循環,最後72 °C 5分鐘。(15)轉座酶基因cltL,位於SEQ ID NO :1的第21712 22153位;編碼的蛋白的 序列如SEQ ID NO :13所示;功能IS1648轉座酶,該酶可能參與了基因簇的水平轉移。PCR 擴增所用引物序列為 F(5,GTGAGTAACGGGCGTTGC 3,)和 R(5,TCAAGGCGGACCGATGTG 3,),擴 增條件為95 °C 5分鐘,95°C 30秒68 °C 40秒共30個循環,最後72 °C 5分鐘。(16)轉座酶基因cltQ,位於SEQ ID NO 1的第1182 1541位;編碼的蛋白的序 列如SEQ ID NO :18所示,功能轉座酶,該酶可能參與了基因簇的水平轉移。PCR擴增所用 引物序列為 F(5,ATGGAGGCGATCCGGGTGC 3』)和 R(5』 TCACGCCCACATCAGTAG 3』),擴增條件 為95°C 5分鐘,95°C 30秒63°C 30秒72°C 40秒共30個循環,最後72°C 5分鐘。(17)氮還原酶基因cltK,位於SEQ ID NO 1的第21248 21601位;編碼的蛋白 的序列如SEQ ID NO :12所示;功能氮還原酶(nitroreductase)家族蛋白。PCR擴增所用 引物序列為 F(5,ATGGACGTATATGAGGCCGT 3』)和 R(5』 TCAAGGTAGCGATCTTCCT 3』),擴增條 件為95°C 5分鐘,95°C 30秒60°C 30秒72°C 40秒共30個循環,最後72°C 5分鐘。實施例2環噻唑黴素生物合成功能基因簇功能的驗證步驟一,吸水鏈黴菌10-22及變鉛青鏈黴菌1326異源生產株的培養將吸水鏈黴菌10-22及變鉛青鏈黴菌1326異源生產株(Antimicrob Agents Chemother (1992) 36 (5) :1119 1124)接種於SFM固體培養基平板上,30°C培養5 7天, 用打孔器將培養物打成菌塊備用。將PDA固體培養基平板上活化的吸水黴素生物學活性測 定指示灰黴菌(Botrytis cinerea Persoon)菌絲體收集到0. 5ml無菌水中混勻打碎,均勻 混於60°C左右尚未凝固的PDA培養基中,混勻後倒板,在合適的位置上放置待測的鏈黴菌 菌塊,30°C培養48h後觀察結果,結果見圖2。步驟二,環噻唑黴素的快速提取取培養7天的固體發酵物,用兩倍體積的甲醇浸泡過夜,並將浸泡液以15000g離 心10分鐘2次,用無水硫酸鈉去水,然後用真空旋轉蒸發儀將其旋幹,再以等體積甲醇將 剩餘物重新溶解,樣品用0. 2微米的一次性過濾器過濾,進行質譜檢測。利用LC-ES-Q-TOF 對環噻唑黴素進行高精度質譜檢測分析,LC-ES-Q-TOF分析採用的是安捷倫公司Agilent1200 系統,柱子規格為 2· IX 30mm C18 reverse-phase column (Agilent Co.CA),流速為 0. 3ml/min。A泵溶液為10%的乙腈溶液(含0. 1 %甲酸),B泵溶液為含0. 甲酸的乙腈。 梯度洗脫條件是,0 10分鐘內溶液B的濃度從0 90%。質譜檢測是通過安捷倫公司的 6530Accurate-Mass Q-TOF質譜檢測儀;二級質譜是採用指定靶點依賴的模式進行。檢測 結果見圖3,圖4將圖3的離子流峰進行放大後得到的一價和二價正離子的分布以及同位素 峰圖。二級質譜的具體結果和分析見圖5和圖6。異源表達菌株的CLT質譜分析結果見圖 9。
步驟三,異源表達雙功能質粒載體的構建本實施例中用於異源表達載體的構建採用酶切連接的方法。因為構建文庫所用 的柯斯質粒(PHZ1358)是一種大腸桿菌鏈黴菌的穿梭質粒,具有在鏈黴菌中遺傳不穩定 的特點,在非抗性選擇的條件下,質粒極容易丟失,所以不適合用於異源表達。本實施例採 用的是以PSET152為載體,將基因組文庫中篩選到的負責環噻唑黴素生物合成的柯斯質 粒酶切,連接到經相應限制性內切酶酶切的PSET152載體上見圖8,構建了載體pJTU4891 和pJTU4892。pJTU4894是作為基因缺失質粒構建的,採用了 PCR-Targeting的方法在將 PJTU4891轉化至含有pIJ790質粒的大腸桿菌BW25113中(E. coli BW25113/pIJ790)中制 備成感受態細胞,以通過PCR擴增的pIJ779或pIJ778中含有的aac基因(帶有與目的替 換基因兩側同源的尾端)DNA進行電轉化,得到基因置換質粒pJTU4894。所有的異源表達載 體構建成功後都轉化到大腸桿菌ET12567中以消除DNA甲基化影響,然後用接合轉移的方 法轉化變鉛青鏈黴菌1326。步驟四,環噻唑黴素的異源表達確定了一個完整的生物合成基因簇從吸水鏈黴菌10-22基因組文庫中用基於環化脫水酶的保守序列設計的引物篩 選得到兩個陽性cosmids,其中含有較長插入片段的一個質粒14E6測序後進行後續的分 析。將14E6用XbaI和EcoRI雙酶切後與穿梭載體pSET152雙酶切後的片段連接,構 建出含有27kb插入序列的重組質粒PJTU4891,將之通過大腸桿菌ET12567介導轉入異源宿 主變鉛青鏈黴菌1326中,對照是空載體pSET152轉入1326。生測實驗表明pJTU4891使得 1326具有了抑制灰黴菌的活性,作為對照的含空載體菌株則沒有活性(圖7,8)。這一結果表明27kb的插入片段中包含了完整的環噻唑黴素生物合成基因簇。在 此克隆的基礎上,進一步構建了多個衍生質粒,確認一段22kb的序列包含了基本最小化的 環噻唑黴素生物合成基因簇。其中含有最小基因簇的PJTU4892在1326中的表達產物質譜 分析如圖9。序列表上海交通大學環噻唑黴素生物合成功能基因簇18PatentIn version 3. 3134982DNA
Streptomyces hygroscopicus 10-221ggatcttttccgctgcataa ccctgcttcg gggtcattat agcgattttt tcggtat atc60catcctttttcgcacgatat acaggatttt gccaaagggt tcgtgtagac tttccttggt120gtatccaacg gcgtcagccg ggcaggatag gtgaagtagg cccacccgcg agcgggtgtt180ccttcttcactgtcccttat tcgcacctgg cggtgctcaa cgggaatcct gctctgcgag240gctggccggctaccgccggc gtaacagatg agggcaagcg gatggctgat gaaaccaagc300caaccaggaa gggcagccca cctatcaagg tgtactgcct tccagacgaa cgaagagcga360ttgaggaaaa ggcggcggcg gccggcatga gcctgtcggc ctacctgctg gccgtcggcc420agggctacaaaatcacgggc gtcgtggact atgagcacgt ccgcgagctg gcccgcatca480atggcgacctgggccgcctg ggcggcctgc tgaaactctg gctcaccgac gacccgcgca540cggcgcggttcggtgatgcc acgatcctcg ccctgctggc gaagatcgaa gagaagcagg600acgagcttggcaaggtcatg atgggcgtgg tccgcccgag ggcagagcca tgactttttt660agccgctaaaacggccgggg ggtgcgcgtg attgccaagc acgtccccat gcgctccatc720aagaagagcgacttcgcgga gctggtgaag tacatcaccg acgagcaagg caagaccgat780ccccggggacctgcaggtcg actctagagg atcgtgtgga agttccgtac cgggacggcc840tggcgggatgtgcctgagcg gtacgggccg tgggccacgc tgtacacccg ttttcgccgg900tgggcggcggacggcacgtt cgaacggatg ctccgcgccg cgcagtcccg ggtcgacgcc960gtcggtgacatcgactggct ggtgtcggtc gactccacca tcgtccgcgc ccaccagcat1020gccgccggtgctcgaaaagg gggctccgca gcccagctct cgggcgctcc cgaggcggcc1080tgaccagcaagattcacctg gcctgcgacg gtgccggccg cccgctcgcc ttcatcgtca1140cgggcggcaacgccaacgac tgcacccagt tctccgctgt gatggaggcg atccgggtgc1200cccgcccaggcccggggcgg ccccgggtgc ggccctcgca cgtcctgggc gacaagggct1260acagctccagggcgatccgc agctggctgc gtcggcgcgg gatcagccac accattcccg1320agcgagccgatcaggtccgc aaccggctga accgcggcag ccgtggcgga cggcccccgg1380ccttcgaccgcgacacctac aagcggcgca acgtggtgga acggtgcttc aacaagctga1440agcagtggcgcggcatcgcc acccggtacg acaagaccac cgagtcctac caagcagccg1500tcaccctcgcagccctactg atgtgggcgt gacgtttgac gacaggacct aggcccaggt1560gccgtccgccgaccagcggc gatgccgttc agagaccgtc ttccaggccc cgtagcgttc1620cggcaggtcacgccacggga caccggtgcg gacccggaac aggatcccgt tgaccaccct1680gcgatggtcgctccaccggc ctcgccgacg gcccgccgag ggcagatgcg attcgagtag1740cgaccactcgcgattcgtca gatcgccgac ccatgccccg tccaacgagc aaccggtcgg1800agagtcacatgatccgtcgg acagtgcctg gccgcgggcc tcgaccggcc tcctcaggtt1860gctgcaagcaggtgccgcac acgcgcaggg ccgtcgatgg tgccgcgggc gatgcggtgg1920gccagctcttcgagccgttc ctgggtcgtg cgatccgccg gttggtacac gacgacgcgg1980gtacggggattctcctctag cagcagggtg atggcgcgca cggacaggct gccgacgtgc2040cgtgaccggatgcgcttcac acgtccgggc tcggtggaca catccgcctg ctcccacagg2100cgcacgaacagcggtgactc ctcgcggagc cgggccagca acggcgccca cgccggatcg2160gtgaccgactcgccgtggta cgcgcgcagt ttggccacga cggccgcgca ttcctgttcg2220
tggtcggagtgtgcggcgat ccagtcgggg tgcgtgaaat gcaggtaggc gcagttgcga2280tcggccggaggcagtgcctc caggtcgtcg atcatgaagc ggaacggcgc gttgtaggcc2340agaggctcgaaccaggggtt catcaccacc gccgggtgcg gagagaggct gtccagcagc2400gtctgcacccggccgcttgt cccttcgcag tttgagggtg gttctgcgtc cgggtgtccg2460ccgaggaggaacaggtgccg gcgctcgctg ctcgacaggc gcaacgcgtc cgcgatcgcg2520gccagcacctcgacgctcgg ccgcacgtca cgtccctgtt cgagccaggt gtaccagctc2580gacccgacattcgcgagaac cgcgacctcc tcccggcgca gtcccttcac ccgacgccgg2640ccgccaccgtcgggcagacc cacgtccgcg ggcgagagcc ggtcacgtcg tgcccgcagg2700tacgcgccgagttcgcgaga tcgtacatcc gccatggcaa cgatcatcgc acggtgagac2760caggccggactggtggtccg agcaccagca tcaccgcact ctgggtcgtg gcccgccgga2820cgcgcagggtgagtgcatgc aacggacctg gtcggtttta cgtcgcggca ttcggcgcga2880cgtacacgttcagtatcggc aatgtcaccg ccccgcgcct cggaccggaa ctgggcgcca2940gtcgtggcgaagtcgccctc gtgctcgccg cgttcgcggt gtcgttcgcg gccgggctga3000tcctcgccggccgcctcggt gaccggtatg gccgcaggcg gctgctgggc atcgggcttc3060ttgcgctcgcactgacgtcg gcgctggccg cggcggcacc cggtctgtgg ctgctggtcg3120ctgcccgcgtcctgcaaggc gcgtcctccg cgatcgtgat gccccagacc ctggcgatca3180tccagaccttgggcagcgag cccgcccggg cacgtgggct cgcggcgttc accgcgagtt3240ccggcgtaggaacagtggcg ggccaagtcg tcggcggcct cgtcatgggg ctcggcctgc3300ccttcgcgggatggcgaggg gcggccctga cctccgcgat ccccagtgtg ctggcgctgc3360tcggtgtgcgccgacttctg gttcatccgc cgagcagcac cgaacggccc gacctcggcg3420gcgcgcttgggctgggcact tcgctcctgg ctctggttgc cgggctgtcg ctcggcccgg3480caacgggctgggcctggtgg gcgtcggcgc tggtggcact ggggttcctt gggttgtacg3540gtttctggctcgaccaggga cggcgcgagc gtgcgggacg tccggttctc gtcgcgccct3600ccagcctgcggctgccctcg gttcggctcg gcctgctgat ggctgtgctg cttttcgccg3660gctacggcgcgttcagctac gagtactcga tgctcaccca ggtcggcctc gggttgacac3720cggtccagtccggtctcgcg ctgaccgcgt tcgcggggac cttcgtactc gccgggcttc3780acatgccgggcatcatgtcg cggttcggcg agcgcacaat ggagctggct gcggtcctgc3840tgtgtgccggcctgacactg ctcggcgtgg cctcgtggtt cgctcagggc aagagcgtcg3900cgatctgggtcggttgcttc gaagtgctcg gcgtactcct cggcgcggcg caggcgagcc3960agtacggccccctcgtcggg acggtcatgg cagcggtgcc ccaccgtgtc gcgggcctgg4020ccggcggtctgttcacgacg gcgcaacagg cctcgctggg actcggcatc gccaccatcg4080gcggagtcttcgggactctg gcccccagac tcggctggga gcacgccttc gcggtcgccc4140tcggcgtccagctgatcacc accgtgctct tctgggtcct cgcacgacgc ctccgcagcc4200gaccacgtgcctgcggcacc gtccttgctc cgggcgtaca gcacaggacg gaggcactcg4260attgaccacatccccgcccg cgggcgcagg ctcgatcaga gccggacctg tcgcgtcccg4320ctcacctgtccacgaagtgc ctgcgcactg tcccggccag cagaactcca gccagcagaa4380ggagacatcccgccgtgatc aagatgatca ttacgctcaa gcgtcgtgaa ggcatgaccc4440acgacgagttcaagcactac cagcagaaca tccaccgccc gctgctcatg tcgattccgg4500
aagcagaccggtacatccgc cggttcgtcg tgtcgtatcc cgttccggca ccgcgctacc4560
cggaaccggagtacgactcg gtggtcgaag cgtggttcga caccatggcc gacctcgaag4620ccttgttcttcagcgacaac ttcctgaaga ccgtcgaccc ggatcacggg aacttcatcg4680atctgtcgacgttcgggcgc gtcatcaccg aggaggacgt agtcatcgac ggccgatgaa4740tgcgcaccggcgcatcggtg tgcgagccgg ttgaccaccg atacgcggcc ggcgccatgt4800gcagatcgcagagccggagg tggaggtcgc ccgccgcgcg agccgttggc cgcgcggcgg4860ggcaggtccggtcagtgcgc tgcgacttcc ggtcgtcatc acggcggcga cgaggtcgcg4920ccctttcgtcccttctcttc aggaggcggc agcggttacg gatgccgcaa aggggcctgg4980tagtccgggggcccggtccc cttcacggcc gggggccggc gcccggccgc cggccggtcg5040cggagggcaggagggcaagc ctgatggtgg gcaagcgcat ggagaacgag gcgggatcga5100gcaacgatccgcgcgcggat gtgctgcgcg tcctggggat gctgaaggtc gccaccgccg5160accggatcaagcggctgtcc tcgccgcacc cggcctaccg gcacacgacc aagccgacgg5220cggccaagaaggaagcccgg accgcctccc accgcgccgc ggtgcacgac cttcggctgc5280acggcctggctgtggagggc ggccggacgc ggggaggggg aagagacccg gctggtcacg5340aagaaggtctggccaccgcc gcgatcgact tggaccgcga gatagaggag atgggcggca5400ttgcccaagagggtgggccg ctccggcgcc tcgcacgcga tgacggtgaa ccgtgtcgtc5460gatgatcagcacccgtcggg ccccagctgt tccgccacgt aatcacggac gtcgtcacgc5520agggcgtccgcgtcccagac gccgctgttc agcagccgct ggaagccgtc cggagtgcgg5580tgcgctgcccattccgcgag ctgccagcca ttcttgcgtg tcgaccgccc cagcagacca5640cggacgcagtcccgcatccg ccaccgcaga tccgcccgag cgaaccggcc cgccacccga5700gcgaacaccgactccaactc agctgcccag agcgctattt gacgaccacg ccatcggccg5760gtcccgcggcggaccgacga caaaggtccg cctcgccgcc gatgcccgct gccggcccct5820cgcatccgtaggccaagccg gtgacgcacc tgccttcacc gccgtcatgg gccgcctgcg5880cgttccccgtcggcgaggac acccccgcac caggccggat ccggtcctgg ccgacaaggc5940gtactcctcccacgcgatcc gcgagcacct gcgcaagcgc ggtatccggg cggtgatccc6000cgtcccaggcggaccagcgc agccaccggc tccgccaggg cggccgaggc ggcaggccac6060cggccttcgaccgcgagacc cacaagcagc gcaacaccgt cgagcggtgc atcgaccgcc6120tcaagcagtggcgaggcatc gccacccagt gcgagaaggc cgcgccggcg cggcgcatct6180cggacgcggaggtgtccaca acggcgtccc atacttcacc ggtcagtgtc agggtggcgt6240ggtcccgtcgacgtgccggc accggcccgg ccttcgcgcg cgggcgccgc ggacgggcgt6300caggtcttttcggagccggc cgcaggaagg cggcgcccca cccgcggcgg ggctcggccg6360ctcccccggtgagggaagca ttgctcggtt cgcgcctaat ccttcggccg ctcgtccccg6420ttcggcggcgggcacggacg gatgaggagc aggccgcagt cgaggtatga cgggcctggc6480ctggtgcgagcactgtgcgc cggaatgctc gctttcaggt catgttgcgt cgatcctcac6540atcctcccaggtcaacgcca ctaaattgag gtgctcgtac atccggttga ccgcggatgc6600acggtacgtcgtgcaaggag gcgagcagtt gacctcagtc gatcgaatcg ggcacgcacg6660cgagcgggcacggcttctgg ccgtcatcga cagagcacgc gggggacggg gtccggcgag6720catcgtcatcaggggagagc gggggatcgg caagtcggcc ctgctgggcg agttcgcgtc6780gctcgccgccgacgccgggt tccgagtgtc cgccgtgtcg gcagggaccc agcccggtga6840cccgctcggc gccgccctcc gcgtcgtcag ccgactggac gcgaggtgca ccgagcccgc6900
cgagggcacggcgctccacc ggccggcgcc ggccggcgaa cccgtgcccc accgtgccgc6960cccgagcgaggaagtgctcc gcgaactcgt ggagaccgtg tgccggcagg ccaggcggac7020gccggtcgcgatctgcctgg acgacgccgg acatctcgac ccgtggtcgc tgcactggct7080
ctcgggactgtactccgcag cttccgacct gcccctggcc atcgccctga ccggcgggga7140catcgcggcggcggaccagg acccgtggcc ccccgcactc gccgcggccg cagagcacat7200cgcactgtccgggctggacc cggaggaggt gggcgccttc gcggcggcgt accgcaacgt7260cccgctcgacgcgccgaccg cccaactgtg ccacgagttg accggcggca acccggccct7320gctgctgtccctgctcgcgt gtcacaccgg cacggccccc accgccgacg ccctgcgcga7380caccgccgcgtcggcggtac tgcccggtgc cgatcgctgg ctggccgggc tcgggggagc7440cgccctcgggctggcacggg ccgtcgccgt cctcggcccc caggcggaga tcacccagtg7500cgccgaactggcagggctct ccgtacggga ggcgctgccc ctgatcgacg agttggtcgc7560ccgctcgctgttcgccaacc gcaccccgct gtccttccgc caccccctgc tcgccgggat7620ggtcatcagccgcgtcccgg ccggtacccg ggctgccctg cacctcaccg ccgccgggat7680cctgcgcgacgggcacttcg gcgccaccca cgtggcacgg cacctggtcg ccgccggacc7740gctcggcctcgcctggaccg tccggccgtt acggatcgcg gcgaaccaac tggagcgcga7800gggcaggcatgaggaggccg ccggacatct gcgcgggatg ctgcgggaac gtctgcgccc7860gcgggtccgctcgtccgtcc agtgccagct cgccgcgctg gacgggttcg ccgcccccga7920cagcgccgtacgccggttgg acgccgcgcg gcgcgaggcc gacgacccgc gctgcgccac7980cgactacgccgtggccctcg gcaccctgct ggccgagtgc ggacggcccg aggacgcggt8040ggccgtactcgacgacaccg ccgagcggct gggtccgcaa gcggcggccc agcgctggcg8100gctccggctgcgcaaggcgc tcctctgcct gggcggaccg gtcccttccg tcctccccgc8160cgatctgcccgacagtctgg ccgcgcaggc cccgtccgac gacgaggccc gacgggagct8220gtcggcgctgcgggccgtgc acgccctgcg cgacggcacc gaccgggacg ccgccgtggg8280acacgcgcgcggagcgttga ccgggagcga ggaccccggc cgcctgttgt ggcacggctg8340cgaggtcctgatccgtgccg acgaactcgc cgaggcgtgg tcgtactgca gccgggcccg8400cctgctggaccagtcccggc ccggcacgtg gggagacgtc ggcgtcggtc tgctgcgtgc8460cctcgtcctgtacgcccgcg gcagcctcac cgccgccgac gccgccctga ccccgctggc8520ggacctgctgcgcccggccg ccgaggccgc ccggctgccg gccaccctca ccgtggcggt8580cctggccgaggtgcgggccc agaccggtgc cacggacgca gccctcgccc tcctcgccga8640ctgcggactggacggcgagc tgccggcccg ccaggacacc gtggcggtcc tgggcgcccg8700cgccgccgtgtgggaacagg ccggggacac cgctcgcgcc ctggaggacc tctacgccgc8760tggacggctgctggccgact cccgggtgcg caaccccgcg gtgctgccgt ggcggtcccg8820cgccgcccggttgctggctt ctcgcggcga cctgaccgag gcgtccgggc tcgccgccgc8880cgagtgggaggacgcgcgcc gctggggaac cccgcgcgcg gtcggcacgg cccagcacgc8940gctcgccctgaccgagacgg ggggccgccg gctccgccgt ctcgccacgg ccgtggagac9000cctggcccactcgcccgccc ggctggaact ggcttacgcc cgccgtgatc tcggggccgc9060gctgagcgaggctggacgcg ccgacgccgc gcgcacggag ttccgcgcgg cgctctccct9120ggccaagtcctgcggagcgc agccgctggt gcgccgcgtc cccttggacc gcgaatgtct9180ctggccggtggtggacgacg accggggctc gcccgcgctg agcggcctca ccccccagga9240
acagcggatc ctgggcctgg cgcgagccgg gcacaccaac aaggccatcg cgggcaagct9300gttcgtcacc gtgcggaccg tggagttcca tctctcgggt gcctaccgca agctcggcat9360ctccggacgc gaccagctgg ccgatgtcat ccccgcaccc ttgggcaccg gcggcggccg9420ggcgtagcgg cgcggcgggg gaggcgccgg gccggagcct ccccccgcca ctgccggagc9480gggccgtacg gcggtgttca gccggctccg ccggcggccc acgcctcgcc gatacggcgc9540cactcgggcc gttccgagga ggggtcgacg gaggcgacgt accgctggaa gctgccgacc9600gcgtcaacgc cgtgcaccgc ctcgacggtg agcgccgcca gatggcacag cagcgcccgg9660tcgaccggct tgagtccgag ccggttgagg tgcaggtaga ggtagttcat catgaggcgg9720aacgaggcga accagtcgtc cgtccgtacg aagtcctcgt gcccgtggtc cgaccgcagg9780accgcgtgga actcgctcgt ccgacgcgtc ggcatccgag gtgcccgggc ggccccgccc9840atcgacacct cgccggaggc cagcagcggg tgcgcgatcc gctggtggtg gcgcaccgcg9900gccgcccatt ccgtgacgaa cggcaccacg tcaccgactg cctccgagcg gtccgaccgg9960tccgagcgat ccgctccgtc cccttcagtc gctccgtccg agagggccgc ttccacggac10020cgcagccgct cgcacagcac cgtctcctgc cgccggaacc ggtcgtcgaa agcggcccgc10080acggccaccg ggtcccgggt gcgggacagg aacgcgtcgg catgcgatcg caacgacagg10140aagccacgct cgatcggctc cccgcccgtg gtgaagggga cagccgcgac ggacgtcgtc10200gtccacatca ggtccaaagc gagcagcgac agcgcgccgc ccgcccgcac ccgctcgtac10260gcccggaaag cctggccgtt ggtgtcgctg aggaagccgg ccaacagctc gctcgcccgc10320agcgactcca gcacgggcag ccggtgatcg tacggccgtt ccagcaccgt attgtcgggc10380acccacgggt gtctcgggcc ggtctccatc tccagctccg caagccgggc gtgcaccggg10440gcgagcgcgc cctcgtccag ccgtgccgcg gagggacggg cgcgcaggta gtccgtcacg10500atcccggtca ccgtcggccg gacgcgctcc tcccagtccg tgccgcgaca gcggaagttc10560agccgcagat gcggaccgcg caaccagtgc cggccgaacc aggccgcctc ggcccacggt10620gccacggcct cgaaggccgg ccggacggcg cgcaggacca gttccggctc ggcttcctcg10680tcgtggtgat ggacatggag gctgtaccag ctcgatcccg ccgtcccgtt cacgaggcgg10740ccagtgcctc gggcagctca gcgagcaccc ggccgaccag gaaccgcagt tggttctcct10800gccacagggt cagccccagc cggttgctga ccaggtgggc acagcgcagc agcaccagac10860tcgtgcccgg atgacgggtg tcggacagtc cgaggggctc cgccagcgga gaccccgccc10920acgcggaggt gaacacgccc gtctcctcca gggcgtgcaa ccgctcgcgc agccgccgca10980ccgaagccag ccagtacgcc cgctgatcgt gcccgcccgc cccggggtcc tccgccatcc11040gccaggtcag gcgggcccgc gcacgcagct tgtcgcgctg tgccagatag cgcggggcga11100cgtcctcggc ctcgggaccg ctgccgaacg gaagtggcgg tccgccgtgc cgcgcccact11160ggtcgcggac ctcctcgcac aacgcgaaca caccgacgac caggtcgaag gccagcagcg11220cacgctgctc caccgtcgcc ccggccgcga ccacggacag cgcgagccgg ctcgactcga11280agaagtgctg ctccacggcg gcgatcgccg caccccgccc gtagtcgtcg tactcgcgtt11340catagggcag gaactccacg gagttgttgg ggcggaccag gacgtcgtgg ccgctgcggc11400cctccagacc ggccagtccg gcggcgacct gggtgaagcg ggaccggtcc accacgtccg11460cggccggggt gctggccagg aactcccgga tgcgtttccc ggtccgcagc tcgatcgccg11520agcggtcggc gctcgccgcg ggcagcagcc gcagccgcac atggggcccg ccctcccagt11580
accgcaggaa gaagtaccgc tgcaccagcc cgtcggcggt cagctccgcg accaggggcc11640tgacacagtc ggtcagcagc agatcctggt cggtgtcgta gaagatgtgc gcgcacaccc11700agtccgcgcc ccgggcggcc tcggggtcaa gcgggccgct gtcgttctcc ggcatcctgt11760cctccgttga tctcgatcag aaactcggtc acccggggtc cgctgtcccc gtagccgggc11820atgccgtccg ggccgggcag tgcctcctgg aggaacagca cctgcccgtc gccggccacc11880gcccgttcga acacgccggc cagcagcagg ttcgcgaagt cgacgtagag cggcttgcgc11940gacttgatcc gccacacgct gcccccgacc acggaggccg ggtccagggc gcgtacgaag12000cagcggcgcg ggatgccgtg ctcgcgcagc cagccggcca gtcgcagcag gtgcgcccgg12060tcgctcgcgc ccttctcgcg gaccggaacg gcggacgccg ggaacaccca ctgacggcgg12120ctgaccgtgg tcgcgccgac cgtcacacgg ggttcggcca gcacgccgcc cacctcggcc12180agggacgggt ccccgaacat ccggcggccc gggatgagca ggttggacgt cgctccgaac12240acctggagca gcagccggat cgcgggtggg agccacagct ccgcgatgag gttgggatgc12300accgggcgca cctcggtgtc gcgaccgcgc gaccacagga cgagcaggcc ccgcgcggga12360tcgtggcgca ccagcaggtc cgacagcgga atgcggtgct cggccgcgcg ctcgctgtgc12420ccttccgggt agtcgatctc ggcggcgacg gcggaccgcc gtagccccac gttgctgccg12480aagtgccggc aggtgtccgc gacgatcact gcgtcgtccg gtgcggctgt cttcgcccgg12540gcctcggtac cggcctgcgt cagcaggcgg ctgatgcggt cgcgccctcg gccgtgcccg12600gagttgaccg cgttgaccac gaaccgggcg tccggcccgt cgagcggctg cccgtagaac12660gccacggagt ccggcgcccg catccagcgc ggccagccgt cggccagatc ggccagccgc12720gccgggtcca gccgcaccac gccgtcctcg tcggcgtgga ccggtgcggc tagcgcgcac12780aggtcggccc gtcgggcggc gagttcacgg atgcggggga ggcggtggtc cagcagggac12840gcgtagccgt gggtcgcgat ggacagcagg cctggcagct ccgggtcctc gcgcagccac12900tcctgcaccg tgcggtggaa ggtcagcagg ggcatgctgg caccagtgcc cacgcgttcg12960gcgaaggtgt ctgcgagggc cacccggccg ggcagcgccg ggtccagtac cgcgtagcag13020cggcggacgg tgtcgaggtc ccgcaggacc ggctcccagt cctgccggac cgggcccgcc13080aggggctccg ccagcaacgc gttctcgatg acgctgttct tggcgggcag ctggatctgc13140tcgggcccgg ccaggtcccg tacgcggcgc agcacctcct cgatcgccgt gccgcaccgc13200agccggtccg ccgcgtccgg cagcgtcggg taccgcgcca ccagggccgc cagcgcgtcg13260acctcaccga caagcgccgc cgtgtcgggg cccgcgccgg ccagccagtc tcgcagggcg13320gcgagcgggt ccagcgcctg gtcggcgaag ggacgctcgg cctccagcag tcccagttcc13380accagtcggc ccaggtacgt gtcggcggcg tccacgccgt tcccggtgcg cgtcgcgatc13440tcgcgcgcgg cgtccgcacg gacccgcccg gcctcgccga ccgcggccac acaggccgcg13500accgcggctc ccgccggcag cctccgcaac ggctcctccg gccccgtgcc gaggaactcc13560cagcgcccgt ccgccagatg ggcgctgggg ttgagacgca gccgcatccg ggcggccagc13620acggggcgca ggctcagctg ccgtaccact tgctgcacca cccacacgtt gatctccgcg13680accgtcacca cggcgagtcc cggggcgggc gcgggagcgg ggcgcgcgtc cggctcccgc13740cagacaccga gaccgctgac tgtgaaggtg ctgaaggggc tggtcttcat ggtgacccgg13800gccaggtact tcgccaggcg cagggccagc gagtggtccg gcaccgcctc gtccggacgc13860gccagccact tgcggacctg ccggtagaga accggactgc tgagcaccag gccgtgctgg13920
aagcccgggt cggcgaccgc cttgcgcagc agcaggtgctgctcggccgt ccggtgcgcc13980accagctcgt ccagtcgggc ggtggcccgc tcatgttccg cgagcagttc cgtccaggac14040
cgcacgccgg cggtcacggc gggcggcagc gacgccctta cctcgtcgtt ccagtaccgg14100tcggtcaggg cgcgccggtt gtggacggcc cggcgcagcg ccaccagccg ggacttgcct14160gtcgtggcct gcccgatcag cccgtacagc gcgtcggaca gtccggcctc cgcggcgccg14220agcgcccgct cgccgtccag gaccgtcccg acctggttccacagctccgg tgagctcatg14280tcgtcgagca gcggtaccgg caggccgccg acgcgcacgccgaagacgtc cggggtggtg14340tggttctcgg tcatggccgg ctccagtgtc acgggaacgg gtgcgggtgc gggttgatgt14400ccgacgggga cagcggcccg gcccggtagc ccagcagcgcgggcagccgc agcagccggg14460gcagtccgtg ggtgcggcgc atgccgtggc cgaaggtcatgggcagcaga ccggggacga14520tcaccttcgc gcaggcaagt ccgccggccc ggtgctcgtccgtggtctgg tccaccacga14580tcacgtcctg gccgcggcgg gtgaaccggg tcaccacctcgatgaggtcg tcccgcagat14640ccgtgccgcg cggccggcag tccgcgcgcg cgaacgcctcctccaccggg aggcccggcg14700cgccggtgcc gggaggcccg tcgccgagga ggaagccgaa ccggtcgaac gcggcggggt14760ggcagtacag cagggcgtgg tcccgcatgt cccgcacctg gtccgggtcg gtcaccatcg14820ccccgatccg ctcccgctcc tcgcggtagg cgtcacggttccagcccagg ttggcggtca14880gctccagcag gccgttcagc aacgcctgtt cgggatcgaa gtgcgctcct gcggcacaga14940cggcggccgg ttccgcccgc gggtccccgg gtgcggggaa gaggcgtgcg gtggggtgca15000ccgccatgac ccacgcggtg gggatgccgt gctccggcgtggtggcgaag gccaggaccc15060ggtgcccgct gtcctgccgg atgcgctcgg ccagcaccgcgatacgcggg tcggtcaccg15120tcgccaggtc cacccggggc gcgggcagcc gcgcgtacca ggtgagcagg aacgcgtccc15180gctccgccag ctccaccagc ccgtgcagcg ccgcctcctccagacagccg cccagagcgc15240acccgttgga cacctcgtac gccagcggcc gggcgtccgg attgccgtgc cgggtgcggt15300agtacgcgta gtcctcgggt acgaggacgg gcgcgtcgcg ggcgaaggag tgcccccaca15360cccagtcgag ggccattccc gggtcgaacg gcgggtaggg gaagccgggt gcgtcgtacc15420gctcggacgg atacaggccc agctccaccg gacacagcgcctggtcggcg acctcgcggt15480aggaggcccg caccgtcgtg cgccggccgc cggggcgggcgccgccgagt cgctccaacg15540cctcggccag cgcggtgcgt tcacaggagg cgtaggcgag gttccggccg aagccggcct15600cctgctgtcc gtccggcagg tgcagcgggg cggacaccatcggatagcgg tagtcggtgc15660gtacgtcgag ttggcggacc actccggtgt gtccgtcgacgtacgtccgg gtcaacgcct15720cccagtcggc ccgcagatcg cggacccggt aggtgtcccg gtcgggtttg ggccgggcgg15780tgccgagcag ctccggcggc cggtcgtccg ggagcccgccgcactcgggg cagcgcgggt15840cgggcaggaa gggatgggcg tcgaccgtca tggtcgtcag tgacagcatc accagaccgc15900accgggtcag ccgtcctccg gggaagcgga gttcgtccgccaccagttcc gcgaccgcgt15960cgcacgccca ggccgtcagc acaggggcgg ggtggtcggcgaggcgctca ccgaatcgcc16020gtaccagttc ggcccggggg ctgtccggcc ccactgcccg ctcccggcgg gtgcgggcgc16080accgggcgca gcccgcgcgc ccgggcacga ccatgggccccacgaccacc ctgcccaact16140ccacccggac gggcaggcgg ggcgtctgcg cggagacgatggccgagtcg tcggcccagc16200cgtcgtcggc gacgacggtc acggcagggg agccgctgtcggggccggtg aggccgatcc16260
cgttcgtggc gccggtggcg tcttcgccaccggtcccggccggtgtcccg tggctgcggg16320
agagcaccgc ccggacagcg gtggcgagcaggcccttgcccaggaccgcc gccgtggcgg16380ggcggactgc ggcggtgtcg gtcacggtcacttccctcgtcggtgggagc ggtgccgtgt16440ccggcgggcg caccgcccgc cggacacggctgtgcgatgtgtgccgcttc agctgtgcgg16500cgcatgccgc ttcagcgccg cgtcagcagcaacagcacga gcagcagctc gccggggtac16560cggtcgaggt gcagttggac gcgccgatctcgaccatcgcgtgacccacg ttgatcgact16620ccaggccggc gcccggggag gtcggcagcacgtcgagttcgtcgacgctg aggtcggcga16680ggtcgaggac gagttccttc tccatcggattcccctttccgcgttgtcgg ttgtgcccaa16740ggccaggaat ctggccgtgt ccgatgttcgagcggaacgg ggcccggggt cttcacggtg16800cgaccgcagt cccgcccgta ggatcgagcggctacgggcccggggccgcc cccggggagc16860cgcggttcac catgtcagcg gcatctcgtactgcgccgtg gccctgcggc ggccgacggc16920catgcagaac acgggtacgt acgccgcgtcggcgacacccatcaactcgc ggacgactcc16980ctcgtggtag ccgttggtga tgcgcacagagcgtcccactgcggccgcga gcacgctgat17040gcgctgggcc acgatcccgc tctcctggtgcaggatccgg taaccgcggg ccccgaacgc17100ccgctccccc tcgacccggt tcacggtcaggaacacgatcgcgtcggcct tcgcggagtt17160cacggcaggg gtccggtcgc agagcatcgcgaggacgccg cgccagtttg gtcccggcac17220gcgcgccagc acgggggcgg gggccgggtgcagccggtacagcccggtgt cgaggccgtc17280gacgcggagg gcgagcacat ggcagtcgacgagcgggcgg cagacccggc tggtgtgatc17340ggacggcacg ggctccaggg catgccgcagaacggaggcg agccggtgca cgggcagcgg17400atccccgccc ggcaggaaca tccggccaccggagtcacga gtccgcagcg tggcggccaa17460ctcgatctcg ccggggccgg gttcggtcggcgtcgccagg gacagttgcc gttcaccgcc17520ccgcacgccg gccgggaggt ggaaggcccgtgggtccaccgccgggcgcc cggccgccca17580ggtccgcctg gcggcccggt cgacttccagcagtcccgaccaggcggcgg gatcaaccgc17640gttggtccgc acgtgcgccg cccggatggcaggcagggcg gtggccggcg acgctttgcc17700ggcggcgccg gccggcggtg gggaaggtgcgggacgctgcgcggccggga cgggcgcggg17760cagtggaccg gtgcgcagat cgaggacggcgaccgaggtctcctcggacg cgtccagccc17820tagagcccgg ttgacgacct cgtcgtcgaaccggtggtgcacacgggccc gcagcccgag17880cgcgcccgcg gcgagcaggg cgttgccgaccgtcataccg gcctcctggg cgcacagccg17940gtacgcgtag tcgcggtagc ggaaggccgccttgcggaag cagaccgccg ccacgagcag18000ggcgtcggga gcgtcgtgcg ctccgggggccacggcggcg ggccgttcca ctccgacggc18060ggcgactagc acatccggca gaccaccctcccgcagcctg gtcaggacgt ggtgcgcggg18120gtcgtagtgg tagcagccgg cgcccagttcgccggccggtcgcgccgtcc acagatacag18180ctcgaccgga tagaagcagc gggccgaggccaccagccgg tgatacggcc agacggcgtg18240cggtcccacc tccatgcgac ccatcccgtagacgcagtgcagcagcaccg acacggcggg18300ctcttcgaga cggtccaggc acggcgcaccgccggggtgcgcccggcgga aggaggcgaa18360ggaccatcgc gcgtcgccca ccgcacgggccggcgcgctcaacggatgcc ggggcagccc18420gcggtacgtc ttggccggca gcggatcgtccgccccgccctcctccccgt ggccctccgc18480gaagagttcc cggacgccct cgaaggtgcggtgccagaag cggagtccga cggtgtcggc18540gtccgcgtcg gccacaccgt gcgccgccccggcgccgtgg tccgcggtgc tagtcatcga18600
ggaccacgac ccggagcagg gagggcagca cttcgtgcac ggcggggtcg tggtccagcg18660gcagggccac cggtcgcagg ccgcgggccc gcaggcagtc caccatgcgc tccggcccgg18720gtgcggacgg ccacggagca ccggccgccg gtccctcccc gggcggtgac cccaaccccg18780ccacggtcgg cggcgcgtac gcaggctcgc cggtgatgac ggcctgccgg tccagcaggg18 840ctcgctccag accgtccgcg accgcgtccg gaccgcaggt cgccgccacc gcacggccgc18900cctgccacca ggccagcacc ggcaccccga gcgcgccccc cacgtcggcc acccgcaccg18960atcccccggc cgcccgcagc agaccgagga gcgacttcgc gcgggcgtcg aacacggcgg19020tggcgaggtc caggccggcg ggctcgacgc gcccgtcggc cacgtccgca acggccagcc19080ggacgcagtg ctgggccagc ccgtcggtca ccgcgtcgtc ccagccgagc cgcgccgcca19140ccccgggtcc gaggcccgac gccacggacg tgggaacgcg ccgcgcgcac ccgtccggga19200cgtcccaacc ccacacggtg gcgtccgcgt ccacgcggcg cgggtcggtg aaccgtgccg19260cgtacaccgc gattccgcgc aaggcggccg cgcggcgggc ctcggcgaaa ctcgtcccgg19320cgccgaacac acgcggagca ccgtcgtccg tgggccggac cgcttcggtg acgttcagcg19380gcacctgcgt gaactcacct tcctccaggc tgcgcagcac cccgagatga ggatcgaagc19440agcgcgccgc acgcgcggag aactcctgct cgccgaccgg tccggccgcc cggagcgcgc19500ggacccggct gacgaactcc tcttcccgct ccgggcgcac ggccagggcg tccgggtggg19560gcaggaacgc gtgagccgag gtgcgcagcg tctccaggtc gatacgggtc agctccgtct19620cgtgggaacc gctgatcccg gtgcgggcct tgaacgcggc gagtccgaga tgaccggcga19680cgacggcggc ggccggcccg ccgaggaagc ggctggaccg gtacggcccc gccgccccca19740gccgggacca ggccgacgcc caaccggggc cgcacgggcc cagccaggcg acgtcggcga19800ggaccaggcc ctgcaccagg agggcgccgg agtcccggca gagccggtcc agccgcaccg19860cacgatcgac gcgatcaccg gcggagacga cgtgcaggac gacatcggca cgggccgccg19920ctgcctcctc ctccggggac cagacggcat gctccacttc ctggtccggg tcgcggtgca19980gcgcctcggc ggccagttcc gtcagccgcc ccgagtccgt cgccgcttcc gtcgtccgca20040ccgcccgcag ccgccgcacc ccggagtgca gcgccgagca gaccagcgag acgaacactg20100ggcccgcacc cattacgacg acctcgctgt cgcggtaggt ctcgaaccgc ctcggagcgg20160agtcgaggtg gtactcgacg aacgcgatct cggccgcgta ggtctccagc tcccggtcgg20220tcaggccgtg cgggaggtcg tcggcggcgt ccaggacgca tccggccgcg cgcagccgct20280ccaccagggc gtccacgatc tgccgtttct cctccggcag gccccgcacc aggtcctcca20340actcggtccg gccgtcgaag tgcggggcga gccggtcgag ccattgatag gcggcccggc20400cgcgcagggc cacatcggct cccgccccga acacatgtac tccgttgtcg gtcggcacgt20460acagcacgtc ggacttgagt ttgggacgca tcgccagcct ccgattcggt ggtctggcga20520ttgtcacggc catcgccccg cccgtcctga cgggaccacc gaagaacctg ccacaggatc20580aataccgaag gagccaccca tgacccacct ccactcgggc accgtgcggc acggacccgg20640gcgacccccg atcaaccgcg cgagatgacg ccgagtgata cccgtgaaca gctgatgcgc20700cggcaccgct cgatcgacca tgaacgtcac agccggatcg tgccagctgc cggacacgcc20760tcacccgctg ttccgcacca actcgtaaat gaccggggcc aggccgctgt cctcgcccgc20820gaacgcactg ctggcacaag gtctcggtcc gctccgggag gtcattcgtc gccgttcacg20880cccaccgggc agttgtcccg gagaaggcgt cctggggaac atcgccggga cgcgcatcag20940
tgtcgcttcg agcgaacgag aggacgaccg agcatgatca gcgtggaaca cgccactccc21000ccagtcgtgg aggagtcggt actcgaagac ctgcgcgcac gcctgcgcgg ctaccgccgg21060gtcgacgtcc ccgccgggtt cggttgggcg cgcggtgtcg acggtgaccg cctcgcggac21120ctgatctccc attgggccag catgaccgtc tgcaagtaca tctccgcgtc accccactgt21180cccggcccca tcgtccggtc gaggtagcag aacaagacga ccggagcccc gaacgcctcg21240aagttcaagg tagcgatctt cctgggccgg tcggggtcgt cgcgtgcgat cccagcgctt21300cgtaccgctg ggccgccgca gcggagaagc ggtccgtgta cagcaaggcc agttcgtccg21360ggtacatcgg atactgccgc tcatcacccg ggtcgctcgc cagtgccctt gcggtcgtgc21420gcctcttcag ttcagccaag ggttcgccgg tcacgacgta catatgccac ggctggaggt21480tcccgctgga tggagcccgc gtcgctgcgg tcagcactcg ttcgagaacc tccttgggca21540ccggctcatc gctgaacgcc cgcacggccc ggcgactgtc cacggcctca tatacgtcca21600tgtctcgcgc cctctcatcc aaccgaaccc cgccaccgta ttcggcggtc agcaccgagc21660gtcgccgggg actgggcgac gacccgacga ccagtcagtc gttgatacga ccatggggag21720caggagtgat ctgacggata cccaatggga gcggtcaaat tctgccggtg agtaacgggc21780gttgcggcag gcggcaggac caccaccagg tcgtgaacgg ggcgctgtac cggatacgga21840cgggcatgca atggcgtgat ctgcctgatc ggcacgcacc gtggaagaca gtggacgagc21900ggcatcgccg ctggtcgatg aacagaacgt gggaggtgct cctgcgccaa gtcgaggccg21960actctgggct gactgggcct cccgaccaca tcggtccgcc ttgaataagc tctcggtact22020gaagagcgat ctgcgtgatc tcagcagttt tattggactc accggtcatg ggtctccttc22080ctggtctgtt cgggtcatgt ggcgcggccg ccgactggag cactcgcctg gtaggcgccg22140ctgctcgggt ctgatgacct gtgcgcgccc cggaatccgg gaaccactgt gtgatcgtcc22200acagaggaca ggaggcgctc gccgagcacc gcgccgactg acccgacccc gcggcccgac22260agccgcaccg ccccgcaccc ggatcgccgg cctcgcgacc cgcccccaga acatcgtcaa22320ctcggccttg cacacccgca cgaccgccgt cccgggactg gctcgcccgc ctcgaacacc22380tgaccaaagt ccagttcaag cagacggctc gtccaagcac cgccgcatac gaacgaccac22440tcaagctgaa ccttgcgcag cgcagatgaa acgaccagat cacccaacca gctaactgac22500aaagccgcag gccagaccct gctccagcag cgcccacaat cactgcagcc actggcactc22560ccccactcac cgccgcacta caaactgatc agtgcaggcc agaccaccaa ctactgatca22620gaaaaaccgc tcctggacac cgaactcgac caaatcgaca tgcgctggta acccgaccgg22680acaccgaagg ggtgacgggc agcgaacgcc gccacccgtg aacctgatca cctagccaac22740agaggaccgc aggcacggtt caggccgcca ggatgcgtaa ctgctggaag cggacctccg22800tctgccgacc ctcggtcagg gtgtggaagg cggcggattc accgccccgg ccttgtgcgc22860cgtacgccac gccagccggg ccgccgccat ccgctgtcgt tcagcgggtt ggacgtacaa22920aaccagtacc ggctacttga tcaggtcagc gacgtcggcg atctcgtcgg gcgcgtactc22980caggccgtcg tggacggagt cgttgccgag caggcgggcc tcgtggaatc cgtcaatcac23040cgactgaggc acatcgagcc gggccaaatc gccgatcacc gcgtgcaggc tcttccccgc23100ggctccgcgc tccttgcagc tagcttccac cacggaccgg tagccgaccc cggccagccg23160gaaggcagcc gccgcctcgg ctcgcccagc ctccagaaag aggtcgcgga tctcatctgg23220ggcgtcctgc gaatgtggac gcggctcctg ctccggccac actcgacaga tgagcgtctg23280
ctcccgatcg tcggtgatgtgcttgttgcc cttcatcgga aagcggatga ctgagtacag23340ctcgatcacc gccatgtcgcaaaagtcgca tgaccagacc tgctcctcca catgtcggcc23400tggccgttgc atagcgcccg gagttttcgg ttcgggatgg atccagcgga ggttgcgcag23460ggagatcgcg acccgattcg agcagtgcgg gcactcggcc tggcgcttgg ggccgagctt23520ggggaggaag gtgtcctgatccggcatagc gatcaggtag ccacagaatc ccctaatcgc23580caaaccattt ggccagggtctcggctggcg gcccgcctgc cacttcacga aggacggtac23640agggcggccg acgcttccaa gtcccacgct cccccgctca gccggcagct cgcgccctgc23700tccggagcga cgacggcttcggccttgagg acctcggcgc gggtgttaca accgtccttg23760tccgcatcga cccagtgcttgaacttcgtg cgctcgtacc cggtgcggtc ctcgctgcgg23820accgggagct gggtgagagcgtcctggacg ggcagggtgc cggtatcccg cgacgcggcg23880ggggccgggg gggcgtgcgcggttgtaggg gtgagagggg cggcaagtac ggcagccgca23940gcgatggtgg tgcgggcgag gcgcacgagc ggggtcctcc cgaaagatca cggacagttc24000gtgatcttcg tagcgactcccgcacgcgac ccgcccggca accggcacca accccacccg24060atcgggggtt gcatccgatcgtcgacacgc gcagaggacc atttgacggg caggcaccgg24120gtcttctccg gaggacccgctctcgggatc tatggcgcgc tccggaccgg aacaccccag24180ggccggcgga gaagacagacgagcacgttc ctcaactctc gcgcccacgg aacacccccg24240cgtcggcggg gaggacgggg gcccggagga atcccgcagg tgacgcgtgt gtggtcgaac24300gtagttgacg agtttggtcg gcgatagttg gcgggcccat cgccgttggg tgctgctcct24360ctgaagtgaa ggtcgtggatcaggcggtca gtctgaatgt ggcctggtca gggttggata24420gaggcgttcg tgttcgcggg cggtgtgata ggtgaagtag gcgtcgacag acggccgcgg24480ggtttgagga cggcttcagcgccaccgacg ggacgacgtc gactacgccg acgtgaaagc24540cctcataacc ggctgcctgg tccggacgga gggccgcacg gacgcggacc tggcggcgct24600ggagcgggtc accgagatcg tgtgcgaggg actgcgcgcg aggtgagccc ccggcacgcc24660gtgtaccggc acggggccga ggaccggcgc acggcgctcc gaatggcagc ttcttgtctt24720ccatggaggc atccggaggtgcttaatggt gcacccggta cgcacagtga gctgccaagg24780acacgggggg cgcatgaacg acacagggaa cctcggcgta tcgccgcccg accctccgag24840aacgcccgca ccgccgcgaccgcaggaacc gccggaacta ctcacgacac ccgcacgctc24900cgaggacaag cgaaccctgg ttctcaaggt cagccgccgc atgctgtggg tggggacagc24960ggcactcccg ctgcacaaca tcaccagtgt cgacgccttc aaggcgagga ctgactgggg25020caaagcgtgc atgcgtttcctcacggggct gttcggtgct cttctgctct tcgcgtggct25080gaaccgcgcg ggggacggcg gggatcacct cggggacctg ctcatcgtcg tcgtgatcgc25140cgcggccgcg ttcgccttca aggacgtgtt caggccgagg ccggtgctga ccgtcgagac25200ggccagcggt tccagggtgg ccctgaccct gccgagcatg gacgagttgc aacagatcgc25260cgaacggata gcacaggcca tcgacaaccc ggaagccgag ttcaagacgc tcgtgcagca25320gctcaacagc aacaacacga acaactacgg ccccgtcgtc catatgaacg gcggccgcgg25380aaacacgggg ttcagactatgagcgatgcg tcgaactact acgggccggt ggtcaacatg25440aacggcggcc gcgagaacgtcggcatcaac tacggcaccg tcggcggtgc ccaggacgtc25500gaggtccgtg ccgccgtaaa cgaactcaag ggcctcctgg gcgagttgcg tccacacctc25560acccgggaac aggaccgcaccgtcgaggag gccctgcccg aactcacccc agaccgcgaa25620
gcgttgcgca gtcggggtctcgtcctggcc tccgtcgctc agatcgcgtc ggccgtcggc25680gcggtgggcc agcccgtcgctgaggccgtg ggacggctgc tcgctctgct gggctgagca25740gccggacacg gcgaggacca ccggagccga cgaagcgctg acgagtatcc gtgcgggaag25800 cgctggagcg gcctccggctgtggaccagg cgctgcgcat tccgtgctcg tggaggggtg25860ggcgccctcc cggtggctgg gccccgcgcc gtcaccagca acggcgacct cgacgcctac25920ttcggctatc acaccgcccg cgaacacgga cggctctctg atccgcggac aggtcagccg25980cctccgccgg ctgcccggag gggtccggac ttctcgcctt ggagacctgt gcgggccggg26040catccgggtg gtgcatcagccaccggatcg agcgctcccg cctctccccg ccctgatccc26100gcggcctgac ctgaccggtctgaggcagga cctcctcgac cgtccagcaa acgccgttga26160gcagcagacc cgagcccggg gccagctcaa gaagccccct ttcggtcacc gtcggactcc26220tgcgcccggc cagacctcgg aggcgtcccg caggggctcg cccaggtcgg ccccgagctg26280ccggtgccag atcaggtgca gggcatgcgc gcgggccacg accggcaaag ctgtcgccgc26340gaccaggtcg ccgaagcgca ccgaccggcc ttccgctgcc agcagcagct gagcctgcag26400cgcgagggga tcgtccaggtctcggcgctg agccgagatc gcgtccagca cccccatcgc26460gtgcggccgc cagcccgtca ccaccgagta gcgccagccg caggcggccg ccgcctccac26520ggtcgcggcg aacttgagcg cgtccgcgtg ctcgatgagc cggcgcggcc ggacatcgaa26580cagccaccgg cgccgtcggg catgacggcc aggaagtccg gcgtgtgctc ggcgcgtcct26640gcagcgtgct cgaaccccag ccggaacgac tgcggcaaca cctccgccac ccgcaggaag26700tccagcgcga gcaacagccg ctgttcctcc agcgactcga acccatgatg ccggcgcgtc26760gagaccatga actgcatacccggccggtgc cgttgccggg cccgccaggt gaaccgtcgt26820accggttccg aggagaacaccggcacctca gccagatcac gaaccggcca gaccacctcg26880tccccggcaa accgccacgtcgtcgcccaa cgtcggggcc aggattctcc cagcgtcagc26940agatcccgtg ccgcctcctcgatcccgtac ggaacgacga gatcgtccag cccgcacgta27000tcggaccgca cgacggcccctgcccgcgta ctcacgacga caagcagacc accgtcgcct27060ccccgcgaag cgtggatctccgtacacgat cacaagcgac gcgatctgac cgcgtacgga27120gcgtcactcg ccaactatca gtggccaacc gccaactatc gctggccgtc gcagggggga27180gagccctcct ccgtcggcgccggactctgt ccacagggca gcacgcccag catcagattc27240gaggccgcca cgatcagcgg ggcggcccgt acgttgagga gccgacatgc ccgacaccac27300gccactcgcc ccgatgaccccgcccgcggc catcagcgcc ttcagctacc tccgggccgt27360ccaggccgac gacgtcgacg ccgcccgcga attcgccggc gctgaaccgc ggatgcccga27420actgctcatc gacgccgcga cgcggatcgt cgtcccggtc accgcgctgc ccggcccgga27480ggccggcgag ccgtgcgagg acaccttcgc cctggaggcc ctcggacgcg tcttcgtgac27540ctcgctgcgg atctgggcgcaggccgggcc ggacacggct gagggcatcg cccgcgccgt27600catcgacttc gcgcagcagttactcaacga ggaccacgag gaggactgct gcagcgaggg27660aaggcgggtg atgtgttggcggagcccgcg gtgccgaggt ggcgcatcag gtgtcgacct27720acgaggcctg ctctgcttga ccgccagcca ttgtcgcctc acccccggaa cgccctcgtc27780tcaccgctgc gccccctgcg cggcagtgtc tctggcgtgg gcgccgtgct ggtatcggct27840ccgtccctgg ctgggccaca tggacttgag tgctcgctcg ggccgcagag tccaggacgg27900ggtagcggcg aggatgaagg cgatgcggga ggcgaagcgg gcttcgggga gagggatttc27960
gcccggcgcg tcgtcgagca gcaggccgtc cggcagcttg acgctggatc gcagaggagg28020agcggcggga ggcggagcgg cgccgaggtg agcagatgcg gctggcccct gcggactggc28080tgatccagca cggcctcaaccaggccaacg tcgacgccgt ccacgtaggc ggctgctggg28140ccgcgaagaa gagcggccga tgccgccccg ccacgcgcga gcaggccctc gacgcgctcc28200gaaaccaggt gccgccctgcgtgcactgcc aacccgacca cagcctgcgg catcgactga28260aacgagaacg ccccggccag catgctggcc ggggctgaac ccgcaaaggg gtgagatcgt28320gaagggcggt cgcctgcgcg gcgaaaggca atgcgaggct tcagccgaac gatcgtcctc28380gcatgcgata gatgaggcccggggacactg ttcccttcac catcacggct ggttcaacca28440cacctgcccg gcgaacattcccgcgcgccc tacggggttc ctgagatgtt cccgggcgct28500gcaccgcttc cgtcgtcgccgcgaggtagc cctactcggt cgggtgatcc cgccaggagg28560ggagaactgc gcgcggcaccgacgcgtgat gtccggtatg aagccgatca gcgaagtgca28620tgtggcggaa ccaggcctgg ccgtcgtcga ggtcgcggcc tgtgatgacg agacggcatt28680cgcggcccag gaactgctcg ccagccggtc ccgcccccgt ggagcacgtg cagggccgcg28740acggggccgt gtgccgaccg ggccctcggg tcccgacggg agcggaggca ggccggcacg28800gaagtccccg tgtacgccta cttcttgagc ctgcggctcc cggcgtgcca gtcctcggtc28860ttgcccgtct cctgcgctgtgacgccgaac gacgccagct gcggccgctc acgcaggctg28920cgcttgatct cggcgaagccggggaaccgg gcgaggccga tgacgtggtc ccacagcact28980cccgcctgct cctcgtcggg cagccggctg atcaccggtc cgaagaacgc gacgccctcg29040ggcggttcga agtgcacgatcggggtgccg acgtccttgc ctgtcagcga caacgcctcg29100tcggactcgg cctggatcccggcatcacgg gtcacgtcgt cgagcgcgtc gacgagcgaa29160gccggcaggc cggcctcggccagggcgtcg gagacgaggg cggggctgcc ctgccacccg29220ggggtccggc cctcgtcggg cccggcctcc atgatgcgcg cgccgaagac ctcgtagagc29280gggccgaccg cctctcgtccgtgcttctcc cggacggccg aagccacccg cagcagccgc29340aggcccgcgg tgtgctgggcgtcgtactct ggggggaagt gcgtgtcgta atcgaggtgc29400gcgttgatca gtcgcaagga gatgaaccgc cagtcgacgg tgtactcgcg ctgcgcctgg29460acgatccgta tccacttgctcgtcatccac gcgaaggggc agacgggatc gaaatagaaa29520ttgatgtcgg ccttctctgccatcatgtcc acaatcgtag gttcgactaa tgctccgggc29580gggtggtgct gtcgtggcgg gtggaccacc gcgggctcag tagaccaagg tctgccagcc29640cttcatgtag ttgatgaagcgctcgctcag tcctcccgcg cgcaagtact gtgcggtgac29700gggaagttgc gggctctcgtaccgcgggtc ggccctcacc tgccggggga agtcccgctg29760caggattcct gcgcggccga tcagcacgaa gtcacagccc tcgtccagca actgaccggc29820acgctgggcg gtcctgacctttcccgcagc gcccacgcgc acgctcttcc gggggatgtc29880ggtgaagacg ctgagcatcg tcttcccgcg aaactctccc tcctggacga tctgcgcaga29940gtcccacagg gccaggtcga ggtaatcgat cagttcccgg tcgaggatct cggtgacgat30000ctcgcgcagt tctgccaggcgcagtccgta gcgctcgacg gacaggcgcc agccgatctg30060gaagtcggga ccgcatgccttgcggattcc ttcgatcacc tcgatggtga ggcgggctcg30120gttctcggta cttccgccgtacttgtccgt acggtcgttg agcatggggg acatgaactc30180cgacaggatc cacccgaaag cgccgtgcac ggacaccccg tcgaatccgg ccttctcggc30240tctcaccgcg gcggcgatga aactgtcgcg gattccttcg acttcttccg tcgtgagcgc30300
gtcggtgccc ggcacggtgg tgctggacgc cggagccgga acgccgccca gttccgggcg30360
ggcgcggtgc ccggcgtggtgcagctgtac cgccgacaga ccgccgcctt cccgcaccga30420cgcggccatg cgggtcaggccgggaatgtg ttcgtcgctg tggataccga gctggcgcac30480gaatgccttg gcgccgggttcgacggtggc ggcagcggtc tggatcaagg cgtagtcgcc30540ctgggcgagt tgtctgatccattcctggtc gaaaggagag gccgaaccgt cgtgctcact30600ttgctgattg gtgagcggcg ccagcatgaa tcggttccgc atggctgggc cgtgcgcgag30660tgtgaggggc ttgaacaggtcggggaccga catcagaact ccagatggtc gtggtcgcga30720ggggcgtggc cgcgcacgcg tgcgggccgg gtgagggggt ggggcgcaac gcgtccgacg30780ccacacggag ttgacggatcggacggtcat ttcccggcgc ctacgccgcg cctctcgcgc30840cgttggcgcc cggccggacctcgccccggg gtggggacga gaccactccg gcggccgccc30900gtagttgaac gggacggccg tcggcgggaa cggacccgta tgccccgggt ggggtgatcg30960gatcggccgt agcctctgcg tccgttcccg ggggttcagt ccgcccggcc gggttcgggg31020gcgggcggag ggcgaagtgccgtcagaagg tcaggatccg gtagccggcc tccaccagtt31080cccggatgct cgcgacacccggggtgccgg gcgcctggtt ctggccgatc tgcttgatcc31140cctcgccctc gatgcccttg ttcgcgccga agacggtcgt gcagccggag gaggccaccg31200tggcgacctg cttcttcaccgccgtgtaga gctcgtgggc ggggtgctcg gagtcggcca31260gcacggcggg ccagcgcgta ccggttccct ggaacagcac cagggcctcg ccgtcctgcg31320cgaactccca ggcggtggcg agggcgtcga agacgcggcc tagcgcttcg tcggtgccgg31380tcgacgggtc ggacaggacg acgactgcgg tcttgttgct cattgcggat gctcctcgat31440cgggtgaggt ggacgaattcatttttaccg tacgttcggt aattttgtaa aagtgacgcc31500gatcacacct cggggacggcctgtcggagt ggaggaggcg cggtcgcggc cgcctacgtt31560cacggcggtc gccggcgccccgacggcggg cacgacgacc gcgtccgcat cgtcccgaac31620gatgccggtg acccgcaccctgtcgtagaa gggcggcggg cgcggagggc gacgtcatcg31680gccgctgcgg tccgcagcacgcgcgcggag cggtcgacac cgctcccggc ggctcaccct31740ggcgcgccgc gcgtggtggg tcacctgcgc gacggcgtgc aggtgacatc cgccgttcag31800gcccccacgc ggggtgagta cgtgcgagac ggtgctggtc ggttgcgacc agttcggccc31860gcacggtcat gccgtacggccggacggcgg gacgcgtcgc gttgcgcgtc gcccgcggtc31920gcggctcgtg cttccggcgg aggtccgcta gtgctctgac cgggaaggtt cgccgggttc31980ggccttgttc taggatcctctggctatggg gggatctttt cgtgaccggt ggcgcctgac32040tcgtgccgtt gctgtggcgctggccgtgat cgtgttactg ggcgtcgtgc tcctggttct32100tccggggctg atagtcgaccacgacctcgc aggtggccac ctcgctgcag cggaccggtt32160gaacgcggtg aacaacgtgcgcaccacgct tctgcagacg gtcggcggtg cggtcgtcat32220gttcggcgcc tatgccacatggcggcagct gcgcgtcagc caagacgggc tgaacgcaac32280ccgagagggg aacatcaccg atcgcttcag ccgggccgtg gatcagctcg gcagtgacaa32340gctggacgtg cggatcggag gcatctacgc gctgtggcgg attgcggatc actccgaccg32400cgaccgcgag gcggtcgtctccatcatggc ggcgtatctg cggacacacc ttccctggcc32460gccgcaggaa cccgcagtgccggcggcgga cgtgtccatt aacgcggtgc ccccgttgga32520gacccgcgcc gcggacgctcagacagcgct gacctgcctc ggggtcctat accaggaacg32580ccgtccggag tggctcaacg tcagtttgac cgacctgcgc cgggccgact gtgacggatt32640
gtggctgcac ggagtcaacttcgacggcgc atgcctggaa gcggcgagcg tctaccaggt32700caacctgagc aaggcgtcactgatcgccgc caacctgcgg catgccgaac tcggcacttc32760cattctccac caggtccgctgtctgcaagc cgatctgcgc ggtgcacgcc tggtcaaagc32820
cgacttgagg tcggcggacttctccggtgc ggacctgcgg gaggcgaacc ttcgcaaggc32880tcgtgcccag ggtgccgtgttcgtcggcgc ggacctgcgg ttggccgacc tccggggctg32940cgacctcacc gagactgacctgcgagaggc gaggctggaa gacgcgctgg cgagcgacct33000tacgatctgg ccgaccggcttcgacgctca agcagccggc gtcgttgtca cggcggaccc33060cggcatcgaa ccggacaatctgcttccggc tgccgcgctc acgaggcgag tcccgctgct33120gcaatcagag ccgatgcatg gtccgtcagc gtcggcgaat tgagcaatca ggcagcgcag33180tcgatgggct gcccgcccca gcggatgccc ttctcgctgc ggatgcgggc gcgttccctg33240cgctgggctg cgagcacatcagggtgacgg gcgttgacgt tgcgccagcg caggtagcgg33300tgcagggcct gggtctgcgcgggatggctt cggtggtgtg agttggccag ggtgaactgc33360cgcagcgggc cgaagtgcgcctcgatcggg ttggcccagg aggcgtagga cgggggtgaa33420acacagttcg accttgttcttcttcgccca gcggcggatg tccgcgccgg tgtgggcgga33480gaggttgtcc agaatgaggtagatcggtgc gccgtcgggt cgggcagcac ggatggactt33540caaggcagcg aggctgttgg cggtgccttt gcggcggcgg ttgactcccc acagccggtc33600gtcgccgacg gagtagcaaccgtggaagta ggtgacgccg ggggtgcggt ggtaggtggc33660cggcaggcgg ttgggcttgccctgttcggc ccagcaggaa ccgccggtgg gtcggatccc33720gagcgggccg aactcgtcaa aggcgaagac ccggtccggg aagcgttcca gcacctgctc33780gatacggtcg agcttggcgtcgcggtctgg gtcaggggac tccttccatg tcttggtgcg33840ctggaaggtg atgccacggcactggagcag gcaccgtaag gcctcacggc cgatgcggat33900gacgcgtcca tgcacgcggcgcaggtaggc ggcgagtttg cggatcgacc agcgggtgaa33960gggctggccg agcttggtgg ggcgggtggt ggccgtctgg acgacgaagt cctcgtctca34020ggcttgagca ggcggggacg gcctcccgcc cagcgagggt tcaggcaggc caggccgatc34080tcgttgaacc ggtggatcacctcccgcacc gtgtcctcgt cggcctggac cagctgggcg34140atcaccggga cgcggtttccgccggcggac gcgagcagca tcatcgcccg gcgaaagcgc34200accgagctgg tactgccccg gcgcacgatc tgctgcagct tctgcccttc ctggtcggtc34260aacctgcgca cacggacagg ctcggccacc acacccccaa cggtcggacg gacgccaccg34320acatccaacc gccacaacag ccaacccggc gaaccttccc ggtcagagca ctagtcctgc34380tcgggtgcca gcaggcgcgg caggagcgcc acggcttgtg cgaacggctc cgtgtcaccc34440agcacccggg ccagcaccag ggctccctcg atccgcagga aggcgtcctt ggcggcgcgc34500tgtgcgtctt ccggccggca cccggcccgc tgtgcggctt cggccatcgc ctcgatccac34560gtcatggcga gcgagcgggcatgctcgcgg accttctccg gggcccccgc cagcgtcatc34620gtgtcgagga cgcacgacag ggctcccgcc ccgtagaagt cgctcagtct gcgcgcggtc34680tcttccgtcc cccgcgagacgtcggagtcc gtccgcatcg gctccaggat ccacaggaag34740cggtcgccca ccttggtgag gaccgcctcc gcgatccctt ccttgccggc ggggaagcgg34800tggtagagac tcgcccgctg caggccggag gccgccgaga ggtcgccgat gagggctccc34860tcgaagcctt tctcccggaa cacgggcatg agcaggtcga gcagctgggc ctcatcgatg34920gaggggggac gcgccatgctgcaaggttac cgaactttcg gtaactttgg gggcggagct34980
eg34982260PRTStreptomyces hygroscopicus 10-222Met Glu Lys Glu Leu Val Leu Asp Leu Ala Asp Leu Ser Val Asp Glu151015Leu Asp Val Leu Pro Thr Ser Pro Gly Ala Gly Leu Glu Ser lie Asn202530Val Gly His Ala Met Val Glu lie Gly Ala Ser Asn Cys Thr Ser Thr354045Gly Thr Pro Ala Ser Cys Cys Ser Cys Cys Cys Cys5055603680PRTStreptomyces hygroscopicus 10-223Val Thr Val Thr Asp Thr Ala Ala Val Arg Pro Ala Thr Ala Ala Val 151015Leu Gly Lys Gly Leu Leu Ala Thr Ala Val Arg Ala Val Leu Ser Arg202530Ser His Gly Thr Pro Ala Gly Thr Gly Gly Glu Asp Ala Thr Gly Ala354045Thr Asn Gly lie Gly Leu Thr Gly Pro Asp Ser Gly Ser Pro Ala Val505560Thr Val Val Ala Asp Asp Gly Trp Ala Asp Asp Ser Ala lie Val Ser65707580Ala Gln Thr Pro Arg Leu Pro Val Arg Val Glu Leu Gly Arg Val Val859095Val Gly Pro Met Val Val Pro Gly Arg Ala Gly Cys Ala Arg Cys Ala100105110Arg Thr Arg Arg Glu Arg Ala Val Gly Pro Asp Ser Pro Arg Ala Glu115120125Leu Val Arg Arg Phe Gly Glu Arg Leu Ala Asp His Pro Ala Pro Val130135140Leu Thr Ala Trp Ala Cys Asp Ala Val Ala Glu Leu Val Ala Asp Glu145150155160
Leu Arg Phe Pro Gly Gly Arg Leu Thr Arg Cys Gly Leu Val Met Leu165170175Ser Leu Thr Thr Met Thr Val Asp Ala His Pro Phe Leu Pro Asp Pro180185190Arg Cys Pro Glu Cys Gly Gly Leu Pro Asp Asp Arg Pro Pro Glu Leu195200205Leu Gly Thr Ala Arg Pro Lys Pro Asp Arg Asp Thr Tyr Arg Val Arg210215220Asp Leu Arg Ala Asp Trp Glu Ala Leu Thr Arg Thr Tyr Val Asp Gly225230235240His Thr Gly Val Val Arg Gln Leu Asp Val Arg Thr Asp Tyr Arg Tyr245250255Pro Met Val Ser Ala Pro Leu His Leu Pro Asp Gly Gln Gln Glu Ala260265270Gly Phe Gly Arg Asn Leu Ala Tyr Ala Ser Cys Glu Arg Thr Ala Leu275280285Ala Glu Ala Leu Glu Arg Leu Gly Gly Ala Arg Pro Gly Gly Arg Arg290295300Thr Thr Val Arg Ala Ser Tyr Arg Glu Val Ala Asp Gln Ala Leu Cys305310315320Pro Val Glu Leu Gly Leu Tyr Pro Ser Glu Arg Tyr Asp Ala Pro Gly325330335Phe Pro Tyr Pro Pro Phe Asp Pro Gly Met Ala Leu Asp Trp Val Trp340345350Gly His Ser Phe Ala Arg Asp Ala Pro Val Leu Val Pro Glu Asp Tyr355360365Ala Tyr Tyr Arg Thr Arg His Gly Asn Pro Asp Ala Arg Pro Leu Ala370375380Tyr Glu Val Ser Asn Gly Cys Ala Leu Gly Gly Cys Leu Glu Glu Ala385390395400Ala Leu His Gly Leu Val Glu Leu Ala Glu Arg Asp Ala Phe Leu Leu405410415Thr Trp Tyr Ala Arg Leu Pro Ala Pro Arg Val Asp Leu Ala Thr Val420425430Thr Asp Pro Arg lie Ala Val Leu Ala Glu Arg lie Arg Gln Asp Ser435440445Gly His Arg Val Leu Ala Phe Ala Thr Thr Pro Glu His Gly lie Pro450455460Thr Ala Trp Val Met Ala Val His Pro Thr Ala Arg Leu Phe Pro Ala
465470475480
Pro Gly Asp Pro Arg Ala Glu Pro Ala Ala Val Cys Ala Ala Gly Ala485490495His Phe Asp Pro Glu Gln Ala Leu Leu Asn Gly Leu Leu Glu Leu Thr500505510Ala Asn Leu Gly Trp Asn Arg Asp Ala Tyr Arg Glu Glu Arg Glu Arg515520525lie Gly Ala Met Val Thr Asp Pro Asp Gln Val Arg Asp Met Arg Asp530535540His Ala Leu Leu Tyr Cys His Pro Ala Ala Phe Asp Arg Phe Gly Phe545550555560Leu Leu Gly Asp Gly Pro Pro Gly Thr Gly Ala Pro Gly Leu Pro Val565570575Glu Glu Ala Phe Ala Arg Ala Asp Cys Arg Pro Arg Gly Thr Asp Leu580585590Arg Asp Asp Leu lie Glu Val Val Thr Arg Phe Thr Arg Arg Gly Gln595600605Asp Val lie Val Val Asp Gln Thr Thr Asp Glu His Arg Ala Gly Gly610615620Leu Ala Cys Ala Lys Val lie Val Pro Gly Leu Leu Pro Met Thr Phe625630635640Gly His Gly Met Arg Arg Thr His Gly Leu Pro Arg Leu Leu Arg Leu645650655Pro Ala Leu Leu Gly Tyr Arg Ala Gly Pro Leu Ser Pro Ser Asp lie660665670Asn Pro His Pro His Pro Phe Pro6756804562PRTStreptomyces hygroscopicus 10-224Val Ala Asp Ala Asp Ala Asp Thr Val Gly Leu Arg Phe Trp His Arg151015Thr Phe Glu Gly Val Arg Glu Leu Phe Ala Glu Gly His Gly Glu Glu202530Gly Gly Ala Asp Asp Pro Leu Pro Ala Lys Thr Tyr Arg Gly Leu Pro354045Arg His Pro Leu Ser Ala Pro Ala Arg Ala Val Gly Asp Ala Arg Trp
505560Ser Phe Ala Ser Phe Arg Arg Ala His Pro Gly Gly Ala Pro Cys Leu65707580Asp Arg Leu Glu Glu Pro Ala Val Ser Val Leu Leu His Cys Val Tyr859095
Gly Met Gly Arg Met Glu Val Gly Pro His Ala Val Trp Pro Tyr His100105110Arg Leu Val Ala Ser Ala Arg Cys Phe Tyr Pro Val Glu Leu Tyr Leu115120125Trp Thr Ala Arg Pro Ala Gly Glu Leu Gly Ala Gly Cys Tyr His Tyr130135140Asp Pro Ala His His Val Leu Thr Arg Leu Arg Glu Gly Gly Leu Pro145150155160Asp Val Leu Val Ala Ala Val Gly Val Glu Arg Pro Ala Ala Val Ala165170175Pro Gly Ala His Asp Ala Pro Asp Ala Leu Leu Val Ala Ala Val Cys180185190Phe Arg Lys Ala Ala Phe Arg Tyr Arg Asp Tyr Ala Tyr Arg Leu Cys195200205Ala Gln Glu Ala Gly Met Thr Val Gly Asn Ala Leu Leu Ala Ala Gly210215220Ala Leu Gly Leu Arg Ala Arg Val His His Arg Phe Asp Asp Glu Val225230235240Val Asn Arg Ala Leu Gly Leu Asp Ala Ser Glu Glu Thr Ser Val Ala245250255Val Leu Asp Leu Arg Thr Gly Pro Leu Pro Ala Pro Val Pro Ala Ala260265270Gln Arg Pro Ala Pro Ser Pro Pro Pro Ala Gly Ala Ala Gly Lys Ala275280285Ser Pro Ala Thr Ala Leu Pro Ala lie Arg Ala Ala His Val Arg Thr290295300Asn Ala Val Asp Pro Ala Ala Trp Ser Gly Leu Leu Glu Val Asp Arg305310315320Ala Ala Arg Arg Thr Trp Ala Ala Gly Arg Pro Ala Val Asp Pro Arg325330335Ala Phe His Leu Pro Ala Gly Val Arg Gly Gly Glu Arg Gln Leu Ser340345350Leu Ala Thr Pro Thr Glu Pro Gly Pro Gly Glu lie Glu Leu Ala Ala355360365
Thr Leu Arg Thr Arg Asp Ser Gly Gly Arg Met Phe Leu Pro Gly Gly370375380
Asp Pro Leu Pro Val His Arg Leu Ala Ser Val Leu Arg His Ala Leu385390395400Glu Pro Val Pro Ser Asp His Thr Ser Arg Val Cys Arg Pro Leu Val405410415Asp Cys His Val Leu Ala Leu Arg Val Asp Gly Leu Asp Thr Gly Leu420425430Tyr Arg Leu His Pro Ala Pro Ala Pro Val Leu Ala Arg Val Pro Gly435440445Pro Asn Trp Arg Gly Val Leu Ala Met Leu Cys Asp Arg Thr Pro Ala450455460Val Asn Ser Ala Lys Ala Asp Ala lie Val Phe Leu Thr Val Asn Arg465470475480Val Glu Gly Glu Arg Ala Phe Gly Ala Arg Gly Tyr Arg lie Leu His485490495Gln Glu Ser Gly lie Val Ala Gln Arg lie Ser Val Leu Ala Ala Ala500505510Val Gly Arg Ser Val Arg lie Thr Asn Gly Tyr His Glu Gly Val Val515520525Arg Glu Leu Met Gly Val Ala Asp Ala Ala Tyr Val Pro Val Phe Cys530535540Met Ala Val Gly Arg Arg Arg Ala Thr Ala Gln Tyr Glu Met Pro Leu545550555560Thr Trp5647PRTStreptomyces hygroscopicus 10-225Met Ala Val Thr lie Ala Arg Pro Pro Asn Arg Arg Leu Ala Met Arg151015Pro Lys Leu Lys Ser Asp Val Leu Tyr Val Pro Thr Asp Asn Gly Val202530His Val Phe Gly Ala Gly Ala Asp Val Ala Leu Arg Gly Arg Ala Ala354045Tyr Gln Trp Leu Asp Arg Leu Ala Pro His Phe Asp Gly Arg Thr Glu505560Leu Glu Asp Leu Val Arg Gly Leu Pro Glu Glu Lys Arg Gln lie Val80
ProLeuAsnValThrGluAlaValArgProThrAspAspGlyAlaPro
385390395400
ArgValPheGlyAlaGlyThrSerPheAlaGluAlaArgArgAlaAla
405410415
AlaLeuArgGlylieAlaValTyrAlaAlaArgPheThrAspProArg
420425430
ArgValAspAlaAspAlaThrValTrpGlyTrpAspValProAspGly
435440445
CysAlaArgArgValProThrSerValAlaSerGlyLeuGlyProGly
450455460
ValAlaAlaArgLeuGlyTrpAspAspAlaValThrAspGlyLeuAla
465470475480
GinHisCysValArgLeuAlaValAlaAspValAlaAspGlyArgVal
485490495
GluProAlaGlyLeuAspLeuAlaThrAlaValPheAspAlaArgAla
500505510
LysSerLeuLeuGlyLeuLeuArgAlaAlaGlyGlySerValArgVal
515520525
AlaAspValGlyGlyAlaLeuGlyValProValLeuAlaTrpTrpGin
530535540
GlyGlyArgAlaValAlaAlaThrCysGlyProAspAlaValAlaAsp
545550555560
GlyLeuGluArgAlaLeuLeuAspArgGinAlaVallieThrGlyGlu
565570575
ProAlaTyrAlaProProThrValAlaGlyLeuGlySerProProGly
580585590
GluGlyProAlaAlaGlyAlaProTrpProSerAlaProGlyProGlu
595600605
ArgMetValAspCysLeuArgAlaArgGlyLeuArgProValAlaLeu
610615620
ProLeuAspHisAspProAlaValHisGluValLeuProSerLeuLeu
625630635640
ArgValValValLeuAspAsp
645
6
875
PRT
Streptomyces hygroscopicus10-22
6
3053103153201001]LeuGlyArgLeuValGluLeuGlyLeuLeuGluAlaGluArgProPhe1002]3253303351003]AlaAspGinAlaLeuAspProLeuAlaAlaLeuArgAspTrpLeuAla1004]3403453501005]GlyAlaGlyProAspThrAlaAlaLeuValGlyGluValAspAlaLeu1006]3553603651007]AlaAlaLeuValAlaArgTyrProThrLeuProAspAlaAlaAspArg1008]3703753801009]LeuArgCysGlyThrAlalieGluGluValLeuArgArgValArgAsp1010]3853903954001011]LeuAlaGlyProGluGinlieGinLeuProAlaLysAsnSerVallie1012]4054104151013]GluAsnAlaLeuLeuAlaGluProLeuAlaGlyProValArgGinAsp1014]4204254301015]TrpGluProValLeuArgAspLeuAspThrValArgArgCysTyrAla1016]4354404451017]ValLeuAspProAlaLeuProGlyArgValAlaLeuAlaAspThrPhe1018]4504554601019]AlaGluArgValGlyThrGlyAlaSerMetProLeuLeuThrPheHis1020]4654704754801021]ArgThrValGinGluTrpLeuArgGluAspProGluLeuProGlyLeu1022]4854904951023]LeuSerlieAlaThrHisGlyTyrAlaSerLeuLeuAspHisArgLeu1024]5005055101025]ProArglieArgGluLeuAlaAlaArgArgAlaAspLeuCysAlaLeu1026]5155205251027]AlaAlaProValHisAlaAspGluAspGlyValValArgLeuAspPro1028]5305355401029]AlaArgLeuAlaAspLeuAlaAspGlyTrpProArgTrpMetArgAla1030]5455505555601031]ProAspSerValAlaPheTyrGlyGinProLeuAspGlyProAspAla1032]5655705751033]ArgPheValValAsnAlaValAsnSerGlyHisGlyArgGlyArgAsp1034]5805855901035]ArglieSerArgLeuLeuThrGinAlaGlyThrGluAlaArgAlaLys1036]5956006051037]ThrAlaAlaProAspAspAlaVallieValAlaAspThrCysArgHis1038]6106156201039]PheGlySerAsnValGlyLeuArgArgSerAlaValAlaAlaGlulie1040]6256306356401041]AspTyrProGluGlyHisSerGluArgAlaAlaGluHisArgliePro1042]6456506551043]LeuSerAspLeuLeuValArgHisAspProAlaArgGlyLeuLeuVal1044]6606656701045]LeuTrpSerArgGlyArgAspThrGluValArgProValHisProAsn1046]6756806851047]LeulieAlaGluLeuTrpLeuProProAlalieArgLeuLeuLeuGin1048]6906957001049]ValPheGlyAlaThrSerAsnLeuLeulieProGlyArgArgMetPhe1050]7057107157201051]GlyAspProSerLeuAlaGluValGlyGlyValLeuAlaGluProArg1052]7257307351053]ValThrValGlyAlaThrThrValSerArgArgGinTrpValPhePro1054]7407457501055]AlaSerAlaValProValArgGluLysGlyAlaSerAspArgAlaHis1056]7557607651057]LeuLeuArgLeuAlaGlyTrpLeuArgGluHisGlylieProArgArg1058]7707757801059]CysPheValArgAlaLeuAspProAlaSerValValGlyGlySerVal1060]7857907958001061]TrpArglieLysSerArgLysProLeuTyrValAspPheAlaAsnLeu1062]8058108151063]LeuLeuAlaGlyValPheGluArgAlaValAlaGlyAspGlyGinVal1064]8208258301065]LeuPheLeuGinGluAlaLeuProGlyProAspGlyMetProGlyTyr1066]8358408451067]GlyAspSerGlyProArgValThrGluPheLeulieGlulieAsnGly1068]8508558601069]GlyGinAspAlaGlyGluArgGinArgProAla1070]8658708751071]71072]3411073]PRT1074]Streptomyces hygroscopicus10-221075]71076]Met Pro Glu Asn Asp Ser Gly ProLeu AspProGluAlaAlaArgGly 1077]151015
361078]AlaAspTrpValCysAlaHisliePheTyrAspThrAspGinAspLeu1079]2025301080]LeuLeuThrAspCysValArgProLeuValAlaGluLeuThrAlaAsp1081]3540451082]GlyLeuValGinArgTyrPhePheLeuArgTyrTrpGluGlyGlyPro1083]5055601084]HisValArgLeuArgLeuLeuProAlaAlaSerAlaAspArgSerAla1085]657075801086]lieGluLeuArgThrGlyLysArglieArgGluPheLeuAlaSerThr1087]8590951088]ProAlaAlaAspValValAspArgSerArgPheThrGinValAlaAla1089]1001051101090]GlyLeuAlaGlyLeuGluGlyArgSerGlyHisAspValLeuValArg1091]1151201251092]ProAsnAsnSerValGluPheLeuProTyrGluArgGluTyrAspAsp1093]1301351401094]TyrGlyArgGlyAlaAlalieAlaAlaValGluGinHisPhePheGlu1095]1451501551601096]SerSerArgLeuAlaLeuSerValValAlaAlaGlyAlaThrValGlu1097]1651701751098]GinArgAlaLeuLeuAlaPheAspLeuValValGlyValPheAlaLeu1099]1801851901100]CysGluGluValArgAspGinTrpAlaArgHisGlyGlyProProLeu1101]1952002051102]ProPheGlySerGlyProGluAlaGluAspValAlaProArgTyrLeu1103]2102152201104]AlaGinArgAspLysLeuArgAlaArgAlaArgLeuThrTrpArgMet1105]2252302352401106]AlaGluAspProGlyAlaGlyGlyHisAspGinArgAlaTyrTrpLeu1107]2452502551108]AlaSerValArgArgLeuArgGluArgLeuHisAlaLeuGluGluThr1109]2602652701110]GlyValPheThrSerAlaTrpAlaGlySerProLeuAlaGluProLeu1111]2752802851112]GlyLeuSerAspThrArgHisProGlyThrSerLeuValLeuLeuArg1113]2902953001114]CysAlaHisLeuValSerAsnArgLeuGlyLeuThrLeuTrpGinGlu1115]3053103153201116]AsnGinLeuArgPheLeuValGlyArgValLeuAlaGluLeuProGlu1117]3253303351118]AlaLeuAlaAlaSer1119]3401120]81121]3751122]PRT1123]Streptomyces hygroscopicus10-221124]81125]ValAlaProTrpAlaGluAlaAlaTrpPheGlyArgHisTrpLeuArg1126]1510151127]GlyProHisLeuArgLeuAsnPheArgCysArgGlyThrAspTrpGlu1128]2025301129]GluArgValArgProThrValThrGlylieValThrAspTyrLeuArg1130]3540451131]AlaArgProSerAlaAlaArgLeuAspGluGlyAlaLeuAlaProVal1132]5055601133]HisAlaArgLeuAlaGluLeuGluMetGluThrGlyProArgHisPro1134]657075801135]TrpValProAspAsnThrValLeuGluArgProTyrAspHisArgLeu1136]8590951137]ProValLeuGluSerLeuArgAlaSerGluLeuLeuAlaGlyPheLeu1138]1001051101139]SerAspThrAsnGlyGinAlaPheArgAlaTyrGluArgValArgAla1140]1151201251141]GlyGlyAlaLeuSerLeuLeuAlaLeuAspLeuMetTrpThrThrThr1142]1301351401143]SerValAlaAlaValProPheThrThrGlyGlyGluProlieGluArg1144]1451501551601145]GlyPheLeuSerLeuArgSerHisAlaAspAlaPheLeuSerArgThr1146]1651701751147]ArgAspProValAlaValArgAlaAlaPheAspAspArgPheArgArg1148]1801851901149]GinGluThrValLeuCysGluArgLeuArgSerValGluAlaAlaLeu1150]1952002051151]SerAspGlyAlaThrGluGlyAspGlyAlaAspArgSerAspArgSer1152]2102152201153]AspArgSerGluAlaValGlyAspValValProPheValThrGluTrp1154]2252302352401155]AlaAlaAlaValArgHisHisGinArglieAlaHisProLeuLeuAla[1156]245250255[1157]SerGlyGluValSerMetGlyGlyAlaAlaArgAlaProArgMetPro[1158]260265270[1159]ThrArgArgThrSerGluPheHisAlaValLeuArgSerAspHisGly[1160]275280285[1161]HisGluAspPheValArgThrAspAspTrpPheAlaSerPheArgLeu[1162]290295300[1163]MetMetAsnTyrLeuTyrLeuHisLeuAsnArgLeuGlyLeuLysPro[1164]305310315320[1165]ValAspArgAlaLeuLeuCysHisLeuAlaAlaLeuThrValGluAla[1166]325330335[1167]ValHisGlyValAspAlaValGlySerPheGinArgTyrValAlaSer[1168]340345350[1169]ValAspProSerSerGluArgProGluTrpArgArglieGlyGluAla[1170]355360365[1171]TrpAlaAlaGlyGlyAlaGly[1172]370375[1173]9[1174]932[1175]PRT[1176]Streptomyces hygroscopicus10-22[1177]9[1178]LeuThrSerValAspArglieGlyHisAlaArgGluArgAlaArgLeu[1179]151015[1180]LeuAlaVallieAspArgAlaArgGlyGlyArgGlyProAlaSerlie[1181]202530[1182]VallieArgGlyGluArgGlylieGlyLysSerAlaLeuLeuGlyGlu[1183]354045[1184]PheAlaSerLeuAlaAlaAspAlaGlyPheArgValSerAlaValSer[1185]505560[1186]AlaGlyThrGinProGlyAspProLeuGlyAlaAlaLeuArgValVal[1187]65707580[1188]SerArgLeuAspAlaArgCysThrGluProAlaGluGlyThrAlaLeu[1189]859095[1190]HisArgProAlaProAlaGlyGluProValProHisArgAlaAlaPro[1191]100105110[1192]SerGluGluValLeuArgGluLeuValGluThrValCysArgGinAla[1193]115120125[1194]ArgArgThrProValAlalieCysLeuAspAspAlaGlyHisLeuAsp
391195]1301351401196]ProTrpSerLeuHisTrpLeuSerGlyLeuTyrSerAlaAlaSerAsp1197]1451501551601198]LeuProLeuAlalieAlaLeuThrGlyGlyAsplieAlaAlaAlaAsp1199]1651701751200]GinAspProTrpProProAlaLeuAlaAlaAlaAlaGluHislieAla1201]1801851901202]LeuSerGlyLeuAspProGluGluValGlyAlaPheAlaAlaAlaTyr1203]1952002051204]ArgAsnValProLeuAspAlaProThrAlaGinLeuCysHisGluLeu1205]2102152201206]ThrGlyGlyAsnProAlaLeuLeuLeuSerLeuLeuAlaCysHisThr1207]2252302352401208]GlyThrAlaProThrAlaAspAlaLeuArgAspThrAlaAlaSerAla1209]2452502551210]ValLeuProGlyAlaAspArgTrpLeuAlaGlyLeuGlyGlyAlaAla1211]2602652701212]LeuGlyLeuAlaArgAlaValAlaValLeuGlyProGinAlaGlulie1213]2752802851214]ThrGinCysAlaGluLeuAlaGlyLeuSerValArgGluAlaLeuPro1215]2902953001216]LeulieAspGluLeuValAlaArgSerLeuPheAlaAsnArgThrPro1217]3053103153201218]LeuSerPheArgHisProLeuLeuAlaGlyMetVallieSerArgVal1219]3253303351220]ProAlaGlyThrArgAlaAlaLeuHisLeuThrAlaAlaGlylieLeu1221]3403453501222]ArgAspGlyHisPheGlyAlaThrHisValAlaArgHisLeuValAla1223]3553603651224]AlaGlyProLeuGlyLeuAlaTrpThrValArgProLeuArglieAla1225]3703753801226]AlaAsnGinLeuGluArgGluGlyArgHisGluGluAlaAlaGlyHis1227]3853903954001228]LeuArgGlyMetLeuArgGluArgLeuArgProArgValArgSerSer1229]4054104151230]ValGinCysGinLeuAlaAlaLeuAspGlyPheAlaAlaProAspSer1231]4204254301232]AlaValArgArgLeuAspAlaAlaArgArgGluAlaAspAspProArg1233]435440445
40[1234]CysAlaThrAspTyrAlaValAlaLeuGlyThrLeuLeuAlaGluCys[1235]450455460[1236]GlyArgProGluAspAlaValAlaValLeuAspAspThrAlaGluArg[1237]465470475480[1238]LeuGlyProGinAlaAlaAlaGinArgTrpArgLeuArgLeuArgLys[1239]485490495[1240]AlaLeuLeuCysLeuGlyGlyProValProSerValLeuProAlaAsp[1241]500505510[1242]LeuProAspSerLeuAlaAlaGinAlaProSerAspAspGluAlaArg[1243]515520525[1244]ArgGluLeuSerAlaLeuArgAlaValHisAlaLeuArgAspGlyThr[1245]530535540[1246]AspArgAspAlaAlaValGlyHisAlaArgGlyAlaLeuThrGlySer[1247]545550555560[1248]GluAspProGlyArgLeuLeuTrpHisGlyCysGluValLeulieArg[1249]565570575[1250]AlaAspGluLeuAlaGluAlaTrpSerTyrCysSerArgAlaArgLeu[1251]580585590[1252]LeuAspGinSerArgProGlyThrTrpGlyAspValGlyValGlyLeu[1253]595600605[1254]LeuArgAlaLeuValLeuTyrAlaArgGlySerLeuThrAlaAlaAsp[1255]610615620[1256]AlaAlaLeuThrProLeuAlaAspLeuLeuArgProAlaAlaGluAla[1257]625630635640[1258]AlaArgLeuProAlaThrLeuThrValAlaValLeuAlaGluValArg[1259]645650655[1260]AlaGinThrGlyAlaThrAspAlaAlaLeuAlaLeuLeuAlaAspCys[1261]660665670[1262]GlyLeuAspGlyGluLeuProAlaArgGinAspThrValAlaValLeu[1263]675680685[1264]GlyAlaArgAlaAlaValTrpGluGinAlaGlyAspThrAlaArgAla[1265]690695700[1266]LeuGluAspLeuTyrAlaAlaGlyArgLeuLeuAlaAspSerArgVal[1267]705710715720[1268]ArgAsnProAlaValLeuProTrpArgSerArgAlaAlaArgLeuLeu[1269]725730735[1270]AlaSerArgGlyAspLeuThrGluAlaSerGlyLeuAlaAlaAlaGlu[1271]740745750[1272]TrpGluAspAlaArgArgTrpGlyThrProArgAlaValGlyThrAla1273]7557607651274]GinHisAlaLeuAlaLeuThrGluThrGlyGlyArgArgLeuArgArg1275]7707757801276]LeuAlaThrAlaValGluThrLeuAlaHisSerProAlaArgLeuGlu1277]7857907958001278]LeuAlaTyrAlaArgArgAspLeuGlyAlaAlaLeuSerGluAlaGly1279]8058108151280]ArgAlaAspAlaAlaArgThrGluPheArgAlaAlaLeuSerLeuAla1281]8208258301282]LysSerCysGlyAlaGinProLeuValArgArgValProLeuAspArg1283]8358408451284]GluCysLeuTrpProValValAspAspAspArgGlySerProAlaLeu1285]8508558601286]SerGlyLeuThrProGinGluGinArglieLeuGlyLeuAlaArgAla1287]8658708758801288]GlyHisThrAsnLysAlalieAlaGlyLysLeuPheValThrValArg1289]8858908951290]ThrValGluPheHisLeuSerGlyAlaTyrArgLysLeuGlylieSer1291]9009059101292]GlyArgAspGinLeuAlaAspVallieProAlaProLeuGlyThrGly1293]9159209251294]GlyGlyArgAla1295]9301296]101297]1921298]PRT1299]Streptomyces hygroscopicus10-221300]101301]MetGlyArgLeuArgValProArgArgArgGlyHisProArgThrArg1302]1510151303]ProAspProValLeuAlaAspLysAlaTyrSerSerHisAlalieArg1304]2025301305]GluHisLeuArgLysArgGlylieArgAlaVallieProValProGly1306]3540451307]GlyProAlaGinProProAlaProProGlyArgProArgArgGinAla1308]5055601309]ThrGlyLeuArgProArgAspProGinAlaAlaGinHisArgArgAla1310]657075801311]ValHisArgProProGinAlaValAlaArgHisArgHisProValArg1312]8590951313]GluGlyArgAlaGlyAlaAlaHisLeuGlyArgGlyGlyValHisAsn1314]1001051101315]GlyValProTyrPheThrGlyGinCysGinGlyGlyValValProSer1316]1151201251317]ThrCysArgHisArgProGlyLeuArgAlaArgAlaProArgThrGly1318]1301351401319]ValArgSerPheArgSerArgProGinGluGlyGlyAlaProProAla1320]1451501551601321]AlaGlyLeuGlyArgSerProGlyGluGlySerlieAlaArgPheAla1322]1651701751323]ProAsnProSerAlaAlaArgProArgSerAlaAlaGlyThrAspGly1324]1801851901325]111326]1701327]PRT1328]Streptomyces hygroscopicus10-221329]111330]MetArgArgHisArgSerlieAspHisGluArgHisSerArglieVal1331]1510151332]ProAlaAlaGlyHisAlaSerProAlaValProHisGinLeuValAsn1333]2025301334]AspArgGlyGinAlaAlaValLeuAlaArgGluArgThrAlaGlyThr1335]3540451336]ArgSerArgSerAlaProGlyGlyHisSerSerProPheThrProThr1337]5055601338]GlyGinLeuSerArgArgArgArgProGlyGluHisArgArgAspAla1339]657075801340]HisGinCysArgPheGluArgThrArgGlyArgProSerMetlieSer1341]8590951342]ValGluHisAlaThrProProValValGluGluSerValLeuGluAsp1343]1001051101344]LeuArgAlaArgLeuArgGlyTyrArgArgValAspValProAlaGly1345]1151201251346]PheGlyTrpAlaArgGlyValAspGlyAspArgLeuAlaAspLeulie1347]1301351401348]SerHisTrpAlaSerMetThrValCysLysTyrlieSerAlaSerPro1349]1451501551601350]HisCysProGlyProlieValArgSerArg
431351]1651701352]121353]1181354]PRT1355]Streptomyces hygroscopicus10-221356]121357]Met Asp ValTyrGluAlaValAspSerArgArgAlaValArgAlaPhe1358]1510151359]Ser Asp GluProValProLysGluValLeuGluArgValLeuThrAla1360]2025301361]Ala Thr ArgAlaProSerSerGlyAsnLeuGinProTrpHisMetTyr1362]3540451363]Val Val ThrGlyGluProLeuAlaGluLeuLysArgArgThrThrAla1364]5055601365]Arg Ala LeuAlaSerAspProGlyAspGluArgGinTyrProMetTyr1366]657075801367]Pro Asp GluLeuAlaLeuLeuTyrThrAspArgPheSerAlaAlaAla1368]8590951369]Ala Gin ArgTyrGluAlaLeuGlySerHisAlaThrThrProThrGly1370]1001051101371]Pro Gly ArgSerLeuPro1372]1151373]131374]781375]PRT1376]Streptomyces hygroscopicus10-221377]131378]Val Ser AsnGlyArgCysGlyArgArgGinAspHisHisGinValVal1379]1510151380]Asn Gly AlaLeuTyrArglieArgThrGlyMetGinTrpArgAspLeu1381]2025301382]Pro Asp ArgHisAlaProTrpLysThrValAspGluArgHisArgArg1383]3540451384]Trp Ser MetAsnArgThrTrpGluValLeuLeuArgGinValGluAla1385]5055601386]Asp Ser GlyLeuThrGlyProProAspHislieGlyProPro1387]6570751388]141389]196[1390]PRT[1391]Streptomyces hygroscopicus10-22[1392]14[1393]ValArgCysAspPheArgSerSerSerArgArgArgArgGlyArgAla[1394]151015[1395]LeuSerSerLeuLeuPheArgArgArgGinArgLeuArgMetProGin[1396]202530[1397]ArgGlyLeuValValArgGlyProGlyProLeuHisGlyArgGlyPro[1398]354045[1399]AlaProGlyArgArgProValAlaGluGlyArgArgAlaSerLeuMet[1400]505560[1401]ValGlyLysArgMetGluAsnGluAlaGlySerSerAsnAspProArg[1402]65707580[1403]AlaAspValLeuArgValLeuGlyMetLeuLysValAlaThrAlaAsp[1404]859095[1405]ArglieLysArgLeuSerSerProHisProAlaTyrArgHisThrThr[1406]100105110[1407]LysProThrAlaAlaLysLysGluAlaArgThrAlaSerHisArgAla[1408]115120125[1409]AlaValHisAspLeuArgLeuHisGlyLeuAlaValGluGlyGlyArg[1410]130135140[1411]ThrArgGlyGlyGlyArgAspProAlaGlyHisGluGluGlyLeuAla[1412]145150155160[1413]ThrAlaAlalieAspLeuAspArgGlulieGluGluMetGlyGlylie[1414]165170175[1415]AlaGinGluGlyGlyProLeuArgArgLeuAlaArgAspAspGlyGlu[1416]180185190[1417]ProCysArgArg[1418]195[1419]15[1420]111[1421]PRT[1422]Streptomyces hygroscopicus10-22[1423]15[1424]MetlielieThrLeuLysArgArgGluGlyMetThrHisAspGluPhe[1425]151015[1426]LysHisTyrGinGinAsnlieHisArgProLeuLeuMetSerliePro[1427]202530[1428]GluAlaAspArgTyrlieArgArgPheValValSerTyrProValPro
45[1429]354045[1430]AlaProArgTyrProGluProGluTyrAspSerValValGluAlaTrp[1431]505560 [1432]PheAspThrMetAlaAspLeuGluAlaLeuPhePheSerAspAsnPhe[1433]65707580[1434]LeuLysThrValAspProAspHisGlyAsnPhelieAspLeuSerThr[1435]859095[1436]PheGlyArgVallieThrGluGluAspValVallieAspGlyArg[1437]100105110[1438]16[1439]478[1440]PRT[1441]Streptomyces hygroscopicus10-22[1442]16[1443]ValSerAlaCysAsnGlyProGlyArgPheTyrValAlaAlaPheGly[1444]151015[1445]AlaThrTyrThrPheSerlieGlyAsnValThrAlaProArgLeuGly[1446]202530[1447]ProGluLeuGlyAlaSerArgGlyGluValAlaLeuValLeuAlaAla[1448]354045[1449]PheAlaValSerPheAlaAlaGlyLeulieLeuAlaGlyArgLeuGly[1450]505560[1451]AspArgTyrGlyArgArgArgLeuLeuGlylieGlyLeuLeuAlaLeu[1452]65707580[1453]AlaLeuThrSerAlaLeuAlaAlaAlaAlaProGlyLeuTrpLeuLeu[1454]859095[1455]ValAlaAlaArgValLeuGinGlyAlaSerSerAlalieValMetPro[1456]100105110[1457]GinThrLeuAlalielieGinThrLeuGlySerGluProAlaArgAla[1458]115120125[1459]ArgGlyLeuAlaAlaPheThrAlaSerSerGlyValGlyThrValAla[1460]130135140[1461]GlyGinValValGlyGlyLeuValMetGlyLeuGlyLeuProPheAla[1462]145150155160[1463]GlyTrpArgGlyAlaAlaLeuThrSerAlalieProSerValLeuAla[1464]165170175[1465]LeuLeuGlyValArgArgLeuLeuValHisProProSerSerThrGlu[1466]180185190[1467]ArgProAspLeuGlyGlyAlaLeuGlyLeuGlyThrSerLeuLeuAla1468]1952002051469]LeuValAlaGlyLeuSerLeuGlyProAlaThrGlyTrpAlaTrpTrp1470]2102152201471]AlaSerAlaLeuValAlaLeuGlyPheLeuGlyLeuTyrGlyPheTrp1472]2252302352401473]LeuAspGinGlyArgArgGluArgAlaGlyArgProValLeuValAla1474]2452502551475]ProSerSerLeuArgLeuProSerValArgLeuGlyLeuLeuMetAla1476]2602652701477]ValLeuLeuPheAlaGlyTyrGlyAlaPheSerTyrGluTyrSerMet1478]2752802851479]LeuThrGinValGlyLeuGlyLeuThrProValGinSerGlyLeuAla1480]2902953001481]LeuThrAlaPheAlaGlyThrPheValLeuAlaGlyLeuHisMetPro1482]3053103153201483]GlylieMetSerArgPheGlyGluArgThrMetGluLeuAlaAlaVal1484]3253303351485]LeuLeuCysAlaGlyLeuThrLeuLeuGlyValAlaSerTrpPheAla1486]3403453501487]GinGlyLysSerValAlalieTrpValGlyCysPheGluValLeuGly1488]3553603651489]ValLeuLeuGlyAlaAlaGinAlaSerGinTyrGlyProLeuValGly1490]3703753801491]ThrValMetAlaAlaValProHisArgValAlaGlyLeuAlaGlyGly1492]3853903954001493]LeuPheThrThrAlaGinGinAlaSerLeuGlyLeuGlylieAlaThr1494]4054104151495]lieGlyGlyValPheGlyThrLeuAlaProArgLeuGlyTrpGluHis1496]4204254301497]AlaPheAlaValAlaLeuGlyValGinLeulle Thr Thr Val Leu Phe1498]4354404451499]TrpValLeuAlaArgArgLeuArgSerArgProArgAlaCys Gly Thr1500]4504554601501]ValLeuAlaProGlyValGinHisArgThrGluAlaLeuAsp1502]4654704751503]171504]2971505]PRT1506]Streptomyces hygroscopicus10-221507]171508]MetlieValAlaMetAlaAspValArgSerArgGluLeuGlyAlaTyr1509]1510151510]LeuArgAlaArgArgAspArgLeuSerProAlaAspValGlyLeuPro1511]2025301512]AspGlyGlyGlyArgArgArgValLysGlyLeuArgArgGluGluVal1513]3540451514]AlaValLeuAlaAsnValGlySerSerTrpTyrThrTrpLeuGluGin1515]5055601516]GlyArgAspValArgProSerValGluValLeuAlaAlalieAlaAsp1517]657075801518]AlaLeuArgLeuSerSerSerGluArgArgHisLeuPheLeuLeuGly1519]8590951520]GlyHisProAspAlaGluProProSerAsnCysGluGlyThrSerGly1521]1001051101522]ArgValGinThrLeuLeuAspSerLeuSerProHisProAlaValVal1523]1151201251524]MetAsnProTrpPheGluProLeuAlaTyrAsnAlaProPheArgPhe1525]1301351401526]MetlieAspAspLeuGluAlaLeuProProAlaAspArgAsnCysAla1527]1451501551601528]TyrLeuHisPheThrHisProAspTrplieAlaAlaHisSerAspHis1529]1651701751530]GluGinGluCysAlaAlaValValAlaLysLeuArgAlaTyrHisGly1531]1801851901532]GluSerValThrAspProAlaTrpAlaProLeuLeuAlaArgLeuArg1533]1952002051534]GluGluSerProLeuPheValArgLeuTrpGluGinAlaAspValSer1535]2102152201536]ThrGluProGlyArgValLysArglieArgSerArgHisValGlySer1537]2252302352401538]LeuSerValArgAlalieThrLeuLeuLeuGluGluAsnProArgThr1539]2452502551540]ArgValValValTyrGinProAlaAspArgThrThrGinGluArgLeu1541]2602652701542]GluGluLeuAlaHisArglieAlaArgGlyThrlieAspGlyProAla1543]2752802851544]ArgValArgHisLeuLeuAlaAlaThr1545]2902951546]181547]1161548]PRT1549]Streptomyces hygroscopicus10-221550]181551]Met GluAlalieArgValProArgProGlyProGlyArgProArgVal1552]1510151553]Arg ProSerHisValLeuGlyAspLysGlyTyrSerSerArgAlalie1554]2025301555]Arg SerTrpLeuArgArgArgGlylieSerHisThrlieProGluArg1556]3540451557]Ala AspGinValArgAsnArgLeuAsnArgGlySerArgGlyGlyArg1558]5055601559]Pro ProAlaPheAspArgAspThrTyrLysArgArgAsnValValGlu1560]657075801561]Arg CysPheAsnLysLeuLysGinTrpArgGlylieAlaThrArgTyr1562]8590951563]Asp LysThrThrGluSerTyrGinAlaAlaValThrLeuAlaAlaLeu1564]1001051101565]Leu MetTrpAla1566]115
49
權利要求
一種環噻唑黴素生物合成基因簇,其特徵在於,該基因簇包含分別編碼如下胺基酸序列的17個基因,所述胺基酸序列具體為SEQ ID NO2、SEQ ID NO3、SEQ ID NO4、SEQ ID NO5、SEQ ID NO6、SEQ ID NO7、SEQ ID NO8、SEQ IDNO9、SEQ ID NO10、SEQ ID NO11、SEQ ID NO12、SEQ ID NO13、SEQ ID NO14、SEQ ID NO15、SEQ ID NO16、SEQ ID NO17、SEQ ID NO18。
2.一種根據權利要求1所述的環噻唑黴素生物合成基因簇,其特徵在於,該基因簇包 含如下17個基因,所述17個基因的鹼基序列具體為⑴SEQIDNO1 第 16526 16705位所示鹼基序列、(2) SEQIDNO1 第 14372 16411位所示鹼基序列、(3) SEQIDNO1 第 16870 18555位所示鹼基序列、(4) SEQIDNO1 第 18593 20533位所示鹼基序列、(5) SEQIDNO1 第 11730 14354位所示鹼基序列、(6)SEQIDNO1 第 10733 11755位所示鹼基序列、(7) SEQIDNO1第9501 10625位所示鹼基序列、(8)SEQIDNO1第4875 5462位所示鹼基序列、(9)SEQIDNO1第4404 4736位所示鹼基序列、(10)SEQID NO :1第20695 21204位所示鹼基序列、(11)SEQID NO :1第1857 2747位所示鹼基序列、(12)SEQID NO :1第6629 9424位所示鹼基序列、(13)SEQID NO :1第2829 4262位所示鹼基序列、(14)SEQ ID NO :1第5867 6442位所示鹼基序列、(15)SEQID NO :1第21712 22153位所示鹼基序列、(16)SEQID NO :1第1182 1541位所示鹼基序列、(17)SEQID NO :1第21248 21601位所示鹼基序列。
3.根據權利要求2所述的環噻唑黴素生物合成基因簇,其特徵在於,該基因簇的鹼基 序列如SEQ ID NO 1所示。
全文摘要
一種基因工程技術領域的環噻唑黴素生物合成功能基因簇、重組載體及宿主;本發明涉及一種環噻唑黴素生物合成基因簇,該基因簇包含分別編碼如SEQ ID NO2~SEQ ID NO18所示胺基酸序列的17個基因;本發明還涉及一種包含該基因簇的重組載體;本發明還包含一種包含該基因簇的宿主。本發明的基因簇包含了環噻唑黴素生物合成的所有遺傳元件,實現了環噻唑黴素的生物生產。
文檔編號C12N15/11GK101838642SQ20091031159
公開日2010年9月22日 申請日期2009年12月16日 優先權日2009年12月16日
發明者王絳, 賀新義, 鄧子新, 黃曦 申請人:上海交通大學

同类文章

一種新型多功能組合攝影箱的製作方法

一種新型多功能組合攝影箱的製作方法【專利摘要】本實用新型公開了一種新型多功能組合攝影箱,包括敞開式箱體和前攝影蓋,在箱體頂部設有移動式光源盒,在箱體底部設有LED脫影板,LED脫影板放置在底板上;移動式光源盒包括上蓋,上蓋內設有光源,上蓋部設有磨沙透光片,磨沙透光片將光源封閉在上蓋內;所述LED脫影

壓縮模式圖樣重疊檢測方法與裝置與流程

本發明涉及通信領域,特別涉及一種壓縮模式圖樣重疊檢測方法與裝置。背景技術:在寬帶碼分多址(WCDMA,WidebandCodeDivisionMultipleAccess)系統頻分復用(FDD,FrequencyDivisionDuplex)模式下,為了進行異頻硬切換、FDD到時分復用(TDD,Ti

個性化檯曆的製作方法

專利名稱::個性化檯曆的製作方法技術領域::本實用新型涉及一種檯曆,尤其涉及一種既顯示月曆、又能插入照片的個性化檯曆,屬於生活文化藝術用品領域。背景技術::公知的立式檯曆每頁皆由月曆和畫面兩部分構成,這兩部分都是事先印刷好,固定而不能更換的。畫面或為風景,或為模特、明星。功能單一局限性較大。特別是畫

一種實現縮放的視頻解碼方法

專利名稱:一種實現縮放的視頻解碼方法技術領域:本發明涉及視頻信號處理領域,特別是一種實現縮放的視頻解碼方法。背景技術: Mpeg標準是由運動圖像專家組(Moving Picture Expert Group,MPEG)開發的用於視頻和音頻壓縮的一系列演進的標準。按照Mpeg標準,視頻圖像壓縮編碼後包

基於加熱模壓的纖維增強PBT複合材料成型工藝的製作方法

本發明涉及一種基於加熱模壓的纖維增強pbt複合材料成型工藝。背景技術:熱塑性複合材料與傳統熱固性複合材料相比其具有較好的韌性和抗衝擊性能,此外其還具有可回收利用等優點。熱塑性塑料在液態時流動能力差,使得其與纖維結合浸潤困難。環狀對苯二甲酸丁二醇酯(cbt)是一種環狀預聚物,該材料力學性能差不適合做纖

一種pe滾塑儲槽的製作方法

專利名稱:一種pe滾塑儲槽的製作方法技術領域:一種PE滾塑儲槽一、 技術領域 本實用新型涉及一種PE滾塑儲槽,主要用於化工、染料、醫藥、農藥、冶金、稀土、機械、電子、電力、環保、紡織、釀造、釀造、食品、給水、排水等行業儲存液體使用。二、 背景技術 目前,化工液體耐腐蝕貯運設備,普遍使用傳統的玻璃鋼容

釘的製作方法

專利名稱:釘的製作方法技術領域:本實用新型涉及一種釘,尤其涉及一種可提供方便拔除的鐵(鋼)釘。背景技術:考慮到廢木材回收後再加工利用作業的方便性與安全性,根據環保規定,廢木材的回收是必須將釘於廢木材上的鐵(鋼)釘拔除。如圖1、圖2所示,目前用以釘入木材的鐵(鋼)釘10主要是在一釘體11的一端形成一尖

直流氧噴裝置的製作方法

專利名稱:直流氧噴裝置的製作方法技術領域:本實用新型涉及ー種醫療器械,具體地說是ー種直流氧噴裝置。背景技術:臨床上的放療過程極易造成患者的局部皮膚損傷和炎症,被稱為「放射性皮炎」。目前對於放射性皮炎的主要治療措施是塗抹藥膏,而放射性皮炎患者多伴有局部疼痛,對於止痛,多是通過ロ服或靜脈注射進行止痛治療

新型熱網閥門操作手輪的製作方法

專利名稱:新型熱網閥門操作手輪的製作方法技術領域:新型熱網閥門操作手輪技術領域:本實用新型涉及一種新型熱網閥門操作手輪,屬於機械領域。背景技術::閥門作為流體控制裝置應用廣泛,手輪傳動的閥門使用比例佔90%以上。國家標準中提及手輪所起作用為傳動功能,不作為閥門的運輸、起吊裝置,不承受軸向力。現有閥門

用來自動讀取管狀容器所載識別碼的裝置的製作方法

專利名稱:用來自動讀取管狀容器所載識別碼的裝置的製作方法背景技術:1-本發明所屬領域本發明涉及一種用來自動讀取管狀容器所載識別碼的裝置,其中的管狀容器被放在循環於配送鏈上的文檔匣或託架裝置中。本發明特別適用於,然而並非僅僅專用於,對引入自動分析系統的血液樣本試管之類的自動識別。本發明還涉及專為實現讀