新四季網

用於羊毛硫抗生素107891的生物合成的基因和蛋白質的製作方法

2023-09-20 02:15:05

專利名稱:用於羊毛硫抗生素107891的生物合成的基因和蛋白質的製作方法
用於羊毛硫抗生素107891的生物合成的基因和蛋白質概述本發明涉及羊毛硫抗生素(lantibiotics)的領域,更特別地涉及編碼羊毛硫 抗生素107891和其同系物的生物合成途徑所需的酶的核酸分子的分離。公開的是涉及 107891產生的基因產物的功能。本發明提供了 107891產生所必需的新的生物合成基因、編 碼的多肽、包含編碼所述多肽的核酸序列的重組載體、用所述載體轉化的宿主細胞以及利 用所述轉化的宿主細胞生產羊毛硫抗生素的方法,包括生產107891、其前體、其衍生物、或 不同於107891的修飾的羊毛硫抗生素或其前體的方法。
背景技術:
對現有抗生素有抗性的病原細菌的持續增多是全球性的衛生問題,因而存在著發 現和開發對抗性細菌有活性的新化合物的迫切需求。這重新引起了對天然產物的興趣,這 些天然產物過去是抗生素如青黴素、大環內酯類和糖肽的豐富來源。吸引人的候選物還有 抗微生物肽以及在它們之中被稱為羊毛硫抗生素的那些,即含羊毛硫氨酸的抗生素。羊毛 硫抗生素形成抗微生物肽內的特殊基團,通過幾個特徵來辨別,例如一級和立體結構特徵、 獨特的生物合成途徑以及肽修飾反應和強力的抗細菌活性。這些是由革蘭氏陽性細菌分 泌的、並主要作用於革蘭氏陽性細菌的一組肽衍生的抗微生物化合物。羊毛硫抗生素作為 前原肽(pr印rop印tide)由核糖體合成,所述前原肽被翻譯後修飾為它們的生物學活性形 式。前肽(pr印印tide)由N-末端前導序列和C-末端區域(原肽(prop印tide))組成,所 述N-末端前導序列不經歷任何翻譯後修飾,在從細胞分泌期間或之後被裂解,所述C-末端 區域被翻譯後修飾。羊毛硫抗生素由不同的細菌產生這些化合物的共同特徵是一個或更 多個羊毛硫氨酸殘基的存在,羊毛硫氨酸殘基由通過硫醚鍵共價交聯的兩個丙氨酸殘基組 成。當半胱氨酸殘基與脫氫丙氨酸或脫氫氨基丁酸部分反應來分別形成羊毛硫氨酸或甲基 羊毛硫氨酸殘基時形成硫醚鍵。脫氫胺基酸殘基依次分別通過絲氨酸和蘇氨酸的脫水來形 成。根據它們的結構和功能性質,羊毛硫抗生素通常被分為兩類,A型和B型。A型羊毛硫 抗生素是長度從20到34個胺基酸殘基的長形的陽離子肽乳鏈菌肽、枯草菌素、表皮素和 Pep5是這個類別的成員。B型是具有淨負電荷的球形的肽這個羊毛硫抗生素類別的實例 有mersacidin、肉桂黴素、乳鏈球菌素481和actagardine。這些結構上的不同反映在了作 用的機制上。通過可能由或不由對細胞靶脂質II的先期對接所輔助的一種機制,A型化合 物通過阻斷細胞壁生物合成和通過在細胞膜中形成孔來發揮它們的抗微生物活性。B型羊 毛硫抗生素還通過抑制肽聚糖生物合成來發揮它們的抗微生物活性,但是這些化合物在與 脂質II結合時不形成孔。羊毛硫抗生素已經顯示了具有作為食品添加劑和抗菌劑的效力和用途。最多研 究的羊毛硫抗生素乳鏈菌肽由乳酸乳球菌(Lactococcus lactis)產生,在低濃度(低 納摩爾MIC)下針對多種革蘭氏陽性細菌包括藥物抗性菌株和食物傳染的病原體肉毒杆 菌(Clostridium botulinum)和單核細胞增生利斯特氏菌(Listeria monocytogenes) 具有活性。它已經廣泛地用作食品防腐劑而沒有細菌抗性的實質性發生。其他的 羊毛硫抗生素顯示了感興趣的生物學活性例如,表皮素顯示了針對瘡皰丙酸桿菌(Propionibacteriumacnes)的高效力;肉桂黴素和耐久黴素抑制磷脂酶A2和血管緊張肽 轉變酶,分別提供了作為抗炎劑和用於血壓調節的應用潛力;mersacidin抑制許多革蘭氏 陽性細菌,包括甲氧西林抗性金黃葡萄球菌(Staphylococcus aureas) (MRSA)。對羊毛硫抗生素的生物合成負責的基因以成為基因座符號lan的聚簇來組織,對 每種羊毛硫抗生素具有更為具體的遺傳型名稱(例如,乳鏈菌肽為nis,gallidermin為 gdm,肉桂黴素為cin)。許多lan基因已經被測序,證明了在基因結構上高水平的相似性。 每個聚簇包括編碼前肽的結構基因lanA ;以及在LanA的原肽部分中Ser和Thr殘基的 脫水和硫醚形成所需的一或多個基因。對於A型羊毛硫抗生素,LanB進行脫水反應,LanC 致力於硫醚鍵連,而在B型羊毛硫抗生素中,單個LanM酶催化這兩種反應。其他基因通常 存在於羊毛硫抗生素聚簇中lanT編碼用於羊毛硫抗生素的分泌的ABC轉運蛋白,通常與 由lariETO基因編碼的第二轉運系統組合;lanP編碼加工蛋白酶,但是某些聚簇缺少這一基 因,其可以是lanT的部分或它的功能由細胞的蛋白酶提供;lanl編碼涉及自我保護的蛋白 質;lanKR對調節lan基因的表達負責。存在著通過操作天然化合物來獲得改進的羊毛硫抗生素的可能性和實用性。然 而,羊毛硫抗生素是結構上複雜的肽,它們對化學作用的可接近性限於分子中的一些位置。 化學作用的主要局限性之一是改變肽主鏈中存在的胺基酸的類型或順序。鑑於此,希望的 是擁有對於在羊毛硫抗生素形成中重定向這些步驟有用的基因和酶,以獲得通過化學手段 難以或不可能製得的衍生物。因而,直接通過使用精確工程化的菌株的發酵過程來設計新 的羊毛硫抗生素衍生物的一般方法將是高度期望的。實際上,在羊毛硫抗生素中的異常胺基酸單獨地促進了它們的生物學活性並且還 增強它們的結構穩定性。涉及羊毛硫抗生素生物合成的酶表現了通過將異常胺基酸導入期 望的肽中用於肽工程化的高度潛力。羊毛硫抗生素107891顯示了針對革蘭氏陽性細菌包括甲氧西林和萬古黴素抗 性菌株的抗細菌活性,但是對革蘭氏陰性細菌示出了有限的活性(例如某些莫拉氏菌屬 (Moraxella spp.)、奈瑟氏菌屬(Neisseria spp.)禾口嗜血桿菌屬(Haemophilus spp.))。 107891 分離自小雙孢菌(Microbispora sp.)PTA-5024 的發酵物(W0 2005/04628A1)。它 由緊密相關的因子A1和A2的複合物組成,它的結構可以重新推導為肽骨架,長度24個氨 基酸,含有羊毛硫氨酸和甲基羊毛硫氨酸作為組成部分。此外,氯原子和一個或兩個-0H殘 基存在於分子上。107891複合物的組分的結構由圖3的式1代表,其中R代表
和因 子A1 (R = 0H)、因子A2 (R = -(0H)2)。107891看起來組合了 A型和B型羊毛硫抗生素的元 件107891中的環A和B與A型化合物中的等價的環高度相關;然而,如在B型羊毛硫抗生 素中的,107891是更為球形的,它缺少柔性C-末端尾部並且缺乏帶電的胺基酸殘基。因此, 不能預測致力於107891形成的lan聚簇是編碼單獨的LanM酶還是獨立的LanB和LanC蛋 白。此外,對於含氯的羊毛硫抗生素沒有先例,因而對這種翻譯後修飾負責的基因無法從現 有數據預測。抗生素生產的工業過程的設計是相對成功的,產生了抗生素滴度達到每升幾克 的水平的大規模發酵。這主要是通過經驗性的、嘗試與錯誤的方法來實現的,缺少理論基 礎。因而新工藝的開發和現有技術的改進仍然是費時的,可能產生不穩定的細菌培養物、不 一致地進行和積累不需要的副產品。近年來,已經成功地應用了理論方法來提高鏈黴菌屬(Streptomycesspp.)產生的抗生素的水平,其通常涉及感興趣的基因簇內存在的關鍵調節 元件的操作或途徑中限速步驟的過表達。因而,編碼這樣的聚簇相關的調節物或合成限制 步驟的基因可能成為產量改進的有效工具。然而,迄今為止在放線菌中鑑定的聚簇相關的 調節物屬於幾個不同的蛋白質家族。甚至在一個家族內部,存在著序列相同性方面相當大 的變異。因而,聚簇相關的調節物的存在、性質、數量和序列不能通過與其他聚簇比較來預 測,甚至是指定了相關抗生素的那些。舉例來說,泰樂菌素基因簇編碼四種不同的調節物, 而在指定相關的大環內脂類抗菌素紅黴素的聚簇中都沒有發現。類似地,生物合成途徑中 限速步驟的性質和原因不能先驗地確定。因而,提高107891產量的工具是高度期望的。然而,沒有來自小雙孢菌屬的其他 成員的聚簇的實例。因而,不能預測生產者菌株保護自身免於107891作用、調節其他lan 基因表達、或lan基因與它的其他細胞過程配合表達的機制。與這些相關的信息對於優化 生產過程將是非常有用的。發明描述本發明提供了微生物中羊毛硫抗生素107891的生物合成所需的一組分離的多核 苷酸分子。因而,根據一個方面,本發明涉及選自連續DNA序列(SEQ ID NO 1)的多核苷酸分 子,所述DNA序列代表了分離自小雙孢菌(Microbisporasp. )PTA-5024的、由編碼107891 形成所需多肽的17個0RF組成的mlb基因簇。由所述17個0RF編碼的多肽的胺基酸序列在SEQ ID NO 2到18中提供。本發明還提供了包含選自由以下組成的組中的核苷酸序列的分離的核酸a)編碼107891和其同系物的合成所需的多肽的mlb基因簇(SEQ IDN0 1);b)編碼由mlb基因簇(SEQ ID NO 1)編碼的相同多肽、與mlb基因簇自身的核苷 酸序列不同的核苷酸序列;c)mlb 0RF 1到17的任何核苷酸序列,編碼由SEQ ID NO 2到18編碼的多肽;d)編碼由mlb 0FR 1到17的任一個編碼的相同的多肽(SEQ ID NO 2到18)、與 所述0RF的核苷酸序列不同的核苷酸序列。本發明的進一步的主題是提供了包含選自由以下組成的組中的核苷酸序列的分 離的核酸e)編碼一多肽的核苷酸序列,所述多肽在其全長上在胺基酸序列上與mlb 0RF 1 到17的任一個編碼的多肽(SEQ ID NO 2到18)至少具有65%、優選86%、更優選90%、 最優選95%或更高的相同性。在一個實施方案中,本發明的分離的核酸包含選自0RF 1到17(SEQ IDN0:2到18) 的0RF,其編碼107891的前原肽的合成所需的多肽。在另一個實施方案中,所述核酸包含選自0RF 1到17(SEQ ID NO :2到18)的0RF, 其編碼107891脫水酶的合成所需的多肽。在又一個實施方案中,所述核酸包含選自0RF 1 到17(SEQ ID NO 2到18)的0RF,其編碼107891的羊毛硫氨酸和甲基-羊毛硫氨酸殘基 的合成所需的多肽。根據另一個實施方案,在本發明的核酸中,提供了選自0RF 1到17(SEQ ID NO 2 到18)的0RF,其編碼107891的胺基酸4的色氨酸殘基的氯化所需的多肽。
在又一個實施方案中,提供了包含選自0RF 1到17(SEQ ID NO 2到18)的0RF的 核酸,其編碼107891的胺基酸14的脯氨酸殘基的羥基化所需的多肽。在又一個實施方案中,提供了包含選自0RF 1到17(SEQ ID NO 2到18)的0RF的 核酸,其編碼氧化脫羧作用所需的黃素蛋白,氧化脫羧作用在107891的位置21和24產生 S-[(Z)-2-氨基乙烯基]-(3S)-3-甲基-D-半胱氨酸(AviMeCys)殘基。根據另一個實施方案,在本發明的核酸中,提供了選自0RF 1到17(SEQ ID NO 2 到18)的0RF,其編碼黃素蛋白還原所需的多肽。根據又一個實施方案,提供了核酸,其包含選自0RF 1到17(SEQ IDN0 2到18)的 0RF的組合,編碼對107891的輸出和抗性所需的多肽。在又一個實施方案中,提供了核酸,其包含選自0RF 1到17(SEQ IDN0 2到18)的 0RF的組合,編碼調節mlb基因簇表達所需的多肽。本領域技術人員理解的是,已經提供了編碼107891生物合成途徑的多肽的核苷 酸序列,本發明還提供了編碼來自這樣的多肽的片段的核苷酸。根據本發明,本領域技術人 員理解的是,由於遺傳密碼是簡併性的,由SEQID NO 2到18所編碼的相同的多肽可以由 0RF 1到17的天然或人工變體編碼,即由0RF 1到17所指定的基因組核苷酸序列之外的、 但是編碼相同的多肽的核苷酸序列編碼。此外,還要理解的是,天然發生的或人工製造的變體可以出自SEQ IDN0:2到18編 碼的多肽,所述變體具有與上述原始多肽相同的一或多種功能,但是含有對於摺疊或催化 功能非關鍵的胺基酸的添加、缺失或取代,或必需胺基酸的保守性取代。本領域技術人員還理解的是,提供了 107891生物合成所需的全部聚簇的核苷酸 序列,本發明還提供了所述聚簇中存在的基因的表達所需的核苷酸序列。這樣的調節序列 包括但不限於啟動子和增強子序列、反義序列、轉錄終止子和抗終止子序列。這些序列對於 調節mlb基因簇中存在的基因的表達是有用的。帶有單獨的或與其他核苷酸序列融合的所 述核苷酸序列的細胞也在本發明的範圍之內。在一個方面,本發明提供了包含核苷酸序列的分離的核酸,所述核苷酸序列編碼 0RF6多肽(SEQ ID NO :7)、或所述多肽的天然發生的變體或衍生物,編碼107891的前原肽。在另一個方面,本發明提供了包含核苷酸序列的核酸,所述核苷酸序列編碼0RF7 多肽(SEQ ID NO :8)、或所述多肽的天然發生的變體或衍生物,對於羊毛硫抗生素前體中絲 氨酸和蘇氨酸殘基的脫水化是有用的。在又一個方面,本發明提供了包含核苷酸序列的核酸,所述核苷酸序列編碼0RF8 多肽(SEQ ID NO :9)、或所述多肽的天然發生的變體或衍生物,對於羊毛硫抗生素前體中羊 毛硫氨酸和甲基_羊毛硫氨酸形成是有用的。在另一個方面,本發明提供了包含核苷酸序列的核酸,所述核苷酸序列編碼 0RF9多肽(SEQ ID NO :10)、或所述多肽的天然發生的變體或衍生物,對於抗生素前體中 AviMeCys形成是有用的。在另一個方面,本發明提供了包含核苷酸序列的核酸,所述核苷酸 序列編碼0RF15多肽(SEQ IDN0:16)、或所述多肽的天然發生的變體或衍生物,對於羊毛硫 抗生素前體中色氨酸殘基的氯化是有用的。在又一個方面,本發明提供了包含核苷酸序列的核酸,所述核苷酸序列編碼0RF2 多肽(SEQ ID NO :3)、或所述多肽的天然發生的變體或衍生物,對於羊毛硫抗生素前體中脯氨酸殘基的羥基化是有用的。在另一個方面,本發明提供了包含核苷酸序列的核酸,所述核苷酸序列編碼0RF1、 10到11、13到14和17(SEQ ID NO :2、11到12、14到15、和18)所指定的多肽,或所述多肽 的天然或人工發生的變體或衍生物,對於107891或107891前體的細胞輸出是有用的。在另一個方面,本發明提供了包含核苷酸序列的核酸,所述核苷酸序列編碼0RF3 和5多肽(SEQ ID NO :4和6)、或所述多肽的天然或人工發生的變體或衍生物,對於調節羊 毛硫抗生素產生是有用的。在一個實施方案中,本發明提供了帶有核苷酸序列的額外的拷貝的羊毛硫抗生素 生產菌株,所述核苷酸序列指定選自0RF 1到17(SEQ ID N0:2到18)的任一個的至少一個 0RF。在一個優選的實施方案中,這樣的羊毛硫抗生素生產菌株是屬於放線菌目 (Actinomycetales)的任何菌株。在又一個優選的實施方案中,這樣的羊毛硫抗生素生產菌株是小雙孢菌屬的成
員O在一個優選的實施方案中,本發明提供了小雙孢菌菌株,其含有SEQ IDN0 1中指 定的核苷酸序列中的一個或更多個變異,所述變異引起0RF 1到17(SEQ ID NO :2到18)的 一個或更多個的提高或降低的表達。在一個優選的實施方案中,本發明提供了攜帶在一個或更多個載體上的包含SEQ ID NO 1指定的核苷酸序列或其部分的核酸,對於通過其他細胞生產107891、一種或更多 種的其前體或其衍生物是有用的。在一個優選的實施方案中,所述核苷酸序列或其部分被攜帶在單個載體上。適合 的載體是能夠攜帶此處定義的完整mlb聚簇的任何粘粒、F粘粒、BAC、PAC、ESAC載體。適 合的載體是本領域技術人員公知的,在文獻(Kieser et al.,2000,以及其中描述的參考文 獻)中描述。在一個方面,本發明提供了提高107891的產生的方法,所述方法包括以下步驟-用重組DNA載體轉化微生物,所述微生物通過生物合成途徑生產107891或其 同系物或107891的前體或其同系物,所述載體包含DNA序列,所述DNA序列選自0RF 1到 17(SEQ ID N0:2到18)的任一個,其編碼所述途徑中速率限制性的活性。-在適合於細胞生長的條件下培養用所述載體轉化的所述微生物,表達所述基因 並產生所述抗生素或抗生素前體。適合的宿主細胞是放線菌目,到鏈孢囊菌科(Str印tosporangiaceae)、小單 抱菌禾鬥(Micromonosporaceae)、假諾卡氏菌禾鬥(Pseudonocardiaceae)和鏈黴菌科 (Streptomycetaceae),到小雙孢菌屬(Microbispora)、遊雲力放線菌屬(Actinoplanes)、遊動單胞菌屬(Planomonospora)、鏈黴菌屬(Streptomyces)等等。在另一個方面,本發明提供了生產107891的衍生物和其同系物的方法,所述方法 包括以下步驟-在適合的載體中克隆選自SEQID NO :1所定義的核苷酸序列的片段,所述片段 含有0RF 1到17(SEQ ID NO 2到18)之一的至少一部分,所述0RF編碼多肽,所述多肽催 化希望繞過的生物合成步驟;
-通過除去或置換一個或更多個指定胺基酸的密碼子來失活所述0RF,所述氨基 酸對於所述多肽的活性是必需的;-用所述重組DNA載體轉化微生物,所述微生物通過生物合成途徑生產107891或 其同系物或其107891前體;-在所述產生的轉化體中篩選出所述DNA序列被突變的拷貝置換的那些轉化體;-在適合於細胞生長的條件下培養突變細胞,表達所述途徑並生產所述途徑類似 物。在又一個方面,本發明提供了生產新的羊毛硫抗生素的方法,所述方法包括以下 步驟-用重組DNA載體轉化微生物,所述微生物通過生物合成途徑生產羊毛硫抗生素 或其同系物或其前體,所述載體包含一個或更多個0RF,所述0RF選自0RF 1到17 (SEQ ID NO 2到18),其編碼能夠修飾所述羊毛硫抗生素或羊毛硫抗生素前體的一或多種酶;-在適合於細胞生長的條件下培養用所述載體轉化的所述微生物,表達所述基因 並產生所述羊毛硫抗生素或其同系物或其羊毛硫抗生素前體。在又一個方面,本發明提供了生產新的羊毛硫抗生素的方法,所述方法包括以下 步驟-用重組DNA載體轉化微生物,所述載體包含一個或更多個0RF,所述0RF選自0RF 1到17(SEQ ID NO :2到18),其編碼能夠修飾羊毛硫抗生素或羊毛硫抗生素前體的一或多 種酶;-在適合於細胞生長的條件下培養用所述載體轉化的所述微生物,在存在所述羊 毛硫抗生素或羊毛硫抗生素前體的情況下表達所述基因。在又一個方面,本發明提供了生產新的羊毛硫抗生素的方法,所述方法包括以下 步驟-用重組DNA載體轉化微生物,所述載體包含一個或更多個0RF,所述0RF選自0RF 1到17(SEQ ID NO :2到18),其編碼修飾羊毛硫抗生素或羊毛硫抗生素前體的一種或更多 種多肽;-在適合於一或多種活性多肽的存在的條件下製備所述微生物的細胞提取物或細 胞級分,所述細胞提取物或細胞級分至少含有所述一或多種多肽;-將羊毛硫抗生素或羊毛硫抗生素前體添加到所述細胞提取物或細胞級分中,在 所述一或多種多肽可以修飾所述羊毛硫抗生素或羊毛硫抗生素前體的條件下保溫所述混 合物。本發明的進一步的方面包括涉及107891的生物合成途徑的分離的多肽,選自-由mlb0RF 1到17(SEQ ID NO 2到18)的任一個編碼的0RF多肽,禾口-一多肽,所述多肽在其全長上在胺基酸序列上與mlb0RF 1到17(SEQID N0:2到 18)的任一個、優選 mlb 0RF 1 到 3、5 到 11、13 到 17 (SEQID NO :2 到 4、6 到 12、14 到 18)的 任一個編碼的多肽具有至少65%、優選95%或更高的相同性。優選的多肽組包含由mlb 0RF 1到3、5到11、13到17(SEQ ID NO 2到4、6到12、 14到18)的任一個編碼的任何0RF多肽,或在其全長上在胺基酸序列上與所述mlb 0RF的 任一個編碼的多肽具有至少65%、優選86%、更優選90%、最優選95%或更高的相同性的
10任何多肽。定義術語「分離的核酸」在此是指DNA分子,作為基因組DNA或互補DNA (cDNA),其可以 是單鏈或雙鏈的、天然或合成來源的。該術語還指天然或合成來源的RNA分子。術語「核苷酸序列」在此是指此處公開的0RF的全長或部分長度序列以及基因間 區域。術語「核苷酸序列」在此還指和/或包含序列表中所示的本發明的核苷酸序列的 任一個。序列表的任一核苷酸序列是A)編碼序列,B)來自(A)轉錄的RNA分子,C)利用了遺傳密碼的簡併性來編碼相同多肽的編碼序列,D)基因間區域,含有啟動子、增強子、終止子和抗終止子序列。術語「基因簇」、「聚簇」和「生物合成聚簇」在此是指微生物的基因組的連續片段, 其含有次級代謝產物的合成所需的全部基因。術語「mlb」在此是指對小雙孢菌PTA-5024中的107891生物合成負責的遺傳元件。 該術語是 Microbispora LantiBiotic 的簡稱。術語「0RF」在此是指編碼一個多肽的基因組核苷酸序列。在本發明的上下文中, 術語0RF與「基因」同義。術語「 0RF多肽」在此是指由0RF編碼的多肽。術語「mlb 0RF」在此是指包含在mlb基因簇之內的0RF。術語「次級代謝產物」在此是指微生物通過由基因簇指定的一組基因的表達產生 的生物學活性物質。術語「載體」在此被定義為包括特別是任何質粒、粘粒、噬菌體,其可以通過整合到 細胞基因組中或染色體外地存在(例如,具有複製起點的自主複製質粒)來轉化原核宿主。術語「生產宿主」、「宿主細胞」在此是微生物,其中次級代謝產物的形成由來自供 體微生物的基因簇指導。術語「同系物」在此是指由生物合成基因簇編碼的多肽,其在其全長上與由mlb聚 簇編碼的任何多肽享有至少65%的序列相同性。附圖簡述附

圖1顯示了來自小雙孢菌PTA-5024的染色體的分離的DNA片段。粗線表示了 SEQ ID N0:1中描述的片段。帶有所述分離的DNA片段的粘粒被稱為1G6和6H6。附圖2顯示了 mlb聚簇的遺傳結構。每個0RF由箭頭表示,如表1中的編號(附 圖4)。取向與附圖1中相同。標尺條上的數字表示序列坐標(按照kb)。附圖3顯示了 107891複合物的成分的結構。附圖4顯示了 0RF的主要特徵。A.分離自小雙孢菌的mlb基因107891是小雙孢菌PTA-5024產生的緊密相關的肽抗生素的複合物。本發明提供 了用於107891生物合成的mlb基因簇的核酸序列和表徵。mlb基因簇的物理組織與側翼 DNA序列一起在附圖1中報告,其說明了來自小雙孢菌PTA-5024的基因組的20_kb基因組片段、以及定義這樣的片段的兩個粘粒的物理圖譜。調節107891生物合成的DNA片段的遺 傳組織結構在附圖2中示出,它的核苷酸序列由SEQ ID NO 1報告。聚簇的精確邊界可以根據它的基因產物的功能來建立。因此,在左側末端(附圖 l),mlb聚簇由mlb ORFl劃界,編碼ABC轉運蛋白(SEQ IDNO :2),涉及107891的輸出。在 右側,mlb聚簇由mlb ORF 17劃界,一種膜離子反向轉運蛋白(SEQ ID N0:18)。mlb聚簇 跨越大約20,000個鹼基對,含有17個0RF,稱為mlb ORFl到mlb 0RF17。SEQ ID NO 1的 連續核苷酸序列(20000個鹼基對)編碼17種推斷的蛋白質,列於SEQ IDNO 2到18中。ORFl (SEQ ID NO 2)代表從核苷酸67到969翻譯SEQ ID NO 1推斷出的300個 胺基酸。0RF2 (SEQ ID NO :3)代表從核苷酸 966 到 2210 翻譯 SEQ ID NO :1 推斷出的 414
個胺基酸。0RF3 (SEQ ID NO 4)代表從核苷酸 2941 到 3723 翻譯 SEQ ID NO 1 推斷出的 260
個胺基酸。0RF4 (SEQ ID NO 5)代表從核苷酸 3948 到 4614 翻譯 SEQ ID NO 1 推斷出的 221
個胺基酸。0RF5 (SEQ ID NO 6)代表在互補鏈上從核苷酸5283到4621翻譯SEQ ID NO :1推 斷出的220個胺基酸。0RF6 (SEQ ID NO :7)代表從核苷酸 5414 到 5587 翻譯 SEQ ID NO :1 推斷出的 57
個胺基酸。0RP7 (SEQ ID NO 8)代表從核苷酸 5706 到 9053 翻譯 SEQ ID NO :1 推斷出的 1115
個胺基酸。0RF8 (SEQ ID NO 9)代表從核苷酸 9080 到 10507 翻譯 SEQ ID NO 1 推斷出的 475
個胺基酸。0RF9 (SEQ ID NO 10)代表從核苷酸 10537 到 11184 翻譯 SEQ ID NO 1 推斷出的 215個胺基酸。ORE 10 (SEQ ID NO :11)代表從核苷酸 11181 到 12131 翻譯 SEQ IDN0:1 推斷出的
316個胺基酸。ORFll (SEQ ID NO 12)代表從核苷酸 12253 到 12981 翻譯 SEQ ID NO :1 推斷出的
242個胺基酸。ORF12 (SEQ ID NO 13)代表從核苷酸 13357 到 13992 翻譯 SEQ ID NO :1 推斷出的 211個胺基酸。ORF13 (SEQ ID NO 14)代表從核苷酸 14795 到 15544 翻譯 SEQ ID NO :1 推斷出的 249個胺基酸。ORF14 (SEQ ID NO 15)代表從核苷酸 15546 到 16256 翻譯 SEQ ID NO :1 推斷出的 236個胺基酸。ORF15 (SEQ ID NO 16)代表從核苷酸 16370 到 17995 翻譯 SEQ ID NO :1 推斷出的
541個胺基酸。0RF16 (SEQ ID NO 17)代表從核苷酸 17992 到 18528 翻譯 SEQ ID NO :1 推斷出的 178個胺基酸。
12
ORF17 (SEQ ID NO 18)代表從核苷酸 18525 到 19817 翻譯 SEQ ID NO :1 推斷出的
430個胺基酸。mlb聚簇的基因組結構和一級序列將107891置於A型羊毛硫抗生素中。mlb和其他羊毛硫抗生素基因簇之間的比較揭示了重要的不同。實際上,mlb聚簇 的特徵在於在其他羊毛硫抗生素聚簇中沒有找到同系物的幾種ORF的存在。這些包括ORF 1到6、12、15到18 (SEQ ID NO :2到7、13、16到19)。總之,此處描述的mlb聚簇的結構實 質上不同於其他羊毛硫抗生素的合成中所涉及的其他聚簇的結構。因而它代表了具有這樣 的基因組結構的聚簇的第一個實例。B. mlb基因的作用本發明公開了負責107891的前原肽前體的合成的DNA序列。107891前原肽由 33-aa長度的前導肽和24_aa的原肽組成。在此所指的核酸序列是編碼107891前原肽或 其片段的那些。57-aa的107891前原肽代表了新的元件,其在它的全長上與來自雞葡萄球 菌(Staphylococcus gallinarum)的羊毛硫抗生素 gallidermin 的前原肽、UniProt 登記 號P21838僅具有41 %的相同性。mlb聚簇中存在的其他基因代表了對於提高107891的產生或合成新的代謝物有 用的新的遺傳元件。在這些之中,mlb ORF 7到8(SEQ ID NO :8到9)編碼涉及mlb 0RF6 的翻譯產物的翻譯後修飾的蛋白質,在成熟的107891中導入羊毛硫氨酸殘基。特別是,mlb 0RF7多肽負責107891的前原肽部分中Ser和Thr殘基的脫水,分別產生脫氫丙氨酸和脫氫 氨基丁酸殘基。mlb 0RF8多肽催化前原肽內部半胱氨酸殘基對脫氫胺基酸殘基的親核攻 擊。這些基因可以在異源宿主中克隆和表達以產生能夠將羊毛硫氨酸殘基導入其他前原肽 的有活性的酶。本發明的另一個優選的核酸分子包括mlb 0RF9 (SEQ ID NO 10),其編碼在產生 S-[(Z)-2-氨基乙烯基]-(3S)-3-甲基-D-半胱氨酸殘基(式I)的氧化脫羧作用中涉及的 蛋白質。本發明的又一個優選的核酸分子包括mlb 0RF16 (SEQ ID NO 17),其編碼色氨酸 滷化酶(halogenase),負責將氯原子加到107891的胺基酸4。mlb ORF 16代表新的和獨特 的遺傳元件,早先在其他羊毛硫抗生素聚簇中沒有報導。實際上,氯化是107891在已知的 羊毛硫抗生素中相當獨特的特徵。這個基因可以在異源宿主中克隆和表達,產生能夠氯化 羊毛硫抗生素分子的色氨酸殘基的活性酶。或者,mlb 0RP16可以在生產菌株中失活,導致 缺乏附著於胺基酸4的氯的107891衍生物的形成。本發明的又一個優選的核酸分子包括mlb 0RF2 (SEQ ID NO :3),其編碼對107891 前原肽的翻譯後修飾負責的細胞色素P450羥化酶,通過添加一個或兩個氧到位置14的脯 氨酸殘基。mlb 0RF2代表新的和獨特的遺傳元件,在其他羊毛硫抗生素聚簇中從未被報導 過。實際上,107891脯氨酸羥基化譜在羊毛硫抗生素中相當獨特的。這個基因可以在異源 宿主中克隆和表達,產生能夠氧化羊毛硫抗生素分子中存在的脯氨酸殘基的活性酶。或者, mlb 0RP2可以在生產菌株中失活,導致胺基酸14處缺乏氧原子的107891衍生物的形成。mlb聚簇還包括許多調節基因,對107891生產期間直接或間接地活化生物合成和 抗性基因的表達負責。這些基因包括mlb ORF 3和5(SEQ IDNO :4和6) :mlb 0RF3 (SEQ ID NO 4)代表獨立的群體感應(quorum-sensing)肽,對107891生產的調節部分地負責;mlb0RF5 (SEQID NO 6)是與Sigma_70高度相關的,Sigma_70是一種作為正轉錄調節物的RNA 聚合酶sigma因子的細胞質外功能家族。mlb ORF 3和5代表了其他羊毛硫抗生素聚簇沒 有的新的遺傳元件。這兩個基因,mlb ORF 3和5可以單獨地或按它們任何的組合在另一 個羊毛硫抗生素生產者菌株中克隆和表達來提高形成的產物的產量。宿主菌株包括但不限於屬於放線菌目的菌株,屬於鏈孢囊菌科、小單孢菌科、假諾 卡氏菌科和鏈黴菌科的菌株,屬於小雙孢菌屬、遊動放線菌屬、遊動單胞菌屬、鏈黴菌屬的 菌株等等。或者,這些基因可以單獨地或它們的任何組合在107891生產菌株中過表達來提 高107891的產量。mlb聚簇還包括對輸出羊毛硫抗生素中間物或終產物到細胞質外負責的、以及對 生產者細胞賦予抗性負責的許多基因。這些基因包括mlb ORF 1、10到11、13到14和17(SEQ ID NO :2、11 至Ij 12、14 到 15 禾口 18)。mlb 0RF1U0 到 11、13 到 14 編碼 ABC 類別的轉運蛋白, 對107891或它的中間物的ATP依賴性排出負責。mlb 0RF17編碼Na/K離子反向轉運蛋白, 對於對抗質子梯度輸出107891或它的中間物負責。這些基因可以單獨地或按它們任何組 合在另一個羊毛硫抗生素生產者菌株中克隆和表達來提高形成的產物的產量。宿主菌株包 括但不限於屬於放線菌目的菌株,屬於鏈孢囊菌科、小單孢菌科、假諾卡氏菌科和鏈黴菌科 的菌株,屬於小雙孢菌屬、遊動放線菌屬、遊動單胞菌屬、鏈黴菌屬的菌株等等。或者,這些基因可以單獨地或它們的任何組合地在107891生產菌株中過表達來 提高107891的產量。C. mlb聚簇的用途本發明還提供了用於完整107891分子、其任何前體或其衍生物的表達的核酸。這 樣的核酸包括一或多個分離的基因簇,所述基因簇包含編碼足以指導107891組裝的多肽 的0RF。在一個實例中,完整的mlb聚簇(SEQID NO 1)可以被導入適合的載體中,用於轉化 期望的生產宿主。在另一個方面,mlb聚簇作為兩個獨立的片段克隆到兩個不同的載體中, 所述載體在期望的生產宿主中是相容的。在又一個方面,mlb聚簇可以分成三個片段,各自 克隆到獨立的、相容的載體中。一、二或三載體系統的使用的實例已經在文獻中描述了。一旦mlb聚簇被適當地克隆到一個或更多個載體中,它可以被導入許多適合的生 產宿主中,在其中羊毛硫抗生素的生產可以以比天然宿主中更高的效率發生。優選的宿主 細胞是可以有效地表達放線菌基因的那些物種或菌株。這樣的宿主包括但不限於屬於放線 菌目,鏈孢囊菌科、小單孢菌科、假諾卡氏菌科和鏈黴菌科,小雙孢菌屬、遊動放線菌屬、遊 動單胞菌屬、鏈黴菌屬等等。或者,被克隆到一個或更多個適合的載體中的mlb聚簇的第二 拷貝可以被導入107891生產菌株中,在其中mlb基因的第二拷貝將提高107891的產量。生產能力向良好表徵的宿主的轉移可以實質上改善導致優化和發展的過程的幾 個部分生產菌株中天然產物的滴度可以更有效地提高;天然產物的純化可以在可能干擾 活性的已知背景中進行;複合物的組成可以更有效地控制;天然產物的改變的衍生物可以 通過發酵條件的操作或通過途徑工程化來更有效地產生。或者,生物合成基因簇可以被修飾,插入到宿主細胞中,用於合成或化學地修飾各 種各樣的代謝物例如,開放閱讀框可以被重新排序,修飾,和與其他羊毛硫抗生素生物合 成基因簇組合。使用在此提供的信息,107891核酸的克隆和表達可以利用常規和公知的方法實現。在另一個可能的用途中,從mlb基因簇選擇的ORF可以通過使用常規的分子生物 學技術來分離和失活。克隆在含有DNA片段的適合的載體中的突變的ORF被導入所述小雙 孢菌菌株中,所述DNA片段側翼於小雙孢菌PTA-5024染色體中的所述0RF,其中同源重組 的兩次交叉事件引起所述生產者菌株中所述ORF的失活。這個過程對於以有效的方式生產 107891的前體或衍生物是有用的。在另一種可能的用途中,從mlb基因簇選擇的ORF被分離並置於期望的啟動子的 控制下。克隆在適合的載體中的工程化的ORF然後被導入小雙孢菌PTA-5024,通過如上所 述置換原始0RF、或作為所述ORF的另外的拷貝。這個操作對於提高或降低對107891分子、 其前體或衍生物的生產是關鍵的ORF的表達水平是有用的。實驗小節以下實施例用來說明鑑定出107891基因簇的原理和方法,以及鑑定和分析所有 mlb基因的原理和方法。這些實施例用來說明本發明的原理和方法,但是不意味著限制它的 範圍。一般方法除非另外指出,細菌菌株和克隆載體全部可以從公眾保藏機構或商業來源獲得。 使用分子生物學的標準方法。小雙孢菌屬在HT瓊脂和在V6培養基(20g/l葡萄糖,5g/l酵 母提取物,3g/l酪蛋白水解物,5g/l肉類提取物,5g/l蛋白腖,1.5g/l NaCl,0.5%甘油)中 生長。根據公開的過程分離羊毛硫抗生素。使用標準程序進行序列分析。在公眾站點使用 Blast或Fasta程序進行資料庫檢索。實施例1-107891生物合成基因的分離使用來自小雙孢菌PTA-5024的DNA在接合粘粒載體Supercos 3中製備基因組文 庫。這通過將來自 pSET152 的 aacIV-oriT-intOC31 盒插入 Supercos 1 (Stratagene, La Jolla, CA 92037)中來構建如下aacIV-oriT_intOC31 盒通過 PCR 從載體 pSET152 作為 3. 8kb長的NruI片段獲得,插入到supercosl的相同位點中。來自小雙孢菌PTA-5024的總 DNA用Sau3AI部分地消化以將片段大小優化在40kb範圍內。部分消化的DNA用鹼性磷酸 酶處理,連接到早先用BamHI消化的SuperC0S3。連接混合物體外包裝,用於轉染大腸桿菌 (E. coli)XLlBlue細胞。產生的粘粒文庫通過與寡核苷酸探針5『 -GTS ACS WSS TGG WSS YTS WSS ACS GGS CCS TGCACS WSS CCS GGS GGS WSS AAC WSS WSS TCC WSS TG_3' (SEQ IDNO 19)雜交來篩選。根據從107891的結構推測出的胺基酸序列設計寡核苷酸。分離出 對於該探針為陽性的兩個粘粒,用限制性內切酶物理作圖。根據這樣的實驗,鑑定了附圖1 中報導的粘粒。由此從小雙孢菌PTA-5024的基因組鑑定的片段含有對抗生素107891的合 成負責的mlb基因簇。以上實施例用來說明mlb聚簇被分離的原理和方法。本領域技術人員將想到的是 mlb聚簇可以克隆在多種載體中。然而,本領域技術人員將理解,考慮到mlb聚簇的20-kb 大小,優選的載體是能夠攜帶大的插入物的那些,例如lambda、粘粒和BAC載體。本領域技 術人員理解,其他探針可用於從這樣的文庫鑑定mlb聚簇。根據在SEQ ID NO :1中報告的 序列,任何片段可以從小雙孢菌PTA-5024DNA中PCR擴增,用於篩選使用這些DNA製得的文 庫。從所述文庫可以鑑定出包括SEQ ID NO :1覆蓋的任何片段的一個或更多個克隆。此外,還可能的是通過使用異源探針例如來自其他Ian聚簇的那些利用表1中提供的信息鑑 定mlb聚簇。或者,指導次級代謝產物的合成的其他基因簇含有與mlb基因足夠相關的基 因以允許異源雜交。所有這些變體屬於本發明的範圍。實施例2-107891基因簇的序列分析如實施例1所述鑑定的mlb聚簇通過鳥槍法測序。mlb聚簇的序列在此由SEQ ID NO 1提供。分析產生的DNA序列來鑑定可能的編碼序列,編碼序列與其他Ian聚簇比較或 針對GenBank來檢索。每個ORF的確切起始密碼子通過相關序列的多次比對或通過搜索上 遊核糖體結合位點來確定。總共鑑定了 17個0RF,命名為mlb ORF 1到ORF 17。這些分析 的結果在表1中概述,在此在序列表中作為SEQ ID NO :2到SEQ ID N0:18來提供。詳述如 下。2A. 107891前原肽的合成mlb ORF 6對前原肽的合成負責。前原肽含有49_aa的前導序列和24_aa的原肽 (SEQ ID NO :7),原肽被翻譯後修飾來產生成熟的羊毛硫抗生素。羊毛硫抗生素前導肽的兩 個共同特徵在107891中被保留A型羊毛硫抗生素的保守序列(例如,F-D/N-L-D/E基序) 和在位置-2的脯氨酸殘基。前原肽(SEQ ID NO 7)的C-末端部分與公開的107891 —級 結構以及它的預定的原肽序列相一致。2B. 107891原肽的翻譯後修飾由 mlb ORF 7 至Ij 9 禾口 mlb ORF 17 編碼的四種蛋白質(SEQ ID NO :8 至Ij 10 禾口 SEQ ID NO 18)涉及107891前原肽的翻譯後修飾。這些基因產物的同系物在許多羊毛硫抗生 素聚簇中發現。根據與其他羊毛硫抗生素聚簇中發現的脫水酶和環化酶的序列相同性以及 它們的作用,可以進行以下的預測。mlb 0RF7多肽對107891原肽的位置3、5、13、18和21 處的絲氨酸殘基以及位置2和8處的蘇氨酸殘基的脫水負責,產生相應的脫水的殘基。mlb 0RF8多肽催化107891原肽中存在的半胱氨酸殘基向四個脫氫丙氨酸和一個脫氫氨基丁酸 殘基的區域和立體特異共軛加成,產生相應的五個硫醚。特別地,mlb ORF 8多肽涉及3-7、 13-20、18-23和21-24羊毛硫氨酸的形成和8_11甲基羊毛硫氨酸的形成。在表皮素和mersacidin聚簇編碼的脫羧酶觀察到的序列相同性的基礎上,mlb 0RF9編碼對21-24羊毛硫氨酸部分的脫羧作用負責的酶。在其他抗生素聚簇編碼的黃素還 原酶觀察到的序列相同性的基礎上,mlb 0RF16編碼黃素蛋白還原酶。考慮到在表皮素和 mersacidin形成期間氧化脫羧作用預計的作用,mlb 0RF9和16多肽催化107891中存在的 S- [ (Z) -2-氨基乙烯基]-D-半胱氨酸殘基的形成(式I)。2C. β -羥脯氨酸和色氨酸氯化的形成由mlb ORF 2和15 (SEQ ID NO :3和16)編碼的兩種蛋白質涉及一個或兩個β羥 基基團向位置14處的脯氨酸殘基的添加和107891原肽的位置4處的色氨酸殘基的氯化。 mlb 0RF2多肽顯示了與P450單加氧酶的顯著的相同性(表1),涉及脯氨酸殘基的羥基化。 在其他羊毛硫抗生素聚簇中沒有發現mlb 0RF2的同系物,因而這個基因代表了涉及羊毛硫 抗生素分子的羥基化的P450單加氧酶的獨特實例。此外,在與其他滷化酶的相同性水平的 基礎上,mlb 0RF15多肽涉及色氨酸氯化,代表了羊毛硫抗生素分子的修飾中涉及的滷化酶 的獨特實例。2D.輸出和抗性
16
由 ORF 1、10、11、13、14 和 17 (SEQ ID NO :2、11、12、14、15 和 18)編碼的五種蛋白 質涉及將107891或它的前體輸出到細胞質外部,以及涉及為生產菌株賦予抗性。它們預測 的作用如下。ORFl (SEQ ID NO 2)的同系物在其他羊毛硫抗生素聚簇中不存在。這個基因編 碼另外的ABC型轉運蛋白(表1),因而涉及在生產菌株小雙孢菌PTA中賦予對107891的 抗性。ORF 10、13到14和17 (SEQ ID NO :11、14到15和18)的同系物存在於其他羊毛硫 抗生素聚簇中(表1)。它們分別編碼ABC-型和離子依賴性跨膜轉運蛋白。因而它們涉及 107891或其前體的輸出或區室化。mlb 0RF17編碼Na/K離子反向轉運蛋白,對抗質子梯度 輸出107891或它的中間物負責。2E.調節ID NO :4和6)編碼的兩種蛋白質涉及調節一種或更多種mlb基 因的表達。mlb 0RF5多肽(SEQ ID NO 6)代表新的遺傳元件,其同系物在其他羊毛硫抗生 素聚簇中沒有發現。這種蛋白質屬於作為正轉錄調節物起作用的sigma因子的細胞質外功 能家族。0RF3多肽(SEQID NO 4)屬於LuxR型轉錄調節物的家族。0RF3 (SEQ ID NO 4)因 而可能是一種或更多種mlb基因的表達所需的。2F.其他功能在mlb聚簇中存在兩個另外的ORF:0RF4(SEQ ID NO 5)和ORF12 (SEQ ID N0:13)。 兩個 ORF 分別與 Salinispora tropica 禾口產二素鏈黴菌(Streptomyces ambofaciens)中 存在的未知功能的蛋白質相關(表1)。然而,它們在107891生物合成中的確切作用還不能 預測。實施例3-通過基因置換的107891途徑的操作使用實施例2中提供的信息,如下構建0RF2中的符合讀框的缺失。通過用寡聚物 5' -AAGCTTGCATCTGCGTGGGCGTCCTGC-3『 (SEQ ID NO 20)和5『 -TCTAGACGGTCCGAAGATCAT GGCCGCGG-3 『 (SEQ ID NO :21)擴增獲得片段A ;用寡聚物 5 『 -TCTAGATCCATGTGAACCGGCGGG TGGCCG-3『 (SEQ ID NO 22)和 5' -GAATTCCGGTCGCTCTCCTCGTCCTTTGCC-3『 (SEQ ID NO 23)擴增片段B。然後,用EcoRI和XbaI消化片段A,用XbaI和HindIII消化片段B,都連接到早先 用EcoRI和HindIII消化的pSET152。在轉化大腸桿菌DH5 α細胞之後,產生的質粒稱為 pDMl,通過在用EcoRI和HindIII消化後4kb和1. 5kb的片段的存在來識別。pDMl的等份轉 移到大腸桿菌ET12567(pUB307)細胞中,產生菌株DM1。然後,來自LB中的過夜培養物的約 IO8CFU的DMl細胞與在Rare3培養基中生長約80h的約IO7CFU的小雙孢菌PTA 5024混合。 產生的混合物塗布在HT平板上,其然後在28°C保溫約20h。在用水柔和洗滌除去過量的大 腸桿菌細胞後,平板用含有200 μ g萘啶酸和15 μ g/ml安普黴素的3mL軟瓊脂覆蓋。在28°C 進一步保溫3-5周後,小雙孢菌外接合體在含有安普黴素的新鮮培養基上劃線。一株這樣 的的外接合體,稱為菌株Mb-DMl,被進一步處理。菌株Mb-DMl然後在沒有安普黴素的HT 培養基中生長几個傳代,合適的稀釋物平鋪在沒有安普黴素的HT瓊脂上。然後使用寡聚物 5' -CGCGCTGCTCGGGGCCAAC-3『 (SEQID NO :24)和 5『 -AGGAAACGGCCAGCCCGTGG-3『 (SEQ ID NO 25)通過PCR分析單獨的菌落。含有0RF2的缺失的等位基因的菌落通過1. 5kb條 帶的存在來識別。一種這樣的菌落,稱為Mb-DM2,在HT培養基中生長,通過與可信的標準比
17較來確認脫羥基-107891的形成。上述實施例用來說明原理和方法,通過所述原理和方法在SEQ ID NO :2到18所指 定的當中選擇的ORF可以被107891生產菌株小雙孢菌PTA5024中突變的拷貝來置換。本 領域技術人員想得到的是0RF2 (SEQ ID NO :3)是在SEQ ID NO :1說明的聚簇中產生符合讀 框的缺失的方法的實例。本領域技術人員還理解的是,符合讀框的缺失僅僅是產生突變的一種方法,包括 但不限於移碼突變、插入和定點突變的其他方法也可以用於產生SEQ ID NO :2到18所指定 的任何ORF中的無效突變體。本領域技術人員還理解,建立了在SEQ ID NO 1指定的任何ORF中產生突變的方 法,這些相同的方法可以用於改變這些同樣的ORF的表達水平。如何實現這一點的實例包 括但不限於所述ORF的多個拷貝整合到小雙孢菌PTA 5024基因組的任何地方,改變控制所 述ORF的表達的啟動子,除去幹擾它們的表達的反義RNA或轉錄終止子。最後,用於將突變的等位基因導入小雙孢菌PTA5024中的載體、所述供體和接受 體菌株的接合和培養的條件、挑選和篩選外接合體和它們的衍生物的方法中的改變都屬於 本發明的範圍內。實施例4-羊毛硫抗生素的體外滷化使用實施例2中提供的信息,mlb 0RF15(SEQ ID NO 16)在大腸桿菌中如下過表 達。通過用寡聚物 5' -TTTTTCATATGGGTGGGAGTGATCGGCGGCG-3' (SEQ ID NO 26)和 5 『 -T TTTTGTCGACCTACTGCTGGCCGCGGTCCGGACT-3『 (SEQ ID NO 27)擴增獲得的 1. 6kb片段用 NcoI 和SalI消化,連接到預先用NcoI和XhoI消化的pET22b。在轉化大腸桿菌DH5 α細胞之 後,可通過用NdeI和XhoI消化後5. 5kb和1. 6kb片段的存在來識別的、產生的質粒pHAL 被導入大腸桿菌BL21(DE3)細胞。帶有pHAL的大腸桿菌BL21(DE3)細胞的培養物在LB中 在20°C生長到0.6的0D600。然後,IPTG添加到ImM,細胞進一步生長6h。收穫細胞,通過 超聲處理破裂,從Ni-瓊脂糖柱回收His標籤標記的0RF15多肽。進行底物例如乳鏈球菌 素481或97518的滷化,通過MS分析確定羊毛硫抗生素的氯衍生物的形成。以上實施例用來說明原理和方法,通過所述原理和方法在SEQ ID NO :2到18指定 的那些中選擇的任何ORF可以在方便的宿主中過表達,產生過量生產的酶並用於將羊毛硫 抗生素天然產物轉化成不同的化合物。本領域技術人員將想到的是,0RF15(SEQ ID NO 16) 僅僅是用作過量生產SEQID NO :1編碼的任何多肽的方法的實例。本領域技術人員還理解 的是,過量生產蛋白質的其他方法包括但不限於利用不同的親和標籤、利用不同的載體、不 同的宿主菌株和誘導方法也可以用於過量產生ORF 1到17 (SEQ IDNO 2到18)指定的多 肽。本領域技術人員將想到的是,含有或沒有色氨酸殘基的其他羊毛硫抗生素底物可 以用於通過0RF15(SEQ ID N0:16)添加氯原子。本領域技術人員還將想到的是,mlb聚簇 (SEQ ID NO 1)指定的其他ORF多肽可以用於其他羊毛硫抗生素前原肽的翻譯後修飾。可 以用於這個目的的ORF多肽包括但不限於0RF2 (SEQ ID NO 3)。特別地,ORF 7和8 (SEQ IDNO 8和9)可用於在其他羊毛硫抗生素前原肽中脫水和引入硫醚鍵;0RF9和16 (SEQ ID NO :10和17)可以用於使其他含有C-末端Cys殘基的羊毛硫抗生素脫羧基;ORF 2 (SEQ ID NO 3)可以用於羥化其他含有脯氨酸的羊毛硫抗生素。
實施例5-mlb聚簇在異源宿主中的表達使用實施例1和2中提供的信息,含有所有mlb聚簇(SEQ ID NO 1)的粘粒1G6 (附 圖1)通過如Kieser et al.,2000所描述的接合來導入白色鏈黴菌(Sti^ptomyces albus) 中。安普黴素抗性接合後體在合適的條件下生長,如所述純化107891。本領域技術人員還理解白色鏈黴菌僅是一種生產者菌株,其他菌株也可以用於導 入全部mlb聚簇(SEQ ID NO=D和用於107891的生產。優選的宿主細胞是可以有效地表 達放線菌基因的那些物種或菌株。這樣的宿主包括但不限於放線菌目,鏈孢囊菌科、小單 孢菌科、假諾卡氏菌科和鏈黴菌科,小雙孢菌屬、遊動放線菌屬、遊動單胞菌屬、鏈黴菌屬等 等。本領域技術人員理解只要適合的啟動子置於mlb操縱子前,生產宿主不必限於可有效 地表達放線菌基因的那些細胞。這後一類別的適合的生產宿主可以在易於遺傳學操作的那 些、或天然地生產其他羊毛硫抗生素的那些中找到。這樣的生產宿主的實例包括但不限於 大腸桿菌和相關物種,芽胞桿菌、鏈球菌、乳桿菌、葡萄球菌等等。本領域技術人員還理解,使用在該實施例中描述的方法,mlb聚簇可以作為第二拷 貝被導入原始的107891生產者菌株小雙孢菌PTA 5024,其中mlb基因的第二拷貝將提高 107891的產量。本領域技術人員還理解不同的載體、導入mlb聚簇的不同方法、選擇帶有mlb聚簇 的重組克隆的不同的方法、生長所述重組克隆的不同方法和條件、檢測107891生產的不同 方法對於mlb聚簇在異源宿主中的表達是有效的。實施例6-107891變體文庫的產生使用實施例2、3和5中提供的信息,如下修飾mlb ORF 6 (SEQ ID NO :7)來 產生107891的變體。首先,利用片段A的寡聚物5 『 -GCAGCCAGGCTCGCACCGGC-3 『和 CGCCCGTAACGAGCGA (SEQ ID NO 28 和 29)和片段 B 的寡聚物 5' -GCAGCTTCTGCTGCTGA-3 『 和 5' -TCCCGGCCAGCCACTT-3 『 (SEQ ID NO 30 和 31)根據實施例 3 的方法擴增 0RF6 來構建在ORF 6 (SEQ ID NO 7)中帶有符合讀框的缺失的載體。產生的構建體用於根 據實施例3的方法置換如實施例5中所描述獲得的白色鏈黴菌菌株中的0RF6,產生 SA-D6 菌株。然後,通過用寡聚物 5' -CCGGAAAGGAGCGAGCATATG-3 『 (SEQ ID NO 32)禾口 5' -CAGATCTGCCAATACAGT-3『 (SEQ ID NO :33)擴增獲得的 mlb 0RF6 (SEQ ID NO 7)的 前肽部分用NdeI和BglII消化並連接到用NdeI和BglII預先消化的pIJ8600 (Kieser et al. ,2000)產生質粒pPREl。在平行的實驗中,寡聚物A 5' -C GGT GTC GAG GAG ATC ACCGCC GGG CCG GCG NNN NNN AGC NNN NNN NNN TGC ACC NNNNNN TGC NNN AGC NNN NNN NNN NNN AGC NNN TGC AGC NNNTGC TGC TGA AGA TCT-3『和寡聚物B 5' -T TCA GCA GCA NNN GCT GCANNN GCT NNN NNN NNN NNN GCT NNN GCA NNN NNN GGT GCANNN NNN NNN GCT NNN NNN CGC CGG CCC GGC GGT GAT CTC CTCGAC ACC GAT CGA-3 『 (SEQ ID 34 和 35)被變 性和退火來產生DNA片段(SEQ ID NO 36)的混合物,其編碼多肽,所述多肽具有在預計涉 及硫醚形成的0RF6多肽的原肽區域(特別是胺基酸3、7、8、11、13、18、20、21、23和24)的 胺基酸序列中所有可能的改變。這種DNA片段的混合物連接到預先用BSA OI和BglII消 化的質粒PPRE1,來產生質粒的文庫,所述質粒的文庫帶有融合到編碼前導肽的0RF6片段 的、編碼原肽的0RF6片段的所有可能的變體形式(預期(甲基)羊毛硫氨酸橋)。該質粒 文庫被導入SA-D6菌株中,在存在μ g/ml硫鏈絲菌肽的情況下生長產生的接合外體通過生物學分析或HPLC分析來篩選107891變體的產生。通過測序0RF6變體的原肽部分和通過 結構推測來進一步表徵感興趣的變體。本領域技術人員理解0RF6多肽的前導肽部分也可以被修飾,只要在翻譯後修飾 中涉及的酶(SEQ ID N0:8和9)可以識別所述不同的前導肽。在0RF6多肽的前導肽部分 中的改變屬於本發明的範圍。本領域技術人員將想到的是其他方法可以用於構建ORF 6變體的文庫,包括但不 限於使用不同的寡聚物、載體、誘導系統和宿主菌株。此外,本領域技術人員理解甲基羊毛 硫氨酸殘基可以被羊毛硫氨酸殘基置換,反之亦然,產生另外的ORF 6變體。本領域技術人 員還理解的是定點誘變可以用於產生導致指定的107891衍生物的生產的ORF 6的選定的 變體。
權利要求
一種分離的核酸,包含選自以下序列組成的組中的核苷酸序列a)編碼107891和其同系物的合成所需的多肽的mlb基因簇(SEQ ID NO1);b)編碼由mlb基因簇(SEQ ID NO1)編碼的相同多肽、與mlb基因簇的核苷酸序列不同的核苷酸序列;c)mlb ORF 1到17的任何核苷酸序列,編碼由SEQ ID NO2到18編碼的多肽;和d)編碼由mlb OFR 1到17的任一個編碼的相同的多肽(SEQ ID NO2到18)、與所述ORF的核苷酸序列不同的核苷酸序列。
2.一種分離的核酸,包含選自以下序列組成的組中的核苷酸序列e)編碼一多肽的核苷酸序列,所述多肽在其全長上在胺基酸序列上與mlbORF 2、6到 9、15到16 (SEQ ID NO :3、7到10、16到17)的任一個編碼的多肽具有至少65%、至少86%、 至少90%和至少95%或更高的相同性。
3.根據權利要求1或2的分離的核酸,包含編碼由mlb0RF6 (SEQ ID NO :7)組成的、 107891前原肽的合成所需的多肽的核苷酸序列、或編碼相同的多肽的但不同於所述ORF的 核苷酸序列的核苷酸序列的組合。
4.根據權利要求1或2的分離的核酸,包含由mlbORF 9和16 (SEQ IDN0:10和17)組 成的、編碼0RF6多肽的C-末端Cys殘基的氧化脫羧作用所需的多肽的核苷酸序列、或編碼 相同的多肽的但不同於所述ORF的核苷酸序列的核苷酸序列的組合。
5.根據權利要求1或2的分離的核酸,包含由mlbORF 7和8 (SEQ IDNO 8和9)組成 的、編碼107891原肽部分的脫水和(甲基)羊毛硫氨酸形成所需的多肽的核苷酸序列、或 編碼相同多肽的但不同於所述ORF的核苷酸序列的核苷酸序列的組合。
6.根據權利要求1或2的分離的核酸,包含由mlbORF 15 (SEQ ID NO 16)組成的、編 碼胺基酸4的芳香族殘基的氯化所需的多肽的核苷酸序列、或編碼相同的多肽的但不同於 所述ORF的核苷酸序列的核苷酸序列的組合。
7.根據權利要求1或2的分離的核酸,包含由mlbORF 2 (SEQ ID NO 3)組成的、編碼 107891的胺基酸14的脯氨酸殘基的羥基化所需的多肽的核苷酸序列、或編碼相同的多肽 的但不同於所述ORF的核苷酸序列的核苷酸序列的組合。
8.根據權利要求1或2的分離的核酸,包含由mlbORF 1、10、11、13、14和17 (SEQ ID NO :2、11、14、15和18)組成的、編碼107891或某些它的前體向細胞質外的輸出所需的和賦 予生產菌株對107891的抗性所需的多肽的核苷酸序列、或編碼相同的多肽的但不同於所 述ORF的核苷酸序列的核苷酸序列的組合。
9.根據權利要求1或2的分離的核酸,包含由mlbORF 3和5 (SEQ ID NO :4和6)組 成的、編碼調節mlb基因簇的一個或更多個基因的表達所需的多肽的核苷酸序列、或編碼 相同的多肽的但不同於所述ORF的核苷酸序列的核苷酸序列的組合。
10.根據權利要求1或2的分離的核酸,包含由編碼107891的合成所需的多肽的mlb 基因簇組成的核苷酸序列,其中符合讀框的缺失被導入到編碼脯氨酸殘基的羥基化所需的 多肽的核苷酸序列中。
11.根據權利要求1或2的分離的核酸序列,包含帶有以下序列的至少一個額外拷貝的 核苷酸序列mlb ORF 1到17 (SEQ ID NO 2到18)中至少一個或編碼與所述mlb ORF所編 碼的相同多肽的但不同於所述mlb ORF的核苷酸序列的核苷酸序列。
12.權利要求1到11任一項的分離的核酸,其中所述核苷酸序列是DNA序列。
13.重組DNA載體,其包含權利要求12中定義的DNA序列。
14.用權利要求13的載體轉化的宿主細胞。
15.根據權利要求14的轉化的宿上細胞,其屬於放線菌目。
16.根據權利要求15的轉化的宿主細胞,其屬於選自鏈孢囊菌科、小單孢菌科、假諾卡 氏菌科和鏈黴菌科的科。
17.根據權利要求16的轉化的宿主細胞,其屬於選自小雙孢菌屬、遊動放線菌屬、遊動 單胞菌屬、鏈黴菌屬等等的屬。
18.根據權利要求14的轉化的宿主細胞,其屬於芽孢桿菌目。
19.根據權利要求18的轉化的宿主細胞,其屬於選自芽胞桿菌科、乳桿菌科、鏈球菌科 或葡萄球菌科的科。
20.根據權利要求19的轉化的宿主細胞,其屬於選自芽胞桿菌屬、乳桿菌屬、鏈球菌 屬、葡萄球菌屬等等的屬。
21.根據權利要求14的轉化的宿主細胞,其屬於大腸桿菌物種。
22.一種通過生物合成途徑的方式通過能夠生產107891或其前體的微生物提高 107891或其同系物的生產的方法,所述方法包括-用權利要求13的重組DNA載體轉化通過生物合成途徑生產107891或107891前體的 微生物,其中所述DNA載體編碼在所述途徑中速度限制型活性的表達;_在適於細胞生長的條件下培養用所述載體轉化的所述微生物,表達所述基因並產生 所述抗生素或抗生素前體。
23.—種生產107891或其同系物或其前體或衍生物的轉化的微生物,其中在其基因組 中107891生物合成基因已經通過插入權利要求10的核苷酸序列而被修飾。
24.一種生產107891或其前體或衍生物的方法,其包括培養權利要求23的轉化的 107891生產微生物。
25.一種在基因組中具有107891生物合成基因的轉化的107891生產微生物,其中選自 mlb ORF 1到17 (SEQ ID NO 2到18)的107891生物合成基因的至少一個被破壞。
26.根據權利要求25的轉化的微生物,其中被破壞的生物合成基因是涉及氯殘基的附著的基因。
27.一種生產107891前體或衍生物的方法,其包括權利要求25的轉化的107891生產 微生物。
28.—種生產不同於107891或其前體的羊毛硫抗生素的方法,所述方法包括-用重組DNA載體轉化通過生物合成途徑產生不同於107891或其前體的羊毛硫抗生素 或羊毛硫抗生素前體的微生物,所述載體或其部分包含權利要求1到11任一項的核苷酸序 列,所述核苷酸序列編碼修飾所述羊毛硫抗生素或羊毛硫抗生素前體的酶活性的表達;和-在適合於細胞生長的條件下培養用所述載體轉化的所述微生物,表達所述基因並產 生所述抗生素或抗生素前體。
29.分離的多肽,選自-由mlb ORF 1到17 (SEQ ID NO 2到18)的任一個編碼的ORF多肽;禾口-選自由在胺基酸序列上與mlb ORF 1到17 (SEQ ID NO 2到18)的任一個編碼的ORF多肽具有至少65%相同性的多肽、具有至少90%相同性的多肽和具有至少95%或更高的 相同性的多肽組成的組中的多肽。
30.權利要求29的分離的多肽,其是mlbORF 2、6到9、15到16 (SEQ ID N0:3、7到10、 16到17)的任一個。
31.權利要求29的分離的多肽,包含mlbORF 2、6到9、15到16 (SEQ ID N0:3、7到10、 16到17)的任一個編碼的mlb ORF多肽,或選自由在胺基酸序列上與所述mlb ORF的任一 個編碼的多肽具有至少65%相同性的多肽、具有至少90%相同性的多肽和具有至少95% 或更高的相同性的多肽組成的組中的多肽。
32.權利要求29的分離的多肽,包含mlbORF UlO到11、13到14禾口 17 (SEQ ID NO 2、11到12、14到15和18)的任一個編碼的mlb ORF多肽,或選自由在胺基酸序列上與所述 mlb ORF的任一個編碼的多肽具有至少65%相同性的多肽、具有至少90%相同性的多肽和 具有至少95%或更高的相同性的多肽組成的組中的多肽。
33.權利要求29的分離的多肽,包含mlbORF 3和5 (SEQ ID NO :4和6)的任一個編 碼的mlb ORF多肽,或選自由在胺基酸序列上與所述mlbORF的任一個編碼的多肽具有至少 65%相同性的多肽、具有至少90%相同性的多肽和具有至少95%或更高的相同性的多肽 組成的組中的多肽。
34.分離的多肽,包含選自權利要求1到12任一項的任何核酸所編碼的多肽的、涉及 107891的生物合成途徑的多肽。
全文摘要
本發明涉及羊毛硫抗生素領域,更特別地涉及編碼羊毛硫抗生素107891和其同系物的生物合成途徑所需的酶的核酸分子的分離。
文檔編號C12N15/76GK101939328SQ200780100776
公開日2011年1月5日 申請日期2007年8月3日 優先權日2007年8月3日
發明者D·梅爾科裡洛, M·索西奧, S·塞麗娜, S·多納迪奧 申請人:森蒂內拉製藥公司

同类文章

一種新型多功能組合攝影箱的製作方法

一種新型多功能組合攝影箱的製作方法【專利摘要】本實用新型公開了一種新型多功能組合攝影箱,包括敞開式箱體和前攝影蓋,在箱體頂部設有移動式光源盒,在箱體底部設有LED脫影板,LED脫影板放置在底板上;移動式光源盒包括上蓋,上蓋內設有光源,上蓋部設有磨沙透光片,磨沙透光片將光源封閉在上蓋內;所述LED脫影

壓縮模式圖樣重疊檢測方法與裝置與流程

本發明涉及通信領域,特別涉及一種壓縮模式圖樣重疊檢測方法與裝置。背景技術:在寬帶碼分多址(WCDMA,WidebandCodeDivisionMultipleAccess)系統頻分復用(FDD,FrequencyDivisionDuplex)模式下,為了進行異頻硬切換、FDD到時分復用(TDD,Ti

個性化檯曆的製作方法

專利名稱::個性化檯曆的製作方法技術領域::本實用新型涉及一種檯曆,尤其涉及一種既顯示月曆、又能插入照片的個性化檯曆,屬於生活文化藝術用品領域。背景技術::公知的立式檯曆每頁皆由月曆和畫面兩部分構成,這兩部分都是事先印刷好,固定而不能更換的。畫面或為風景,或為模特、明星。功能單一局限性較大。特別是畫

一種實現縮放的視頻解碼方法

專利名稱:一種實現縮放的視頻解碼方法技術領域:本發明涉及視頻信號處理領域,特別是一種實現縮放的視頻解碼方法。背景技術: Mpeg標準是由運動圖像專家組(Moving Picture Expert Group,MPEG)開發的用於視頻和音頻壓縮的一系列演進的標準。按照Mpeg標準,視頻圖像壓縮編碼後包

基於加熱模壓的纖維增強PBT複合材料成型工藝的製作方法

本發明涉及一種基於加熱模壓的纖維增強pbt複合材料成型工藝。背景技術:熱塑性複合材料與傳統熱固性複合材料相比其具有較好的韌性和抗衝擊性能,此外其還具有可回收利用等優點。熱塑性塑料在液態時流動能力差,使得其與纖維結合浸潤困難。環狀對苯二甲酸丁二醇酯(cbt)是一種環狀預聚物,該材料力學性能差不適合做纖

一種pe滾塑儲槽的製作方法

專利名稱:一種pe滾塑儲槽的製作方法技術領域:一種PE滾塑儲槽一、 技術領域 本實用新型涉及一種PE滾塑儲槽,主要用於化工、染料、醫藥、農藥、冶金、稀土、機械、電子、電力、環保、紡織、釀造、釀造、食品、給水、排水等行業儲存液體使用。二、 背景技術 目前,化工液體耐腐蝕貯運設備,普遍使用傳統的玻璃鋼容

釘的製作方法

專利名稱:釘的製作方法技術領域:本實用新型涉及一種釘,尤其涉及一種可提供方便拔除的鐵(鋼)釘。背景技術:考慮到廢木材回收後再加工利用作業的方便性與安全性,根據環保規定,廢木材的回收是必須將釘於廢木材上的鐵(鋼)釘拔除。如圖1、圖2所示,目前用以釘入木材的鐵(鋼)釘10主要是在一釘體11的一端形成一尖

直流氧噴裝置的製作方法

專利名稱:直流氧噴裝置的製作方法技術領域:本實用新型涉及ー種醫療器械,具體地說是ー種直流氧噴裝置。背景技術:臨床上的放療過程極易造成患者的局部皮膚損傷和炎症,被稱為「放射性皮炎」。目前對於放射性皮炎的主要治療措施是塗抹藥膏,而放射性皮炎患者多伴有局部疼痛,對於止痛,多是通過ロ服或靜脈注射進行止痛治療

新型熱網閥門操作手輪的製作方法

專利名稱:新型熱網閥門操作手輪的製作方法技術領域:新型熱網閥門操作手輪技術領域:本實用新型涉及一種新型熱網閥門操作手輪,屬於機械領域。背景技術::閥門作為流體控制裝置應用廣泛,手輪傳動的閥門使用比例佔90%以上。國家標準中提及手輪所起作用為傳動功能,不作為閥門的運輸、起吊裝置,不承受軸向力。現有閥門

用來自動讀取管狀容器所載識別碼的裝置的製作方法

專利名稱:用來自動讀取管狀容器所載識別碼的裝置的製作方法背景技術:1-本發明所屬領域本發明涉及一種用來自動讀取管狀容器所載識別碼的裝置,其中的管狀容器被放在循環於配送鏈上的文檔匣或託架裝置中。本發明特別適用於,然而並非僅僅專用於,對引入自動分析系統的血液樣本試管之類的自動識別。本發明還涉及專為實現讀