新四季網

產生碳氫化合物的方法和組合物的製作方法

2023-10-17 20:47:59 2

專利名稱:產生碳氫化合物的方法和組合物的製作方法
產生碳氫化合物的方法和組合物相關申請的交叉引用本申請要求2008年5月16日提交的美國臨時申請第61/053955號的優先權,在 此將其內容全部併入。
背景技術:
石油是地球上發現的、液體、氣體或固體形式的有限的天然資源。石油主要由 碳氫化合物組成,碳氫化合物主要由碳和氫組成。石油還含有大量的處於不同形式的其 他元素,例如氮、氧或硫。石油是寶貴資源,但是以相當大的金融和環境代價對石油產品進行開發。首 先,必須發現石油資源。石油勘探是耗資並有風險的投資。勘探深水井的費用可以超過 1億美元。此外,不能保證這些井會含有石油。據估計,僅40%的鑽井成為產生商業碳 氫化合物的生產井。除經濟費用外,石油勘探存在嚴重的環境代價。例如近海勘探擾亂 周圍海洋環境。發現生產井後,必須以巨大代價從地球開採石油。在初次採收(primary recovery)中,地下的自然壓力足以開採約20%的井中石油。當該自然壓力降低時,如果 經濟上合算,則使用二次採收(secondrecovery)。通常,二次採收涉及通過例如水注射、 天然氣注射或氣舉等增加井壓。使用二次採油,採收到另外5%至15%的石油。一旦二 次採收方法不起作用,如果經濟上合算,可以使用三次採收方法。三次方法涉及降低石 油的粘度以使其更易開採。使用三次採收方法,採收到另外5%至15%的石油。因此, 即使在最佳條件下,僅可以開採50%的井中石油。石油開採也存在環境代價。例如,石 油開採可以導致大量石油滲漏上升至表面。此外,近海鑽井涉及挖掘河床,這擾亂或破 壞周圍海洋環境。因為石油礦藏不是在地球各處均勻發現的,所以石油必須從石油產生區長距離 運輸到石油消耗區。除運輸費用外,還存在大規模油洩漏的環境風險。從地球開採的原油在天然形式時具有少數商業用途。其是具有不同長度和復 雜性的碳氫化合物(例如,石蠟(或烷)、烯烴(或烯)、炔、環烷(napthenes)(或環烷 (cylcoalkanes))>脂肪族化合物、芳香族化合物等)的混合物。此外,原油含有其他有機 化合物(例如含有氮、氧、硫等的有機化合物)和雜質(例如硫磺、鹽、酸、金屬等)。因此,在商業上可以使用前,必須提煉並純化原油。由於其高能量密度及其便 利的可運輸性,大部分石油被提煉為燃料,例如運輸燃料(例如汽油、柴油、航空燃料 等)、燃用油、液化石油氣等。原油還是用於產生石化產品的原材料的主要來源。兩類主要的來自石油的原材 料是短鏈烯烴(例如乙烯和丙烯)和芳香族化合物(例如苯和二甲苯異構體)。這些原材 料來源於原油中較長鏈的碳氫化合物,這是通過以相當大的費用使用各種方法,例如催 化裂化、蒸汽裂化或催化重整,裂化原油。這些原材料用於製造不能直接從原油提煉的 石化產品,例如單體、溶劑、去垢劑或粘合劑。來源於原油的原材料的一個實例是乙烯。 乙烯被用於生產石化產品,例如聚乙烯、乙醇、氧化乙烯、乙二醇、聚酯、乙二醇醚、乙氧基化物、乙酸乙烯酯、1,2-二 氯乙烷、三氯乙烯、四氯乙烯、氯乙烯和聚氯乙烯。原材料的其他實例是丙烯,丙烯用 於生產異丙醇、丙烯腈、聚丙烯、氧化丙烯、丙烯二醇、乙二醇醚、丁烯、異丁烯、1, 3_ 丁二烯、合成橡膠、聚烯烴、α-烯烴、脂肪醇、丙烯酸、丙烯聚合物、氯化丙烯、 環氧氯丙烷和環氧樹脂。然後,這些石化產品可以用於製造特種化學品,例如塑料、樹脂、纖維、橡 膠、藥品、潤滑劑或凝膠。可以產自石化材料的具體特種化學品為脂肪酸、碳氫化合 物(例如長鏈、支鏈、飽和的、不飽和的等)、脂肪醇、酯、脂肪醛、酮、潤滑劑等。特種化學品具有很多商業用途。脂肪酸在商業上被用作表面活性劑,例如在去 垢劑和肥皂中。它們還可以被用作燃料中的添加劑、潤滑油、塗料、漆、蠟燭、色拉 油、起酥油、化妝品和乳化劑。此外,在橡膠產品中脂肪酸被用作促進劑活性劑。脂肪 酸還可以被用作生產甲基酯、醯胺、胺、醯基氯、酐、乙烯酮二聚物以及過氧酸和酯的 原料。碳氫化合物具有很多商業用途。例如鏈較短的烷被用作燃料。甲烷和乙烷是天 然氣的主要成分。鏈較長的烷(例如5至16個碳)被用作運輸燃料(例如汽油、柴油或航 空燃料)。具有多於16個碳原子的烷是燃油和潤滑油的重要組分。即使在室溫下為固體 的較長的烷也可以被用作,例如石蠟。含有約35個碳的烷見於用於路面(road surfacing) 的浙青中。此外,可以裂化較長鏈的烷以生產商業上有用的較短鏈的碳氫化合物。與短鏈烷類似,短鏈烯被用於運輸燃料中。較長鏈的烯被用於塑料、潤滑劑和 合成潤滑劑中。此外,烯被用作生產醇類、酯、增塑劑、表面活性劑、叔胺、增強型採 油劑(enhanced oil revovery agent)、脂肪酸、硫醇、烯基琥珀酸酐、環氧化物、氯化烷、 氯化烯、蠟、燃油添加劑和粘性流減阻劑。脂肪醇具有很多商業用途。鏈較短的脂肪醇在化妝品和食品工業中,用作乳化 齊U、潤滑劑和增稠劑。由於其兩性分子屬性,脂肪醇起非離子表面活性劑的作用,所述 非離子表面活性劑可用作去垢劑。此外,脂肪醇被用於蠟、樹膠、樹脂、藥物軟膏和 洗劑、潤滑油添加劑、紡織品抗靜電和整理劑、增塑劑、化妝品、工業溶劑和脂肪溶劑 中。酯具有很多商業用途。例如作為替代燃料的生物柴油是由酯(例如脂肪酸甲基 酯、脂肪酸乙基酯等)組成。一些低分子量的酯是揮發性的,具有令人愉悅的氣味,這 使得它們可用作芳香劑或調味劑。另外,酯被用作漆、塗料和清漆的溶劑。此外,一 些天然存在的物質,例如蠟、脂肪和油是由酯組成的。酯還被用作樹脂和塑料中的軟化 齊U、增塑劑、滅火劑以及汽油和油中的添加劑。此外,酯可以用於製造聚合物、膠片、 紡織品、染料和藥品。醛用於生產很多特種化學品。例如,醛用於生產聚合物、樹脂(例如膠木 (Bakelite))、染料、調味劑、增塑劑、香水、藥品和其他化學品。一些被用作溶劑、防 腐劑或消毒劑。一些天然和合成的化合物,例如維生素和激素是醛。此外,很多糖含有酸基。酮在商業上被用作溶劑。例如, 丙酮常常被用作溶劑,但其也是製造聚合物的 原材料。酮還用於漆、塗料、爆炸物、香水和紡織品加工中。此外,酮用於生產醇、烯、烷、亞胺和烯胺。此外,原油是潤滑劑的來源。來自石油的潤滑劑通常由烯烴組成,特別是聚烯烴和α-烯烴。潤滑劑可以從原油提煉或使用提煉自原油的原材料生產。從原油獲得這些特種化學品需要大量的金融投資以及大量的能量。因為原油中 的長鏈碳氫化合物常常被裂化以產生較小的單體,其也是低效的過程。這些單體然後被 用作生產更複雜的特種化學品的原材料。除勘探、開採、運輸和提鍊石油的問題外,石油是有限的並逐漸減少的資源。 估計世界石油消耗為每年300億桶。據估計,以現有生產水平,世界石油儲量預計在 2050年前會耗竭。最後,基於石油的燃料的燃燒釋放溫室氣體(例如二氧化碳)和其他形式的空氣 汙染(例如一氧化碳、二氧化硫等)。隨著世界對燃料需求的增加,溫室氣體和其他形式 的空氣汙染的排放也增加。大氣中溫室氣體的累積導致增加全球變暖。因此,除局部破 壞環境外(例如油洩漏、海洋環境的挖掘等),燃燒石油還破壞全球環境。由於石油所引起的內在挑戰,存在對於不需要像石油一樣被勘探、開採、長距 離運輸或大量提煉的可再生石油資源的需要。存在對於可以經濟地生產而不會產生石油 工業和基於石油的燃料的燃燒所產生的類型的環境破壞的可再生石油資源。基於相似原 因,還存在對於通常來自石油的化學品的可再生資源的需要。發明_既述本發明至少部分基於編碼碳氫化合物生物合成多肽的藍細菌基因的鑑定。因 此,在一方面,本發明特徵為產生碳氫化合物的方法,所述方法包括在宿主細胞中產生 包含 SEQ ID NO: 2、4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、 34或36的胺基酸序列的多肽或其變體,並從所述宿主細胞分離所述碳氫化合物。在一些實施方案中,所述多肽包含與SEQ ID NO 2、4、6、8、10、12、14、 16、18、20、22、24、26、28、30、32、34 或 36 具有至少約 70 %、至少約 80%、至少 約85%、至少約90%、至少約91%、至少約92%、至少約93%、至少約94%、至少約 95%,至少約96%、至少約97%、至少約98%或至少約99%的同一性的胺基酸序列。在一些實施方案中,所述多肽包含具有一個或多個胺基酸取代、添加、插入或 缺失的 SEQ ID NO: 2、4、6、8、10、12、14、16、18、20、22、24、26、28、30、 32、34或36的胺基酸序列。在一些實施方案中,所述多肽具有脫羰酶活性。在其他實施 方案中,所述多肽包含具有一個或多個保守型胺基酸取代的SEQ ID NO: 2、4、6、8、 10、12、14、16、18、20、22、24、26、28、30、32、34 或 36 的胺基酸序列。例如,所 述多肽包含一個或多個以下保守型胺基酸取代諸如丙氨酸、纈氨酸、亮氨酸和異亮氨 酸的脂肪族胺基酸被另一脂肪族胺基酸替換;絲氨酸被蘇氨酸替換;蘇氨酸被絲氨酸替 換;諸如天冬氨酸和穀氨酸的酸性殘基被另一酸性殘基替換;諸如天冬醯胺和穀氨醯胺 的攜帶醯胺基的殘基被另一攜帶醯胺基的殘基替換;諸如賴氨酸和精氨酸的鹼性殘基被 另一鹼性殘基交換;以及諸如苯丙氨酸和酪氨酸的芳香族殘基被另一芳香族殘基替換。 在一些實施方案中,所述多肽具有約1、2、3、4、5、6、7、8、9、10、15、20、30、 40、50、60、70、80、90、100或更多的胺基酸取代、添加、插入或缺失。在一些實施方 案中,所述多肽具有脫羰酶活性。
在其他實施方案中,所述多肽包含以下的胺基酸序列(i)SEQIDNO: 37或 SEQ ID NO 38 或 SEQ ID NO 39 ;或(ii) SEQ ID NO 40 以及(a) SEQ ID NO 37、 (b) SEQ ID NO 38 和(c) SEQ ID NO 39 中的任一個;或(iii) SEQ ID NO 41 或 SEQ
ID NO 42或SEQ ID NO 43或SEQ IDNO 44。在某些實施方案中,所述多肽具有脫
羰酶活性。在另一方面,本發明特徵為產生碳氫化合物的方法,所述方法包括在宿主細胞 中表達多核苷酸,所述多核苷酸包含與SEQ ID NO: 1、3、5、7、9、11、13、15、17、 19、21、23、25、27、29、31、33 或 35 具有至少約 70%、至少約 75%、至少約 80%、 至少約85%、至少約90%、至少約91%、至少約92%、至少約93%、至少約94%、至 少約95%、至少約96%、至少約97%、至少約98%或至少約99%的序列同一性的核苷酸 序列。在一些實施方案中,所述核苷酸序列是SEQ ID NO 1、3、5、7、9、11、13、 15、17、19、21、23、25、27、29、31、33或35。在一些實施方案中,所述方法還包含 從所述宿主細胞分離所述碳氫化合物。在其他實施方案中,所述核苷酸序列與SEQIDNO 1、3、5、7、9、11、13、 15、17、19、21、23、25、27、29、31、33或35的互補物或其片段雜交,例如,在低嚴
緊性、中嚴緊性、高嚴緊性或非常高的嚴緊性條件下。在其他實施方案中,所述核苷酸序列編碼包含以下的多肽(i)SEQIDNO: 2、4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34 或 36 的胺基酸序 列;或(ii)具有一個或多個胺基酸取代、添加、插入或缺失的SEQ ID NO: 2、4、6、 8、10、12、14、16、18、20、22、24、26、28、30、32、34 或 36 的胺基酸序列。在一 些實施方案中,所述多肽包含具有一個或多個保守型胺基酸取代的SEQ ID NO: 2、4、
6、8、10、12、14、16、18、20、22、24、26、28、30、32、34或 36 的胺基酸序列。在 一些實施方案中,所述多肽具有脫羰酶活性。在其他實施方案中,所述核苷酸序列編碼與包含SEQ IDNO 2、4、6、8、 10、12、14、16、18、20、22、24、26、28、30、32、34 或 36 的胺基酸序列的多肽具有 相同生物活性的多肽。在一些實施方案中,所述核苷酸序列是SEQ ID NO : 1、3、5、
7、9、11、13、15、17、19、21、23、25、27、29、31、33或 35,或其片段。在其他實 施方案中,所述核苷酸序列與 SEQIDN0 1、3、5、7、9、11、13、15、17、19、21、 23、25、27、29、31、33或35的互補物或其片段雜交,例如在低嚴緊性、中嚴緊性、高 嚴緊性或非常高的嚴緊性條件下。在一些實施方案中,所述生物活性是脫羰酶活性。在一些實施方案中,所述方法包括用重組載體轉化宿主細胞,所述重組載體包 含與 SEQ ID NO: 1、3、5、7、9、11、13、15、17、19、21、23、25、27、29、31、33 或35具有至少約70%、至少約75%、至少約80%、至少約85%、至少約90%、至少 約91%、至少約92%、至少約93%、至少約94%、至少約95%、至少約96%、至少約 97%,至少約98%或至少約99%的序列同一性的核苷酸序列。在一些實施方案中,所 述重組載體還包含可操作地連接到所述核苷酸序列的啟動子。在一些實施方案中,所述 啟動子是發育調節性、細胞器特異性、組織特異性、誘導型、組成型或細胞特異性啟動 子。在具體實施方案中,所述重組載體包含至少一個選自以下的序列 (a)可操作地連接 到所述核苷酸序列的調節序列;(b)可操作地連接到所述核苷酸序列的選擇標記;(c)可操作地連接到所述核苷酸序列的標記序列;(d)可操作地連接到所述核苷酸序列的純化部分;(e)可操作地連接到所述核苷酸序列的分泌序列;和(f)可操作地連接到所述核苷 酸序列的引導序列(targeting sequence)。在某些實施方案中,所述核苷酸序列被穩定併入 所述宿主細胞的基因組DNA,並且所述核苷酸序列的表達受可調型啟動子區的控制。在本文所述的任何方面中,所述宿主細胞可以選自哺乳動物細胞、植物細胞、 昆蟲細胞、酵母細胞、真菌細胞、絲狀真菌細胞和細菌細胞。在一些實施方案中,所述宿主細胞是革蘭氏陽性細菌細胞。在其他實施方案 中,所述宿主細胞是革蘭氏陰性細菌細胞。在一些實施方案中,所述宿主細胞選自以下的屬埃希氏菌屬(Escherichia)、 芽孢桿菌屬(Bacillus)、乳酸桿菌屬(Lactobacillus)、紅球菌屬(Rhodococcus)、假 單胞菌屬(Pseudomonas)、麴黴屬(Aspergillus)、木黴屬(Trichoderma)、鏈孢黴屬 (Neurospora)、鐮刀菌屬(Fusarium)、腐質黴屬(Humicola)、根毛黴屬(Rhizomucor)、 克魯維酵母菌屬(Kluyveromyces)、畢赤酵母屬(Pichia)、毛黴菌屬(Mucor)、蝕絲黴屬 (Myceliophtora)、青黴屬(Penicillium)、平革菌屬(Phanerochaete)、側耳屬(Pleurotus)、 栓菌屬(Trametes)、金黃孢子菌屬(Chrysosporium)、酵母屬(Saccharomyces)、寡養單胞 菌屬(Stenotrophamonas)、裂殖酵母屬(Schizosaccharomyces)、耳口 氏酵母屬(Yarrowia)或 鏈黴菌屬(Streptomyces)。在具體實施方案中,所述宿主細胞為遲緩芽孢桿菌(Bacillus lentus)細胞、短芽 孢桿菌(Bacillusbrevis)細胞、嗜熱脂肪芽孢桿菌(Bacillusstearothermophilus)細胞、地衣 芽孢桿菌(Bacilluslicheniformis)細胞、嗜鹼芽孢桿菌(Bacillusalkalophilus)細胞、凝結 芽孢桿菌(Bacillus coagulans)細胞、環狀芽孢桿菌(Bacillus circulans)細胞、短小芽孢杆 菌(Bacilluspumilis)細胞、蘇雲金芽孢桿菌(Bacillusthuringiensis)細胞、克勞氏芽孢桿菌 (Bacillusclausii)細胞、巨大芽孢桿菌(Bacillusmegaterium)細胞、枯草芽孢桿菌(Bacillus subtilis)細胞或解澱粉芽孢桿菌(Bacillusamyloliquefaciens)細胞。在其他實施方案中,宿主細胞為康氏木黴(Trichodermakoningii)細胞、綠色木 黴(Trichoderma viride)細胞、裡氏木黴(Trichodermareesei)細胞、長枝木黴(Trichoderma longibrachiatum)細胞、泡盛麴黴(Aspergillus awamori)細胞、煙麴黴(Aspergillus fomigates)細胞、臭麴黴(Aspergillus foetidus)細胞、構巢麴黴(Aspergillus nidulans) 細胞、黑麴黴(Aspergillusniger)細胞、米麴黴(Aspergillus oryzae)細胞、特異腐質 黴(Humicola insolens)細胞、棉毛狀腐質黴(Humicola lanuginose)細胞、混濁紅球菌 (Rhodococcusopacus)細胞、米黑根毛黴(Rhizomucormiehei)細胞或米黑毛酶(Mucor michei)細胞。在其他實施方案中,所述宿主細胞是淺青紫鏈黴菌(Streptomyces lividans)細 胞或鼠灰鏈黴菌(Streptomyces murinus)細胞。在其他實施方案中,宿主細胞是放線菌 (Actinomycetes)細胞。在一些實施方案中,所述宿主細胞是CHO細胞、COS細胞、VERO細胞、BHK 細胞、HeLa細胞、Cvl細胞、MDCK細胞、293細胞、3T3細胞或PC12細胞。在具體實施方案中,所述宿主細胞是大腸桿菌(E.coli)細胞、例如菌株B、菌株 C、菌株K或菌株W大腸桿菌細胞。
在其他實施方案中,所述宿主細胞是藍細菌宿主細胞。在具體實施方案中,所 述藍細菌宿主細胞是表1中列出的細胞。在一些實施方案中,所述碳氫化合物由所述宿主細胞分泌在某些實施方案中,所述宿主細胞超表達本文所述的底物。在一些實施方案 中,所述方法還包括用編碼本文所述的酶的核酸轉化宿主細胞,並且所述宿主細胞超表 達本文所述的底物。在其他實施方案中,所述方法還包括在至少一種本文所述的底物的 存在下培養所述宿主細胞。在一些實施方案中,所述底物是脂肪酸衍生物、醯基ACP、 脂肪酸、醯基CoA、脂肪醛、脂肪醇或脂肪酯。在一些實施方案中,所述脂肪酸衍生物底物是不飽和脂肪酸衍生物底物、單不 飽和脂肪酸衍生物底物或飽和脂肪酸衍生物底物。在其他實施方案中,所述脂肪酸衍生 物底物是直鏈脂肪酸衍生物底物、支鏈脂肪酸衍生物底物或包括環狀部分的脂肪酸衍生 物底物。在本文所述的方面的某些實施方案中,所產生的碳氫化合物是烷。在一些實施 方案中,所述烷是C3-C25烷。例如,所述烷是C3、C4> C5、C6> C7、C8> c9、C1Q、 Cll、Ci2、Ci3、C14 Λ Ci5、Ci6、Ci7、Ci8、C19 Λ C2C)、C2」 C22、C23、C24 或C25燒。在 一些實施方案中,所述烷是十三烷、甲基十三烷、十九烷、甲基十九烷、十七烷、甲基 十七烷、十五烷或甲基十五烷。在一些實施方案中,所述烷是直鏈烷、支鏈烷或環狀烷。在某些實施方案中,所述方法還包括在飽和脂肪酸衍生物的存在下培養宿主 細胞,並且所產生的碳氫化合物是烷。在某些實施方案中,所述飽和脂肪酸衍生物是 C6-C26脂肪酸衍生物底物。例如,所述脂肪酸衍生物底物是c6、c7、c8、c9、c10> cn、 Ci2、Ci3、C14 λ Ci5、Ci6、Ci7、Ci8、C19、C2C)、C2I Λ C22、C23、C24、C25 或C 26 脂肪酸衍 生物底物。在具體實施方案中,所述脂肪酸衍生物底物是2-甲基二十烷醛、二十烷醛、 十八烷醛、十四烷醛、2-甲基十八烷醛、硬脂醛或棕櫚醛。在一些實施方案中,所述方法還包括從所述宿主細胞或從培養基分離所述烷。 在其他實施方案中,所述方法還包括裂化或提煉所述烷。在本文所述的方面的某些實施方案中,所產生的碳氫化合物是烯。在一些實施 方案中,所述烯是C3-C25烯。例如,所述烯是C3、C4> C5、C6> C7、C8> c9、C1Q、 Cll、Ci2、Ci3、C14 Λ Ci5、Ci6、Ci7、Ci8、C19 Λ C2C)、C2」 C22、C23、C24 或C25烯。在 一些實施方案中,所述烯是十五烯、十七烯、甲基十五烯或甲基十七烯。在一些實施方案中,所述烯是直鏈烯、支鏈烷或環狀烯。在某些實施方案中,所述方法還包括在不飽和脂肪酸衍生物的存在下培養宿主 細胞,並且所產生的碳氫化合物是烯。在某些實施方案中,所述不飽和脂肪酸衍生物是 C6-C26脂肪酸衍生物底物。例如,所述脂肪酸衍生物底物是c6、c7、c8、c9、c10> cn、 C12、Ci3、C14 Λ Ci5、Ci6、Ci7、Ci8、C19、C2C)、C2I Λ C22、C23、C24、C25 或C 26 不飽和脂 肪酸衍生物底物。在具體實施方案中,所述脂肪酸衍生物底物是十八烯醛、十六烯醛、 甲基十六烯醛或甲基十八烯醛。在另一方面,本發明特徵為遺傳改造的微生物, 其包含穩定併入所述微生物的 基因組DNA的外源控制序列。在一個實施方案中,所述控制序列被整合到多核苷酸的上遊,該多核苷酸包含與 SEQIDNO 1、3、5、7、9、11、13、15、17、19、21、23、25、27、29、31、33或35具有至少約70%的序列同一性的核苷酸序列。在一些實施方 案中,所述核苷酸序列與 SEQIDNO 1、3、5、7、9、11、13、15、17、19、21、23、 25、27、29、31、33或35具有至少約75%、至少約80%、至少約85%、至少約90%、 至少約91%、至少約92%、至少約93%、至少約94%、至少約95%、至少約96%、至 少約97%、至少約98%或至少約99%的序列同一性。在一些實施方案中,所述核苷酸序 列是 SEQ ID NO: 1、3、5、7、9、11、13、15、17、19、21、23、25、27、29、31、33 或35。在一些實施方案中,所述多核苷酸對於所述微生物是內源的。在一些實施方案 中,所述微生物相對於野生型微生物表達水平增高的碳氫化合物。在一些實施方案中, 所述微生物是藍細菌(cyanobacterium)。在另一方面,本發明特徵為製造碳氫化合物的方法,所述方法包括在適於基因 表達的條件下,培養本文所述的遺傳改造的微生物,並分離所述碳氫化合物。在另一方面,本發明特徵為製造碳氫化合物的方法,所述方法包括使底物與以 下接觸(i)與 SEQ ID NO: 2、4、6、8、10、12、14、16、18、20、22、24、26、28、 30、32、34或36的胺基酸序列具有至少70%的同一性的多肽或其變體;(ii)與SEQ ID NO: 1、3、5、7、9、11、13、15、17、19、21、23、25、27、29、31、33 或 35 具有至 少70%的同一性的核苷酸序列所編碼的多肽或其變體;(iii)包含SEQ ID NO 37、38或 39的胺基酸序列的多肽;(iv)包含SEQ ID NO 40以及(a) SEQ ID NO 37、(b) SEQ ID NO 38和(c) SEQ ID NO 39中的任一個的胺基酸序列的多肽;或(v) SEQ ID NO 41、42、43或44。在一些實施方案中,所述多肽具有脫羰酶活性。在一些實施方案中,所述多肽與SEQ ID NO 2、4、6、8、10、12、14、16、 18、20、22、24、26、28、30、32、34或36具有至少約80 %、至少約85%、至少約 90%,至少約91%、至少約92%、至少約93%、至少約94%、至少約95%、至少約 96%,至少約97%、至少約98%或至少約99%的同一性。在一些實施方案中,所述多肽 具有 SEQ ID NO: 2、4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、 34或36的胺基酸序列。在一些實施方案中,所述多肽由與SEQ ID NO 1、3、5、7、9、11、13、 15、17、19、21、23、25、27、29、31、33 或 35 具有至少約 75%、至少約 80%、至少 約85%、至少約90%、至少約91%、至少約92%、至少約93%、至少約94%、至少約 95%,至少約96%、至少約97%、至少約98%或至少約99%的序列同一性的核苷酸序列 編碼。在一些實施方案中,所述多肽由具有SEQIDNO 1、3、5、7、9、11、13、15、 17、19、21、23、25、27、29、31、33 或 35 的核苷酸序列編碼。在一些實施方案中,所述生物底物是脂肪酸衍生物、醯基ACP、脂肪酸、醯基 CoA,脂肪醛、脂肪醇或脂肪酯。在一些實施方案中,所述底物是飽和脂肪酸衍生物,並且所述碳氫化合物是 烷,例如 C3-C25 烷。例如,所述烷是 C3、C4、C5、C6> C7> C8、C9> c10> cn、c12、 Ci3、C14 Λ Ci5、Ci6、Ci7、Ci8、C19、C2C)、C2I Λ C22、C23、C24 或C25燒。在一些實施 方案中,所述烷是十三烷、甲基十三烷、十九烷、甲基十九烷、十七烷、甲基十七烷、十五烷或甲基十五烷。在一些實施方 案中,所述烷是直鏈烷、支鏈烷或環狀烷。在一些實施方案中,所述飽和脂肪酸衍生物是2_甲基二十烷醛、二十烷醛、 十八烷醛、十四烷醛、2-甲基十八烷醛、硬脂醛或棕櫚醛。在其他實施方案中,所述生物底物是不飽和脂肪酸衍生物,並且所述碳氫化合 物是烯,例如 C3-C25 烯。例如,所述烯是 C3、C4> C5、C6、C7、C8> C9> C1Q、cn、 Cl2、Ci3、Ci4、Ci5、Ci6、Ci7、Ci8、C19 λ C2C)、C2」 C22、C23、C24 或C25烯。在一些實 施方案中,所述烯是十五烯、十七烯、甲基十五烯或甲基十七烯。在一些實施方案中,所述烯是直鏈烯、支鏈烷或環狀烯。在一些實施方案中,所述不飽和脂肪酸衍生物是十八烯醛、十六烯醛、甲基 十六烯醛或甲基十八烯醛。在另一方面,本發明特徵為由本文所述的任何方法或微生物所產生的碳氫化合 物。在具體實施方案中,所述碳氫化合物是S 13C為約-15.4或更高的烷或烯。例如, 所述烷或烯的為δ 13C約-15.4至約-10.9,例如約-13.92至約-13.84。在其他實施方案 中,所述烷或烯的fM14C為至少約1.003。例如,所述烷或烯的fM14C為至少約1.01或至 少約1.5。在一些實施方案中,所述烷或烯的fM14C為約1.111至約1.124。在另一方面,本發明特徵為包括由本文所述的任何方法或微生物所產生的碳氫 化合物的生物燃料。在具體實施方案中,所述碳氫化合物是S 13C為約-15.4或更高的烷 或烯。例如,所述烷或烯的S 13C為約-15.4至約-10.9,例如約-13.92至約-13.84。在 其他實施方案中,所述烷或烯具有至少約1.003的fM14C。例如,所述烷或烯的fM14C為至 少約1.01或至少約1.5。在一些實施方案中,所述烷或烯的fM14C為約1.111至約1.124。 在一些實施方案中,所述生物燃料是柴油、汽油或噴氣燃料(jet fuel)。在另一方面,本發明特徵為由SEQIDNO 1、3、5、7、9、11、13、15、17、 19、21、23、25、27、29、31、33或35的不多於約500個核苷酸組成的分離的核酸。在 一些實施方案中,所述核酸由 SEQIDNO 1、3、5、7、9、11、13、15、17、19、21、 23、25、27、29、31、33或35的不多於約300個核苷酸、不多於約350個核苷酸、不多 於約400個核苷酸、不多於約450個核苷酸、不多於約550個核苷酸、不多於約600個核 苷酸或不多於約650個核苷酸組成。在一些實施方案中,所述核酸編碼具有脫羰酶活性 的多肽。在另一方面,本發明特徵為由不多於約99%、不多於約98%、不多於約97%、 不多於約96%、不多於約95%、不多於約94%、不多於約93%、不多於約92%、不多於 約91%、不多於約90%、不多於約85%或不多於約80%的SEQ ID NO 1、3、5、7、 9、11、13、15、17、19、21、23、25、27、29、31、33 或 35 的核苷酸組成的分離的核
酸。在一些實施方案中,所述核酸編碼具有脫羰酶活性的多肽。在另一方面,本發明特徵為由SEQ ID NO 2、4、6、8、10、12、14、16、 18、20、22、24、26、28、30、32、34或36的不多於約200、不多於約175、不多於約
150或不多於約100個胺基酸組成的分離的多肽。在一些實施方案中,所述多肽具有脫羰 酶活性。在另一方面,本發明特徵為由不多於約99%、不多於約98%、不多於約97%、不多於約96%、不多於約95%、不多於約94%、不多於約93%、不多於約92%、不多於 約91%、不多於約90%、不多於約85%或不多於約80%的SEQ ID NO 2、4、6、8、 10、12、14、16、18、20、22、24、26、28、30、32、34 或 36 的胺基酸組成的分離的多 肽。在一些實施方案中,所述多肽具有脫羰酶活性。定義 在整個本說明書中,可以使用縮寫基因名稱或多肽名稱進行引用,但是應當理 解到,該縮寫基因或多肽名稱表示基因或多肽的種類。這些基因名稱包括編碼相同多肽 和具有相同生理功能的同源多肽的所有基因。多肽名稱包括具有相同活性(例如催化相 同基礎化學反應活性)的所有多肽。本文引用的登錄號來自美國國立衛生研究院(National Institute of Health, U.S.Α)所維護的NCBI資料庫(國家生物技術信息中心(National Center for Biotechnology Information))。除非另作說明,登錄號按照截止到2009年四月的資料庫中提供的。EC號由國際生物化學和分子生物學聯盟命名委員會(Nomenclature Committee of the International Union of Biochemistry and Molecular Biology (NC-IUBMB))(可獲取自 http://www.chem.qmul.ac.uk/iubmb/enzvme/)制定。本文引用的EC號來自由東京大學 部分資助的京都基因與基因組百科全書(Kyoto Encyclopedia of Genes and Genomics)所維 護的KEGG配體資料庫。除非另作說明,EC號按照截止到2008年三月的資料庫中提供 的。本文所用冠詞「a」和「an」是指該冠詞的一個或多於一個(即至少一個)語 法對象。作為實例,「元件(an element)「表示一個元件或多於一個元件。本文所用術語「約」表示給定數值的士20%的值。因此,「約60%」表示在 60士 (60 ^ 20% )之間的值(即48至70)。如本文所用術語「醛」表示具有通式RCHO的碳氫化合物,所述RCHO特徵為 不飽和羰基(C = O)。在優選的實施方案中,所述醛是產生自脂肪酸或脂肪酸衍生物的 任何醛。在一個實施方案中,R基長度為至少約1、2、3、4、5、6、7、8、9、10、11、 12、13、14、15、16、17、18、19 或 20 個碳。如本文所用的「醛生物合成基因」或「醛生物合成多核苷酸」是編碼醛生物合 成多肽的核酸。如本文所用的「醛生物合成多肽」是作為醛的生物合成途徑的部分的多肽。這 些多肽可以作用於生物底物以產生醛。在一些情況下,所述醛生物合成多肽具有還原酶 活性。如本文所用的術語「烷」表示僅含有單一碳-碳鍵的碳氫化合物。如本文所用的「烷生物合成基因」或「烷生物合成多核苷酸」是編碼烷生物合 成多肽的核酸。如本文所用的「烷生物合成多肽」是作為烷的生物合成途徑的部分的多肽。這 些多肽可以作用於生物底物以產生烷。在一些情況下,所述烷生物合成多肽具有脫羰酶 活性。如本文所用的「烯生物合成基因」或「烯生物合成多核苷酸」是編碼烯生物合 成多肽的核酸。
如本文所用的「烯生物合成多肽」是作為烯的生物合成途徑的部分的多肽。這 些多肽可以作用於生物底物以產生烯。在一些情況下,所述烯生物合成多肽具有脫羰酶 活性。
如本文所用的術語「減弱」表示削弱、降低或縮小。例如,可以通過修飾多肽 來減弱多肽以降低其活性(例如,通過修飾編碼所述多肽的核苷酸序列)。
如本文所用的術語「生物柴油」表示可以作為來源於石油的柴油的替代品的生 物燃料。生物柴油可以以被稱為「純(neat)」生物柴油的純品形式或作為以任何濃度與 基於石油的柴油的混合物用於內燃柴油發動機。生物柴油可以包括酯或碳氫化合物,例 如醛和烷。
如其中所用的術語「生物燃料」是指來源於生物量的任何燃料。生物燃料可以 替代基於石油的燃料。例如,生物燃料包括運輸工具燃料(例如汽油、柴油、噴氣燃料 (jet fuel)等)、燃用燃料和發電燃料。生物燃料是可再生能源。
如本文使用,術語「生物量」是指來源於生物材料的碳源。生物量可以被轉變 為生物燃料。生物量的一個示例性來源是植物物質。例如,玉米、甘蔗或柳枝稷可以 用作生物量。生物量的另一非限制性實例是動物物質,例如牛糞。生物量還包括來自工 業、農業、林業和家庭的廢品。可以用作生物量的這些廢品的實例是發酵廢渣、秸稈、 無用雜物、汙水、垃圾和剩餘食物。生物量還包括例如碳水化合物(例如單糖、二糖或 多糖)的碳源。
如本文所用的短語「碳源」是指適於用作原核或簡單真核細胞生長的碳的來源 的底物或化合物。碳源可以是不同形式的,包括但不限於聚合物、碳水化合物、酸、 醇、醛、酮、胺基酸、肽和氣體(例如CO和CO2)。這些包括,例如各種單糖,例如葡 萄糖、果糖、甘露糖和半乳糖;寡糖,例如低聚果糖和低聚半乳糖;多糖,例如木糖和 阿拉伯糖;二糖,例如蔗糖、麥芽糖和松二糖;纖維素原料,例如甲基纖維素和羧甲基 纖維素鈉;飽和或不飽和脂肪酸酯,例如琥珀酸酯、乳酸酯和醋酸酯;醇,例如乙醇或 其混合物。碳源還可以是光合作用的產物,包括但不限於葡萄糖。優選的碳源是生物 量。另一優選的碳源是葡萄糖。
如本文所用的「降低濁點的添加劑」是添加到組合物以減少或降低溶液的濁點 的添加劑。
如本文所用的短語「液體的濁點」表示溶解的固體不再完全可溶的溫度。在該 溫度下,固體開始作為第二相沉澱,給予液體渾濁的外觀。在石油工業中,濁點是指這 樣的溫度在該溫度下固化物質或其他重碳氫化合物在原油、提煉油或燃料中結晶以形 成渾濁的外觀。固化物質的存在影響該液體的流動特性、該液體堵塞燃料過濾器、噴嘴 的傾向等、固化物質在冷表面(例如管道或熱交換器汙垢)上的聚積以及該液體與水的乳 化特性。
如果兩個序列的每個鹼基都匹配(即能夠形成Watson Crick鹼基對),則核苷酸 序列與另一核苷酸序列是「互補的」。術語「互補鏈」在本文中與術語「互補物」互 換使用。核酸鏈的互補物可以是編碼鏈的互補物或非編碼鏈的互補物。
如本文所用的術語「足以允許表達的條件」表示允許宿主細胞產生諸如本文所 述的多肽、醛或烷的所需產物的任何條件。合適的條件包括,例如發酵條件。發酵條件可以包含很多參數,例如溫度範圍、通氣水平和培養基組分。這些條件中每一個單獨地 並聯合地允許宿主細胞生長。示例性培養基包括培養液或膠。通常,所述培養基包括諸 如葡萄糖、果糖、纖維素等的碳源,該碳源可以直接被宿主細胞代謝。此外,培養基中 可以使用酶以便於動員(例如澱粉或纖維素的解聚為可發酵的糖)和隨後碳源的代謝。
為了確定條件是否足以允許表達,可以將宿主細胞培養例如約4、8、12、24、 36或48小時。培養中和/或培養後,可以獲取樣品並分析樣品以確定該條件是否允許表 達。例如,可以測試樣品或宿主細胞在其中生長的培養基中的宿主細胞的所需產物的存 在。當測試產物的存在時,可以使用諸如但不限於TLC、HPLC> GC/FID、GC/MS、 LC/MS、MS的檢測。
應當理解到,本文所述的多肽可以具有另外的對於多肽功能沒有本質影響的保 守型或非必需胺基酸取代。特定取代是否會被允許(即不會不利地影響例如脫羧酶活性 的所需生物性質),可以按照Bowie et al.,Science (1990) 247 13061310中所述進行測 定。「保守型胺基酸取代」是胺基酸殘基被具有相似側鏈的胺基酸殘基所替代的取代。 具有相似側鏈的胺基酸殘基的家族在本領域中已有定義。這些家族包括具有以下側鏈的 胺基酸鹼性側鏈(例如賴氨酸、精氨酸、組氨酸)、酸性側鏈(例如天冬氨酸、穀氨 酸)、不帶電荷的極性側鏈(例如甘氨酸、天冬醯胺、穀氨醯胺、絲氨酸、蘇氨酸、酪氨 酸、半胱氨酸)、非極性側鏈(例如丙氨酸、纈氨酸、亮氨酸、異亮氨酸、脯氨酸、苯丙 氨酸、甲硫氨酸、色氨酸)、β-分枝側鏈(例如蘇氨酸、纈氨酸、異亮氨酸)和芳香族 側鏈(例如酪氨酸、苯丙氨酸、色氨酸、組氨酸)。
如本文所用的「控制元件」表示轉錄控制元件。控制元件包括啟動子和增強 子。術語「啟動子元件」、「啟動子」或「啟動子序列」是指作為激活基因表達的開 關發揮功能的DNA序列。如果基因被激活,認為其被轉錄或參與轉錄。轉錄涉及由基 因合成mRNA。因此,啟動子充當轉錄調節元件並且還提供基因轉錄為mRNA的起始 位點。控制元件與參與轉錄的細胞蛋白特異性相互作用(Maniatis et al, Science 236 1237, 1987)。
如本文所用的術語「酯合酶」表示能夠產生脂肪酯的肽。更具體而言,酯合酶 是將硫酯轉變為脂肪酯的肽。在優選的實施方案中,所述酯合酶將硫酯(例如醯基CoA) 轉變為脂肪酯。
在可選的實施方案中,酯合酶使用硫酯和醇作為底物產生脂肪酯。酯合酶能夠 使用短和長鏈硫酯作為底物。此外,酯合酶能夠使用短和長鏈醇作為底物。
酯合酶的非限制性實例是蠟合酶、蠟酯合酶、醯基CoA:醇轉醯酶、醯基轉移 酶和脂肪醯輔酶A 脂肪醇醯基轉移酶。示例性的酯合酶被分在酶分類號EC 2.3.1.75 中。示例性的GenBank登錄號提供於圖40中。
如本文使用,術語「脂肪酸」表示具有通式RCOOH的羧酸。R表示脂肪族基 團,優選地表示烷基。R可以包含約4到約22個碳原子。脂肪酸可以為飽和的、單不 飽和的或多不飽和的。在優選的實施方案中,所述脂肪酸由脂肪酸生物合成途徑產生。
如本文所用的術語「脂肪酸生物合成途徑」表示產生脂肪酸的生物合成途徑。 所述脂肪酸生物合成途徑包括脂肪酸酶,所述脂肪酸酶可以按照本文所述經改造產生脂 肪酸,並且在一些實施方案中可以與其他酶一起表達以產生具有所需碳鏈特徵的脂肪
如本文所用的術語「脂肪酸衍生物」表示部分地產生於生產宿主生物體的脂肪 酸生物合成途徑的產物。「脂肪酸衍生物」還包括部分地產生於醯基ACP或醯基ACP 衍生物的產物。所述脂肪酸生物合成途徑包括脂肪酸合酶酶類,所述脂肪酸合酶酶類可 以按照本文所述經改造產生脂肪酸衍生物,並且在一些實施例中可以與其他酶一起表達 以產生具有所需碳鏈特徵的脂肪酸衍生物。示例性的脂肪酸衍生物包括,例如脂肪酸、 醯基CoA、脂肪醛、短和長鏈醇、碳氫化合物、脂肪醇和酯(例如蠟、脂肪酸酯或脂肪 酯)。
如本文所用的術語「脂肪酸衍生酶」表示在脂肪酸衍生物的產生中可以被表達 或超表達的所有酶。這些酶在本文統稱為脂肪酸衍生酶。這些酶可以是脂肪酸生物合 成途徑的一部分。脂肪酸衍生酶的非限制性實例包括脂肪酸合酶、硫酯酶、醯基CoA合 酶、醯基CoA還原酶、醇脫氫酶、醇醯基轉移酶、脂肪醇形成醯基CoA還原酶、酯合 酶、醛生物合成多肽和烷生物合成多肽。脂肪酸衍生酶將底物轉變為脂肪酸衍生物。在 一些實施例中,所述底物可以是被脂肪酸衍生酶轉變為不同的脂肪酸衍生物的脂肪酸衍 生物。
如本文所用的術語「脂肪醇形成肽」表示能夠催化醯基CoA轉變為脂肪醇的 肽,包括脂肪醇形成醯基CoA還原酶(FAR,EC111.*)、醯基CoA還原酶(EC 1.2丄50) 或醇脫氫酶(EC1.L1.1)。此外,本領域技術人員應當理解到,一些脂肪醇形成肽還會催 化其他反應。例如,除脂肪酸外,一些醯基CoA還原酶肽會接受其他底物。因此,還 包括這些非特異性肽。編碼脂肪醇形成肽的核酸序列是本領域已知的,並且這些肽是可 公開獲取的。示例性的GenBank登錄號提供於圖40中。
如本文所用的「脂肪酸酶」表示參與脂肪酸生物合成的任何酶。脂肪酸酶可以 在宿主細胞中表達或超表達以產生脂肪酸。脂肪酸酶的非限制性實例包括脂肪酸合酶和 硫酯酶。
如本文所用的術語「脂肪酯」表示酯。在優選的實施方案中,脂肪酯是產生自 脂肪酸的任何酯,例如脂肪酸酯。在一個實施方案中,脂肪酯含有A側(即連接於羧基 氧的碳鏈)和B側(即包含母體羧基的碳鏈)。在優選的實施方案中,當所述脂肪酯來 源於脂肪酸生物合成途徑時,A側由醇貢獻,並且B側由脂肪酸貢獻。任何醇可以用於 形成脂肪酯的A側。例如,所述醇可以來自脂肪酸生物合成途徑。可選地,所述醇可以 通過非脂肪酸生物合成途徑產生。此外,所述醇可以是外源提供的。例如,在脂肪酯是 由生物體產生的情況下,所述醇可以提供在發酵液(fermentation broth)中。可選地,例 如在脂肪酯是由還產生醇的生物體產生的情況下,諸如脂肪酸或乙酸的羧酸可以是外源 提供的。
包含A側或B側的碳鏈可以是任何長度。在一個實施方案中,酯的A側的長度 為至少約1、2、3、4、5、6、7、8、10、12、14、16或18個碳。酯的B側的長度為至 少約4、6、8、10、12、14、16、18、20、22、對或洸個碳。A側和/或B側可以是直 鏈或支鏈。支鏈可以具有一個或多個分支點。此外,支鏈可以包括環狀分支。而且, A側和/或B側可以是飽和的或不飽和的。如果是不飽和的,A側和/或B側可以具有 一個或多個不飽和點。
在一個實施方案中,脂肪酯是生物合成產生的。在該實施方案中,首先脂肪酸 被「活化」。「活化的」脂肪酸的非限制性實例是醯基CoA、醯基ACP和醯基磷酸鹽。 醯基CoA可以是脂肪酸生物合成或降解的直接產物。此外,醯基CoA可以由游離脂肪 酸、CoA或三磷酸腺苷(ATP)合成。產生醯基CoA的酶的實例是醯基CoA合酶。
在脂肪酸被活化後,其可以被容易地轉移到接受體親核體。示例性的親核體為 醇、硫醇或磷酸鹽。
在一個實施方案中,脂肪酯是蠟。蠟可以來自長鏈醇和長鏈脂肪酸。在另一實 施方案中,所述脂肪酯可以來自脂肪醯基硫酯和醇。在另一實施方案中,所述脂肪酯是 脂肪酸硫酯,例如脂肪醯輔酶A(CoA)。在其他實施方案中,所述脂肪酯是脂肪醯基泛 酸酯、醯基載體蛋白(ACP)或脂肪磷酸酯。脂肪酯具有很多用途。例如,脂肪酯可以 被用作生物燃料。
如本文所用的「現代碳比例(fraction of modern carbon)」或「fM」與分別由 稱為草酸標準HOxI和HOxII的國家標準技術研究院(National Institute of Standards and Technology(NIST))標準參考物6RMs) 4990B和4990C所定義的具有相同意義。基本定 義涉及0.95倍的WC/12C同位素比例HOxI (參考AD 1950)。這粗略地等於衰變校正的工 業革命前樹木(!decay-corrected pre-Industrial Revolution wood)。對於現今生命生物圈(植 物物質)而言,fM約為1.1。
可以按照以下計算兩個序列之間「同源性」。序列以最佳比較目的進行比對 (例如,可以在第一和第二胺基酸或核酸序列之一或兩者中引入空位用於最佳比對,並且 為了比較目的可以忽略非同源序列)。在優選的實施方案中,用於比較目的的而比對的參 考序列長度為參考序列長度的至少約30%、優選地至少約40%、更優選地至少約50%、 更優選地至少約60%並且更優選地至少約70%、至少約80%、至少約90%或約100%。 然後比較位於對應胺基酸位置或核苷酸位置的胺基酸殘基或核苷酸。當第一序列中的位 置被與第二序列中對應位置相同的胺基酸殘基或核苷酸佔據時,則分子在該位置是相同 的(如本文所用的,胺基酸或核酸「同一性」等同於胺基酸或核酸「同源性」)。兩個 序列之間的同一性百分比是序列所共享的相同位置數的函數,這考慮到空位數和每個空 位的長度,為了兩個序列的最佳比對需要引入空位。
可以使用數學算法完成序列的比較和兩個序列之間同源性百分比的測定。在 優選的實施方案中,使用以下測定兩個胺基酸序列之間的同源性百分比Needleman and Wunsch (1970), J.Mol.Biol.48 444453的算法,其被併入GCG軟體包中的GAP程序中, 使用Blossum 62矩陣或PAM250矩陣,以及16、14、12、10、8、6或4的空位權重和1、 2、3、4、5或6的長度權重。在另一優選的實施方案中,使用以下測定兩個核苷酸序列 之間的同源性百分比GCG軟體包中的GAP程序,使用NWSgapdna.CMP矩陣以及40、 50、60、70或80的空位權重和1、2、3、4、5或6的長度權重。特別優選的參數組(和 如果操作者不確定應當應用哪些參數確定分子是否在要求的同源性限制內而應該使用的 參數組)是具有12的空位罰分、4的空位延伸罰分和5的移碼空位罰分的Blossum 62評 分矩陣。
如本文所用的「宿主細胞」是用於產生本文所述的產物(例如本文所述的醛或 烷)的細胞。可以改造宿主細胞以表達或超表達所選擇的基因或具有所選擇的基因的減弱的表達。宿主細胞的非限制性實例包括植物、動物、人、細菌、酵母或絲狀真菌細 胞。
如本文所用的術語「在低嚴緊性、中嚴緊性、高嚴緊性或非常高的嚴緊性條件 下雜交」描述用於雜交和洗滌的條件。講行雜交反應的指導可以見於Current Protocols in Molecular Biology (現代分子牛物學實驗技術),John Wiley&Sons,N.Y.(1989), 6.3.1-6.3.6。該參考資料中描述了水性和非水性方法並且可以使用任一方法。本文涉 及的具體雜交條件如下1)低嚴緊性雜交條件在約45°C下、在6X氯化鈉/檸檬酸鈉 6SC)中,然後是在至少50°C下、在0.2XSSC、0.1% SDS中洗滌兩次(對於低嚴緊性條 件,洗滌溫度可以升至55°C) ; 2)中嚴緊性雜交條件在約45°C下在、在6XSSC中,然 後是在60°C的0.2XSSC、0.1% SDS中洗滌一次或多次;3)高嚴緊性雜交條件在約45°C 的6XSSC中,然後是在65°C下、在0.2XSSC、0.1 % SDS中洗滌一次或多次;以及優 選地4)非常高嚴緊性雜交條件為65°C的0.5M磷酸鈉、7%SDS,然後是在65°C下、在 0.2XSSC、1% SDS中洗滌一次或多次。除非另作規定,非常高的嚴緊性條件(4)是優 選的條件。
本文中涉及諸如DNA或RNA的核酸所用的術語「分離的」是指分別從所述核 酸的天然來源中存在的其他DNA或RNA中隔離的分子。此外,「分離的核酸」包括核 酸片段,例如不是天然存在的片段。本文所用的術語「分離的」還指從其他細胞蛋白分 離的多肽,並且包括純化的內源多肽和重組多肽兩者。當核酸或多肽是通過重組DNA技 術產生時,本文使用的術語「分離的」還指基本上游離於細胞物質、病毒物質或培養基 的核酸或多肽。當核酸或多肽是化學合成時,本文所用的術語「分離的」還指基本上遊 離於化學前體或其他化學品的核酸或多肽。
如本文所用的「細胞中的基因表達水平」是指由所述細胞中基因編碼的 mRNA、前體mRNA新生轉錄物、轉錄加工中間體、成熟mRNA和/或降解產物的水平。
如本文所用的術語「微生物」表示來自古菌域、細菌域和真核域的原核和真核 微生物種類,後者包括酵母和絲狀真菌、原生動物、藻類或高等原生生物。如本文所用 的術語「微生物細胞」表示來自微生物的細胞。
如本文所用的術語「核酸」是指多核苷酸,例如脫氧核糖核酸(DNA)以及適當 情況下,指核糖核酸(RNA)。該術語還包括產生自核苷酸類似物的RNA或DNA的類 似物,以及適用於所述實施方案的單鏈(有義或反義)和雙鏈多核苷酸、EST、染色體、 cDNA、mRNA 禾口 rRNA。
如本文所用的術語「可操作地連接」表示所選擇的核苷酸序列(例如編碼本文 所述的多肽)與啟動子接近以允許所述啟動子調節該選擇的核苷酸序列的表達。此外, 按照轉錄和翻譯的方向,所述啟動子位於所述選擇的核苷酸序列的上遊。「可操作地連 接」表示將核苷酸序列和調節序列連接以便當合適的分子(例如轉錄激活蛋白)與調節序 列結合時允許基因表達。
本文所用術語「或」表示術語「和/或」並且與術語「和/或」交換使用,除 非上下文明確表示並非如此。
如本文所用的「超表達」表示在細胞中以高於對應野生型細胞中正常表達濃度的濃度表達核酸、多肽或碳氫化合物或使 之被表達。例如,當在重組宿主細胞中多肽以 與其在相同種類的非重組宿主細胞中的濃度相比更高的濃度存在時,所述多肽在所述重 組宿主細胞中能夠「超表達」。
如本文所用的「分配係數」或「P」定義為化合物在有機相中的平衡濃度除以 在水相中(例如發酵液)平衡時的濃度。在本文所述的兩相系統的一個實施方案中,生 產過程中所述有機相是由醛或烷形成的。但是,在一些實施例中,可以例如通過提供辛 烷層來提供有機相以便於產物分離。當描述兩相系統時,化合物的分配特性可以描述為 logP。例如,IogP為1的化合物會10 1分配到有機相。IogP為-1的化合物會1 10 分配到有機相。通過選擇合適的發酵液和有機相,具有高IogP值的醛或烷在發酵容器中 也會分離到有機相中,即使處於很低的濃度。
如本文所用的術語「純化(purify),,、「純化的(purified),,或「純化 (purification) 」表示通過例如分離或隔離從分子的環境中移除或分離所述分子。「基本 上純化的」分子為至少約60%、優選地至少約75%以及更優選地至少約90%游離於與其 相關的其他組分。如本文所用的這些術語還指從樣品中去除汙染物。例如,汙染物的去 除可以導致樣品中醛或烷的百分比增加。例如,當醛或烷在宿主細胞中產生時,可以通 過去除宿主細胞蛋白純化醛或烷。純化後,樣品中醛或烷的百分比增加。
術語「純化(purify),,、「純化的(purified),,或「純化(purification),,不需要絕 對純。它們是相對的術語。因此,例如當醛或烷在宿主細胞中產生時、純化的醛或純化 的烷是基本與其他細胞組分(例如核酸、多肽、脂質、碳水化合物或其他碳氫化合物)隔 離的醛或烷。在另一實施例中,純化的醛或純化的烷製劑是這樣的製劑,在該製劑中, 所述醛或烷基本游離於例如可能存在於後續發酵的那些汙染物。在一些實施方案中,當 樣品重量的至少約50%是由醛或烷組成時,所述醛或烷是純化的。在其他實施方案中, 當樣品重量的至少約60%、70%, 80%, 85%, 90%, 92%, 95%, 98%或99%或更多 是由醛或烷組成時,所述醛或烷是純化的。
如本文使用,術語「重組多肽」是指通過重組DNA技術產生的多肽,其中通常 將編碼所表達的多肽或RNA的DNA插入合適的表達載體,並且所述表達載體接下來用於 轉化宿主細胞以產生所述多肽或RNA。
如本文所用的術語「基本相同」(或「基本同源」)是用於指含有足夠數量的 與第二胺基酸或核苷酸序列相同或等同的(例如具有相似側鏈,例如保守胺基酸取代)氨 基酸殘基或核苷酸的第一胺基酸或核苷酸序列,這樣所述第一和第二胺基酸或核苷酸序 列具有相似活性。
如本文所用的術語「合酶」表示催化合成過程的酶。如本文所用的術語合酶包 括合酶、合成酶和連接酶。
如本文所用的術語「轉染」表示將核酸(例如通過表達載體)通過核酸介導的 基因轉移引入到受體細胞。
如本文所用的「轉化」是指這樣的過程,在該過程中,細胞的基因型由於細胞 攝入外源核酸而改變。這可以導致表達重組形式的RNA或多肽的轉化的細胞。在由轉 移的基因反義表達的情況下,天然存在形式的多肽的表達被破壞。
如本文使用,「轉運蛋白」是便於一種或多種化合物移入和/或移出細胞器和/20或細胞的多肽。
如本文所用,多肽X的「變體」是指具有多肽X的胺基酸序列的多肽,其中一 個或多個胺基酸殘基被改變。所述變體可以具有保守型改變或非保守型改變。使用本領 域熟知的電腦程式,例如LASERGENE軟體(DNASTAR),可以找到確定哪些胺基酸 殘基可以被取代、插入或缺失而不影響生物活性的指導。
在用於多核苷酸序列的情況下,術語「變體」可以包括與基因或其編碼序列的 多核苷酸序列相關的多核苷酸序列。該定義還可以包括,例如「等位基因」變體、「剪 接」變體、「物種」變體或「多態性」變體。剪接變體可以與參考多核苷酸具有顯著的 同一性,但是由於在mRNA加工中的可選的外顯子剪接,會通常具有更多或更少的多核 苷酸數。對應的多肽可以具有另外的功能結構域或結構域缺失。物種變體是在物種之間 彼此不同的多核苷酸序列。得到的多肽通常會具有顯著的相對於彼此的胺基酸同一性。 多態性變體是在給定物種的個體之間特定基因的多核苷酸序列中的變異。
如本文所用,術語「載體」是指能夠轉運另一核酸的核酸分子,所述核酸分子 連接到所述另一核酸。一種有用的載體是附加體(即能夠染色體外的複製的核酸)。有 用的載體是能夠自主複製和/或表達與其連接的核酸的那些載體。能夠指導基因的表達 的載體在本文被稱為「表達載體」,所述載體被可操作地連接到所述基因。通常,在重 組DNA技術中有用的表達載體經常是「質粒」的形式,所述「質粒」通常是指在其載 體形式時不與染色體結合的環狀雙鏈DNA環。在本說明書中,因為質粒是最通常使用的 載體形式,所以「質粒」和「載體」是交換使用的。但是,還包括發揮等同功能並隨 後至今成為本領域已知的表達載體的這些其他形式。
除非另外限定,本文使用的所有技術和科學術語與本發明所屬領域技術人員通 常理解的具有相同的意義。儘管與本文所述的那些方法和材料相似或等同的方法和材料 可以用於本發明的實踐或測試,仍然在下文描述了合適的方法和材料。本文提及的所有 出版物、專利申請、專利和其他參考資料通過引用全文併入。如有衝突,以包括定義在 內的本說明書為準。此外,材料、方法和實施例僅是舉例說明並不意圖限制。
根據下文的詳細描述和權利要求,本發明的其他特徵和優勢會清晰。
附圖簡述
圖IA是海洋原綠球菌(Prochlorococcus marinus) CCMP1986細胞產生的碳氫化合 物的GC/MS追蹤。圖IB是圖IA的7.55分鐘時的峰的質量裂解譜(mass fragmentation pattern)。
圖2A是點狀念珠藍細菌(Nostoc punctiforme)PCC73102細胞產生的碳氫化合物 的GC/MS追蹤。圖2B是圖2A的8.73分鐘時的峰的質量裂解譜。
圖3A是無類囊體藍細菌(Gloeobaceter violaceus) ATCC29082細胞產生的碳氫化 合物的GC/MS追蹤。圖3B是圖3A的8.72分鐘時的峰的質量裂解譜。
圖4A是集胞藍細菌Mynechocystic sp.)PCC6803細胞產生的碳氫化合物的GC/ MS追蹤。圖4B是圖4A的7.36分鐘時的峰的質量裂解譜。
圖5A是集胞藍細菌Mynechocystis sp.) PCC6803野生型細胞產生的碳氫化合物的 GC/MS追蹤。圖5B是具有S110208和sll0209基因缺失的集胞藍細菌PCC6803細胞產生 的碳氫化合物的GC/MS追蹤。
圖6A是大腸桿菌MG1655野生型細胞產生的碳氫化合物的GC/MS追蹤。圖 6B 是表達細長聚球藍細菌(Synechococcus elongatus) PCC7942YP_400611 (Synpcc7942_l5 94) (SEQ ID NO 65)的大腸桿菌MG1655細胞產生的碳氫化合物的GC/MS追蹤。圖7 是表達藍絲 菌(Cyanothece sp.) ATCC51142 cce_1430 (ΥΡ_001802846) (SEQ ID NO 69)的大腸桿菌細胞產生的碳氫化合物的GC/MS追蹤。圖8A 是表達細長聚球藍細菌 PCC7942 YP_400611 (Synpcc7942_1594) (SEQ ID NO: 65)和細長聚球藍細菌 PCC7942YP_400610(Synpcc7942_1593) (SEQ ID NO : 1)的 大腸桿菌細胞產生的碳氫化合物的GC/MS追蹤。圖8B描述圖8A在6.98分鐘時的峰和 十五烷的質量裂解譜。圖8C描述圖8A在8.12分鐘時的峰和8-十七烯的質量裂解譜。圖9 是表達細長聚球藍細菌 PCC7942YP_400611 (Synpcc7942_l 594) (SEQ ID NO: 65)和點狀念珠藍細菌 PCC73102 Npun02004178(ZP00108838) (SEQ ID NO : 5)的 大腸桿菌MG1655細胞產生的碳氫化合物的GC/MS追蹤。

圖10 是表達細長聚球藍細菌 PCC7942YP_400611 (Synpcc7942_1594) (SEQ ID NO 65)和集胞藍細菌 PCC6803 sll0208 (NP 442147) (SEQ IDNO 3)的大腸桿菌 MG1655細胞產生的碳氫化合物的GC/MS追蹤。圖11 是表達細長聚球藍細菌 PCC7942 YP_400611 (Synpcc7942_l594) (SEQ ID NO 65)和念珠藍細菌(Nostoc sp.) PCC72IO alr5283 (NP 489323) (SEQ ID NO 7)的大腸 桿菌MG1655細胞產生的碳氫化合物的GC/MS追蹤。圖12 是表達細長聚球藍細菌 PCC7942 YP_400611(Synpcc7942_1594) (SEQ ID NO 65)和密碼子優化的海濱藍藻菌(Acaryochloris marina) MBICl 1017 AM1_4041 (YP_001518340) (SEQ ID NO 46)的大腸桿菌MG1655細胞產生的碳氫化合 物的GC/MS追蹤。圖13 是表達細長聚球藍細菌 PCC7942 YP_400611 (Synpcc7942_l594) (SEQ ID NO: 65)和密碼子優化的細長嗜熱聚球藍細菌(Thermosynechococcuselongatus)BP-I tlll313(NP_682103) (SEQ IDNO 47)的大腸桿菌MG1655細胞產生的碳氫化合物的GC/
MS追蹤。圖14 是表達細長聚球藍細菌 PCC7942 YP_400611(Synpcc7942_1594) (SEQ ID NO 65)和密碼子優化的聚球藍細菌(Synechococcus sp.) JA-3-3AbCYA_0415 (YP_473897) (SEQ ID NO 48)的大腸桿菌 MG1655 細胞產生的碳氫 化合物的GC/MS追蹤。圖15 是表達細長聚球藍細菌 PCC7942 YP_400611 (Synpcc7942_l594) (SEQ ID NO 65)和無類囊體藍細菌 PCC7421 gll3146 (NP 926092) (SEQ IDNO 15)的大腸桿菌 MG1655細胞產生的碳氫化合物的GC/MS追蹤。圖16 是表達細長聚球藍細菌 PCC7942 YP_400611(Synpcc7942_1594) (SEQ ID NO 65)和密碼子優化的海洋原綠球菌MIT9313 PMT1231 (NP895059) (SEQ ID NO 49) 的大腸桿菌MG1655細胞產生的碳氫化合物的GC/MS追蹤。圖17 是表達細長聚球藍細菌 PCC7942 YP_400611 (Synpcc7942_l594) (SEQ ID NO: 65)和海洋原綠球菌 CCMP 1986 PMM0532 (NP 892650) (SEQID NO : 19)的大腸杆 菌MG1655細胞產生的碳氫化合物的GC/MS追蹤。
圖18 是表達細長聚球藍細菌 PCC7942 YP_400611(Synpcc7942_1594) (SEQ ID NO 65)和密碼子優化的海洋原綠球菌NATL2A PMN2A_1863 (YP_293054) (SEQ ID NO: 51)的大腸桿菌MG1655細胞產生的碳氫化合物的GC/MS追蹤。圖19 表達細長聚球藍細菌 PCC7942 YP_400611 (Synpcc7942_1594) (SEQ ID NO: 65)和密碼子優化的聚球藍細菌 RS9917 RS9917_09941(ZP_01079772) (SEQ ID NO 52)的大腸桿菌MG1655細胞產生的碳氫化合物的GC/MS追蹤。圖20 是表達細長聚球藍細菌 PCC7942 YP_400611 (Synpcc7942_l594) (SEQ ID NO 65)和密碼子優化的聚球藍細菌 RS9917 RS9917_12945 (ΖΡ_01080370) (SEQ ID NO 53)的大腸桿菌MG1655細胞產生的碳氫化合物的GC/MS追蹤。圖21 是表達細長聚球藍細菌 PCC7942 YP_400611 (Synpcc7942_l594) (SEQ ID NO: 65)和藍絲菌 ATCC51142 cce_0778(YP_001802195) (SEQ IDNO : 27)的大腸桿菌 MG1655細胞產生的碳氫化合物的GC/MS追蹤。圖22 是表達細長聚球藍細菌 PCC7942 YP_400611(Synpcc7942_1594) (SEQ ID NO 65)和藍絲菌 PCC7425 Cyan7425_0398 (YP_002481151) (SEQID NO 29)的大腸杆 菌MG1655細胞產生的碳氫化合物的GC/MS追蹤。圖23 是表達細長聚球藍細菌 PCC7942 YP_400611(Synpcc7942_1594) (SEQ ID NO 65)和藍絲菌 PCC7425 Cyan7425_2986(YP_002483683) (SEQ ID NO 31)的大腸杆 菌MG1655細胞產生的碳氫化合物的GC/MS追蹤。圖 24A 是表達海洋原綠球菌 CCMP1986PMM0533(NP_892651) (SEQ ID NO 71)的大腸桿菌MG1655細胞產生的碳氫化合物的GC/MS追蹤。圖24B是表達海洋原 綠球菌 CCMP1986 PMM0533 (NP_892651) (SEQ ID NO 71)和海洋原綠球菌 CCMP1986 PMM0532 (NP_892650) (SEQ ID NO 19)的大腸桿菌MG1655細胞產生的碳氫化合物的 GC/MS追蹤。圖25A是大腸桿菌MG1655 Δ fadE lacZ::Ptrc 『tesA-fadD細胞產生的碳氫化合物 的GC/MS追蹤。圖25B是表達細長聚球藍細菌PCC7942YP_400611 (Synpcc7942_1594) (SEQ ID NO 65)和海濱藍藻菌 MBIC11017AM1_4041 (YP_001518340) (SEQ ID NO 9) 的大腸桿菌MG1655 Δ fadElacZ::Ptrc 『tesA-fadD細胞產生的碳氫化合物的GC/MS追蹤。圖26A 是表達集胞藍細菌 PCC6803 sll0209 (NP_442146) (SEQ ID NO 67)的大腸桿菌MG1655 Δ fadE lacZ::Ptrc 『tesA-fadD細胞產生的碳氫化合物的GC/MS追 蹤。圖 26B 是表達集胞藍細菌 PCC6803 sll0209 (NP_442146) (SEQ ID NO 67)和集 胞藍細菌 PCC6803 sll0208 (NP_442147) (SEQ ID NO 3)的大腸桿菌 MG1655 Δ fadE lacZ::Ptrc 『tesA-fadD細胞產生的碳氫化合物的GC/MS追蹤。圖27A是表達恥垢分枝桿菌(M.smegmatis)菌株MC2 155MSMEG_5739 (YP_889972) (SEQ ID NO 85)的大腸桿菌 MG1655 Δ fadElacZ::Ptrc 『tesA-fadD細胞產生的碳氫化合物的GC/MS追蹤。圖27B 是表達恥垢分枝桿菌菌株MC2 155 MSMEG_5739 (YP_889972) (SEQ ID NO 85)和點 狀念珠藍細菌 PCC73102 Npun02004178 (ΖΡ_00108838) (SEQ ID NO 5)的大腸桿菌 MG1655 Δ fadE lacZ::Ptrc 『tesA-fadD細胞產生的碳氫化合物的GC/MS追蹤。圖28是大腸桿菌MG1655 Δ fadE lacZ::Ptrc 『tesA-fadD細胞產生的碳氫化合物的圖示,所述細胞單獨表達恥垢分枝桿菌菌株MC2 155MSMEG_5739(YP_889972) (SEQ ID NO 85)或表達恥垢分枝桿菌菌株 MC2 155MSMEG_5739 (YP_889972) (SEQ ID NO 85)與以下的組合念珠藍細菌PCC7120 alr5283(SEQ ID NO 7)、點狀念珠藍細菌 PCC73102Npun02004178 (SEQ ID NO 5)、海洋原綠球菌 CCMP1986PMM0532 (SEQID NO 19)、無類囊體藍細菌PCC7421 gll3146 (SEQ ID NO 15)、聚球藍細菌 RS9917_09941 (SEQ ID NO 23)、聚球藍細菌 RS9917_12945 (SEQ IDNO : 25)或海濱藍 藻菌 MBIC11017AM 1_4041 (SEQ IDNO 9)。圖29A是I型核糖核酸酶還原酶亞基β蛋白RN Ri^的三維結構展示。圖29Β 是海洋原綠球菌ΜΙΤ9313 PMT1231 (NP_895059) (SEQ ID NO 17)的三維結構的展示。 圖29C是海洋原綠球菌MIT9313 PMT1231 (NP_895059) (SEQ ID NO 17)的活性位點三
維結構的展示。圖 30A 是表達點狀念珠藍細菌 PCC73102 Npun02004178 (ΖΡ_00108838) (SEQ ID NO 5)的大腸桿菌MG1655細胞產生的碳氫化合物的GC/MS追蹤。圖30B是表達點 狀念珠藍細菌 PCC73102Npun02004178(ZP_00108838)Y123F 變體的大腸桿菌 MG1655 細 胞產生的碳氫化合物的GC/MS追蹤。圖30C是表達點狀念珠藍細菌PCC73102Npun020 04178 (ΖΡ_00108838) Y126F變體的大腸桿菌MG1655細胞產生的碳氫化合物的GC/MS追
S示ο圖31 描述了使用點狀念珠藍細菌 PCC73102 Npun02004178 (ZP_00108838) (SEQ ID NO 6)和十八烷醛(A) ; Npun02004178(ZP_00108838) (SEQ ID NO 6)、十八烷 醛、菠菜鐵氧還蛋白還原酶和NADPH(B);十八烷醛、菠菜鐵氧還蛋白、菠菜鐵氧還蛋 白還原酶和 NADPH(C);或 Npun02004178(ZP_00108838) (SEQ ID NO 6)、菠菜鐵氧 還蛋白和菠菜鐵氧還蛋白(D),體外產生的碳氫化合物的GC/MS追蹤。圖32 描述了 使用點狀念珠藍細菌 PCC73102 Npun02004178 (ZP_00108838) (SEQ ID NO: 6)、NADPH、十八烷醛和(A)菠菜鐵氧還蛋白和菠菜鐵氧還蛋白還 原酶;(B)點狀念珠藍細菌 PCC73102Npun02003626 (ΖΡ_00109192) (SEQ ID NO 88)和點狀念珠藍細菌 PCC73102 Npun02001001(ZP_00111633) (SEQ ID NO: 90); (C)Npun02003626(ZP_00109192) (SEQ ID NO 88)和點狀念珠藍細菌 PCC73102 Npun02003530(ZP_00109422) (SEQ ID NO 92);或(D)Npun02003626 (ZP_00109192) (SEQ ID NO 88)和點狀念珠藍細菌 PCC73102 Npun02003123 (ZP_00109501) (SEQ ID NO 94),體外產生的碳氫化合物的GC/MS追蹤。圖33A是使用十八醯CoA、細長聚球藍細菌PCC7942YP_400611 (Synpcc7942 _1594) (SEQ ID NO 66)、NADH和Mg2+體外產生的碳氫化合物的GC/MS追蹤。圖 33B是使用十八醯CoA、細長聚球藍細菌卩07942¥ _400611(37叩(^7942_1594) (SEQ ID NO 66)、NADPH和Mg2+體外產生的碳氫化合物的GC/MS追蹤。圖33C是使用十八 醯 CoA、細長聚球藍細菌 PCC7942 YP_400611 (Synpcc7942_1594) (SEQ ID NO 66)禾口 NADPH體外產生的碳氫化合物的GC/MS追蹤。圖34A是使用十八醯CoA、標記的NADPH、細長聚球藍細菌PCC7942 YP_400611 (Synpcc7942_l 594) (SEQ ID NO 66)和未標記的 NADPH 體外產生的碳氫 化合物的GC/MS追蹤。圖34B是使用十八醯CoA、標記的NADPH、細長聚球藍細菌PCC7942 YP_400611 (Synpcc7942_1594) (SEQ ID NO 66)禾Π S_(4」H)NADPH 體外產生 的碳氫化合物的GC/MS追蹤。圖34C是使用十八醯CoA、標記的NADPH、細長聚球 藍細菌 PCC7942 YP_400611 (Synpcc7942_1594) (SEQ ID NO 66)和 R-(4」H) NADPH 體 外產生的碳氫化合物的GC/MS追蹤。 圖35是由Che-9培養基中的表達細長聚球藍細菌PCC7942YP_400611 (Synpcc7 942_1594) (SEQ IDNO 65)的大腸桿菌MG1655 Δ fadE細胞所產生的無細胞上清中碳氫 化合物的GC/MS追蹤。圖36是由Che-9培養基中的表達細長聚球藍細菌PCC7942YP_400611 (Synpcc7 942_1594) (SEQ ID NO 65)和點狀念珠藍細菌 PCC73102 Npun02004178 (ZP_00108838) (SEQ ID NO 5)的大腸桿菌MG1655 Δ fadE細胞所產生的無細胞上清中碳氫化合物的 GC/MS追蹤。圖37 是表達念珠藍細菌 PCC7120 alr5283 (NP_489323) (SEQ IDNO 7)和念珠藍 細菌 PCC7120 alr5284 (NP_489324) (SEQ ID NO 81)的大腸桿菌 MG1655 細胞產生的碳 氫化合物的GC/MS追蹤。圖38是來自宏基因組資料庫的細長聚球藍細菌PCC7942YP_400610(Synpcc7942 _1593) (SEQ IDNO 1)的同系物的實例列表。圖39是來自宏基因組資料庫的細長聚球藍細菌PCC7942YP_400611 (Synpcc7942 _1594) (SEQ ID NO 65)的同系物的實例列表。圖40是鑑定出可以被表達、超表達或減弱以增加特定底物的產生的各種基因的表。詳細描述本發明提供了從例如醯基ACP、脂肪酸、醯基CoA、脂肪醛的底物或脂肪醇底 物(例如PCT/US08/058788中所述的,在此通過引用特別併入)產生醛、脂肪醇和碳氫 化合物(例如烷、烯和炔)的組合物和方法。此類醛、烷和烯作為生物燃料(例如汽油、 柴油、噴氣燃料等的替代品)、特種化學品(例如潤滑劑、燃料添加劑等)或用於後續化 學轉變(例如,燃料、聚合物、塑料、紡織品、溶劑、粘合劑等)的原料是有用的。本 發明部分地基於參與醛、烷和烯生物合成的基因的鑑定。這些烷和烯生物合成基因包括,例如細長聚球藍細菌 PCC7942Synpcc7942_1593 (SEQ ID NO 1)、集胞藍細菌 PCC6803 sll0208 (SEQ ID NO 3)、點狀念珠藍細菌 PCC73102 Npun02004178 (SEQ ID NO 5)、念珠藍細菌 PCC 7120 alr5283 (SEQ ID NO 7)、海濱藍藻菌 MBIC11017AM1_4041 (SEQ ID NO : 9)、細長 嗜熱聚球藍細菌 BP-I tlll313(SEQ ID NO : 11)、聚球藍細菌 JA-3-3A CYA_0415 (SEQ ID NO 13)、無類囊體藍細菌PCC7421 gll3146(SEQIDNO: 15)、海洋原綠球菌 MIT9313 PM 123 (SEQ ID NO 17)、狹義的海洋原綠球菌 pastoris 亞種(Prochlorococcus marinus subsp.pastoris str.) CCMP1986PMM0532 (SEQ ID NO 19)、狹義的海洋原綠球 菌(Prochlorococcus marinus str.)NATL2A PMN2A_1863 (SEQ ID NO 21)、聚球藍細 菌 RS9917 RS9917_09941 (SEQ ID NO 23)、聚球藍細菌 RS9917 RS9917_12945 (SEQ ID NO : 25)、藍絲菌 ATCC51142cce_0778(SEQ ID NO : 27)、藍絲菌 PCC7245 Cyan7425DRAFT_1220 (SEQ ID NO : 29)、藍絲菌 PCC7245 cce_0778 (SEQ ID NO 31)、多變魚腥藍細菌(Anabaena variabilis) ATCC29413 YP_323043 (Ava 2533) (SEQ ID NO 33)和細長聚球藍細菌 PCC6301 YP_170760(syc0050_d) (SEQ ID NO 35)。其他烷
和烯生物合成基因在表1和圖38中列出。 醛生物合成基因包括,例如細長聚球藍細菌PCC7942Synpcc7942_1594(SEQ ID NO 65)、集胞藍細菌 PCC6803 sll0209 (SEQ ID NO 67)、藍絲菌 ATCC51142 cce_1430 (SEQ ID NO 69)、狹義的海洋原綠球菌pastoris亞種 CCMP1986PMM0533 (SEQ ID NO 71)、無類囊體藍細菌 PCC7421 NP_96091(gll3145) (SEQ ID NO : 73)、點狀 念珠藍細菌 PCC73102 ZP_00108837(Npun02004176) (SEQIDNO: 75)、多變魚腥藍 細菌 ATCC29413 YP_323044(Ava_2534) (SEQ ID NO 77)、細長聚球藍細菌 PCC6301 YP_170761 (syc0051_d) (SEQ ID NO 79)和念珠藍絲菌 PCC7120 alr5284 (SEQ ID NO 81)。其他醛生物合成基因在表1和圖39中列出。使用本文所述的方法,使用一個或多個本文所述的醛、烷和/或烯生物合成基 因或多肽或所述基因或多肽的變體,利用宿主細胞或無細胞方法,可以製備醛、脂肪 醇、烷和烯。表1.藍細菌基因組中醛和烷生物合成基因同系物
權利要求
1.產生碳氫化合物的方法,所述方法包括在宿主細胞中產生包含SEQID NO: 2、 4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34 或 36 的胺基酸序列 的多肽或其變體,並從所述宿主細胞分離所述碳氫化合物。
2.產生碳氫化合物的方法,所述方法包括在宿主細胞中產生多肽並從所述宿主細胞 分離所述碳氫化合物,所述多肽包含與SEQ ID NO 2、4、6、8、10、12、14、16、 18、20、22、24、26、28、30、32、34或36具有至少約70%同一性的胺基酸序列。
3.產生碳氫化合物的方法,所述方法包括在宿主細胞中產生多肽,所述多肽包含具 有一個或多個胺基酸取代、添加、插入或缺失的SEQ IDNO : 2、4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34或36的胺基酸序列,其中所述多肽具有 脫羰酶活性。
4.如權利要求3所述的方法,其中所述多肽包含具有一個或多個保守型胺基酸取代的 SEQ ID NO 2、4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34 或36的胺基酸序列。
5.產生碳氫化合物的方法,所述方法包括在宿主細胞中表達多核苷酸並從所述宿主 細胞分離所述碳氫化合物,所述多核苷酸包含與SEQ IDNO : 1、3、5、7、9、11、13、15、17、19、21、23、25、27、29、31、33或35具有至少約70%的序列同一性的核苷酸序列。
6.產生碳氫化合物的方法,所述方法包括在宿主細胞中表達多核苷酸,所述多核苷 酸與 SEQ ID NO: 1、3、5、7、9、11、13、15、17、19、21、23、25、27、29、31、33 或35的互補物或其片段雜交,其中所述多核苷酸編碼與包含SEQ ID NO: 2、4、6、8、 10、12、14、16、18、20、22、24、26、28、30、32、34 或 36 的多肽具有相同生物活性的多肽。
7.如權利要求1-6中任一項權利要求所述的方法,其中所述多肽或所述多核苷酸來自藍細菌。
8.產生碳氫化合物的方法,所述方法包括用重組載體轉化宿主細胞並從所述宿主細 胞分離所述碳氫化合物,所述重組載體包含與SEQ IDNO : 1、3、5、7、9、11、13、 15、17、19、21、23、25、27、29、31、33或35具有至少約70%的序列同一性的核苷酸序列。
9.如權利要求8所述的方法,其中所述重組載體還包含可操作地連接到所述核苷酸序 列的啟動子。
10.如權利要求1-9中任一項權利要求所述的方法,其中所述宿主細胞選自哺乳動物 細胞、植物細胞、昆蟲細胞、酵母細胞、真菌細胞、絲狀真菌細胞和細菌細胞。
11.如權利要求10所述的方法,其中所述宿主細胞是大腸桿菌細胞。
12.如權利要求11所述的方法,其中所述大腸桿菌細胞是菌株B、菌株C、菌株K或 菌株W大腸桿菌細胞。
13.如權利要求8所述的方法,其中所述宿主細胞產生所述重組載體的核苷酸序列所 編碼的多肽。
14.如權利要求10所述的方法,其中所述碳氫化合物由所述宿主細胞分泌。
15.如權利要求10所述的方法,其中所述碳氫化合物是烷。
16.如權利要求15所述的方法,其中所述烷包含C13-C21烷。
17.如權利要求15所述的方法,其中所述烷選自十三烷、甲基十三烷、十九烷、甲基 十九烷、十七烷、甲基十七烷、十五烷和甲基十五烷。
18.如權利要求1-14中任一項權利要求所述的方法,還包括在至少一種所述多肽或所 述核苷酸序列編碼的多肽的生物底物的存在下,培養所述宿主細胞。
19.如權利要求18所述的方法,其中所述底物是脂肪酸衍生物。
20.如權利要求15所述的方法,還包括在飽和脂肪酸衍生物的存在下培養所述宿主細胞。
21.如權利要求20所述的方法,其中所述飽和脂肪酸衍生物是C14-C22飽和脂肪酸衍 生物。
22.如權利要求20所述的方法,其中所述飽和脂肪酸衍生物選自2-甲基二十烷醛、 二十烷醛、十八烷醛、十四烷醛、2-甲基十八烷醛、硬脂醛、棕櫚醛及它們的衍生物。
23.如權利要求10所述的方法,其中所述碳氫化合物是烯。
24.如權利要求22所述的方法,其中所述烯包含C13-C21烯。
25.如權利要求22所述的方法,其中所述烯選自十五烯、十七烯、甲基十五烯和甲基 十七烯。
26.如權利要求22所述的方法,還包括在不飽和脂肪酸衍生物的存在下培養所述宿主 細胞。
27.如權利要求26所述的方法,其中所述不飽和脂肪酸衍生物是C14-C22不飽和脂肪 酸衍生物。
28.如權利要求26所述的方法,其中所述不飽和脂肪酸衍生物選自十八烯醛、十六烯 醛、甲基十六烯醛和甲基十八烯醛。
29.遺傳改造的微生物,其包含穩定併入所述微生物的基因組DNA、位於多核苷酸 上遊的外源控制序列,所述多核苷酸包含與SEQ IDNO : 1、3、5、7、9、11、13、15、 17、19、21、23、25、27、29、31、33或35具有至少約70 %的序列同一性的核苷酸序 列,其中所述微生物相對於野生型微生物產生水平增高的碳氫化合物。
30.如權利要求29所述的微生物,其中所述微生物是藍細菌。
31.產生碳氫化合物的方法,所述方法包括在適於基因表達的條件下培養權利要求29 所述的微生物。
32.通過權利要求1-28和31所述的方法的任一方法產生的碳氫化合物。
33.生物燃料,包含權利要求32所述的碳氫化合物。
34.如權利要求33所述的生物燃料,其中所述生物燃料是柴油、汽油或噴氣燃料。
35.如權利要求33所述的生物燃料,其中所述碳氫化合物的δ13C為約-15.4或更大。
36.如權利要求33所述的生物燃料,其中所述碳氫化合物的fM14C為至少約1.003。
37.製造碳氫化合物的方法,所述方法包括使底物與以下接觸(i)包含SEQID NO: 2、4、6、8、10、12、14、16、18、20、22、24、26、28、30 32、34 或 36 的氨 基酸序列的多肽或其變體;(ii)與 SEQ ID NO: 1、3、5、7、9、11、13、15、17、19、 21、23、25、27、29、31、33或35具有至少70%的同一性的核苷酸序列所編碼的多肽或 其變體。
38.如權利要求37所述的方法,其中所述碳氫化合物包含C13-C21烷。
39.如權利要求37所述的方法,其中所述碳氫化合物選自十三烷、甲基十三烷、十九 烷、甲基十九烷、十七烷、甲基十七烷、十五烷和甲基十五烷。
40.如權利要求39所述的方法,其中所述底物選自2-甲基二十烷醛、二十烷醛、 十八烷醛、十四烷醛、2-甲基十八烷醛、硬脂醛、棕櫚醛及它們的衍生物。
41.如權利要求37所述的方法,其中所述碳氫化合物包含C13-C21烯。
42.如權利要求37所述的方法,其中所述碳氫化合物選自十五烯、十七烯、甲基十五 烯和甲基十七烯。
43.如權利要求42所述的方法,其中所述底物選自十八烯醛、十六烯醛、甲基十六烯 醛和甲基十八烯醛。
44.產生碳氫化合物的方法,所述方法包括在宿主細胞中產生包含以下胺基酸序列的 多肽(i)SEQ ID NO 37 或 SEQ ID NO 38 或 SEQ ID NO 39 ;或(ii)SEQ ID NO 40 以及(a) SEQ ID NO 37、 (b) SEQ ID NO 38 禾口(c) SEQ ID NO 39中的任一個;或(iii)SEQ ID NO 41 或 SEQ ID NO 42 或 SEQ ID NO 43 或 SEQ IDNO 44,其中所述多肽具有脫羰酶活性。
45.如權利要求44所述的方法,其中所述多肽來自藍細菌。
46.如權利要求44或45所述的方法,其中所述宿主細胞選自哺乳動物細胞、植物細 胞、昆蟲細胞、酵母細胞、真菌細胞、絲狀真菌細胞和細菌細胞。
47.如權利要求46所述的方法,其中所述宿主細胞是大腸桿菌細胞。
48.如權利要求44所述的方法,其中所述碳氫化合物由所述宿主細胞分泌。
49.如權利要求44所述的方法,其中所述碳氫化合物包含C13-C21烷。
50.如權利要求44所述的方法,其中所述碳氫化合物選自十三烷、甲基十三烷、十九 烷、甲基十九烷、十七烷、甲基十七烷、十五烷和甲基十五烷。
51.如權利要求44-48中任一項權利要求所述的方法,還包括在至少一種所述多肽的 生物底物的存在下,培養所述宿主細胞。
52.如權利要求51所述的方法,其中所述底物是脂肪酸衍生物。
53.如權利要求49所述的方法,還包括在飽和脂肪酸衍生物的存在下培養所述宿主細胞。
54.如權利要求53所述的方法,其中所述飽和脂肪酸衍生物選自2-甲基二十烷醛、 二十烷醛、十八烷醛、十四烷醛、2-甲基十八烷醛、硬脂醛、棕櫚醛及它們的衍生物。
55.如權利要求44所述的方法,其中所述碳氫化合物包含C13-C21烯。
56.如權利要求44所述的方法,其中所述碳氫化合物選自十五烯、十七烯、甲基十五 烯和甲基十七烯。
57.如權利要求55所述的方法,還包括在不飽和脂肪酸衍生物的存在下培養所述宿主 細胞。
58.如權利要求57所述的方法,其中所述不飽和脂肪酸衍生物選自十八烯醛、十六烯 醛、甲基十六烯醛和甲基十八烯醛。
59.製造碳氫化合物的方法,所述方法包括使底物與包含以下胺基酸序列的多肽接觸(i)SEQ ID NO 37 或 SEQ ID NO 38 或 SEQ ID NO 39 ;或(ii)SEQ ID NO 40 以及(a) SEQ ID NO 37、 (b) SEQ ID NO 38 禾口(c) SEQ ID NO 39中的任一個;或(iii)SEQ ID NO 41 或 SEQ ID NO 42 或 SEQ ID NO 43 或 SEQ IDNO 44,其中所述多肽具有脫羰酶活性。
60.如權利要求59所述的方法,其中所述碳氫化合物包含C13-C21烷。
61.如權利要求59所述的方法,其中所述碳氫化合物選自十三烷、甲基十三烷、十九 烷、甲基十九烷、十七烷、甲基十七烷、十五烷和甲基十五烷。
62.如權利要求59所述的方法,其中所述底物是脂肪酸衍生物。
63.如權利要求60所述的方法,其中所述底物是飽和脂肪酸衍生物。
64.如權利要求61所述的方法,其中所述底物選自2-甲基二十烷醛、二十烷醛、 十八烷醛、十四烷醛、2-甲基十八烷醛、硬脂醛、棕櫚醛及它們的衍生物。
65.如權利要求59所述的方法,其中所述碳氫化合物包含C13-C21烯。
66.如權利要求59所述的方法,其中所述碳氫化合物選自十五烯、十七烯、甲基十五 烯和甲基十七烯。
67.如權利要求65所述的方法,其中所述底物是不飽和脂肪酸底物。
68.如權利要求66所述的方法,其中所述底物選自十八烯醛、十六烯醛、甲基十六烯 醛和甲基十八烯醛。
69.分離的核酸,由SEQ ID NO: 1、3、5、7、9、11、13、15、17、19、21、23、25、27、29、31、33或35的不多於500個核苷酸組成。
70.分離的核酸,由不多於90%的 SEQ ID NO 1、3、5、7、9、11、13、15、17、19、21、23、25、27、29、31、33或 35 的核苷酸組成。
71.如權利要求69或70所述的核酸,其中所述核酸編碼具有脫羰酶活性的多肽。
72.分離的多肽,由SEQ ID NO: 2、4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34或36的不多於200個胺基酸組成。
73.分離的多肽,由不多於90%的 SEQ IDNO 2、4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34或 36 的胺基酸組成。
74.如權利要求72或73所述的分離的多肽,其中所述多肽具有脫羰酶活性。
全文摘要
本為描述了用於產生諸如醛、烷和烯的碳氫化合物的組合物和方法。某些碳氫化合物可用於生物燃料。
文檔編號C12N9/88GK102027108SQ200980117663
公開日2011年4月20日 申請日期2009年5月18日 優先權日2008年5月16日
發明者安德裡亞斯·席爾默, 謝恩·布魯貝克, 馬修·路德 申請人:Ls9公司

同类文章

一種新型多功能組合攝影箱的製作方法

一種新型多功能組合攝影箱的製作方法【專利摘要】本實用新型公開了一種新型多功能組合攝影箱,包括敞開式箱體和前攝影蓋,在箱體頂部設有移動式光源盒,在箱體底部設有LED脫影板,LED脫影板放置在底板上;移動式光源盒包括上蓋,上蓋內設有光源,上蓋部設有磨沙透光片,磨沙透光片將光源封閉在上蓋內;所述LED脫影

壓縮模式圖樣重疊檢測方法與裝置與流程

本發明涉及通信領域,特別涉及一種壓縮模式圖樣重疊檢測方法與裝置。背景技術:在寬帶碼分多址(WCDMA,WidebandCodeDivisionMultipleAccess)系統頻分復用(FDD,FrequencyDivisionDuplex)模式下,為了進行異頻硬切換、FDD到時分復用(TDD,Ti

個性化檯曆的製作方法

專利名稱::個性化檯曆的製作方法技術領域::本實用新型涉及一種檯曆,尤其涉及一種既顯示月曆、又能插入照片的個性化檯曆,屬於生活文化藝術用品領域。背景技術::公知的立式檯曆每頁皆由月曆和畫面兩部分構成,這兩部分都是事先印刷好,固定而不能更換的。畫面或為風景,或為模特、明星。功能單一局限性較大。特別是畫

一種實現縮放的視頻解碼方法

專利名稱:一種實現縮放的視頻解碼方法技術領域:本發明涉及視頻信號處理領域,特別是一種實現縮放的視頻解碼方法。背景技術: Mpeg標準是由運動圖像專家組(Moving Picture Expert Group,MPEG)開發的用於視頻和音頻壓縮的一系列演進的標準。按照Mpeg標準,視頻圖像壓縮編碼後包

基於加熱模壓的纖維增強PBT複合材料成型工藝的製作方法

本發明涉及一種基於加熱模壓的纖維增強pbt複合材料成型工藝。背景技術:熱塑性複合材料與傳統熱固性複合材料相比其具有較好的韌性和抗衝擊性能,此外其還具有可回收利用等優點。熱塑性塑料在液態時流動能力差,使得其與纖維結合浸潤困難。環狀對苯二甲酸丁二醇酯(cbt)是一種環狀預聚物,該材料力學性能差不適合做纖

一種pe滾塑儲槽的製作方法

專利名稱:一種pe滾塑儲槽的製作方法技術領域:一種PE滾塑儲槽一、 技術領域 本實用新型涉及一種PE滾塑儲槽,主要用於化工、染料、醫藥、農藥、冶金、稀土、機械、電子、電力、環保、紡織、釀造、釀造、食品、給水、排水等行業儲存液體使用。二、 背景技術 目前,化工液體耐腐蝕貯運設備,普遍使用傳統的玻璃鋼容

釘的製作方法

專利名稱:釘的製作方法技術領域:本實用新型涉及一種釘,尤其涉及一種可提供方便拔除的鐵(鋼)釘。背景技術:考慮到廢木材回收後再加工利用作業的方便性與安全性,根據環保規定,廢木材的回收是必須將釘於廢木材上的鐵(鋼)釘拔除。如圖1、圖2所示,目前用以釘入木材的鐵(鋼)釘10主要是在一釘體11的一端形成一尖

直流氧噴裝置的製作方法

專利名稱:直流氧噴裝置的製作方法技術領域:本實用新型涉及ー種醫療器械,具體地說是ー種直流氧噴裝置。背景技術:臨床上的放療過程極易造成患者的局部皮膚損傷和炎症,被稱為「放射性皮炎」。目前對於放射性皮炎的主要治療措施是塗抹藥膏,而放射性皮炎患者多伴有局部疼痛,對於止痛,多是通過ロ服或靜脈注射進行止痛治療

新型熱網閥門操作手輪的製作方法

專利名稱:新型熱網閥門操作手輪的製作方法技術領域:新型熱網閥門操作手輪技術領域:本實用新型涉及一種新型熱網閥門操作手輪,屬於機械領域。背景技術::閥門作為流體控制裝置應用廣泛,手輪傳動的閥門使用比例佔90%以上。國家標準中提及手輪所起作用為傳動功能,不作為閥門的運輸、起吊裝置,不承受軸向力。現有閥門

用來自動讀取管狀容器所載識別碼的裝置的製作方法

專利名稱:用來自動讀取管狀容器所載識別碼的裝置的製作方法背景技術:1-本發明所屬領域本發明涉及一種用來自動讀取管狀容器所載識別碼的裝置,其中的管狀容器被放在循環於配送鏈上的文檔匣或託架裝置中。本發明特別適用於,然而並非僅僅專用於,對引入自動分析系統的血液樣本試管之類的自動識別。本發明還涉及專為實現讀