新四季網

酮還原酶多肽及其用途的製作方法

2024-03-02 12:50:15

專利名稱:酮還原酶多肽及其用途的製作方法
酮還原酶多肽及其用途1.相關申請的交叉引用本申請根據美國法典第35編專利法第119(e)條要求在2007年9月28日提交的 序號為60/976,345的申請的權益,所述申請的內容通過引用被併入本文。2.對序列表、表格或電腦程式的引用根據37C. F. R. 1. 821以計算機可讀形式(CRF)通過EFS-Web使用文件名 376247-018. txt隨本申請共同提交的序列表通過引用被併入本文。電子版的序列表創建於 2008年9月28日,其文件大小為254千字節。3.背景屬於酮還原酶(KRED)或羰基還原酶類別(EC1. 1. 1. 184)的酶用於從相應的前立 體異構(prostereoisomeric)酮底物或相應的外消旋(racemic)醛底物合成旋光的醇。 KRED通常將酮或醛轉化為相應的醇產物,但是還可以催化逆反應,即醇底物被氧化為相應 的酮/醛產物。酶例如KRED對酮和醛的還原以及醇的氧化需要輔助因子,其中最常見的為 還原型煙醯胺腺嘌呤二核苷酸(NADH)或還原型煙醯胺腺嘌呤二核苷酸磷酸(NADPH)以及 用於氧化反應的煙醯胺腺嘌呤二核苷酸(NAD)或煙醯胺腺嘌呤二核苷酸磷酸(NADP)。NADH 和NADPH充當電子供體,而NAD和NADP充當電子受體。經常觀察到酮還原酶和醇脫氫酶接 受磷酸化的或非磷酸化的輔助因子(以其氧化態和還原態)。可在大範圍的細菌和酵母中發現KRED酶(關於綜述,參見Kraus和Waldman, 1995,Enzyme catalysis in organic synthesis (有機合成中的酶催化),卷 1 和 2. VCH Weinheim ;Faber, K. , Biotransformations in organic chemistry (有機化學中的生 物轉化),第 4 版 Springer, Berlin Heidelberg New York. 2000 ;以及 Hummel 和 Kula, 1989,Eur. J. Biochem. 184 :1_13)。已經報導了若干KRED基因和酶序列,例如木蘭假 絲酵母(Candida magnoliae) (Genbank 登記號 JC7338 ;GI :11360538)、近平滑假絲酵 母(Candidaparapsilosis) (Genbank 登記號 BAA24528. 1 ;GI 2815409)、赭色擲孢酵母 (Sporobolomyces salmonicolor) (Genbank 登記號 AF160799 ;GI 6539734)。為了省去產生關鍵化合物的許多化學合成步驟,漸增地利用酮還原酶將不同的酮 和醛底物向手性醇產物進行酶促轉化。這些應用可利用表達酮還原酶的完整細胞來進行 生物催化的酮還原,或在多種酮還原酶在完整細胞中的存在將不利地影響立體純度和期望 產物收率的情況下使用純化的酶。對於體外應用,將再生酶例如葡萄糖脫氫酶(GDH)、甲 酸脫氫酶等的輔助因子(NADH或NADPH)與酮還原酶共同使用。使用酮還原酶來產生有用 的化合物的實例包括4-氯乙醯基乙酸酯的不對稱還原(Zhou,1983,J. Am. Chem. Soc. 105 5925-5926 ;Santaniello, J. Chem. Res. (S) 1984 132-133 ;美國專利第 5,559,030 號;美國 專利第5,700, 670號和美國專利第5,891,685號)、二氧代羧酸的還原(例如美國專利第 6,399,339號)、(S)氯_5_羥基-3-氧代已酸叔丁基酯的還原(例如美國專利第6,645,746 號和WO 01/40450)、基於吡咯並三嗪的化合物的還原(例如美國申請第2006/0286646 號)、取代苯乙酮的還原(例如美國專利第6,800,477號)和酮噻吩烷(ketothiolanes)的 還原(W0 2005/054491)。
期望鑑定可被用來進行從各種酮和醛底物向其對應的手性醇產物轉化的其他的 酮還原酶。4.概述在一個方面,本公開提供能夠將2-[3-[3-[2-(7-氯_2_喹啉基)乙烯基]苯 基]-3-氧代丙基]苯甲酸甲酯(「底物」)還原或轉化為(S,E)-2-(3-(3-(2-(7-氯喹 啉-2-基)乙烯基)苯基)-3_羥丙基)苯甲酸甲酯(「產物」)的酮還原酶多肽,編碼這種 多肽的多核苷酸以及使用所述多肽的方法。相比之下,天然存在的酮還原酶不展示將特定 的酮底物還原或轉化為相應的醇產物的顯著活性。本公開中人工改造的酮還原酶多肽衍生自乳酸桿菌屬(Lactobacillus)物 種的酮還原酶。照這樣,在一些實施方案中,與得自乳酸桿菌例如高加索酸奶乳桿菌 (Lactobacillus kifir) ( "L. kefir" ;SEQ ID NO :4)、短乳桿菌(Lactobacillus brevis) ("L. brevis";SEQ ID NO 2)和微小乳桿菌(Lactobacillus minor) ( "L. minor", SEQ ID NO 114)的天然存在的野生型酮還原酶相比,本公開中人工改造的酮還原酶多肽在將特定 的酮底物轉化為相應的醇產物中具有增加的活性。在一些實施方案中,與SEQ ID NO :2、 4或114的序列相比,人工改造的酮還原酶至少具有下面的特徵(1)對應於位置190(即 X190)的殘基是受限(constrained)殘基,而且(2)對應於位置202 (即X202)的殘基是 芳香族殘基。在一些實施方案中,與SEQ ID NO :2、4或114的序列相比,本公開的酮還原 酶至少具有下面的特徵(1)對應於位置190 (即X190)的殘基是受限殘基,(2)對應於位 置195(即X195)的殘基是鹼性的、酸性的、非極性的或極性的殘基,而且(3)對應於位置 202 (即X202)的殘基是芳香族殘基。除了上述特徵之外,與SEQ ID NO :2、4或114的序列相比,酮還原酶在其他殘基位 置可具有一個或多個殘基差異。在一些實施方案中,本文的酮還原酶多肽包括與具有下述 特徵的基於SEQ ID NO :2、4或114的參考序列至少約80%、85%、86%、87%、88%、89%、 90%、91%、92%、93%、94%、95%、96%、97%、98%、99% 或更多地相同的胺基酸序列對 應於X190的殘基是受限殘基,特別是脯氨酸;而且對應於X202的殘基是芳香族殘基,特別 是色氨酸;條件是酮還原酶多肽至少具有上述特徵,即,對應於X190的殘基是受限殘基,而 且對應於X202的殘基是芳香族殘基。在一些實施方案中,酮還原酶多肽至少具有下面的特 徵對應於X190的殘基是脯氨酸;而且對應於X202的殘基是色氨酸。在一些實施方案中,本文的酮還原酶多肽包括與具有下述特徵的基於SEQ ID NO 2、4 或 114 的參考序列至少約 80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、 94%、95%、96%、97%、98%、99%或更多地相同的胺基酸序列對應於X190的殘基是受限 殘基,特別是脯氨酸;對應於X195的殘基是鹼性的、酸性的、非極性的或極性的殘基,特別 是脯氨酸、精氨酸、賴氨酸、天冬氨酸或天冬醯胺;而且對應於X202的殘基是芳香族殘基, 特別是色氨酸;條件是酮還原酶多肽至少具有上述特徵,即,對應於X190的殘基是受限殘 基,對應於X195的殘基是鹼性的、酸性的、非極性的或極性的殘基,而且對應於X202的殘基 是芳香族殘基。在一些實施方案中,酮還原酶多肽至少具有下面的特徵對應於X190的殘 基是脯氨酸;對應於X195的殘基是脯氨酸、精氨酸、賴氨酸、天冬氨酸或天冬醯胺;而且對 應於X202的殘基是色氨酸。在一些實施方案中,例如當改進的性質是來自單個殘基差異或殘基差異的特定組
16合時,人工改造的酮還原酶可任選地包括與參考序列相比在多肽中其他位置一個或多個保 守的殘基差異。在一些實施方案中,可以引入其他殘基位置的另外的殘基差異以對酶的性 質產生進一步的改進。這些改進可以是針對確定底物的酶活性的進一步增加,但也可包括 立體選擇性、熱穩定性、溶劑穩定性的增加和/或產物抑制的減少。能夠導致一種或多種改 善的酶性質的各種殘基差異在詳述中被提供。在一些實施方案中,這些人工改造的酮還原 酶多肽基於SEQ ID NO: 111、112和139或其區域(例如對應於殘基90至211的殘基)中所 陳列的序列式。SEQ ID NO :112基於高加索酸奶乳桿菌酮還原酶的野生型胺基酸序列(SEQ ID NO 4) ;SEQ IDNO :111基於短乳桿菌酮還原酶的野生型胺基酸序列(SEQ ID NO 2);而 且SEQ ID NO 139基於微小乳桿菌酮還原酶的野生型胺基酸序列(SEQ IDNO :114)。序列 式說明,對應於X190的殘基是受限殘基;對應於X195的殘基是鹼性的、酸性的、非極性的或 極性的殘基;而且對應於X202的殘基是芳香族殘基。如詳述中所提供,序列式還說明在其 他殘基位置的特徵。在一些實施方案中,與SEQ ID NO :2、4或114相比,在酶活性速率方面改進了本公 開的酮還原酶多肽,所述酶活性速率即它們將底物轉化為產物的速率。改進量範圍可是1. 5 倍(或重)於對應的野生型或參考酮還原酶的酶活性至多達2倍、5倍、10倍、20倍、25倍、 50倍、75倍、100倍或更多倍。在一些實施方案中,酮還原酶多肽能夠以至少5倍、10倍、25 倍、50 倍、75 倍、100 倍、150 倍、200 倍、250 倍、300 倍、500 倍或 1000 倍於 SEQ ID NO 4 或 SEQ ID NO :90的多肽所展現的速率的速率將底物轉化為產物。在一些實施方案中,人工改造的酮還原酶多肽能夠以比參考多肽改進的速率將底 物2-[3-[3-[2-(7-氯-2-喹啉基)乙烯基]苯基]-3-氧代丙基]苯甲酸甲酯轉化為產物 (S,E)-2-(3-(3-(2-(7-氯喹啉-2-基)乙烯基)苯基)_3_羥丙基)苯甲酸甲酯,其中所述 參考多肽具有SEQ ID NO :90的胺基酸序列並能夠將底物轉化為具有至少約95%的百分比 立體異構過量的產物。具有這種性質的示例性多肽包括但不限於含有對應於SEQ ID NO :6、 8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、48、50、52、54、56、58、 60、62、64、66、68、70、72、74、76、78、80、82、84、86、88、92、94、96、98、100、102、104、106、108 和110的胺基酸序列的多肽。在一些實施方案中,酮還原酶多肽還能夠將底物轉化為具有至少約99%的百分比 立體異構過量的產物。具有這種性質的示例性多肽包括但不限於含有對應於SEQ ID NO :6、 8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、48、50、52、54、56、58、 60、62、64、66、68、70、72、74、76、78、80、82、84、86、88、92、94、96、98、100、102、104、106、108 和110的胺基酸序列的多肽。因為具有SEQ ID NO :90的胺基酸序列的參考多肽能夠以比 野生型(SEQ IDNO 4)改進的速率(例如,用約10g/L的KRED將lg/L的底物的10-20%在 24小時內轉化為產物)和立體選擇性(99%的立體異構過量)將底物轉化為產物,所以比 SEQ ID NO :90改進的本文的多肽也是比野生型改進的。在一些實施方案中,酮還原酶多肽能夠以至少約99 %的百分比立體異構過量和比 參考多肽改進了至少1-50倍的速率將底物2-[3-[3-[2-(7-氯-2-喹啉基)乙烯基]苯 基]-3-氧代丙基]苯甲酸甲酯轉化為產物(S,E)-2-(3-(3-(2-(7-氯喹啉-2-基)乙烯 基)苯基)-3_羥丙基)苯甲酸甲酯,其中所述參考多肽具有SEQ ID NO :90的胺基酸序列。 具有這種性質的示例性多肽包括但不限於含有對應於SEQ ID NO :42、44、46、48、86、88、92、94、96、100或102的胺基酸序列的多肽。 在一些實施方案中,酮還原酶多肽能夠以至少約99 %的百分比立體異構過量和比 參考多肽改進了至少50-250倍的速率將底物2-[3-[3-[2-(7_氯-2-喹啉基)乙烯基]苯 基]-3-氧代丙基]苯甲酸甲酯轉化為產物(S,E)-2-(3-(3-(2-(7-氯喹啉-2-基)乙烯 基)苯基)-3-羥丙基)苯甲酸甲酯,其中所述參考多肽具有SEQ ID NO :90的胺基酸序列。 具有這種性質的示例性多肽包括但不限於含有對應於SEQ ID NO :10、32、34、36、50、64、66、 68、70、72、74、76、78、80、82、84、98、104、106 和 108 的胺基酸序列的多肽。
在一些實施方案中,酮還原酶多肽能夠以至少約99 %的百分比立體異構過量和比 參考多肽改進了至少250-1000倍的速率將底物2-[3-[3-[2-(7-氯-2-喹啉基)乙烯基] 苯基]-3-氧代丙基]苯甲酸甲酯轉化為產物(S,E)-2-(3-(3-(2-(7-氯喹啉-2-基)乙烯 基)苯基)-3_羥丙基)苯甲酸甲酯,其中所述參考多肽具有SEQ ID NO :90的胺基酸序列。 具有這種性質的示例性多肽包括但不限於含有對應於SEQ ID NO :12、18、22、24、26、28、30、 38、40、52、54、56、58、60、62和110的胺基酸序列的多肽。在一些實施方案中,本發明提供能夠以至少約99%的百分比立體異構過量和比 參考多肽改進了至少1000倍的速率將底物2-[3-[3-[2-(7-氯-2-喹啉基)乙烯基]苯 基]-3-氧代丙基]苯甲酸甲酯轉化為產物(S,E)-2-(3-(3-(2-(7-氯喹啉-2-基)乙烯 基)苯基)-3_羥丙基)苯甲酸甲酯的酮還原酶多肽,其中所述參考多肽具有SEQ ID NO 90的胺基酸序列。具有這種性質的示例性多肽包括但不限於含有對應於SEQ ID N0:6、8、 14、16和20的胺基酸序列的多肽。在一些實施方案中,與具有SEQ ID NO 90的胺基酸序列的參考多肽相比,本公開 的改進的酮還原酶多肽還具有增加的對丙酮的抵抗性,其中丙酮作為底物向產物轉化中的 競爭性抑制劑。具有這種增加的丙酮抵抗性的示例性多肽包括但不限於含有對應於SEQ ID NO :6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、50、52、54、56、58、60、62、 64、66、68、70、72、74、76、78、80、82、84、86、88、98、104、106、108 和 110 的胺基酸序列的多 肽。在一些實施方案中,當用超過約100g/L的底物和小於約5g/L的多肽進行時,酮還 原酶多肽能夠在小於約24小時中將至少約95%的底物轉化為產物。具有這種能力的示例 性多肽包括但不限於含有對應於SEQ IDNO :6、8、14、16和20的胺基酸序列的多肽。在一些實施方案中,本公開的酮還原酶是高度地立體選擇性的,並且因此能夠將 底物還原為具有超過約 99%,99. 1 99. 2%,99. 3%,99. 4%,99. 5%,99. 6%,99. 7%, 99. 8%或99. 9%立體異構過量的產物。具有這種高度立體選擇性的示例性酮還原酶多肽 包括但不限於含有對應於SEQ IDNO :6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、 38、40、42、44、46、48、50、52、54、56、58、60、62、64、66、68、70、72、74、76、78、80、82、84、86、 88、90、92、94、96、98、100、102、104、106、108 和 110 的胺基酸序列的多肽。在另一方面,本公開提供編碼本文所述人工改造的酮還原酶的多核苷酸或者與這 種多核苷酸在高度嚴格的條件下雜交的多核苷酸。所述多核苷酸可包括啟動子和用於表達 所編碼的人工改造的酮還原酶的其他調節元件,並且可利用為特定的所期望的表達系統而 優化的密碼子。示例性多核苷酸包括但不限於SEQ ID NO :5、7、9、11、13、15、17、19、21、23、 25、27、29、31、33、35、37、39、41、43、45、47、49、51、53、55、57、59、61、63、65、67、69、71、73、75、77、79、81、83、85、87、89、91、93、95、97、99、101、103、105、107 或 109。示例性多核苷酸還 包括編碼對應於SEQ ID NO 111、112和139的序列式的多肽的多核苷酸。 在另一方面,本公開提供含有本文所述多核苷酸和/或表達載體的宿主細胞。所 述宿主細胞可以是高加索酸奶乳桿菌或短乳桿菌或微小乳桿菌,或者它們可以是不同的生 物體。所述宿主細胞可被用來表達和分離本文所述人工改造的酮還原酶,或者可選地,它們 可被直接用來將底物轉化為立體異構產物。無論用完整的細胞、細胞提取物還是純化的酮還原酶進行該方法,都可以使用單 獨的酮還原酶,或者可選地,可以使用兩種或更多種酮還原酶的混合物。本文所述的酮還原酶能夠催化具有結構式(I)的化合物即 2-[3-[3-[2-(7-氯-2-喹啉基)乙烯基]苯基]-3-氧代丙基]苯甲酸甲酯(「底物」)中 的酮基 向具有結構式(II)的相應的立體異構醇產物即(S,E)-2-(3-(3-(2-(7-氯喹 啉-2-基)乙烯基)苯基)-3_羥丙基)苯甲酸甲酯(「產物」)還原的反應 在一些實施方案中,本文所述的酮還原酶能夠催化具有結構式(III)的化合物即 2_[2-[3-[3 [2-(7-氯-2-喹啉基)乙烯基]苯基]-3-氧代丙基]苯基]_2_丙醇(也是
「底物」)中的酮基, 向具有結構式(IV,(S,E)-l-(3-(2-(7-氯喹啉_2_基)乙烯基)苯 基)-3-(2-(2-羥丙-2-基)苯基)丙-1-醇(也是有關式(III)中底物的產物))的相應 的立體異構醇產物還原的反應 因此,在一些實施方案中,本文提供了將結構式(I)或結構式(III)中底物還原為 相應的醇產物的方法,其包括將所述底物在適於將所述底物分別還原或轉化為結構式(II)或結構式(IV)中產物的反應條件下與本公開的酮還原酶多肽接觸或孵化。在一些實施方案中,本文所提供的酮還原酶多肽可被用來生產用於合成結構式 (V)中化合物 2- [ 1- [[ (IR) -1- [3- [ (E) -2- (7-氯喹啉-2-基)乙烯基]苯基]-3- [2- (2-羥 丙-2-基)苯基]丙基]硫甲基]環丙基]乙酸的中間產物 包括其溶劑化物、水合物及藥學上可接受的鹽。在一些實施方案中,在用於合成式 (V)中化合物的方法中,所述方法中的步驟可包括在適於將所述底物還原或轉化為式(II) 中產物的反應條件下使用本公開的酮還原酶多肽將式(I)中的底物還原或轉化為式(II) 中的產物。在一些實施方案中,式(IV)的中間產物還可被用來合成結構式(V)中的化合物。 因此,在一些實施方案中,在用於合成式(V)中化合物的方法中,所述方法中的步驟可包括 通過在適於將所述底物還原或轉化為式(IV)中產物的反應條件下將底物與本文公開的酮 還原酶接觸而將式(III)中的底物還原或轉化為式(IV)中的產物。在一些將底物還原為產物的方法的實施方案中,底物被還原為具有超過約99% 立體異構過量的產物,其中所述酮還原酶多肽包括對應於SEQ IDNO :6、8、10、12、14、16、 18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、48、50、52、54、56、58、60、62、64、66、 68、70、72、74、76、78、80、82、84、86、88、90、92、94、96、98、100、102、104、106、108、110、111 或 112的序列。在一些將底物還原為產物的方法的實施方案中,當用超過約100g/L的底物和小 於約5g/L的多肽進行時,至少約95%的底物在小於約24小時中被轉化為產物,其中所述多 肽包括對應於SEQ ID NO :6、8、14、16或20的胺基酸序列。在一些將底物還原為產物的方法的實施方案中,使用約10g/L的多肽在小於約24 小時中將至少約10-20%的lg/L的底物轉化為產物,其中所述多肽包括對應於SEQ ID NO 6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、48、50、52、54、56、 58、60、62、64、66、68、70、72、74、76、78、80、82、84、86、88、90、92、94、96、98、100、102、104、 106、108、110、111或112的胺基酸序列。5.附圖簡述

圖1說明酮還原酶(KRED)在將式(I)中底物化合物向式(II)中相應產物轉化中 的作用。該還原使用本文所述的KRED和輔助因子例如NADPH。葡萄糖脫氫酶(GDH)被用來 將NAD(P)+轉化/再循環為NAD(P)H。葡萄糖被轉化為葡萄糖酸,而隨著氫氧化鈉的加入, 葡萄糖酸又被轉化為它的鈉鹽(葡萄糖酸鈉)。可選地,可使用仲醇脫氫酶(例如KRED)來 將異丙醇轉化為丙酮並將NAD (P) +轉化/再循環為NAD (P) H。6.詳述
6. 1.定義如本文所用,下列術語旨在具有下列意義。「酮還原酶」和「_」在本文中被可互換地使用以指具有將羰基還原為它相應的 醇的酶能力的多肽。更具體地說,本發明的酮還原酶多肽能夠立體選擇性地將上述式(I) 中的化合物還原為上述式(II)中的相應產物。所述多肽通常利用輔助因子即還原型煙醯 胺腺嘌呤二核苷酸(NADH)或還原型煙醯胺腺嘌呤二核苷酸磷酸(NADPH)作為還原劑。本 文所用的酮還原酶包括天然存在的(野生型的)酮還原酶以及通過人類操作而產生的非天 然存在的人工改造的多肽。「編碼序列」是指編碼蛋白的胺基酸序列的那部分核酸(例如基因)。「天然存在的」或「野牛型的」是指在自然中所發現的形式。例如,天然存在的或野 生型的多肽或多核苷酸序列是存在於生物體中的、可從自然中的來源分離的並且未被人類 操作有意識地修改的序列。「重組的」在提及例如細胞、核酸或多肽而被使用時,是指對應於天然或天牛形式 的物質的物質,該物質以否則在自然中不存在的方式被修飾,或者與天然或天生形式的物 質相同但是是從合成的物質和/或通過使用重組技術的操作而產生或衍生出來的。非限制 性的實例包括但不限於這樣的重組細胞,其表達在天然(非重組)形式的細胞中未被發現 的基因或者表達否則以不同水平表達的天然基因。「序列同一件百分比」和「百分比同源件」在本文中可被互換使用以提及多核苷酸 和多肽中的比較,並且是通過將兩個最佳地比對的序列在一個比較窗上進行比較而被確定 的,其中比較窗中的多核苷酸或多肽序列的部分與參考序列(其不包括添加或缺失)相比 可包括添加或缺失(即,缺口)以將這兩個序列最佳地比對。百分比可如下計算確定兩個 序列中存在相同核酸鹼基或胺基酸殘基的位置的數量來得到匹配位置數量,將匹配位置數 量除以比較窗中位置的總數量並將該結果乘以100以得到序列同一性百分比。可選地,百 分比可如下計算確定兩個序列中存在相同核酸鹼基或胺基酸殘基或者核酸鹼基和胺基酸 殘基與缺口對齊的位置的數量而產生匹配位置數量,將匹配位置數量除以比較窗中位置的 總數量並將該結果乘以100以得到序列同一性百分比。本領域技術人員理解,存在許多可 用的確立的算法比對兩個序列。可通過例如Smith和Waterman,1981,Adv. App 1. Math. 2 482的局部同源性算法、Needleman和Wunsch, 1970,J. Mol. Biol. 48 443的同源性比對算 法、Pearson 和 Lipman,1988,Proc. Natl. Acad. Sci. USA 85 2444 的相似性搜索方法、這些 算法的計算機化執行(GCGWisconsin軟體包中的GAP、BESTFIT、FASTA和TFASTA)或目視 檢查(通常參見Current Protocols in Molecular Biology (最新分子生物學實驗方法 彙編),F. M. Ausubel 等,編輯,Current Protocols (最新實驗方法),GreenePublishing Associates, Inc.和 John Wiley & Sons, Inc.之間的合資企業,(1995 補編)(Ausubel)) 來進行比較序列的最佳比對。適合於確定百分比序列同一性和序列相似性的算法的實例是 BLAST 和 BLAST 2. 0 算法,其分別被描述在 Altschul 等,1990,J. Mol. Biol. 215 403-410 和 Altschul 等,1977,Nucleic Acids Res. 3389-3402 中。用於進行 BLAST 分析的軟體可通過 美國國家生物技術信息中心網站公開獲得。該算法包括首先通過鑑定查詢序列中長度W的 短字來鑑定高分值序列對(HSP),其在與資料庫序列中相同長度的字比對時匹配或滿足一 些正值的閾值分Τ。T被稱作鄰近字分值的閾值(Altschul等,如上述)。這些最初的鄰近的字符合(word hit)被作為啟動對更長的含有字符合的HSP的搜索的種子(seed)而起作 用。然後將字符合向雙方向沿著每個序列擴展,直到累計比對分值被增加。對於核苷酸序 列,使用參數M(匹配的殘基對兒的獎賞分值;總是>0)和N(錯配的殘基的懲罰分值;總是 <0)來計算累計分值。對於胺基酸序列,評分矩陣被用來計算累計分值。字符合在各方向 的延伸在下面這時停止累計比對分值從它所獲得的最大值減少了數量X ;由於一個或多 個負分值殘基比對的積累導致累計分值降到零或以下;或者到達任一個序列的末端。BLAST 算法參數W、T和X確定比對的靈敏度和速度。BLASTN程序(用於核苷酸序列)默認使用字 長度(W) 11、期望值(E) 10、M = 5、N = 4和兩條鏈的對比。對於胺基酸序列,BLASTP程序 默認使用字長度(W) 3、期望值(E) 10和BL0SUM62評分矩陣(參見Henikoff和Henikoff, 1989,Proc Natl Acad Sci USA 89:10915)。序列比對和%序列同一性的示例性的確定可 利用 GCG Wisconsin 軟體包(Accelrys,Madison WI)中的 BESTFIT 或 GAP 程序,其使用所 提供的默認參數。「參考序列」是指被用作序列比較基礎的確定序列。參考序列可以是較大序列的亞 組(subset),例如全長基因或多肽序列的一部分。通常,參考序列的長度為至少20個核苷 酸或胺基酸殘基、至少25個殘基、至少50個殘基或者全長的核酸或多肽。因為兩個多核苷 酸或多肽可各自⑴包括兩個序列之間相似的序列(即完整序列的一部分),並且⑵還包 括兩個序列之間有分歧的序列,所以通常通過在「比較窗」中比較兩個多核苷酸的序列來進 行兩個(或更多個)多核苷酸或多肽之間的序列比較,以便鑑定並比較具有序列相似性的 局部區域。在一些實施方案中,「參考序列」可基於一級胺基酸序列,其中所述參考序列是可 在一級序列中具有一個或多個改變的序列。例如,「在對應於X190的殘基處具有脯氨酸的 基於SEQ ID NO 4的參考序列」是指在其中SEQ ID NO 4的X190處的相應殘基已被改變 為脯氨酸的參考序列。「比較窗」是指具有至少約20個連續的核苷酸位置或胺基酸殘基的概念性區段, 其中可將序列與具有至少20個連續核苷酸或胺基酸的參考序列進行比較,而且其中為了 兩個序列的最佳比對,比較窗中的序列部分與參考序列(其不包括添加或缺失)相比可包 括20%或更少的添加或缺失(即缺口)。比較窗可以比20個連續殘基長,並且包括任選地 30、40、50、100個或更長的窗。「基本同一件」是指與參考序列在具有至少20個殘基位置的比較窗且常常為至少 30-50個殘基的窗中相比具有至少80%序列同一性、至少85%序列同一性和89至95%序 列同一性,更通常地至少99%序列同一性的多核苷酸或多肽序列,其中通過將參考序列與 包括缺失或添加在內的序列進行比較來計算序列同一性百分比,所述缺失或添加在比較窗 上總共佔參考序列的20%或更少。在應用於多肽的特定實施方案中,術語「基本同一性」是 指在被任選地比對例如通過程序GAP或BESTFIT使用默認的缺口權重進行比對時兩個多肽 序列共享至少80%的序列同一性,優選地至少89%的序列同一性、至少95%的序列同一性 或更高(例如99%序列同一性)。優選地,不相同的殘基位置的區別在於保守的胺基酸取 代。「對應於」、「參照」或「相對於」在被用於給定的胺基酸或多核苷酸序列編號的上下 文中時是指在將給定的胺基酸或多核苷酸序列與參考序列比較時指定的參考序列的殘基
22編號。換句話說,給定的多聚體的殘基編號或殘基位置是參照參考序列指定的而非通過在 給定的胺基酸或多核苷酸序列中殘基的實際編號位置指定的。例如,給定的胺基酸序列例 如人工改造的酮還原酶的胺基酸序列,可與參考序列進行比對,其通過引入缺口而將兩個 序列之間的殘基匹配最佳化。在這些情況下,雖然存在缺口,但是給定的胺基酸或多核苷酸 序列中殘基的編號是參照它與之比對的參考序列而制定的。「立體詵擇件」是指在化學或酶促反應中一種立體異構體與另一種相比優先差 異形成。立體選擇性可以是部分的,其中對一種立體異構體的形成的偏愛超過另一種;或 者它可以是全部的,其中只形成一種立體異構體。當立體異構體是對映體時,立體選擇性 被稱作對映選擇性,即一種對映體在兩種的總和中的分數(通常被報導為百分數)。它 通常可選地在本領域中被報導(通常作為百分數)為對映體過量(e.e.),它是根據公 式[主要對映體一次要對映體]/[主要對映體+次要對映體]從中計算而得的。當立 體異構體是非對映異構體(diastereoisomer)時,立體選擇性被稱作非對映立體選擇性 (diastereoselectivity), ^(diastereomer)白勺一禾中白勺 分數(通常被報導為百分數)通常被可選地報導為非對映體過量(d. e.)。對映體過量和非 對映體過量是立體異構過量的類型。「高立體詵擇件的」是指這樣的酮還原酶多肽,其能夠將底物轉化或還原為具有至 少約99%立體異構過量的相應的(S)-產物。「^fim」是指在化學或酶促反應中一種立體異構體與另一種相比優先差異 轉化。立體特異性可以是部分的,其中對一種立體異構體的轉化的偏愛超過另一種;或者它 可以是全部的,其中只轉化一種立體異構體。「化學詵擇件」是指在化學或酶促反應中一種產物與另一種相比優先差異形成。「改進的酶性質」是指與參考酮還原酶相比展現了任何酶性質改進的酮還原酶多 肽。關於本文所述的人工改造的酮還原酶多肽,通常是針對野生型酮還原酶進行比較,雖然 在一些實施方案中,參考酮還原酶可以是另一個改進的人工改造的酮還原酶。期望得到改 進的酶性質包括但不限於酶活性(其可被表示為底物的轉化百分比)、熱穩定性、溶劑穩定 性、PH活性概況、輔助因子的要求、對抑制劑的不應性(例如產物抑制)、立體特異性和立體 選擇性(包括對映體選擇性)。「增加的酶活件」是指人工改造的酮還原酶多肽的改講的件質,其可被表示為與參 考酮還原酶相比之下比活性(例如,所產生的產物/時間/蛋白重量)的增加或底物向產 物的轉化百分比(例如,使用特定量的KRED在特定時間段內起始量的底物向產物的轉化百 分比)的增加。確定酶活性的示例性方法在實施例中提供。可影響與酶活性相關的任何特 性,包括經典的酶性質Km、Vmax或k。at,其改變可導致酶活性的增加。酶活性的改進可以是從 約1. 5倍於相應野生型酮還原酶的酶活性到多達2倍、5倍、10倍、20倍、25倍、50倍、75倍、 100倍或更多倍於天然存在的酮還原酶或酮還原酶多肽所衍生自的另一種人工改造的酮還 原酶的酶活性。在特定的實施方案中,人工改造的酮還原酶展現改進的酶活性,其範圍是超 過母體酮還原酶的酶活性1. 5至50倍、1. 5至100倍。技術人員所理解的是,任何酶的活性 被擴散限制了以至於催化反轉速率不能超過底物(其包括任何必需的輔助因子)的擴散速 率。擴散限制的理論最大值或1^/\通常是約IO8至109(Μ_ν)。因此,酮還原酶的酶活性 的任何改進將具有與所述酮還原酶所作用於其上的底物的擴散速率相關的上限。可通過用於測量酮還原酶的任一個標準測定來測量酮還原酶活性,例如由與酮向醇的還原伴隨的其 氧化所致的NADPH吸光度或螢光的減少,或者通過耦合測定中所產生的產物來測量酮還原 酶活性。如本文進一步更詳細地描述,使用酶的確定製劑、設定條件下的確定測定和一種或 多種確定底物來進行酶活性的比較。通常,當比較裂解產物時,確定了所測定的細胞的數目 和蛋白的量,以及使用相同表達系統和相同宿主細胞來將宿主細胞所產生的並存在於裂解 產物中的酶量的變化降至最低。「體,是指將底物酶促還原為相應的產物。「轉化百分比」是指在特定條件下一 段時間內被還原為產物的底物的百分比。因此,酮還原酶多肽的「酶活性」或「活性」可被 表達為底物向產物的「轉化百分比」。「熱穩定的」是指與未處理的酶相比在暴露於升高的溫度(例如40-80°C )下一段 時間(例如0. 5-24小時)後保持相似活性(例如超過60%至80% )的酮還原酶多肽。「溶劑穩定的」是指與未處理的酶相比在暴露於變化的濃度(例如5-99% )的溶 齊U (異丙基醇、四氫呋喃、2-甲基四氫呋喃、丙酮、甲苯、醋酸丁酯、甲基叔丁基醚等)中一段 時間(例如0. 5-24小時)後保持相似活性(超過60%至80% )的酮還原酶多肽。「dH穩定的」是指與未處理的酶相比在暴露於高或低pH(例如4. 5-6或8至12) 中一段時間(例如0. 5-24小時)後保持相似活性(超過60%至80% )的酮還原酶多肽。「熱和溶劑穩定的」是指既是熱穩定的又是溶劑穩定的酮還原酶多肽。「衍牛自」如本文中在人工改造的酮還原酶的上下文中所用,鑑定所沭人工改造所 基於的起始酮還原酶和/或編碼這種酮還原酶的基因。例如,通過人工地使編碼SEQ ID NO 4中的高加索酸奶乳桿菌酮還原酶的基因經過多代而進化來獲得SEQ ID N0:90中的人工 改造的酮還原酶。因此,該人工改造的酮還原酶「衍生自」 SEQ ID NO :4中的野生型酮還原 酶。「親水件胺基酸或殘基」是指具有展現小於零的疏水性的側鏈的胺基酸或殘基,所 述疏水性是根據Eisenberg等,1984,J. Mol. Biol. 179 125-142中歸一化的共有疏水性量 表。被遺傳編碼的親水性胺基酸包括 L-Thr (T)、L-Ser (S)、L-His (H)、L-Glu (E)、L-Asn (N)、 L-Gln (Q)、L-Asp (D)、L-Lys (K)禾口 L-Arg (R)。「酸件胺基酸或殘基」是指當胺基酸被包含在肽或多肽中時具有展現小於約6的 PK值的側鏈的親水性胺基酸或殘基。酸性胺基酸在生理pH下由於失去了氫離子而通常具 有帶負電的側鏈。被遺傳編碼的酸性胺基酸包括L-Glu (E)和L-Asp (D)。「鹼件胺基酸或殘基」是指當胺基酸被包含在肽或多肽中時具有展現大於約6的 PK值的側鏈的親水性胺基酸或殘基。鹼性胺基酸在生理PH下由於締合了水合氫離子而通 常具有帶正電的側鏈。被遺傳編碼的鹼性胺基酸包括L-Arg(R)和L-Lys(K)。「極性胺基酸或殘基」是指具有在生理PH下不帶電的側鏈的親水性胺基酸或殘基, 但是它具有至少一個這樣的鍵,在其中兩個原子所共享的電子對兒與其中一個原子保持得 更近。被遺傳編碼的極性胺基酸包括L-Asn (N)、L-Gln (Q)、L-Ser (S)和L-Thr (T)。「疏水性胺基酸或殘基」是指具有展現大於零的疏水性的側鏈的胺基酸或殘基,所 述疏水性是根據Eisenberg等,1984,J. Mol. Biol. 179 125-142中歸一化的共有疏水性量 表。被遺傳編碼的疏水性胺基酸包括 L-Pro (P) ,L-Ile (I) ,L-Phe (F) ,L-Val (V) ,L-Leu (L)、 L-Trp (W)、L-Met (M)、L-Ala (A)和 L-Tyr (Y)。
「芳呑族氨某酸或殘某」是指具有句,括至Φ—個芳呑族或雜芳呑族環的側鏈的 親水性或疏水性胺基酸或殘基。被遺傳編碼的芳香族胺基酸包括L-Phe (F)、L-Tyr(Y)和 L-Trp (W)。雖然由於它的雜芳香族氮原子的pKa,L-His(H)有時候被分類為鹼性殘基,或者 由於它的側鏈包括雜芳香族環而被分類為芳香族殘基,但是在本文中組氨酸被分類為親水 性殘基或「受限殘基」(參見如下)。「警限胺基酸或殘基」是指具有警限的幾何形狀的胺基酸或殘基。在本文中,受限 殘基包括L-Pro(P)和L-His(H)。組氨酸具有受限的幾何形狀,因為它具有相對小的咪唑 環。脯氨酸具有受限的幾何形狀,因為它也具有五元環。「非極件胺基酸或殘基」是指具有在生理pH下不帶電的側鏈的疏水性胺基酸或 殘基,而且所述側鏈具有這樣的鍵,在其中兩個原子所共享的電子對兒與這兩個原子中的 每一個通常保持同等距離(即,該側鏈不是極性的)。被遺傳編碼的非極性胺基酸包括 L-Gly (G)、L-Leu (L)、L-Val (V)、L-Ile (I)、L-Met (M)和 L-Ala (A)。「脂肪族胺基酸或殘基」是指具有脂肪烴側鏈的疏水件胺基酸或殘基。被遺傳編碼 的非極性胺基酸包括 L-Ala (A)、L-Val (V)、L-Leu (L)和 L-Ile (I)。「半胱氨酸」或L-Cys (C)是不普通的,因為它能夠與其他L-Cys (C)胺基酸或其他 含有硫烷基或硫氫基的胺基酸形成二硫橋。「類半胱氨酸殘基」包括半胱氨酸和含有能夠形 成二硫橋的硫氫基部分的其他胺基酸。L-Cys (C)(和具有含-SH的側鏈的其他胺基酸)以 還原的游離-SH或氧化的二硫橋形式存在於肽中的能力影響L-Cys(C)是否為肽貢獻淨疏 水或親水特性。當L-Cys(C)展示根據Eisenberg(Eisenberg等,1984,見上文)歸一化的 共有量表為0. 29的疏水性時,可以理解的是,為了本公開的目的,L-Cys(C)被分類到它自 己的獨特的組。「小胺基酸或殘基」是指具有由總共三個或更少的碳和/或雜原子(不包括α -碳 和氫)所組成的側鏈的胺基酸或殘基。小胺基酸或殘基可根據上述定義被進一步分類為 脂肪族、非極性、極性或酸性的小胺基酸或殘基。被遺傳編碼的小胺基酸包括L-Ala(A)、 L-Val (V)、L-Cys (C)、L-Asn (N)、L-Ser (S)、L-Thr (T)禾口 L-Asp (D)。「含羥基的胺基酸或殘基」是指含有羥基(-0Η)部分的胺基酸。被遺傳編碼的含羥 基的胺基酸包括 L-Ser (S)、L-Thr (T)和 L-Tyr (Y)。「保守的」胺基酸取代或突變是指具有相似側鏈的殘基的可互換性,並且因此通常 包括多肽中的胺基酸被相同或相似的確定分類內的胺基酸所取代。然而,如本文所用,在一 些實施方案中,保守的突變不包括從親水性殘基到親水性殘基、疏水性殘基到疏水性殘基、 含羥基的殘基到含羥基的殘基或者小殘基到小殘基的取代,如果取而代之地保守的突變可 以是從脂肪族殘基到脂肪族殘基、非極性殘基到非極性殘基、極性殘基到極性殘基、酸性殘 基到酸性殘基、鹼性殘基到鹼性殘基、芳香族殘基到芳香族殘基或者受限殘基到受限殘基 的取代。此外,如本文所用,A、V、L或I可被保守地突變為另一種脂肪族殘基或另一種非極 性殘基。下面的表1顯示示例性的保守取代。表1 保守取代
25 「非保守的取代」是指多肽中的胺基酸向具有顯著不同的側鏈件質的胺基酸講行 的取代或突變。非保守的取代可使用上面所列的確定組之間而非之內的胺基酸。在一個實 施方案中,非保守的突變影響(a)取代(例如脯氨酸取代甘氨酸)的區域中肽骨架的結構, (b)電荷或疏水性,或(C)側鏈的體積。「跡失」是指通過從參考多肽除去一個或多個胺基酸而對多肽的修飾。缺失可包括 除去1個或多個胺基酸、2個或更多個胺基酸、5個或更多個胺基酸、10個或更多個胺基酸、 15個或更多個胺基酸或者20個或更多個胺基酸、多達構成多肽的胺基酸總數目的10%、多 達構成多肽的胺基酸總數目的20%或多達構成多肽的胺基酸總數目的30%,同時保留酶 活性並且/或者保留人工改造的酮還原酶的改進的性質。缺失可針對多肽的內部部分和/ 或末端部分。在各種實施方案中,缺失可包括連續的區段或者可以是不連續的。「插入」是指通過向參考多肽添加一個或多個胺基酸而對多肽的修飾。在一些實 施方案中,改進的人工改造的酮還原酶包括向天然存在的酮還原酶多肽插入一個或多個氨 基酸以及向其他改進的酮還原酶多肽插入一個或多個胺基酸。插入可以是在多肽的內部部 分,或者在羧基或氨基末端。本文所用的插入包括本領域已知的融合蛋白。插入可以是連 續的胺基酸區段或者是被天然存在的多肽中一個或多個胺基酸所分開的。「醜段」如本文所用是指具有氨基末端和/或羧基末端缺失的多肽,但是其中餘下 的胺基酸序列與序列中相應位置相同。片段可以是至少14個胺基酸的長度、至少20個氨基 酸的長度、至少50個胺基酸的長度或更長,並且長達SEQ ID NO 2或SEQ ID NO 4或SEQ ID NO 114中天然存在的酮還原酶多肽全長的70%、80%、90%、95%、98%和99%。「分離的多肽」是指基本上同天然伴隨它的其他雜質例如蛋白、脂質和多核苷酸分 開的多肽。該術語包括已經從它們天然存在的環境或表達系統(例如宿主細胞或體外合成)中除去或純化的多肽。改進的酮還原酶可以存在於細胞中,存在於細胞培養基中或者 以各種形式例如裂解產物或分離的製劑而被製備。像這樣,在一些實施方案中,改進的酮還 原酶可以是分離的多肽。「某本卜.鈍的多fe」是指這樣的組合物,在其中所述多肽種類是所存在的優勢種類 (即在摩爾或重量基礎上,它比組合物中任何其他單獨的大分子種類的含量更多),而且當 目標種類佔存在的大分子種類至少約50% (以摩爾或%重量)時所述組合物通常是基本上 純化的組合物。通常,基本上純的酮還原酶組合物將包括約60%或更多、約70%或更多、約 80%或更多、約90%或更多、約95%或更多和約98%或更多的(以摩爾或%重量)存在於 組合物中的所有大分子種類。在一些實施方案中,目標種類被純化為大致均一的(即通過 常規檢測方法不能在組合物中檢測到雜質種類),其中組合物基本上由單獨的大分子種類 所組成。溶劑種類、小分子(< 500道爾頓)和元素離子種類不被視為大分子種類。在一 些實施方案中,分離的改進的酮還原酶多肽是基本上純的多肽組合物。在本文中被用來指這樣的條件,在其中核酸雜交體是穩定的。如本領 域技術人員所知,雜交體的穩定性反映在雜交體的解鏈溫度(Tm)上。通常,雜交體的穩定 性是離子強度、溫度、G/C含量和離液劑的存在的函數。可使用用於預測解鏈溫度的已知 方法來計算多核苷酸的Tm值(參見例如Baldino等,Methods Enzymology 168 :761_777 ; Bolton φ, 1962, Proc. Natl. Acad. Sci. USA 48 1390 ;Bresslauer 等,1986,Proc. Natl. Acad. SciUSA 83 :8893_8897 ;Freier 等,1986,Proc. Natl. Acad. Sci USA 83 :9373_9377 ; Kierzek 等,Biochemistry 25 7840-7846 ;Rychlik 等,1990,Nucleic Acids Resl8 6409-6412 (勘誤表,1991,Nucleic Acids Res 19:698) ;Sambrook 等,見上文;Suggs 等, 1981,在Developmental Biology Using Purified Genes (使用純化的基因的發育生物學) 中(Brown 等,編輯),第 683-693 頁,AcademicPress ;禾口 Wetmur,1991,Crit Rev Biochem Mol Biol 26:227-259。所有出版物通過引用併入本文)。在一些實施方案中,多核苷酸編 碼本文所公開的多肽,並在確定條件(例如適度嚴格的或高度嚴格的條件)下與編碼本公 開的人工改造的酮還原酶的序列的互補體進行雜交。「雜交嚴格性」涉及核酸的雜交中的雜交條件,例如洗滌條件。通常,在較低嚴格 性條件下進行雜交反應,接著在不同的但是更高的嚴格性下洗滌。術語「適度嚴格的雜 交」是指允許靶DNA結合互補核酸的條件,其中所述互補核酸與靶DNA具有大約60%的同 一性、優選地大約75%的同一性、大約85%的同一性;與靶多核苷酸具有超過大約90%的 同一性。示例性的適度嚴格的條件是這樣的條件,其等同於在42°C下在50%甲醯胺、5X 登納特氏溶液、5XSSPE、0. 2% SDS中雜交,接著在42°C下用0. 2XSSPE、0. 2% SDS洗滌。 「高度嚴格的雜交」通常是指與在溶液條件下針對確定的核苷酸序列所確定的熱解鏈溫度 Tm相差約10°C或更少的條件。在一些實施方案中,高度嚴格的雜交是指僅允許在65°C下 0.018M NaCl中形成穩定雜交體的那些核酸序列進行雜交的條件。(即,如果雜交體在65°C 下0. OlSMNaCl中不穩定,它在如本文所包括的高度嚴格的條件下將不穩定)。可通過例如 在等同於在42°C下在50%甲醯胺、5X登納特氏溶液、5XSSPE、0. 2% SDS並接著在65°C 下用0. IX SSPE和0. 1% SDS洗滌的條件下雜交來提供高度嚴格的條件。另一種高度嚴格 的條件是在等同於在65°C下在含有0. 1% (w:v) SDS的5XSSC中雜交並在65°C下用含有 0. 1% SDS的0. IX SSC洗滌的條件下雜交。其他高度嚴格的雜交條件以及適度嚴格的條件在上面所引用的參考文獻中描述。「顯M&ffl」多核苷酸是指通過實驗室技術被引入宿主細胞的任何多核苷酸,而且 包括從宿主細胞中取出,進行實驗室操作並且之後被重新引入宿主細胞的多核苷酸。「MiiMim」是指將編碼蛋白的多核苷酸的密碼子改變為在特定生物體中優 先使用的那些,以使被編碼的蛋白被有效地表達在感興趣的生物體中。雖然遺傳密碼因 為大多數胺基酸由若干密碼子(被稱作「同義密碼子」或「同義的」密碼子)而是簡併的 (degenerate),但是眾所周知特定生物體的密碼子選擇是非隨機的並且偏向於特定密碼子 三聯體。根據給定基因、具有共同功能或祖先起源的基因、高表達蛋白與低拷貝數蛋白的對 比以及生物體基因組的聚集蛋白編碼區,密碼子選擇偏向可能更高。在一些實施方案中,編 碼酮還原酶的多核苷酸可以是密碼子優化的以從被選作表達的宿主生物體最優化地生產。「優詵的」、「最優化的」或「高度密碼子詵擇偏向的密碼子」可互換地指與編碼相 同胺基酸的其他密碼子相比在蛋白編碼區中以更高頻率使用的密碼子。可根據單個基因、 具有共同功能或起源的一組基因、高表達的基因、整個生物體的聚集蛋白編碼區中的密碼 子頻率、相關生物體的聚集蛋白編碼區中的密碼子頻率或其組合來確定優選的密碼子。其 頻率與基因表達水平一起增加的密碼子通常是表達的最優化的密碼子。已經知道若干方 法用於確定密碼子頻率(例如,密碼子選擇、相對同義的密碼子選擇)和特定生物體中的 密碼子偏好,其包括多變量分析,例如使用聚類分析或對應分析和用於基因中的密碼子的 有效數目(參見 GCG CodonPreference, Genetics Computer Group Wisconsin Package ; Codonff, John Peden, University of Nottingham ;McInerney, J. 0,1998, Bioinformatics 14 372-73 ;Stenico 等,1994,Nucleic Acids Res. 222437-46 ;Wright, F.,1990,Gene87 23-29)。對于越來越多的生物體可獲得密碼子選擇表(參見例如Wada等,1992,Nucleic Acids Res. 20 :2111_2118 ;Nakamura 等,2000,Nucl. Acids Res. 28 292 ;Duret,等,見上 文;Henaut 禾口 Danchin, "Escherichia coli andSalmonella,,,1996, Neidhardt,等編輯, ASM Press, Washington D. C.,第2047-2066頁)。獲得密碼子選擇的數據來源可依靠能夠 編碼蛋白的任何可得的核苷酸序列。這些數據集包括實際上已知編碼被表達蛋白的核酸序 列(例如,完整的編碼蛋白的序列-CDS)、被表達的序列標籤(ESTS)或預測的基因組序列 編石馬區(參見例如 Mount, D. , Bioinformatics :Sequence andGenome Analysis,第 8 章, Cold Spring Harbor Laboratory Press, Cold SpringHarbor, N. Y. ,2001 ;Uberbacher, Ε. C.,1996,Methods Enzymo1. 266 :259_281 ;Tiwari 等·,1997,Comput. App1. Biosci. 13 263-270)。「控制序列」在本文中被定義為包括這樣的所有成分,其對於感興趣的多核苷酸和 /或多肽的表達是必要的或有利的。每個控制序列對於編碼多肽的核酸序列可以是天生的 或外來的。這種控制序列包括但不限於前導序列、多腺苷酸化序列、前肽序列、啟動子、信號 肽序列和轉錄終止子。至少,控制序列包括啟動子以及轉錄和翻譯終止信號。為了引入特 定的限制位點以促進控制序列與編碼多肽的核酸序列的編碼區連接,可為控制序列提供連 接序列。「可操作地連接的」在本文中被定義為這樣的構型,在其中將控制序列適當置於 (即,以功能的關係)相對於感興趣的多核苷酸的一個位置以使所述控制序列指導或調節 感興趣的多核苷酸和/或多肽的表達。
「啟動子序列」是被宿主細胞識別以表達感興趣的多核苷酸(例如編碼序列)的核 酸序列。控制序列可包括適當的啟動子序列。啟動子序列含有轉錄控制序列,其介導感興 趣的多核苷酸的表達。啟動子可以是在所選的宿主細胞中顯示轉錄活性的任何核酸序列, 其包括突變、截短的和雜交的啟動子,並且可從編碼與宿主細胞同源或異源的細胞外或細 胞內多肽的基因獲得。6.2.酮還原酶
本公開提供人工改造的酮還原酶(「KRED」),其能夠立體選擇性地將底物 2-[3-[3-[2-(7-氯-2-喹啉基)乙烯基]苯基]-3-氧代丙基]苯甲酸甲酯還原或轉化 為產物(S,E)-2-(3-(3-(2-(7-氯喹啉-2-基)乙烯基)苯基)_3_羥丙基)苯甲酸甲 酯,而且與從高加索酸奶乳桿菌(SEQ ID NO 4)或短乳桿菌(SEQ IDNO 2)或微小乳杆 菌(SEQ ID NO 114)獲得的天然存在的野生型KRED酶相比或者與其他人工改造的酮還 原酶相比,其具有改進的特性。所述產物化合物在孟魯司特的合成中是有用的,孟魯司特 也被稱作Singulari 這個名字,即被用作治療過敏症和控制哮喘的治療劑的一種白三 烯受體拮抗劑。如本文所示,來自高加索酸奶乳桿菌的野生型酶不以任何顯著的速率將 2-[3-[3-[2-(7-氯-2-喹啉基)乙烯基]苯基]-3-氧代丙基]苯甲酸甲酯還原或轉化 為產物(S,E)-2-(3-(3-(2-(7-氯喹啉-2-基)乙烯基)苯基)_3_羥丙基)苯甲酸甲酯。 與此相反,本公開的酮還原酶能夠將特定底物還原或轉化為明顯水平的產物。在一些實施 方案中,本公開的酮還原酶多肽具有如下要求(1)對應於SEQ ID N0:2、4或114的位置 190 (即X190)的殘基是受限殘基;而且⑵對應於SEQ ID NO :2、4或114的位置202 (即 X202)的殘基是芳香族殘基。在一些實施方案中,改進的酮還原酶多肽具有如下要求(1) 對應於SEQ ID NO :2、4或114的位置190 (即X190)的殘基是受限殘基;(2)對應於SEQ ID NO :2、4或114的位置195 (即X195)的殘基是鹼性的、酸性的、 非極性的或極性的殘基;而且(3)對應於SEQ ID N0:2、4或114的位置202(即X202)的殘 基是芳香族殘基。如上所述,可針對高加索酸奶乳桿菌、短乳桿菌或微小乳桿菌的天然存在的酮還 原酶(也被稱作「ADH」或「醇脫氫酶」)或另外人工改造的酮還原酶的胺基酸序列來描述本 公開的酮還原酶。像這樣,在從起始的甲硫氨酸(M)殘基(即M代表殘基位置1)開始的酮 還原酶中確定胺基酸殘基位置,雖然技術人員將理解可通過生物加工裝置在例如宿主細胞 或體外翻譯系統中除去該起始的甲硫氨酸殘基以便產生缺少起始的甲硫氨酸殘基的成熟 蛋白。特殊胺基酸或胺基酸改變存在於胺基酸序列中的胺基酸殘基位置在本文中有時候被 描述為術語「Xn」或「位置n」,其中η是指殘基位置。當相同殘基位置處的胺基酸殘基在酮 還原酶之間有所不同時,不同的殘基可表示為含有「/」的排列「高加索酸奶乳桿菌殘基/短 乳桿菌殘基/微小乳桿菌殘基」。取代突變,即不同胺基酸殘基對參考序列例如SEQID NO 2和SEQ ID NO 4和SEQ ID NO 114的野生型酮還原酶中的胺基酸殘基的替換,可被表示 為符號「一」。在本文中,突變有時候被描述為突變「至一個」類型的胺基酸。例如,SEQ ID NO 4的殘基96可被突變「至一個」脂肪族殘基。但是短語「至一個」的使用不排除從一類 的一個胺基酸突變至同類的另一個胺基酸。例如,SEQ ID NO :4的殘基96是極性殘基絲氨 酸,但是它可被突變為不同的極性殘基;例如,所述突變可以是「S96T」(96 —T)突變。可從 已知編碼酮還原酶活性的多核苷酸來獲得高加索酸奶乳桿菌、短乳桿菌或微小乳桿菌的天
29然存在的酮還原酶(也被稱作「ADH」或「醇脫氫酶」)的胺基酸序列(例如,關於高加索酸 奶乳桿菌,Genbank登錄號AAP94029 GI :33112056或SEQ ID NO :3 ;關於短乳桿菌,Genbank 登錄號 CAD66648 GI =28400789 或 SEQ ID NO 1 ;以及關於微小乳桿菌,SEQ ID NO :113)。在一些實施方案中,與野生型或另外人工改造的多肽相比,酮還原酶多肽的 改進的特性是關於它將式(I)中的底物2-[3-[3-[2-(7-氯-2-喹啉基)乙烯基]苯 基]-3-氧代丙基]苯甲酸甲酯還原或轉化為其相應的式(II)中的(S)-醇產物(S, E)-2-(3-(3-(2-(7-氯喹啉-2-基)乙烯基)苯基)_3_羥丙基)苯甲酸甲酯的活性的增 加。在一些實施方案中,酶活性的增加可體現為底物向產物轉化的速率的增加,或體現為與 野生型或另外的參考序列(例如SEQ IDNO 90)相比在還原或轉化相同量產物中使用較少 的改進的多肽的能力。在一些實施方案中,酮還原酶性質的改進的性質是關於還原底物至 產物中立體選擇性的增加,即,這裡是產物的立體異構過量的增加。在一些實施方案中,酮 還原酶多肽的改進的性質是關於它的穩定性或熱穩定性。在一些實施方案中,酮還原酶多 肽具有多於一個改進的性質,例如改進的酶活性和改進的立體選擇性。在一些實施方案中,本文的酮還原酶多肽可具有對參考序列(例如天然存在的多 肽或人工改造的多肽)的若干修飾,其在一些實施方案中可產生改進的酮還原酶性質。如 本文所用,「修飾」包括胺基酸取代、缺失和插入。可將任一個或一組合的修飾引入天然存 在的或人工改造的多肽以產生人工改造的酶。在這種實施方案中,對胺基酸序列修飾的數 目可包括一個或多個胺基酸、2個或更多個胺基酸、3個或更多個胺基酸、4個或更多個氨 基酸、5個或更多個胺基酸、6個或更多個胺基酸、8個或更多個胺基酸、10個或更多個氨基 酸、15個或更多個胺基酸或者20個或更多個胺基酸,參考多肽序列的胺基酸總數目的至多 10%、胺基酸總數目的至多10%、胺基酸總數目的至多15%、胺基酸總數目的至多20%或 胺基酸總數目的至多30%。在一些實施方案中,產生改進的酮還原酶性質的對天然存在的 多肽或人工改造的多肽的修飾的數目可包括約1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、 1-11、1-12、1-14、1-15、1-16、1-18、1-20、1-22、1-24、1-26、1-30、1-35 或約 1-40 個參考序 列修飾。在一些實施方案中,修飾的數目可以是1、2、3、4、5、6、7、8、9、10、11、12、14、15、16、 18、20、22、24、26、30、35或約40個胺基酸殘基。所述修飾可包括插入、缺失、取代或其組合。在一些實施方案中,修飾包括對參考序列的胺基酸取代。可產生改進的酮還原酶 性質的取代可以在一個或多個胺基酸、2個或更多個胺基酸、3個或更多個胺基酸、4個或更 多個胺基酸、5個或更多個胺基酸、6個或更多個胺基酸、8個或更多個胺基酸、10個或更多 個胺基酸、15個或更多個胺基酸或者20個或更多個胺基酸,參考酶序列的胺基酸總數目 的至多10%、胺基酸總數目的至多20%或胺基酸總數目的至多30%。在一些實施方案中, 產生改進的酮還原酶性質的對天然存在的多肽或人工改造的多肽的取代的數目可包括參 考序列的約 1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18、 1-20、1-22、1-24、1-26、1-30、1-35或約1_40個胺基酸取代。在一些實施方案中,取代的數 目可以是 1、2、3、4、5、6、7、8、9、10、11、12、14、15、16、18、20、22、24、26、30、35或約40 個氨基 酸殘基。在一些實施方案中,本文的酮還原酶多肽包括與具有下述特徵的基於SEQ ID NO 2、4 或 114 的參考序列至少約 80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、 94%、95%、96%、97%、98%、99%或更多地相同的胺基酸序列對應於位置X190的殘基是受限殘基,特別是脯氨酸;而且對應於X202的殘基是芳香族殘基,特別是色氨酸;條件是 酮還原酶多肽具有這樣的胺基酸序列,在其中對應於X190的殘基是受限殘基,而且對應於 X202的殘基是芳香族殘基。在一些實施方案中,對應於X190的殘基是脯氨酸。在一些實 施方案中,對應於X202的殘基是色氨酸。在一些實施方案中,酮還原酶多肽具有這樣的氨 基酸序列,在其中對應於X190的殘基是脯氨酸,而且對應於X202的殘基是色氨酸。在一些 實施方案中,這些酮還原酶多肽與參考胺基酸序列相比可在其他殘基位置上具有一個或多 個殘基差異。該差異可包括各種修飾,例如取代、缺失和插入。取代可以是非保守取代、保 守取代或者非保守取代和保守取代的組合。在一些實施方案中,這些酮還原酶多肽可任選 地與參考序列相比在其他胺基酸殘基位置上具有約1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、 1-10、1-11、1-12、1-14、1-15、1-16、1-18、1-20、1-22、1-24、1-26、1-30、1-35、1-40、1-45 或 約1-50個殘基差異。在一些實施方案中,與參考序列相比在其他胺基酸殘基上的差異的數 目可以是 1、2、3、4、5、6、7、8、9、10、11、12、14、15、16、18、20、22、24、26、30、35、40、45或50個 殘基差異。在一些實施方案中,本文的酮還原酶多肽包括與具有下述特徵的基於SEQ ID NO 2、4 或 114 的參考序列至少約 80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、 94%、95%、96%、97%、98%、99%或更多地相同的胺基酸序列對應於位置X190的殘基是 受限殘基,特別是脯氨酸;對應於X195的殘基是鹼性的、酸性的、非極性的或極性的殘基, 特別是脯氨酸、精氨酸、賴氨酸、天冬氨酸或天冬醯胺;而且對應於X202的殘基是芳香族殘 基,特別是色氨酸;條件是酮還原酶多肽包括至少具有上述特徵的胺基酸序列,即,對應於 X190的殘基是受限殘基;對應於X195的殘基是鹼性的、酸性的、非極性的或極性的殘基;而 且對應於X202的殘基是芳香族殘基。在一些實施方案中,對應於X190的殘基是脯氨酸。 在一些實施方案中,對應於X195的殘基是精氨酸。在一些實施方案中,對應於X202的殘基 是色氨酸。在一些實施方案中,酮還原酶多肽具有這樣的胺基酸序列,在其中對應於X190 的殘基是脯氨酸;對應於X195的殘基是脯氨酸、精氨酸、賴氨酸、天冬氨酸或天冬醯胺,特 別是精氨酸;而且對應於X202的殘基是色氨酸。在一些實施方案中,這些酮還原酶多肽與 參考胺基酸序列相比可在其他殘基位置上具有一個或多個殘基差異。該差異可包括各種修 飾,例如取代、缺失和插入。取代可以是非保守取代、保守取代或者非保守取代和保守取代 的組合。在一些實施方案中,這些酮還原酶多肽可任選地與參考序列相比在其他胺基酸殘 基位置上具有約 1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-15、1-16、 1-18、1-20、1-22、1-24、1-26、1-30、1-35、1-40、1-45 或約 1-50 個殘基差異。在一些實施方 案中,與參考序列相比在其他胺基酸殘基位置上的差異的數目可以是1、2、3、4、5、6、7、8、9、 10、11、12、14、15、16、18、20、22、24、26、30、35、40、45 或 50 個殘基差異。在一些實施方案中,改進的酮還原酶多肽包括基於SEQ ID N0:111或SEQ ID NO: 112或SEQ ID NO :139或其區域(例如對應於90-211的殘基)中所陳列的序列式的胺基酸 序列。SEQ ID NO :112基於高加索酸奶乳桿菌酮還原酶的野生型胺基酸序列(SEQ ID NO 4) ;SEQ ID NO :111基於短乳桿菌酮還原酶的野生型胺基酸序列(SEQ ID NO 2);而且SEQ ID NO: 139基於微小乳桿菌酮還原酶的野生型胺基酸序列(SEQ ID N0:114)。基於SEQ ID NO :111、112或139中的序列式的酮還原酶說明,對應於X190的殘基是受限殘基;對應於 X195的殘基是鹼性的、酸性的、非極性的或極性的殘基;而且X202是芳香族殘基。在SEQID N0:lll、112或139中的序列式的一些實施方案中,對應於X190的殘基是脯氨酸;而且對應於X202的殘基是色氨酸。在SEQ ID NO :111、112或139中的序列式的一些實施方案 中,對應於X190的殘基是脯氨酸;對應於X195的殘基是脯氨酸、精氨酸、賴氨酸、天冬氨酸 或天冬醯胺,特別是精氨酸;而且對應於X202的殘基是色氨酸。如下所述,該序列式還說明 了各種殘基位置的特徵。 在一些實施方案中,包括基於SEQ ID N0:lll、112或139或其區域(例如殘基 90-211)中的序列式的胺基酸序列並且具有本文所述對應於X190和X202的殘基的特定 特徵或對應於X190、X195和X202的殘基的特定特徵的改進的酮還原酶多肽,還可包括如 序列式中所提供的一個或多個選自如下的特徵對應於X7的殘基是受限的或非極性的殘 基;對應於X17的殘基是非極性的或脂肪族的殘基;對應於X25的殘基是極性的或酸性的 殘基;對應於X27的殘基是芳香族的殘基;對應於X41的殘基是極性的、脂肪族的或非極性 的殘基;對應於X53的殘基是極性的、非極性的或酸性的殘基;對應於X57的殘基是非極性 的或脂肪族的殘基;對應於X64的殘基是極性的、脂肪族的或非極性的殘基;對應於X66的 殘基是酸性的殘基;對應於X68的殘基是極性的、酸性的、脂肪族的或非極性的殘基;對應 於X72的殘基是鹼性的殘基;對應於X76的殘基是脂肪族的、非極性的或極性的殘基;對應 於X80的殘基是脂肪族的、非極性或極性的殘基;對應於X93的殘基是極性的、脂肪族的或 非極性的殘基;對應於X94的殘基是半胱氨酸、脂肪族的或非極性的殘基;對應於X95的殘 基是脂肪族的、非極性的或酸性的殘基;對應於X96的殘基是半胱氨酸、極性的、脂肪族的 或非極性的殘基;對應於X97的殘基是鹼性的、受限的或極性的殘基;對應於XlOO的殘基 是鹼性的、酸性的、極性的、脂肪族的或非極性的殘基;對應於X108的殘基是鹼性的或受限 的殘基;對應於Xlll的殘基是非極性的或脂肪族的殘基;對應於X139的殘基是非極性的 或脂肪族的殘基;對應於X145的殘基是酸性的、脂肪族的或非極性的殘基;對應於X147的 殘基是芳香族的、脂肪族的或非極性的殘基;對應於X148的殘基是非極性的或脂肪族的殘 基;對應於X151的殘基是受限的、非極性的或脂肪族的殘基;對應於X152的殘基是極性 的、芳香族的、脂肪族的或非極性的殘基;對應於X163的殘基是非極性的或脂肪族的殘基; 對應於X165的殘基是極性的、非極性的或脂肪族的殘基;對應於X173的殘基是酸性的、非 極性的或脂肪族的殘基;對應於X179的殘基是芳香族的、鹼性的、脂肪族的或非極性的殘 基;對應於X194的殘基是受限的、極性的、脂肪族的或非極性的殘基;對應於X196的殘基 是非極性的或脂肪族的殘基;對應於X197的殘基是酸性的殘基;對應於X198的殘基是酸 性的或極性的殘基;對應於X210的殘基是極性的或鹼性的殘基;對應於X211的殘基是鹼 性的、脂肪族的、非極性的、酸性的或極性的殘基;對應於X212的殘基是極性的、脂肪族的 或非極性的殘基;對應於X216的殘基是受限的或鹼性的殘基;對應於X223的殘基是非極 性的或脂肪族的殘基;對應於X226的殘基是非極性的或極性的殘基;對應於X233的殘基 是極性的或酸性的殘基;對應於X235的殘基是極性的或芳香族的殘基;對應於X248的殘 基是非極性的或芳香族的殘基;而且對應於X249的殘基是芳香族的殘基。在一些實施方 案中,胺基酸序列可具有至少2、3、4、5、6或更多種特徵。在一些實施方案中,包括基於SEQ ID NO 111、112或139 (或其區域)中的序列式的胺基酸序列的多肽與SEQ ID NO :2、4或 114中的參考序列相比可另外在未被上面的X所指出的殘基位置上具有一個或多個殘基 差異。在一些實施方案中,所述差異可以是在未被上面的X所限定的其他胺基酸殘基位置上的 1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18、1-20、 1-22、1-24、1-26、1-30、1-35或約1_40個殘基差異。在一些實施方案中,差異的數目可以 是在其他胺基酸殘基位置上的 1、2、3、4、5、6、7、8、9、10、11、12、14、15、16、18、20、22、24、26、 30,35或約40個殘基差異。在一些實施方案中,所述差異包括保守突變。在一些 實施方案中,包括基於SEQ ID N0:lll、112或139或其區域(例如殘基 90-211)中的序列式的胺基酸序列的多肽與SEQ ID NO :2、4或114中的胺基酸序列相比可 具有一個或多個保守突變。示例性的保守突變包括胺基酸替換,例如但不限於用另一種芳 香族殘基例如酪氨酸替換對應於X27的殘基苯丙氨酸(F);用另一種非極性的或脂肪族殘 基例如纈氨酸替換對應於X57的殘基異亮氨酸(I);用另一種非極性的或脂肪族殘基例如 纈氨酸替換對應於X64的殘基丙氨酸(A);用另一種酸性的殘基例如穀氨酸替換對應於X66 的殘基天冬氨酸(D);用另一種鹼性殘基例如精氨酸替換對應於X72的殘基賴氨酸(K);用 另一種非極性的或脂肪族殘基例如纈氨酸替換對應於X80的殘基丙氨酸(A);用另一種極 性的殘基例如絲氨酸替換對應於X93的殘基異亮氨酸(I);用另一種非極性的殘基例如甘 氨酸替換對應於X94的殘基丙氨酸(A);用另一種非極性的或脂肪族殘基例如亮氨酸替換 對應於X95的殘基纈氨酸(V);用另一種極性的殘基例如蘇氨酸替換對應於X96的殘基絲 氨酸(S);用另一種非極性的或脂肪族殘基例如異亮氨酸替換對應於X148的殘基纈氨酸 (V);用另一種極性的殘基例如絲氨酸替換對應於X152的殘基蘇氨酸;用另一種非極性的 或脂肪族殘基例如異亮氨酸替換對應於X163的殘基纈氨酸(V);用另一種芳香族殘基例如 苯丙氨酸替換對應於X179的殘基酪氨酸(Y);用另一種脂肪族殘基例如亮氨酸替換對應於 X196的殘基纈氨酸(V);用另一種酸性的殘基例如穀氨酸替換對應於X198的殘基天冬氨酸 (D);用另一種非極性的或脂肪族殘基例如纈氨酸替換對應於X223的殘基異亮氨酸(I);以 及用另一種芳香族殘基例如色氨酸替換對應於X249的殘基酪氨酸(Y)。在一些實施方案中,包括基於SEQ ID N0:lll、112或139或其區域(例如殘基 90-211)中的序列式的胺基酸序列的,具有本文所述對應於X190和X202的殘基的特定特 徵或對應於X190、X195和X202的殘基的特定特徵的酮還原酶多肽,還可包括一個或多個選 自如下的特徵對應於X7的殘基是組氨酸、脯氨酸、甘氨酸、甲硫氨酸、丙氨酸、纈氨酸、亮 氨酸或異亮氨酸,特別是甘氨酸或組氨酸;對應於X17的殘基是甘氨酸、甲硫氨酸、丙氨酸、 纈氨酸、亮氨酸、異亮氨酸,特別是甲硫氨酸;對應於X25的殘基是穀氨酸、天冬氨酸、絲氨 酸、蘇氨酸、穀氨醯胺或天冬醯胺,特別是蘇氨酸或天冬氨酸;對應於X27的殘基是酪氨酸、 苯丙氨酸、色氨酸,特別是酪氨酸;對應於X41的殘基是絲氨酸、蘇氨酸、穀氨醯胺、天冬醯 胺、甘氨酸、甲硫氨酸、丙氨酸、纈氨酸、亮氨酸或異亮氨酸,特別是絲氨酸或丙氨酸;對應於 X53的殘基是絲氨酸、蘇氨酸、穀氨醯胺、天冬醯胺、甘氨酸、甲硫氨酸、丙氨酸、纈氨酸、亮氨 酸、異亮氨酸、天冬氨酸或穀氨酸,特別是蘇氨酸、甘氨酸或天冬氨酸;對應於X57的殘基是 甘氨酸、甲硫氨酸、丙氨酸、纈氨酸、亮氨酸或異亮氨酸,特別是纈氨酸;對應於X64的殘基 是絲氨酸、蘇氨酸、穀氨醯胺、天冬醯胺、甘氨酸、甲硫氨酸、丙氨酸、纈氨酸、亮氨酸或異亮 氨酸,特別是絲氨酸、丙氨酸或纈氨酸;對應於X66的殘基是天冬氨酸或穀氨酸;對應於X68 的殘基是絲氨酸、蘇氨酸、穀氨醯胺、天冬醯胺、天冬氨酸、穀氨酸、甘氨酸、甲硫氨酸、丙氨 酸、纈氨酸、亮氨酸或異亮氨酸,特別是蘇氨酸、天冬氨酸、丙氨酸、纈氨酸或穀氨酸;對應於 X72的殘基是賴氨酸或精氨酸,特別是精氨酸;對應於X76的殘基是絲氨酸、蘇氨酸、穀氨醯胺、天冬醯胺、甘氨酸、丙氨酸、纈氨酸、亮氨酸或異亮氨酸,特別是丙氨酸或蘇氨酸;對應於 X80的殘基是絲氨酸、蘇氨酸、穀氨醯胺、天冬醯胺、甘氨酸、甲硫氨酸、丙氨酸、纈氨酸、亮氨 酸或異亮氨酸,特別是丙氨酸、蘇氨酸或纈氨酸;對應於X93的殘基是絲氨酸、蘇氨酸、穀氨 醯胺、天冬醯胺、甘氨酸、甲硫氨酸、丙氨酸、纈氨酸、亮氨酸或異亮氨酸,特別是異亮氨酸、 絲氨酸、丙氨酸或甘氨酸;對應於X94的殘基是半胱氨酸、甘氨酸、甲硫氨酸、丙氨酸、纈氨 酸、亮氨酸或異亮氨酸,特別是半胱氨酸、甘氨酸或丙氨酸;對應於X95的殘基是天冬氨酸、 穀氨酸、甘氨酸、甲硫氨酸、丙氨酸、纈氨酸、亮氨酸或異亮氨酸,特別是纈氨酸、亮氨酸或谷 氨酸;對應於X96的殘基是半胱氨酸、絲氨酸、蘇氨酸、穀氨醯胺、天冬醯胺、甘氨酸、甲硫氨 酸、丙氨酸、纈氨酸、亮氨酸或異亮氨酸,特別是天冬醯胺、絲氨酸、纈氨酸、亮氨酸、異亮氨 酸或蘇氨酸;對應於X97的殘基是賴氨酸、精氨酸、組氨酸、脯氨酸、絲氨酸、蘇氨酸、穀氨醯 胺或天冬醯胺,特別是賴氨酸、組氨酸或絲氨酸;對應於XlOO的殘基是賴氨酸、精氨酸、絲 氨酸、蘇氨酸、穀氨醯胺、天冬醯胺、甘氨酸、丙氨酸、纈氨酸、亮氨酸或異亮氨酸,特別是谷 氨酸、賴氨酸、穀氨醯胺或丙氨酸;對應於X108的殘基是精氨酸、賴氨酸、組氨酸或脯氨酸, 特別是精氨酸或組氨酸;對應於Xlll的殘基是甘氨酸、甲硫氨酸、丙氨酸、纈氨酸、亮氨酸 或異亮氨酸,特別是甲硫氨酸;對應於X139的殘基是甘氨酸、甲硫氨酸、丙氨酸、纈氨酸、亮 氨酸或異亮氨酸,特別是亮氨酸;對應於X145的 殘基是天冬氨酸、穀氨酸、甘氨酸、甲硫氨 酸、丙氨酸、纈氨酸、亮氨酸或異亮氨酸,特別是穀氨酸或亮氨酸;對應於X147的殘基是酪 氨酸、苯丙氨酸、色氨酸、甘氨酸、甲硫氨酸、丙氨酸、纈氨酸、亮氨酸或異亮氨酸,特別是苯 丙氨酸或亮氨酸;對應於X148的殘基是甘氨酸、甲硫氨酸、丙氨酸、纈氨酸、亮氨酸或異亮 氨酸,特別是異亮氨酸;對應於X151的殘基是脯氨酸、組氨酸、甘氨酸、甲硫氨酸、丙氨酸、 纈氨酸、亮氨酸或異亮氨酸,特別是丙氨酸;對應於X152的殘基是絲氨酸、蘇氨酸、穀氨醯 胺、天冬醯胺、酪氨酸、苯丙氨酸、色氨酸、甘氨酸、甲硫氨酸、丙氨酸、纈氨酸、亮氨酸或異亮 氨酸,特別是蘇氨酸、色氨酸、丙氨酸或絲氨酸;對應於X163的殘基是甘氨酸、甲硫氨酸、丙 氨酸、纈氨酸、亮氨酸或異亮氨酸,特別是異亮氨酸;對應於X165的殘基是絲氨酸、蘇氨酸、 穀氨醯胺天冬醯胺、甘氨酸、甲硫氨酸、丙氨酸、纈氨酸、亮氨酸或異亮氨酸,特別是天冬醯 胺;對應於X173的殘基是天冬氨酸、穀氨酸、甘氨酸、甲硫氨酸、丙氨酸、纈氨酸、亮氨酸、異 亮氨酸,特別是纈氨酸;對應於X179的殘基是酪氨酸、苯丙氨酸、色氨酸、精氨酸、賴氨酸、 甘氨酸、甲硫氨酸、丙氨酸、纈氨酸、亮氨酸或異亮氨酸,特別是酪氨酸、苯丙氨酸、賴氨酸或 亮氨酸;對應於X194的殘基是脯氨酸、組氨酸、絲氨酸、蘇氨酸、穀氨醯胺、天冬醯胺、甘氨 酸、甲硫氨酸、丙氨酸、纈氨酸、亮氨酸或異亮氨酸,特別是脯氨酸、穀氨醯胺、絲氨酸或亮氨 酸;對應於X196的殘基是甘氨酸、甲硫氨酸、丙氨酸、纈氨酸、亮氨酸或異亮氨酸,特別是亮 氨酸;對應於X197的殘基是天冬氨酸或穀氨酸,特別是穀氨酸;對應於X198的殘基是天冬 氨酸、穀氨酸、絲氨酸、蘇氨酸、穀氨醯胺或天冬醯胺,特別是天冬氨酸、穀氨酸或穀氨醯胺; 對應於X210的殘基是精氨酸、賴氨酸、絲氨酸、蘇氨酸、穀氨醯胺或天冬醯胺,特別是蘇氨 酸或精氨酸;對應於X211的殘基是賴氨酸、精氨酸、天冬氨酸、穀氨酸、甘氨酸、甲硫氨酸、 丙氨酸、纈氨酸、亮氨酸、異亮氨酸、絲氨酸、蘇氨酸、穀氨醯胺或天冬醯胺,特別是賴氨酸、 纈氨酸、亮氨酸、精氨酸、蘇氨酸、天冬氨酸或異亮氨酸;對應於X212的殘基是絲氨酸、蘇氨 酸、穀氨醯胺、天冬醯胺、甘氨酸、甲硫氨酸、丙氨酸、纈氨酸、亮氨酸或異亮氨酸,特別是蘇 氨酸、絲氨酸或纈氨酸;對應於X216的殘基是脯氨酸、組氨酸、精氨酸或賴氨酸,特別是組氨酸或精氨酸;對應於X223的殘基是甘氨酸、甲硫氨酸、丙氨酸、纈氨酸、亮氨酸或異亮氨酸,特別是纈氨酸;對應於X226的殘基是甘氨酸、甲硫氨酸、丙氨酸、纈氨酸、亮氨酸、異亮 氨酸、絲氨酸、蘇氨酸、穀氨醯胺或天冬醯胺,特別是蘇氨酸;對應於X233的殘基是絲氨酸、 蘇氨酸、穀氨醯胺、天冬醯胺、天冬氨酸、穀氨酸,特別是天冬醯胺或天冬氨酸;對應於X235 的殘基是絲氨酸、蘇氨酸、穀氨醯胺、天冬醯胺、酪氨酸、苯丙氨酸、色氨酸,特別是絲氨酸或 色氨酸;對應於X248的殘基是甘氨酸、甲硫氨酸、丙氨酸、纈氨酸、亮氨酸、異亮氨酸、酪氨 酸、苯丙氨酸或色氨酸,特別是甘氨酸或色氨酸;並且對應於X249的殘基是酪氨酸、苯丙氨 酸或色氨酸,特別是色氨酸。在一些實施方案中,胺基酸序列可具有至少2、3、4、5、6或更 多種由上述X所定義的另外的特徵。在一些實施方案中,包括基於SEQ ID N0:lll、112或 139(或其區域)中的序列式的胺基酸序列的酮還原酶多肽與SEQ ID N0:2、4或114中的參 考序列相比在未被上面的X所指出的殘基位置上可另外具有一個或多個殘基差異。在一些 實施方案中,所述差異可以是在未被上面的X所限定的其他胺基酸殘基位置上的1-2、1-3、 1-4、1-5、1-6、1-7、1-8、1-9、1-10U-11、1-12U-14、1-15U-16、1-18U_20、1-22、1-24、 1-26、1-30、1-35或約1-40個殘基差異。在一些實施方案中,差異的數目可以是在其他氨基 酸殘基位置上的 1、2、3、4、5、6、7、8、9、10、11、12、14、15、16、18、20、22、24、26、30、35或40個 殘基差異。在一些實施方案中,所述差異包括保守突變。 在一些實施方案中,包括基於SEQ ID N0:lll、112或139或其區域(例如殘基 90-211)中的序列式的胺基酸序列,具有本文所述對應於X190和X202的殘基的特定特徵 或對應於X190、X195和X202的殘基的特定特徵的改進的酮還原酶,可另外具有一個或多 個或至少所有的下述特徵對應於X7的殘基是受限的或非極性的殘基,特別是組氨酸;對 應於X94的殘基是半胱氨酸、脂肪族的或非極性的殘基,特別是半胱氨酸或甘氨酸;對應 於X96的殘基是半胱氨酸、極性的、脂肪族的或非極性的殘基,特別是蘇氨酸、半胱氨酸、纈 氨酸、亮氨酸或異亮氨酸;對應於X147的殘基是芳香族的、脂肪族的或非極性的殘基,特別 是亮氨酸。在一些實施方案中,酮還原酶多肽除了前述特徵之外可具有一種或多種如下特 徵對應於X93的殘基是極性的、脂肪族的或非極性的殘基,特別是絲氨酸;對應於X194的 殘基是受限的、極性的、脂肪族的或非極性的殘基,特別是亮氨酸、絲氨酸或穀氨醯胺;對應 於X196的殘基是非極性的或脂肪族的殘基,特別是亮氨酸;並且對應於X211的殘基是鹼 性的、脂肪族的、非極性的、酸性的或極性的殘基,特別是纈氨酸、亮氨酸、異亮氨酸或蘇氨 酸。在一些實施方案中,酮還原酶多肽除了前述特徵之外可具有一種或多種如下特徵對應 於X17的殘基是非極性的或脂肪族的殘基,特別是甲硫氨酸;對應於X27的殘基是芳香族的 殘基,特別是酪氨酸;對應於X64的殘基是極性的、非極性的或脂肪族的殘基,特別是纈氨 酸;對應於X80的殘基是脂肪族的、非極性的或極性的殘基,特別是蘇氨酸;對應於XlOO的 殘基是鹼性的、酸性的、極性的、脂肪族的或非極性的殘基,特別是賴氨酸;對應於X198的 殘基是酸性的或極性的殘基,特別是穀氨酸;並且對應於X216的殘基是受限的或鹼性的殘 基,特別是精氨酸。在一些實施方案中,酮還原酶多肽除了前述特徵之外可具有一種或多種 如下特徵對應於X25的殘基是極性的或酸性的殘基,特別是蘇氨酸;對應於X41的殘基是 極性的、脂肪族的或非極性的殘基,特別是絲氨酸或丙氨酸;對應於X53的殘基是極性的、 非極性的或酸性的殘基,特別是天冬氨酸;對應於X57的殘基是非極性的或脂肪族的殘基, 特別是纈氨酸;對應於X66的殘基是酸性的殘基,特別是穀氨酸;對應於X68的殘基是極性的、酸性的、脂肪族的或非極性的殘基,特別是纈氨酸;對應於X72的殘基是鹼性的殘基,特 別是精氨酸;對應於X76的殘基是脂肪族的、非極性的或極性的殘基,特別是丙氨酸;對應 於X95的殘基是脂肪族的、非極性的或酸性的殘基,特別是亮氨酸或穀氨酸;對應於X97的 殘基是鹼性的、受限的或極性的殘基,特別是組氨酸;對應於X108的殘基是鹼性的或受限 的殘基,特別是組氨酸;對應於Xlll的殘基是非極性的或脂肪族的殘基,特別是甲硫氨酸; 對應於X139的殘基是非極性的或脂肪族的殘基,特別是亮氨酸;對應於X145的殘基是酸 性的、脂肪族的或非極性的殘基,特別是亮氨酸或穀氨醯胺;對應於X148的殘基是非極性 的或脂肪族的殘基,特別是異亮氨酸;對應於X151的殘基是受限的、非極性的或脂肪族的 殘基,特別是丙氨酸;對應於X152的殘基是極性的、芳香族的、脂肪族的或非極性的殘基, 特別是絲氨酸;對應於X163的殘基是非極性的或脂肪族的殘基,特別是異亮氨酸;對應於 X165的殘基是極性的、非極性的或脂肪族的殘基,特別是天冬醯胺;對應於X173的殘基是 酸性的、非極性的或脂肪族的殘基,特別是纈氨酸;對應於X179的殘基是芳香族的、鹼性 的、脂肪族的或非極性的殘基,特別 是苯丙氨酸;對應於X197的殘基是酸性的殘基,特別是 穀氨酸;對應於X210的殘基是極性的或鹼性的殘基,特別是精氨酸;對應於X212的殘基是 極性的、脂肪族的或非極性的殘基,特別是纈氨酸或絲氨酸;對應於X223的殘基是非極性 的或脂肪族的殘基,特別是纈氨酸;對應於X226的殘基是非極性的或極性的殘基,特別是 蘇氨酸;對應於X233的殘基是極性的或酸性的殘基,特別是天冬醯胺或天冬氨酸;對應於 X235的殘基是極性的或芳香族的殘基,特別是色氨酸;對應於X248的殘基是非極性的或芳 香族的殘基,特別是甘氨酸或色氨酸;並且對應於X249的殘基是芳香族的殘基,特別是色 氨酸。對於本領域技術人員將是明顯的是,前述組中特徵的各種組合可被用來形成本公開 的酮還原酶。在一些實施方案中,包括基於SEQ ID N0:lll、112或139或其區域(例如殘基 90-211)中的序列式的胺基酸序列,具有本文所述對應於X190和X202的殘基的特定特徵或 對應於X190、X195和X202的殘基的特定特徵的改進的酮還原酶,還包括一個或多個或至少 所有的下述另外特徵對應於X94的殘基是半胱氨酸、脂肪族的或非極性的殘基特別是半 胱氨酸或甘氨酸;對應於X96的殘基是半胱氨酸、極性的、脂肪族的或非極性的殘基特別是 蘇氨酸、半胱氨酸、纈氨酸、亮氨酸或異亮氨酸;並且對應於X211的殘基是鹼性的、脂肪族 的、非極性的、酸性的或極性的殘基特別是纈氨酸、亮氨酸、異亮氨酸或蘇氨酸。在一些實施 方案中,酮還原酶多肽與SEQID NO :2、4或114中的參考序列相比在其他胺基酸殘基位置上 可另外具有 1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18、 1-20、1-22、1-24、1-26、1-30、1-35或約1-40個殘基差異。在一些實施方案中,差異的數目 可以是在其他胺基酸殘基上的 1、2、3、4、5、6、7、8、9、10、11、12、14、15、16、18、20、22、24、26、 30、35或約40個殘基差異。在一些實施方案中,所述差異包括保守突變。在一些實施方案 中,酮還原酶多肽包括與具有前述特徵的基於SEQ ID NO :2、4或114的參考序列至少85%、 86%,87%,88%,89%,90%,91%,92%,93%,94%,95%,96%,97%,98%^; 99%相同的 胺基酸序列,條件是酮還原酶具有至少含前述特徵的胺基酸序列。在一些實施方案中,包括基於SEQ ID N0:lll、112或139或其區域(例如殘基 90-211)中的序列式的胺基酸序列,具有本文所述對應於X190和X202的殘基的特定特徵 或對應於X190、X195和X202的殘基的特定特徵的改進的酮還原酶,還包括一個或多個或至少所有的下述另外特徵對應於X94的殘基是半胱氨酸、脂肪族的或非極性的殘基,特別是 半胱氨酸或甘氨酸;對應於X96的殘基是半胱氨酸、極性的、脂肪族的或非極性的殘基,特 別是蘇氨酸、半胱氨酸、纈氨酸、亮氨酸或異亮氨酸;並且對應於X147的殘基是脂肪族的、 脂肪族的或非極性的殘基,特別是亮氨酸。在一些實施方案中,酮還原酶多肽與SEQ ID NO
2、4或114中的參考序列相比在其他胺基酸殘基位置上可另外具有1-2、1-3、1-4、1_5、1_6、 1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18、1-20、1-22、1-24、1-26、1-30、1-35 或約1-40個殘基差異。在一些實施方案中,差異的數目可以是在其他胺基酸殘基上的1、2、
3、4、5、6、7、8、9、10、11、12、14、15、16、18、20、22、24、26、30、35或約 40 個殘基差異。在一些 實施方案中,所述差異包括保守突變。在一些實施方案中,酮還原酶多肽包括與具有前述特 徵的基於 SEQ ID NO :2、4 或 114 的參考序列至少 85%、86%、87%、88%、89%、90%、91%、 92%、93%、94%、95%、96%、97%、9 8%或99%相同的胺基酸序列,條件是酮還原酶具有至 少含前述特徵的胺基酸序列。在一些實施方案中,包括基於SEQ ID N0:lll、112或139或其區域(例如殘基 90-211)中的序列式的胺基酸序列,具有本文所述對應於X190和X202的殘基的特定特徵 或對應於X190、X195和X202的殘基的特定特徵的改進的酮還原酶,還包括一個或多個或至 少所有的下述另外特徵對應於X94的殘基是半胱氨酸、脂肪族的或非極性的殘基,特別是 半胱氨酸或甘氨酸;對應於X96的殘基是半胱氨酸、極性的、脂肪族的或非極性的殘基,特 別是蘇氨酸、半胱氨酸、纈氨酸、亮氨酸或異亮氨酸;對應於X147的殘基是芳香族的、脂肪 族的或非極性的殘基,特別是亮氨酸;並且對應於X211的殘基是鹼性的、脂肪族的、非極性 的、酸性的或極性的殘基,特別是纈氨酸、亮氨酸、異亮氨酸或蘇氨酸。在一些實施方案中, 酮還原酶多肽與SEQ ID NO :2、4或114中的參考序列相比在其他胺基酸殘基位置上可另外 具有 1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18、1-20、 1-22、1-24、1-26、1-30、1-35或約1_40個殘基差異。在一些實施方案中,差異的數目可以是 在其他胺基酸殘基上的 1、2、3、4、5、6、7、8、9、10、11、12、14、15、16、18、20、22、24、26、30、35 或約40個殘基差異。在一些實施方案中,所述差異包括保守突變。在一些實施方案中,酮 還原酶多肽包括與具有前述特徵的基於SEQ ID N0:2、4或114的參考序列至少85%、86%、 87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或 99%相同的胺基酸 序列,條件是酮還原酶具有至少含前述特徵的胺基酸序列。在一些實施方案中,包括基於SEQ ID N0:lll、112或139或其區域(例如殘基 90-211)中的序列式的胺基酸序列,具有本文所述對應於X190和X202的殘基的特定特徵或 對應於X190、X195和X202的殘基的特定特徵的改進的酮還原酶,還包括一個或多個或至少 所有的下述另外特徵對應於X94的殘基是半胱氨酸、脂肪族的或非極性的殘基,特別是半 胱氨酸或甘氨酸;對應於X96的殘基是半胱氨酸、極性的、脂肪族的或非極性的殘基,特別 是蘇氨酸、半胱氨酸、纈氨酸、亮氨酸或異亮氨酸;對應於X194的殘基是受限的、極性的、月旨 肪族的或非極性的殘基,特別是亮氨酸、絲氨酸或穀氨醯胺;並且對應於X211的殘基是鹼 性的、脂肪族的、非極性的、酸性的或極性的殘基,特別是纈氨酸。在一些實施方案中,酮還 原酶多肽與SEQ ID NO :2、4或114中的參考序列相比在其他胺基酸殘基位置上可另外具有 1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18、1-20、1-22、 1-24、1-26、1-30、1-35或約1_40個殘基差異。在一些實施方案中,差異的數目可以是在其他胺基酸殘基上的 1、2、3、4、5、6、7、8、9、10、11、12、14、15、16、18、20、22、24、26、30、35 或約
40個殘基差異。在一些實施方案中,所述差異包括保守突變。在一些實施方案中,酮還原酶 多肽包括與具有前述特徵的基於SEQ ID而2、4或114的參考序列至少85%、86%、87%、 88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或 99%相同的胺基酸序列, 條件是酮還原酶具有至少含前述特徵的胺基酸序列。
在一些實施方案中,包括基於SEQ ID N0:lll、112或139或其區域(例如殘基 90-211)中的序列式的胺基酸序列,具有本文所述對應於X190和X202的殘基的特定特徵 或對應於X190、X195和X202的殘基的特定特徵的改進的酮還原酶,還包括一個或多個或至 少所有的下述另外特徵對應於X94的殘基是半胱氨酸、脂肪族的或非極性的殘基,特別是 半胱氨酸或甘氨酸;對應於X96的殘基是半胱氨酸、極性的、脂肪族的或非極性的殘基,特 別是蘇氨酸、半胱氨酸、纈氨酸、亮氨酸或異亮氨酸;對應於X147的殘基是芳香族的、脂肪 族的或非極性的殘基,特別是亮氨酸;對應於X194的殘基是受限的、極性的、脂肪族的或非 極性的殘基,特別是亮氨酸、絲氨酸或穀氨醯胺;並且對應於X211的殘基是鹼性的、脂肪族 的、非極性的、酸性的或極性的殘基,特別是纈氨酸、亮氨酸、異亮氨酸或蘇氨酸。在一些實 施方案中,酮還原酶多肽與SEQ ID NO :2、4或114中的參考序列相比在其他胺基酸殘基位 置上可另外具有 1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-15、1-16、 1-18、1-20、1-22、1-24、1-26、1-30、1-35或約1-40個殘基差異。在一些實施方案中,差異 的數目可以是在其他胺基酸殘基上的1、2、3、4、5、6、7、8、9、10、11、12、14、15、16、18、20、22、 24、26、30、35或約40個殘基差異。在一些實施方案中,所述差異包括保守突變。在一些實施 方案中,酮還原酶多肽包括與具有前述特徵的基於SEQ ID NO :2、4或114的參考序列至少 85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98% 或 99% 相 同的胺基酸序列,條件是酮還原酶具有至少含前述特徵的胺基酸序列。在一些實施方案中,包括基於SEQ ID N0:lll、112或139或其區域(例如殘基 90-211)中的序列式的胺基酸序列,具有本文所述對應於X190和X202的殘基的特定特徵 或對應於X190、X195和X202的殘基的特定特徵的改進的酮還原酶,還包括一個或多個或 至少所有的下述另外特徵對應於X93的殘基是極性的、脂肪族的或非極性的殘基,特別是 絲氨酸;對應於X94的殘基是半胱氨酸、脂肪族的或非極性的殘基,特別是半胱氨酸或甘氨 酸;對應於X96的殘基是半胱氨酸、極性的、脂肪族的或非極性的殘基,特別是蘇氨酸或亮 氨酸;並且對應於X211的殘基是鹼性的、脂肪族的、非極性的、酸性的或極性的殘基,特別 是蘇氨酸、異亮氨酸、亮氨酸或纈氨酸。在一些實施方案中,酮還原酶多肽與SEQ ID NO :2、 4或114中的參考序列相比在其他胺基酸殘基位置上可另外具有1-2、1-3、1-4、1-5、1-6、 1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18、1-20、1-22、1-24、1-26、1-30、1-35 或約1-40個殘基差異。在一些實施方案中,差異的數目可以是在其他胺基酸殘基上的1、2、 3、4、5、6、7、8、9、10、11、12、14、15、16、18、20、22、24、26、30、35 或約 40 個殘基差異。在一些 實施方案中,所述差異包括保守突變。在一些實施方案中,酮還原酶多肽包括與具有前述特 徵的基於 SEQ ID NO :2、4 或 114 的參考序列至少 85%、86%、87%、88%、89%、90%、91%、 92%、93%、94%、95%、96%、97%、98%或99%相同的胺基酸序列,條件是酮還原酶具有至 少含前述特徵的胺基酸序列。在一些實施方案中,包括基於SEQ ID N0:lll、112或139或其區域(例如殘基90-211)中的序列式的胺基酸序列,具有本文所述對應於X190和X202的殘基的特定特徵 或對應於X190、X195和X202的殘基的特定特徵的改進的酮還原酶,還包括一個或多個或 至少所有的下述另外特徵對應於X93的殘基是極性的、脂肪族的或非極性的殘基,特別是 絲氨酸;對應於X94的殘基是半胱氨酸、脂肪族的或非極性的殘基,特別是半胱氨酸或甘氨 酸;對應於X96的殘基是半胱氨酸、極性的、脂肪族的或非極性的殘基,特別是半胱氨酸、蘇 氨酸、纈氨酸、亮氨酸或異亮氨酸;對應於XlOO的殘基是鹼性的、酸性的、極性的、脂肪族的 或非極性的殘基,特別是賴氨酸;對應於X147的殘基是芳香族的、脂肪族的或非極性的殘 基,特別是亮氨酸;對應於X152的殘基是極性的、芳香族的、脂肪族的或非極性的殘基,特 別是絲氨酸;對應於X194的殘基是受限的、極性的、脂肪族的或非極性的殘基,特別是亮氨 酸、絲氨酸或穀氨醯胺;對應於X196的殘基是非極性的或脂肪族的殘基,特別是亮氨酸; 並且對應於X211的殘基是鹼性的、脂肪族的、非極性的、酸性的或極性的殘基,特別是纈氨 酸、亮氨酸、異亮氨酸或蘇氨酸。在一些實施方案中,酮還原酶多肽與SEQ IDNO:2、4或114 中的參考序列相比在其他胺基酸殘基位置上可另外具有1-2、1-3、1-4、1-5、1-6、1-7、1-8、 1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18、1-20、1-22、1-24、1-26、1-30、1-35 或約 1-40 個殘基差異。在一些實施方案中,差異的數目可以是在其他胺基酸殘基上的1、2、3、4、5、6、 7、8、9、10、11、12、14、15、16、18、20、22、24、26、30、35 或約 40 個殘基差異。在一些實施方案 中,所述差異包括保守突變。在一些實施方案中,酮還原酶多肽包括與具有前述特徵的基 於 SEQ ID NO :2、4 或 114 的參考序列至少 85%、86%、87%、88%、89%、90%、91%、92%、 93%、94%、95%、96%、97%、98%或99%相同的胺基酸序列,條件是酮還原酶具有至少含 前述特徵的胺基酸序列。 在一些實施方案中,包括基於SEQ ID NO :111、112或139或其區域(例如殘基90-211)中的序列式的胺基酸序列,具有本文所述對應於X190和X202的殘基的特定特徵 或對應於X190、X195和X202的殘基的特定特徵的改進的酮還原酶,還包括一個或多個或 至少所有的下述另外特徵對應於X7的殘基是受限的或非極性的殘基,特別是組氨酸;對 應於X66的殘基是酸性的殘基,特別是穀氨酸;對應於X93的殘基是極性的、脂肪族的或非 極性的殘基,特別是絲氨酸或甘氨酸;對應於X94的殘基是半胱氨酸、非極性的或脂肪族的 殘基,特別是半胱氨酸;對應於X96的殘基是半胱氨酸、極性的、脂肪族的或非極性的殘基, 特別是異亮氨酸、亮氨酸或蘇氨酸;對應於X147的殘基是芳香族的、脂肪族的或非極性的 殘基,特別是亮氨酸;對應於X194的殘基是受限的、極性的、脂肪族的或非極性的殘基,特 別是亮氨酸、絲氨酸或穀氨醯胺;對應於X196的殘基是非極性的或脂肪族的殘基,特別是 亮氨酸;對應於X198的殘基是酸性的或極性的殘基,特別是穀氨酸;並且對應於X211的 殘基是鹼性的、脂肪族的、非極性的、酸性的或極性的殘基,特別是蘇氨酸、纈氨酸、亮氨酸 或異亮氨酸。在一些實施方案中,酮還原酶多肽與SEQ ID NO :2、4或114中的參考序列相 比在其他胺基酸殘基位置上可另外具有1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、 1-12、1-14、1-15、1-16、1-18、1-20、1-22、1-24、1-26、1-30、1-35 或約 1-40 個殘基差異。在 一些實施方案中,差異的數目可以是在其他胺基酸殘基上的1、2、3、4、5、6、7、8、9、10、11、 12、14、15、16、18、20、22、24、26、30、35或約40個殘基差異。在一些實施方案中,所述差異包 括保守突變。在一些實施方案中,酮還原酶多肽包括與具有前述特徵的基於SEQ ID NO :2、 4 或 114 的參考序列至少 85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96 %、97 %、98 %或99 %相同的胺基酸序列,條件是酮還原酶具有至少含前述特徵的胺基酸 序列。在一些實施方案中,包括基於SEQ ID NO :111、112或139或其區域(例如殘基 90-211)中的序列式的胺基酸序列,具有本文所述對應於X190和X202的殘基的特定特徵 或對應於X190、X195和X202的殘基的特定特徵的改進的酮還原酶,還包括一個或多個或 至少所有的下述另外特徵對應於X7的殘基是受限的或非極性的殘基 ,特別是組氨酸;對 應於X17的殘基是非極性的或脂肪族的殘基,特別是甲硫氨酸;對應於X27的殘基是芳香 族的殘基,特別是酪氨酸;對應於X64的殘基是極性的、非極性的或脂肪族的殘基,特別是 纈氨酸;對應於X66的殘基是酸性的殘基,特別是穀氨酸;對應於X80的殘基是脂肪族的、 非極性的或極性的殘基,特別是蘇氨酸;對應於X93的殘基是極性的、脂肪族的或非極性的 殘基,特別是絲氨酸或甘氨酸;對應於X94的殘基是半胱氨酸、非極性的或脂肪族的殘基, 特別是半胱氨酸;對應於X96的殘基是半胱氨酸、極性的、脂肪族的或非極性的殘基,特別 是異亮氨酸、亮氨酸或蘇氨酸;對應於XlOO的殘基是鹼性的、酸性的、極性的、脂肪族的、非 極性的殘基或受限的殘基,特別是賴氨酸;對應於X147的殘基是芳香族的、脂肪族的或非 極性的殘基,特別是亮氨酸;對應於X194的殘基是受限的、極性的、脂肪族的或非極性的殘 基,特別是亮氨酸、絲氨酸或穀氨醯胺;對應於X196的殘基是非極性的或脂肪族的殘基,特 別是亮氨酸;對應於X198的殘基是酸性的或極性的殘基,特別是穀氨酸;對應於X211的殘 基是鹼性的、脂肪族的、非極性的、酸性的或極性的殘基,特別是蘇氨酸、纈氨酸、亮氨酸或 異亮氨酸;並且對應於X216的殘基是受限的或鹼性的殘基,特別是精氨酸。在一些實施方 案中,酮還原酶多肽與SEQ ID NO :2、4或114中的參考序列相比在其他胺基酸殘基位置上 可另外具有 1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18、 1-20、1-22、1-24、1-26、1-30、1-35或約1-40個殘基差異。在一些實施方案中,差異的數目 可以是在其他胺基酸殘基上的 1、2、3、4、5、6、7、8、9、10、11、12、14、15、16、18、20、22、24、26、 30、35或約40個殘基差異。在一些實施方案中,所述差異包括保守突變。在一些實施方案 中,酮還原酶多肽包括與具有前述特徵的基於SEQ ID NO :2、4或114的參考序列至少85%、 86%,87%,88%,89%,90%,91%,92%,93%,94%,95%,96%,97%,98%^; 99%相同的 胺基酸序列,條件是酮還原酶具有至少含前述特徵的胺基酸序列。在一些實施方案中,包括基於SEQ ID NO :111、112或139或其區域(例如殘基 90-211)中的序列式的胺基酸序列,具有本文所述對應於X190和X202的殘基的特定特徵 或對應於X190、X195和X202的殘基的特定特徵的改進的酮還原酶,還至少包括下述另外 特徵對應於X7的殘基是受限的或非極性的殘基,特別是甘氨酸或組氨酸。在一些實施方 案中,酮還原酶多肽與SEQ ID NO :2、4或114中的參考序列相比在其他胺基酸殘基位置上 可另外具有 1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18、 1-20、1-22、1-24、1-26、1-30、1-35或約1-40個殘基差異。在一些實施方案中,差異的數目 可以是在其他胺基酸殘基上的 1、2、3、4、5、6、7、8、9、10、11、12、14、15、16、18、20、22、24、26、 30、35或約40個殘基差異。在一些實施方案中,所述差異包括保守突變。在一些實施方案 中,酮還原酶多肽包括與具有前述特徵的基於SEQ ID NO :2、4或114的參考序列至少85%、 86%,87%,88%,89%,90%,91%,92%,93%,94%,95%,96%,97%,98%^; 99%相同的 胺基酸序列,條件是酮還原酶具有至少含前述特徵的胺基酸序列。
在一些實施方案中,包括基於SEQ ID NO :111、112或139或其區域(例如殘基 90-211)中的序列式的胺基酸序列,具有本文所述對應於X190和X202的殘基的特定特徵 或對應於X190、X195和X202的殘基的特定特徵的改進的酮還原酶,還至少包括下述另外特 徵對應於X17的殘基是非極性的或脂肪族的殘基,特別是甲硫氨酸。在一些實施方案中, 酮還原酶多肽與SEQ ID NO :2、4或114中的參考序列相比在其他胺基酸殘基位置上可另外 具有 1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18、1-20、 1-22、1-24、1-26、1-30、1-35或約1_40個殘基差異。在一些實施方案中,差異的數目可以是 在其他胺基酸殘基上的 1、2、3、4、5、6、7、8、9、10、11、12、14、15、16、18、20、22、24、26、30、35 或約40個殘基差異。在一些實施 方案中,所述差異包括保守突變。在一些實施方案中,酮 還原酶多肽包括與具有前述特徵的基於SEQ ID N0:2、4或114的參考序列至少85%、86%、 87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或 99%相同的胺基酸 序列,條件是酮還原酶具有至少含前述特徵的胺基酸序列。在一些實施方案中,包括基於SEQ ID NO :111、112或139或其區域(例如殘基 90-211)中的序列式的胺基酸序列,具有本文所述對應於X190和X202的殘基的特定特徵 或對應於X190、X195和X202的殘基的特定特徵的改進的酮還原酶,還至少包括下述另外特 徵對應於X25的殘基是極性的或酸性的殘基,特別是蘇氨酸。在一些實施方案中,酮還原 酶多肽與SEQ ID NO :2、4或114中的參考序列相比在其他胺基酸殘基位置上可另外具有 1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18、1-20、1-22、 1-24、1-26、1-30、1-35或約1_40個殘基差異。在一些實施方案中,差異的數目可以是在其 他胺基酸殘基上的 1、2、3、4、5、6、7、8、9、10、11、12、14、15、16、18、20、22、24、26、30、35 或約 40個殘基差異。在一些實施方案中,所述差異包括保守突變。在一些實施方案中,酮還原酶 多肽包括與具有前述特徵的基於SEQ IDN0:2、4或114的參考序列至少85%、86%、87%、 88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或 99%相同的胺基酸序列, 條件是酮還原酶具有至少含前述特徵的胺基酸序列。在一些實施方案中,包括基於SEQ ID NO :111、112或139或其區域(例如殘基 90-211)中的序列式的胺基酸序列,具有本文所述對應於X190和X202的殘基的特定特徵 或對應於X190、X195和X202的殘基的特定特徵的改進的酮還原酶,還至少包括下述另外特 徵對應於X27的殘基是芳香族的殘基,特別是酪氨酸。在一些實施方案中,酮還原酶多肽 與SEQ IDNO :2、4或114中的參考序列相比在其他胺基酸殘基位置上可另外具有1_2、1_3、 1-4、1-5、1-6、1-7、1-8、1-9、1-10U-11、1-12、1-14、1-15、1-16、1-18U-20、1-22U_24、 1-26、1-30、1-35或約1-40個殘基差異。在一些實施方案中,差異的數目可以是在其他氨基 酸殘基上的 1、2、3、4、5、6、7、8、9、10、11、12、14、15、16、18、20、22、24、26、30、35或約40 個殘 基差異。在一些實施方案中,所述差異包括保守突變。在一些實施方案中,酮還原酶多肽包 括與具有前述特徵的基於SEQ ID N0:2、4或114的參考序列至少85%、86%、87%、88%、 89%、90%、91%、92%、93%、94%、95%、96%、97%、98% 或 99%相同的胺基酸序列,條件 是酮還原酶具有至少含前述特徵的胺基酸序列。在一些實施方案中,包括基於SEQ ID NO :111、112或139或其區域(例如殘基 90-211)中的序列式的胺基酸序列,具有本文所述對應於X190和X202的殘基的特定特徵 或對應於X190、X195和X202的殘基的特定特徵的改進的酮還原酶,還至少包括下述另外特徵對應於X53的殘基是極性的、非極性的或酸性的殘基,特別是天冬氨酸。在一些實施方 案中,酮還原酶多肽與SEQ ID NO :2、4或114中的參考序列相比在其他胺基酸殘基位置上 可另外具有 1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18、 1-20、1-22、1-24、1-26、1-30、1-35或約1-40個殘基差異。在一些實施方案中,差異的數目 可以是在其他胺基酸殘基上的 1、2、3、4、5、6、7、8、9、10、11、12、14、15、16、18、20、22、24、26、 30、35或約40個殘基差異。在一些實施方案中,所述差異包括保守突變。在一些實施方案 中,酮還原酶多肽包括與具有前述特徵的基於SEQ ID NO :2、4或114的參考序列至少85%、 86%,87%,88%,89%,90%,91%,92%,93%,94%,95%,96%,97%,98%^; 99%相同的 胺基酸序列,條件是酮還原酶具有至少含前述特徵的胺基酸序列。
在一些實施方案中,包括基於SEQ ID NO :111、112或139或其區域(例如殘基 90-211)中的序列式的胺基酸序列,具有本文所述對應於X190和X202的殘基的特定特徵 或對應於X190、X195和X202的殘基的特定特徵的改進的酮還原酶,還至少包括下述另外特 徵對應於X64的殘基是非極性的或脂肪族的殘基,特別是纈氨酸。在一些實施方案中,酮 還原酶多肽與SEQ ID NO :2、4或114中的參考序列相比在其他胺基酸殘基位置上可另外 具有 1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18、1-20、 1-22、1-24、1-26、1-30、1-35或約1_40個殘基差異。在一些實施方案中,差異的數目可以是 在其他胺基酸殘基上的 1、2、3、4、5、6、7、8、9、10、11、12、14、15、16、18、20、22、24、26、30、35 或約40個殘基差異。在一些實施方案中,所述差異包括保守突變。在一些實施方案中,酮 還原酶多肽包括與具有前述特徵的基於SEQ ID N0:2、4或114的參考序列至少85%、86%、 87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或 99%相同的胺基酸 序列,條件是酮還原酶具有至少含前述特徵的胺基酸序列。在一些實施方案中,包括基於SEQ ID N0:lll、112或139或其區域(例如殘基 90-211)中的序列式的胺基酸序列,具有本文所述對應於X190和X202的殘基的特定特徵 或對應於X190、X195和X202的殘基的特定特徵的改進的酮還原酶,還至少包括下述另外 特徵對應於X80的殘基是脂肪族的、非極性的或極性的殘基,特別是纈氨酸或蘇氨酸。在 一些實施方案中,酮還原酶多肽與SEQ ID NO :2、4或114中的參考序列相比在其他胺基酸 殘基位置上可另外具有 1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-15、 1-16、1-18、1-20、1-22、1-24、1-26、1-30、1-35 或約 1-40 個殘基差異。在一些實施方案中, 差異的數目可以是在其他胺基酸殘基上的1、2、3、4、5、6、7、8、9、10、11、12、14、15、16、18、 20、22、24、26、30、35或約40個殘基差異。在一些實施方案中,所述差異包括保守突變。在 一些實施方案中,酮還原酶多肽包括與具有前述特徵的基於SEQ ID N0:2、4或114的參考 序列至少 85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98% 或99 %相同的胺基酸序列,條件是酮還原酶具有至少含前述特徵的胺基酸序列。在一些實施方案中,包括基於SEQ ID N0:lll、112或139或其區域(例如殘基 90-211)中的序列式的胺基酸序列,具有本文所述對應於X190和X202的殘基的特定特徵 或對應於X190、X195和X202的殘基的特定特徵的改進的酮還原酶,還至少包括下述另外特 徵對應於X93的殘基是極性的、脂肪族的或非極性的殘基,特別是絲氨酸。在一些實施方 案中,酮還原酶多肽與SEQ ID NO :2、4或114中的參考序列相比在其他胺基酸殘基位置上 可另外具有 1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18、1-20、1-22、1-24、1-26、1-30、1-35或約1-40個殘基差異。在一些實施方案中,差異的數目 可以是在其他胺基酸殘基上的 1、2、3、4、5、6、7、8、9、10、11、12、14、15、16、18、20、22、24、26、 30、35或約40個殘基差異。在一些實施方案中,所述差異包括保守突變。在一些實施方案 中,酮還原酶多肽包括與具有前述特徵的基於SEQ ID NO :2、4或114的參考序列至少85%、 86%,87%,88%,89%,90%,91%,92%,93%,94%,95%,96%,97%,98%^; 99%相同的 胺基酸序列,條件是酮還原酶具有至少含前述特徵的胺基酸序列。在一些實施方案中,包括基於SEQ ID NO :111、112或139或其區域(例如殘基 90-211)中的序列式的胺基酸序列,具有本文所述對應於X190和X202的殘基的特定特徵 或對應於X190、X195和X202的殘基的特定特徵的改進的酮還原酶,還至少包括下述另外特 徵對應於X94的殘基是半胱氨酸、脂肪族的或非極性的殘基,特別是甘氨酸或半胱氨酸。 在一些實施方案中,酮還原酶多肽與SEQ ID NO :2、4或114中的參考序列相比在其他氨 基酸殘基位置上可另外具有 1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、 1-15、1-16、1-18、1-20、1-22、1-24、1-26、1-30、1-35 或約 1-40 個殘基差異。在一些實施方 案中,差異的數目可以是在其他胺基酸殘基上的1、2、3、4、5、6、7、8、9、10、11、12、14、15、16、 18、20、22、24、26、30、35或約40個殘基差異。在一些實施方案中,所述差異包括保守突變。 在一些實施方案中,酮還原酶多肽包括與具有前述特徵的基於SEQ ID NO :2、4或114的參 考序列至少 85%、86%、87%、88% 、89%、90%、91%、92%、93%、94%、95%、96%、97%、 98 %或99 %相同的胺基酸序列,條件是酮還原酶具有至少含前述特徵的胺基酸序列。在一些實施方案中,包括基於SEQ ID NO :111、112或139或其區域(例如殘基 90-211)中的序列式的胺基酸序列,具有本文所述對應於X190和X202的殘基的特定特徵 或對應於X190、X195和X202的殘基的特定特徵的改進的酮還原酶,還至少包括下述另外特 徵對應於X96的殘基是半胱氨酸、極性的、脂肪族的或非極性的殘基,特別是纈氨酸、亮氨 酸、異亮氨酸、蘇氨酸或半胱氨酸。在一些實施方案中,酮還原酶多肽與SEQ IDN0:2、4或 114中的參考序列相比在其他胺基酸殘基位置上可另外具有1-2、1-3、1-4、1-5、1-6、1-7、 1-8、1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18、1-20、1-22、1-24、1-26、1-30、1-35 或約 1-40個殘基差異。在一些實施方案中,差異的數目可以是在其他胺基酸殘基上的1、2、3、4、 5、6、7、8、9、10、11、12、14、15、16、18、20、22、24、26、30、35 或約 40 個殘基差異。在一些實施 方案中,所述差異包括保守突變。在一些實施方案中,酮還原酶多肽包括與具有前述特徵的 基於SEQ ID NO :2、4或 114 的參考序列至少85%、86%、87%、88%、89%、90%、91%、92%、 93%、94%、95%、96%、97%、98%或99%相同的胺基酸序列,條件是酮還原酶具有至少含 前述特徵的胺基酸序列。在一些實施方案中,包括基於SEQ ID NO :111、112或139或其區域(例如殘基 90-211)中的序列式的胺基酸序列,具有本文所述對應於X190和X202的殘基的特定特徵 或對應於X190、X195和X202的殘基的特定特徵的改進的酮還原酶,還至少包括下述另外特 徵對應於XlOO的殘基是鹼性的、酸性的、極性的、脂肪族的或非極性的殘基,特別是賴氨 酸。在一些實施方案中,酮還原酶多肽與SEQ ID NO :2、4或114中的參考序列相比在其他氨 基酸殘基位置上可另外具有 1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、 1-15、1-16、1-18、1-20、1-22、1-24、1-26、1-30、1-35 或約 1-40 個殘基差異。在一些實施方 案中,差異的數目可以是在其他胺基酸殘基上的1、2、3、4、5、6、7、8、9、10、11、12、14、15、16、18、20、22、24、26、30、35或約40個殘基差異。在一些實施方案中,所述差異包括保守突變。 在一些實施方案中,酮還原酶多肽包括與具有前述特徵的基於SEQ ID NO :2、4或114的參 考序列至少 85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、 98 %或99 %相同的胺基酸序列,條件是酮還原酶具有至少含前述特徵的胺基酸序列。
在一些實施方案中,包括基於SEQ ID NO :111、112或139或其區域(例如殘基 90-211)中的序列式的胺基酸序列,具有本文所述對應於X190和X202的殘基的特定特徵 或對應於X190、X195和X202的殘基的特定特徵的改進的酮還原酶,還至少包括下述另外特 徵對應於X108的殘基是鹼性的或受限的殘基,特別是組氨酸。在一些實施方案中,酮還原 酶多肽與SEQ ID NO :2、4或114中的參考序列相比在其他胺基酸殘基位置上可另外具有 1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18、1-20、1-22、 1-24、1-26、1-30、1-35或約1_40個殘基差異。在一些實施方案中,差異的數目可以是在其 他胺基酸殘基上的 1、2、3、4、5、6、7、8、9、10、11、12、14、15、16、18、20、22、24、26、30、35 或約 40個殘基差異。在一些實施方案中,所述差異包括保守突變。在一些實施方案中,酮還原酶 多肽包括與具有前述特徵的基於SEQ IDN0:2、4或114的參考序列至少85%、86%、87%、 88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或 99%相同的胺基酸序列, 條件是酮還原酶具有至少含前述特徵的胺基酸序列。在一些實施方案中,包括基於SEQ ID NO :111、112或139或其區域(例如殘基 90-211)中的序列式的胺基酸序列,具有本文所述對應於X190和X202的殘基的特定特徵 或對應於X190、X195和X202的殘基的特定特徵的改進的酮還原酶,還至少包括下述另外特 徵對應於X147的殘基是芳香族的、脂肪族的或非極性的殘基,特別是亮氨酸。在一些實 施方案中,酮還原酶多肽與SEQ ID NO :2、4或114中的參考序列相比在其他胺基酸殘基位 置上可另外具有 1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-15、1-16、 1-18、1-20、1-22、1-24、1-26、1-30、1-35或約1-40個殘基差異。在一些實施方案中,差異 的數目可以是在其他胺基酸殘基上的1、2、3、4、5、6、7、8、9、10、11、12、14、15、16、18、20、22、 24、26、30、35或約40個殘基差異。在一些實施方案中,所述差異包括保守突變。在一些實施 方案中,酮還原酶多肽包括與具有前述特徵的基於SEQ ID NO :2、4或114的參考序列至少 85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98% 或 99% 相 同的胺基酸序列,條件是酮還原酶具有至少含前述特徵的胺基酸序列。在一些實施方案中,包括基於SEQ ID NO :111、112或139或其區域(例如殘基 90-211)中的序列式的胺基酸序列,具有本文所述對應於X190和X202的殘基的特定特徵 或對應於X190、X195和X202的殘基的特定特徵的改進的酮還原酶,還至少包括下述另外特 徵對應於X151的殘基是受限的、非極性的或脂肪族的殘基,特別是丙氨酸。在一些實施方 案中,酮還原酶多肽與SEQ ID NO :2、4或114中的參考序列相比在其他胺基酸殘基位置上 可另外具有 1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18、 1-20、1-22、1-24、1-26、1-30、1-35或約1-40個殘基差異。在一些實施方案中,差異的數目 可以是在其他胺基酸殘基上的 1、2、3、4、5、6、7、8、9、10、11、12、14、15、16、18、20、22、24、26、 30、35或約40個殘基差異。在一些實施方案中,所述差異包括保守突變。在一些實施方案 中,酮還原酶多肽包括與具有前述特徵的基於SEQ ID NO :2、4或114的參考序列至少85%、 86%,87%,88%,89%,90%,91%,92%,93%,94%,95%,96%,97%,98%^; 99%相同的胺基酸序列,條件是酮還原酶具有至少含前述特徵的胺基酸序列。在一些實施方案中,包括基於SEQ ID NO :111、112或139或其區域(例如殘基 90-211)中的序列式的胺基酸序列,具有本文所述對應於X190和X202的殘基的特定特徵 或對應於X190、X195和X202的殘基的特定特徵的改進的酮還原酶,還至少包括下述另外特 徵對應於X165的殘基是極性的、非極性的或脂肪族的殘基,特別是天冬醯胺。在一些實 施方案中,酮還原酶多肽與SEQ ID NO :2、4或114中的參考序列相比在其他胺基酸殘基位 置上可另外具有 1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-15、1-16、 1-18、1-20、1-22、1-24、1-26、1-30、1-35或約1-40個殘基差異。在一些實施方案中,差異 的數目可以是在其他胺基酸殘基上的1、2、3、4、5、6、7、8、9、10、11、12、14、15、16、18、20、22、 24、26、30、35或約40個殘基差異。在一些實施方案中,所述差異包括保守突變。在一些實施 方案中,酮還原酶多肽包括與具有前述特徵的基於SEQ ID NO :2、4或114的參考序列至少 85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98% 或 99% 相 同的胺基酸序列,條件是酮還原酶具有至少含前述特徵的胺基酸序列。在一些實施方案中,包括基於SEQ ID NO :111、112或139或其區域(例如殘基 90-211)中的序列式的胺基酸序列,具有本文所述對應於X190和X202的殘基的特定特徵 或對應於X190、X195和X202的殘基的特 定特徵的改進的酮還原酶,還至少包括下述另外特 徵對應於X173的殘基是酸性的、非極性的或脂肪族的殘基,特別是纈氨酸。在一些實施方 案中,酮還原酶多肽與SEQ ID NO :2、4或114中的參考序列相比在其他胺基酸殘基位置上 可另外具有 1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18、 1-20、1-22、1-24、1-26、1-30、1-35或約1-40個殘基差異。在一些實施方案中,差異的數目 可以是在其他胺基酸殘基上的 1、2、3、4、5、6、7、8、9、10、11、12、14、15、16、18、20、22、24、26、 30、35或約40個殘基差異。在一些實施方案中,所述差異包括保守突變。在一些實施方案 中,酮還原酶多肽包括與具有前述特徵的基於SEQ ID NO :2、4或114的參考序列至少85%、 86%,87%,88%,89%,90%,91%,92%,93%,94%,95%,96%,97%,98%^; 99%相同的 胺基酸序列,條件是酮還原酶具有至少含前述特徵的胺基酸序列。在一些實施方案中,包括基於SEQ ID N0:lll、112或139或其區域(例如殘基 90-211)中的序列式的胺基酸序列,具有本文所述對應於X190和X202的殘基的特定特徵 或對應於X190、X195和X202的殘基的特定特徵的改進的酮還原酶,還至少包括下述另外特 徵對應於X194的殘基是受限的、極性的、脂肪族的或非極性的殘基,特別是絲氨酸、穀氨 醯胺或亮氨酸。在一些實施方案中,酮還原酶多肽與SEQ ID NO :2、4或114中的參考序列相 比在其他胺基酸殘基位置上可另外具有1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、 1-12、1-14、1-15、1-16、1-18、1-20、1-22、1-24、1-26、1-30、1-35 或約 1-40 個殘基差異。在 一些實施方案中,差異的數目可以是在其他胺基酸殘基上的1、2、3、4、5、6、7、8、9、10、11、 12、14、15、16、18、20、22、24、26、30、35或約40個殘基差異。在一些實施方案中,所述差異包 括保守突變。在一些實施方案中,酮還原酶多肽包括與具有前述特徵的基於SEQ ID NO :2、 4 或 114 的參考序列至少 85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、 96 %、97 %、98 %或99 %相同的胺基酸序列,條件是酮還原酶具有至少含前述特徵的胺基酸 序列。在一些實施方案中,包括基於SEQ ID N0:lll、112或139或其區域(例如殘基90-211)中的序列式的胺基酸序列,具有本文所述對應於X190和X202的殘基的特定特徵或對應於X190、X195和X202的殘基的特定特徵的改進的酮還原酶,還至少包括下述另外特 徵對應於X196的殘基是非極性的或脂肪族的殘基,特別是亮氨酸。在一些實施方案中,酮 還原酶多肽與SEQ ID NO :2、4或114中的參考序列相比在其他胺基酸殘基位置上可另外 具有 1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18、1-20、 1-22、1-24、1-26、1-30、1-35或約1_40個殘基差異。在一些實施方案中,差異的數目可以是 在其他胺基酸殘基上的 1、2、3、4、5、6、7、8、9、10、11、12、14、15、16、18、20、22、24、26、30、35 或約40個殘基差異。在一些實施方案中,所述差異包括保守突變。在一些實施方案中,酮 還原酶多肽包括與具有前述特徵的基於SEQ ID N0:2、4或114的參考序列至少85%、86%、 87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或 99%相同的胺基酸 序列,條件是酮還原酶具有至少含前述特徵的胺基酸序列。在一些實施方案中,包括基於SEQ ID NO :111、112或139或其區域(例如殘基 90-211)中的序列式的胺基酸序列,具有本文所述對應於X190和X202的殘基的特定特徵 或對應於X190、X195和X202的殘基的特定特徵的改進的酮還原酶,還至少包括下述另外特 徵對應於X198的殘基是酸性的或極性的殘基,特別是穀氨酸或穀氨醯胺。在一些實施方 案中,酮還原酶多肽與SEQ ID NO :2、4或114中的參考序列相比在其他胺基酸殘基位置上 可另外具有 1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18、 1-20、1-22、1-24、1-26、1-30、1-35或約1-40個殘基差異。在一些實施方案中,差異的數目 可以是在其他胺基酸殘基上的 1、2、3、4、5、6、7、8、9、10、11、12、14、15、16、18、20、22、24、26、 30、35或約40個殘基差異。在一些實施方案中,所述差異包括保守突變。在一些實施方案 中,酮還原酶多肽包括與具有前述特徵的基於SEQ ID NO :2、4或114的參考序列至少85%、 86%,87%,88%,89%,90%,91%,92%,93%,94%,95%,96%,97%,98%^; 99%相同的 胺基酸序列,條件是酮還原酶具有至少含前述特徵的胺基酸序列。在一些實施方案中,包括基於SEQ ID NO :111、112或139或其區域(例如殘基 90-211)中的序列式的胺基酸序列,具有本文所述對應於X190和X202的殘基的特定特徵 或對應於X190、X195和X202的殘基的特定特徵的改進的酮還原酶,還至少包括下述另外特 徵對應於X210的殘基是極性的或鹼性的殘基,特別是精氨酸。在一些實施方案中,酮還原 酶多肽與SEQ ID NO :2、4或114中的參考序列相比在其他胺基酸殘基位置上可另外具有 1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18、1-20、1-22、 1-24、1-26、1-30、1-35或約1_40個殘基差異。在一些實施方案中,差異的數目可以是在其 他胺基酸殘基上的 1、2、3、4、5、6、7、8、9、10、11、12、14、15、16、18、20、22、24、26、30、35 或約 40個殘基差異。在一些實施方案中,所述差異包括保守突變。在一些實施方案中,酮還原酶 多肽包括與具有前述特徵的基於SEQ IDNO :2、4或114的參考序列至少85%、86%、87%、 88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或 99%相同的胺基酸序列, 條件是酮還原酶具有至少含前述特徵的胺基酸序列。在一些實施方案中,包括基於SEQ ID NO :111、112或139或其區域(例如殘基 90-211)中的序列式的胺基酸序列,具有本文所述對應於X190和X202的殘基的特定特徵 或對應於X190、X195和X202的殘基的特定特徵的改進的酮還原酶,還至少包括下述另外特 徵對應於X211的殘基是鹼性的、脂肪族的、非極性的、酸性的或極性的殘基,特別是纈氨酸、亮氨酸、異亮氨酸或蘇氨酸。在一些實施方案中,酮還原酶多肽與SEQ IDN0:2、4或114 中的參考序列相比在其他胺基酸殘基位置上可另外具有1-2、1-3、1-4、1-5、1-6、1-7、1-8、 1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18、1-20、1-22、1-24、1-26、1-30、1-35 或約 1-40 個殘基差異。在一些實施方案中,差異的數目可以是在其他胺基酸殘基上的1、2、3、4、5、6、 7、8、9、10、11、12、14、15、16、18、20、22、24、26、30、35 或約 40 個殘基差異。在一些實施方案 中,所述差異包括保守突變。在一些實施方案中,酮還原酶多肽包括與具有前述特徵的基 於 SEQ ID NO :2、4 或 114 的參考序列至少 85%、86%、87%、88%、89%、90%、91%、92%、 93 %、94%、95%、96 %、97 %、98 %或99%相同的胺基酸序列,條件是酮還原酶具有至少含 前述特徵的胺基酸序列。在一些實施方案中,包括基於SEQ ID NO :111、112或139或其區域(例如殘基 90-211)中的序列式的胺基酸序列,具有本文所述對應於X190和X202的殘基的特定特徵 或對應於X190、X195和X202的殘基的特定特徵的改進的酮還原酶,還至少包括下述另外特 徵對應於X212的殘基是極性的、脂肪族的或非極性的殘基,特別是纈氨酸或絲氨酸。在 一些實施方案中,酮還原酶 多肽與SEQ ID NO :2、4或114中的參考序列相比在其他胺基酸 殘基位置上可另外具有 1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-15、 1-16、1-18、1-20、1-22、1-24、1-26、1-30、1-35 或約 1-40 個殘基差異。在一些實施方案中, 差異的數目可以是在其他胺基酸殘基上的1、2、3、4、5、6、7、8、9、10、11、12、14、15、16、18、 20、22、24、26、30、35或約40個殘基差異。在一些實施方案中,所述差異包括保守突變。在 一些實施方案中,酮還原酶多肽包括與具有前述特徵的基於SEQ ID N0:2、4或114的參考 序列至少 85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98% 或99 %相同的胺基酸序列,條件是酮還原酶具有至少含前述特徵的胺基酸序列。在一些實施方案中,包括基於SEQ ID NO :111、112或139或其區域(例如殘基 90-211)中的序列式的胺基酸序列,具有本文所述對應於X190和X202的殘基的特定特徵 或對應於X190、X195和X202的殘基的特定特徵的改進的酮還原酶,還至少包括下述另外特 徵對應於X216的殘基是受限的或鹼性的殘基,特別是精氨酸。在一些實施方案中,酮還原 酶多肽與SEQ ID NO :2、4或114中的參考序列相比在其他胺基酸殘基位置上可另外具有 1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18、1-20、1-22、 1-24、1-26、1-30、1-35或約1_40個殘基差異。在一些實施方案中,差異的數目可以是在其 他胺基酸殘基上的 1、2、3、4、5、6、7、8、9、10、11、12、14、15、16、18、20、22、24、26、30、35 或約 40個殘基差異。在一些實施方案中,所述差異包括保守突變。在一些實施方案中,酮還原酶 多肽包括與具有前述特徵的基於SEQ IDNO :2、4或114的參考序列至少85%、86%、87%、 88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或 99%相同的胺基酸序列, 條件是酮還原酶具有至少含前述特徵的胺基酸序列。在一些實施方案中,包括基於SEQ ID NO :111、112或139或其區域(例如殘基 90-211)中的序列式的胺基酸序列,具有本文所述對應於X190和X202的殘基的特定特徵 或對應於X190、X195和X202的殘基的特定特徵的改進的酮還原酶,還至少包括下述另外特 徵對應於X223的殘基是非極性的或脂肪族的殘基,特別是纈氨酸。在一些實施方案中,酮 還原酶多肽與SEQ ID NO :2、4或114中的參考序列相比在其他胺基酸殘基位置上可另外 具有 1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18、1-20、1-22、1-24、1-26、1-30、1-35或約1_40個殘基差異。在一些實施方案中,差異的數目可以是 在其他胺基酸殘基上的 1、2、3、4、5、6、7、8、9、10、11、12、14、15、16、18、20、22、24、26、30、35 或約40個殘基差異。在一些實施方案中,所述差異包括保守突變。在一些實施方案中,酮 還原酶多肽包括與具有前述特徵的基於SEQ ID NO:2、4或114的參考序列至少85%、86%、 87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或 99%相同的胺基酸 序列,條件是酮還原酶具有至少含前述特徵的胺基酸序列。在一些實施方案中,包括基於SEQ ID NO :111、112或139或其區域(例如殘基 90-211)中的序列式的胺基酸序列,具有本文所述對應於X190和X202的殘基的特定特徵 或對應於X190、X195和X202的殘基的特定特徵的改進的酮還原酶,還至少包括下述另外特 徵對應於X226的殘基是非極性的或極性的殘基,特別是蘇氨酸。在一 些實施方案中,酮還 原酶多肽與SEQ ID NO :2、4或114中的參考序列相比在其他胺基酸殘基位置上可另外具有 1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18、1-20、1-22、 1-24、1-26、1-30、1-35或約1_40個殘基差異。在一些實施方案中,差異的數目可以是在其 他胺基酸殘基上的 1、2、3、4、5、6、7、8、9、10、11、12、14、15、16、18、20、22、24、26、30、35 或約 40個殘基差異。在一些實施方案中,所述差異包括保守突變。在一些實施方案中,酮還原酶 多肽包括與具有前述特徵的基於SEQ ID而2、4或114的參考序列至少85%、86%、87%、 88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或 99%相同的胺基酸序列, 條件是酮還原酶具有至少含前述特徵的胺基酸序列。在一些實施方案中,包括基於SEQ ID NO :111、112或139或其區域(例如殘基 90-211)中的序列式的胺基酸序列,具有本文所述對應於X190和X202的殘基的特定特 徵或對應於X190、X195和X202的殘基的特定特徵的改進的酮還原酶,還至少包括下述另 外特徵對應於X7的殘基是受限的或非極性的殘基,特別是組氨酸;對應於X94的殘基是 半胱氨酸、非極性的或脂肪族的殘基,特別是半胱氨酸或甘氨酸;對應於X147的殘基是芳 香族的、脂肪族的或非極性的殘基,特別是苯丙氨酸或亮氨酸;並且對應於X196的殘基是 非極性的或脂肪族的殘基,特別是亮氨酸。在一些實施方案中,酮還原酶多肽與具有前述 特徵的基於SEQ ID NO :2、4或114的參考序列相比在其他胺基酸殘基位置上可另外具有 1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18、1-20、1-22、 1-24、1-26、1-30、1-35或約1-40個殘基差異(例如SEQ ID NO :48)。在一些實施方案中,差 異的數目可以是在其他胺基酸殘基上的1、2、3、4、5、6、7、8、9、10、11、12、14、15、16、18、20、 22、24、26、30、35或約40個殘基差異。在一些實施方案中,酮還原酶多肽包括與具有前述特 徵的基於 SEQ ID NO :2、4 或 114 的參考序列至少 85%、86%、87%、88%、89%、90%、91%、 92%、93%、94%、95%、96%、97%、98%或 99%相同的胺基酸序列(例如 SEQ ID NO 48), 條件是酮還原酶具有至少含前述特徵的胺基酸序列。在一些實施方案中,包括基於SEQ ID N0:lll、112或139或其區域(例如殘基 90-211)中的序列式的胺基酸序列,具有本文所述對應於X190和X202的殘基的特定特徵 或對應於X190、X195和X202的殘基的特定特徵的改進的酮還原酶,還至少包括下述另外 特徵對應於X7的殘基是受限的或非極性的殘基,特別是組氨酸;對應於X96的殘基是半 胱氨酸、極性的、脂肪族的或非極性的殘基,特別是天冬醯胺、絲氨酸、纈氨酸、亮氨酸、異亮 氨酸或蘇氨酸;對應於X147的殘基是芳香族的、脂肪族的或非極性的殘基,特別是苯丙氨酸或亮氨酸;並且對應於X196的殘基是非極性的或脂肪族的殘基,特別是亮氨酸。在一些 實施方案中,酮還原酶多肽與具有前述特徵的SEQ ID NO :2、4或114中的參考序列相比在 其他胺基酸殘基位置上可另外具有 1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、 1-14、1-15、1-16、1-18、1-20、1-22、1-24、1-26、1-30、1-35 或約 1-40 個殘基差異(例如 SEQ ID N0:42、44、46或90)。在一些實施方案中,差異的數目可以是在其他胺基酸殘基上的1、 2、3、4、5、6、7、8、9、10、11、12、14、15、16、18、20、22、24、26、30、35 或約 40 個殘基差異。在一 些實施方案中,酮還原酶多肽包括與具有前述特徵的基於SEQ ID N0:2、4或114的參考序 列至少 85%,86%,87%,88%,89%,90%,91%,92%,93%,94%,95%,96%,97%,98%^; 99%相同的胺基酸序列(例如SEQ ID NO :42、44、46或90),條件是酮還原酶具有至少含前 述特徵的胺基酸序列。在一些實施方案中,包括基於SEQ ID N0:lll、112或139或其區域(例如殘基 90-211)中的序列式的胺基酸序列,具有本文所述對應於X190和X202的殘基的特定特徵 或對應於X190、X195和X202的殘基的特定特徵的改進的酮還原酶,還至少包括下述另外 特徵對應於X7的殘基是受限的或非極性的殘基,特別是組氨酸;對應於X96的殘基是半 胱氨酸、極性的、脂肪族的或非極性的殘基,特別是天冬醯胺、絲氨酸、纈氨酸、亮氨酸、異亮 氨酸或蘇氨酸;對應於X147的殘基是芳香族的、脂肪族的或非極性的殘基,特別是苯丙氨 酸或亮氨酸;對應於X196的殘基是非極性的或脂肪族的殘基,特別是亮氨酸;並且對應於 X211的殘基是鹼性的、脂肪族的、非極性的、酸性的或極性的殘基,特別是纈氨酸、亮氨 酸、 異亮氨酸或蘇氨酸。在一些實施方案中,酮還原酶多肽與具有前述特徵的SEQ ID N0:2、4或 114中的參考序列相比在其他胺基酸殘基位置上可另外具有1-2、1-3、1-4、1-5、1-6、1-7、 1-8、1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18、1-20、1-22、1-24、1-26、1-30、1-35 或約 1-40個殘基差異(例如SEQ ID N0:88、94或102)。在一些實施方案中,差異的數目可以是 在其他胺基酸殘基上的 1、2、3、4、5、6、7、8、9、10、11、12、14、15、16、18、20、22、24、26、30、35 或約40個殘基差異。在一些實施方案中,酮還原酶多肽包括與具有前述特徵的基於SEQ ID NO :2、4 或 114 的參考序列至少 85%,86%,87%,88%,89%,90%,91%,92%,93%,94%, 95%、96%、97%、98%或99%相同的胺基酸序列(例如SEQID NO :88、94或102),條件是酮 還原酶具有至少含前述特徵的胺基酸序列。在一些實施方案中,包括基於SEQ ID NO :111、112或139或其區域(例如殘基 90-211)中的序列式的胺基酸序列,具有本文所述對應於X190和X202的殘基的特定特徵 或對應於X190、X195和X202的殘基的特定特徵的改進的酮還原酶,還至少包括下述另外 特徵對應於X7的殘基是受限的或非極性的殘基,特別是組氨酸;對應於X96的殘基是半 胱氨酸、極性的、脂肪族的或非極性的殘基,特別是天冬醯胺、絲氨酸、纈氨酸、亮氨酸、異亮 氨酸或蘇氨酸;對應於X147的殘基是芳香族的、脂肪族的或非極性的殘基,特別是苯丙氨 酸或亮氨酸;對應於X194的殘基是受限的、極性的、脂肪族的或非極性的殘基,特別是亮氨 酸、穀氨醯胺或絲氨酸;對應於X196的殘基是非極性的或脂肪族的殘基,特別是亮氨酸; 並且對應於X211的殘基是鹼性的、脂肪族的、非極性的、酸性的或極性的殘基,特別是纈氨 酸、亮氨酸、異亮氨酸或蘇氨酸。在一些實施方案中,酮還原酶多肽與具有前述特徵的SEQ ID NO :2、4或114中的參考序列相比在其他胺基酸殘基位置上可另外具有1_2、1_3、1_4、 1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18、1-20、1-22、1-24、1-26、1-30、1-35或約1-40個殘基差異(例如SEQ ID NO :98)。在一些實施方案中,差異的數目 可以是在其他胺基酸殘基上的 1、2、3、4、5、6、7、8、9、10、11、12、14、15、16、18、20、22、24、26、 30、35或約40個殘基差異。在一些實施方案中,酮還原酶多肽包括與具有前述特徵的基於 SEQ IDNO :2、4或114的參考序列至少85%、86%、87%、88%、89%、90%、91%、92%、93%、 94%、95%、96%、97%、98%或99%相同的胺基酸序列(例如SEQ ID N0:98),條件是酮還 原酶具有至少含前述特徵的胺基酸序列。在一些實施方案中,包括基於SEQ ID NO :111、112或139或其區域(例如殘基 90-211)中的序列式的胺基酸序列,具有本文所述對應於X190和X202的殘基的特定特 徵或對應於X190、X195和X202的殘基的特定特徵的改進的酮還原酶,還至少包括下述另 外特徵對應於X7的殘基是受限的或非極性的殘基,特別是組氨酸;對應於X93的殘基是 極性的、脂肪族的或非極性的殘基,特別是絲氨酸;對應於X94的殘基是半胱氨酸、非極性 的或脂肪族的殘基,特別是半胱氨酸或甘氨酸;對應於X96的殘基是半胱氨酸、極性的、月旨 肪族的或非極性的殘基,特別是天冬醯胺、絲氨酸、纈氨酸、亮氨酸、異亮氨酸或蘇氨酸;對 應於X147的殘基是芳香族的、脂肪族的或非極 性的殘基,特別是苯丙氨酸或亮氨酸;對應 於X196的殘基是非極性的或脂肪族的殘基,特別是亮氨酸;並且對應於X211的殘基是鹼 性的、脂肪族的、非極性的、酸性的或極性的殘基,特別是纈氨酸、亮氨酸、異亮氨酸或蘇氨 酸。在一些實施方案中,酮還原酶多肽與具有前述特徵的SEQ ID N0:2、4或114中的參考 序列相比在其他胺基酸殘基位置上可另外具有1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、 1-11、1-12、1-14、1-15、1-16、1-18、1-20、1-22、1-24、1-26、1-30、1-35 或約 1-40 個殘基差 異(例如SEQ ID N0:84)。在一些實施方案中,差異的數目可以是在其他胺基酸殘基上的 1、2、3、4、5、6、7、8、9、10、11、12、14、15、16、18、20、22、24、26、30、35 或約 40 個殘基差異。在 一些實施方案中,酮還原酶多肽包括與具有前述特徵的基於SEQ ID N0:2、4或114的參考 序列至少 85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98% 或99%相同的胺基酸序列(例如SEQID NO :84),條件是酮還原酶具有至少含前述特徵的氨 基酸序列。在一些實施方案中,包括基於SEQ ID NO :111、112或139或其區域(例如殘基 90-211)中的序列式的胺基酸序列,具有本文所述對應於X190和X202的殘基的特定特徵 或對應於X190、X195和X202的殘基的特定特徵的改進的酮還原酶,還至少包括下述另外 特徵對應於X7的殘基是受限的或非極性的殘基,特別是組氨酸;對應於X66的殘基是酸 性的殘基,特別是穀氨酸;對應於X93的殘基是極性的、脂肪族的或非極性的殘基,特別是 絲氨酸;對應於X94的殘基是半胱氨酸、非極性的或脂肪族的殘基,特別是半胱氨酸或甘氨 酸;對應於X96的殘基是半胱氨酸、極性的、脂肪族的或非極性的殘基,特別是天冬醯胺、絲 氨酸、纈氨酸、亮氨酸、異亮氨酸或蘇氨酸;對應於X147的殘基是芳香族的、脂肪族的或非 極性的殘基,特別是苯丙氨酸或亮氨酸;對應於X196的殘基是非極性的或脂肪族的殘基, 特別是亮氨酸;並且對應於X211的殘基是鹼性的、脂肪族的、非極性的、酸性的或極性的殘 基,特別是纈氨酸、亮氨酸、異亮氨酸或蘇氨酸。在一些實施方案中,酮還原酶多肽與具有前 述特徵的SEQ ID NO :2、4或114中的參考序列相比在其他胺基酸殘基位置上可另外具有 1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18、1-20、1-22、 1-24、1-26、1-30、1-35或約1-40個殘基差異(例如SEQ IDNO 64)。在一些實施方案中,差異的數目可以是在其他胺基酸殘基上的1、2、3、4、5、6、7、8、9、10、11、12、14、15、16、18、20、 22、24、26、30、35或約40個殘基差異。在一些實施方案中,酮還原酶多肽包括與具有前述特 徵的基於 SEQ ID NO :2、4 或 114 的參考序列至少 85%、86%、87%、88%、89%、90%、91%、 92%、93%、94%、95%、96%、97%、98%或 99%相同的胺基酸序列(例如 SEQ ID NO 64),
條件是酮還原酶具有至少含前述特徵的胺基酸序列。在一些實施方案中,包括 基於SEQ ID NO :111、112或139或其區域(例如殘基 90-211)中的序列式的胺基酸序列,具有本文所述對應於X190和X202的殘基的特定特徵 或對應於X190、X195和X202的殘基的特定特徵的改進的酮還原酶,還至少包括下述另外 特徵對應於X7的殘基是受限的或非極性的殘基,特別是組氨酸;對應於X17的殘基是非 極性的或脂肪族的殘基,特別是甲硫氨酸;對應於X27的殘基是芳香族的殘基,特別是酪氨 酸;對應於X64的殘基是極性的、非極性的或脂肪族的殘基,特別是纈氨酸;對應於X80的 殘基是脂肪族的、非極性的或極性的殘基,特別是蘇氨酸或纈氨酸;對應於X93的殘基是極 性的、脂肪族的或非極性的殘基,特別是絲氨酸;對應於X94的殘基是半胱氨酸、非極性的 或脂肪族的殘基,特別是半胱氨酸或甘氨酸;對應於X96的殘基是半胱氨酸、極性的、脂肪 族的或非極性的殘基,特別是天冬醯胺、絲氨酸、纈氨酸、亮氨酸、異亮氨酸或蘇氨酸;對應 於XlOO的殘基是鹼性的、酸性的、極性的或脂肪族的,特別是賴氨酸;對應於X147的殘基 是芳香族的、脂肪族的或非極性的殘基,特別是苯丙氨酸或亮氨酸;對應於X196的殘基是 非極性的或脂肪族的殘基,特別是亮氨酸;並且對應於X211的殘基是鹼性的、脂肪族的、非 極性的、酸性的或極性的殘基,特別是纈氨酸、亮氨酸、異亮氨酸或蘇氨酸。在一些實施方案 中,酮還原酶多肽與具有前述特徵的SEQID NO :2、4或114中的參考序列相比在其他胺基酸 殘基位置上可另外具有 1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-15、 1-16、1-18、1-20、1-22、1-24、1-26、1-30、1-35 或約 1-40 個殘基差異(例如 SEQ ID NO 22 或24)。在一些實施方案中,差異的數目可以是在其他胺基酸殘基上的1、2、3、4、5、6、7、8、 9、10、11、12、14、15、16、18、20、22、24、26、30、35或約40個殘基差異。在一些實施方案中,酮 還原酶多肽包括與具有前述特徵的基於SEQ ID NO :2、4或114的參考序列至少85%、86%、 87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或 99%相同的胺基酸 序列(例如SEQ ID NO :22或24),條件是酮還原酶具有至少含前述特徵的胺基酸序列。在一些實施方案中,包括基於SEQ ID NO :111、112或139或其區域(例如殘基 90-211)中的序列式的胺基酸序列,具有本文所述對應於X190和X202的殘基的特定特徵 或對應於X190、X195和X202的殘基的特定特徵的改進的酮還原酶,還至少包括下述另外 特徵對應於X7的殘基是受限的或非極性的殘基,特別是組氨酸;對應於X66的殘基是酸 性的殘基,特別是穀氨酸;對應於X93的殘基是極性的、脂肪族的或非極性的殘基,特別是 絲氨酸;對應於X94的殘基是半胱氨酸、非極性的或脂肪族的殘基,特別是半胱氨酸或甘氨 酸;對應於X96的殘基是半胱氨酸、極性的、脂肪族的或非極性的殘基,特別是天冬醯胺、 絲氨酸、纈氨酸、亮氨酸、異亮氨酸或蘇氨酸;對應於X147的殘基是芳香族的、脂肪族的或 非極性的殘基,特別是苯丙氨酸或亮氨酸;對應於X194的殘基是受限的、極性的或非極性 的殘基,特別是天冬醯胺或亮氨酸;對應於X196的殘基是非極性的或脂肪族的殘基,特別 是亮氨酸;對應於X198的殘基是酸性的或極性的殘基,特別是穀氨酸或天冬醯胺;對應於 X211的殘基是鹼性的、脂肪族的、非極性的、酸性的或極性的殘基,特別是纈氨酸、亮氨酸、異亮氨酸或蘇氨酸;並且對應於X216的殘基是受限的或鹼性的殘基,特別是精氨酸。在一 些實施方案中,酮還原酶多肽與具有前述特徵的SEQ ID NO :2、4或114中的參考序列相 比在其他胺基酸殘基位置上可另外具有1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、 1-12、1-14、1-15、1-16、1-18、1-20、1-22、1-24、1-26、1-30、1-35 或約 1-40 個殘基差異(例 如SEQ IDNO :58)。在一些實施方案中,差異的數目可以是在其他胺基酸殘基上的1、2、3、4、 5、6、7、8、9、10、11、12、14、15、16、18、20、22、24、26、30、35 或約 40 個殘基差異。在一些實施 方案中,酮還原酶多肽包括與具有前述特徵的基於SEQ ID NO :2、4或114的參考序列至少 85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98% 或 99% 相 同的胺基酸序列(例如SEQ ID NO :58),條件是酮還原酶具有至少含前述特徵的胺基酸序 列。在一些實施方案中,包括基於SEQ ID NO :111、112或139或其區域(例如殘基 90-211)中的序列式的胺基酸序列,具有本文所述對應於X190和X202的殘基的特定特徵 或對應於X190、X195和X202的殘基的特定特徵的改進的酮還原酶,還至少包括下述另外 特徵對應於X7的殘基是受限的或非極性的殘基,特別是組氨酸;對應於X66的殘基是酸 性的殘基,特別是穀氨酸;對應於X93的殘基是極性的、脂肪族的或非極性的殘基,特別是 絲氨酸;對應於X94的殘基是半胱氨酸、脂肪族的或非極性的殘基,特別是半胱氨酸;對應 於X96的殘基是半胱氨酸、極性的、脂肪族的或非極性的殘基,特別是半胱氨酸、蘇氨酸、纈 氨酸、亮氨酸或異亮氨酸;對應於X147的殘基是芳香族的或脂肪族的殘基,特別是亮氨酸; 對應於 X194的殘基是受限的、極性的、脂肪族的或非極性的殘基,特別是穀氨醯胺;對應於 X196的殘基是非極性的或脂肪族的殘基,特別是亮氨酸;對應於X198的殘基是酸性的或極 性的殘基,特別是穀氨酸;並且對應於X211的殘基是鹼性的、脂肪族的或非極性的殘基,特 別是纈氨酸纈氨酸、亮氨酸、異亮氨酸或蘇氨酸。在一些實施方案中,酮還原酶多肽與具有 前述特徵的SEQ ID NO :2、4或114中的參考序列相比在其他胺基酸殘基位置上可另外具有 1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18、1-20、1-22、 1-24、1-26、1-30、1-35或約1-40個殘基差異(例如SEQ ID NO :40)。在一些實施方案中,差 異的數目可以是在其他胺基酸殘基上的1、2、3、4、5、6、7、8、9、10、11、12、14、15、16、18、20、 22、24、26、30、35或約40個殘基差異。在一些實施方案中,酮還原酶多肽包括與具有前述特 徵的基於 SEQ ID NO :2、4 或 114 的參考序列至少 85%、86%、87%、88%、89%、90%、91%、 92%、93%、94%、95%、96%、97%、98%或 99%相同的胺基酸序列(例如 SEQ ID NO 40), 條件是酮還原酶具有至少含前述特徵的胺基酸序列。在一些實施方案中,包括基於SEQ ID NO :111、112或139或其區域(例如殘基 90-211)中的序列式的胺基酸序列,具有本文所述對應於X190和X202的殘基的特定特徵 或對應於X190、X195和X202的殘基的特定特徵的改進的酮還原酶,還至少包括下述另外 特徵對應於X7的殘基是受限的或非極性的殘基,特別是組氨酸;對應於X17的殘基是非 極性的或脂肪族的殘基,特別是甲硫氨酸;對應於X27的殘基是芳香族的殘基,特別是酪氨 酸;對應於X64的殘基是非極性的或脂肪族的殘基,特別是纈氨酸;對應於X80的殘基是脂 肪族的、非極性的或極性的殘基,特別是蘇氨酸或纈氨酸;對應於X93的殘基是極性的、月旨 肪族的或非極性的殘基,特別是絲氨酸;對應於X94的殘基是半胱氨酸、非極性的或脂肪族 的殘基,特別是半胱氨酸或甘氨酸;對應於X96的殘基是半胱氨酸、極性的、脂肪族的或非極性的殘基,特別是天冬醯胺、絲氨酸、纈氨酸、亮氨酸、異亮氨酸或蘇氨酸;對應於XlOO的 殘基是鹼性的、酸性的、極性的、非極性的或脂肪族的殘基,特別是賴氨酸;對應於X147的 殘基是芳香族的、脂肪族的或非極性的殘基,特別是苯丙氨酸或亮氨酸;對應於X194的殘 基是受限的、極性的或非極性的殘基,特別是天冬醯胺或亮氨酸;對應於X196的殘基是非 極性的或脂肪族的殘基,特別是亮氨酸;對應於X198的殘基是酸性的或極性的殘基,特別 是穀氨酸或天冬醯胺;對應於X211的殘基是鹼性的、脂肪族的、非極性的、酸性的或極性的 殘基,特別是纈氨酸、亮氨酸、異亮氨酸或蘇氨酸;並且對應於X216的殘基是受限的或鹼性 的殘基,特別是精氨酸。在一些實施方案中,酮還原酶多肽與具有前述特徵的SEQ ID NO 2、4或114中的參考序列相比在其他胺基酸殘基位置上可另外具有1-2、1-3、1-4、1_5、1_6、 1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18、1-20、1-22、1-24、1-26、1-30、1-35 或約1-40個殘基差異(例如SEQ ID NO :14或16)。在一些實施方案中,差異的數目可以是 在其他胺基酸殘基上的 1、2、3、4、5、6、7、8、9、10、11、12、14、15、16、18、20、22、24、26、30、35 或約40個殘基差異。在一些實施方案中,酮還原酶多肽包括與具有前述特徵的基於SEQ ID NO :2、4 或 114 的參考序列至少 85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、 95%、96%、97%、98%或99%相同的胺基酸序列(例如SEQ ID NO 14或16),條件是酮還 原酶具有至少含前述特徵的胺基酸序列。
在一些實施方案中,包括基於SEQ ID NO :111、112或139或其區域(例如殘基 90-211)中的序列式的胺基酸序列,具有本文所述對應於X190和X202的殘基的特定特徵 或對應於X190、X195和X202的殘基的特定特徵的改進的酮還原酶,還至少包括下述另外 特徵對應於X7的殘基是受限的或非極性的殘基,特別是組氨酸;對應於X17的殘基是非 極性的或脂肪族的殘基,特別是甲硫氨酸;對應於X25的殘基是極性的或酸性的殘基,特別 是蘇氨酸;對應於X27的殘基是芳香族的殘基,特別是酪氨酸;對應於X53的殘基是極性 的、非極性的或酸性的殘基,特別是天冬氨酸;對應於X64的殘基是非極性的或脂肪族的殘 基,特別是纈氨酸;對應於X80的殘基是脂肪族的、非極性的或極性的殘基,特別是蘇氨酸 或纈氨酸;對應於X93的殘基是極性的、脂肪族的或非極性的殘基,特別是絲氨酸;對應於 X94的殘基是半胱氨酸、非極性的或脂肪族的殘基,特別是半胱氨酸或甘氨酸;對應於X96 的殘基是半胱氨酸、極性的、脂肪族的或非極性的殘基,特別是天冬醯胺、絲氨酸、纈氨酸、 亮氨酸、異亮氨酸或蘇氨酸;對應於XlOO的殘基是鹼性的、酸性的、極性的、非極性的或脂 肪族的殘基,特別是賴氨酸;對應於X147的殘基是芳香族的、脂肪族的或非極性的殘基,特 別是苯丙氨酸或亮氨酸;對應於X194的殘基是受限的、極性的或非極性的殘基,特別是天 冬醯胺或亮氨酸;對應於X196的殘基是非極性的或脂肪族的殘基,特別是亮氨酸;對應於 X198的殘基是酸性的或極性的殘基,特別是穀氨酸或天冬醯胺;對應於X211的殘基是鹼性 的、脂肪族的、非極性的、酸性的或極性的殘基,特別是纈氨酸、亮氨酸、異亮氨酸或蘇氨酸; 並且對應於X216的殘基是受限的或鹼性的殘基,特別是精氨酸。在一些實施方案中,酮還 原酶多肽與具有前述特徵的SEQ IDNO :2、4或114中的參考序列相比在其他胺基酸殘基位 置上可另外具有 1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-15、1-16、 1-18、1-20、1-22、1-24、1-26、1-30、1-35 或約 1-40 個殘基差異(例如 SEQ ID NO :6)。在一 些實施方案中,差異的數目可以是在其他胺基酸殘基上的1、2、3、4、5、6、7、8、9、10、11、12、 14、15、16、18、20、22、24、26、30、35或約40個殘基差異。在一些實施方案中,酮還原酶多肽包括與具有前述特徵的基於SEQ ID NO :2、4或114的參考序列至少85%、86%、87%、88%、 89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或 99%相同的胺基酸序列(例如 SEQ ID NO :6),條件是酮還原酶具有至少含前述特徵的胺基酸序列。在一些實施方案中,包括基於SEQ ID N0:lll、112或139或其區域(例如殘基 90-211)中的序列式的胺基酸序列,具有本文所述對應於X190和X202的殘基的特定特徵 或對應於X190、X195和X202的殘基的特定特徵的改進的酮還原酶,還至少包括下述另外特 徵對應於X7的殘基是受限的或非極性的殘基,特別是組氨酸;對應於X17的殘基是非極 性的或脂肪族的殘基,特別是甲硫氨酸;對應於X25的殘基是極性的或酸性的殘基,特別是 蘇氨酸;對應於X27的殘基是芳香族的殘基,特別是酪氨酸;對應於X53的殘基是極性的、 非極性的或酸性的殘基,特別是天冬氨酸;對應於X64的殘基是非極性的或脂肪族的殘基, 特別是纈氨酸;對應於X76的殘基是脂肪族的、非極性的或極性的殘基,特別是丙氨酸;對 應於X80的殘基是脂肪族的、非極性的或極性的殘基,特別是蘇氨酸或纈氨酸;對應於X93 的殘基是極性的、脂肪族的或非極性的殘基,特別是絲氨酸;對應於X94的殘基是半胱氨 酸、非極性的或脂肪族的殘基,特別是半胱氨酸或甘氨酸;對應於X96的殘基是半胱氨酸、 極性的、脂肪族的或非極性的殘基,特別是天冬醯胺、絲氨酸、纈氨酸、亮氨酸、異亮氨酸或 蘇氨酸;對應於XlOO的殘基是鹼性的、酸性的、極性的、非極性的或脂肪族的殘基,特別是 賴氨酸;對應於X147的殘基是芳香族的、脂肪族的或非極性的殘基,特別是苯丙氨酸或亮 氨酸;對應於X194的殘基是受限的、極性的或非極性的殘基,特 別是天冬醯胺或亮氨酸;對 應於X196的殘基是非極性的或脂肪族的殘基,特別是亮氨酸;對應於X198的殘基是酸性 的或極性的殘基,特別是穀氨酸或天冬醯胺;對應於X211的殘基是鹼性的、脂肪族的、非極 性的、酸性的或極性的殘基,特別是纈氨酸、亮氨酸、異亮氨酸或蘇氨酸;並且對應於X216 的殘基是受限的或鹼性的殘基,特別是精氨酸。在一些實施方案中,酮還原酶多肽與具有 前述特徵的SEQ IDNO :2、4或114中的參考序列相比在其他胺基酸殘基位置上可另外具有 1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18、1-20、1-22、 1-24、1-26、1-30、1-35或約1-40個殘基差異(例如SEQ ID NO :8)。在一些實施方案中,差 異的數目可以是在其他胺基酸殘基上的1、2、3、4、5、6、7、8、9、10、11、12、14、15、16、18、20、 22、24、26、30、35或約40個殘基差異。在一些實施方案中,酮還原酶多肽包括與具有前述特 徵的基於 SEQ ID NO :2、4 或 114 的參考序列至少 85%、86%、87%、88%、89%、90%、91%、 92%、93%、94%、95%、96%、97%、98%或99%相同的胺基酸序列(例如 SEQ ID N0:8),條 件是酮還原酶具有至少含前述特徵的胺基酸序列。在一些實施方案中,本公開的改進的酮還原酶包括具有對應於SEQ IDN0:111、112 或139中的序列式的殘基90-211的區域或結構域的胺基酸序列,其中對應於X190的殘基 是受限的殘基,而對應於X202的殘基是芳香族的殘基。在一些實施方案中,對應於殘基 90-211的結構域或區域包括這樣的胺基酸序列,其中對應於X190的殘基是脯氨酸,而對應 於X202的殘基是色氨酸。在一些實施方案中,對應於殘基90-211的區域或結構域與基於 SEQ ID NO :2、4或114的參考序列的相應結構域相比在其他胺基酸殘基位置上可另外具有 1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18 或 1-20 個殘 基差異。在一些實施方案中,差異的數目可以是在所述結構域中其他胺基酸殘基上的1、2、 3、4、5、6、7、8、9、10、11、12、14、15、16、18或約20個殘基差異。在一些實施方案中,所述差異包括保守突變。在一些實施方案中,酮還原酶多肽包括具有與在對應於X190和X202的殘 基上具有前述特徵的基於SEQ IDNO :2、4或114的參考序列的相應結構域至少85%、86%、 87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或 99%相同的結構域 或區域的胺基酸序列,條件是酮還原酶結構域或區域包括至少含前述特徵的胺基酸序列。在一些實施方案中,本公開的改進的酮還原酶包括具有對應於SEQIDN0:111、112 或139中的序列式的殘基90-211的區域或結構域的胺基酸序列,其中對應於X190的殘基 是受限的殘基;對應於X195的殘基是鹼性的、酸性的、非極性的或極性的殘基;而對應於 X202的殘基是芳香族的殘基。在一些實施方案中,對應於殘基90-211的結構域或區域包括 這樣的胺基酸序列,其中對應於X190的殘基是脯氨酸;對應於X195的殘基是脯氨酸、精氨 酸、賴氨酸、天冬氨酸或天冬醯胺,特別是精氨酸;而對應於X202的殘基是色氨酸。在一些 實施方案中,對應於殘基90-211的區域或結構域與基於SEQ ID NO :2、4或114的參考序列 的相應結構域相比在其他胺基酸殘基位置上可另外具有1-2、1-3、1-4、1-5、1-6、1-7、1-8、 1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18或1-20個殘基差異。在一些實施方案中,差異 的數目可以是在所述結構域中其他胺基酸殘基上的1、2、3、4、5、6、7、8、9、10、11、12、14、15、 16、18或約20個殘基差異。在一些實施方案中,所述差異包括保守突變。在一些實施方案 中,酮還原酶多肽包括具有與在對應於X190、X195和X202的殘基上具有前述特徵的基於 SEQ ID NO :2、4或114的參考序列的相應結構域至少85%、86%、87%、88%、89%、90%、 91%、92%、93%、94%、95%、96%、97%、98%或99%相同的結構域或區域的胺基酸序列, 條件是酮還原酶結構域或區域包括至少含前述特徵的胺基酸序列。在一些實施方案中,具有對應於SEQ ID NO 111、112或139中的序列式的殘基 90-211的結構域或區域並且具有對應於X190和X202的殘基的特定特徵或對應於X190、 X195和X202的殘基的特定特徵的酮還原酶多肽,還可在所述區域或結構域中包括選自如 下的一種或多種特徵對應於X93的殘基是極性的、脂肪族的或非極性的殘基;對應於X94 的殘基是半胱氨酸、脂肪族的或非極性的殘基;對應於X95的殘基是脂肪族的、非極性的或 酸性的殘基;對應於X96的殘基是半胱氨酸、極性的、脂肪族的或非極性的殘基;對應於X97 的殘基是鹼性的、受限的或極性的殘基;對應於XlOO的殘基是鹼性的、酸性的、極性的、月旨 肪族的或非極性的殘基;對應於X108的殘基是鹼性的或受限的殘基;對應於Xlll的殘基 是非極性的或脂肪族的殘基;對應於X139的殘基是非極性的或脂肪族的殘基;對應於X145 的殘基是酸性的、脂肪族的或非極性的殘基;對應於X147的殘基是芳香族的、脂肪族的或 非極性的殘基;對應於X148的殘基是非極性的或脂肪族的殘基;對應於X151的殘基是受 限的、非極性的或脂肪族的殘基;對應於X152的殘基是極性的、芳香族的、脂肪族的或非極 性的殘基;對應於X163的殘基是非極性的或脂肪族的殘基;對應於X165的殘基是極性的、 非極性的或脂肪族的殘基;對應於X173的殘基是酸性的、非極性的或脂肪族的殘基;對應 於X179的殘基是芳香族的、鹼性的、脂肪族的或非極性的殘基;對應於X194的殘基是受限 的、極性的、脂肪族的或非極性的殘基;對應於X196的殘基是非極性的或脂肪族的殘基;對 應於X197的殘基是酸性的殘基;對應於X198的殘基是酸性的或極性的殘基;對應於X210 的殘基是極性的或鹼性的殘基;而且對應於X211的殘基是鹼性的、脂肪族的、非極性的、酸 性的或極性的殘基。在一些實施方案中,對應於殘基90-211的區域或結構域與基於SEQ ID NO :2、4或114的參考序列的相應結構域相比在其他未被上述X所指定的胺基酸殘基上可另外具有約 1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18 或1-20個殘基差異。在一些實施方案中,差異的數目可以是在所述結構域中其他胺基酸殘 基上的1、2、3、4、5、6、7、8、9、10、11、12、14、15、16、18或約20個殘基差異。在一些實施方案
中,所述差異包括保守突變。 在一些實施方案中,如上所述具有包含與SEQ ID NO :111、112或139中的序列式 的殘基90-211相對應的胺基酸序列的結構域或區域的酮還原酶多肽,與SEQ ID NO :2、4或 114的相應結構域的胺基酸序列相比在所述結構域或區域中可具有一個或多個保守突變。 這種保守突變的實例包括胺基酸替換例如但不限於用另一種極性殘基例如絲氨酸替換對 應於X93的殘基異亮氨酸(I);用另一種非極性殘基例如甘氨酸替換對應於X94的殘基丙 氨酸(A);用另一種非極性或脂肪族殘基例如亮氨酸替換對應於X95的殘基纈氨酸(V);以 及用另一種極性殘基例如蘇氨酸替換對應於X96的殘基絲氨酸(S);用另一種非極性或脂 肪族殘基例如異亮氨酸替換對應於X148的殘基纈氨酸(V);用另一種極性殘基例如絲氨酸 替換對應於X152蘇氨酸;用另一種非極性或脂肪族殘基例如異亮氨酸替換對應於X163的 殘基纈氨酸(V);用另一種芳香族殘基例如苯丙氨酸替換對應於X179的殘基酪氨酸(Y); 以及用另一種脂肪族殘基例如亮氨酸替換對應於X196的殘基纈氨酸(V);用另一種酸性殘 基例如穀氨酸替換對應於X198的殘基天冬氨酸(D)。在一些實施方案中,具有對應於SEQ ID NO 111、112或139中的序列式的殘基 90-211的結構域或區域並且具有對應於X190和X202的殘基的特定特徵或對應於X190、 X195和X202的殘基的特定特徵的酮還原酶多肽,還可在所述區域或結構域中包括選自如 下的一種或多種特徵對應於X93的殘基是絲氨酸、蘇氨酸、穀氨醯胺、天冬醯胺、甘氨酸、 甲硫氨酸、丙氨酸、纈氨酸、亮氨酸或異亮氨酸,特別是異亮氨酸、絲氨酸、丙氨酸或甘氨酸; 對應於X94的殘基是半胱氨酸、甘氨酸、甲硫氨酸、丙氨酸、纈氨酸、亮氨酸或異亮氨酸,特 別是半胱氨酸、甘氨酸或丙氨酸;對應於X95的殘基是天冬氨酸、穀氨酸、甘氨酸、甲硫氨 酸、丙氨酸、纈氨酸、亮氨酸或異亮氨酸,特別是纈氨酸、亮氨酸或穀氨酸;對應於X96的殘 基是半胱氨酸、絲氨酸、蘇氨酸、穀氨醯胺、天冬醯胺、甘氨酸、甲硫氨酸、丙氨酸、纈氨酸、 亮氨酸或異亮氨酸,特別是天冬醯胺、絲氨酸、纈氨酸、亮氨酸、異亮氨酸或蘇氨酸;對應於 X97的殘基是賴氨酸、精氨酸、組氨酸、脯氨酸、絲氨酸、蘇氨酸、穀氨醯胺或天冬醯胺,特別 是賴氨酸、組氨酸或絲氨酸;對應於XlOO的殘基是賴氨酸、精氨酸、絲氨酸、蘇氨酸、穀氨醯 胺、天冬醯胺、甘氨酸、丙氨酸、纈氨酸、亮氨酸或異亮氨酸,特別是穀氨酸、賴氨酸、穀氨醯 胺或丙氨酸;對應於X108的殘基是精氨酸、賴氨酸、組氨酸或脯氨酸,特別是精氨酸或組氨 酸;對應於Xlll的殘基是甘氨酸、甲硫氨酸、丙氨酸、纈氨酸、亮氨酸或異亮氨酸,特別是甲 硫氨酸;對應於X139的殘基是甘氨酸、甲硫氨酸、丙氨酸、纈氨酸、亮氨酸或異亮氨酸,特別 是亮氨酸;對應於X145的殘基是天冬氨酸、穀氨酸、甘氨酸、甲硫氨酸、丙氨酸、纈氨酸、亮 氨酸或異亮氨酸,特別是穀氨酸或亮氨酸;對應於X147的殘基是酪氨酸、苯丙氨酸、色氨 酸、甘氨酸、甲硫氨酸、丙氨酸、纈氨酸、亮氨酸或異亮氨酸,特別是苯丙氨酸或亮氨酸;對應 於X151的殘基是脯氨酸、組氨酸、甘氨酸、甲硫氨酸、丙氨酸、纈氨酸、亮氨酸或異亮氨酸, 特別是丙氨酸;對應於X152的殘基是絲氨酸、蘇氨酸、穀氨醯胺、天冬醯胺、酪氨酸、苯丙氨 酸、色氨酸、甘氨酸、甲硫氨酸、丙氨酸、纈氨酸、亮氨酸或異亮氨酸,特別是蘇氨酸、色氨酸、 丙氨酸或絲氨酸;對應於X163的殘基是甘氨酸、甲硫氨酸、丙氨酸、纈氨酸、亮氨酸或異亮氨酸,特別是異亮氨酸;對應於X165的殘基是絲氨酸、蘇氨酸、穀氨醯胺天冬醯胺、甘氨酸、 甲硫氨酸、丙氨酸、纈氨酸、亮氨酸或異亮氨酸,特別是天冬醯胺;對應於X173的殘基是天 冬氨酸、穀氨酸、甘氨酸、甲硫氨酸、丙氨酸、纈氨酸、亮氨酸、異亮氨酸,特別是纈氨酸;對 應於X179的殘基是酪氨酸、苯丙氨酸、色氨酸、精氨酸、賴氨酸、甘氨酸、甲硫氨酸、丙氨酸、 纈氨酸、亮氨酸或異亮氨酸,特別是酪氨酸、苯丙氨酸、賴氨酸或亮氨酸;對應於X194的殘 基是脯氨酸、組氨酸、絲氨酸、蘇氨酸、穀氨醯胺、天冬醯胺、甘氨酸、甲硫氨酸、丙氨酸、纈氨 酸、亮氨酸或異亮氨酸,特別是脯氨酸、穀氨醯胺、絲氨酸或亮氨酸;對應於X196的殘基是 甘氨酸、甲硫氨酸、丙氨酸、纈氨酸、亮氨酸或異亮氨酸,特別是亮氨酸;對應於X197的殘基 是天冬氨酸或穀氨酸,特別是穀氨酸;對應於X198的殘基是天冬氨酸、穀氨酸、絲氨酸、蘇 氨酸、穀氨醯胺或天冬醯胺,特別是天冬氨酸、穀氨酸或穀氨醯胺;對應於X210的殘基是精 氨酸、賴氨酸、絲氨酸、蘇氨酸、穀氨醯胺或 天冬醯胺,特別是蘇氨酸或精氨酸;而且對應於 X211的殘基是賴氨酸、精氨酸、天冬氨酸、穀氨酸、甘氨酸、甲硫氨酸、丙氨酸、纈氨酸、亮氨 酸、異亮氨酸、絲氨酸、蘇氨酸、穀氨醯胺或天冬醯胺,特別是纈氨酸、亮氨酸、蘇氨酸或異亮 氨酸。在一些實施方案中,對應於殘基90-211的區域或結構域與基於SEQ ID NO :2、4或 114的參考序列的相應結構域相比在其他未被上述X所指定的胺基酸殘基上可另外具有約 1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18 或 1-20 個殘 基差異。在一些實施方案中,差異的數目可以是在所述結構域中其他胺基酸殘基上的1、2、 3、4、5、6、7、8、9、10、11、12、14、15、16、18或約20個殘基差異。在一些實施方案中,所述差異 包括保守突變。在一些實施方案中,具有對應於SEQ ID NO 111、112或139中的序列式的殘基 90-211的結構域或區域並且具有本文所述對應於X190和X202的殘基的特定特徵或對應 於X190、X195和X202的殘基的特定特徵的酮還原酶多肽,還可在所述區域或結構域中包 括選自如下的一種或多種或所有特徵對應於X94的殘基是半胱氨酸、脂肪族的或非極性 的殘基,特別是半胱氨酸或甘氨酸;對應於X96的殘基是半胱氨酸、極性的、脂肪族的或非 極性的殘基,特別是蘇氨酸、半胱氨酸、纈氨酸、亮氨酸或異亮氨酸;而且對應於X211的殘 基是鹼性的、脂肪族的、非極性的、酸性的或極性的殘基,特別是纈氨酸、亮氨酸、蘇氨酸或 異亮氨酸。在一些實施方案中,對應於殘基90-211的區域或結構域與基於SEQ ID NO :2、 4或114的參考序列的結構域相比在其他胺基酸殘基位置上可另外具有1-2、1-3、1-4、1-5、 1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18 或 1-20 個殘基差異。在一些實 施方案中,差異的數目可以是在所述結構域中其他胺基酸殘基上的1、2、3、4、5、6、7、8、9、 10、11、12、14、15、16、18或約20個殘基差異。在一些實施方案中,所述差異包括保守突變。 在一些實施方案中,酮還原酶區域或結構域包括至少具有前述特徵的胺基酸序列,而且其 中所述胺基酸序列與對應於具有前述特徵的基於SEQ IDNO :2、4或114的參考序列的殘基 90-211 的胺基酸序列相比具有至少 85%,86%,87%,88%,89%,90%,91%,92%,93%, 94%、95%、96%、97%、98%或 99%的同一性。在一些實施方案中,具有對應於SEQ ID NO 111、112或139中的序列式的殘基 90-211的結構域或區域並且具有本文所述對應於X190和X202的殘基的特定特徵或對應 於X190、X195和X202的殘基的特定特徵的酮還原酶多肽,還可在所述區域或結構域中包括 選自如下的一種或多種或所有特徵對應於X94的殘基是半胱氨酸、脂肪族的或非極性的殘基,特別是半胱氨酸或甘氨酸;對應於X96的殘基是半胱氨酸、極性的、脂肪族的或非極 性的殘基,特別是蘇氨酸、半胱氨酸、纈氨酸、亮氨酸或異亮氨酸;對應於X147的殘基是芳 香族的、脂肪族的或非極性的殘基,特別是亮氨酸;而且對應於X211的殘基是鹼性的、脂肪 族的、非極性的、酸性的或極性的殘基,特別是纈氨酸、亮氨酸、蘇氨酸或異亮氨酸。在一些 實施方案中,對應於殘基90-211的區域或結構域與基於SEQ ID NO :2、4或114的參考序列 的結構域相比在其他胺基酸殘基位置上可另外具有1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、 1-10、1-11、1-12、1-14、1-15、1-16、1-18或1-20個殘基差異。在一些實施方案中,差異的數 目可以是在所述結構域中其他胺基酸殘基上的1、2、3、4、5、6、7、8、9、10、11、12、14、15、16、 18或約20個殘基差異。在一些實施方案中,所述差異包括保守突變。在一些實施方案中, 酮還原酶區域或結構域包括至少具有前述特徵的胺基酸序列,而且其中所述胺基酸序列與 對應於具有前述特徵的基於SEQ ID NO :2、4或114的參考序列的殘基90-211的胺基酸序列 相比具有至少 85%,86%,87%,88%,89%,90%,91%,92%,93%,94%,95%,96%,97%, 98%或99%的同一性。在一些實施方案中,具有對應於SEQ ID NO 111、112或139中的序列式的殘基 90-211的結構域或區域並且具有本文所述對應於X190和X202的殘基的特定特徵或對應 於X190、X195和X202的殘基的特定特徵的酮還原酶多肽,還可在所述區域或結構域中包 括選自如下的一種或多種或所有特徵對應於X94的殘基是半胱氨酸、脂肪族的或非極性 的殘基,特別是半胱氨酸或甘氨酸;對應於X96的殘基是半胱氨酸、極性的、脂肪族的或非 極性的殘基,特別是蘇氨酸、半胱氨酸、纈氨酸、亮氨酸或異亮氨酸;對應於X194的殘基是 受限的、極性的、脂肪族的或非極性的殘基,特別是絲氨酸或穀氨醯胺;而且對應於X211的 殘基是鹼性的、脂肪族的、非極性的、酸性的或極性的殘基,特別是纈氨酸、亮氨酸、蘇氨酸 或異亮氨酸。在一些實施方案中,對應於殘基90-211的區域或結構域與基於SEQ IDNO :2、 4或114的參考序列的結構域相比在其他胺基酸殘基上可另外具有1-2、1-3、1-4、1_5、1_6、 1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18 或 1-20 個殘基差異。在一些實施 方案中,差異的數目可以 是在所述結構域中其他胺基酸殘基上的1、2、3、4、5、6、7、8、9、10、 11、12、14、15、16、18或約20個殘基差異。在一些實施方案中,所述差異包括保守突變。在 一些實施方案中,酮還原酶區域或結構域包括至少具有前述特徵的胺基酸序列,而且其中 所述胺基酸序列與對應於具有前述特徵的基於SEQ ID NO :2、4或114的參考序列的殘基 90-211 的胺基酸序列相比具有至少 85%,86%,87%,88%,89%,90%,91%,92%,93%, 94%、95%、96%、97%、98%或 99%的同一性。在一些實施方案中,具有對應於SEQ ID NO 111、112或139中的序列式的殘基 90-211的結構域或區域並且具有本文所述對應於X190和X202的殘基的特定特徵或對應於 X190、X195和X202的殘基的特定特徵的酮還原酶多肽,還可在所述區域或結構域中包括選 自如下的一種或多種或所有特徵對應於X94的殘基是半胱氨酸、脂肪族的或非極性的殘 基,特別是半胱氨酸或甘氨酸;對應於X96的殘基是半胱氨酸、極性的、脂肪族的或非極性 的殘基,特別是蘇氨酸、半胱氨酸、纈氨酸、亮氨酸或異亮氨酸;對應於X147的殘基是芳香 族的、脂肪族的或非極性的殘基,特別是亮氨酸;對應於X194的殘基是受限的、極性的、月旨 肪族的或非極性的殘基,特別是亮氨酸、絲氨酸或穀氨醯胺;而且對應於X211的殘基是鹼 性的、脂肪族的、非極性的、酸性的或極性的殘基,特別是纈氨酸、亮氨酸、異亮氨酸或蘇氨酸。在一些實施方案中,對應於殘基90-211的區域或結構域與基於SEQ ID NO:2、4或114的 參考序列的結構域相比在其他胺基酸殘基上可另外具有1-2、1-3、1-4、1-5、1-6、1_7、1_8、 1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18 或 1-20 個殘基差異。在一些實施方案中,差 異的數目可以是在所述結構域中其他胺基酸殘基上的1、2、3、4、5、6、7、8、9、10、11、12、14、 15、16、18或約20個殘基差異。在一些實施方案中,所述差異包括保守突變。在一些實施 方案中,酮還原酶區域或結構域包括至少具有前述特徵的胺基酸序列,而且其中所述氨基 酸序列與對應於具有前述特徵的基於SEQ ID NO :2、4或114的參考序列的殘基90-211的 胺基酸序列相比具有至少 85%,86%,87%,88%,89%,90%,91%,92%,93%,94%,95%, 96%、97%、98%或 99% 的同一性。 在一些實施方案中,具有對應於SEQ ID N0:lll、112或139中的序列式的殘基 90-211的結構域或區域並且具有本文所述對應於X190和X202的殘基的特定特徵或對應於 X190、X195和X202的殘基的特定特徵的酮還原酶多肽,還可在所述區域或結構域中包括選 自如下的一種或多種或所有特徵對應於X93的殘基是極性的、脂肪族的或非極性的殘基, 特別是絲氨酸;對應於X94的殘基是半胱氨酸、脂肪族的或非極性的殘基,特別是半胱氨酸 或甘氨酸;對應於X96的殘基是半胱氨酸、極性的、脂肪族的或非極性的殘基,特別是蘇氨 酸或亮氨酸;而且對應於X211的殘基是鹼性的、脂肪族的、非極性的、酸性的或極性的殘 基,特別是蘇氨酸、異亮氨酸、亮氨酸或纈氨酸。在一些實施方案中,對應於殘基90-211的 區域或結構域與基於SEQ ID NO :2、4或114的參考序列的結構域相比在其他胺基酸殘基位 置上可另外具有 1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-15、1-16、 1-18或1-20個殘基差異。在一些實施方案中,差異的數目可以是在所述結構域中其他氨 基酸殘基上的1、2、3、4、5、6、7、8、9、10、11、12、14、15、16、18或約20個殘基差異。在一些實 施方案中,所述差異包括保守突變。在一些實施方案中,酮還原酶區域或結構域包括至少 具有前述特徵的胺基酸序列,而且其中所述胺基酸序列與對應於具有前述特徵的基於SEQ ID NO :2、4或114的參考序列的殘基90-211的胺基酸序列相比具有至少85%、86%、87%、 88%,89%,90%,91%,92%,93%,94%,95%,96%,97%,98%^; 99%的同一性。在一些實施方案中,具有對應於SEQ ID N0:lll、112或139中的序列式的殘基 90-211的結構域或區域並且具有本文所述對應於X190和X202的殘基的特定特徵或對應於 X190、X195和X202的殘基的特定特徵的酮還原酶多肽,還可在所述區域或結構域中包括選 自如下的一種或多種或所有特徵對應於X93的殘基是極性的、脂肪族的或非極性的殘基, 特別是絲氨酸;對應於X94的殘基是半胱氨酸、脂肪族的或非極性的殘基,特別是半胱氨酸 或甘氨酸;對應於X96的殘基是半胱氨酸、極性的、脂肪族的或非極性的殘基,特別是半胱 氨酸、蘇氨酸、纈氨酸、亮氨酸或異亮氨酸;對應於XlOO的殘基是鹼性的、酸性的、極性的、 脂肪族的或非極性的殘基,特別是賴氨酸;對應於X147的殘基是芳香族的、脂肪族的或非 極性的殘基,特別是亮氨酸;對應於X152的殘基是極性的、芳香族的、脂肪族的或非極性的 殘基,特別是絲氨酸;對應於X194的殘基是受限的、極性的、脂肪族的或非極性的殘基,特 別是絲氨酸或穀氨醯胺;對應於X196的殘基是非極性的或脂肪族的殘基,特別是亮氨酸; 而且對應於X211的殘基是鹼性的、脂肪族的、非極性的、酸性的或極性的殘基,特別是纈氨 酸。在一些實施方案中,差異的數目可以是在所述結構域中其他胺基酸殘基上的1、2、3、4、 5、6、7、8、9、10、11、12、14、15、16、18或約20個殘基差異。在一些實施方案中,對應於殘基90-211的區域或結構域與基於SEQ ID NO :2、4或114的參考序列的結構域相比在其他胺基酸殘基位置上可另外具有 1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、 1-15、1-16、1-18或1-20個殘基差異。在一些實施方案中,差異的數目可以是在所述結構域 中其他胺基酸殘基上的1、2、3、4、5、6、7、8、9、10、11、12、14、15、16、18或約20個殘基差異。 在一些實施方案中,所述差異包括保守突變。在一些實施方案中,酮還原酶區域或結構域 包括至少具有前述特徵的胺基酸序列,而且其中所述胺基酸序列與對應於具有前述特徵的 基於SEQ ID NO :2、4或114的參考序列的殘基90-211的胺基酸序列相比具有至少85%、 86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或 99% 的同一 性。在一些實施方案中,具有對應於SEQ ID NO 111、112或139中的序列式的殘基 90-211的結構域或區域並且具有本文所述對應於X190和X202的殘基的特定特徵或對應於 X190、X195和X202的殘基的特定特徵的酮還原酶多肽,還可在所述區域或結構域中包括選 自如下的一種或多種或所有特徵對應於X93的殘基是極性的、脂肪族的或非極性的殘基, 特別是絲氨酸或甘氨酸;對應於X94的殘基是半胱氨酸、非極性的或脂肪族的殘基,特別是 半胱氨酸;對應於X96的殘基是半胱氨酸、極性的、脂肪族的或非極性的殘基,特別是異亮 氨酸、亮氨酸或蘇氨酸;對應於X147的殘基是芳香族的、脂肪族的或非極性的殘基,特別是 亮氨酸;對應於X194的殘基是受限的、極性的、脂肪族的或非極性的殘基,特別是穀氨醯胺 或絲氨酸;對應於X196的殘基是非極性的或脂肪族的殘基,特別是亮氨酸;對應於X198的 殘基是酸性的或極性的殘基,特別是穀氨酸;而且對應於X211的殘基是鹼性的、脂肪族的、 非極性的、酸性的或極性的殘基,特別是蘇氨酸、纈氨酸、亮氨酸或異亮氨酸。在一些實施方 案中,對應於殘基90-211的區域或結構域與基於SEQ ID NO :2、4或114的參考序列的結 構域相比在其他胺基酸殘基位置上可另外具有1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、 1-11、1-12、1-14、1-15、1-16、1-18或1-20個殘基差異。在一些實施方案中,差異的數目可 以是在所述結構域中其他胺基酸殘基上的1、2、3、4、5、6、7、8、9、10、11、12、14、15、16、18或 約20個殘基差異。在一些實施方案中,所述差異包括保守突變。在一些實施方案中,酮還原 酶區域或結構域包括至少具有前述特徵的胺基酸序列,而且其中所述胺基酸序列與對應於 具有前述特徵的基於SEQ ID NO :2、4或114的參考序列的殘基90-211的胺基酸序列相比 具有至少 85%,86%,87%,88%,89%,90%,91%,92%,93%,94%,95%,96%,97%,98% 或99%的同一性。在一些實施方案中,具有對應於SEQ ID NO 111、112或139中的序列式的殘基 90-211的結構域或區域並且具有本文所述對應於X190和X202的殘基的特定特徵或對應 於X190、X195和X202的殘基的特定特徵的酮還原酶多肽,還可在所述區域或結構域中包 括選自如下的一種或多種或所有特徵對應於X93的殘基是極性的、脂肪族的或非極性的 殘基,特別是絲氨酸或甘氨酸;對應於X94的殘基是半胱氨酸、非極性的或脂肪族的殘基, 特別是半胱氨酸;對應於X96的殘基是半胱氨酸、極性的、脂肪族的或非極性的殘基,特別 是異亮氨酸、亮氨酸或蘇氨酸;對應於XlOO的殘基是is a鹼性的、酸性的、極性的、脂肪族 的、非極性的殘基或受限的殘基,特別是賴氨酸;對應於X147的殘基是芳香族的、脂肪族的 或非極性的殘基,特別是亮氨酸;對應於X194的殘基是受限的、極性的、脂肪族的或非極性 的殘基,特別是穀氨醯胺或絲氨酸;對應於X196的殘基是非極性的或脂肪族的殘基,特別是亮氨酸;對應於X198的殘基是酸性的或極性的殘基,特別是穀氨酸;而且對應於X211的 殘基是鹼性的、脂肪族的、非極性的、酸性的或極性的殘基,特別是蘇氨酸、纈氨酸、亮氨酸 或異亮氨酸。在一些實施方案中,對應於殘基90-211的區域或結構域與基於SEQ ID NO 2、4或114的參考序列的結構域相比在其他胺基酸殘基位置上可另外具有1-2、1-3、1-4、 1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18 或 1-20 個殘基差異。在一 些實施方案中,差異的數目可以是在所述結構域中其他胺基酸殘基上的1、2、3、4、5、6、7、8、 9、10、11、12、14、15、16、18或約20個殘基差異。在一些實施方案中,所述差異包括保守突 變。在一些實施方案中,酮還原酶區域或結構域包括至少具有前述特徵的胺基酸序列,而 且其中所述胺基酸序列與對應於具有前述特徵的基於SEQ ID N0:2、4或114的參考序列 的殘基90-211的胺基酸序列相比具有至少85%、86%、87%、88%、89%、90%、91%、92%、 93%、94%、95%、96%、97%、98%或 99% 的同一性。
在一些實施方案中,酮還原酶多肽還可包括對應於SEQ ID NO :111、112或139中 的序列式的殘基1-89的結構域或區域,其中所述結構域或區域可具有一種或多種下述特 徵對應於X7的殘基是受限的或非極性的殘基;對應於X17的殘基是非極性的或脂肪族的 殘基;對應於X25的殘基是極性的或酸性的殘基;對應於X27的殘基是芳香族的殘基;對應 於X41的殘基是極性的、脂肪族的或非極性的殘基;對應於X53的殘基是極性的、非極性的 或酸性的殘基;對應於X57的殘基是非極性的或脂肪族的殘基;對應於X64的殘基是極性 的、脂肪族的或非極性的殘基;對應於X66的殘基是酸性的殘基;對應於X68的殘基是極性 的、酸性的、脂肪族的或非極性的殘基;對應於X72的殘基是鹼性的殘基;對應於X76的殘 基是脂肪族的、非極性的或極性的殘基;對應於X80的殘基是脂肪族的、非極性的或極性的 殘基。在一些實施方案中,包括對應於SEQ ID N0:lll、112或139中的序列式的殘基1-89 的區域或結構域的多肽與SEQ ID NO :2、4或114的參考序列相比在未被上述X所指定的殘 基位置上可另外具有一個或多個殘基差異。在一些實施方案中,所述差異可以是與SEQ ID NO :2、4或114的參考序列相比在其他未被上述X所界定的胺基酸殘基位置上的1-2、1-3、 1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-15 或 1-16 個殘基差異。在一些實施 方案中,差異的數目可以是在其他胺基酸殘基位置上的1、2、3、4、5、6、7、8、9、10、11、12、14、 15或16個殘基差異。在一些實施方案中,所述差異包括保守突變。在一些實施方案中,酮還原酶多肽還可包括對應於SEQ ID NO 111、112或139中 的序列式的殘基1-89的結構域或區域,其中所述結構域或區域可具有一種或多種下述特 徵對應於X7的殘基是組氨酸、脯氨酸、甘氨酸、甲硫氨酸、丙氨酸、纈氨酸、亮氨酸或異亮 氨酸,特別是甘氨酸或組氨酸;對應於X17的殘基是甘氨酸、甲硫氨酸、丙氨酸、纈氨酸、亮 氨酸、異亮氨酸,特別是甲硫氨酸;對應於X25的殘基是穀氨酸、天冬氨酸、絲氨酸、蘇氨酸、 穀氨醯胺或天冬醯胺,特別是蘇氨酸或天冬氨酸;對應於X27的殘基是酪氨酸、苯丙氨酸、 色氨酸,特別是酪氨酸;對應於X41的殘基是絲氨酸、蘇氨酸、穀氨醯胺、天冬醯胺、甘氨酸、 甲硫氨酸、丙氨酸、纈氨酸、亮氨酸或異亮氨酸,特別是絲氨酸或丙氨酸;對應於X53的殘基 是絲氨酸、蘇氨酸、穀氨醯胺、天冬醯胺、甘氨酸、甲硫氨酸、丙氨酸、纈氨酸、亮氨酸、異亮氨 酸、天冬氨酸或穀氨酸,特別是蘇氨酸、甘氨酸或天冬氨酸;對應於X57的殘基是甘氨酸、甲 硫氨酸、丙氨酸、纈氨酸、亮氨酸或異亮氨酸,特別是纈氨酸;對應於X64的殘基是絲氨酸、 蘇氨酸、穀氨醯胺、天冬醯胺、甘氨酸、甲硫氨酸、丙氨酸、纈氨酸、亮氨酸或異亮氨酸,特別是絲氨酸、丙氨酸或纈氨酸;對應於X66的殘基是天冬氨酸或穀氨酸;對應於X68的殘基 是絲氨酸、蘇氨酸、穀氨醯胺、天冬醯胺、天冬氨酸、穀氨酸、甘氨酸、甲硫氨酸、丙氨酸、纈氨 酸、亮氨酸或異亮氨酸,特別是蘇氨酸、天冬氨酸、丙氨酸、纈氨酸或穀氨酸;對應於X72的 殘基是賴氨酸或精氨酸,特別是精氨酸;對應於X76的殘基是絲氨酸、蘇氨酸、穀氨醯胺、天 冬醯胺、甘氨酸、丙氨酸、纈氨酸、亮氨酸或異亮氨酸,特別是丙氨酸或蘇氨酸;而且對應於 X80的殘基是絲氨酸、蘇氨酸、穀氨醯胺、天冬醯胺、甘氨酸、甲硫氨酸、丙氨酸、纈氨酸、亮氨 酸或異亮氨酸,特別是丙氨酸、蘇氨酸或纈氨酸。在一些實施方案中,包括對應於SEQ ID NO 111、112或139中的序列式的殘基1-89的區域或結構域的多肽與SEQ ID N0:2、4或114 的參考序列相比在未被上述X所指定的殘基位置上可另外具有一個或多個殘基差異。在 一些實施方案中,所述差異可以是與SEQ ID NO :2、4或114的參考序列相比在其他未被上 述 X 所界定的胺基酸殘基位置上的 1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、 1-14、1-15或1-16個殘基差異。在一些實施方案中,差異的數目可以是在其他胺基酸殘基 位置上的1、2、3、4、5、6、7、8、9、10、11、12、14、15或16個殘基差異。在一些實施方案中,所 述差異包括保守突變。在一些實施方案中,酮還原酶多肽還可包括對應於SEQ ID NO :111、112或139中 的序列式的殘基1-89的結構域或區域,其中所述結構域或區域可至少具有下述特徵對應 於X7的殘基是受限的或非極性的殘基,特別是組氨酸。在一些實施方案中,包括對應於SEQ ID NO :111、112或139中的序列式的殘基1-89的區域或結構域的多肽與SEQ ID N0:2、4或 114的參考序列相比在其他殘基位置上可另外具有一個或多個殘基差異。在一些實施方案 中,對應於殘基1-89的區域或結構域與基於SEQ ID NO :2、4或114的參考序列的相應結構 域或區域相比在其他胺基酸殘基位置上可另外具有1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、 1-10、1-11、1-12、1-14、1-15或1-16個殘基差異。在一些實施方案中,差異的數目可以是在所述結構域中其他胺基酸殘基上的1、2、3、4、5、6、7、8、9、10、11、12、14、15或約16個殘基 差異。在一些實施方案中,所述差異包括保守突變。在一些實施方案中,酮還原酶區域或結 構域包括至少具有前述特徵的胺基酸序列,而且其中所述胺基酸序列與對應於具有前述特 徵的基於SEQ IDNO :2、4或114的參考序列的殘基1_89的胺基酸序列相比具有至少85%、 86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或 99% 的同一 性。在一些實施方案中,酮還原酶多肽還可包括對應於SEQ ID NO 111、112或139中 的序列式的殘基1-89的結構域或區域,其中所述結構域或區域可具有一種或多種或至少 所有的下述特徵對應於X7的殘基是受限的或非極性的殘基,特別是組氨酸;而且對應於 X66的殘基是酸性的殘基,特別是穀氨酸。在一些實施方案中,包括對應於SEQ ID NO=IlU 112或139中的序列式的殘基1-89的區域或結構域的多肽與SEQ ID NO :2、4或114的參考 序列相比在其他殘基位置上可另外具有一個或多個殘基差異。在一些實施方案中,對應於 殘基1-89的區域或結構域與基於SEQ ID NO :2、4或114的參考序列的相應結構域相比在 其他胺基酸殘基位置上可另外具有 1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、 1-14、1-15或1-16個殘基差異。在一些實施方案中,差異的數目可以是在所述結構域中其 他胺基酸殘基上的1、2、3、4、5、6、7、8、9、10、11、12、14、15或約16個殘基差異。在一些實 施方案中,所述差異包括保守突變。在一些實施方案中,酮還原酶區域或結構域包括至少具有前述特徵的胺基酸序列,而且其中所述胺基酸序列與對應於具有前述特徵的基於SEQ IDN0:2、4或114的參考序列的殘基1_89的胺基酸序列相比具有至少85 %、86 %、87 %、 88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或 99% 的同一性。在一些實施方案中,酮還原酶多肽還可包括對應於SEQ ID NO 111、112或139中 的序列式的殘基1-89的結構域或區域,其中所述結構域或區域可具有一種或多種或至少 所有的下述特徵對應於X7的殘基是受限的或非極性的殘基,特別是組氨酸;對應於X17 的殘基是非極性的或脂肪族的殘基,特別是甲硫氨酸;對應於X27的殘基是芳香族的殘基, 特別是酪氨酸;對應於X64的殘基是極性的、脂肪族的或非極性的殘基,特別是纈氨酸;而 且對應於X80的殘基是脂肪族的、非極性的或極性的殘基,特別是蘇氨酸或纈氨酸。在一些 實施方案中,包括對應於SEQ ID N0:lll、112或139中的序列式的殘基1-89的區域或結 構域的多肽與SEQ ID NO :2、4或114的參考序列相比在其他殘基位置上可另外具有一個 或多個殘 基差異。在一些實施方案中,對應於殘基1-89的區域或結構域與基於SEQ IDNO
2、4或114的參考序列的相應結構域相比在其他胺基酸殘基位置上可另外具有1-2、1-3、 1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-15 或 1-16 個殘基差異。在一些實施 方案中,差異的數目可以是在所述結構域中其他胺基酸殘基上的1、2、3、4、5、6、7、8、9、10、 11、12、14、15或約16個殘基差異。在一些實施方案中,所述差異包括保守突變。在一些實 施方案中,酮還原酶區域或結構域包括至少具有前述特徵的胺基酸序列,而且其中所述氨 基酸序列與對應於具有前述特徵的基於SEQ IDNO :2、4或114的參考序列的殘基1_89的 胺基酸序列相比具有至少 85%,86%,87%,88%,89%,90%,91%,92%,93%,94%,95%, 96%、97%、98%或 99% 的同一性。在一些實施方案中,酮還原酶多肽還可包括對應於SEQ ID NO :111、112或139中 的序列式的殘基212-252的結構域或區域,其中所述結構域或區域可具有一種或多種下述 特徵對應於X212的殘基是極性的、脂肪族的或非極性的;對應於X216的殘基是受限的或 鹼性的殘基;對應於X223的殘基是非極性的或脂肪族的殘基;對應於X226的殘基是非極 性的或極性的殘基;對應於X233的殘基是極性的或酸性的;對應於X235的殘基是極性的 或芳香族的殘基;對應於X248的殘基是非極性的或芳香族的殘基;而且對應於X249的殘 基是芳香族的殘基。在一些實施方案中,所述胺基酸序列可具有由上述X所界定的至少2、
3、4、5、6或更多種另外特徵。在一些實施方案中,包括基於SEQID NO :111、112或139中 的序列式的胺基酸序列(或其區域)的多肽與SEQ ID NO :2、4或114的參考序列相比在未 被上述X所指定的殘基位置上可另外具有一個或多個殘基差異。在一些實施方案中,所述 差異可以是在其他未被上述X所界定的胺基酸殘基位置上的1-2、1-3、1-4、1-5、1-6、1-7、 1-8、1-9或1-10個殘基差異。在一些實施方案中,差異的數目可以是在其他胺基酸殘基位 置上的1、2、3、4、5、6、7、8、9或約10個殘基差異。在一些實施方案中,所述差異包括保守突 變。在一些實施方案中,酮還原酶多肽還可包括對應於SEQ ID NO :111、112或139中 的序列式的殘基212-252的結構域或區域,其中所述結構域或區域可具有一種或多種下述 特徵對應於X212的殘基是絲氨酸、蘇氨酸、穀氨醯胺、天冬醯胺、甘氨酸、甲硫氨酸、丙氨 酸、纈氨酸、亮氨酸或異亮氨酸,特別是蘇氨酸、絲氨酸或纈氨酸;對應於X216的殘基是脯 氨酸、組氨酸、精氨酸或賴氨酸,特別是組氨酸或精氨酸;對應於X223的殘基是甘氨酸、甲硫氨酸、丙氨酸、纈氨酸、亮氨酸或異亮氨酸,特別是纈氨酸;對應於X226的殘基是甘氨酸、 甲硫氨酸、丙氨酸、纈氨酸、亮氨酸、異亮氨酸、絲氨酸、蘇氨酸、穀氨醯胺或天冬醯胺,特別 是蘇氨酸;對應於X233的殘基是絲氨酸、蘇氨酸、穀氨醯胺、天冬醯胺、天冬氨酸、穀氨酸, 特別是天冬醯胺或天冬氨酸;對應於X235的殘基是絲氨酸、蘇氨酸、穀氨醯胺、天冬醯胺、 酪氨酸、苯丙氨酸、色氨酸,特別是絲氨酸或色氨酸;對應於X248的殘基是甘氨酸、甲硫氨 酸、丙氨酸、纈氨酸、亮氨酸、異亮氨酸、酪氨酸、苯丙氨酸或色氨酸,特別是甘氨酸或色氨 酸;而且對應於X249的殘基是酪氨酸、苯丙氨酸或色氨酸,特別是色氨酸。在一些實施方案 中,所述胺基酸序列可具有由上述X所界定的至少2、3、4、5、6或更多種另外特徵。在一些 實施方案中,包括基於SEQID N0:lll、112或139中的序列式的胺基酸序列(或其區域)的 多肽與SEQID NO :2、4或114的參考序列相比在未被上述X所指定的殘基位置上可另外具 有一個或多個殘基差異。在一些實施方案中,所述差異可以是在其他未被上述X所界定的 胺基酸殘基位置上的1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9或1_10個殘基差異。在一些實 施方案中,差異的數目可以是在其他胺基酸殘基位置上的1、2、3、4、5、6、7、8、9或約10個殘 基差異。在一些實施方案中,所述差異包括保守突變。在一些實施方案中,酮 還原酶多肽還可包括對應於SEQ ID NO :111、112或139中 的序列式的殘基212-252的結構域或區域,其中所述結構域或區域至少具有下述特徵對 應於X216的殘基是受限的或鹼性的殘基,特別是精氨酸。在一些實施方案中,包括對應於 SEQ ID NO: 111、112或139中的序列式的殘基212-252的區域或結構域的多肽與具有前述 特徵的SEQ ID NO :2、4或114的參考序列相比在其他殘基位置上可另外具有一個或多個 殘基差異。在一些實施方案中,對應於殘基212-252的區域或結構域與基於SEQ ID NO :2、 4或114的參考序列的相應結構域相比在其他胺基酸殘基位置上可另外具有1-2、1-3、1-4、 1-5、1-6、1-7、1-8、1-9或1_10個殘基差異。在一些實施方案中,差異的數目可以是在所述 結構域中其他胺基酸殘基上的1、2、3、4、5、6、7、8、9或約10個殘基差異。在一些實施方案 中,所述差異包括保守突變。在一些實施方案中,酮還原酶區域或結構域包括至少具有前 述特徵的胺基酸序列,而且其中所述胺基酸序列與對應於具有前述特徵的基於SEQ ID NO 2、4或114的參考序列的殘基212-252的胺基酸序列相比具有至少85%、86%、87%、88%、 89%,90%,91%,92%,93%,94%,95%,96%,97%,98%^; 99%的同一性。在一些實施方案中,酮還原酶多肽還可包括對應於SEQ ID NO :111、112或139中 的序列式的殘基212-252的結構域或區域,其中所述結構域或區域可具有一種或多種或至 少所有的下述特徵對應於X212的殘基是極性的、脂肪族的或非極性的殘基,特別是蘇氨 酸、絲氨酸或纈氨酸;對應於X216的殘基是受限的或鹼性的殘基,特別是組氨酸或精氨酸; 對應於X223的殘基是極性的、脂肪族的或非極性的,特別是纈氨酸;對應於X233的殘基是 極性的或酸性的殘基,特別是天冬醯胺或天冬氨酸;對應於X235的殘基是極性的或芳香族 的殘基,特別是絲氨酸或色氨酸;對應於X248的殘基是非極性的或芳香族的殘基,特別是 甘氨酸或色氨酸;而且對應於X249的殘基是芳香族的殘基,特別是色氨酸。在一些實施方 案中,包括對應於SEQ ID NO :111、112或139中的序列式的殘基212-252的區域或結構域 的多肽與SEQ ID NO :2、4或114的參考序列相比在其他殘基位置上可另外具有一個或多個 殘基差異。在一些實施方案中,對應於殘基212-252的區域或結構域與基於SEQ ID NO :2、 4或114的參考序列的相應結構域相比在其他胺基酸殘基位置上可另外具有1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9或1_10個殘基差異。在一些實施方案中,差異的數目可以是在所述 結構域中其他胺基酸殘基上的1、2、3、4、5、6、7、8、9或約10個殘基差異。在一些實施方案 中,所述差異包括保守突變。在一些實施方案中,酮還原酶區域或結構域包括至少具有前 述特徵的胺基酸序列,而且其中所述胺基酸序列與對應於具有前述特徵的基於SEQ ID NO 2、4或114的參考序列的殘基212-252的胺基酸序列相比具有至少85%、86%、87%、88%、 89%,90%,91%,92%,93%,94%,95%,96%,97%,98%^; 99%的同一性。
下表2提供本文公開的具有相關活性的特定SEQ ID NO的列表。除非另外說明, 下面的序列衍生自野生型高加索酸奶乳桿菌酮還原酶序列(SEQID N0:3和4)。在下表2 中,每行列出兩個SEQ ID N0,其中的奇數指的是編碼由偶數所提供的胺基酸序列的核苷酸 序列。列出突變數目的列是關於與SEQ ID NO :4中的高加索酸奶乳桿菌KRED胺基酸序列 相比之下胺基酸取代的數目。在活性列中,一個「 + 」對應於10g/L的酶在約24小時內轉化 10-20%的lg/L底物的能力。兩個加號「++」表示多肽比SEQ ID NO 90的活性高約1至50 倍。三個加號「+++」表示多肽比SEQ ID NO :90的活性高約50至250倍。四個加號「++++」 表示多肽比SEQ ID NO 90的活性高約250至1000倍,而五個加號「+++++」表示多肽比SEQ ID NO 90的活性高1000倍以上。表2 序列和相應的活性改進的列表 在一些實施方案中,所述多肽與基於SEQID NO :6、8、10、12、14、16、18、20、22、24、 26、28、30、32、34、36、38、40、42、44、46、48、50、52、54、56、58、60、62、64、66、68、70、72、74、 76、78、80、82、84、86、88、92、94、96、98、100、102、104、106、108 或 110 的參考序列的多Jj太相 比具有至少 85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、 98%或99%的序列同一性,條件是酮還原酶多肽胺基酸序列與SEQ ID NO :4相比包括列在表2中的任何一組取代組合。在一些實施方案中,酮還原酶多肽與參考序列相比在其他氨 基酸殘基位置上可另外具有 1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、
1-15、1-16、1-18、1-20、1-22、1-24、1-25、1-30、1-35或約 1-40 個殘基差異。在一些實施方 案中,差異的數目可以是在其他胺基酸殘基上的1、2、3、4、5、6、7、8、9、10、11、12、14、15、16、 18、20、22、24、26、30、35或約40個殘基差異。在一些實施方案中,所述差異包括保守突變。在一些實施方案中,酮還原酶多肽能夠以至少約99 %的百分比立體異構過量和比 具有SEQ ID NO :90的胺基酸序列的參考多肽改進的速率將底物2-[3-[3-[2-(7-氯-2-喹 啉基)乙烯基]苯基]-3-氧代丙基]苯甲酸甲酯轉化為產物(5,幻-2-(3-(3-(2-(7-氯喹 啉-2-基)乙烯基)苯基)_3_羥丙基)苯甲酸甲酯。具有這種性質的示例性多肽包括但不 限於含有對應於 SEQ ID NO :6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、 42、44、46、48、50、52、54、56、58、60、62、64、66、68、70、72、74、76、78、80、82、84、86、88、92、 94、96、98、100、102、104、106、108和110的胺基酸序列的多肽。因為具有SEQ ID NO :90的 胺基酸序列的參考多肽能夠以比野生型(SEQ ID N0:4)改進的速率(例如,用約10g/L的 KRED在24小時內將10-20%的lg/L底物轉化為產物)和立體選擇性(99%的立體異構過 量)將底物轉化為產物,所以本文中比SEQ IDN0:90改進的多肽也是比野生型改進的。在一些實施方案中,酮還原酶多肽能夠以至少約99%的百分比立體異構過量 和比具有SEQ ID NO :90的胺基酸序列的參考多肽改進了至少1-50倍的速率將底物
2-[3-[3-[2-(7-氯-2-喹啉基)乙烯基]苯基]-3-氧代丙基]苯甲酸甲酯轉化為產物(S, E)-2-(3-(3-(2-(7-氯喹啉-2-基)乙烯基)苯基)_3_羥丙基)苯甲酸甲酯。具有這種 性質的示例性多肽包括但不限於含有對應於SEQ IDN0 :42、44、46、48、86、88、92、94、96、100 和102的胺基酸序列的多肽。在一些實施方案中,酮還原酶多肽能夠以至少約99%的百分比立體異構過量 和比具有SEQ ID NO :90的胺基酸序列的參考多肽改進了至少50-250倍的速率將底物 2-[3-[3-[2-(7-氯-2-喹啉基)乙烯基]苯基]-3-氧代丙基]苯甲酸甲酯轉化為產物(S, E)-2-(3-(3-(2-(7-氯喹啉-2-基)乙烯基)苯基)_3_羥丙基)苯甲酸甲酯。具有這種性 質的示例性多肽包括但不限於含有對應於SEQ ID NO :10、32、34、36、50、64、66、68、70、72、 74、76、78、80、82、84、98、104、106 和 108 的胺基酸序列的多肽。在一些實施方案中,酮還原酶多肽能夠以至少約99%的百分比立體異構過量和 比具有SEQ ID NO 90的胺基酸序列的參考多肽改進了至少250-1000倍的速率將底物 2-[3-[3-[2-(7-氯-2-喹啉基)乙烯基]苯基]-3-氧代丙基]苯甲酸甲酯轉化為產物(S, E)-2-(3-(3-(2-(7-氯喹啉-2-基)乙烯基)苯基)_3_羥丙基)苯甲酸甲酯。具有這種性 質的示例性多肽包括但不限於含有對應於SEQ ID NO :12、18、22、24、26、28、30、38、40、52、 54、56、58、60、62和110的胺基酸序列的多肽。在一些實施方案中,酮還原酶多肽能夠以至少約99%的百分比立體異構過量 和比具有SEQ ID NO :90的胺基酸序列的參考多肽改進了至少1000倍的速率將底物 2-[3-[3-[2-(7-氯-2-喹啉基)乙烯基]苯基]-3-氧代丙基]苯甲酸甲酯轉化為產物(S, E)-2-(3-(3-(2-(7-氯喹啉-2-基)乙烯基)苯基)_3_羥丙基)苯甲酸甲酯。具有這種 性質的示例性多肽包括但不限於含有對應於SEQ IDN0 :6、8、14、16和20的胺基酸序列的多 肽。
在一些實施方案中,與具有SEQ ID NO :90的胺基酸序列的參考多肽相比,改進 的酮還原酶多肽可具有增加的對丙酮的抵抗性,其中丙酮被作為底物向產物轉化中的競爭 性抑制劑。具有這種增加的抵抗性的示例性多肽包括但不限於含有對應於SEQ ID N0:6、 8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、50、52、54、56、58、60、62、64、66、 68、70、72、74、76、78、80、82、84、86、88、98、104、106、108 和 110 的胺基酸序列的多肽。在一些實施方案中,當用超過約100g/L的底物和小於約5g/L的多肽進行時,酮還 原酶多肽能夠在小於約24小時中將至少約95%的底物轉化為產物。具有這種能力的示例 性多肽包括但不限於含有對應於SEQ IDN0 :6、8、14、16和20的胺基酸序列的多肽。在一些實施方案中,本公開的酮還原酶多肽是高度地立體選擇性的,以便它能夠 將底物還原為具有超過約 99%,99. 1%,99. 2%,99. 3%,99. 4%,99. 5%,99. 6%,99. 7%, 99. 8%或99. 9%立體異構過量的產物。具有這種高度立體選擇性的示例性酮還原酶多肽 包括但不限於含有對應於SEQ IDN0 :6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、 38、40、42、44、46、48、50、52、54、56、58、60、62、64、66、68、70、72、74、76、78、80、82、84、86、 88、90、92、94、96、98、100、102、104、106、108 和 110 的胺基酸序列的多肽。在一些實施方案中,改進的酮還原酶多肽可包括與SEQ ID NO :2或SEQ ID NO 4 或SEQ ID NO :114或者其區域或結構域(例如殘基90-211)至少約85%、86%、87%、88%、 89%、90%、91%、92%、93%、94%、95%、96%、97%、98% 或 99%相同的胺基酸序列,條件 是對應於SEQ IDN0 :2、4或114中的殘基190的殘基是脯氨酸,對應於SEQ ID NO :2、4或 114中的殘基195的殘基是精氨酸,而且對應於SEQ ID NO :2、4或114中的殘基202的殘 基是色氨酸,並且改進的酮還原酶多肽另外具有一種或多種下述取代以使該多肽比野生型 高加索酸奶乳桿菌酮還原酶或另一種人工改造的酮還原酶(例如SEQ ID N0:90)進一步 改進(例如,關於立體選擇性、酶活性和/或熱穩定性)7 — H ;17 — M ;25 — T ;27 — Y ; 41 — S ;53 — D ;57 — V ;64 — V ;66 — E ;68 — V,E ;72 — R ;76 — A ;80 — T,V ;93 — S, A, G ;94 — C,G ;95 — L,E ;96 — V, L, I,T ;97 — H,S ;100 — K,Q,A ;108 — H ;111 — M ; 139 — L ;145 — L ;147 — L ;152 — W,A,S ;163 — I ;179 — F,K,L ; 194 — Q,S,L ;196 — L ; 197 —E ; 198 —E,Q ;210 — R ;211 — V,L,R,T,D,I ;212 —S,V ;216 —R ;223 —V ;233 —N ; 235 — W ; 248 — W 和 249 — W。在一些實施方案中,改進的酮還原酶多肽可包括與SEQ ID NO :2、4或114(或者 其區域或結構域,例如殘基90-211)至少約85%、86%、87%、88%、89%、90%、91%、92%、 93%、94%、95%、96%、97%、98%或99%相同的胺基酸序列,條件是對應於5£0 ID NO :2、 4或114中的殘基190的殘基是脯氨酸;對應於SEQ ID NO :2、4或114中的殘基195的殘 基是精氨酸;而且對應於SEQ ID NO :2、4或114中的殘基202的殘基是色氨酸,並且改進 的酮還原酶多肽另外具有至少一種或多種下述取代以使該多肽比野生型高加索酸奶乳杆 菌酮還原酶或另一種人工改造的酮還原酶(例如SEQ ID NO 90)進一步改進(例如,關於 立體選擇性、酶活性和/或熱穩定性):17 — M ;27 — Y ;64 — V ;80 — T ;93 — S ;94 — C ; 96 — L ;100 — K ;147 — L ;152 — S ;194 — Q 和 211 — V。如本領域技術人員將理解的,除非另外說明,上述界定的胺基酸類別中的一些不 互斥。因此,具有展現兩種或更多種物理化學性質的側鏈的胺基酸可被包括在多個類別中。 任何胺基酸或殘基的適當分類對於本領域技術人員將是明顯的,特別是鑑於本文提供的詳
在一些實施方案中,改進的人工改造的酮還原酶包括天然存在的酮還原酶多肽的 缺失或其他人工改造的酮還原酶多肽的缺失。在一些實施方案中,本文所述的每種改進的 人工改造的酮還原酶可包括本文所述的多肽的缺失。因此,對於本公開的酮還原酶多肽的 各個和每個實施方案來說,缺失可包括一個或多個胺基酸、2個或更多個胺基酸、3個或更 多個胺基酸、4個或更多個胺基酸、5個或更多個胺基酸、6個或更多個胺基酸、8個或更多個 胺基酸、10個或更多個胺基酸、15個或更多個胺基酸或者20個或更多個胺基酸,酮還原酶 多肽的胺基酸總數目的至多10%、胺基酸總數目的至多20%或胺基酸總數目的至多30%, 只要能維持酮還原酶活性的功能性活性。在一些實施方案中,缺失可包括1_2、1-3、1-4、 1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18、1-20、1-22、1-24、1-25、
1-30、1-35或約1-40個胺基酸殘基。在一些實施方案中,缺失的數目可以是1、2、3、4、5、6、 7、8、9、10、11、12、14、15、16、18、20、22、24、26、30、35 或約 40 個胺基酸。在一些實施方案中, 缺失可包括1、2、3、4、5、6、7、8、9、10、11、12、14、15、16、18或20個胺基酸殘基的缺失。如本文所述,本公開的酮還原酶多肽可以是融合多肽的形式,其中所述酮還原酶 多肽被融合至其他多肽,例如但不限於抗體標籤(例如myc表位)、純化序列(例如His標 籤)和細胞定位信號(例如分泌信號)。因此,酮還原酶多肽可以與或者不與其他多肽融合 而使用本文所述多肽不限於被遺傳編碼的胺基酸。除了被遺傳編碼的胺基酸之外,本 文所述的多肽可以全部或部分地包括天然存在的和/或合成的非編碼胺基酸。可能包含 本文所述多肽的某些常見的非編碼胺基酸包括但不限於被遺傳編碼的胺基酸的D-立體 異構體;2,3-二氨基丙酸(Dpr) ; a-氨基異丁酸(Aib) ; e-氨基己酸(Aha) ; S -氨基戊 酸(Ava) ;N-甲基甘氨酸或肌氨酸(MeGly或Sar);鳥氨酸(Orn);瓜氨酸(Cit) ;t_ 丁基 丙氨酸(Bua) ;t-丁基甘氨酸(Bug) ;N-甲基異亮氨酸(Melle);苯甘氨酸(Phg);環己基 丙氨酸(Cha);正亮氨酸(Nle);萘基丙氨酸(Nal) ;2_氯苯丙氨酸(Ocf) ;3_氯苯丙氨酸 (Mcf) ;4-氯苯丙氨酸(Pcf) ;2-氟代苯丙氨酸(Off) ;3-氟代苯丙氨酸(Mff) ;4-氟代苯 丙氨酸(Pff) ;2-溴代苯丙氨酸(Obf) ;3-溴代苯丙氨酸(Mbf) ;4-溴代苯丙氨酸(Pbf);
2-甲基苯丙氨酸(Omf);3-甲基苯丙氨酸(Mmf) ;4-甲基苯丙氨酸(Pmf) ;2-硝基苯丙氨 酸(Onf) ;3-硝基苯丙氨酸(Mnf) ;4-硝基苯丙氨酸(Pnf) ;2-氰基苯丙氨酸(Ocf) ;3-氰 基苯丙氨酸(Mcf) ;4-氰基苯丙氨酸(Pcf) ;2-三氟代甲基苯丙氨酸(Otf) ;3-三氟代甲 基苯丙氨酸(Mtf) ;4-三氟代甲基苯丙氨酸(Ptf) ;4-氨基苯丙氨酸(Paf) ;4-碘代苯丙 氨酸(Pif) ;4-氨基甲基苯丙氨酸(Pamf) ;2,4-二氯苯丙氨酸(Opef) ;3,4-二氯苯丙氨 酸(Mpcf) ;2,4-二氟代苯丙氨酸(Opff) ;3,4-二氟代苯丙氨酸(Mpff);吡啶_2_基丙氨 酸(2pAla);吡啶-3-基丙氨酸(3pAla);吡啶_4_基丙氨酸(4pAla);萘基丙氨酸 (InAla);萘-2-基丙氨酸(2nAla);噻唑基丙氨酸(taAla);苯並噻吩基丙氨酸(bAla);噻 吩基丙氨酸(tAla);呋喃基丙氨酸(fAla);高苯丙氨酸(hPhe);高酪氨酸(hTyr);高色氨 酸(hTrp);戊氟代苯丙氨酸(5ff);苯乙烯基丙氨酸(sAla);蒽基丙氨酸(aAla) ;3,3_ 二 苯丙氨酸(Dfa) ;3-氨基-5-苯基戊酸(Afp);青黴胺(Pen) ; 1,2,3,4-四氫異喹啉-3-羧 酸(Tic) ; 0-2-噻吩基丙氨酸(Thi);甲硫氨酸亞碸(Mso) ;N(w)_硝基精氨酸(nArg);高 賴氨酸(hLys);膦醯基甲基苯丙氨酸(pmPhe);磷酸絲氨酸(pSer);磷酸蘇氨酸(pThr);高天冬氨酸(hAsp);高穀氨酸(hGlu) ; 1-氨基環戊-(2或3)-烯-4羧酸;哌啶酸(PA),氮 雜環丁烷-3-羧酸(ACA) ;1-氨基環戊烷-3-羧酸;烯丙基甘氨酸(aOly);炔丙基甘氨酸 (pgGly);高丙氨酸(hAla);正纈氨酸(nVal);高亮氨酸(hLeu),高纈氨酸(hVal);高異亮 氨酸(hlle);高精氨酸(hArg) ;N-乙醯賴氨酸(AcLys) ;2,4-二氨基丁酸(Dbu) ;2,3-二 氨基丁酸(Dab) ;N-甲基纈氨酸(MeVal);高半胱氨酸(hCys);高絲氨酸(hSer);羥脯氨酸 (Hyp)和高脯氨酸(hPro)。可能包含本文所述多肽的另外的非編碼胺基酸對於本領域技術 人員將是明顯的(參見例如 Fasman,1989,CRC Practical Handbook of Biochemistryand Molecular Biology, CRC Press, Boca Raton,FL,第3-70頁和本文所引用的參考文獻中提 供的各種胺基酸,其全部通過引用被併入)。這些胺基酸可以是L-或D-構型的。本領域技術人員將發現,含有側鏈保護基團的胺基酸或殘基還可包括本文所述的 多肽。這種受保護的胺基酸(在這種情況下其屬於芳香族類別)的非限制性實例包括(括 號中列出保護基團)但不限於:Arg(tos)、Cys(甲基苄基)、Cys (硝基吡啶亞氧硫基)、 Glu(6-苄酯)、Gln(氧雜蒽基)、Asn(N- 6 -氧雜蒽基).His (bom) .His (苄基).His (tos)、 Lys (fmoc)、Lys (tos)、Ser (0_ 苄基)、Thr (0-苄基)和 Tyr (0-苄基)。可能包含本文所述多肽的、構象受限的非編碼胺基酸包括但不限於N-甲基氨基 酸(L-構型);1-氨基環戊_(2或3)-烯-4-羧酸;哌啶酸;氮雜環丁烷-3-羧酸;高脯氨 酸(hPro)和1-氨基環戊烷-3-羧酸。如上所述,被引入天然存在的多肽以產生人工改造的酮還原酶的各種修飾可針對 該酶的特殊性質。6. 3編碼人工改造的酮還原酶的多核苷酸在另一方面,本公開提供編碼人工改造的酮還原酶的多核苷酸。所述多核苷酸可 以被可操作地連接至一個或多個控制基因表達的異源性調節序列以產生能夠表達該多肽 的重組多核苷酸。含有編碼人工改造的酮還原酶的異源性多核苷酸的表達構建體可被引入 適當的宿主細胞以表達相應的酮還原酶多肽。因為對應於各種胺基酸的密碼子的知識,蛋白序列的可用性提供對所有能夠編 碼所述蛋白序列的多核苷酸的描述。遺傳密碼的簡併性(在其中相同的胺基酸被可選的 或同義的密碼子所編碼)允許產生極大量的核酸,其所有都編碼本文公開的改進的酮還原 酶。因此,在已經鑑定了特定胺基酸序列之後,本領域技術人員可以以不改變蛋白胺基酸 序列的方式通過簡單地修飾一個或多個密碼子的序列來製備任何數量的不同核酸。在這點 上,本公開特別預期能夠通過選擇基於可能的密碼子選擇的組合來進行多核苷酸的各個和 每個可能的改變,而且所有這種改變都將被視為為了本文所公開的任何多肽而被特別公開 的,其中所述多肽包括呈現於表2中的胺基酸序列。在一些實施方案中,優選地選擇密碼子 以適應產生蛋白的宿主細胞。例如,用於細菌中的優選的密碼子被用來表達細菌中的基因; 用於酵母中的優選的密碼子被用於酵母中的表達;而且用於哺乳動物中的優選的密碼子被 用於哺乳動物細胞中的表達。舉例來說,SEQ ID NO :3的多核苷酸是為了大腸桿菌中的表 達而被優化的密碼子,但是另外還編碼高加索酸奶乳桿菌的天然存在的酮還原酶。在一些實施方案中,不需要替換所有密碼子以將酮還原酶的密碼子選擇最佳化, 因為天然序列將包括優選的密碼子並且因為優選的密碼子的使用對於所有胺基酸殘基可 能不是必需的。因此,編碼酮還原酶的密碼子優化的多核苷酸可在全長編碼區域中約40 %、50%,60%,70%,80%或超過90%的密碼子位置上含有優選的密碼子。在一些實施方案中,多核苷酸包括編碼酮還原酶多肽的核苷酸序列,所述酮還原 酶多肽具有與本文所述任何參考人工改造的酮還原酶多肽相比具有至少約80%、85%、 86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98% 或 99% 或更高 序列同一性的胺基酸序列。因此,在一些實施方案中,多核苷酸編碼與具有下述特徵的基 於 SEQID NO :2、4 或 114 的參考序列至少約 80%、85%、86%、87%、88%、89%、90%、91 %、 92%、93%、94%、95%、96%、97%、98%、99%或更多地相同的胺基酸序列對應於位置 X190的殘基是受限殘基,特別是脯氨酸;而且對應於X202的殘基是芳香族殘基,特別是色 氨酸;條件是被編碼的酮還原酶多肽具有這樣的胺基酸序列,在其中對應於X190的殘基是 受限殘基,而且對應於X202的殘基是芳香族殘基。在一些實施方案中,多核苷酸編碼具有 一種胺基酸序列的酮還原酶,所述胺基酸序列中對應於X190的殘基是脯氨酸;而且對應於 X202的殘基是色氨酸。在一些實施方案中,多核苷酸編碼包括與具有下述特徵的基於SEQ IDN0 :2、4或 114 的參考序列至少約 80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、 95%、96%、97%、98%、99%或更多地相同的胺基酸序列的酮還原酶多肽對應於位置 X190的殘基是受限殘基,特別是脯氨酸;對應於X195的殘基是鹼性的、酸性的、非極性的或 極性的殘基,特別是脯氨酸、精氨酸、賴氨酸、天冬氨酸或天冬醯胺;而且對應於X202的殘 基是芳香族殘基,特別是色氨酸;條件是被編碼的酮還原酶多肽包括至少具有前述特徵的 胺基酸序列(即,對應於位置X190的殘基是受限殘基;對應於X195的殘基是鹼性的、酸性 的、非極性的或極性的殘基;而且對應於X202的殘基是芳香族殘基。在一些實施方案中,被 編碼的酮還原酶具有這樣的胺基酸序列,其中對應於X190的殘基是脯氨酸;對應於X195的 殘基是脯氨酸、精氨酸、賴氨酸、天冬氨酸或天冬醯胺;而且對應於X202的殘基是色氨酸。 在一些實施方案中,多核苷酸編碼包括選自SEQ ID NO :6、8、10、12、14、16、18、20、22、24、 26、28、30、32、34、36、38、40、42、44、46、48、50、52、54、56、58、60、62、64、66、68、70、72、74、 76、78、80、82、84、86、88、92、94、96、98、100、102、104、106、108 和 110 的胺基酸序列的人工 改造的酮還原酶多肽。在一些實施方案中,多核苷酸編碼包括與選自SEQ ID NO :6、8、10、12、14、16、18、 20、22、24、26、28、30、32、34、36、38、40、42、44、46、48、50、52、54、56、58、60、62、64、66、68、 70、72、74、76、78、80、82、84、86、88、92、94、96、98、100、102、104、106、108 和 110 的參考序列 至少約 80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、 98%、99%或更多地相同的胺基酸序列的酮還原酶多肽,其中被編碼的多肽具有本文中對 應於X190和X202的殘基的特定特徵,或者具有本文中的殘基X190、X195和X202的特定特 徵。在一些實施方案中,編碼人工改造的酮還原酶的多核苷酸選自SEQ IDN0:5、7、9、 11、13、15、17、19、21、23、25、27、29、31、33、35、37、39、41、43、45、47、49、51、53、55、57、59、 61、63、65、67、69、71、73、75、77、79、81、83、85、87、89、91、93、95、97、99、101、103、105、107 和109。在一些實施方案中,多核苷酸能夠在高度嚴格的條件下與包括SEQ ID N0:5、7、 9、11、13、15、17、19、21、23、25、27、29、31、33、35、37、39、41、43、45、47、49、51、53、55、57、59、 61、63、65、67、69、71、73、75、77、79、81、83、85、87、89、91、93、95、97、99、101、103、105、107 或109的多核苷酸雜交,其中在高度嚴格的條件下雜交的多核苷酸編碼能夠將式(I)的底物 還原或轉化為式(II)的產物的酮還原酶多肽。在一些實施方案中,由嚴格地雜交的多核苷 酸所編碼的多肽能夠將式(III)的底物還原或轉化為式(IV)的產物。在一些實施方案中, 由嚴格地雜交的多核苷酸所編碼的多肽將具有特定的酶活性,以及對應於X190和X202的 殘基的特定特徵或者對應於X190、X195和X202的殘基的特定特徵。在一些實施方案中,多核苷酸編碼本文所述的多肽,但在核苷酸水平上與編碼人 工改造的酮還原酶的參考多核苷酸相比具有約80%或更高的序列同一性,約85%、86%、 87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98% 或 99% 或更高的序列 同一性。在一些實施方案中,所述參考多核苷酸選自SEQ ID NO :5、7、9、11、13、15、17、19、 21、23、25、27、29、31、33、35、37、39、41、43、45、47、49、51、53、55、57、59、61、63、65、67、69、 71、73、75、77、79、81、83、85、87、89、91、93、95、97、99、101、103、105、107 和 109。可以以各種方式對編碼改進的酮還原酶多肽的分離的多核苷酸進行操作以提供 多肽的表達。取決於表達載體,在插入載體之前對分離的多核苷酸的操作可以是期望的 或必要的。利用重組DNA方法修飾多核苷酸和核酸序列的技術是本領域眾所周知的。指 導被提供在 Sambrook 等 ,2001,Molecular Cloning :A Laboratory Manual,第 3 版, Cold Spring HarborLaboratory Press ;禾口 Current Protocols in Molecular Biology, Ausubel.F.編輯,Greene Pub. Associates, 1998,更新至 2006 中。關於細菌宿主細胞,用於指導本公開核酸構建體的轉錄的適合的啟動子 包括從大腸桿菌lac操縱子、大腸桿菌trp操縱子、天藍色鏈黴菌(Str印tomyces coelicolor)瓊脂水解酶基因(dagA)、枯草芽孢桿菌果聚糖蔗糖酶基因(sacB)、地衣 型芽胞桿菌(Bacillus licheniformis) a-澱粉酶基因(amyL)、嗜熱脂肪芽胞桿菌 (Bacillus stearothermophilus)麥芽糖澱粉酶基因(amyM)、解澱粉芽胞桿菌(Bacillus amyloliquefaciens) a-澱粉酶基因(amyQ)、地衣型芽胞桿菌青黴素酶基因(penP)、枯草 芽孢桿菌xylA和xylB基因和原核0 -內醯胺酶基因獲得的啟動子(Villa-Kamaroff等., 1978,Proc. Natl Acad. Sci. USA 75 :3727_3731),以及tac啟動子(DeBoer等.,1983,Proc. Natl Acad. Sci. USA 80 :21_25)。關於絲狀真菌宿主細胞,用於指導本公開核酸構建體的轉錄的適合的啟動子包括 從米麴黴(Aspergillus oryzae)TAKA澱粉酶、米赫根毛黴(Rhizomucor miehei)天冬氨酸 蛋白酶、黑麴黴(Aspergillus niger)中性a -澱粉酶、黑麴黴酸穩定性a-澱粉酶、黑曲 黴或泡盛麴黴(Aspergillusawamori)葡萄糖澱粉酶(glaA)、米赫根毛黴脂肪酶、米麴黴鹼 性蛋白酶、米麴黴丙糖磷酸異構酶、構巢麴黴(Aspergillus nidulans)乙醯胺酶和尖孢鐮 刀菌(Fusarium oxysporum)胰蛋白酶樣蛋白酶的基因獲得的啟動子(W096/00787),以及 NA2_tpi啟動子(來自黑麴黴中性a-澱粉酶和米麴黴丙糖磷酸異構酶基因的啟動子的雜 交體)及其突變的、截短的和雜交的啟動子。在酵母宿主中,有用的啟動子可來自釀酒酵母烯醇化酶(EN0-1)、釀酒酵母半乳糖 激酶(GAL1)、釀酒酵母醇脫氫酶/甘油醛-3-磷酸脫氫酶(ADH2/GAP)和釀酒酵母3-磷酸 甘油酸酯激酶的基因。酵母宿主細胞的其他有用的啟動子被描述於Romanos等.,1992, Yeast 8 :423-488。控制序列還可以是適合的轉錄終止子序列,即被宿主細胞識別以終止轉錄的序列。終止子序列被可操作地連接至編碼多肽的核酸序列的3』末端。在所選宿主細胞中有 功能性的任何終止子可被用於本發明。例如,絲狀真菌宿主細胞的示例性轉錄終止子可獲得自米麴黴TAKA澱粉酶、黑曲 黴葡萄糖澱粉酶、構巢麴黴鄰氨基苯甲酸合成酶、黑麴黴a 「葡萄糖苷酶和尖孢鐮刀菌胰 蛋白酶樣蛋白酶的基因。酵母宿主細胞的示例性終止子可獲得自釀酒酵母烯醇化酶、釀酒酵母細胞色素 C(CYC1)和釀酒酵母甘油醛-3-磷酸脫氫酶的基因。酵母宿主細胞的其他有用的終止子被 描述於Romanos等 ,1992,見上文。控制序列還可以是適合的前導序列,即對於宿主細胞的翻譯重要的mRNA的非翻 譯區。前導序列被可操作地連接至編碼多肽的核酸序列的5』末端。在所選宿主細胞中有功 能性的任何前導序列可被使用。示例性的前導序列包括M13噬菌體pill前導序列、大腸杆 菌麥芽糖結合蛋白前導序列和大腸桿菌pelB前導序列。絲狀真菌宿主細胞的前導序列可 獲得自米麴黴TAKA澱粉酶和構巢麴黴丙糖磷酸異構酶的基因。酵母宿主細胞的適合的前 導序列獲得自釀酒酵母烯醇化酶(EN0-1)、釀酒酵母3-磷酸甘油酸酯激酶、釀酒酵母a -因 子和釀酒酵母醇脫氫酶/甘油醛-3-磷酸脫氫酶(ADH2/GAP)的基因。控制序列還可以是多腺苷酸化序列,即被可操作地連接至核酸序列的3』末端的序 列,而且其在被轉錄時作為向被轉錄的mRNA添加多腺苷酸殘基的信號而被宿主細胞識別。 在所選宿主細胞中有功能性的任何多腺苷酸化序列可被用於本發明。絲狀真菌宿主細胞的 示例性多腺苷酸化序列可來自米麴黴TAKA澱粉酶、黑麴黴葡萄糖澱粉酶、構巢麴黴鄰氨基 苯甲酸合成酶、尖孢鐮刀菌胰蛋白酶樣蛋白酶和黑麴黴a-葡萄糖苷酶。酵母宿主細胞的 有用的多腺苷酸化序列被描述於Guo和Sherman,1995,Mol Cell Biol5 :5983_5990。控制序列還可以是信號肽編碼區,其編碼被連接至多肽氨基末端並將被編碼的多 肽引導進入細胞分泌途徑的胺基酸序列。核酸序列的編碼序列的5』端可內在地含有在翻 譯閱讀框架中被天然地連接編碼分泌多肽的編碼區片段的信號肽編碼區。可選地,編碼序 列的5』端可含有對於所述編碼序列來說是外來的單個肽編碼區。當編碼序列不天然地含 有信號肽編碼區時,外來的信號肽編碼區可能是必需的。可選地,外來的信號肽編碼區可簡單地替換天然的信號肽編碼區以便增強多肽的 分泌。然而,將表達多肽引導進入所選宿主細胞分泌途徑的任何信號肽編碼區可被用於本 發明。細菌宿主細胞的有效的信號肽編碼區是從桿菌屬(Bacillus)NC1B11837麥芽 糖澱粉酶、嗜熱脂肪芽胞桿菌a-澱粉酶、地衣型芽胞桿菌枯草蛋白酶、地衣型芽胞桿菌 3 -內醯胺酶、嗜熱脂肪芽胞桿菌中性蛋白酶(nprT、nprS、nprM)和枯草芽孢桿菌prsA的 基因獲得的信號肽編碼區。進一步的信號肽被描述於Simonen和Palva,1993,Microbiol Rev 57 :109-137。絲狀真菌宿主細胞的有效的信號肽編碼區可以是從米麴黴TAKA澱粉酶、黑麴黴 中性澱粉酶、黑麴黴葡萄糖澱粉酶、米赫根毛黴天冬氨酸蛋白酶、特異腐質黴(Humicola insolens)纖維素酶和嗜熱羊毛狀腐質黴(Humicola lanuginosa)脂肪酶的基因獲得的信 號肽編碼區。酵母宿主細胞的有用的信號肽可來自釀酒酵母a-因子和釀酒酵母轉化酶的基因。其他有用的信號肽編碼區被描述於Romanos等.,1992,見上文。控制序列還可以是前肽編碼區,其編碼被置於多肽氨基末端的胺基酸序列。所得 的多肽被稱作前酶或前多肽(或者在一些情況下的酶原)。前多肽通常是無活性的,並且 可通過從所述前多肽中將前肽催化或自催化裂解而被轉化為成熟的活性多肽。前肽編碼 區可獲得自枯草芽孢桿菌鹼性蛋白酶(aprE)、枯草芽孢桿菌中性蛋白酶(nprT)、釀酒酵母 a-因子、米赫根毛黴天冬氨酸蛋白酶和嗜熱毀絲黴(Myceliophthora thermophila)乳糖 酶的基因(W0 95/33836)。當信號肽區域和前肽區域二者都存在於多肽的氨基末端時,所述前肽區域被置於 多肽氨基末端鄰近處,而且所述信號肽區域被置於所述前肽區域的氨基末端鄰近處。還可能期望加入調節序列,其允許對與宿主細胞生長相關的多肽表達進行調節。 調節系統的實例是導致基因表達根據化學或物理刺激而被打開或關閉的那些,所述刺激包 括調節化合物的存在。在原核宿主細胞中,適合的調節序列包括lac、tac和trp操縱子系 統。在酵母宿主細胞中,適合的調節系統包括例如ADH2系統或GAL1系統。在絲狀真菌中, 適合的調節序列包括TAKAa-澱粉酶啟動子、黑麴黴葡萄糖澱粉酶啟動子和米麴黴葡萄糖 澱粉酶啟動子。調節序列的其他實例是允許基因擴增的那些。在真核系統中,這些包括在氨甲蝶 呤存在下被擴增的二氫葉酸還原酶基因以及與重金屬一起的被擴增的金屬硫蛋白基因。在 這些情況下,編碼本發明的KRED多肽的核酸序列將被可操作地連接至調節序列。因此,在另一個實施方案中,本公開還針對包括編碼人工改造的酮還原酶多肽或 其變體的多核苷酸以及一個或多個表達調節區例如啟動子和終止子、複製起點等等的重組 表達載體,這取決於它們將被引入的宿主類型。上述各種核酸和控制序列可被連接在一起 以產生重組表達載體,其可包括一個或多個方便的限制位點以允許在此類位點插入或取代 編碼多肽的核酸序列。可選地,可通過將包括所述序列的核酸序列或核酸構建體插入用於 表達的適合的載體來表達本公開的核酸序列。在產生表達載體時,編碼序列位於載體中以 便將編碼序列可操作地連接至用於表達的適合的控制序列。重組表達載體可以是任何載體(例如質粒或病毒),其可被方便地進行重組DNA程 序並且可導致多核苷酸序列的表達。載體的選擇通常將取決於載體與其將被引入的宿主細 胞之間的相容性。載體可以是線狀或閉環質粒。表達載體可以是其複製獨立於染色體複製的自主複製載體,即作為染色體外的實 體存在的載體,例如質粒、染色體外元件、微型染色體或人工染色體。該載體可含有用於保 證自複製的任何工具。可選地,該載體可以是在被引入宿主細胞時被整合進基因組並與其 被整合進入的染色體一起複製的載體。此外,可以使用待引入宿主細胞基因組的單個載體 或質粒或者共同含有總DNA的兩個或更多個載體或質粒,或者轉座子。本發明的表達載體優選地含有一個或多個可選擇標誌物,其允許對被轉化的細胞 的便利選取。可選擇標誌物是這樣的基因,其產物提供殺生物劑或病毒抗性、重金屬抗性、 營養缺陷體的原營養以及諸如此類。細菌的可選擇標誌物的實例是來自枯草芽孢桿菌或地 衣型芽胞桿菌的dal基因,或者賦予抗生素抗性例如氨苄西林、卡那黴素、氯黴素(實施例 1)或四環素抗性的標誌物。酵母宿主細胞的適合的標誌物是ADE2、HIS3、LEU2、LYS2、MET3、 TRP1 禾口 URA3。
用於絲狀真菌宿主細胞的可選擇標誌物包括但不限於amdS (乙醯胺酶)、argB (鳥 氨酸氨甲醯轉移酶)、bar (草丁膦乙醯轉移酶)、hph (潮黴素磷酸轉移酶)、niaD(硝酸鹽 還原酶)、pyrG (乳清酸核苷-5 『-磷酸脫羧酶)、sC (硫酸腺苷基轉移酶)和trpC (鄰氨 基苯甲酸合成酶)及其等價物。用於麴黴屬細胞的實施方案包括構巢麴黴或米麴黴的amdS 禾口 pyrG 基因禾口吸水鏈霄菌(Streptomyces hygroscopicus)的 bar 基因。本發明的表達載體優選地含有這樣的元件,其允許載體向宿主細胞基因組中的整 合或細胞中載體獨立於基因組的自主複製。關於向宿主細胞基因組中的整合,該載體可依 賴於編碼多肽的核酸序列或用於通過同源或非同源的重組將載體整合進入基因組的任何 其他載體元件。可選地,表達載體可含有另外的核酸序列,其用於指導通過同源重組向宿主細胞 基因組中的整合。所述另外的核酸序列使得載體被整合進宿主細胞基因組中染色體的精 確位置處。為了增加在精確位置處整合的相似性,整合元件應該優選地含有足夠數目的核 酸,例如100至10,000個鹼基對兒,優選地400至10,000個鹼基對兒,而且最優選地800 至10,000個鹼基對兒,其中所述核酸與相應的靶序列是高度同源的以提高同源重組的可 能性。整合元件可以是與宿主細胞基因組中的靶序列同源的任何序列。此外,整合元件可 以是非編碼的或編碼的核酸序列。在另一方面,可通過非同源重組將載體整合進入宿主細 胞的基因組。關於自主複製,載體還可包括複製起點,其使得載體能夠在所討論的宿主細胞中 自主地複製。細菌複製起點的實例是P15A ori (如?16.5中的質粒所示)或者質粒pBR322、 pUC19、pACYC177(其中質粒具有P15A ori)的複製起點,或者允許大腸桿菌中的複製的 PACYC184和允許芽胞桿菌中的複製的pUB110、pE194、pTA1060或pAM0 1。用於酵母宿主細 胞的複製起點的實例是2微米的複製起點,即ARS1、ARS4、ARS1和CEN3的組合、以及ARS4 和CEN6的組合。複製起點可以是具有一種突變的複製起點,所述突變使其在宿主細胞中的 功能是溫度敏感的(參見例如 Ehrlich,1978,Proc Natl Acad Sci. USA 75:1433)。可將本發明多於一個拷貝的核酸序列插入宿主細胞中以增加基因產物的生產。可 通過將至少一個另外拷貝的序列整合進入宿主細胞基因組或者通過包括具有核酸序列的 可擴增的可選擇標誌物基因來獲得核酸序列拷貝數的增加,其中含有擴增的拷貝數的可選 擇標誌物基因以及因此額外拷貝的核酸序列的細胞可通過在適當的可選擇的劑的存在下 培養細胞來進行選擇。用於本發明的許多表達載體是商業上可得的。適合的商品化的表達載體包括來 自 Sigma-Aldrich Chemicals, St. Louis M0.的 p3xFLAGTM 表達載體,其包括用於哺乳 動物宿主細胞中表達的CMV啟動子和hGH多腺苷酸化位點以及用於大腸桿菌中擴增的 PBR322複製起點和氨苄西林抗性標誌物。其他適合的表達載體是pBluescriptll SK(-) 和pBK-CMV (其可通過商業從Stratagene,Lajolla CA獲得),以及衍生自pBR322 (Gibco BRL)、pUC (Gibco BRL)、pREP4、pCEP4 (Invitrogen)或 pPoly (Lathe 等 ,1987,Gene 57 193-201)的質粒。6. 4用於表達酮還原酶多肽的宿主細胞在另一方面,本公開提供包括編碼本公開改進的酮還原酶多肽的多核苷酸的宿主 細胞,所述多核苷酸被可操作地連接至用於表達宿主細胞中酮還原酶的一個或多個控制序列。用於通過本發明的表達載體來表達KRED多肽的宿主細胞是本領域眾所周知的,並且包 括但不限於細菌細胞例如大腸桿菌、高加索酸奶乳桿菌、短乳桿菌、微小乳桿菌、鏈黴菌和 鼠傷寒沙門氏菌(Salmonella typhimurium)細胞;真菌細胞例如酵母細胞(例如釀酒酵母 或巴斯德畢赤酵母(Pichia pastoris) (ATCC登錄號201178));昆蟲細胞例如果蠅S2和夜 蛾Sf9細胞;動物細胞例如CHO、COS、BHK、293和Bowes黑素瘤細胞;以及植物細胞。上述 宿主細胞的適合的培養基和生長條件是本領域眾所周知的。用於表達酮還原酶的多核苷酸可通過本領域已知的各種方法被引入細胞。技術包 括但不限於電穿孔、基因槍粒子轟擊、脂質體介導的轉染、氯化鈣轉染和原生質體融合。用 於將多核苷酸引入細胞的各種方法對於技術人員將是明顯的。示例性的宿主細胞是大腸桿菌W3110。通過將編碼改進的酮還原酶的多核苷酸 連接至質粒PCK110900來產生表達載體,其中所述質粒被可操作地連接至受lacl抑制子 (repressor)控制的lac啟動子。所述表達載體還含有P15a複製起點和氯黴素抗性基因。 通過將細胞經過氯黴素選擇來分離含有大腸桿菌W3110中目標多核苷酸的細胞。6. 5產生人工改造的酮還原酶多肽的方法在一些實施方案中,為了製備本公開中改進的KRED多核苷酸和多肽,從高加索酸 奶乳桿菌或短乳桿菌或微小乳桿菌獲得(或衍生)催化還原反應的天然存在的酮還原酶。 在一些實施方案中,親本多核苷酸序列是密碼子優化的以便增強酮還原酶在特定宿主細胞 中的表達。作為說明,從低聚核苷酸構建了編碼高加索酸奶乳桿菌野生型KRED多肽的親 本多核苷酸序列,其中所述低聚核苷酸是基於Genbank資料庫中可得的高加索酸奶乳桿菌 KRED序列(Genbank登錄號AAP94029 GI =33112056)的已知多肽序列來製備的。被指定為 SEQ ID NO :1的親本多核苷酸序列是密碼子優化的以用於大腸桿菌中的表達,而且密碼子 優化的多核苷酸被克隆進表達載體,將酮還原酶基因的表達置於lac啟動子和lacl抑制子 基因的控制之下。表達大腸桿菌中活性酮還原酶的克隆被鑑定,而且基因被測序以確認它 們的身份。指定的序列(SEQ ID N0:1)是被用作大多數實驗起始點的親本序列,而且人工 改造的酮還原酶的文庫構建是從高加索酸奶乳桿菌酮還原酶發展而來的。如上面討論的,可通過將編碼天然存在的酮還原酶的多核苷酸經過誘變和/或定 向進化方法來獲得人工改造的酮還原酶。示例性的定向進化技術是誘變和/或DNA重排, 如 Stemmer,1994,Proc Natl Acad Sci USA91 :10747-10751;W0 95/22625 ;W0 97/0078 ; W0 97/35966 ;W0 98/27230 ;W0 00/42651 ;W0 01/75767 和美國專利 6,537,746 中所 述。其他可用的定向進化程序包括但不限於交錯延伸過程(StEP)、體外重組(Zhao等., 1998,Nat. Biotechnol. 16 :258_261)、誘變 PCR(Caldwell 等.,1994,PCR MethodsAppl. 3 S136-S140)以及盒式誘變(Black 等.,1996,Proc Natl Acad Sci USA93 :3525_3529)。 可在下述參考文獻中發現對於本文目的有用的另外的誘變和定向進化技術Ling, 等.,1997, "Approaches to DNA mutagenesis :anoverview (DNA ^ 7j ^ ) Anal. Biochem. 254(2) 157-78 ;Dale 等.,1996, "Oligonucleotide-directed random mutagenesis using thephosphorothioate method(使用憐硫酷方法的低聚核昔酸指導的 隨機誘變)」,Methods Mol. Biol. 57 369-74 ;Smith, 1985, "In vitro mutagenesis (體外
"7Ann. Rev. Genet. 19 423-462 ;Botstein^. , 1985,"Strategies andapplications of in vitro mutagenesis (體外誘變的策略和應用)」,Science229 1193-1201 ;Carter,
851986, "Site-directed mutagenesis (位點定向誘變)」,Biochem. J. 237 1~7 ;Kramer 等 ,1984,『『Point Mismatch Repair (點錯配修復)」,Cell, 38 :879_887 ;Wells 等 , 1985, "Cassette mutagenesis :an efficientmethod for generation of multiple mutations at defined sites (盒式誘變在確定位點產生多重突變的有效方法)」,Gene 34315-323 ;Minshull 等.,1999,"Protein evolution by molecular breeding(通 過分子育種進行的蛋白進化)」,Curr Op in Chem Biol 3 :284_290 ;Christians 等., 1999, "Directed evolution ofthymidine kinase for AZT phosphorylation using DNA family shuffling(使用DNA家族重排進行的用於AZT磷酸化的胸腺嘧啶核苷激酶定向進 化)」,Nature Biotech 17 :259_264 ;Crameri 等 ,1998,"DNA shuffling of a family ofgenes from diverse species accelerates directed evolution(來自各禾中物禾中的基因 家族的 DNA 重排加速定向進化),,,Nature 391 :288_291 ;Crameri 等.,1997,"Molecular evolution of an arsenate detoxification pathway by DNA shuffling(iEii DNA M 排進行的砷酸鹽解毒途徑分子進化)」,Nature Biotechl5 =436-438 ;Zhang等.,1997, "Directed evolution of an effective fructosidasefrom a galactos idase by DNA shuffling and screening(通過DNA重排和篩選進行的從半乳糖苷酶向有效的果糖苷酶的 定向進化)」,Proc Natl Acad SciUSA 94:45-4-4509 ;Crameri 等 ,1996," Improved green fluorescent protein bymolecular evolution using DNA shuffling(使用 DNA 重排通 過分子進化來改進綠色螢光蛋白)」,Nature Biotech 14 :315_319 ;以及Stemmer,1994, "Rapidevolution of a protein in vitro by DNA shuffling(通過 DNA 重排進行的體外 蛋白快速進化)」,Nature 370:389-391。所有出版物通過引用被併入本文。篩選在誘變處理之後獲得的克隆中具有期望的改進的酶性質的人工改造的酮還 原酶。當被轉化為NAD+或NADP+時,可使用監測NADH或NADPH濃度的減少率的標準生化技 術(通過吸光度或螢光的減少)來進行表達文庫中的酶活性測量。在該反應中,隨著酮還原 酶將酮底物還原為相應的羥基,NADH或NADPH被酮還原酶消耗(氧化)。如吸光度或螢光 的減少所測量的,每單位時間中NADH或NADPH濃度的減少率表示固定量的裂解產物(或從 中製備的凍乾粉末)中KRED多肽的相對(酶促)活性。當期望改進的酶性質是熱穩定性 時,可在將酶製劑經過確定的溫度並測量熱處理之後殘留的酶活性的量之後測量酶活性。 含有編碼酮還原酶的多核苷酸的克隆然後被分離,被測序以鑑定核苷酸序列改變(如果有 任何的話),並被用來在宿主細胞中表達酶。當已知人工改造的多肽的序列時,可根據已知的合成方法通過標準的固相方法來 製備編碼酶的多核苷酸。在一些實施方案中,多達約100個鹼基的片段可被分別合成,然後 連接(例如通過酶促或化學連接方法,或聚合酶介導的方法)以形成任何期望的連續序列。 例如,可使用例如Beaucage等 ,1981,Tet Lett 22 =1859-69中描述的經典的亞磷醯胺方 法或Matthes等.,1984,EMB0 J. 3 :801_05中描述的方法(例如,如它通常在自動化的合成 方法中實踐的那樣)通過化學合成來製備本發明的多核苷酸和低聚核苷酸。根據亞磷醯胺 方法,將低聚核苷酸在例如自動化DNA合成器中合成、純化、退火、連接並克隆進適合的載 體。另外,可從各種商業來源中的任一種獲得基本上任何核酸,其中所述商業來源例如The Midland CertifiedReagent Company, Midland, TX, The Great American Gene Company, Ramona,CA,ExpressGen Inc. Chicago,IL,Operon Technologies Inc.,Alameda,CA,以及許多其他的。可使用蛋白純化的熟知技術中的任一種或多種從細胞和/或培養基中回收宿主 細胞中表達的人工改造的酮還原酶,其中所述技術包括但不限於溶菌酶處理、超聲裂解、過 濾、鹽析、超離心和色譜法。用於細胞裂解和從細菌如大腸桿菌中高效提取蛋白的適合溶液 是可以以CelLytic B 的商標名從St. Louis M0的Sigma-Aldrich通過商業獲得的。用於分離酮還原酶多肽的色譜技術包括但不限於反相色譜高效液相色譜、離子交 換色譜、凝膠電泳和親和色譜。用於純化特定酶的條件將部分取決於例如淨電荷、疏水性、 親水性、分子量、分子形狀等因素,並且對於本領域技術人員將是明顯的。在一些實施方案中,親和技術可被用來分離改進的酮還原酶。對於親和色譜純化, 可以使用特異性結合酮還原酶多肽的任何抗體。為了產生抗體,可通過注射酮還原酶多肽 來對各種宿主動物進行免疫接種,所述宿主動物包括但不限於兔、小鼠、大鼠等。可通過側 鏈功能基團或連接至側鏈功能基團的連接體將多肽連接至適合的載體例如BSA。可根據宿 主物種而使用各種佐劑來增強免疫應答,所述佐劑包括但不限於弗氏佐劑(完全和不完全 的)、礦物凝膠例如氫氧化鋁、表面活性物質例如溶血卵磷脂、普盧蘭尼克多元醇類、多聚陰 離子、肽、油乳劑、鑰孔血藍蛋白、二硝基苯酚和潛在有用的人類佐劑例如BCG(卡介苗)和 短小棒狀桿菌(Corynebacterium parvum)。在一些實施方案中,可以製備酮還原酶並以表達酶的細胞的形式將其用作粗提取 物或者分離的或純化的製劑。可將酮還原酶製備成凍乾產物、粉末形式(例如丙酮粉末) 或製備為酶溶液。在一些實施方案中,酮還原酶可以是基本上純的製劑的形式。在一些實施方案中,酮還原酶多肽可被連接至固體基質。所述基質可以是固相、表 面和/或膜。固體支持體可由有機多聚體(例如聚苯乙烯、聚乙烯、聚丙烯、聚氟乙烯、聚乙 烯氧基和聚丙烯醯胺)及其共聚物和移植物所組成。固體支持體還可以是無機的,例如玻 璃、二氧化矽、可控孔度玻璃(CPG)、反相二氧化矽或者金屬例如金或鉬。底物的構型可以是 珠子、球形、粒子、顆粒、凝膠、膜或表面的形式。表面可以是平面的、基本上平面的或非平面 的。固體支持體可以是多孔的或無孔的,並且可具有膨脹的或不膨脹的特徵。可以以孔、凹 陷或其他容器、器皿、特徵或位置的形式形成固體支持體。可在陣列上對於試劑的機器人遞 送可尋址的各種位置上或者通過檢測方法和/或儀器形成許多支持體。6. 6人工改造的酮還原酶和與之一起製備的化合物的使用方法本文所述的酮還原酶可催化結構式(I)中的底物即2-[3-[3-[2-(7-氯_2_喹啉 基)乙烯基]苯基]-3-氧代丙基]苯甲酸甲酯向結構式(II)中相應的立體異構產物即(S,E)-2-(3-(3-(2-(7-氯喹啉-2-基) 乙烯基)苯基)-3_羥丙基)苯甲酸甲酯(「產物」)的還原 在另一個實施方案中,本文所述的酮還原酶能夠催化結構式(III)中的化合物即 2_[2-[3-[3 [2-(7-氯-2-喹啉基)乙烯基]苯基]-3-氧代丙基]苯基]_2_丙醇(也是
「底物」), 向結構式(IV,(5,幻-1-(3-(2-(7-氯喹啉-2_基)乙烯基)苯基)_3_ (2_ (2_羥 丙-2-基)苯基)丙-1-醇(也可被稱作有關式(III)中底物的「產物」))中相應的立體 異構產物的還原反應 在一些實施方案中,本公開的酮還原酶可被用於將具有化學式(I)或(III)的底 物還原為相應產物的方法中,其中所述方法包括將底物在適於將所述底物分別還原或轉化 為式(II)或式(IV)中產物的反應條件下與本文所述的酮還原酶多肽中任一種(或多種) 接觸或孵化。在一些將底物還原為產物的方法的實施方案中,與SEQ ID NO :4、2和114的野生 型高加索酸奶乳桿菌或短乳桿菌或微小乳桿菌KRED序列相比,酮還原酶多肽至少具有下 面的特徵(1)對應於X190的殘基是受限殘基而且(2)對應於X202的殘基是芳香族殘基。 在一些實施方案中,與SEQ ID NO :4、2和114的野生型高加索酸奶乳桿菌或短乳桿菌或微 小乳桿菌KRED序列相比,酮還原酶多肽至少具有下面的特徵(1)對應於X190的殘基是受 限殘基;⑵對應於195的殘基是鹼性的、酸性的或極性的殘基;而且(3)對應於X202的殘 基是芳香族殘基。在一些將底物還原為產物的方法的實施方案中,底物被還原為具有超過約99% 立體異構過量的產物,其中所述酮還原酶多肽包括對應於SEQ IDN0:6、8、10、12、14、16、 18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、48、50、52、54、56、58、60、62、64、66、 68、70、72、74、76、78、80、82、84、86、88、90、92、94、96、98、100、102、104、106、108、110、111 或 112的序列。在一些將底物還原為產物的方法的實施方案中,當用超過約100g/L的底物和小 於約5g/L的多肽進行時,至少約95%的底物在小於約24小時中被轉化為產物,其中所述多 肽包括對應於SEQ ID NO :6、8、14、16和20的胺基酸序列。在一些將底物還原為產物的方法的實施方案中,使用約10g/L的多肽在小於約24小時中將至少約10-20%的lg/L的底物轉化為產物,其中所述多肽包括對應於SEQ ID NO 6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、48、50、52、54、56、 58、60、62、64、66、68、70、72、74、76、78、80、82、84、86、88、90、92、94、96、98、100、102、104、 106、108、110、111或112的胺基酸序列。在一些實施方案中,本文所提供的酮還原酶多肽可被用來生產用於合成結構式 (V)中化合物的中間產物 其包括溶劑化物、水合物及其藥學上可接受的鹽。式(V)中的化合物即 2-[l-[[(lR)-l_[3-[(E)-2-(7-氯喹啉-2-基)乙烯基]苯基]_3_ [2-(2-羥丙-2-基)苯 基]丙基]硫甲基]環丙基]乙酸(也被稱作孟魯司特)是可以以式(Va)中所示的鈉鹽形 式(即(R,E)-2-(l-((l-(3-(2(7-氯喹啉-2-基)乙烯基)苯基)-3-(2-(2-羥丙-2-基) 苯基)丙基硫)甲基)環丙基)乙酸鈉)通過商業獲得的 如上所述而不被理論所約束,孟魯司特是白三烯受體拮抗劑(LTRA)並且看來似 乎阻斷白三烯D4對半胱氨醯白三烯受體CysLTl的作用。為了過敏症的治療和哮喘的維持 治療而將孟魯司特開處方(參見例如美國專利第5,565,473號)。在一些合成孟魯司特的實 施方案中,重要的中間產物是式(II)的化合物。因此,在用於合成化合物(V)的方法中,該 方法的一個步驟可包括在適於將所述底物還原或轉化為式(II)中產物的條件下將式(I) 的底物與本公開的酮還原酶多肽反應或接觸。在一些實施方案中,可以從式(II)中的化合物合成式(V)中的化合物,如方案I 中所說明以及如美國申請公布20070135480和20050245568中所述。
因此,在一些實施方案中,用於合成化合物(V)的方法可包括(a)用本公開的酮 還原酶將化合物(I)還原或轉化為化合物(II) ; (b)將化合物(II)與甲基磺醯氯反應以 形成式(VI)中的化合物;(c)將化合物(VI)轉化成式(VII)中的硫代(thio)化合物,接 著轉化為式(Vila)中的化合物;(d)將硫代化合物(Vila)與式(X)的化合物反應以形成 式(IX)中的化合物,其中R』是離去基團而R是H或C1-C4烷基;以及(e)將化合物(IX)轉化為式(Vb)中的化合物或其鹽例如式(Va)。在一些實施方案中,其他的烷基磺醯滷素 或芳基磺醯滷素可替代甲基磺醯氯來使用。式(IX)中的化合物向式(Vb)中的化合物的 轉化可使用CH3Li但該步驟還可使用格氏試劑例如甲基滷化鎂來進行(參見美國申請公布 20070135480)。在一些實施方案中,上述步驟(c)之後的可選過程可包括(d)將式(VII) 中的化合物轉化成式(VIII)中的化合物,接著轉化為式(Vllb)中的化合物,以及(e)將硫 代化合物(X)與化合物(Vllb)反應以形成式(Vb)中的化合物或其鹽。各步驟的細節和條 件被描述在美國申請公布20070135480和20050245568中。在一些實施方案中,孟魯司特的合成可使用式(IV)的中間產物。因此,在一些實 施方案中,在用於合成式(V)的化合物的方法中,該方法的一個步驟可包括在適於將所述 底物還原或轉化為式(VI)中產物的條件下通過將底物與本文所公開的酮還原酶接觸而將 式(III)中的底物還原或轉化為式(IV)中的產物。在一些實施方案中,可由式(IV)中的產物來合成孟魯司特化合物,如方案II中所 說明以及如美國申請公布第2005/0234241號和美國專利第7,189,853號中所述
(XIII)
NaOMe 或 NaOH
(V
方案2因此,在一些實施方案中,用於合成化合物(V)的方法可包括(a)用本公開的酮 還原酶將化合物(I)還原或轉化為化合物(II) ; (b)將式(IV)中的化合物與甲基磺醯氯反 應以形成式(VI)中的化合物;(C)將式(XIII)中的巰基化合物與式(IV)中的化合物偶合 以形成式(VII)中的化合物,其中X是-CN或C0NH2 ;以及(d)將式(VII)中的化合物轉化 為式(V)中的化合物或其鹽。在一些實施方案中,還可由式(II)中的產物來合成孟魯司特化合物,如下面的方案III中所說明以及如美國專利第5,614632號中所述,其公開通過引用被併入本文(參見 美國專利5,614,632的實施例5-8)。在方案III中,使用本公開的酮還原酶將式(I)中的 底物還原為式(II)中的產物;然後通過例如使用格氏試劑(甲基氯化鎂)轉化為式(IV) 中的化合物。將式(IV)中的化合物與甲基磺醯氯反應以形成甲磺酸鹽化合物(XIII),雖然 可以使用其他烷基磺醯滷素或芳基磺醯滷素。化合物(XIII)與式(XIII)中的巰基化合物 的反應得到化合物(V),其可被轉化為鈉鹽形式。

可根據方案4來合成式(XIII)中的巰基化合物(參見例如美國專利第5,614,632
方案4方案4中的R基團可以是低級烷基,優選地為C1-C4烷基。從式(II)或式(IV) 中的化合物合成孟魯司特的各種變化也被描述在美國專利第5,565,473號;美國公布 20050107612 ;美國公布 20050245569 ;美國公布 20060004204 ;和美國公布 20060194839 中;所有參考文獻通過引用併入本文。鑑於式(VI)和式(XII)中的甲磺酸鹽化合物的重要性,本公開的酮還原酶可被用 於合成式(XX)中的化合物
OCH3
或者式(XXI)中的化合物 其中R1是烷基磺醯基、(全)氟代烷基磺醯基或芳基磺醯基。在一些實施方案中, 所述烷基是低級烷基例如C1-C4烷基,而芳基是苄基。在一些實施方案中,R1是甲苯磺醯基 或甲磺醯基。在一些實施方案中,化合物(XX)的合成方法可包括(a)在適於將化合物(I)還 原為化合物(II)的反應條件下將化合物(I)與本文所述的酮還原酶接觸;以及(b)將化 合物(II)與烷基磺醯基、(全)氟代烷基磺醯基、芳基磺醯基滷素或酐反應以形成化合物 (XX)。在一些實施方案中,用於(b)中的烷基磺醯滷素是甲基磺醯氯,使得化合物(XX)中 的R1是甲磺醯基。在一些實施方案中,式(XXI)中的化合物的合成方法可包括(a)在適於將化合物
(III)還原為化合物(IV)的反應條件下將化合物(III)與本文所述的酮還原酶接觸;以及(b)將化合物(VI)與烷基磺醯基或芳基磺醯基滷素或酐反應以形成化合物(XXI)。在一些 實施方案中,用於(b)中的烷基磺醯滷素是甲基磺醯氯,使得化合物(XXI)中的R1是甲磺醯基。可選地,在一些實施方案中,化合物(XXI)的合成方法可使用方案3中所說明的 過程,其中所述方法包括(a)在適於將化合物(I)還原為化合物(II)的反應條件下將化 合物(I)與本文所述的酮還原酶接觸;(b)將化合物(II)轉化為化合物(IV);以及(c) 將化合物(IV)與烷基磺醯基、(全)氟代烷基磺醯基、芳基磺醯基滷素反應以形成化合物 (XXI)。如上所述,化合物(II)向(b)中的化合物(IV)的轉化可使用格氏試劑或CH3Li。在一些實施方案中,本公開的酮還原酶可以與酮還原酶所作用的底物和/或由酮 還原酶反應所產生的產物一起作為組合物例如反應組合物存在。因此,在一些實施方案中, 組合物可包括本公開的酮還原酶以及結構式(I)中的底物或結構式(III)中的底物。在一 些實施方案中,組合物可包括本公開的酮還原酶以及結構式(II)中的產物或結構式(IV) 中的產物。在一些實施方案中,所述組合物可包括本公開的酮還原酶、式(I)中的底物和式 (II)中的產物。在一些實施方案中,所述組合物可包括本公開的酮還原酶、式(III)中的底 物和式(IV)中的產物。因為酮還原酶反應可在輔助因子(NADH或NADPH)再生系統的存在下進行,所以反 應條件還可包括輔助因子再生系統的元件,其在下面更詳細地描述。因此,在一些實施方案 中,前述酮還原酶組合物還可包括輔助因子再生系統,其包括葡萄糖脫氫酶和葡萄糖;甲酸 脫氫酶和甲酸;或者異丙醇和仲醇脫氫酶。在一些實施方案中,仲醇脫氫酶是人工改造的酮 還原酶。可被用於輔助因子循環的其他酶和底物將是技術人員眾所周知的。如本領域技術人員所知,酮還原酶催化的還原反應通常需要輔助因子。由本文所 述的人工改造的酮還原酶所催化的還原反應通常也需要輔助因子,雖然人工改造的酮還原 酶的許多實施方案需要比野生型酮還原酶所催化的反應少得多的輔助因子。如本文所用, 術語「輔助因子」是指與酮還原酶共同起作用的非蛋白化合物。適合與本文所述的人工改 造的酮還原酶共同使用的輔助因子包括但不限於NADP+(煙醯胺腺嘌呤二核苷酸磷酸)、 NADPH(NADP+的還原型)、NAD+ (煙醯胺腺嘌呤二核苷酸)和NADH(NAD+的還原型)。通常,將 輔助因子的還原型加入反應混合物。任選地,可以使用輔助因子再生系統從氧化的NAD(P) + 形式再生還原的NAD(P)H形式。術語「輔助因子再生系統」是指參加將氧化型的輔助因子還原(例如NADP+至 NADPH)的反應的一組反應物。被酮還原酶催化的酮底物還原所氧化的輔助因子被輔助因 子再生系統再生為還原型。輔助因子再生系統包括化學計量還原劑,其為還原氫等價物的 來源並且能夠將輔助因子的氧化型還原。輔助因子再生系統還可包括催化劑,例如為還原 劑對輔助因子氧化型的還原進行催化的酶催化劑。用於從NAD+或NADP+分別再生NADH或 NADPH的輔助因子再生系統是本領域已知的並且可被用於本文所述的方法。可被使用的適合的示例性輔助因子再生系統包括但不限於葡萄糖和葡萄糖脫氫 酶、甲酸和甲酸脫氫酶、葡萄糖6-磷酸和葡萄糖-6-磷酸脫氫酶、仲醇(例如異丙醇)和 仲醇脫氫酶、亞磷酸鹽和亞磷酸鹽脫氫酶、分子氫和氫化酶以及諸如此類。這些系統可與 NADP+/NADPH或NAD+/NADH輔助因子共同使用。使用氫化酶的電化學再生還可被用作輔助 因子再生系統。參見例如美國專利第5,538,867和6,495,023號,其二者都通過引用被並
96入本文。包括金屬催化劑和還原劑(例如分子氫或甲酸鹽)的化學的輔助因子再生系統也 是適合的。參見例如PCT公布WO 2000/053731,其通過引用被併入本文。術語「葡萄糖脫氫酶」和「⑶H」在本文中被互換地使用以指NAD+或NADP+依賴性 酶,所述酶催化D-葡萄糖和NAD+或NADP+分別向葡萄糖酸和NADH或NADPH的轉化。下面 的反應式(1)描述葡萄糖脫氫酶催化的葡萄糖對NAD+或NADP+的還原。
(1) 葡萄糖 +NAD(P)++ H2O GDH .葡萄糖酸 +NAD(P)H+ H+適合用於本文所述方法的實踐的葡萄糖脫氫酶包括天然存在的葡萄糖脫氫酶以 及非天然存在的葡萄糖脫氫酶二者。編碼天然存在的葡萄糖脫氫酶的基因已在文獻中報 道。例如,枯草芽孢桿菌61297⑶H基因被表達在大腸桿菌中,並且據報導其展示了與在 其天然宿主中所產生的酶相同的物理化學性質(Vasantha等.,1983,Proc. Natl. Acad. Sci.USA 80:785)。對應於Genbank登錄號M12276的枯草芽孢桿菌GDH基因的基因序列 被報導在 Lampel 等·,1986,J. Bacteriol. 166 :238_243 中,而且其作為 Genbank 登錄號 D50453 的修正形式被報導在 Yamane 等.,1996,Microbiologyl42 3047-3056 中。天然存 在的GDH基因還包括編碼賭樣芽胞桿菌(B. cereus)ATCC 14579 (Nature, 2003,423 :87_91 ; Genbank 登錄號 AE017013)和巨大芽胞桿菌(B. megaterium) (Eur. J. Biochem.,1988,174 485-490,Genbank 登錄號 X12370 J. Ferment. Bioeng.,1990,70 :363_369,Genbank 登錄號 GI216270)中⑶H的那些。來自芽孢桿菌屬的葡萄糖脫氫酶作為SEQID N0:10和12(分別 由對應於該PCT公布中的SEQ ID NO :9和11多核苷酸序列所編碼)被提供在PCT公布WO 2005/018579中,其公開通過引用被併入本文。可使用已知方法例如誘變、定向進化以及諸如此類來產生非天然存在的葡萄糖脫 氫酶。可使用PCT公布WO 2005/018579中實施例4所描述的測定容易地鑑定具有適當活 性的GDH酶,不論它是天然存在的還是非天然存在的,其公開通過引用被併入本文。示例性 的非天然存在的葡萄糖脫氫酶作為SEQ ID而62、64、66、68、122、124和126被提供在卩(^ 公布WO 2005/018579中。編碼它們的多核苷酸序列作為SEQ ID NO :61、63、65、67、121、 123和125被分別提供在PCT公布WO 2005/018579中。所有這些序列通過引用被併入本 文。本文所公開的適合用於酮還原酶催化的還原反應的另外的非天然存在的葡萄糖脫氫酶 被提供在美國申請公布第2005/0095619和2005/0153417號中,其公開通過引用被併入本 文。本文所述的用於酮還原酶催化的還原反應的葡萄糖脫氫酶可在PCT公布WO 2005/018579的實施例4中所述的測定中展示至少約10 μ mol/min/mg而且有時候至少約 102μ mol/min/mg 或約 IO3 μ mol/min/mg、高達約 IO4 μ mol/min/mg 或更高的活性。本文所述的酮還原酶催化的還原反應通常在溶劑中進行。適合的溶劑包括水、有 機溶劑(例如乙酸乙酯、乙酸丁酯、1-辛醇、庚烷、辛烷、甲基叔丁基醚(MTBE)、甲苯以及諸 如此類)、離子液體(例如1-乙基4-甲基咪唑四氟硼酸鹽、1-丁基-3-甲基咪唑四氟硼酸 鹽、1-丁基-3-甲基咪唑六氟磷酸鹽以及諸如此類)。在一些實施方案中,使用水溶劑,其 包括水和水共溶劑系統。示例性的水共溶劑系統具有水和一種或多種有機溶劑。通常,選擇水共溶劑系統 的有機溶劑組分以便它不完全地使酮還原酶失活。可利用酶活性測定例如本文所述的那些,通過用候選溶劑系統中感興趣的確定底物來測量指定的人工改造的酮還原酶的酶活性 來容易地鑑定適當的共溶劑系統。水共溶劑系統的有機溶劑組分可與水組分混溶以提供單液相,或者可與水組分 部分混溶或不可混溶以提供兩個液相。通常,當使用水共溶劑系統時,它被選擇為雙相性 的,水被分散在有機溶劑中或者相反。通常,當使用水共溶劑系統時,期望選擇可從水相容 易地分離的有機溶劑。通常,共溶劑系統中水和有機溶劑的比例通常是在有機溶劑對水約 90 10至約10 90 (ν/ν),以及有機溶劑對水約80 20至約20 80 (ν/ν)的範圍內。 可在加入反應混合物之前預先形成共溶劑系統,或者可將其在反應容器中就地(in situ) 形成。水溶劑(水或水共溶劑系統)可以是PH緩衝的或未緩衝的。一般地,可在約10或 以下,通常在約5至約10的範圍內的pH中進行還原。在一些實施方案中,在約9或以下, 通常在約5至約9的範圍內的pH中進行還原。在一些實施方案中,在約8或以下,通常在 約5至約8的範圍內並且通常在約6至約8的範圍內的pH中進行還原。還可在約7. 8或 以下,或者7. 5或以下的pH中進行還原。可選地,可在中性pH即約7中進行還原。在還原反應的過程中,可改變反應混合物的pH。可在反應過程中通過加入酸或鹼 而將反應混合物的PH維持在期望的pH或在期望的pH範圍內。可選地,可使用含有緩衝液 的水溶劑來控制PH。維持期望pH範圍的適合的緩衝液是本領域已知的並且包括例如磷酸 鹽緩衝液、三乙醇胺緩衝液以及諸如此類。還可使用緩衝和酸或鹼添加的組合。當使用葡萄糖/葡萄糖脫氫酶輔助因子再生系統時,如果所得的葡萄糖酸水溶液 不被另外中和,那麼反應式(1)中所表示的葡萄糖酸(PKa = 3.6)的共同產生導致反應混 合物的PH下降。可通過標準的緩衝技術(其中所述緩衝將高達所提供的緩衝能力的葡萄 糖酸中和),或者通過與轉化過程同時發生的鹼的加入而將反應混合物的PH維持在期望水 平。還可使用緩衝和鹼添加的組合。上面描述了維持期望PH範圍的適合的緩衝液。用於 葡萄糖酸中和的適合的鹼是有機鹼例如胺、醇化物和諸如此類,以及無機鹼例如氫氧化物 鹽(例如NaOH)、碳酸鹽(例如NaHCO3)、碳酸氫鹽(例如K2CO3)、鹼式磷酸鹽(例如Κ2ΗΡ04、 Na3PO4)以及諸如此類。可以在監測反應混合物pH時手動地,或者更方便地通過使用被用 作PH恆定器的自動滴定器來完成與轉化過程同時發生的鹼的加入。還可將部分緩衝能力 和鹼添加的組合用於過程控制。當鹼添加被用來中和在酮還原酶催化的還原反應過程中釋放的葡萄糖酸時,可通 過被添加以維持PH的鹼的量來監測轉化過程。通常,在還原過程中被加入未緩衝的或部分 緩衝的反應混合物的鹼被加入水溶液。在一些實施方案中,輔助因子再生系統可包括甲酸脫氫酶。術語「甲酸脫氫酶」 和「FDH」在本文中被互換地使用以指NAD+或NADP+依賴性酶,所述酶催化甲酸和NAD+或 NADP+分別向二氧化碳和NADH或NADPH的轉化。適合在本文所述的酮還原酶催化的還原 反應中用作輔助因子再生系統的甲酸脫氫酶包括天然存在的甲酸脫氫酶以及非天然存在 的甲酸脫氫酶二者。甲酸脫氫酶包括對應於PCT公布WO 2005/018579中SEQ ID NOS 70 (假單胞菌屬)和72 (博伊丁念珠菌Candida boidinii)的那些,其被分別對應於PCT 公布2005/018579中SEQ ID NOS :69和71的多核苷酸序列所編碼,其公開通過引用被並 入本文。用於本文所述方法的甲酸脫氫酶(不論是天然存在的還是非天然存在的)可展示至少約1 μ mol/min/mg、有時候至少約10 μ mol/min/mg或至少約IO2 μ mol/min/mg、高達約 IO3 μ mol/min/mg或更高的活性,並且可在PCT公布W02005/018579的實施例4中所述的測
定中容易地篩選活性。如本文所用,術語「甲酸(formate)」是指甲酸陰離子(HC02_)、甲酸(HCO2H)及其混 合物。可以以鹽(通常為鹼或銨鹽(例如HC02Na、KHC02NH4以及諸如此類))、甲酸(通常為 甲酸水溶液)或其混合物的形式提供甲酸。甲酸是溫和酸。在它的pKa(水中pKa = 3. 7) 的幾個PH單位以內的水溶液中,甲酸以平衡濃度的HC02_和HCO2H 二者存在。在高於約pH 4的pH值下,甲酸主要以HC02_存在。當以甲酸(formic acid)的形式提供甲酸(formate) 時,通常通過加入鹼而對反應混合物進行緩衝或使其酸性減少以提供期望的pH,其通常為 約pH 5或以上。適用於中和甲酸的鹼包括但不限於有機鹼例如胺、醇化物和諸如此類,以 及無機鹼例如氫氧化物鹽(例如NaOH)、碳酸鹽(例如NaHCO3)、碳酸氫鹽(例如K2CO3)、鹼 式磷酸鹽(例如K2HP04、Na3PO4)以及諸如此類。對於高於約pH 5的pH值(在此條件下甲酸主要以HC02_存在),下面的反應式⑵ 描述甲酸脫氫酶催化的甲酸對NAD+或NADP+的還原。 當使用甲酸和甲酸脫氫酶作為輔助因子再生系統時,可通過標準的緩衝技術(其 中所述緩衝釋放高達所提供的緩衝能力的質子),或者通過與轉化過程同時發生的酸的加 入而將反應混合物的PH維持在期望水平。在反應過程中被加入以維持pH的適合的酸包括 有機酸例如羧酸、磺酸、膦酸和諸如此類,無機酸例如氫滷酸(例如氫氯酸)、硫酸、磷酸和 諸如此類,酸式鹽例如磷酸二氫鹽(例如KH2PO4)、硫酸氫鹽(例如NaHSO4)和諸如此類。一 些實施方案利用甲酸(formic acid),從而甲酸(formate)濃度和溶液pH二者都得以維持。當利用酸添加來維持使用甲酸/甲酸脫氫酶輔助因子再生系統的還原反應中的 PH時,可通過被添加以維持pH的酸的量來監測轉化過程。通常,在轉化過程中被加入未緩 衝的或部分緩衝的反應混合物的酸被加入水溶液。術語「仲醇脫氫酶」和「sADH」在本文中被互換地使用以指NAD+或NADP+依賴性酶, 所述酶催化仲醇和NAD+或NADP+分別向酮和NADH或NADPH的轉化。下面的反應式(3)描 述仲醇(用異丙醇進行說明)對NAD+或NADP+的還原。 適合用作本文所述酮還原酶催化的還原反應中輔助因子再生系統的仲醇脫氫 酶包括天然存在的仲醇脫氫酶以及非天然存在的仲醇脫氫酶二者。天然存在的仲醇脫 氫酶包括來自布氏熱厭氧菌(Thermoanaerobiumbrockii)、紅串紅球菌(Rhodococcus erythropolis)、高加索酸奶乳桿菌、短乳桿菌和微小乳桿菌的已知的醇脫氫酶,而非天然 存在的仲醇脫氫酶包括從其衍生的人工改造的醇脫氫酶。用於本文所述方法的仲醇脫氫 酶(不論是天然存在的還是非天然存在的)可展示至少約1 μ mol/min/mg、有時候至少約 10 μ mol/min/mg 或至少約 IO2 μ mol/min/mg、高達約 IO3 μ mol/min/mg 或更高的活性。適合的仲醇包括低級仲鏈烷醇和芳基-烷基甲醇。低級仲醇的實例包括異丙醇、
992_ 丁醇、3-甲基-2-丁醇、2-戊醇、3-戊醇、3,3_ 二甲基-2-丁醇以及諸如此類。在一個實 施方案中,仲醇是異丙醇。適合的芳基-烷基甲醇包括未取代的和取代的1-芳基乙醇。當仲醇和仲醇脫氫酶被用作輔助因子再生系統時,所得的NAD+或NADP+被仲醇的 偶合氧化所還原,其中所述偶合氧化是仲醇脫氫酶將仲醇氧化為酮。一些人工改造的酮還 原酶還具有對仲醇還原劑脫氫的活性。在一些將仲醇用作還原劑的實施方案中,人工改造 的酮還原酶和仲醇脫氫酶是相同的酶。在進行利用輔助因子再生系統的本文所述酮還原酶催化的還原反應的實施方案 中,可最初提供氧化或還原型的輔助因子。如上所述,輔助因子再生系統將氧化的輔助因子 轉化為其還原型,其然後被用於酮還原酶底物的還原中。在一些實施方案中,輔助因子再生系統未被使用。對於不使用輔助因子再生系統 而進行的還原反應,將還原型的輔助因子加入反應混合物。在一些實施方案中,當使用宿主生物體的整個細胞進行該過程時,整個細胞可天 生地提供該輔助因子。可選地或共同地,該細胞可天生地或重組地提供葡萄糖脫氫酶。在進行本文所述立體選擇性還原反應時,人工改造的酮還原酶和包括任選的輔助 因子再生系統的任何酶可以以純化的酶、用編碼該酶的基因轉化的整個細胞和/或這種細 胞的細胞提取物和/或裂解產物的形式被加入反應混合物。編碼人工改造的酮還原酶的基 因和任選的輔助因子再生系統可被分別轉化進宿主細胞或一起轉化進相同宿主細胞。例 如,在一些實施方案中,可用編碼人工改造的酮還原酶的基因來轉化一組宿主細胞,並用編 碼輔助因子再生酶的基因來轉化另一組。兩組轉化細胞可以完整細胞形式或從其衍生的裂 解產物或提取物形式一起用於反應混合物。在其他實施方案中,可用編碼人工改造的酮還 原酶和輔助因子再生酶的基因來轉化宿主細胞。用編碼人工改造的酮還原酶和/或任選的輔助因子再生酶的基因所轉化的整個 細胞或者細胞提取物和/或其裂解產物可以以各種不同形式被使用,所述形式包括固體 (例如凍幹的、噴霧乾燥的以及諸如此類)或半固體(例如粗製的糊狀物)。可通過沉澱作用(硫酸銨、聚乙烯亞胺、熱處理或諸如此類,接著在凍幹之前進行 脫鹽程序(例如超濾、透析以及諸如此類))將細胞提取物或細胞裂解產物部分地純化。可 通過使用已知的交聯劑例如戊二醛的交聯或固定於固相(例如Eupergit C以及諸如此類) 來穩定任何細胞製劑。可以以各種不同形式將固體反應物(例如酶、鹽等)提供給反應,所述不同形式 包括粉末(例如凍幹的、噴霧乾燥的以及諸如此類)、溶液、乳濁液、懸液以及諸如此類。可 使用本領域普通技術人員已知的方法和設備將反應物容易地凍幹或噴霧乾燥。例如,可以 在-80°C以小等份將蛋白溶液冷凍,然後加入預先冷卻的凍幹容器中,接著施加真空。在從 樣品除去水後,在釋放真空並回收凍幹的樣品之前,通常將溫度提高到4°C保持兩小時。取決於期望產物的量並隨著所使用的酮還原酶底物的量,用於還原反應的反應物 的量通常將變化。可使用下述準則來確定待使用的酮還原酶、輔助因子和任選的輔助因子 再生系統的量。通常,可以使用約50mg至約5g的酮還原酶和約IOmg至約150mg的輔助因 子來利用濃度為約20至300克/升的酮底物。本領域普通技術人員將容易理解如何改變 這些量以使它們達到期望的產率水平和生產規模。可通過基於所用輔助因子和/或酮還原 酶的量的常規實驗來容易地確定任選的輔助因子再生系統的適當的量。通常,以超過等摩爾水平的酮還原酶底物的水平來利用還原劑(例如葡萄糖、甲酸、異丙醇)以獲得基本完全 的或接近完全的酮還原酶底物轉化。反應物的加入順序不重要。可同時將反應物一起加入溶劑(例如單相溶劑、雙相 水共溶劑系統以及諸如此類),或可選地可將一些反應物分開加入,以及將一些在不同時間 點一同加入。例如,輔助因子再生系統、輔助因子、酮還原酶和酮還原酶底物可被首先加入 溶劑。為了在使用水共溶劑系統時增加混合效率,可首先將輔助因子再生系統、酮還原 酶和輔助因子加入並混合進水相。然後可將有機相加入並混合,接著加入酮還原酶底物。可 選地,在加入水相之前,可將酮還原酶底物在有機相中預先混合。進行本文所述的酮還原酶催化的還原反應的適合條件包括各種各樣的可被常規 實驗容易地優化的條件,所述常規實驗包括但不限於在實驗PH和溫度下將人工改造的酮 還原酶和底物相接觸並且使用例如本文所提供的實施例中所述的方法檢測產物。通常在約15°C至約75°C範圍內的溫度下進行酮還原酶催化的還原。對於一些實 施方案,在約20°C至約55°C範圍內的溫度下進行反應。還在其他的實施方案中,在約20°C 至約45°C範圍內的溫度下進行。還可在環境條件下進行反應。通常允許還原反應進行到基本上完成或者接近完成,得到底物的還原。可使用已 知方法通過檢測底物和/或產物來監測底物向產物的還原。適合的方法包括氣相色譜法、 HPLC以及諸如此類。反應混合物中產生的醇還原產物的轉化率通常超過約50%,也可超過 約60 %,也可超過約70 %,也可超過約80 %,也可超過約90 %,並且往往超過約97 %。
7.實施例在下面的代表性實例中說明本公開的各種特徵和實施方案,其旨在是說明性的而 不是限制性的。在下面的描述中,不管是否使用葡萄糖脫氫酶(⑶H),它是可從JulichChiral Solutions, Julich, Germany 獲得的⑶H CDX901。實施例1 野生型酮還原酶基因的獲得和表達載體的構建。根據報導的酮還原酶胺基酸序列和美國臨時申請第60/848,950號(其通過引用 被併入本文)的實施例1中所述的密碼子優化算法,為了在大腸桿菌中的表達而設計了編 碼酮還原酶(KRED)的基因。使用由42個核苷酸所組成的低聚核苷酸合成了基因,並將其克 隆進受Iac啟動子控制的表達載體pCK110900(其被描述為美國專利申請公布20060195947 中的圖3)。所述表達載體還含有P15a複製起點和氯黴素抗性基因。使用標準方法將所得 的質粒轉化進大腸桿菌W3110。密碼子優化的基因以及編碼多肽被列在表3中。如美國臨 時申請第60/848,950號中所述確認了野生型酮還原酶的活性。表3
表3:所用的酮還原酶的縮寫、來源和參考KRED最初從其中鑑定出Genbank 登GI號多核苷酸多肽SEQ 編碼本發明中人工改造的酮還原酶的多核苷酸同樣被克隆進載體PCK110900以 在大腸桿菌W3110中表達。實施例2 酮還原酶粉末的產生;搖瓶程序。包括含有感興趣的酮還原酶基因的質粒的大腸桿菌的一個單獨微生物菌落被接 種在50ml的含有30μ g/ml氯黴素和葡萄糖的Terrific Broth肉湯中。在30°C培養 箱中以250rpm搖動培養細胞過夜(至少16小時)。在1升的燒瓶中的250ml的Terrific Broth肉湯(12g/L細菌用胰蛋白腖、24g/L酵母提取物、4ml/L甘油、65mM磷酸鉀(pH 7.0)、 ImM的MgS04、30 μ g/ml氯黴素)中將培養物稀釋到在600nm(0D600)下0. 2的光密度,並允許其在30°C下生長。當培養物的0D600是0. 6至0. 8時,用ImM的IPTG誘發酮還原酶基因 的表達並培養過夜(至少16小時)。通過離心(5000rpm、15min、4°C )收集細胞並丟棄上清 液。用等體積冷的(4°C ) IOOmM三乙醇胺(氯)緩衝液pH 7. 0 (在ADH-LK和ADH-LB以及 從其衍生的人工改造的酮還原酶的情況下包括2mM的MgSO4)將細胞團塊重懸浮,並如上通 過離心收集。在兩體積的冷的三乙醇胺(氯)緩衝液中將被衝洗的細胞重懸浮,並在維持 在4°C時在12000psi下將其通過弗氏壓碎器(French Press)兩次。通過離心(9000rpm、 45min、4°C)除去細胞碎片。收集澄清的裂解產物上清液並儲存在_20°C。對冷凍的澄清裂 解產物的凍幹提供了粗製酮還原酶的乾燥粉末。實施例3 酮還原酶的產生;發酵步驟。在通風攪拌的15L發酵器中,含有0. 88g/L硫酸銨、0. 98g/L檸檬酸鈉、12. 5g/L三 水合磷酸氫二鉀、6. 25g/L磷酸二氫鉀、6. 2g/L的Tastone-154酵母提取物、0. 083g/L檸檬 酸鐵銨和8. 3ml/L的微量元素溶液(含2g/L 二水合氯化鈣、2. 2g/L七水合硫酸鋅、0. 5g/L 一水合硫酸錳、lg/L七水合硫酸亞銅、0. lg/L四水合鉬酸銨和0. 02g/L十水合四硼酸鈉) 的6. OL的生長培養基被升到30°C。用含有帶感興趣的酮還原酶基因的質粒的大腸桿菌 W3110的晚期指數培養物在發酵器中接種,並在實施例3中所述的搖瓶中生長至0. 5至2. 0 的起始0D600。以500-1500rpm攪拌發酵器,並以1. 0-15. OL/min向發酵容器中提供空氣以 維持30%飽和或更高的溶氧水平。通過加入20% ν/ν的氫氧化銨來將培養物的pH控制在 7. O。通過加入含有500g/L結晶葡萄糖(cerelose)、12g/L氯化銨和10. 4g/L七水合硫酸鎂 的進料溶液來維持培養物的生長。在培養物達到50的0D600之後,通過將異丙基-b-D-硫 代半乳糖苷(IPTG)加到ImM的終濃度來誘導酮還原酶的表達。將培養物再生長14小時。 然後將培養物冷卻到4°C並維持在4°C直到被收集。在4°C下Sorval RC12BP離心機中以 5000G離心40分鐘來收集細胞。將收集的細胞直接用於接下來的下遊回收過程並儲存在 4°C下直到如此使用。在4°C下在2體積的IOOmM三乙醇胺(氯)緩衝液(pH6. 8)中將細胞團塊重懸浮 至每體積的溼細胞糊狀物。通過將懸浮液穿過裝有二階段均質閥門組件的均質器(其使 用12000psig的壓力)來從細胞釋放細胞內的酮還原酶。破裂之後馬上將細胞勻漿冷卻到 4°C。10%w/v的聚乙烯亞胺pH 7. 2的溶液被加入裂解產物至終濃度0.5% w/v,並且攪拌 30分鐘。通過在標準的實驗室離心機上以5000G離心30分鐘而使所得的懸浮液變澄清。 將澄清的上清液倒出並使用具有30Kd的分子量截留(cut off)的纖維素超濾膜將其濃縮 十倍。將最終的濃縮物分配到淺容器中,在_20°C下冷凍並凍幹為粉末。將酮還原酶粉末儲 存在_80°C。實施例4 將2-[3-[3-[2-(7-氯_2_喹啉基)乙烯基]苯基]_3_酮丙基]苯甲 酸甲酯轉化為(S)-2-[3-[3-[2-(7-氯-2-喹啉基)乙烯基]苯基]-3-羥丙基]苯甲酸甲 酯的分析方法。2-[3-[3-[2-(7-氯-2-喹啉基)乙烯基]苯基]_3_酮丙基]苯甲酸甲酯的還原和 醇產物的手性純度由如下所確定反相HPLC(具有保護筒的2. lX50mmZorbax XDB柱子;在 30°C下,0. 6mL/min,H20中的90 10的ACN/0. 25% AcOH ;使用下面的保留時間以287nm進 行檢測對映體醇0. 55min ;酮0. 72min)或者正相的手性HPLC (具有保護筒的2. 1 X 150mm ChiralPakAS-H柱子,在40°C下,0.5mL/min,10 90的異丙醇/庚烷;使用下面的保留時間以 287nm 進行檢測(S)-醇 7. Imin ; (R)-醇 5. 7min ;酮 4. 5min)。實施例5 將2-[3-[3-[2-(7-氯_2_喹啉基)乙烯基]苯基]_3_酮丙基]-苯 基]-1-甲基-1-乙醇轉化為(S)-2-[3-[3-[2-(7-氯-2-喹啉基)乙烯基]苯基]_3_羥 丙基]-苯基]-1-甲基-1-乙醇的分析方法。2-[3-[3-[2-(7-氯-2-喹啉基)乙烯基]苯基]_3_酮丙基]-苯基]甲 基-1-乙醇(通過將相應的醇氧化而製備的)的還原和醇產物的純度由HPLC(具有下面的 洗脫圖的 4. 6 X 50mm Phenomix Gemini C18,IlOA 柱子從 40% 至 80%在水/0. 1 % TFA 梯 度持續4min,保持1. 5min,以0. 5mL/min的流速在Imin內回到40%的乙腈/0. 1% TFA ;環 境溫度;使用下面的保留時間以254nm進行檢測醇4. 4min,酮5. 7min)所確定。通過HPLC(2. IX 150mm ChiralPak AD-H 柱子;溶劑40 60 異丙醇庚燒; 在40°C下,流速=0. 5mL/min ;使用下面的保留時間以280nm進行檢測(S)-醇12. Omin ; (R)-醇11. 2min ;酮10. 3min)來評估手性純度。實施例6 對用來將2-[3-[3-[2-(7-氯-2-喹啉基)乙烯基]苯基]_3_酮丙基] 苯甲酸甲酯還原的野生型酮還原酶的評估使用作為輔助因子的NADH和NADPH以及作為輔助因子再生系統的葡萄糖脫氫酶 /葡萄糖或異丙醇來篩選實施例1的表3中所述的KRED。向96深孔板的孔中加入250 μ L 的含有1.0g/L NAD(P)、30-50g/L的KRED變體的IOOmM三乙醇胺(氯)緩衝液pH7. 0、 200 μ L的IPA和50 μ L的10_20g/L酮底物的THF溶液。可選地,向96深孔板的每孔中預 先加入 10-20mg 的 CaC03、250 μ L 的含有 1. Og/L 的 NAD(P)、30_50g/L 的 KRED、10_20g/L 的 ⑶H和10%葡萄糖的IOOmM三乙醇胺(氯)緩衝液pH7.0。用鋁/聚丙烯分層熱密封膠帶 (Velocity ll(Menlo Park, CA),目錄號06643-001)對板進行密封,並在室溫下搖動過夜。 通過加入IOOOyL的EtOAc而將反應猝滅。離心(在22°C下以4000rpm進行IOmin)後,使 用實施例4中的正相HPLC方法來測定有機相的轉化。在被測試的任何條件下這些酶中沒 有一個顯示了任何活性(檢測極限為 0. 5%轉化)。該實施例證明,野生型酮還原酶對2-[3-[3-[2-(7_氯-2-喹啉基)乙烯基]苯 基]-3-酮丙基]苯甲酸甲酯具有非常少(如果有的話)的活性。實施例7 對用來將2-[3-[3-[2-(7-氯-2-喹啉基)乙烯基]苯基]_3_酮丙基] 苯甲酸甲酯還原的ADH-LK變體的評估對已經產生的幾種ADH-LK變體進行了評估並且發現當在實施例6中所述的和 表4中所列的條件下進行評估時具有SEQ ID NO :90的ADH-LK變體將底物轉化為手性的 (S)-2-[3-[3-[2-(7-氯-2-喹啉基)乙烯基]苯基]-3-羥丙基]苯甲酸甲酯。表 4 該實施例顯示,含有 G7H、S96T、F147L、Y190P、V196L、A202W 突變的 ADH-LK 變體 以高度的立體選擇性(>99%的立體異構過量)將2-[3-[3-[2-(7-氯-2-喹啉基)乙烯 基]苯基]-3-酮丙基]苯甲酸甲酯轉化為(S)-2-[3-[3-[2-(7-氯-2-喹啉基)乙烯基]苯基]-3-羥丙基]苯甲酸甲酯。實施例8 利用異丙醇來再生輔助因子的用來測定酮還原酶對 2-[3-[3-[2-(7-氯-2-喹啉基)乙烯基]苯基]-3-酮丙基]苯甲酸甲酯的活性的高通量 HPLC測定通過定向進化獲得並含有進化的酮還原酶基因的質粒文庫被轉化進大腸桿菌 中並被鋪板在含有葡萄糖和30 μ g/mL氯黴素(CAM)的Luria-Bertani (LB)肉湯上。 在30 °C下孵化至少16小時後,使用Q-bot 機器人菌落採集器(Genetix USA,Inc., Beaverton,0R)將菌落採集進含有180 μ L的Terrif ic肉湯(TB)、1 %葡萄糖、30 μ g/mL氯 黴素(CAM)和2mM的MgSO4的96孔淺孔微量滴定板中。在30°C下以200rpm搖動使細胞生 長過夜。然後將20 μ L的該培養物轉移進含有350 μ L的Terrific肉湯(TB)、2mM的MgSO4 和30 μ g/mL的CAM的96深孔板中。在30°C下深孔板中以250rpm搖動孵化2. 5至3小時 後(0D_ 0.6-0. 8),細胞培養物對重組基因的表達被異丙基硫代半乳糖苷(IPTG)誘導至 ImM的終濃度。然後在30°C下以250rpm搖動板孵化15-23小時。向96孔微量滴定板的孔中加入100 μ L的含有0. 2mM Na-NADP和2mM的MgSO4的 IOOmM三乙醇胺(氯)緩衝液pH7.0,以及足夠體積的細胞培養物以使最熟知的酶將在任何 時間點上(例如在第一輪進化中的SEQ ID 90)給出酮向(S)-醇的10-20%的轉化。IPA 和含有1. 67至16. 7g/L的2-[3-[3-[2-(7-氯-2-喹啉基)乙烯基]苯基]_3_酮丙基] 苯甲酸甲酯的THF溶液被加入孔中以得到體積比為4 1 5的IOOmM三乙醇胺(氯)緩 衝液pH7. 0、THF和IPA的最終組合物(最終的底物濃度為1至10g/L)。隨意地將酮加到 終濃度為0至2% (通常作為IPA或THF中的溶液)。如實施例6中所述將板熱密封並在 室溫或40°C下搖動孵化4或24小時。在反應的最後,用1000 μ L的1 4的THF 乙腈將 底物和產物猝滅。在室溫下離心之後,使用實施例4中所述的反相HPLC方法分析上清液的 轉化。對於待測定對映選擇性的反應,用ImL的EtOAc將反應猝滅,離心並通過實施例4中 所述的正相HPLC方法對有機相進行手性分析。該實施例描述被用來鑑定針對2-[3-[3-[2-(7_氯-2-喹啉基)乙烯基]苯 基]-3-酮丙基]苯甲酸甲酯的還原而被改進的KRED變體的方法。實施例9 衍生自ADH-LK的人工改造的酮還原酶對2-[3-[3-[2-(7_氯_2_喹啉 基)乙烯基]苯基]-3-酮丙基]苯甲酸甲酯的還原。在空氣中隨著攪拌棒的攪拌向琥珀色小瓶中按順序加入50_500mg的底物、1. 5mL 的含有 0. 33g/L 的 NADP-Na 禾Π 10. 0-33. 3g/L 的 KRED 變體、2mM 的 MgSO4 的 IOOmM 三乙醇 胺(氯)緩衝液pH 7. 0或8. 0、2. 5mL的IPA和0. 5mL的共溶劑(THF或甲苯)。小瓶被封 閉並被浸入被控制在期望溫度下的油浴中。在1、2、4和8小時處取出兩個50 μ L等份,並 在t = 24h處取出四個50 μ L等份。用IOOOyL的THF稀釋所述等份,並離心(22°C下, 4000rpm,10分鐘)以除去碎屑。用乙腈將上清液稀釋9 X,並如實施例4中所述確定轉化。 在第24小時的樣品上進行手性分析加入0. 5體積的鹽水和2體積的THF以獲得清晰的 相分離(phase break),並用MgSO4將有機相干燥。用EtOAc將有機相稀釋IOX,並如實施 例4中所述來分析。表5給出對應於酮還原酶的SEQ ID NO.、來自野生型ADH-LK的氨基 酸突變的數目和2-[3-[3-[2-(7-氯-2-喹啉基)乙烯基]苯基]-3-酮丙基]苯甲酸甲酯 向(S)-2-[3-[3-[2-(7-氯-2-喹啉基)乙烯基]苯基]-3-羥丙基]苯甲酸甲酯的轉化。被測的所有變體給出>99. 2%立體異構過量的(S)-2-[3-[3-[2-(7-氯-2-喹啉基)乙烯
基]苯基]-3-羥丙基]苯甲酸甲酯(參考標準是99.2% ee;不期望的立體異構體是不可
檢測的)。
+ 20g產物/升/g酶/天。實施例10 衍生自ADH-LK的人工改造的酮還原酶對2-[2-[3-[3[2-(7_氯_2_喹 啉基)乙烯基]苯基]-3-氧代丙基]苯基]-2-丙醇的還原。在空氣中隨著攪拌棒的攪拌向琥珀色小瓶中按順序加入500mg的 2_[2-[3-[3 [2-(7-氯-2-喹啉基)乙烯基]苯基]-3-氧代丙基]苯基]_2_丙醇、1. 5mL的 含有 0. 89g/L 的 NADP-Na 和 13. 3g/L 的 KRED 變體 SEQ ID NO :20、2mM 的 MgSO4 的 IOOmM 三 乙醇胺(氯)緩衝液PH 7.0,2. 5mL的IPA和0. 5mL的共溶劑(THF或甲苯)。小瓶被封閉 並被浸入被控制在40°C下的油浴中。在6、24和29小時處取出樣品(30 μ L),並用1500 μ L的THF稀釋;30 μ L稀釋的樣品被濃縮乾燥,在如實施例5中所述的化學轉化的HPLC分析 之前溶解在IOOOyL乙腈中。在29h處建立整個反應混合物之後進行手性分析用2mL鹽水和6mL的THF稀釋 樣品而得到清晰的相分離。用乙酸乙酯(3X10mL)萃取水相,並在MgSO4I將合併的有機 層乾燥。將有機溶液濾過西萊特(Celite)床並濃縮乾燥。通過將Img的殘基溶解在Iml 的乙腈中來製備分析樣品,並如實施例5中所述進行分析。以> 99%的立體異構過量獲得 (S)-I-(3-(2-(7-氯喹啉-2-基)乙烯基)苯基)-3-(2-(2-羥丙-2-基)苯基)丙-1-醇。 轉化超過約67%。實施例11 (S) -2- [3- [3- [2- (7-氯_2_喹啉基)乙烯基]苯基]_3_羥丙基]苯 甲酸甲酯的製備性規模生產。在氮氣中向通過外部熱交換器將套溫度設置為51°C的裝備有內部溫度計和機 械攪拌子(250rpm)的帶套的2L三頸燒瓶中加入300mL的IOOmM的pH 8. 0的三乙醇 胺*HC1、0. 6mL的IM的MgSO4、如實施例3中所製備的3. Og的SEQ ID NO 20的催化劑、 0. Ig的NADP-Na2以得到淡黃色溶液。攪拌10分鐘之後,在 5分鐘內分批加入IOOg的 2-[3-[3-[2-(7-氯-2-喹啉基)乙烯基]苯基]-3-酮丙基]苯甲酸甲酯。向漿體加入 500mL(390g)的IPA和IOOmL(85g)的甲苯。如實施例4和6中所述通過手性HPLC監測反 應過程。實施例9中所述的過程被用作取樣和樣品製備。在45°C下攪拌24小時後,根據手性HPLC分析來表明反應完成。通過空氣驅動的 真空泵將反應混合物濾過三層的150mm直徑的Whatman#2濾紙。需要大約10分鐘來完成 過濾以得到褐色糊狀物。用2X500mL水衝洗褐色糊狀物。將褐色糊狀物過夜風乾以得到 104g的褐色固體(S)-2-[3-[2-(7-氯-2-喹啉基)乙烯基]苯基]-3-羥丙基]苯甲酸甲 酯一水合物(100%產率;產物是一水合物),其化學純度是98. 5HPLC面積百分比(起始物 質的主要雜質是0. 3-0. 4HPLC面積百分比)。(R)-立體異構體是未檢測到的。本申請中所引用的所有出版物、專利、專利申請和其他文件為所有目的通過引用 以其整體併入本文,達到如同單個出版物、專利、專利申請或其他文件單獨表明為了所有目 的而通過引用被併入的程度。
權利要求
一種能夠以SEQ ID NO4多肽速率的至少1.5倍的速率將底物2-[3-[3-[2-(7-氯-2-喹啉基)乙烯基]苯基]-3-氧代丙基]苯甲酸甲酯轉化為產物(S,E)-2-(3-(3-(2-(7-氯喹啉-2-基)乙烯基)苯基)-3-羥丙基)苯甲酸甲酯的酮還原酶多肽。
2.根據權利要求1所述的多肽,其能夠將所述底物轉化為具有至少約95%的百分比立 體異構過量的所述產物。
3.根據權利要求1所述的多肽,其能夠將所述底物轉化為具有至少約99%的百分比立 體異構過量的所述產物。
4.根據權利要求1所述的多肽,其包括與具有下述特徵的基於SEQIDN0:2、4或114 的參考序列至少約85%相同的胺基酸序列對應於X190的殘基是脯氨酸,而且對應於X202 的殘基是色氨酸;條件是所述酮還原酶多肽具有這樣的胺基酸序列,其中對應於X190的殘 基是受限殘基,而且對應於X202的殘基是芳香族殘基。
5.根據權利要求1所述的多肽,其包括與具有下述特徵的基於SEQIDN0:2、4或114的 參考序列至少約85%相同的胺基酸序列對應於X190的殘基是脯氨酸;對應於X195的殘 基是精氨酸;而且對應於X202的殘基是色氨酸;條件是所述酮還原酶多肽具有這樣的氨基 酸序列,其中對應於X190的殘基是受限殘基,對應於X195的殘基是鹼性的、酸性的、非極性 的或極性的殘基,而且對應於X202的殘基是芳香族殘基。
6.根據權利要求4所述的多肽,其包括這樣的胺基酸序列,其中對應於X190的殘基是 脯氨酸,而且對應於X202的殘基是色氨酸。
7.根據權利要求5所述的多肽,其包括這樣的胺基酸序列,其中對應於X190的殘基是 脯氨酸,對應於X195的殘基是精氨酸,而且對應於X202的殘基是色氨酸。
8.根據權利要求4至7任一項所述的多肽,其中酮還原酶胺基酸序列另外具有一種或 多種下述特徵對應於X7的殘基是受限的或非極性的殘基; 對應於X17的殘基是非極性的或脂肪族的殘基; 對應於X25的殘基是極性的或酸性的殘基; 對應於X27的殘基是芳香族的殘基; 對應於X41的殘基是極性的、脂肪族的或非極性的殘基; 對應於X53的殘基是極性的、非極性的或酸性的殘基; 對應於X57的殘基是非極性的或脂肪族的殘基; 對應於X64的殘基是極性的、脂肪族的或非極性的殘基; 對應於X66的殘基是酸性的殘基;對應於X68的殘基是極性的、酸性的、脂肪族的或非極性的殘基; 對應於X72的殘基是鹼性的殘基; 對應於X76的殘基是脂肪族的、非極性的或極性的殘基; 對應於X80的殘基是脂肪族的、非極性的或極性的殘基; 對應於X93的殘基是極性的、脂肪族的或非極性的殘基; 對應於X94的殘基是半胱氨酸、脂肪族的或非極性的殘基; 對應於X95的殘基是脂肪族的、非極性的或酸性的殘基;對應於X96的殘基是半胱氨酸、極性的、脂肪族的或非極性的殘基;對應於X97的殘基是鹼性的、受限的或極性的殘基;對應於XlOO的殘基是鹼性的、酸性的、極性的、脂肪族的或非極性的殘基;對應於X108的殘基是鹼性的或受限的殘基;對應於Xlll的殘基是非極性的或脂肪族的殘基;對應於X139的殘基是非極性的或脂肪族的殘基;對應於X145的殘基是酸性的、脂肪族的或非極性的殘基;對應於X147的殘基是芳香族的、脂肪族的或非極性的殘基;對應於X148的殘基是非極性的或脂肪族的殘基;對應於X151的殘基是受限的、非極性的或脂肪族的殘基;對應於X152的殘基是極性的、芳香族的、脂肪族的或非極性的殘基;對應於X163的殘基是非極性的或脂肪族的殘基;對應於X165的殘基是極性的、非極性的或脂肪族的殘基;對應於X173的殘基是酸性的、非極性的或脂肪族的殘基;對應於X179的殘基是芳香族的、鹼性的、脂肪族的或非極性的殘基;對應於X194的殘基是受限的、極性的、脂肪族的或非極性的殘基;對應於X196的殘基是非極性的或脂肪族的殘基;對應於X197的殘基是酸性的殘基;對應於X198的殘基是酸性的或極性的殘基;對應於X210的殘基是極性的或鹼性的殘基;對應於X211的殘基是鹼性的、脂肪族的、非極性的、酸性的或極性的殘基;對應於X212的殘基是極性的、脂肪族的或非極性的;對應於X216的殘基是受限的或鹼性的殘基;對應於X223的殘基是非極性的或脂肪族的殘基;對應於X226的殘基是非極性的或極性的殘基;對應於X233的殘基是極性的或酸性的;對應於X235的殘基是極性的或芳香族的殘基;對應於X248的殘基是非極性的或芳香族的殘基;對應於X249的殘基是芳香族的殘基;而且其中任選地,所述胺基酸序列與所述參考序列相比在其他胺基酸殘基位置具有一個或 多個殘基差異。
9.根據權利要求4至7任一項所述的多肽,其中酮還原酶胺基酸序列另外具有一種或 多種下述特徵對應於X7的殘基是組氨酸; 對應於X17的殘基是甲硫氨酸; 對應於X25的殘基是天冬氨酸; 對應於X27的殘基是酪氨酸; 對應於X41的殘基是絲氨酸或丙氨酸; 對應於X53的殘基是天冬氨酸;對應於X57的殘基是纈氨酸; 對應於X64的殘基是纈氨酸; 對應於X66的殘基是穀氨酸;對應於X68的殘基是纈氨酸; 對應於X72的殘基是精氨酸; 對應於X76的殘基是丙氨酸; 對應於X80的殘基是蘇氨酸或纈氨酸; 對應於X93的殘基是絲氨酸; 對應於X94的殘基是半胱氨酸或甘氨酸; 對應於X95的殘基是亮氨酸或穀氨酸;對應於X96的殘基是半胱氨酸、天冬醯胺、纈氨酸、亮氨酸、異亮氨酸或蘇氨酸;對應於X97的殘基是組氨酸或絲氨酸;對應於XlOO的殘基是賴氨酸;對應於X108的殘基是組氨酸;對應於Xlll的殘基是甲硫氨酸;對應於X139的殘基是亮氨酸;對應於X145的殘基是穀氨醯胺或亮氨酸;對應於X147的殘基是亮氨酸;對應於X148的殘基是纈氨酸;對應於X151的殘基是丙氨酸;對應於X152的殘基是絲氨酸;對應於X163的殘基是異亮氨酸;對應於X165的殘基是天冬醯胺;對應於X173的殘基是纈氨酸;對應於X179的殘基是苯丙氨酸、賴氨酸或亮氨酸;對應於X194的殘基是穀氨醯胺、絲氨酸或亮氨酸;對應於X196的殘基是亮氨酸;對應於X197的殘基是穀氨酸;對應於X198的殘基是穀氨酸或穀氨醯胺;對應於X210的殘基是精氨酸;對應於X211的殘基是纈氨酸、亮氨酸、蘇氨酸或異亮氨酸;對應於X212的殘基是絲氨酸或纈氨酸;對應於X216的殘基是精氨酸;對應於X223的殘基是纈氨酸;對應於X226的殘基是蘇氨酸;對應於X233的殘基是天冬醯胺或天冬氨酸;對應於X235的殘基是色氨酸;對應於X248的殘基是甘氨酸或色氨酸;對應於X249的殘基是色氨酸;而且其中任選地,所述胺基酸序列與所述參考序列相比在其他胺基酸殘基位置具有一個或 多個殘基差異。
10.根據權利要求4所述的多肽,其中酮還原酶胺基酸序列另外具有一種或多種或至 少所有的下述特徵對應於X94的殘基是半胱氨酸、脂肪族的或非極性的殘基; 對應於X96的殘基是半胱氨酸、極性的、脂肪族的或非極性的殘基,而且 對應於X211的殘基是鹼性的、脂肪族的、非極性的、酸性的或極性的殘基;而且 其中任選地,所述胺基酸序列與所述參考序列相比在其他胺基酸殘基位置具有一個或 多個殘基差異。
11.根據權利要求4所述的多肽,其中酮還原酶胺基酸序列另外具有一種或多種或至 少所有的下述特徵對應於X94的殘基是半胱氨酸、脂肪族的或非極性的殘基, 對應於X96的殘基是半胱氨酸、極性的、脂肪族的或非極性的殘基; 對應於X147的殘基是芳香族的、脂肪族的或非極性的殘基;而且 其中任選地,所述胺基酸序列與所述參考序列相比在其他胺基酸殘基位置具有一個或 多個殘基差異。
12.根據權利要求4所述的多肽,其中酮還原酶胺基酸序列另外具有一種或多種或至 少所有的下述特徵對應於X94的殘基是半胱氨酸、脂肪族的或非極性的殘基; 對應於X96的殘基是半胱氨酸、極性的、脂肪族的或非極性的殘基; 對應於X147的殘基是芳香族的、脂肪族的或非極性的殘基; 對應於X211的殘基是鹼性的、脂肪族的、非極性的、酸性的或極性的殘基;而且 其中任選地,所述胺基酸序列與所述參考序列相比在其他胺基酸殘基位置具有一個或 多個殘基差異。
13.根據權利要求4所述的多肽,其中酮還原酶胺基酸序列另外具有一種或多種或至 少所有的下述特徵對應於X94的殘基是半胱氨酸、脂肪族的或非極性的殘基; 對應於X96的殘基是半胱氨酸、極性的、脂肪族的或非極性的殘基; 對應於X194的殘基是受限的、極性的、脂肪族的或非極性的殘基; 對應於X211的殘基是鹼性的、脂肪族的、非極性的、酸性的或極性的殘基;而且 其中任選地,所述胺基酸序列與所述參考序列相比在其他胺基酸殘基位置具有一個或 多個殘基差異。
14.根據權利要求4所述的多肽,其中酮還原酶胺基酸序列另外具有一種或多種或至 少所有的下述特徵對應於X94的殘基是半胱氨酸、脂肪族的或非極性的殘基;對應於X96的殘基是半胱氨酸、極性的、脂肪族的或非極性的殘基;對應於X147的殘基是芳香族的、脂肪族的或非極性的殘基;對應於X194的殘基是受限的、極性的、脂肪族的或非極性的殘基;對應於X211的殘基是鹼性的、脂肪族的、非極性的、酸性的或極性的殘基;而且其中任選地,所述胺基酸序列與所述參考序列相比在其他胺基酸殘基位置具有一個或 多個殘基差異。
15.根據權利要求4所述的多肽,其中酮還原酶胺基酸序列另外具有一種或多種或至 少所有的下述特徵對應於X93的殘基是極性的、脂肪族的或非極性的殘基; 對應於X94的殘基是半胱氨酸、脂肪族的或非極性的殘基; 對應於X96的殘基是半胱氨酸、極性的、脂肪族的或非極性的殘基; 對應於X211的殘基是鹼性的、脂肪族的、非極性的、酸性的或極性的殘基;而且 其中任選地,所述胺基酸序列與所述參考序列相比在其他胺基酸殘基位置具有一個或 多個殘基差異。
16.根據權利要求4所述的多肽,其中酮還原酶胺基酸序列另外具有一種或多種或至 少所有的下述特徵對應於X93的殘基是極性的、脂肪族的或非極性的殘基; 對應於X94的殘基是半胱氨酸、脂肪族的或非極性的殘基; 對應於X96的殘基是半胱氨酸、極性的、脂肪族的或非極性的殘基; 對應於XlOO的殘基是鹼性的、酸性的、極性的、脂肪族的或非極性的殘基; 對應於X147的殘基是芳香族的、脂肪族的或非極性的殘基; 對應於X152的殘基是極性的、芳香族的、脂肪族的或非極性的殘基; 對應於X194的殘基是受限的、極性的、脂肪族的或非極性的殘基; 對應於X196的殘基是非極性的或脂肪族的殘基;對應於X211的殘基是鹼性的、脂肪族的、非極性的、酸性的或極性的殘基;而且 其中任選地,所述胺基酸序列與所述參考序列相比在其他胺基酸殘基位置具有一個或 多個殘基差異。
17.根據權利要求4所述的多肽,其中酮還原酶胺基酸序列另外具有一種或多種或至 少所有的下述特徵對應於X7的殘基是受限的或非極性的殘基;對應於X66的殘基是酸性的殘基;對應於X93的殘基是極性的、脂肪族的或非極性的殘基;對應於X94的殘基是半胱氨酸、非極性的或脂肪族的殘基;對應於X96的殘基是半胱氨酸、極性的、脂肪族的或非極性的殘基;對應於X147的殘基是芳香族的、脂肪族的或非極性的殘基;對應於X194的殘基是受限的、極性的、脂肪族的或非極性的殘基;對應於X196的殘基是非極性的或脂肪族的殘基;對應於X198的殘基是酸性的或極性的殘基;對應於X211的殘基是鹼性的、脂肪族的、非極性的、酸性的或極性的殘基;而且 其中任選地,所述胺基酸序列與所述參考序列相比在其他胺基酸殘基位置具有一個或 多個殘基差異。
18.根據權利要求4所述的多肽,其中酮還原酶胺基酸序列另外具有一種或多種或至 少所有的下述特徵對應於X7的殘基是受限的或非極性的殘基;對應於X17的殘基是非極性的或脂肪族的殘基;對應於X27的殘基是芳香族的殘基; 對應於X64的殘基是極性的、非極性的或脂肪族的殘基; 對應於X66的殘基是酸性的殘基;對應於X80的殘基是脂肪族的、非極性的或極性的殘基;對應於X93的殘基是極性的、脂肪族的或非極性的殘基;對應於X94的殘基是半胱氨酸、非極性的或脂肪族的殘基;對應於X96的殘基是半胱氨酸、極性的、脂肪族的或非極性的殘基;對應於XlOO的殘基是鹼性的或受限的殘基;對應於X147的殘基是芳香族的、脂肪族的或非極性的殘基;對應於X194的殘基是受限的、極性的、脂肪族的或非極性的殘基;對應於X196的殘基是非極性的或脂肪族的殘基;對應於X198的殘基是酸性的或極性的殘基;對應於X211的殘基是鹼性的、脂肪族的、非極性的、酸性的或極性的殘基; 對應於X216的殘基是受限的或鹼性的殘基;其中任選地,所述胺基酸序列與所述參考序列相比在其他胺基酸殘基位置具有一個或 多個殘基差異。
19.根據權利要求4所述的多肽,其中酮還原酶胺基酸序列另外具有所有的下述特徵 對應於X7的殘基是受限的或非極性的殘基;對應於X17的殘基是非極性的或脂肪族的殘基;對應於X27的殘基是芳香族的殘基;對應於X64的殘基是極性的、非極性的或脂肪族的殘基;對應於X80的殘基是脂肪族的、非極性的或極性的殘基;對應於X93的殘基是極性的、脂肪族的或非極性的殘基;對應於X94的殘基是半胱氨酸、非極性的或脂肪族的殘基;對應於X96的殘基是半胱氨酸、極性的、脂肪族的或非極性的殘基;對應於XlOO的殘基是鹼性的或受限的殘基;對應於X147的殘基是芳香族的、脂肪族的或非極性的殘基;對應於X194的殘基是受限的、極性的、脂肪族的或非極性的殘基;對應於X196的殘基是非極性的或脂肪族的殘基;對應於X198的殘基是酸性的或極性的殘基;對應於X211的殘基是鹼性的、脂肪族的、非極性的、酸性的或極性的殘基; 對應於X216的殘基是受限的或鹼性的殘基;其中任選地,所述胺基酸序列與所述參考序列相比在其他胺基酸殘基位置具有一個或 多個殘基差異。
20.根據權利要求4所述的多肽,其中酮還原酶胺基酸序列另外具有所有的下述特徵 對應於X7的殘基是組氨酸;對應於X17的殘基是甲硫氨酸;對應於X27的殘基是芳香族的殘基;對應於X64的殘基是酪氨酸;對應於X80的殘基是蘇氨酸;對應於X93的殘基是絲氨酸;對應於X94的殘基是半胱氨酸;對應於X96的殘基是纈氨酸、亮氨酸或異亮氨酸;對應於XlOO的殘基是賴氨酸;對應於X147的殘基是亮氨酸;對應於X194的殘基是穀氨醯胺;對應於X196的殘基是亮氨酸;對應於X198的殘基是穀氨酸;對應於X211的殘基是纈氨酸;對應於X216的殘基是精氨酸;其中任選地,所述胺基酸序列與所述參考序列相比在其他胺基酸殘基位置具有一個或 多個殘基差異。
21.根據權利要求8所述的多肽,其中所述酮還原酶胺基酸序列具有下述特徵對應於 X7的殘基是組氨酸;對應於X96的殘基是蘇氨酸;對應於X147的殘基是亮氨酸;而且對應 於X196的殘基是亮氨酸。
22.根據權利要求21所述的多肽,其中所述酮還原酶胺基酸序列另外具有下述特徵 對應於X93的殘基是絲氨酸;對應於X94的殘基是半胱氨酸;對應於X96的殘基是亮氨酸; 而且對應於X211的殘基是纈氨酸。
23.根據權利要求22所述的多肽,其中所述酮還原酶胺基酸序列另外具有下述特徵 對應於X17的殘基是甲硫氨酸;對應於X27的殘基是酪氨酸;對應於X64的殘基是纈氨酸; 對應於X80的殘基是蘇氨酸;而且對應於XlOO的殘基是賴氨酸。
24.根據權利要求22所述的多肽,其中所述酮還原酶胺基酸序列另外具有下述特徵 對應於X66的殘基是穀氨酸;對應於X96的殘基是異亮氨酸;對應於X194的殘基是穀氨醯 胺;對應於X198的殘基是穀氨酸;而且對應於X216的殘基是精氨酸。
25.根據權利要求22所述的多肽,其中所述酮還原酶胺基酸序列另外具有下述特徵 對應於X66的殘基是穀氨酸;對應於X96的殘基是異亮氨酸;對應於X194的殘基是穀氨醯 胺;而且對應於X198的殘基是穀氨酸。
26.根據權利要求23所述的多肽,其中所述酮還原酶胺基酸序列另外具有下述特徵 對應於X194的殘基是穀氨醯胺;對應於X198的殘基是穀氨酸;而且對應於X216的殘基是 精氨酸。
27.根據權利要求24所述的多肽,其中所述酮還原酶胺基酸序列另外具有下述特徵 對應於X17的殘基是甲硫氨酸;對應於X27的殘基是酪氨酸;對應於X64的殘基是纈氨酸; 對應於X66的殘基是天冬氨酸;對應於X80的殘基是蘇氨酸;對應於X96的殘基是異亮氨酸 或亮氨酸;而且對應於XlOO的殘基是賴氨酸。
28.根據權利要求1所述的多肽,其中所述酮還原酶多肽包括具有與具有下述特徵的 基於SEQ ID NO :2、4或114的參考序列的殘基90至211至少85%相同的胺基酸序列的區域或結構域對應於X190的殘基是脯氨酸,而且對應於X202的殘基是色氨酸;條件是酮還 原酶結構域或區域具有這樣的胺基酸序列,其中對應於X190的殘基是受限殘基,而且對應 於X202的殘基是芳香族殘基。
29.根據權利要求1所述的多肽,其中所述酮還原酶多肽包括具有與具有下述特徵的 基於SEQ ID NO :2、4或114的參考序列的殘基90至211至少85%相同的胺基酸序列的區 域或結構域對應於X190的殘基是脯氨酸;對應於X195的殘基是精氨酸;而且對應於X202 的殘基是色氨酸;條件是酮還原酶結構域或區域具有這樣的胺基酸序列,其中對應於X190 的殘基是受限殘基,對應於X195的殘基是鹼性的、酸性的、非極性的或極性的殘基,而且對 應於X202的殘基是芳香族殘基。
30.根據權利要求28所述的多肽,其中所述酮還原酶結構域或區域包括這樣的胺基酸 序列,其中對應於X190的殘基是脯氨酸,而且對應於X202的殘基是色氨酸。
31.根據權利要求29所述的多肽,其中所述酮還原酶結構域或區域包括這樣的胺基酸 序列,其中對應於X190的殘基是脯氨酸,對應於X195的殘基是精氨酸,而且對應於X202的 殘基是色氨酸。
32.根據權利要求28至31任一項所述的多肽,其中所述酮還原酶結構域或區域另外具 有一種或多種下述特徵對應於X93的殘基是極性的、脂肪族的或非極性的殘基;對應於X94的殘基是半胱氨酸、脂肪族的或非極性的殘基;對應於X95的殘基是脂肪族的、非極性的或酸性的殘基;對應於X96的殘基是半胱氨酸、極性的、脂肪族的或非極性的殘基;對應於X97的殘基是鹼性的、受限的或極性的殘基;對應於XlOO的殘基是鹼性的、酸性的、極性的、脂肪族的或非極性的殘基;對應於X108的殘基是鹼性的或受限的殘基;對應於Xlll的殘基是非極性的或脂肪族的殘基;對應於X139的殘基是非極性的或脂肪族的殘基;對應於X145的殘基是酸性的、脂肪族的或非極性的殘基;對應於X147的殘基是芳香族的、脂肪族的或非極性的殘基;對應於X148的殘基是非極性的或脂肪族的殘基;對應於X151的殘基是受限的、非極性的或脂肪族的殘基;對應於X152的殘基是極性的、芳香族的、脂肪族的或非極性的殘基;對應於X163的殘基是非極性的或脂肪族的殘基;對應於X165的殘基是極性的、非極性的或脂肪族的殘基;對應於X173的殘基是酸性的、非極性的或脂肪族的殘基;對應於X179的殘基是芳香族的、鹼性的、脂肪族的或非極性的殘基;對應於X194的殘基是受限的、極性的、脂肪族的或非極性的殘基;對應於X196的殘基是非極性的或脂肪族的殘基;對應於X197的殘基是酸性的殘基;對應於X198的殘基是酸性的或極性的殘基;對應於X210的殘基是極性的或鹼性的殘基;對應於Χ211的殘基是鹼性的、脂肪族的、非極性的、酸性的或極性的殘基;而且 其中所述胺基酸序列與所述參考序列相比可以任選地具有在對應於殘基90-211的結 構域中其他胺基酸殘基位置的一個或多個差異。
33.根據權利要求28至31任一項所述的多肽,其中所述酮還原酶結構域或區域另外具 有一種或多種下述特徵對應於Χ93的殘基是絲氨酸; 對應於Χ94的殘基是半胱氨酸或甘氨酸; 對應於Χ95的殘基是亮氨酸或穀氨酸;對應於Χ96的殘基是半胱氨酸、天冬醯胺、纈氨酸、亮氨酸、異亮氨酸或蘇氨酸;對應於Χ97的殘基是組氨酸或絲氨酸;對應於XlOO的殘基是賴氨酸;對應於Χ108的殘基是組氨酸;對應於Xlll的殘基是甲硫氨酸;對應於Χ139的殘基是亮氨酸;對應於Χ145的殘基是穀氨醯胺或亮氨酸;對應於Χ147的殘基是亮氨酸;對應於Χ151的殘基是丙氨酸;對應於Χ152的殘基是絲氨酸;對應於Χ163的殘基是異亮氨酸;對應於Χ165的殘基是天冬醯胺;對應於Χ173的殘基是纈氨酸;對應於Χ179的殘基是苯丙氨酸、賴氨酸或亮氨酸;對應於Χ194的殘基是穀氨醯胺、絲氨酸或亮氨酸;對應於Χ196的殘基是亮氨酸;對應於Χ197的殘基是穀氨酸;對應於Χ198的殘基是穀氨酸或穀氨醯胺;對應於Χ210的殘基是精氨酸;對應於Χ211的殘基是纈氨酸、亮氨酸、精氨酸、蘇氨酸或異亮氨酸; 其中所述胺基酸序列與所述參考序列相比可以任選地具有在對應於殘基90-211的結 構域中其他胺基酸殘基位置的一個或多個差異。
34.根據權利要求28至31任一項所述的多肽,其中所述酮還原酶結構域或區域另外具 有所有的下述特徵對應於Χ93的殘基是極性的、脂肪族的或非極性的殘基; 對應於Χ94的殘基是半胱氨酸、脂肪族的或非極性的殘基; 對應於Χ96的殘基是半胱氨酸、極性的、脂肪族的或非極性的殘基; 對應於XlOO的殘基是鹼性的、酸性的、極性的、脂肪族的或非極性的殘基; 對應於Χ147的殘基是芳香族的、脂肪族的或非極性的殘基; 對應於Χ194的殘基是受限的、極性的、脂肪族的或非極性的殘基; 對應於Χ196的殘基是非極性的或脂肪族的殘基;對應於X198的殘基是酸性的或極性的殘基;對應於X211的殘基是鹼性的、脂肪族的、非極性的、酸性的或極性的殘基;而且其中所述胺基酸序列與所述參考序列相比可以任選地具有在對應於殘基90-211的結 構域中其他胺基酸殘基位置的一個或多個差異。
35.根據權利要求1所述的多肽,其中所述酮還原酶包括選自SEQIDN0:6、8、10、12、 14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、48、50、52、54、56、58、60、62、 64、66、68、70、72、74、76、78、80、82、84、86、88、92、94、96、98、100、102、104、106、108 和 110 的胺基酸序列。
36.根據權利要求1所述的多肽,其中所述酮還原酶能夠以比參考多肽高至少1-50倍 的速率將所述底物轉化為所述產物。
37.根據權利要求36所述的多肽,其中所述酮還原酶包括對應於SEQIDNO :42、44、46、 48、86、88、92、94、96、100 或 102 的胺基酸序列。
38.根據權利要求1所述的多肽,其中所述酮還原酶能夠以比參考多肽高至少50-250 倍的速率將所述底物轉化為所述產物。
39.根據權利要求38所述的多肽,其包括對應於SEQID NO 10、32、34、36、50、64、66、 68、70、72、74、76、78、80、82、84、98、104、106 和 108 的胺基酸序列。
40.根據權利要求1所述的多肽,其能夠以比參考多肽高至少250-1000倍的速率將所 述底物轉化為所述產物。
41.根據權利要求40所述的多肽,其包括對應於SEQID NO 12、18、22、24、26、28、30、 38、40、52、54、56、58、60、62 和 110 的胺基酸序列。
42.根據權利要求1所述的多肽,其能夠以比參考多肽高至少1000倍的速率將所述底 物轉化為所述產物。
43.根據權利要求42所述的多肽,其包括對應於SEQID NO :6、8、14、16和20的胺基酸序列。
44.根據權利要求1所述的多肽,當用超過約100g/L的底物和小於約5g/L的所述多肽 進行時,所述多肽能夠在小於約24小時內將至少約95%的所述底物轉化為所述產物。
45.根據權利要求44所述的多肽,其包括對應於SEQID NO :6、8、14、16和20的氨基 酸序列。
46.根據權利要求1所述的多肽,其與參考多肽相比具有增加的對作為所述底物向所 述產物轉化的競爭性抑制劑的丙酮的抵抗性。
47.根據權利要求46所述的多肽,其中所述酮還原酶包括選自SEQIDN0:6、8、10、12、 14、16、18、20、22、24、26、28、30、32、34、36、38、40、50、52、54、56、58、60、62、64、66、68、70、 72、74、76、78、80、82、84、86、88、98、104、106、108 和 110 的胺基酸序列。
48.一種編碼根據權利要求1-46任一項的多肽的多核苷酸。
49.根據權利要求48所述的多核苷酸,其選自對應於SEQID NO:的序列。
50.一種包括權利要求48所述多核苷酸的表達載體,所述多核苷酸可操作地連接至適 合指導在宿主細胞中表達的控制序列。
51.根據權利要求50所述的表達載體,其中所述控制序列包括啟動子。
52.根據權利要求51所述的表達載體,其中所述啟動子包括大腸桿菌啟動子。
53.一種包括權利要求50所述表達載體的宿主細胞。
54.根據權利要求53所述的宿主細胞,其為大腸桿菌。
55.根據權利要求53所述的宿主細胞,其中編碼所述多肽的所述表達載體的密碼子已 被優化以在所述宿主細胞中表達。
56.一種組合物,其包括權利要求1-46任一項的酮還原酶和結構式(I)的底物 2-[3-[3-[2-(7-氯-2-喹啉基)乙烯基]苯基]-3-氧代丙基]苯甲酸甲酯;結構式(II) 的產物(S,E)-2-(3-(3-(2-(7-氯喹啉-2-基)乙烯基)苯基)_3_羥丙基)苯甲酸甲酯; 結構式(III)的底物2-[2-[3-[3[2-(7_氯-2-喹啉基)乙烯基]苯基]-3-氧代丙基] 苯基]-2-丙醇;或結構式(IV)的產物(S,E)-l-(3-(2-(7-氯喹啉-2-基)乙烯基)苯 基)-3-(2-(2-羥丙-2-基)苯基)丙-1-醇。
57.根據權利要求56所述的組合物,其中所述底物是結構式(I)的底物而且所述組合 物還包括結構式(II)的產物。
58.根據權利要求56所述的組合物,其中所述底物是結構式(II)的底物而且所述組合 物還包括結構式(IV)的產物。
59.根據權利要求56所述的組合物,還包括輔助因子再生系統。
60.根據權利要求59所述的組合物,其中所述輔助因子再生系統包括葡萄糖脫氫酶和 葡萄糖;甲酸脫氫酶和甲酸;或者異丙醇和仲醇脫氫酶。
61.一種將式(I)的底物2-[3-[3-[2-(7-氯-2-喹啉基)乙烯基]苯基]-3-氧代丙 基]苯甲酸甲酯還原為式(II)的產物(S,E)-2-(3-(3-(2-(7-氯喹啉-2-基)乙烯基)苯 基)-3_羥丙基)苯甲酸甲酯的方法,該方法包括將式(I)底物在適於將所述底物還原或轉 化為式(II)產物的反應條件下與權利要求1-46任一項所述的酮還原酶多肽接觸。
62.根據權利要求61所述的方法,其中所述產物以超過約99%的立體異構過量存在。
63.根據權利要求63所述的方法,其中至少約95%的所述底物在小於約24小時內被 還原為所述產物,其中所述底物的濃度是至少100g/L而所述多肽的濃度是小於約5g/L,並 且其中所述多肽包括對應於SEQ IDNO :6、8、14、16和20的胺基酸序列。
64.根據權利要求61所述的方法,該方法使用表達酮還原酶的完整細胞或這種細胞的 提取物或裂解產物進行。
65.根據權利要求61所述的方法,其中所述酮還原酶是分離和/或純化的而且還原反 應是在酮還原酶的輔助因子以及任選地輔助因子再生系統的存在下進行的。
66.根據權利要求65所述的方法,其中所述輔助因子再生系統包括葡萄糖脫氫酶和葡 萄糖;甲酸脫氫酶和甲酸;或者異丙醇和仲醇脫氫酶。
67.根據權利要求66所述的方法,其中所述仲醇脫氫酶是酮還原酶。
68.一種將式(III)底物2-[2-[3-[3[2-(7_氯-2-喹啉基)乙烯基]苯基]_3_氧 代丙基]苯基]-2-丙醇還原為產物(S,E)-l-(3-(2-(7-氯喹啉-2-基)乙烯基)苯 基)-3-(2-(2_羥丙-2-基)苯基)丙-1-醇的方法,該方法包括將式(III)底物在適於將 所述底物還原為式(IV)產物的反應條件下與權利要求1-46任一項所述的酮還原酶多肽接 觸。
69.根據權利要求68所述的方法,其中所述產物以超過約99%的立體異構過量存在。
70.根據權利要求68所述的方法,其中至少約95%的所述底物在小於約24小時內被還原為產物,其中所述底物的濃度是至少100g/L而所述多肽的濃度是小於約5g/L,並且其 中所述多肽包括對應於SEQ ID NO :6、8、14、16和20的胺基酸序列。
71.根據權利要求68所述的方法,其使用表達酮還原酶的完整細胞或這種細胞的提取 物或裂解產物進行。
72.根據權利要求68所述的方法,其中所述酮還原酶是分離和/或純化的而且還原反 應是在酮還原酶的輔助因子以及任選地輔助因子再生系統的存在下進行的。
73.根據權利要求72所述的方法,其中所述輔助因子再生系統包括葡萄糖脫氫酶和葡 萄糖;甲酸脫氫酶和甲酸;或者異丙醇和仲醇脫氫酶。
74.根據權利要求73所述的方法,其中所述仲醇脫氫酶是酮還原酶。
75.一種用於合成式(XX)化合物的方法 化為式(II)產物的反應條件下將式(I)底物與權利要求1-46任一項所述的酮還原酶多肽 接觸而將式(I)底物2-[3-[3-[2-(7-氯-2-喹啉基)乙烯基]苯基]-3-氧代丙基]苯甲 酸甲酯還原為式(II)產物(S,E)-2-(3-(3-(2-(7-氯喹啉-2-基)乙烯基)苯基)-3_羥 丙基)苯甲酸甲酯;以及(b)將式(II)化合物與烷基磺醯基滷素或芳基磺醯基滷素在適於 形成化合物(XX)的條件下反應。
76.根據權利要求75所述的方法,其中所述烷基磺醯基滷素是甲基磺醯氯。
77.一種用於合成式(XXI)化合物的方法 化為式(IV)產物的反應條件下將式(III)底物與權利要求1-46任一項所述的酮還原酶多 肽接觸而將式(III)底物2-[2-[3-[3[2-(7_氯-2-喹啉基)乙烯基]苯基]-3-氧代丙 基]苯基]-2-丙醇還原為式(IV)產物(S,E)-l-(3-(2-(7-氯喹啉-2-基)乙烯基)苯 基)-3-(2-(2-羥丙-2-基)苯基)丙-1-醇;以及(b)將式(IV)化合物與烷基磺醯基滷 素或芳基磺醯基滷素在適於形成化合物(XXI)的條件下反應。
78.根據權利要求75所述的方法,其中所述烷基磺醯基滷素是甲基磺醯氯。
79. 一種用於合成化合物(V)或其鹽、水合物或溶劑化物的方法 其中所述方法中的步驟包括通過在適於將底物還原或轉化為式(II)產物的反應條件下將式(I)底物與權利要求1-46任一項所述的酮還原酶多肽接觸而將式(I)底物 2-[3-[3-[2-(7-氯-2-喹啉基)乙烯基]苯基]-3-氧代丙基]苯甲酸甲酯還原為式(II) 產物(S,E)-2-(3-(3-(2-(7-氯喹啉-2-基)乙烯基)苯基)_3_羥丙基)苯甲酸甲酯。
80. 一種用於合成化合物(V)或其鹽、水合物或溶劑化物的方法 其中所述方法中的步驟包括通過在適於將底物還原為式(IV)產物的反應條件下 將式(III)底物與權利要求1-46任一項所述的酮還原酶多肽接觸而將式(III)底物 2_ [2-[3-[3 [2-(7-氯-2-喹啉基)乙烯基]苯基]_3_氧代丙基]苯基]-2-丙醇還原為式 (IV)產物(5,幻-1-(3-(2-(7-氯喹啉-2-基)乙烯基)苯基)-3-(2-(2-羥丙-2-基)苯 基)丙-ι-醇。
全文摘要
本公開提供與天然存在的野生型酮還原酶相比具有改進性質的人工改造的酮還原酶。還提供了編碼人工改造的酮還原酶的多核苷酸、能夠表達人工改造的酮還原酶的宿主細胞和使用人工改造的酮還原酶來合成各種手性化合物的方法。
文檔編號C12N9/04GK101889081SQ200880118039
公開日2010年11月17日 申請日期2008年9月28日 優先權日2007年9月28日
發明者吉伽特·哈思曼, 傑克·梁, 波蒂·博勒普, 艾米麗·穆德弗, 詹姆士·拉隆德, 韋絲娜·米切爾 申請人:科德克希思公司

同类文章

一種新型多功能組合攝影箱的製作方法

一種新型多功能組合攝影箱的製作方法【專利摘要】本實用新型公開了一種新型多功能組合攝影箱,包括敞開式箱體和前攝影蓋,在箱體頂部設有移動式光源盒,在箱體底部設有LED脫影板,LED脫影板放置在底板上;移動式光源盒包括上蓋,上蓋內設有光源,上蓋部設有磨沙透光片,磨沙透光片將光源封閉在上蓋內;所述LED脫影

壓縮模式圖樣重疊檢測方法與裝置與流程

本發明涉及通信領域,特別涉及一種壓縮模式圖樣重疊檢測方法與裝置。背景技術:在寬帶碼分多址(WCDMA,WidebandCodeDivisionMultipleAccess)系統頻分復用(FDD,FrequencyDivisionDuplex)模式下,為了進行異頻硬切換、FDD到時分復用(TDD,Ti

個性化檯曆的製作方法

專利名稱::個性化檯曆的製作方法技術領域::本實用新型涉及一種檯曆,尤其涉及一種既顯示月曆、又能插入照片的個性化檯曆,屬於生活文化藝術用品領域。背景技術::公知的立式檯曆每頁皆由月曆和畫面兩部分構成,這兩部分都是事先印刷好,固定而不能更換的。畫面或為風景,或為模特、明星。功能單一局限性較大。特別是畫

一種實現縮放的視頻解碼方法

專利名稱:一種實現縮放的視頻解碼方法技術領域:本發明涉及視頻信號處理領域,特別是一種實現縮放的視頻解碼方法。背景技術: Mpeg標準是由運動圖像專家組(Moving Picture Expert Group,MPEG)開發的用於視頻和音頻壓縮的一系列演進的標準。按照Mpeg標準,視頻圖像壓縮編碼後包

基於加熱模壓的纖維增強PBT複合材料成型工藝的製作方法

本發明涉及一種基於加熱模壓的纖維增強pbt複合材料成型工藝。背景技術:熱塑性複合材料與傳統熱固性複合材料相比其具有較好的韌性和抗衝擊性能,此外其還具有可回收利用等優點。熱塑性塑料在液態時流動能力差,使得其與纖維結合浸潤困難。環狀對苯二甲酸丁二醇酯(cbt)是一種環狀預聚物,該材料力學性能差不適合做纖

一種pe滾塑儲槽的製作方法

專利名稱:一種pe滾塑儲槽的製作方法技術領域:一種PE滾塑儲槽一、 技術領域 本實用新型涉及一種PE滾塑儲槽,主要用於化工、染料、醫藥、農藥、冶金、稀土、機械、電子、電力、環保、紡織、釀造、釀造、食品、給水、排水等行業儲存液體使用。二、 背景技術 目前,化工液體耐腐蝕貯運設備,普遍使用傳統的玻璃鋼容

釘的製作方法

專利名稱:釘的製作方法技術領域:本實用新型涉及一種釘,尤其涉及一種可提供方便拔除的鐵(鋼)釘。背景技術:考慮到廢木材回收後再加工利用作業的方便性與安全性,根據環保規定,廢木材的回收是必須將釘於廢木材上的鐵(鋼)釘拔除。如圖1、圖2所示,目前用以釘入木材的鐵(鋼)釘10主要是在一釘體11的一端形成一尖

直流氧噴裝置的製作方法

專利名稱:直流氧噴裝置的製作方法技術領域:本實用新型涉及ー種醫療器械,具體地說是ー種直流氧噴裝置。背景技術:臨床上的放療過程極易造成患者的局部皮膚損傷和炎症,被稱為「放射性皮炎」。目前對於放射性皮炎的主要治療措施是塗抹藥膏,而放射性皮炎患者多伴有局部疼痛,對於止痛,多是通過ロ服或靜脈注射進行止痛治療

新型熱網閥門操作手輪的製作方法

專利名稱:新型熱網閥門操作手輪的製作方法技術領域:新型熱網閥門操作手輪技術領域:本實用新型涉及一種新型熱網閥門操作手輪,屬於機械領域。背景技術::閥門作為流體控制裝置應用廣泛,手輪傳動的閥門使用比例佔90%以上。國家標準中提及手輪所起作用為傳動功能,不作為閥門的運輸、起吊裝置,不承受軸向力。現有閥門

用來自動讀取管狀容器所載識別碼的裝置的製作方法

專利名稱:用來自動讀取管狀容器所載識別碼的裝置的製作方法背景技術:1-本發明所屬領域本發明涉及一種用來自動讀取管狀容器所載識別碼的裝置,其中的管狀容器被放在循環於配送鏈上的文檔匣或託架裝置中。本發明特別適用於,然而並非僅僅專用於,對引入自動分析系統的血液樣本試管之類的自動識別。本發明還涉及專為實現讀