酮還原酶及其用途的製作方法
2024-03-02 14:55:15 6
專利名稱::酮還原酶及其用途的製作方法酮還原酶及其用途1.相關申請的交叉引用本申請根據35U.S.C§119(e)要求2007年2月8日提交的申請序列號60/900,494和2007年2月8日提交的申請序列號60/900,430的權益,其內容在此通過引用併入。2.序列表、表格或電腦程式的引用根據37C.F.R.§1.821(c)與本申請同時提交的"序列表"和根據37C.F.R.§1.821(e)提交的序列表的計算機可讀形式(CRF)通過引用以其整體併入。提供了序列表的兩個拷貝,這兩個光碟的每一個上標記"拷貝1"和"拷貝2"。序列表的每個電子拷貝創建於2008年2月8日,具有221Kb的文件大小。文件名是Copyl-376247-015WO.txt和Copy2-376247-015WO.txt。通過引用在此併入的序列表和與其同時提交的序列表的CRF相同。3.背景屬於酮還原酶(KRED)或羰基還原酶類(EC1.1.1.184)的酶對從對應的前手性酮底物合成光學活性醇是有用的。KRED通常將酮底物轉化為對應的醇產物,但是還可以催化逆反應,將醇底物氧化為對應的酮/醛產物。酶,諸如KRED,對酮的還原和對醇的氧化需要輔因子,最普通地是還原型煙醯胺腺嘌呤二核苷酸(NADH)或還原型煙醯胺腺。票呤二核苷S交磷酸(NADPH)和用於氧化反應的煙醯胺腺。票呤二核苷酸(NAD)或煙醯胺腺嘌呤二核苷酸-疇酸(NADP)。NADH和NADPH作為電子供體,而NAD和NADP作為電子受體。經常觀察到酮還原酶和醇脫氫酶接受磷酸化或未磷酸化的輔因子(在其氧化和還原狀態下),但不同時接受它們。KRED酶可以在大範圍的細菌和酵母中發現(參見Kraus和Waldman,Enzymecatalysisinorganicsynthesis(有才幾合成中的酶催化),第1&2巻,VCHWeinheim1995;Faber,K.,說o加m,腸"'om'wc力e她訂(有機化學中的生物轉化),第4版Springer,BerlinHeidelbergNewYork.2000;Hummel和Kula五w./.說ocAe附.1989184:1-13)。已經淨艮道了幾種KRED基因和酶序列,例如木蘭假絲酵母(C朋^fomagw/^e)(Genbank登錄號JC7338;GI:11360538)、近平滑假絲酵母(Cam/wtopfifra;w,7ara)(Genbank登錄號BAA24528.1;GI:2815409)、赭色擲孢酵母(S;wra^/o/w_yc"■ra/wowco/or)(Genbank登錄號AF160799;GI:6539734)。為了避開製備關鍵化合物的許多化學合成過程,酮還原酶的使用在不斷增加,以將不同酮底物酶促轉化為手性醇產物。這些應用可以採用表達酮還原酶的全細胞用於生物催化的酮還原,或在其中多個酮還原酶的存在影響所需產物的特異性和收率的那些實例中採用純化酶。對於體外應用,輔因子(NADH或NADPH)再生酶,諸如葡糖脫氫酶(GDH)、甲酸脫氫酶等等,與酮還原酶聯合使用。使用酮還原酶製備有用的化合物的實例包括不對稱還原4-氯乙醯乙酸酯類(Zhou,J.力w.C&m.Soc.1983105:5925-5926;Santaniello,J.C/ze附.尺"(S)1984:132-133;美國專利第5,559,030號;美國專利第5,700,670號和美國專利第5,891,685號);還原二氧羧酸類(例如美國專利第6,399,339號);還原(S)氯-5-羥基-3-氧代己酸叔丁酯(例如美國專利第6,645,746號和WO01/40450);還原基於吡咯並三"秦的化合物(例如美國申請第2006/0286646號);還原取代的乙醯苯(例如美國專利第6,800,477號);以及還原羥基四氫噻吩(hydroxythiolanes)(WO2005/054491)。期望鑑別可用於執行多種酮底物向其對應的手性醇產物轉化的其他酮還原酶。本公開提供了工程或重組酮還原酶多肽,其能夠將化合物1-[4-(4-氟2-曱基-1^[-吲哚-5-基氧基)-5-曱基-吡咯並[2,1^[1,2,4]三嗪-6-基氧基]-丙-2-酮還原或轉化為對應產物U)1-[4-(4-氟-2-曱基-IH-吲哚-5-基氧基)-5-曱基吡咯並[2,1-f][1,2,4]三溱-6-基氧基]-丙-2-醇。該工程或重組酮還原酶還能夠將乙醯苯還原或轉化為(W)-l-苯基乙醇。在本文的實施方案中,該工程酮還原酶與天然存在的克菲爾乳桿菌(丄actc^ac,〃Mytey^)和短乳桿菌(丄ac/Mac/〃wZav/j)的野生型酮還原酶對比,在將底物轉化為產物方面具有一個或多個改善的性質。一方面,能夠將1-[4-(4-氟2-甲基-IH-吲哚-5-基氧基)-5-甲基-吡咯並[2,l-f][l,2,4]三。秦-6-基氧基-丙-2-酮轉化為對應產物(7)-1-[4-(4-氟-2-甲基-IH-吲哚-5-基氧基)-5-甲基吡咯並[2,1《[1,2,4]三嗪-6-基氧基]-丙-2-醇的重組多肽包括具有以下的胺基酸序列(1)對應於SEQIDNO:2或SEQIDNO:4的殘基94的胺基酸殘基處的芳族胺基酸或G,和/或(2)對應於SEQIDNO:2或SEQIDNO:4的殘基96的胺基酸殘基處的S和N之外的胺基酸殘基。在一些實施方案中,酮還原酶多肽包括與SEQIDNO:2或SEQIDNO:4具有至少約85%、86。/。、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的同一性的胺基酸序列,條件是對應於殘基94的殘基是芳族胺基酸殘基或G。該工程酮還原酶可任選地包括在所述胺基酸序列中的其他殘基位置上的一個或多個保守取代。在一些實施方案中,酮還原酶多肽包括與SEQIDNO:2或SEQIDNO:4具有至少90%胺基酸序列同一性的胺基酸序列,並且包括對應於SEQIDNO:2或SEQIDNO:4的殘基94的胺基酸殘基處的芳族胺基酸或G。在一些實施方案中,能夠將1-[4-(4-氟2-甲基-lH-吲哚-5-基氧基)-5-甲基-吡咯並[2,1^[1,2,4]三噪-6-基氧基]-丙-2-酮轉化為對應產物(尺)-1-[4-(4-氟-2-曱基-IH-吲哚-5-基氧基)-5-甲基吡咯並[2,1-£][1,2,4]三嗪-6-基氧基]-丙-2-醇的酮還原酶多肽可以包括具有與SEQIDNO:2或SEQIDNO:4的區域或其結構域(諸如殘基90-233)具有至少約85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或990/0的同一性的胺基酸序列的區域,條件是對應於殘基94的胺基酸殘基是芳族胺基酸殘基或G。在這些酮還原酶多肽的一些實施方案中,對應於SEQIDNO:2或SEQIDNO:4的殘基90-233的剩餘殘基中的一個或多個可具有保守取代。除了對應於SEQIDNO:2或SEQIDNO:4的殘基94的胺基酸殘基處的芳族胺基酸或G以外,能夠將化合物l-[4-(4-氟2-曱基-IH-吲哚-5-基氧基)-5-曱基-吡咯並[2,l-f][l,2,4]三。秦-6-基氧基]-丙-2-酮轉化為對應產物U)l-[4-(4-氟-2-甲基-IH-吲哚-5-基氧基)-5-甲基吡咯並[2,1《[1,2,4]三嗪-6-基氧基]-丙-2-醇的酮還原酶多肽還可包括選自以下的特徵中的一個或多個殘基96是S/N之外的任何胺基酸;殘基153是L之外的脂肪族胺基酸殘基;殘基199是L之外的任何胺基酸殘基;殘基202是G,或是A之外的脂肪族胺基酸殘基;以及殘基206是芳族胺基酸殘基。在一些實施方案中,在殘基94處具有指定的胺基酸的酮還原酶多肽可包括選自以下的下列附加特徵中的一個(on)或多個殘基49是K之外的極性胺基酸殘基;殘基53是酸性胺基酸殘基;殘基54是T/P之外的小的或脂肪族胺基酸殘基;殘基60是V之外的脂肪族胺基酸殘基;殘基95是V之外的脂肪族胺基酸;殘基97是小的胺基酸或G;殘基109是K之外的鹼性胺基酸殘基;殘基147是脂肪族胺基酸殘基;殘基165是羥基或小的胺基酸殘基;殘基197是小的胺基酸殘基或G;殘基223是L之外的脂肪族胺基酸殘基;以及殘基233是小的胺基酸殘基或G。在另一個方面中,能夠將化合物l-[4-(4-氟2-曱基-IH-吲哚-5-基氧基)-5-曱基-吡咯並[2,1力[1,2,4]三。秦-6-基氧基]-丙-2-酮轉化為對應產物(W)1_[4-(4-氟-2-曱基-IH-吲哚-5-基氧基)-5-甲基吡咯並[2,1-5][1,2,4]三嗪-6-基氧基]-丙-2-醇的重組酮還原酶多肽包括在對應於SEQIDNO:2或SEQIDNO:4的殘基96的胺基酸殘基處具有S和N之外的胺基酸的胺基酸序列。在一些實施方案中,這些重組酮還原酶多肽可包^"在對應於SEQIDNO:2或SEQIDNO:4的殘基96的胺基酸殘基處具有G、F、Y或I的絲酸序列。在一些實施方案中,該酮還原酶多肽包括與SEQIDNO:2或SEQIDNO:4具有至少約85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的同一性的胺基酸序列,條件是對應於殘基96的殘基是S和N之外的胺基酸殘基。該工程酮還原酶可任選地包括在胺基酸序列中的其他殘基位置上的一個或多個保守取代。在一些實施方案中,這些酮還原酶多肽可包括與SEQIDNO:2或SEQIDNO:4具有至少約85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的同一性的胺基酸序列,條件是對應於殘基96的殘基是G、F、Y或I。在一些實施方案中,能夠將1-[4-(4-氟2-甲基-IH-吲哚-5-基氧基)-5-曱基-吡咯並[2,1-5][1,2,4]三嗪-6-基氧基]-丙-2-酮轉化為對應產物(/0-1-[4-(4-氟-2-曱基-IH-吲哚-5-基氣基)-5-甲基吡咯並[2,1-1][1,2,4]三嗪-6-基氧基]_丙-2-醇的酮還原酶多肽可以包括具有與SEQIDNO:2或SEQIDNO:4的區域或其結構域(諸如殘基90-233)具有至少約85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的同一性的胺基酸序列的區域,條件是對應於殘基96的殘基是S和N之外的胺基酸殘基。在這些酮還原酶多肽的一些實施方案中,對應於SEQIDNO:2或SEQIDNO:4的殘基90-233的剩餘殘基中的一個或多個可具有保守取代。在一些實施方案中,酮還原酶多肽包括與SEQIDNO:2或SEQIDNO:4具有至少90%胺基酸序列同一性的胺基酸序列,並且包括在對應於SEQIDNO:2或SEQIDNO:4的殘基96的氣基酸殘基處的G、F、Y或I。這些工程酮還原酶可任選地包括在多肽序列中的其他殘基位置上的一個或多個保守突變。在一些實施方案中,除了在對應於SEQIDNO:2或SEQIDNO:4的殘基96的胺基酸殘基處的G、F、Y或I之外,能夠將化合物1-[4-(4-氟2-曱基-IH-吲哚-5-基氧基)-5-曱基-吡咯並[2,1-!][1,2,4]三嗪-6-基氧基]-丙-2-酮轉化為對應產物(W)1-[4-(4-氟-2-曱基-IH-吲哚-5-基氧基)-5-甲基吡咯並[2,l-fJ[l,2,4]三溱-6-基氧基]-丙-2-醇的酮還原酶多肽還可包括選自以下的特徵中的一個或多個殘基94是芳族胺基酸殘基或G;殘基153是L之外的脂肪族胺基酸殘基;殘基199是L之外的任何胺基酸殘基;殘基202是A之外的脂肪族胺基酸殘基;以及殘基206是芳族胺基酸殘基。在一些實施方案中,在殘基96處具有指定的胺基酸殘基的酮還原酶多肽可包括選自以下的特徵中的一個或多個殘基49是K之外的極性胺基酸殘基;殘基53是酸性胺基酸殘基;殘基54是T/P之外的小的或脂肪族胺基酸殘基;殘基60是V之外的脂肪族胺基酸殘基;殘基95是V之外的脂肪族胺基酸;殘基97是小的胺基酸或G;殘基109是K之外的鹼性胺基酸殘基;殘基147是脂肪族胺基酸殘基;殘基165是羥基或小的胺基酸殘基;殘基197是小的胺基酸殘基或G;殘基223是L之外的脂肪族胺基酸殘基;以及殘基233是小的胺基酸殘基或G。在一些實施方案中,能夠將化合物1-[4-(4-氟2-甲基-IH-吲哚-5-基氧基)-5-甲基-吡咯並[2,l-f][l,2,4]三嗪-6-基氧基]-丙-2-酮轉化為對應產物U)1_[4-(4-氟-2-曱基-IH-吲哚-5-基氧基)-5-甲基吡咯並[2,1-3[1,2,4]三嗪-6-基氧基]-丙-2-醇的酮還原酶多肽選自SEQIDNO:6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、48、50、52、54、56、58、60、62、64、66、68、70、72、74、76、78、80、82、84、86、88、90、92、94、96、98、100、102、104、106、108、110、112、114、116和118。如上所示,重組酮還原酶多肽還能將乙醯苯還原或轉化為對應產物(i^)-l-苯基乙醇。能夠將乙醯苯轉化為對應產物(W)1-苯基乙醇的其他多肽包括重組酮還原酶多肽,該重組酮還原酶多肽包括在對應於SEQIDNO:2或SEQIDNO:4的殘基96的胺基酸殘基處具有G、I、C或芳族胺基酸的胺基酸序列。在一些實施方案中,這些酮還原酶多肽可包括與SEQIDNO:2或SEQIDNO:4具有至少約85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95°/。、96%、97%、98%或99%的同一性的胺基酸序列,條件是對應於殘基96的殘基是G、I、C或芳族胺基酸。這些工程酮還原酶可任選地包括在多肽序列中的其他殘基位置上的一個或多個保守突變。在一些實施方案中,能夠將乙醯苯還原或轉化為對應產物(尺)-l-苯基乙醇的酮還原酶多肽可以包括具有與SEQIDNO:2或SEQIDNO:4的區域或其結構域(諸如殘基90-233)具有至少約85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的同一性的胺基酸序列的區域,條件是對應於殘基96的殘基是G、I、C或芳族胺基酸。在這些酮還原酶多肽的一些實施方案中,對應於SEQIDNO:2或SEQIDNO:4的殘基90-233的剩餘殘基中的一個或多個可具有保守取代。在一些實施方案中,酮還原酶多肽包括與SEQIDNO:2或SEQIDNO:4具有至少90%胺基酸序列同一性的胺基酸序列,並且包括在對應於SEQIDNO:2或SEQIDNO:4的殘基96的胺基酸殘基處的G、I、C或芳族胺基酸。在一些實施方案中,除了在對應於殘基96的胺基酸殘基處的G、I、C或芳族胺基酸之外,能夠將乙醯苯還原或轉化為對應產物(W)-l-苯基乙醇的酮還原酶多肽可包括選自以下的特徵中的一個或多個殘基94是芳族胺基酸殘基或G;殘基153是L之外的脂肪族胺基酸殘基;殘基199是L之外的任何胺基酸殘基;殘基202是A之外的脂肪族胺基酸殘基;以及殘基206是芳族胺基酸殘基。在一些實施方案中,能夠將乙醯苯還原或轉化為對應產物(i)-l-笨基乙醇的酮還原酶多肽可另外地包括選自以下的特徵中的一個或多個殘基49是K之外的極性胺基酸殘基;殘基53是酸性胺基酸殘基;殘基54是T/P之外的小的或脂肪族胺基酸殘基;殘基60是V之外的脂肪族胺基酸殘基;殘基95是V之外的脂肪族胺基酸;殘基97是小的胺基酸或G;殘基109是K之外的鹼性胺基酸殘基;殘基147是脂肪族胺基酸殘基;殘基165是羥基或小的胺基酸殘基;殘基197是小的胺基酸殘基或G;殘基223是L之外的脂肪族胺基酸殘基;以及殘基233是小的胺基酸殘基或G。在一些實施方案中,能夠將乙醯苯還原或轉化為對應產物(W)-l-苯基乙醇的酮還原酶多肽選自SEQIDNO:6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、48、50、52、54、56、58、60、62、64、66、68、70、72、74、76、78、80、82、84、86、88、90、92、94、96、98、100、102、104、106、108、110、112、114、116和118。在一些實施方案中,能夠將乙醯苯還原或轉化為對應產物(/)-l-苯基乙醇的酮還原酶多肽選自SEQIDNO:120、122、124、126、128、130、132、134、136和138。在另一個方面中,本公開提供編碼本文描述的工程酮還原酶的多核苷酸或與此類多核苷酸在高度嚴格條件下雜交的多核苷酸。該多核苷酸可包含用於表達所編碼的工程酮還原酶的啟動子和其他調節元件,並且可利用針對具體所需表達系統所優化的密碼子。示例性多核苷酸包括SEQIDNO:5、7、9、11、13、15、17、19、21、23、25、27、29、31、33、35、37、39、41、43、45、47、49、51、53、55、57、59、61、63、65、67、69、71、73、75、77、79、81、83、85、87、89、91、93、95、97、99、101、103、105、107、109、111、113、115、117、119、121、123、125、127、129、131、133、135和137。在再一個方面中,本公開提供包含本文描述的多核苷酸和/或表達載體的宿主細胞。這些宿主細胞可以是克菲爾乳桿菌或短乳桿菌,或它們可以是不同的生物體。這些宿主細胞可用於工程酮還原酶的表達和分離,或可選地,它們可直接用於將酮底物轉化為手性醇產物。如本領域技術人員所了解,以上闡述的還原反應一般需要輔因子,其通常為NADH或NADPH,並且該還原反應可包括用於再生該輔因子的系統,例如葡萄糖和葡糖脫氫酶。在使用純化的工程酮還原酶的一些實施方案中,此類輔因子和任選地此類輔因子再生系統,通常將與底物和酮還原酶一起添加到反應介質中。與工程酮還原酶類似,包含輔因子再生系統的任何酶可以此類細胞的提取物或溶解產物形式,或作為純化的酶提供於反應混合物。在使用細胞提取物或細胞溶解產物的實施方案中,用於產生提取物或溶解產物的細胞可設計為表達僅含有輔因子再生系統或含有輔因子再生系統連同工程酮還原酶的酶。在使用全細胞的實施方案中,該細胞可"i殳計為表達含有輔因子再生系統連同工程酮還原酶的酶。不論用全細胞、細胞提取物或純化的酮還原酶執行所述方法,可使用單一酮還原酶,或可選地,可使用兩種或更多種酮還原酶的混合物。在不同的實施方案中,工程酶可執行具有對映選擇性>99%的程度的還原或轉化反應。因此,以上的反應可用作標準反應來評價與參考酮還原酶(諸如SEQIDNO:2或SEQIDNO:4的酮還原酶)相比的工程酮還原酶的活性。在一些實施方案中,因為本文描述的工程酮還原酶具有高度的立體選擇性,所以得到的產物結構式(II)("化合物(II),,)或結構式(IV)("化合物(IV)")可以大致立體化學純的形式回收,而不需要將它與對應的對映體手性分離。5.附圖簡述圖1闡明酮還原酶在將確定的底物化合物(I)轉化為手性醇產物化合物(IT)中的作用。該圖還顯示包含葡糖脫氪酶(GDH)和葡萄糖的輔因子再生系統的使用。圖2闡明酮還原酶在將確定的底物化合物(III)轉化為手性醇產物化合物(IV)中的作用。該圖還顯示包含葡糖脫氫酶(GDH)和葡萄糖的輔因子再生系統的使用。6.詳細描述如本說明書和所附的權利要求所用,單數形式"一個"、"一種"和"所述"包括複數指示物,除非上下文中另外清晰地指出。因此,例如,所提及的"一種蛋白質"包括多於一種蛋白質,且所提及的"一個化合物"指.多於一個化合物。此外,除非另外陳述,否則使用"或,,指"和/或"。相寸以;也,"包4舌(comprise)"、"包3舌(comprises)"、"包者舌(comprising)"、"包含(include),,、"包含(includes),,和"包含(including),,可相互交換,並且無意限制。應進一步理解,當多個實施方案的描述^f吏用術語"包括"時,本領域技術人員應理解為在一些具體情況下,一個實施方案可可選地使用語句"主要由...組成"或"由…組成"來描述。本文使用的章節標題僅為了組織目的,並且不解釋為限制所描述的主題。6.1定義如本文所用,以下術語意在具有以下含義。"酮還原酶"和"KRED,,在本文中可相互交換使用以指能夠將酮基還原為其對應的醇的多肽。更加具體地,本公開的酮還原酶多肽能夠立體選擇性地將上述的式(n的化合物還原為上述式(ii)的醇產物(參見圖i)和/或將上述式(in)的化合物還原為式(iv)的醇產物(參見圖2)。該多肽通常利用輔因子還原型煙醯胺腺噪呤二核香酸(NADH)或還原型煙醯胺腺。票呤二核普酸磷酸(NADPH)作為還原劑。如本文所用,酮還原酶包括天然存在的(野生型)酮還原酶以及由人工處理產生的非天然存在的工程多肽(即重組多肽)。"編碼序列"指編碼蛋白質的胺基酸序列的那部分核酸(例如基因)。"天然存在的"或"野生型"指在自然界中發現的形式。例如,天然存在的或野生型多肽或多核苷S交序列是存在於生物體的序列,它可以從自然界中的來源分離,並且沒有被人工處理所特意地修飾。當使用涉及例如,細胞、核酸或多肽時,"重組"指已經以自然界中未存在的方式修飾的,或與其相同,但是是由合成材料和/或通過使用重組技術的處理製備或衍生的材料,或對應於材料的天然或固有形式的材料。其中,非限制性的實例包括表達在細胞的固有(非重組)形式中未發現的基因或表達以不同水平另外表達的固有基因的重組細胞。"序列同一性的百分比"和"百分比同源性"在本文中可互換使用以指多核苷酸和多肽之間的對比,並且通過在對比^L窗(comparisonwindow)對比兩個最佳比對序列來確定,其中在對比視窗中的多核苷酸或多肽序列部分與用於兩條序列的最佳比對的參考序列(其不包含添加或缺失)對比,可包含添加或缺失(即缺口)。該百分比可通過以下計算確定相同核酸鹼基或胺基酸殘基在兩個序列都存在的位置數以產生匹配位置數,將匹配位置數除以對比視窗中位置的總數,並用100乘以結果以產生序列同一性的百分比。可選地,該百分比可通過以下計算確定相同核酸鹼基或胺基酸殘基在兩個序列都存在或核酸鹼基或胺基酸殘基與缺口比對的位置數以產生匹配位置數,該匹配位置數除以對比視窗中的位置總數,並用100乘以結果以產生序列同一性的百分比。本領域技術人員應理解,有許多可用於比對兩個序列的確定的算法。用於對比的序列的最佳比對可通過以下進行例如Smith和Waterman的局部同源性算法,1981,Xt/v.A勿仇2:482,Needl函n和Wunsch的同源性比對算法,1970,/.M/.脂.48:443,Pearson和Lipman的相似性4臾索方法,1988,屍rac.jV^/.Sc.85:2444,通過這些算法的計算機化執行(GCGWisconsin軟體包中的GAP、BESTFIT、FASTA和TFASTA),或目觀'J(一屏§:參見Cw/re",Pratoco/swMo/ecwtor別o/ogy(最新分子生物學實驗方法彙編),RM.Ausubel等人編,CurrentProtocols,GreenePublishingAssociates,Inc.和JohnWiley&Sons,Inc.之間的合資企業,(1995補充)(Ausubel))。適合於確定百分比序列同一性和序列相似性的算法的實例是BLAST和BLAST2.0算法,它們分別描述於Altschul等人,1990,丄M/.倫/.215:403-410和Altschul等人,1977,M/c/e/cv4cz必ites.3389-3402。用於執行BLAST分析的軟體是通過美國國家生物技術信息中心的網站公共可用的。這一算法包括首先通過鑑別查詢序列中長度W的短字來鑑別高分序列對(HSP),所述短字與資料庫序列中相同長度的字比對時匹配或滿足一些正值閥值得分T。T稱為鄰近字得分閥值(Altschul等人,同上)。這些起始鄰近字匹配字串(wordhits)作為啟動搜索的種子以尋找含有它們的更長HSP。然後,將字匹配字串沿著每個序列的兩個方向延伸,直到累積比對得分可以被增加。對於核苷酸序列,使用參數M(匹配殘基對的獎勵得分;總是〉0)和N(錯配殘基的罰分;總是O)計算累積得分。對於胺基酸序列,得分矩陣用於計算累積得分。當以下情況時,每個方向中的字匹配字串的延伸被終止累積比對得分從其最大達到值下降了量X;由於累積一個或多個負得分殘基比對,累積得分達到0或以下;或到達任一序列末端。BLAST算法參數W、T和X確定比對的敏感度和速度。BLASTN程序(針對核苷酸序列)使用字長(W)11、期望值(E)10、M=5、N=-4以及兩條鏈的對比作為默認值。針對胺基酸序列,BLASTP程序使用字長(W)3、期望值(E)10和BLOSUM62得分矩陣(參見Henikoff和Henikoff,1989,PracAto"c"dSc/89:10915)作為默認值。序列比對和%序列同一性的示例性確定可使用GCGWisconsin軟體包(Accelrys,MadisonWI)中的BESTFIT或GAP程序,使用所提供的默認參數。"參考序列"指用於作為序列對比的基礎的確定序列。參考序列可以是較大序列的子集,例如全長基因或多肽序列的區段。一般來說,參考序列為至少20個核苷酸或氬基酸殘基長度、至少25個殘基長度、至少50個殘基長度或核酸或多肽的全長。由於兩個多核苷酸或多肽可能各自(I)包含在兩個序列之間相似的序列(即完整序列的一部分),並且(II)可進一步包括兩個序列之間不同的序列,因此兩個(或更多個)多核苷酸或多肽之間的序列對比通常通過對比"對比視窗"上兩個多核苦酸的序列以鑑別並比較序列相似性的局部區域來進行。"對比視窗"指至少約20個連續核苷酸位置或胺基酸殘基的概念區段,其中序列可以與至少20個連續核苷酸或胺基酸的參考序列對比,並序列(其不包含添加或缺失)相比,20%或更少的添加或缺失(即缺口)。對比視窗可以比20個連續的殘基更長,並且包括任選地30、40、50、100個或更長的視窗。"大致同一性"指在至少20個殘基位置對比視窗內、通常在至少30-50個殘基的視窗內與參考序列對比,具有至少80%的序列同一性、至少85%的序列同一性和89%至95%的序列同一性,更加常見地至少98%的序列同一性、至少99%的序列同一性或至少99.5。/。或更高的序列同一性的多核苷酸或多肽序列,其中序列同一性的百分比是通過在對比^見窗內對比參考序列和包括總計為參考序列的20%或更少缺失或添加的序列來計算。在應用於多肽的具體實施方案中,術語"大致同一性"指當諸如通過程序GAP或BESTFIT,使用默認缺口權重進行最佳比對時,兩個多肽序列共享至少80%的序列同一性、優選至少89%的序列同一性、至少95%的序列同一性、至少98%的序列同一性或至少99%的序列同一性。優選地,不同的殘基位置因保守tt酸取代而不同。當在給定的胺基酸或多核苷酸序列的編號的內容中使用時,"對應土"、"參考"或"相對於"指當給定的胺基酸或多核苷酸序列與指定的參考序列對比時,所述參考序列的殘基的編號。換言之,給定聚合體的殘基編號或殘基位置是根據參考序列指定的,而不是通過給定胺基酸或多核苷酸序列中殘基的實際編號位置指定。例如,給定的氛基酸序列,諸如工程酮還原酶的胺基酸序列,可通過導入缺口來與參考序列比對以優化兩個序列之間的殘基匹配。在這些情況下,儘管存在缺口,給定胺基酸或多核苷酸序列中的殘基根據其已經比對的參考序列進行編號。"立體選擇性"指一個立體異構體與另一個立體異構體相比在化學或酶促反應中的優先形成。立體選擇性可以是部分的,其中一個立體異構體的形成相對另一立體異構體是有利的,或其可以是完全的,其中僅形成一個立體異構體。當立體異構體是對映體時,立體選擇性稱為對映選擇性,一個對映體在兩個總和中的比例(通常報導為百分比)。其在本領域中一般報導(通常為百分比)為根據式[主要對映體-次要對映體]/[主要對映體+次要對映體]從中計算的對映體過量。如果立體異構體是非對映異構體,則立體選擇性稱為非對映選擇性,一個非對映體在它與其他非對映體的總和中的比例(通常^Jt為百分比)。"高度立體選擇性"指能夠以至少約85%的立體異構體過量將底物轉化或還原為具有化學式(II)的對應產物的酮還原酶多肽。"立體特異性"指化學或酶促反應中一個立體異構體超過另一個的優先轉化。立體特異性可以是部分的,其中一個立體異構體的轉化相對另一立體異構體是有利的,或它可以是完全的,其中僅轉化一個立體異構體。"改善的酶性質"指與參考酮還原酶相比在任何的酶性質方面表現出改善的酮還原酶多肽。對於本文描述的工程酮還原酶多肽,通常與野生型酮還原酶進行對比,儘管在一些實施方案中,參考酮還原酶可以是另一個改善的工程酮還原酶。需要改善的酶性質包括但不限於,酶促活性(其可以根據底物的轉化百分比來表達)、熱穩定性、pH活性特徵(profile)、輔因子需求、對抑制劑(例如產物抑制)的不應性(refractoriness)、立體特異性和立體選擇性(包括對映選擇性)。"增加的酶促活性"指工程酮還原酶多肽的改善的性質,其可以表示為與參考酮還原酶對比,比活性(例如所產生的產物/時間/重量蛋白)的增加,或底物轉化為產物的百分比(例如使用指定量的KRED時,起始量的底物在指定的時間段內轉化為產物的百分比)的增加。在實施例中提供確定酶活性的示例性方法。可能影響涉及酶活性的任何性質,包括典型的酶性質fw、K皿或yU,,它們的變化可導致酶促活性的增加。酶活性的改善可以是從對應野生型酮還原酶的酶促活性的約1.5倍,至超過所述酮還原酶多肽書f生自的天然存在的酮還原酶或另一個工程酮還原酶的酶促活性多達2倍、3倍、4倍、5倍、10倍、20倍、25倍、50倍、75倍、100倍或更多。在具體的實施方案中,工程酮還原酶可表現出改善的酶促活性,其範圍是比母體酮還原酶的酶促活性大1.5至50倍,1.5至100倍。本領域技術人員應理解,任何酶的活性是擴散限制的,以致底物(包括任何所需的輔因子)的催化周轉速率不可能超過擴散速率。擴散限制的理論最大值,或^。Z^,一般是約108至109(M"s")。因此,酮還原酶的酶活性的任何改善將具有與酮還原酶所作用的底物的擴散速率有關的上限。酮還原酶活性可通過測量酮還原酶所用的標準測定中的任何一個來測量,諸如測量由於伴隨酮還原成醇的NADPH氧化導致的NADPH吸光度或螢光降低,或通過在偶聯測定中所產生的產物來測量。如本文中進一步詳細地描述,使用確定的酶製品、在設定條件下的確定測定和一個或多個確定的底物進行酶活性的對比。一般來說,當對比溶解產物時,確定細胞的數量和所測定的蛋白質的量,並使用相同表達系統和相同宿主細胞,以使宿主細胞所產生的和在溶解產物中存在的酶的量的變化最小化。"轉化"指將底物酶促轉化為對應產物。"轉化百分比"指在指定的條件下在一定時間段內還原為產物的底物的百分比。因此,酮還原酶多肽的"酶促活性"或"活性"可以表達為底物至產物的"轉化百分比"。"熱穩定"指在暴露於升高的溫度(例如40-80°C)—段時間(例如0.5-24小時)後,與未處理的酶對比,維持相似的活性(例如超過60%至80%,或更多)的酮還原酶多肽。"溶劑穩定"指在暴露於變化濃度(例如5-99%)的溶劑(例如異丙醇、四氫呋喃、2-甲基四氫呋喃、丙酮、甲苯、醋酸丁酯、曱基叔丁基醚等等)或溶劑混合物一段時間(例如0.5-24小時)後,與未處理的酶對比,維持相似的活性(超過例如60%至80%)的酮還原酶多肽。"。H穩定"指在暴露於高或低pH(例如4.5-6或8至12)—段時間(例如0.5-24小時)後,與未處理的酶對比,維持相似的活性(超過例如60%至80%)的酮還原酶多肽。"熱和溶劑穩定"指熱穩定和溶劑穩定的酮還原酶多肽。如本文的工程酮還原酶的內容中所用,"衍生自"鑑別工程所依靠的起始酮還原酶和/或編碼此類酮還原酶的基因。例如,通過多代人工進化編碼SEQIDNO:2的克菲爾乳桿菌酮還原酶的基因來獲得SEQIDNO:10的工程酮還原酶。因此,這一工程酮還原酶"衍生自"SEQIDNO:2的野生型酮還原酶。"親水胺基酸或殘基"指具有表現出根據Eisenberg等人,1984,J.Mo/.說o/.179:125-142的標準化統一疏水性標度,疏水性小於零的側鏈的胺基酸或殘基。遺傳編碼的親水胺基酸包括L-Thr(T)、L-Ser(S)、L-His(H)、L-Glu(E)、L-Asn(N)、L誦Gln(Q)、L-Asp(D)、L-Lys(K)和L-Arg(R)。"酸性胺基酸或殘基"指當胺基酸包含於肽或多肽時,具有表現出小於約6的pK值的側鏈的親水胺基酸或殘基。在生理pH下,酸性胺基酸由於缺失了氫離子而通常具有帶負電的側鏈。遺傳編碼的酸性胺基酸包括L-Glu(E)和L-Asp(D)。"鹼性胺基酸或殘基"指當胺基酸包含於肽或多肽時,具有表現出大於約6的pK值的側鏈的親水胺基酸或殘基。在生理pH下,鹼性胺基酸由於與水合氫離子締合而通常具有帶正電的側鏈。遺傳編碼的鹼性胺基酸包括L-Arg(R)和L-Lys(K)。"極性胺基酸或殘基"指具有生理pH下不帶電的側鏈的親水胺基酸或殘基,但該側鏈具有其中兩個原子共享的電子對維持為更加接近所述原子之一的至少一個鍵。遺傳編碼的極性胺基酸包括L-Asn(N)、L-Gln(Q)、L-Ser(S)和L醫Thr(T)。"疏水胺基酸或殘基"指具有表現出根據Eisenberg等人,1984,丄M>/.fi/o/.179:125-142的標準化統一疏水性標度,疏水性大於零的側鏈的胺基酸或殘基。遺傳編碼的疏水胺基酸包括L-Pro(P)、L-Ile(I)、L-Phe(F)、L-Val(V)、L畫Leu(L)、L-Trp(W)、L-Met(M)、L-Ala(A)和L-Tyr(Y)。"芳族胺基酸或殘基"指具有包含至少一個芳族環或雜芳族環的側鏈的親水或疏水胺基酸或殘基。遺傳編碼的芳族胺基酸包括L-Phe(F)、L-Tyr(Y)和L-Trp(W)。儘管由於L-His(H)的雜芳族氮原子的pKa,其有時被分類為鹼性殘基,或因為其側鏈包含雜芳族環而分類為芳族殘基,但本文中組氨酸被分類為親水殘基或為"限制殘基"(見下文)。"限制胺基酸或殘基"指具有限制幾何學的胺基酸或殘基。本文中,限制殘基包括L-pro(P)和L-his(H)。組氨酸具有限制幾何學,是因為其具有相對小的咪唑環。脯氨酸具有限制幾何學,也是因為其也具有五元環。"非極性胺基酸或殘基"指具有生理pH下不帶電的側鏈的疏水胺基酸或殘基,並且該側鏈具有其中兩個原子共享的電子對一般由兩個原子中的每一個平等維持的鍵(即側鏈是非極性的)。遺傳編碼的非極性胺基酸包括L-Gly(G)、L-Leu(L)、L-Val(V)、L扁Ile(I)、L-Met(M)和L扁Ala(A)。"脂肪族胺基酸或殘基"指具有脂肪烴側鏈的疏水胺基酸或殘基。遺傳編碼的脂肪族胺基酸包括L-Ala(A)、L-Val(V)、L-Leu(L)和L-Ile(1)。"半胱氨酸"。胺基酸L-Cys(C)不常見,原因是其可與其他L-Cys(C)M酸或其他含有硫烷基或硫氫基的胺基酸形成二硫鍵。"半胱氨酸樣殘基"包括半胱氨酸和含有可用於形成二硫鍵的硫氫基部分的其他胺基酸。L-Cys(C)(和具有含-SH的側鏈的其他胺基酸)以還原的游離-SH或氧化的二裙a建形式存在於肽中的能力影響L-Cys(C)是否對肽貢獻淨疏水或親水特徵。雖然根據Eisenberg(Eisenberg等人,1984,同上)的標準化統一標度,L-Cys(C)表現為0.29的疏水性,^f旦應理解,對於本公開的目的,L-Cys(C)其自身單獨劃分為一組。"小的胺基酸或殘基"指具有包含總計三個或更少的碳和/或雜原子(排除a-碳和氫)的側鏈的胺基酸或殘基。根據以上定義,小的胺基酸或殘基可進一步分類為脂肪族、非極性、極性或酸性的小的胺基酸或殘基。遺傳編碼的小胺基酸包括L-Ala(A)、L畫Val(V)、L-Cys(C)、L-Asn(N)、L-Ser(S)、L畫Thr(T)和L-Asp(D)。"含有羥基的胺基酸或殘基"指含有羥基(-OH)部分的胺基酸。遺傳編碼的含有羥基的胺基酸包括L-Ser(S)、L-Thr(T)和L-Tyr(Y)。"保守"胺基酸取代或突變指具有相似側鏈的殘基的可交換性,因此通常包括用屬於相同或相似的胺基酸定義類型的胺基酸取代多肽中的胺基酸。然而,如本文所用,保守突變不包括從親水殘基到親水殘基、從疏水殘基到疏水殘基、從含有羥基的殘基到含有羥基的殘基或從小殘基到小殘基的取代,如果保守突變可以替代地是從脂肪族殘基到脂肪族殘基、從非極性殘基到非極性殘基、從極性殘基到極性殘基、從酸性殘基到酸性殘基、從鹼性殘基到鹼性殘基、從芳族殘基到芳族殘基或限制殘基到限制殘基的取代。此外,如本文所用,可將A、V、L或I保守地突變為另一個脂肪族殘基或另一個非極性殘基。下表顯示示例性保守取代。tableseeoriginaldocumentpage23"非保守取代"指用側鏈性質顯著不同的胺基酸取代或突變多肽中的胺基酸。非保守取代可使用以上列出的定義組之間的胺基酸,而不是屬於一組的胺基酸。在一個實施方案中,非保守突變影響(a)取代區域內肽主鏈的結構(例如脯氨酸取代甘氨酸)(b)電荷或疏水性,或(c)側鏈的體積(bulk)。"缺失"指通過去除參考多肽的一個或多個胺基酸來修飾多肽。缺失可包^"去除組成參考酶的1、2、3、4、5個或更多個胺基酸、IO個或更多個胺基酸、15個或更多個胺基酸、20個或更多個氛基酸、多達胺基酸總數的10%或多達胺基酸總數的20%,而仍舊保持酶促活性和/或保持工程酮還原酶的改善的性質。缺失可針對多肽的內部部分和/或末端部分。在不同的實施方案中,缺失可包括連續的區段或可以是不連續的。"插入"指通過向參考多肽添加一個或多個胺基酸來修飾多肽。在一些實施方案中,改善的工程酮還原酶包括向天然存在的酮還原酶多肽插入一個或多個胺基酸,以及向其他的工程酮還原酶多肽插入一個或多個胺基酸。可以在多肽的內部部分插入,或插入到羧基或氨基末端。如本文所用,插入包括本領域所知的融合蛋白。插入可以是連續的胺基酸區段,或被天然存在的多肽中的一個或多個胺基酸隔開。關於指定的參考序列,"不同於(differentfrom)"或"不同於(differsfrom)"指當與參考序列比對時,給定胺基酸或多核苷酸序列的差異。一般來說,當最佳比對兩個序列時,可確定差異。差異包括與參考序列對比時,胺基酸殘基的插入、缺失或取代。如本文所用,"片段"指具有氨基末端和/或羧基末端缺失,但其中剩餘的胺基酸序列與序列中的對應位置相同的多肽。片段可以是至少14個胺基酸長、至少20個胺基酸長、至少50個胺基酸長或更長,和多達全長參考序列的70%、80%、90%、95%、98%和99%,所述參考序列諸如野生型(SEQIDNO:2或SEQIDNO:4)或工程酮還原酶多肽。"分離的多肽"指與天然伴隨多肽的其他雜質(如蛋白質、脂質和多核苷酸)大致分離的多肽。該術語包括已經從多肽的天然存在的環境或表達系統(例如宿主細胞或體外合成)中移出或純化的多肽。改善的酮還原酶可存在於細胞中、存在於細胞培養基(cellularmedium)中,或以不同的形式製備,諸如溶解產物或分離的製品。因此,在一些實施方案中,改善的酮還原酶可以是分離的多肽。"大致純的多肽"指一種組合物,其中多肽物類是存在的主要物類(即根據摩爾或質量,它比組合物中的任何其他單個大分子物類更豐富),並且當目標物類以摩爾或。/。重量計包括存在的大分子物類的至少約50%時,該組合物一般是大致純化的組合物。一般來說,大致純的酮還原酶組合物按摩爾或%重量計,將包括存在於組合物中所有大分子物類的約60%或更多、約70%或更多、約80%或更多、約90%或更多、約95%或更多和約98%或更多。在一些實施方案中,將目標物類純化為基本同質(即在組合物中通過常規檢測方法不能檢測到雜質物類),其中該組合物基本上由單一大分子物類組成。溶劑物類、小分子(值可使用用於預測解鏈溫度的已知方法來計算(參見例如Baldino等人,MeAo必五"z;/附o/ogv168:761-777;Bolton等人,1962,屍rac.TV"/.[7&448:1390;Bresslauer等人,1986,TV""."&483:8893-8897;Freier等人,1986,Ato/.爿o^.[/&483:9373-9377;Kierzek等人,說oc/2e脂;^y25:7840-7846;Rychlik等人,1990,油c/e/c爿c/tfeh18:6409-6412(勘誤,1991,A^c/e,cj"'tfcto19:698);Sambrook等人,同上);Suggs等人,1981,在Deve/o/mew/a/Ao/ogyW,"gP譜:/WGe"^(使用純化基因的發育生物學)(Brown等人編)中,第683-693頁,AcademicPress;和Wetmur,1991,O,Yitev說0c/2e附A/o/說o/26:227-259。所有出版物在此通過引用併入)。在一些實施方案中,多核苷酸編碼本文公開的多肽,並且在確定條件(諸如適度嚴格或高度嚴格條件)下雜交於編碼本公開的工程酮還原酶的序列的互補序列。"雜交嚴格性"指核酸的這種洗滌條件。一般來說,雜交反應在較低嚴格性條件下進行,隨後在變化的但是較高的嚴格性下洗滌。術語"適度嚴格雜交"指允許目標多核普酸結合互補多核苷酸的條件,所述互補多核苷酸與目標多核苦酸具有約60%的序列同一性、約75%的序列同一性、約85%的序列同一性、約90%的序列同一性或具有約95%或更高的序列同一性。示例性適度嚴格條件是等同於在42。C下在50%甲醯胺、5xDenhart溶液、5xSSPE、0.2%SDS中雜交,隨後在42。C下在0.2xSSPE、0.2%SDS中洗塗的條件。"高度嚴格性雜交"一般指如在確定的多核苷酸序列的溶解條件下所確定的,比熱解鏈溫度Tm低約l(TC或更少的條件。在一些實施方案中,高度嚴格性條件指僅允許在65°C下0.018MNaCl中形成穩定雜交體的那些核酸序列雜交的條件。(即如果雜交體在65。C下0.018MNaCl中不穩定,那麼它在高度嚴格性條件下也是不穩定的,諸如本文所涵蓋)。例如,可通過以下提供高度嚴格性條件在等同於42。C下50。/o曱醯胺、5xDenhart溶液、5xSSPE、0.2%SDS的條件下雜交,隨後在65。C下在O.lxSSPE和0.iy。SDS中洗滌。其他高度嚴格性雜交條件,以及適度嚴格條件在以上引用的參考文獻中描述。"異源"多核香酸指通過實驗室技術導入宿主細胞的任何多核苷酸,並且包括從宿主細胞移出,進行實驗室處理,然後再次導入宿主細胞的多核苷酸。"優化的密碼子"指編碼蛋白質的多核苷酸的密碼子變化為在特定生物體中優先使用的密碼子,以便所編碼的蛋白質在關注的生物體中被有效地表達。儘管遺傳密碼是簡併的,即大多數胺基酸是由幾個稱為"同義(sy麵yms)"或"同義(synonymous)"密碼子的密碼子代表,但已公知特定生物體對密碼子的使用是非隨機的並且偏倚於特定的密碼子三聯體。對於給定基因、共同功能或祖先起源的基因、相對低拷貝數的蛋白質高度表達的蛋白質,以及生物體的基因組的聚集蛋白質編碼區,這一密碼子使用偏倚可能更高。在一些實施方案中,編碼酮還原酶的多核香酸可能為了從選擇用於表達的宿主生物體的最佳生產而進行了密碼子優化。"優選的、最佳、高度密碼子使用偏倚密碼子"互換地指在蛋白質編碼區中比編碼相同胺基酸的其他密碼子使用頻率更高的密碼子。優選密碼子的確定可與以下有關單個基因、具有共同功能或起源的一組基因、高度表達的基因中的密碼子使用;整個生物體的聚集蛋白質編碼區中的密碼子頻率;相關生物體的聚集蛋白質編碼區中的密碼子頻率或其組合。頻率隨基因表達水平增加的密碼子通常是用於表達的最佳密碼子。已知用於確定具體生物體中密碼子頻率(例如密碼子使用、相對同義密碼子使用)和密碼子喜好的多種方法,包括多變量分析(multivariatanalysis),例如使用聚類分析或對應分析,以及在基因中所用的密碼子的有效數(參見GCGCodon—Preference,GeneticsComputerGroupWisconsinPackage;CodonW,JohnPeden,UniversityofNottingham;Mclnerney,J.O,1998,Bioinformatics14:372-73;Stenico等人,1994,NucleicAcidsRes.222437-46;Wright,F.,1990,Gene87:23-29)。具有可用的密碼子使用表的生物體的列表在不斷增加(參見例如Wada等人,1992,7Vwc/e/cJc,A20:2111-2118;Nakamura等人,2000,M/c/.爿"&i^s.28:292;Duret等人,同上;Henaut和Danchin,"£^c/2er/c//aco/z'ow(iSa/AW6we〃a(大腸4幹菌和沙、門氏菌)",1996,Neidhardt等人編,ASMPress,WashingtonD.C.,第2047-2066頁)。用於獲得密碼子使用的數據源可依賴於能夠編碼蛋白質的任何可用核芬酸序列。這些數據集包括實際已知編碼表達的蛋白質(例如完全蛋白質編碼序列-CDS)、表達的序列標籤(ESTS)或基因組序列的預測編碼區的核酸序列(參見例:i口Mount,D.,SegwewceJwa/>ww(生4勿"f言息,學序列和基因組分析),第8章,ColdSpringHarborLaboratoryPress,ColdSpringHarbor,N.Y.,2001;Uberbacher,E.C.,1996,她Acxis'i"z拜o/.266:259-281;Tiwari等人,1997,J///.說osc13:263-270)。本文定義的"控制序列"包括對本公開的多肽的表達必需的或有利的所有組分。對於編碼多肽的核酸序列,每個控制序列可以是固有的或外源的。這種控制序列包括但不限於,前導區、聚腺苷酸化序列、前肽序列、啟動子、信號肽序列和轉錄終止子。至少,控制序列包括啟動子,以及轉錄和翻譯終止信號。控制序列可提供有連接體,以便導入促進所述控制序列與編碼多肽的核酸序列的編碼區連4妻的具體限制位點。本文定義的"可操作地連接"為一種構型,其中控制序列適當地置於相對於多核苷酸序列的編碼序列的位置,以便控制序列指導或影響該多核苷酸編碼的多核芬酸和/或多肽的表達。"啟動子序列"是由用於表達多核苷酸(諸如含有編碼區的多核苷酸)的宿主細胞所識別的核酸序列。一般來說,啟動子序列包括介導多核苷酸的表達的轉錄控制序列。啟動子可以是在選擇的宿主細胞中表現出轉錄活性的任何核酸序列,包括突變、截短和雜合啟動子,並且可以從宿主細胞的同源或異源的編碼細胞外或細胞內多肽的基因獲得。"輔因子再生系統"指參與還原氧化形式的輔因子的反應(例如NADP+到NADPH)的一組反應物。由酮還原酶催化的酮底物的還原所氧化的輔因子通過輔因子再生系統再生為還原形式。輔因子再生系統包括化學計量的還原劑,它是還原氫等同物的來源,並且能夠還原氧化形式的輔因子。輔因子再生系統可進一步包括催化劑,例如酶催化劑,它催化還原劑還原氧化形式的輔因子。從NAD+或NADP+分別再生NADH或NADPH的輔因子再生系統為本領域所知,並且可用於本文描述的方法中。6.2酮還原酶本公開提供能夠將確定的酮底物還原或轉化為其對應的醇產物的工程或重組酮還原酶("KRED"),並且該酶當與從克菲爾乳桿菌或短乳桿菌獲得的天然存在的野生型酮還原酶或另一種參考酮還原酶(諸如另一種工程酮還原酶)比較時,具有改善的性質。如下文進一步討論,在本文的實施方案中,重組酮還原酶多肽能夠將如式(I)的結構所代表的底物1-[4-(4-氟-2-曱基-lH-吲哚-5-基氧基)-5-曱基-吡咯並[2,1-幻[1,2,4]三嗪-6-基氧基]-丙-2-酮立體選擇性地還原或轉化為如式(II)的結構所代表的產物(尺)-1-[4-(4-氟-2-甲基-lH-吲哚-5-基氧基)-5-甲基-吡咯並[2,1-51[1,2,4]三嗪-6-基氧基]-丙-2-醇。與天然存在的克菲爾乳桿菌或乳酸桿菌(LactoMc/〃wto"7/z^)的酮還原酶相比,該酮還原酶在將式(I)的底物轉化為式(II)的產物方面具有改善的性質。如下文進一步討論,在一些實施方案中,重組酮還原酶多肽還能夠將如結構式(III)所代表的底物乙醯苯還原或轉化為如結構式(IV)所代表的手性醇產物(i)l-苯基乙醇。因此,使用底物1-[4-(4-氟-2-甲基-1&吲味-5-基氧基)-5-甲基-吡咯並[2,1《[1,2,4]三嗪-6-基氧基]-丙-2-酮或乙醯苯,或兩者,可對比工程酮還原酶和參考酮還原酶。在一些實施方案中,當對比工程酮還原酶和參考酮還原酶(例如SEQIDNO:2或SEQIDNO:4)的活性時,一種參考底物(例如1-[4-(4-氟-2-曱基-lH-吲哚-5-基氧基)-5-曱基-吡咯並[2,l-f][l,2,4]三。秦-6-基氧基]-丙-2-酮)可以用其他的參考底物(例如乙醯苯)代替。在本文的實施方案中,酮還原酶多肽分別在SEQIDNO:2和4的野生型克菲爾乳桿菌或短乳桿菌序列的對應殘基位置上包括至少(1)94位的胺基酸殘基,它是芳族胺基酸殘基或G,和/或(2)96位的胺基酸殘基,它是S/N之外的胺基酸。因此,在本文的不同實施方案中,本公開的酮還原酶包括對對應於SEQIDNO:2或SEQIDNO:4的胺基酸序列的多肽的至少以下胺基酸取代(1)從A—芳族胺基酸殘基或G來修飾殘基94,和/或(2)從S/N—S/N之外的任何胺基酸來修飾殘基96。這些非天然存在的酮還原酶可通過不同的公知技術製備,諸如遺傳材料的體外誘變或定向進化,所述遺傳材料編碼克菲爾乳桿菌或短乳桿菌的酮還原酶,並且識別表達具有所需性質的工程酶的多核苷酸。KRED的能力可以指它們作為單個多肽的性質,或指多聚體形式下它們的性質,這是由於它們可存在於野生型酶中。對本文的目的有用的誘變和定向進化技術詳細地描述於以下參考文獻Ling等人,1997,"ApproachestoDNAmutagenesis:anoverview(DNA誘變的方法綜述)"S,oc/ze附.254(2):157-78;Dale等人,1996,"Oligonucleotide-directedrandommutagenesisusingthephosphorothioatemethod(使用硫代磷酸酯方法的寡核苷酸指導的隨機誘變)"MeAo^Afo/.編.57:369-74;Smith,1985,"Invitromutagenesis(體夕卜誘變)",X肌紐Ge威19:423-462;Botstein等人,1985,"Strategiesandapplicationsofinvitromutagenesis(體外誘變的策略和應用)",Sc,e腳229:1193-1201;Carter,1986,"Site-directedmutagenesis"立點定向i秀變)",說oc/e附.丄237:1-7;Kramer等人,1984,"PointMismatchRepair(點錯配修復)",Ce〃,38:879-887;Wells等人,1985,"Cassettemutagenesis:anefficientmethodforgenerationofmultiplemutationsatdefinedsites(盒式i秀變在石角定4立;、產生多個突變的有效方法)",G匿34:315-323;Minshull等人,1999,"Proteinevolutionbymolecularbreeding(通過分子育種的蛋白質進化),,,CWrC/2ew3:284-290;Christians等人,1999,"DirectedevolutionofthymidinekinaseforAZTphosphorylationusingDNAfamilyshuffling(4吏用DNA家力矣改組定向進化用於AZT磷酸化的胸苷激酶)",A^wre說oZec/17:259-264;Crameri等人,1998,"DNAshufflingofafamilyofgenesfromdiversespeciesacceleratesdirectedevolution(對來自不同物種的基因的家族的DNA改組加速了定向進化)",淑匿391:288-291;Crameri等人,1997,"MolecularevolutionofanarsenatedetoxificationpathwaybyDNAshuffling(通過DNA改組的砷酸鹽解毒途徑的分子進化)",Atowre5wtec/15:436-438;Zhang等人,1997,"DirectedevolutionofaneffectivefructosidasefromagalactosidasebyDNAshufflingandscreening(通過DNA改組和篩選從半乳糖普酶定向進化到有效的果糖普酶)",Ato/乂cadSc/〖/&494:45-4-4509;Crameri等人,1996,"ImprovedgreenfluorescentproteinbymolecularevolutionusingDNAshuffling(通過使用DNA改組的分子進化改善綠色螢光蛋白),,,Atowe說0&c/214:315-319;Stemmer,1994,"RapidevolutionofaproteininvitrobyDNAshuffling(通過DNA改糹且體夕卜'!"夬速進化蛋白質),,,Atowre370:389-391;Stemmer,1994,"DNAshufflingbyrandomfragmentationandreassembly:Invitrorecombinationformolecularevolution(通過隨機斷裂和重新組裝的DNA改組用於分子進化的體外重組)",屍racAto/Am/S"f/&491:10747-10751;WO95/22625;WO97/0078;WO97/35966;WO98/27230;WO00/42651;WO01/75767和美國專利6,537,746。所有出片反物在此通過引用併入。編碼天然存在的克菲爾乳桿菌和短乳桿菌的酮還原酶(還稱為"醇脫氫酶,,或"ADH")的天然存在的多核香酸可從已知編碼酮還原酶活性的分離多核苷酸(例如對於克菲爾乳桿菌,Genbank登錄號AAP94029GI:33112056和對於短乳桿菌,Genbank登錄號CAD66648GI:28400789)獲得。可選地,可通過本領域已知的多核苷酸合成方法學,根據已報導的酮還原酶編碼基因的多核芬酸序列合成編碼天然存在的酮還原酶的多核芬酸。在不同的實施方案中,如下文進一步所述,編碼酮還原酶以及工程酮還原酶的天然存在的多核苷酸可被密碼子優化為用於表達該酶的具體宿主細胞優選的密碼子。編碼天然存在的或野生型酮還原酶的母體或參考多核苷酸經受誘變過程(例如隨機誘變和重組)以將突變導入該多核普酸。表達並翻譯突變的多核苷酸,從而產生具有相對所述多肽的》務飾的工程酮還原酶。如本文所用,"修飾"包括胺基酸取代、缺失和插入。可將修飾的任何一種或組合導入天然存在的酶活性多肽以產生工程酶,然後通過各種方法篩選工程酶以鑑別具有在具體酶性質方面的所需改善的多肽和對應的多核苷酸。編碼具有改善的性質的工程酮還原酶的多核芬酸可經受另外的數輪誘變處理以產生具有進一步改善的所需酶性質的多肽。需要改善的酶性質包括但不限於酶促活性、熱穩定性、pH活性特徵、輔因子需求、對抑制劑(例如產物抑制)的不應性、立體特異性、立體選擇性和溶劑穩定性。在一些實施方案中,重組酮還原酶包括衍生自SEQIDNO:2的克菲爾乳桿菌酮還原酶或SEQIDNO:4的短乳桿菌酮還原酶的工程多肽,並因此可與它們對比。在本說明書中,胺基酸殘基位置是根據參考多肽確定的。對於SEQIDNO:2或SEQIDNO:4的參考序列,編號開始於起始曱硫氨酸(M)殘基(即M代表1位殘基),儘管本領域技術人員應理解,起始甲硫氨酸殘基可通過生物加工機器(諸如在宿主細胞或體外翻譯系統中)除去以產生缺少起始曱硫氨酸殘基的成熟蛋白質。如果兩個參考酮還原酶之間相同殘基位置上的胺基酸殘基不同,則不同的殘基通過'7"(排列為"克菲爾乳桿菌殘基/短乳桿菌殘基,,)來指示。用不同的胺基酸殘基取代參考序列(例如SEQIDNO:2和SEQIDNO:4的野生型酮還原酶)中的胺基酸殘基的取代突變用符號"指示。產生改善的酮還原酶性質的對參考多肽(諸如天然存在的SEQIDNO:2或SEQIDNO:4的多肽)的修飾的數量可包括參考酶序列的一個或多個胺基酸、2個或更多個胺基酸、3個或更多個胺基酸、4個或更多個胺基酸、5個或更多個胺基酸、6個或更多個胺基酸、8個或更多個胺基酸、IO個或更多個胺基酸、或15個或更多個胺基酸、20個或更多個胺基酸、多達胺基酸總數的10%、多達胺基酸總數的20%或多達胺基酸總數的30%。同樣地,本公開的多肽可在參考序列(例如SEQIDN0:2或SEQIDNO:4)的1、2、3、4、5、6、7、8、9、10、11、12、14、16、18、20或25個或更多個胺基酸,或多達胺基酸的5%、多達胺基酸的10%、多達胺基酸的20%或多達胺基酸總數的30%上不同於所述參考多肽。在不同的實施方案中,產生改善的酶性質的對參考多肽的修飾可包括在參考序列(諸如SEQIDNO:2或SEQIDNO:4)的l、2、3、4、5、6、7、8、9、10、11、12、14、16、18、20、25個或更多個胺基酸,或多達胺基酸的5%、多達胺基酸的10%、多達胺基酸的20%或多達胺基酸總數的30%上的取代。用於產生改善的酮還原酶的取代可包括保守取代、非保守取代以及保守和非保守取代的組合。在一些實施方案中,與SEQIDNO:2或SEQIDNO:4的野生型參考酮還原酶的活性對比,該酮還原酶多肽具有增加的將底物1-[4-(4-氟-2-曱基-lH-吲哚-5-基氧基)-5-甲基-吡咯並[2,1-幻[1,2,4]三。秦-6-基氧基]-丙-2-酮立體選擇性地還原或轉化為產物U)-1-[4-(4-氟-2-甲基-lH-吲哚-5-基氧基)-5-曱基-吡咯並[2,1-£][1,2,4]三。秦-6-基氧基]-丙-2-醇的酶活性。在一些實施方案中,增加的酶活性是野生型參考多肽的酶活性的至少1.5倍或更高。在一些實施方案中,與參考多肽SEQIDNO:2或SEQIDNO:4的活性對比,增加的酶活性是至少2.0倍或更高的酶活性、至少3.0倍或更高的酶活性、至少5倍或更高的酶活性、至少10倍或更高的酶活性、至少20倍或更高的酶活性、至少25倍或更高的酶活性、至少50倍或更高的酶活性、至少75倍或更高的酶活性、至少100倍或更高的酶活性。在一些實施方案中,在定義的條件下與SEQIDNO:2或SEQIDNO:4的野生型參考酮還原酶的轉化率對比,該酮還原酶多肽具有增加的將1-[4-(4-氟-2-曱基-lH-吲哚-5-基氧基)-5-甲基-吡咯並[2,1-!][1,2,4]三嗪-6-基氧基]-丙-2-酮立體選擇性地還原或轉化為產物(i)-1-[4-(4-氟-2-曱基-lH-吲哚-5-基氧基)-5-甲基-吡咯並[2,1《[1,2,4]三溱-6-基氧基]-丙-2-醇的轉化率。在一些實施方案中,工程酮還原酶的特徵為在定義的條件下,底物的32轉化大於70%、大於80%、大於90%、大於95%、大於98%或大於99%。示例性定義的條件是用約10g/L的KRED將10g/L底物轉化24小時。在一些實施方案中,與SEQIDNO:2或SEQIDNO:4的野生型參考酮還原酶的活性對比,該酮還原酶多肽具有增加的將底物乙醯苯立體選擇性地還原或轉化為產物(A)-l-苯基乙醇的酶活性。在一些實施方案中,增加的酶活性是野生型參考多肽的酶活性的至少1.5倍或更高。在一些實施方案中,與參考多肽SEQIDNO:2或SEQIDNO:4的活性對比,增加的酶活性是至少2.0倍或更高的酶活性、至少3.0倍或更高的酶活性、至少5倍或更高的酶活性、至少IO倍或更高的酶活性、至少20倍或更高的酶活性、至少25倍或更高的酶活性、至少50倍或更高的酶活性、至少75倍或更高的酶活性、至少100倍或更高的酶活性。在一些實施方案中,在定義的條件下與SEQIDNO:2或SEQIDNO:4的野生型參考酮還原酶的活性對比,該酮還原酶多肽具有增加的將底物乙醯苯立體選擇性地還原或轉化為產物(iO-l-苯基乙醇的轉化率。在一些實施方案中,工程酮還原酶的特徵為在定義的條件下,底物的轉化大於70%、大於80%、大於90%、大於95%、大於98%或大於99%。示例性定義的條件是用約10g/L的KRED將10g/L底物轉化24小時。在不同的實施方案中,該酮還原酶多肽能夠以SEQIDNO:2或SEQIDNO:4的活性的至少L5倍將底物l-[4-(4-氟-2-曱基-lH-吲哚-5-基氧基)-5-甲基-吡咯並[2,l-f][l,2,4]三漆-6-基氧基]-丙-2-酮立體選擇性地還原或轉化為產物(A)-1-[4-(4-氟-2-曱基-lH-吲哚-5-基氧基)-5-曱基"比咯並[2,l-f][l,2,4]三嗪-6-基氧基]-丙-2-醇,並且包括具有以下的胺基酸序列(1)在參考序列SEQIDNO:2或SEQIDNO:4的對應殘基位置94處的芳族胺基酸或G,或(2)在參考序列SEQTDNO:2或SEQIDNO:4的對應殘基位置96處的S/N之外的胺基酸。在一些實施方案中,在對應殘基位置96處的胺基酸殘基不是S和N。如下文所討論,在這些實施方案的一些中,該酮還原酶多肽與參考序列對比,可在2個或更多個胺基酸殘基、3個或更多個胺基酸殘基、或4個或更多個胺基酸殘基處不同於參考序列。在一些實施方案中,能夠將底物l-[4-(4-氟-2-曱基-lH-吲哚-5-基氧基)-5-曱基-吡咯並[2,1-3[1,2,4]三溱-6-基氧基]-丙-2-酮立體選擇性地還原或轉化為產物U)-1-[4-(4-氟-2-甲基-m-吲哚-5-基氧基)-5-甲基-吡咯並[2,1-f][1,2,4]三。秦-6-基氧基]-丙-2-醇的酮還原酶多肽包括在參考序列SEQIDNO:2或SEQIDNO:4的對應殘基位置94處具有芳族胺基酸或G的胺基酸序列。同樣地,在一些實施方案中,該酮還原酶多肽包括SEQIDNO:2或SEQIDNO:4的對應序列的殘基94處A—芳族胺基酸殘基或G的修飾。如下文所討論,在這些實施方案的一些中,該酮還原酶多肽與參考序列對比,可在2個或更多個胺基酸殘基、3個或更多個胺基酸殘基、或4個或更多個胺基酸殘基處不同於參考序列。在一些實施方案中,該酮還原酶多肽包括在SEQ1DNO:2或SEQIDNO:4的殘基94的對應胺基酸殘基處具有胺基酸F、W、H或Y的胺基酸序列。同樣地,在一些實施方案中,該酮還原酶多肽包括在SEQIDNO:2或SEQIDNO:4的對應序列的殘基94處的A—F、W、H或Y的4'務飾。在一些實施方案中,殘基94處的胺基酸是F。在一些實施方案中,在殘基94處具有指定胺基酸的能夠將底物1-[4-(4-氟-2-甲基-lH-吲哚-5-基氧基)-5-曱基-吡咯並[2,1{[1,2,4]三嗪-6-基氧基]-丙-2-S同立體選擇性地轉化為產物U)-1-[4-(4-氟-2-曱基-lH-吲哚-5-基氧基)-5-曱基-吡咯並[2,1-幻[1,2,4]三溱-6-基氧基]-丙-2-醇的酮還原酶多肽可包括對應SEQIDNO:2或SEQIDNO:4的其他胺基酸殘基處的修飾,包括非保守或保守取代。如下文進一步討論,非保守取代可以在對應於殘基位置53、54、96、97、147、165、153、197、199、206、223和233的胺基酸殘基處。當存在另外的取代時,該取代可包括在其他胺基酸殘基位置處的一個或多個保守取代。因此,在一些實施方案中,重組酮還原酶多肽包括與SEQIDNO:2在1至25個胺基酸位置上不同的胺基酸序列,條件是對應於SEQIDNO:2或SEQIDNO:4的殘基94的胺基酸殘基是芳族胺基酸或G。同樣地,一些多肽包括與SEQIDNO:2或SEQIDNO:4在以下位置上不同的胺基酸序列在l、2、3、4、5、6、7、8、9、10、11、12、14、16、18、20或25個胺基酸位置上,例如在1-25個胺基酸位置、1-20個氬基酸位置、1-18個胺基酸位置、l-16個胺基酸位置、l-14個胺基酸位置、l-12個胺基酸位置、l-ll個胺基酸位置、l-10個胺基酸位置、卜9個胺基酸位置、卜8個胺基酸位置、l-7個胺基酸位置、l-6個胺基酸位置、l-5個胺基酸位置、1-4個胺基酸位置、1-3個胺基酸位置或1-2個胺基酸位置上。在一些實施方案中,能夠將底物l-[4-(4-氟-2-曱基-lH-吲哚-5-基氧基)-5-甲基-吡咯並[2,1力[1,2,4]三溱-6-基氧基卜丙-2-酮立體選擇性地還原或轉化為產物U)-1-[4-(4-氟-2-甲基-lH-吲哚-5-基氧基)-5-甲基-吡咯並[2,l-fj[l,2,4]三。秦-6-基氧基]-丙-2-醇的酮還原酶多肽包括在對應於SEQIDN0:2或SEQIDNO:4的殘基94的殘基處具有芳族胺基酸或G的胺基酸序列,和選自以下的特徵中的一個或多個(1)對應於殘基96的殘基處的胺基酸是S/N之外的任何胺基酸;(2)對應於殘基153的胺基酸殘基是L之外的脂肪族胺基酸;(3)對應於殘基199的胺基酸殘基是L之外的任何胺基酸;(4)對應於殘基202的胺基酸殘基是G,或是A之外的脂肪族胺基酸;以及(5)對應於殘基206的胺基酸殘基是芳族胺基酸。因此,在一些實施方案中,該酮還原酶多肽可包括具有SEQIDNO:2或SEQIDNO:4的對應序列的殘基94處的A—芳族胺基酸殘基或G的修飾和選自以下一種或多種修飾的胺基酸序列96(S/N—S/N之外的任何胺基酸);153(L—L之外的脂肪族胺基酸殘基);199(L—L之外的任何胺基酸殘基);202(A—G,或A之外的脂肪族胺基酸殘基);以及206(M—芳族胺基酸殘基)。在一些實施方案中,胺基酸殘基和以上殘基中的對應突變選自殘基153是G或A;殘基199是K、I、N、R、V、Q或W;殘基202是I、L或G;且殘基206是F。在一些實施方案中,能夠將底物l-[4-(4-氟-2-曱基-lH-吲哚-5-基氧基)-5-甲基-吡咯並[2,1《[1,2,4]三溱-6-基氧基]-丙-2-酮立體選擇性地還原或轉化為產物U)-1-[4-(4-氟-2-曱基-lH-吲咮-5-基氧基)-5-甲基-吡咯並[2,l-f][l,2,4]三嗪-6-基氧基]-丙-2-醇的酮還原酶多肽包括在對應於SEQIDNO:2或SEQIDNO:4的殘基96的胺基酸殘基處具有G、F、Y或I的^J^酸序列。同樣地,在一些實施方案中,該酮還原酶多肽包括SEQ.IDNO:235或SEQIDNO:4的對應序列的殘基96處的S/N~>G、F、Y或I的修飾。如下文所討-論,在這些實施方案的一些中,該酮還原酶多肽與參考序列對比,可在2個或更多個胺基酸殘基、3個或更多個胺基酸殘基、或4個或更多個胺基酸殘基處不同於參考序列。在一些實施方案中,該酮還原酶多肽還能夠將底物乙醯苯立體選擇性地還原或轉化為產物(A)-l-苯基乙醇。在這些實施方案的一些中,該酮還原酶多肽包括在對應於SEQIDNO:2或SEQIDNO:4的殘基96的胺基酸殘基處具有G、I、C或芳族胺基酸的胺基酸序列。同樣地,在一些實施方案中,該酮還原酶多肽包括SEQIDNO:2或SEQIDNO:4的對應序列的殘基96處的S/N—G、I、C或芳族胺基酸殘基的修飾。如下文所討論,在這些實施方案的一些中,該酮還原酶多肽與參考序列對比,可在2個或更多個胺基酸殘基、3個或更多個胺基酸殘基、或4個或更多個胺基酸殘基處不同於參考序列。在一些實施方案中,在殘基96處具有指定胺基酸的酮還原酶多肽可包括對應的SEQ1DNO:2或SEQIDNO:4的其他胺基酸殘基處的修飾,包括非保守或保守取代。如下文進一步討論,非保守取代可以在對應於殘基位置53、54、96、97、147、165、153、197、199、206、223和233的胺基酸殘基處。當存在另外的取代時,該取代可包括在其他胺基酸殘基位置處的一個或多個保守取代。在一些實施方案中,酮還原酶多肽包括與SEQIDNO:2在1至25個胺基酸位置上不同的胺基酸序列,條件是對應於SEQIDNO:2或SEQIDNO:4的殘基96的胺基酸殘基是G、F、Y或I。同樣地,一些多肽包括與SEQIDNO:2或SEQIDNO:4在以下位置上不同的胺基酸序列在1、2、3、4、5、6、7、8、9、10、11、12、14、16、18、20或25個胺基酸位置上,例如在1-25個胺基酸位置、l-20個胺基酸位置、l-18個胺基酸位置、l-16個胺基酸位置、l-14個胺基酸位置、l-12個胺基酸位置、1-11個胺基酸位置、l-10個胺基酸位置、l-9個胺基酸位置、l-8個胺基酸位置、1-7個胺基酸位置、l-6個胺基酸位置、l-5個胺基酸位置、l-4個胺基酸位置、1-3個胺基酸位置或1-2個胺基酸位置上。在一些實施方案中,酮還原酶多肽包括與SEQIDNO:2在1至25個胺基酸位置上不同的氨J^酸序列,並且包括在對應於SEQIDNO:2或SEQIDNO:4的殘基96的殘基處的G、I、C或芳族胺基酸。同樣地,一些多肽包括與SEQIDNO:2或SEQIDNO:4在以下位置上不同的胺基酸序列在l、2、3、4、5、6、7、8、9、10、11、12、14、16、18、20或25個胺基酸位置上,例如在1-25個氣基酸位置、1-20個胺基酸位置、1-18個胺基酸位置、l-16個胺基酸位置、l-14個胺基酸位置、l-12個胺基酸位置、l-ll個胺基酸位置、l-10個胺基酸位置、l-9個胺基酸位置、l-8個氛基酸位置、l-7個氛基酸位置、l-6個胺基酸位置、l-5個胺基酸位置、1-4個胺基酸位置、1-3個胺基酸位置或卜2個胺基酸位置上。在一些實施方案中,酮還原酶多肽包括在以上SEQIDNO:2或SEQIDNO:4的殘基96處具有指定胺基酸的胺基酸序列,和以下特徵中的一個或多個(1)對應於殘基94的殘基處的胺基酸是芳族胺基酸或G;(2)對應於殘基153的胺基酸殘基是L之外的脂肪族胺基酸;(3)對應於殘基199的胺基酸殘基是L之外的任何胺基酸;(4)對應於殘基202的胺基酸殘基是G,或是A之外的脂肪族胺基酸;以及(5)對應於殘基206的胺基酸殘基是芳族胺基酸。因此,在一些實施方案中,該酮還原酶多肽包括具有SEQIDNO:2或SEQIDNO:4的對應序列的殘基96處的S/N—G、F、Y或I的修飾和以下殘基處的一種或多種修飾的胺基酸序列94(A—芳族胺基酸殘基或G);153(L—L之外的脂肪族胺基酸殘基);199(L—L之外的任何胺基酸殘基);202(A—G,或A之外的脂肪族胺基酸殘基);以及206(M—芳族胺基酸殘基)。在一些實施方案中,該酮還原酶多肽包括具有SEQIDNO:2或SEQIDNO:4的對應序列的殘基96處的S/N—G、I、C的修飾和以下殘基處的一種或多種修飾的胺基酸序列94(A—芳族胺基酸殘基或G);153(L—L之外的脂肪族胺基酸殘基);199(L—L之外的任何胺基酸殘基);202(A—G,或A之外的脂肪族胺基酸殘基);以及206(M—芳族胺基酸殘基)。在一些實施方案中,胺基酸殘基和以上殘基中的對應突變可選自以下中的一個或多個殘基94是F或G;殘基153是G或A;殘基199是K、I、N、R、V、Q或W;殘基202是I、L或G;且殘基206是F。在一些實施方案中,可將另外的突變併入到以上所有的酮還原酶多肽的實施方案中以增強多肽活性的一個或多個性質,所述多肽活性諸如,酶活性、熱穩定性和/或溶劑穩定性和類似性質。因此在一些實施方案中,除了以上所有的實施方案之外,該酮還原酶多肽可包括以下特徵中的一個或多個(1)對應於殘基49的殘基處的胺基酸是K之外的極性胺基酸殘基;(2)對應於殘基53的殘基處的胺基酸是酸性胺基酸殘基;(3)對應於殘基54的殘基處的胺基酸是T/P之外的小的或脂肪族胺基酸殘基;(4)對應於殘基60的殘基處的胺基酸是V之外的脂肪族胺基酸殘基;(5)對應於殘基95的殘基處的胺基酸是V之外的脂肪族胺基酸;(6)對應於殘基97的殘基處的胺基酸是小的胺基酸或G;(7)對應於殘基109的殘基處的胺基酸是K之外的鹼性胺基酸殘基;(8)對應於殘基147的殘基處的胺基酸是脂肪族胺基酸殘基;(9)對應於殘基165的殘基處的胺基酸是羥基或小的胺基酸殘基;(IO)對應於殘基197的殘基處的胺基酸是小的胺基酸殘基或G;(11)對應於殘基223的殘基處的胺基酸是L之外的脂肪族胺基酸殘基;以及(12)對應於殘基233的殘基處的胺基酸是小的胺基酸殘基或G。因此,在這些實施方案中,該酮還原酶多肽可包括以上酮還原酶的每個實施方案所描述的具有SEQIDN0:2或SEQIDNO:4的對應序列的指定》務飾和以下修飾中的一個或多個的胺基酸序列49(K—K之外的極性胺基酸殘基);53(G/T—酸性胺基酸殘基);54(T/P—T/P之外的小的或脂肪族胺基酸殘基);60(V/F—V之外的脂肪族胺基酸殘基);95(V—V之外的脂肪族胺基酸);97(K—小的胺基酸或G);109(K—K之外的鹼性胺基酸殘基);147(F—脂肪族胺基酸殘基);165(I—羥基或小的胺基酸殘基);197(D—小的胺基酸殘基或G);223(I—L之外的脂肪族胺基酸殘基);以及233(D/N—小的胺基酸殘基或G)。在一些實施方案中,酮還原酶多肽包括與SEQIDNO:2或SEQID38NO:4具有至少約85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的同一性的胺基酸序列,條件是(1)對應於殘基94的殘基是芳族胺基酸殘基或G,和/或(2)對應於殘基96的殘基是S/N之外的胺基酸殘基。在一些實施方案中,對應的殘基位置96處的胺基酸殘基不是S和N。在一些實施方案中,酮還原酶多肽可包括與SEQIDNO:2或SEQIDNO:4具有至少約85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的同一性的胺基酸序列,條件是(1)對應於殘基94的殘基是F、W、H或Y;(2)對應於殘基96的殘基是G、F、Y或I;或(3)對應於殘基96的殘基是G、I、C或芳族胺基酸。在一些實施方案中,本發明的酮還原酶多肽可包括具有與SEQIDNO:2或SEQIDNO:4的區域或其結構域(諸如殘基90-233)具有至少約85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的同一性的胺基酸序列的區域,條件是(1)對應於SEQIDNO:2或SEQIDNO:4的對應殘基的殘基94的殘基是芳族胺基酸殘基或G,和/或(2)對應於SEQIDNO:2或SEQIDNO:4的對應殘基的殘基%的殘基是S/N之外的胺基酸殘基。在一些實施方案中,對應的殘基位置96處的胺基酸殘基不是S和N。在這些酮還原酶多肽的一些實施方案中,對應於SEQIDNO:2或SEQIDNO:4的殘基90-233的剩餘殘基中的一個或多個可被保守地突變。在一些實施方案中,酮還原酶多肽可包括具有與SEQIDNO:2或SEQIDNO:4的區域或其結構域(諸如殘基90-233)具有至少約85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的同一性的胺基酸序列的區域,條件是(1)對應於SEQIDNO:2或SEQIDNO:4的對應殘基的殘基94的殘基是F、W、H或Y;(2)對應於SEQIDNO:2或SEQIDNO:4的對應殘基的殘基96的殘基是G、F、Y或I;或(3)對應於SEQIDNO:2或SEQIDNO:4的對應殘基的殘基96的殘基是G、I、C或芳族胺基酸。在這些酮還原酶多肽的一些實施方案中,對應於SEQIDNO:2或SEQIDNO:4的殘基90-233的剩餘殘基中的一個或多個可被保守地突變。在一些實施方案中,工程酮還原酶多肽選自表l列舉的胺基酸序列。對比使用ADH-LK(SEQIDNO:2)所測量的活性,表1排列了使用所列的工程酮還原酶多肽測量的將l-[4-(4-氟-2-甲基-lH-吲哚-5-基氧基)-5-曱基-吡咯並[2,l-f][l,2,4]三嗪-6-基氧基]-丙-2-酮還原或轉化為產物U)_l-[4_(4-氟-2-甲基-lH-吲哚-5-基氧基)-5-甲基-吡咯並[2,1-3[1,2,4]三嗪-6-基氧基]-丙-2-醇的酶活性的等級。表1:核酸SEQIDNO.多肽SEQ舊NO.從ADH-LK(SEQIDNO:2)的突變活性等級(參見圖例)56L17Q;A94F;S96Y;F147L;L153G;L199I+++8G53D;S96G+910S96G+1112S96G;K109R+1314S96Y+1516A94F;S96P+1718S96F+1920.T54A;A94F;S96G;K109R;F147L;L153A;D233G+++2122V43A;V60A;A94G;F147L+++2324V43A;F74L;S96l;F147L;L153G;L199K;I223V+++2526V43A;F74L;S96G;F147L;L153A;D197G;L199l;A202L++40tableseeoriginaldocumentpage41tableseeoriginaldocumentpage42核酸SEQIDNO.多肽SEQIDNO.從ADH-LK<SEQIDNO:2)的突變活性等級(參見圖例)99100T54A;A94F;K109R;F147L:L153A;D233G+++101102T54A;A94F;K109R;F147L;L153A;L199K;N221D;D233G+++103104T54A;A94F;S96F;K109R;F147L;U53A;D233G+++105106K49R;A94G;F147L;D197G;A202G++107108V43A;F74L;A94F;S96Y;L153G++109"0T54A;A94F;S96G;K109R;F147L;L153A;L199K;D233G+++"1"2111V;A94F+113114A94G+1活性等級+與ADH-LK對比提高活性多達20倍。++與ADH-LK對比提高活性21至80倍。+++與ADH-LK對比提高活性超過80倍。在一些實施方案中,工程酮還原酶選自表2列舉的胺基酸序列。對比使用ADH-LK(SEQIDNO:2)所測量的活性,表2排列了使用所列的衍生於ADH-LK的工程酮還原酶多肽測量的將乙醯苯還原或轉化為(W)-1-苯基乙醇的酶活性的等級。表2核酸SEQIDNO.多肽SEQIDNO.從ADH-LK(SEQIDNO:2)或ADH-LB(SEQIDNO:4)的突變活性等級1(參見圖例)115116ADH-LB:A96G117118ADH-LB:N96F119120ADH-LK:S96F+++121122ADH-LK:S96G:F147L;L199N+++43tableseeoriginaldocumentpage44"舌性等級在實施例16的方法中,乙醯苯轉化為(i)l-苯基乙醇+90%轉化。在一些實施方案中,酮還原酶多肽包括與SEQIDNO:2或SEQIDNO:4具有至少約85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的同一性的胺基酸序列,其中胺基酸序列包含表1或表2中所列的多肽序列的任何一個中所含的一套突變中的任何一個。在一些實施方案中,酮還原酶多肽包含在表1或表2的指定殘基位置處的一套胺基酸殘基中的任何一個,並且它與對應序列在約1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-16、1-18、1-20或1-25個胺基酸位置上不同。在一些實施方案中,酮還原酶多肽包含表1或表2所列的一組突變中的任何一個,並且在其他殘基處另外地包含約1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-16、1-18、1-20或1-25個保守取代。因此,在一些實施方案中,與表1或表2中的胺基酸序列對比,酮還原酶多肽可在1、2、3、4、5、6、7、8、9、10、11、12、14、16、18、20或25個胺基酸位置上不同。在一些實施方案中,酮還原酶多肽可包括具有與SEQIDNO:6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、48、50、52、54、56、58、60、62、64、66、68、70、72、74、76、78、80、82、84、86、88、卯、92、94、96、98、100、102、104、106、108、110、112、114、116或118的區域或其結構域(諸如殘基90-233)具有至少約85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的同一性的胺基酸序列的區域。在一些實施方案中,酮還原酶多肽可包括具有與SEQIDNO:120、122、124、126、128、130、132、134、136或138的區域或其結構域(諸如殘基90-233)具有至少約85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的同一性的胺基酸序列的區域。在一些實施方案中,酮還原酶多肽選自SEQIDNO:6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、48、50、52、54、56、58、60、62、64、66、68、70、72、74、76、78、80、82、84、86、88、90、92、94、96、98、100、102、104、106、108、110、112、114、116和118。在一些實施方案中,酮還原酶多肽選自SEQIDNO:120、122、124、126、128、130、132、134、136和138。在一些實施方案中,如果酮還原酶多肽包括在對應於SEQIDNO:2或SEQIDNO:4的殘基94的殘基處具有芳族酸(aromaticacid)或G的胺基酸序列,則酮還原酶多肽可選自SEQIDNO:6、16、20、22、28、30、32、34、36、38、40、42、44、46、48、50、52、54、56、58、60、62、64、66、68、70、72、74、76、78、80、82、84、86、88、90、92、94、96、98、100、102、104、106、108、110、112、114、116和128的tt酸序列。在一些實施方案中,如果酮還原酶多肽包括在對應於SEQIDNO:2或SEQIDNO:4的殘基96的殘基處具有S/N之外的胺基酸的胺基酸序歹'J,則酮還原酶多肽可選自SEQIDNO:6、8、10、12、14、16、18、20、24、26、28、30、36、42、44、46、48、50、52、54、56、58、60、70、72、74、76、78、80、82、84、86、88、90、92、94、%、98、104、108、110、118、120、122、124、126、128、132、134和136的胺基酸序列。在一些實施方案中,可缺失酮還原酶多肽的區段以產生多肽片段。如本文所用,術語"片段"指具有氨基末端和/或羧基末端缺失,但其中剩餘胺基酸序列與序列中的對應位置相同的多肽。片段可以是至少14個胺基酸長、至少20個胺基酸長、至少50個胺基酸長或更長。在一些實施方案45中,片^殳多達以上全長重組酮還原酶多肽的70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%,97%、98%或99%,包括SEQIDNO:6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、48、50、52、54、56、58、60、62、64、66、68、70、72、74、76、78、80、82、84、86、88、90、92、94、96、98、100、102、104、106、108、110、112、114、116和118的酮還原酶多肽的片段。在一些實施方案中,片段多達以上全長重組酮還原酶多肽的70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%,94%、95%、96%、97%、98%或99%,包括SEQIDNO:120、122、124、126、128、130、132、134、136和138的酮還原酶多肽的片段。改善的酮還原酶可存在於細胞中、存在於細胞培養基中,或製備成不同的形式,諸如溶解產物或分離的製品。同樣地,在一些實施方案中,改善的酮還原酶可以是分離的多肽。術語"分離的多肽"指與天然伴隨多肽的其他雜質(如蛋白質、脂質和多核苷酸)大致分離的多肽。該術語包括已經從多肽的天然存在的環境或表達系統(例如宿主細胞或體外合成)中移出或純化的多肽。在一些實施方案中,分離的改善的酮還原酶多肽是大致純的多肽組合物。術語"大致純的多肽"指一種組合物,其中多肽物類是存在的主要物類(即根據摩爾或重量,它比組合物中的任何其他單個大分子物類更豐富),並且當目標物類以摩爾或%重量計包括存在的大分子物類的至少約50%時,該組合物一般是大致純化的組合物。一般來說,大致純的酮還原酶組合物按摩爾或%重量計,將包括存在於組合物中的所有大分子物類的約60%或更多、約70%或更多、約80%或更多、約90%或更多、約95%或更多和約98%或更多。在一些實施方案中,將目標物類純化為基本同質(即在組合物中通過常規檢測方法不能檢測到雜質物類),其中該組合物主要由單一大分子物類組成。溶劑物類、小分子(<500道爾頓)和元素離子物類不認為是大分子物類。6.3編碼工程酮還原酶的多核苷酸在另一個方面中,本公開提供編碼工程酮還原酶多肽的多核苷酸。多核普酸可以可操作地連接到控制基因表達的一個或多個異源調節或控制序列以產生能夠表達該多肽的重組多核苷酸。含有編碼工程酮還原酶的異源多核苷酸的表達構建體可導入合適的宿主細胞以表達對應酮還原酶。由於對對應於不同胺基酸的密碼子的了解,多肽序列的可用性提供對能夠編碼主題多肽的所有多核普酸的描述。遺傳密碼的簡併性(其中相同胺基酸由可選的或同義密碼子編碼)允許製備極大量的核酸,它們所有均編碼本文公開的改善的酮還原酶。因此,已經鑑別了特定的胺基酸序列後,本領域技術人員能夠通過以不改變蛋白質的胺基酸序列的方式簡單地修飾序列的一個或多個密碼子,來製備任何數量的不同核酸。在這方面,本公開特別涵蓋了多核芬酸的各種和每個可能的變化,這可通過根據可能的密碼子選擇挑選組合來製備,並且所有這些變化被認為是為本文公開的任何多肽所特別公開的,包括表1和表2中提供的胺基酸序列。同樣地,本公開的多核苷酸包括編碼SEQIDNO:6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、48、50、52、54、56、58、60、62、64、66、68、70、72、74、76、78、80、82、84、86、88、90、92、94、96、98、100、102、104、106、108、110、112、114、116、118、120、122、124、126、128、130、132、134、136或138的酮還原酶多肽的任何和所有可能的多核苷酸序列。在一些實施方案中,編碼酮還原酶的多核苷酸可為了從選擇用於表達的宿主生物體中最佳生產而進行密碼子優化。例如,用於細菌的優選密碼子用於表達細菌中的基因;用於酵母中的優選密碼子用於在酵母中表達;且用於哺乳動物的優選密碼子用於在哺乳動物細胞中表達。例如,SEQIDNO:1的多核普酸為在大腸桿菌co//)中表達而進行了密碼子優化,但是另外編碼天然存在的克菲爾乳桿菌的酮還原酶。在一些實施方案中,不是所有的密碼子需要被取代來優化酮還原酶的密碼子使用,這是因為天然序列將包括優選的密碼子並且由於優選的密碼子的使用可能不是所有胺基酸殘基所需要的。結果,編碼酮還原酶的密碼子優化的多核芬酸在全長編碼區的約40°/。、50%、60%、70%、80%或超過90%的密碼子位置可包含優選密碼子。47在一些實施方案中,編碼工程酮還原酶的多核苷酸選自SEQIDNO:5、7、9、11、13、15、17、19、21、23、25、27、29、31、33、35、37、39、41、43、45、47、49、51、53、55、57、59、61、63、65、67、69、71、73、75、77、79、81、83、85、87、89、91、93、95、97、99、101、103、105、107、109、111、113、115和117。在一些實施方案中,編碼工程酮還原酶的多核苷酸選自SEQIDNO:119、121、123、125、127、129、131、133、135和137。這些多核普酸編碼由表1和表2列出的胺基酸序列所代表的對應多肽,它們是通過使大腸桿菌密碼子優化的克菲爾乳桿菌基因經受本文描述的定向基因進化技術來衍生的。在一些實施方案中,多核苷酸包括編碼本文描述的多肽的多核苷酸,但是它在核苷酸水平上與編碼工程酮還原酶的參考多核苷酸具有約80%或更高的序列同一性、約85%或更高的序列同一性、約90%或更高的序列同一性、約91%或更高的序列同一性、約92。/。或更高的序列同一性、約93%或更高的序列同一性、約94%或更高的序列同一性、約95%或更高的序列同一性、約96%或更高的序列同一性、約97%或更高的序列同一性、約98%或更高的序列同一性或約99%或更高的序列同一性。在一些實施方案中,參考多核普酸選自SEQIDN0:5、7、9、11、13、15、17、19、21、23、25、27、29、31、33、35、37、39、41、43、45、47、49、51、53、55、57、59、61、63、65、67、69、71、73、75、77、79、81、83、85、87、89、91、93、95、97、99、101、103、105、107、109、111、113、115和117的多核苷酸序列。在一些實施方案中,參考多核苷酸選自SEQIDN0:119、121、123、125、127、129、131、133、135和137的序列。在一些實施方案中,該多核苷酸編碼本文公開的多肽,並且在定義的條件(諸如適度嚴格或高度嚴格條件)下雜交於編碼本公開的工程酮還原酶的序列的互補序列。同樣地,在一些實施方案中,編碼酮還原酶多肽的多核苷酸包括在高度嚴格條件下雜交於選自以下的多核苷酸的多核苷酸SEQIDN0:5、7、9、11、13、15、17、19、21、23、25、27、29、31、33、35、37、39、41、43、45、47、49、51、53、55、57、59、61、63、65、67、69、71、73、75、77、79、81、83、85、87、89、91、93、95、97、99、101、103、105、107、109、111、113、"5和117。在一些實施方案中,編碼酮還原酶多肽的多核芬酸包括在高度嚴格條件下雜交於選自以下的多核苷酸的多核苷酸SEQIDNO:119、121、123、125、127、129、131、133、135和137。編碼改善的酮還原酶多肽的分離的多核普酸可以多種方式處理以提供多肽的表達。根據表達載體,在將分離的多核苷酸插入載體前,對其處理可能是需要的或必需的。利用重組DNA方法修飾多核苷酸和核酸序列的技術在本領域中是公知的。指導提供於Sambrook等人,2001,Mo/ec"/"rC/om"g:爿丄Worato7A/a"wa/(分子克隆實驗室手冊),第3版,ColdSpringHarborLaboratoryPress;和q/^Te/7Z屍ratoco/swM/ecw/ar所o/ogy(最新分子生物學實-瞼方法彙編),Ausubel.F編,GreenePub.Associates,1998,更新至2006。在一些實施方案中,控制序列可能是合適的啟動子序列,它可從編碼同源或異源於宿主細胞的細胞外或細胞內多肽的基因獲得。對於細菌宿主細胞,用於指導本公開的核酸構建體的轉錄的合適啟動子包括從以下獲得的啟動子大腸桿菌lac操縱子、天藍色鏈黴菌(S^ptomycescoe//co/or)瓊脂糖酶基因(dagA)、枯草芽孢桿菌(&c,〃WHwto7w)果聚糖蔗糖酶基因(sacB)、地衣芽孢桿菌(^c,〃i//c/2ew/orm&)a-澱粉酶基因(amyL)、嗜熱脂肪芽孢桿菌(8"c,〃m,WearaAermop/7t)麥芽糖澱粉酶基因(amyM)、解澱4分芽孢桿菌(5acz〃wsa"y;/o/z々i/e/aoem)a-澱粉酶基因(amyQ)、地衣芽孢桿菌青黴素酶基因(penP)、枯草芽孢桿菌xylA和xylB基因及原核卩-內醯胺酶基因(Villa-Kamaroff等人,1978,7W"乂ca^/.W&475:3727-3731),以及toc啟動子(DeBoer等人,1983,MZ/y4c'a(i.U&480:21-25)。此外,啟動子描述於"Usefulproteinsfromrecombinantbacteria(來自重組糹田菌的有用蛋白質),,,Sdem^cy4/we/7.om,1980,242:74-94;以及Sambrook等人,見上。對於絲狀真菌宿主細胞,用於指導本公開的核酸構建體的轉錄的合適啟動子包括從以下的基因獲得的啟動子米麴黴(爿^^^7/w07加e)TAKA澱粉酶、米黑根毛黴(朋,加/m/cw附/e/e,)天冬氨酸蛋白酶、黑麴黴(/^/erg/〃Mmger)中性a-澱粉酶、黑麴黴酸穩定型a-澱粉酶、黑麴黴或泡盛麴黴(A^erg,〃M"vramoh)葡糖澱粉酶(glaA)、米黑根毛黴脂肪酶、米麴黴鹼性蛋白酶、米麴黴石粦酸丙糖異構酶、構巢麴黴(XwwgV/Mw/dw/a/w)乙醯胺酶禾口尖孑包鐮刀菌(FtW(3T/wmox3^ponw7)月夷蛋白酶才羊蛋白酶(WO96/00787),以及NA2-tpi啟動子(來自黑麴黴中性a-澱粉酶和米麴黴磷酸丙糖異構酶基因的啟動子的雜合體)及其突變體、截短和雜合啟動子。在酵母宿主中,有用的啟動子可來自酉良酒酵母(Sacc/araw少cevcerev,wae)烯醇化酶(ENO-l)、釀酒酵母半乳糖激酶(GAL1)、釀酒酵母醇脫氫酶/甘油醛-3-磷酸脫氬酶(ADH2/GAP)和釀酒酵母3-磷酸甘油酸激酶的基因。用於酵母宿主細胞的其他有用啟動子描述於Romanos等人,1992,腸W8:423-488。在一些實施方案中,控制序列還可以是合適的轉錄終止子序列---種由宿主細胞識別以終止轉錄的序列。終止子序列可操作地連接於編碼多肽的核酸序列的3'末端。在選擇的宿主細胞中起作用的任何終止子可用於本發明。.例如,用於絲狀真菌宿主細胞的示例性轉錄終止子可從米麴黴TAKA澱粉酶、黑麴黴葡糖澱粉酶、構巢麴黴鄰氨基苯甲酸合成酶、黑麴黴a-葡糖苷酶和尖孢鐮刀菌胰蛋白酶樣蛋白酶的基因獲得。用於酵母宿主細胞的示例性終止子可從釀酒酵母烯醇化酶、釀酒酵母細胞色素C(CYC1)和釀酒酵母甘油醛-3-磷酸脫氫酶的基因獲得。用於酵母宿主細胞的其他有用終止子描述於Romanos等人,1992,同上。在一些實施方案中,控制序列還可以是合適的前導區序列---種對宿主細胞的翻譯重要的mRNA的非翻譯區。該前導區序列可操作地連接於編碼多肽的核酸序列的5'末端。可使用在選擇的宿主細胞中起作用的任何前導區序列。用於絲狀真菌宿主細胞的示例性前導區是從米麴黴TAKA澱粉酶和構巢麴黴磷酸丙糖異構酶的基因獲得。用於酵母宿主細胞的合適前導區是從釀酒酵母烯醇化酶(ENO-l)、釀酒酵母3-磷酸甘油酸激酶、釀酒酵母a-因子和釀酒酵母醇脫氫酶/甘油醛-3-磷酸脫氫酶(ADH2/GAP)的基因獲得。在一些實施方案中,控制序列還可以是聚腺苷酸化序列---種可操作地連接於核酸序列的3'末端並且當轉錄時被宿主細胞識別為向轉錄的mRNA添加聚腺苦殘基的信號的序列。在選擇的宿主細胞中起作用的任何聚腺苷酸化序列可用於本發明。用於絲狀真菌宿主細胞的示例性聚腺苷酸化序列可來自米麴黴TAKA澱粉酶、黑麴黴葡糖澱粉酶、構巢麴黴鄰氨基苯甲酸合成酶、尖孢鐮刀菌胰蛋白酶樣蛋白酶和黑麴黴a-葡糖苷酶的基因。對酵母宿主細胞有用的聚腺香酸化序列描述於Guo和Sherman,1995,A/o/Ce〃腸15:5983-5990。在一些實施方案中,控制序列還可以是信號肽編碼區,其編碼連接於多肽的氨基末端的胺基酸序列,並且指導編碼多肽進入細胞分泌途徑。核酸序列的編碼序列的5'末端本身可含有按翻譯閱讀框天然連接於編碼分泌的多肽的編碼區的區段的信號肽編碼區。可選地,編碼序列的5'末端可含有外源於編碼序列的信號肽編碼區。如果編碼序列不是天然含有信號肽編碼區,則可能需要外源信號肽編碼區。可選地,外源信號肽編碼區可簡單地代替天然信號肽編碼區,從而增強多肽的分泌。然而,指導表達的多肽進入選擇的宿主細胞的分泌途徑的任何信號肽編碼區可用於本發明。用於細菌宿主細胞的有效的信號肽編碼區是從以下的基因獲得的信號肽編碼區芽孢桿菌(5ac,〃^)NCffi11837麥芽糖澱粉酶、嗜熱脂肪芽孢桿菌a-澱粉酶、地衣芽孢桿菌枯草蛋白酶、地衣芽孢桿菌P-內醯胺酶、嗜熱脂肪芽孢桿菌中性蛋白酶(叩rT、叩rS、nprM)和枯草芽孢桿菌prsA。另外的信號肽描述於Simonen和Palva,1993,M,cra6,W尺ev57:109-137。用於絲狀真菌宿主細胞的有效的信號肽編碼區可以是從以下的基因獲得的信號肽編碼區米麴黴TAKA澱粉酶、黑麴黴中性澱粉酶、黑麴黴葡糖澱粉酶、米黑根毛黴天冬氨酸蛋白酶、特異腐質黴(/^柳co/a/似o/ms)纖維素酶和柔毛腐質黴(//wm/co/a/a"wg/Mora)脂肪酶。頁對酵母宿主細胞有用的信號肽可來自釀酒酵母a-因子和釀酒酵母轉化酶的基因。其他有用的信號肽編碼區描述於Romanos等人,1992,同上。在一些實施方案中,控制序列還可以是前肽編碼區,它編碼位於多肽的氨基末端的胺基酸序列。產生的多肽稱為酶原(proenzyme)或多肽原(或在一些情況下稱為酶原(zymogen))。多肽原通常無活性,並且可通過從多肽原催化或自身催化切割前肽而轉化為成熟的活性多肽。前肽編碼區可從以下的基因獲得枯草芽孢桿菌鹼性蛋白酶(aprE)、枯草芽孢桿菌中性蛋白酶(nprT)、釀酒酵母a-因子、米黑根毛黴天冬氨酸蛋白酶和嗜熱毀絲黴(A<yce/w//^oraA^vw//,/")乳糖酶(WO95/33836)。如果信號肽和前肽區都存在於多肽的氨基末端,則前肽區位於多肽氨基末端的相鄰位置,且信號肽區位於前肽區的氨基末端的相鄰位置。還可期望添加調節序列,其允許相對宿主細胞生長調節多肽的表達。調節系統的實例是引起響應化學或物理刺激(包括調節化合物的存在)而打開或關閉基因的表達的調節系統。在原核宿主細胞中,合適的調節序列包括lac、tac和trp操縱基因系統。在酵母宿主細胞中,合適的調節系統包括,例如ADH2系統或GAL1系統。在絲狀真菌中,合適的調節序列包括TAKAa-澱粉酶啟動子、黑麴黴葡糖澱粉酶啟動子和米麴黴葡糖澱粉酶啟動子。調節或控制序列的其他實例是允許基因擴增的調節或控制序列。在真核系統中,這些包4舌在氛甲蟲萊吟存在時擴增的二氫葉S臾還原酵基因和用重金屬擴增的金屬硫蛋白基因。在這些情況下,編碼本發明的KRED多肽的核酸序列將與控制序列可操作地連接。因此,在另一個方面中,本公開還涉及重組表達載體,根據它們所導入的宿主的類型,其包括編碼工程酮還原酶多肽或其變體的多核苷酸,和一個或多個表達調節區(諸如啟動子和終止子)、複製起點等等。以上描述的各種核酸和控制序列可連接到一起以產生重組表達載體,其可包括一個或多個方便的限制位點以使得編碼多肽的核酸序列在該位點插入或取代。可選地,可通過將核酸序列或包含該序列的核酸構建體插入到用於表達的合適載體來表達本公開的核酸序列。在產生表達載體中,編碼序列位於載體中,以使編碼序列可操作地連接於用於表達的合適控制序列。重組表達載體可以是可方便地經受重組DNA過程並可使多核苷酸序列表達的任何載體(例如質粒或病毒)。載體的選擇將通常依賴於載體與該載體所導入的宿主細胞的相容性。載體可以是直線的或封閉環狀質粒。表達載體可以是自主複製載體,即作為染色體外實體存在的載體,其複製獨立於染色體複製,該載體例如質粒、染色體外元件、微型染色體或人工染色體。該載體可包括確保自身複製的任何部件(means)。可選地,該載體可以是當導入宿主細胞時整合於基因組並與其所整合的染色體一起複製的載體。此外,可使用單個載體或質粒,或一起含有被導入到宿主細胞的基因組的總DNA的兩個或更多個載體或質粒,或轉座子。本發明的表達載體優選含有一個或多個選擇標記基因,其允許易於選擇轉化細胞。選擇標記基因是一種基因,其產物提供殺生物劑或病毒抗性、對重金屬的抗性、營養缺陷型的原養型,以及類似性質。細菌選擇標記基因的實例是來自枯草芽孢桿菌或地衣芽孢桿菌的必/基因,或賦予抗生素抗性,諸如氨比西林、卡那黴素、氯黴素(實施例1)或四環素抗性的標記基因。適合於酵母宿主細胞的標記基因是ADE2、HIS3、LEU2、LYS2、MET3、TRP1和URA3。在絲狀真菌宿主細胞中使用的選擇標記基因包括但不限於amdS(乙醯胺酶)、argB(鳥氨酸氨曱醯轉移酶)、bar(膦絲菌素乙醯轉移酶)、hph(潮黴素磷酸轉移酶)、niaD(硝酸還原酶)、pyrG(乳清酸核苷-5'-磷酸脫羧酶)、sC(硫酸腺苷醯轉移酶(sulfateadenyltransferase))和trpC(鄰氨基苯曱酸合成酶),以及其等同物。在麴黴菌細胞中使用的實施方案包括構巢麴黴或米麴黴的amdS和pyrG基因,以及吸水鏈黴菌(5^e;^w^c^/y^grasc)的bar基因。本發明的表達載體優選地包含允許該載體整合到宿主細胞的基因組或允許載體在細胞中獨立於基因組自主複製的元件。對於整合到宿主細胞基因組,該載體可依靠編碼多肽的核酸序列或載體的任何其他元件,從而通過同源或非同源重組將載體整合到基因組。可選地,表達載體可包含用於指導通過同源重組整合到宿主細胞的基因組的另外的核酸序列。該另外的核酸序列能夠使載體在染色體的精確位置整合到宿主細胞基因組。為了增加在精確位置整合的可能性,該整合元件應該優選地包含足夠數量的與對應靶序列高度同源的核酸,諸如100至10,000個鹼基對、優選400至10,000個鹼基對和最優選800至10,000個石威基對以增加同源重組的可能性。整合元件可以是與宿主細胞的基因組中的耙序列同源的任何序列。此外,整合元件可以是非編碼或編碼的核酸序列。另一方面,載體可通過非同源重組整合到宿主細胞的基因組。對於自主複製,栽體可進一步包括能夠使載體在相關的宿主細胞中自主複製的複製起點。細菌複製起點的實例是P15Aori(如在圖5的質粒中所示),或允許在大腸桿菌中複製的質粒pBR322、pUC19、pACYC177(該質粒具有P15Aori)或pACYC184的複製起點,和允許在芽孢桿菌中複製的pUB110、pE194、pTA1060或pAM.(3.1的複製起點。在酵母宿主細胞中使用的複製起點的實例是2微米的複製起點ARS1、ARS4,ARS1和CEN3的組合以及ARS4和CEN6的組合。複製起點可以是具有使之在宿主細胞中的功能溫度敏感的突變的複製起點(參見例如Ehrlich,1978,PracAto/爿c^c,.固75:1433)。可將本發明的核酸序列的多於一個拷貝插入到宿主細胞以增加基因產物的生產。可通過將序列的至少一個另外的拷貝整合到宿主細胞基因組中,或通過隨核酸序列包含可擴增的選擇標記基因(如果細胞包含選擇標記基因的擴增拷貝,則核酸序列的另外拷貝可通過在存在合適的選擇劑下培養細胞來篩選)來獲得核酸序列的拷貝數量的增加。用於本發明中的表達載體中的許多是商業上可獲得的。合適的商業表達載體包括來自Sigma-AldrichChemicals,St.LouisMO.的p3xFLAGTM表達載體,它包括用於在哺乳動物宿主細胞中表達的CMV啟動子和hGH聚腺普酸化位點,以及用於在大腸桿菌中擴增的pBR322複製起點和氨比西林抗性標記基因。其他合適的表達載體是可從Stratagene,LaJollaCA商業獲得的pBluesciiptllSK(-)⑧和pBK-CMV,以及從pBR322(GibcoBRL)、pUC(GibcoBRL)、pREP4、pCEP4(Invitrogen)或pPolyf;亍生的質粒(Lathe等人,1987,G麼57:193-201)。6.4用於表達酮還原酶多肽的宿主細胞在另一個方面中,本公開提供包含編碼本公開的改善的酮還原酶多肽的多核苷酸的宿主細胞,該多核苷酸可操作地連接於在宿主細胞中用於表達酮還原酶的一個或多個控制序列。用於表達由本發明的表達載體編碼的酮還原酶多肽的宿主細胞在本領域中是公知的,並且包括4旦不限於細菌細月包,諸如大腸桿菌、克菲爾乳桿菌、短乳桿菌、鏈黴菌(S"e/7towyces)和鼠傷寒沙門氏菌(Sa/mowe〃af_y//wmmMm)細胞;真菌細胞,諸如酵母細胞(例如釀酒酵母或畢赤酵母(Pzc/h";7"Ww^)(ATCC登錄號201178));昆蟲細胞,諸如果蠅S2和灰翅夜蛾Sf9(Spod叩teraSf9)細胞;動物細胞,諸如CHO、COS、BHK、293和Bowes黑色素瘤細胞;以及植物細胞。以上描述的宿主細胞的合適的培養基和生長條件在本領域中是公知的。通過本領域中所知的各種方法可將用於表達酮還原酶的多核苷酸導入細胞。技術包括電穿孔、生物射彈粒子轟擊(biolisticparticlebombardment),脂質體介導的轉染、氯化釣轉染和原生質體融合以及其他技術。用於將多核香酸導入細胞的各種方法對本領域技術人員將是明顯的。示例性宿主細胞是大腸桿菌(foc/em:/2,aco/,')W3110。通過將編碼改善的酮還原酶的多核苷酸可^:作地連"t妻到質粒pCK110900,進而可操作地連接於由/fld阻抑蛋白控制的啟動子來產生表達載體。表達載體還包含P15a複製起點和氯黴素抗性基因。大腸桿菌W3110中含有主題多核苷酸的細胞通過使細胞經受氯黴素選擇來分離。6.5產生工程酮還原酶多肽的方法為了製備本公開的改善的酮還原酶多核苷酸和多肽,從克菲爾乳桿菌或短乳桿菌獲得催化還原反應的天然存在的酮還原酶。在一些實施方案中,對母體多核苷酸序列進行了密碼子優化以增強特定宿主細胞中酮還原酶的表達。作為示例,從根據Genbank資料庫中可獲得的克菲爾乳桿菌KRED序列的已知多肽序列(Genbank登錄號AAP94029GI:33112056)製備的寡核苷酸構建編碼野生型克菲爾乳桿菌的酮還原酶多肽的母體多核苷酸序列。將母體多核苷酸序列(稱為SEQIDNO:1)密碼子優化以在大腸桿菌中表達,並且將密碼子優化的多核苷酸克隆於表達載體,將酮還原酶基因的表達置於啟動子和/acl阻抑蛋白基因的控制之下。鑑別在大腸桿菌中表達活性酮還原酶的克隆,並且測序基因以確定它們的同一性。指定的序列(SEQIDN0:1)是用作從克菲爾乳桿菌酮還原酶進化的工程酮還原酶的所有實驗和文庫構建的起始點的母體序列。如前所述,通過使編碼天然存在的酮還原酶的多核苷酸經受誘變和/或定向進化方法可獲得工程酮還原酶。示例性定向進化技術是誘變和/或DNA改組,參見Stemmer,1994,PracA^/爿o^&,t/&491:10747-10751;WO95/22625;WO97/0078;WO97/35966;WO98/27230;WO00/42651;WO01/75767和美國專利6,537,746。除了別的以外,可用的其他定向進化程序包括交叉延伸過程(staggeredextensionprocess)(SffiP)、體外重組(Zhao等人,1998,艦胸ec/wo/.16:258-261)、誘變PCR(Caldwell等人,1994,POM^/2od"///.3:S136-S140)和盒式誘變(Black等人,1996,PracAto/爿cat/to園93:3525-3529)。從誘變處理後獲得的克隆中篩選具有所需改善的酶性質的工程酮還原酶。由於NADH或NADPH轉化為NAD+或NADP+,因此使用監測NADH或NADPH濃度的減少速率(經由吸光度或焚光的減少)的標準生物化學技術可對來自表達文庫的酶活性進行測量。在這一反應中,當酮還原酶將酮底物還原為對應的鞋基時,酮還原酶消耗(氧化)了NADH或NADPH。如通過吸光度或焚光的減少所測,每單位時間NADH或NADPH濃度的減少速率表明在固定量的溶解產物(或由此製備的凍千粉末)中酮還原酶多肽的相對(酶促)活性。如果所需的改善的酶性質是熱穩定性,則可在酶製品經受確定的溫度並測量熱處理後剩餘的酶活性的量之後來測量酶活性。然後分離含有編碼酮還原酶的多核苷酸的克隆,並對其測序以鑑別核苷酸序列的變化(如果有),並將其用於在宿主細胞中表達酶。才艮據已知的合成方法,如果知道工程多肽的序列,則編碼酶的多核苷酸可通過標準固相方法製備。在一些實施方案中,多達約100個鹼基的片段可被單獨地合成,然後連接(例如通過酶促或化學連接(litigation)方法,或聚合酶介導的方法)以形成任何所需的連續序列。例如,本發明的多核苷酸和寡核苷酸可通過化學合成來製備,其使用例如Beaucage等人,1981,7fef厶e"22:1859-69中描述的經典亞磷醯胺方法,或Matthes等人,1984,五^ffi(9J.3:801-05中描述的方法,例如,如其通常在自動化合成方法中所實踐的。根據亞磷醯胺方法,寡核苷酸被合成(例如在自動DNA合成儀中)、純化、退火、連接並克隆於合適的載體中。此外,基本上任何核酸可從各種商業來源中任何一個來獲得,所述商業來源諸如TheMidlandCertifiedReagentCompany,Midland,TX、TheGreatAmericanGeneCompany,Ramona,CA、ExpressGenInc.Chicago,IL、OperonTechnologiesInc.,Alameda,CA以及許多其他的/>司。在宿主細胞中表達的工程酮還原酶可從細胞和/或培養基回收,其使用了蛋白質純化公知技術中的任何一種或多種,包括溶菌酶處理、超聲、過濾、鹽析、超速離心和色譜以及其他方法。用於從細菌(諸如大腸桿菌)中溶解和高效提取蛋白質的合適溶液是以St.LouisMO的Sigma-Aldrich的商標名CelLyticBtm市售的。用於分離酮還原酶多肽的色譜技術包括反相色譜高效液相色諳、離子交換色譜、凝膠電泳和親和色譜以及其他技術。用於純化特定酶的條件將部分依賴於諸如淨電荷、疏水性、親水性、分子量、分子形狀等因素,並將對本領域技術人員是明顯的。在一些實施方案中,親和技術可用於分離改善的酮還原酶。對於親和色i普純化,可使用特異性結合酮還原酶多肽的任何抗體。為了產生抗體,各種宿主動物,包括但不限於兔、小鼠、大鼠等等,可通過用化合物注射來免疫。該化合物可通過側鏈官能團或連接到側鏈官能團的連接體連接於合適的載體,諸如BSA。根據宿主物種,可使用各種佐劑以增加免疫應答,佐劑包括但不限於弗氏佐劑(完全和不完全)、礦物凝膠(諸如氫氧化鋁)、表面活性物質(諸如溶血卵磷脂)、普盧蘭尼克多元醇類(pluronicpolyol)、聚陰離子、肽、油乳劑、匙孔血藍蛋白、二硝基苯酚和可能有用的人類佐劑,諸如BCG(卡介苗)和短小棒狀桿菌(Corynebacteriumparvum)。6.6使用工程酮還原酶和由其製備的化合物的方法本文描述的酮還原酶可將如式(I)的結構所代表的底物1-[4-(4-氟-2-甲基-lH-吲哚-5-基氧基)-5-曱基-吡咯並[2,1《[1,2,4]三嗪-6-基氧基]-丙-2-酮催化還原為如式(II)的結構所代表的手性醇產物(W)-1-[4-(4-氟-2-曱基-lH-吲哚-5-基氧基)-5-甲基-吡咯並[2,1《[1,2,4]三嗪-6-基氧基]-丙-2-醇以上化合物用於合成蛋白質激酶抑制劑,並且被包含於一類化合物中,這類化合物描述於美國申請第US2006/0004007、US2006/0128709;US2006/0257400;US20060264438和US20060286646(所有出版物在此通過引用併入)號中。因此,具有所需酮基的該類的其他化合物可用作本文公開的酮還原酶的底物。在不同的實施方案中,方法可包括用本公開的酮還原酶在適合於將底物轉化為結構式(n)的化合物的反應條件下與式(i)的化合物接觸或混合。示例性反應條件描述於實施例中。其他合適的反應條件對本領域技術人員將是明顯的。可用於該方法的示例性酮還原酶多肽包括但不限於SEQIDNO:6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、48、50、52、54、56、58、60、62、64、66、68、70、72、74、76、78、80、82、84、86、88、90、92、94、96、98、100、102、104、106、108、110、112、114、116和118。在一些實施方案中,本文描述的酮還原酶多肽能夠將如結構式(III)代表的底物乙醯苯轉化為由結構式(IV)代表的對應手性醇產物(W)-l-苯基乙醇在不同的實施方案中,方法可包括用本公開的酮還原酶在適合於將底物轉化為結構式(IV)的化合物的反應條件下與式(III)的化合物接觸或混合。示例性反應條件描述於實施例(參見例如實施例15)中。其他合適的反應條件對本領域技術人員將是明顯的。可用於該方法的示例性酮還原酶多肽包括但不限於SEQIDNO:6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、48、50、52、54、56、58、60、62、64、66、68、70、72、74、76、78、80、82、84、86、88、90、92、94、96、98、100、102、104、106、108、110、112、114、116、118、120、122、124、126、128、130、132、134、136或138。在一些實施方案中,可用於將乙醯苯還原或轉化為(W)1-苯基乙醇的酮還原酶多肽選自SEQIDNO:120、122、124、126、128、〗30、132、134、136或138的多肽。在一些實施方案中,產生的產物以特定的立體異構體(即化合物(II)或化合物(IV))富集。如本文所用,當存在的特定的立體異構體超過存在於化合物中的任何其他立體異構體時,化合物以該特定的立體異構體"富集"。以特定的立體異構體富集的化合物通常將包括至少約60%或更多、70%或更多、80%或更多、90%或更多、95%或更多、96%或更多、97%或更多、98%或更多、99%或更多或99.5%或更多的指定的立體異構體。使用本領域技術人員常規使用的常規分析方法,可確定特定立體異構體的富集的量。59在一些實施方案中,不需要的立體異構體的量可以少於10%,例如少於9%、少於8%、少於7%、少於6%、少於5%、少於4%、少於3%、少於2%、少於1%或甚至少於0.9%、0.8%、0.7%、0.6%、0.5%、0.4%、0.2%或0.1%。含有至少約99.5%或更多所需的立體異構體的立體異構體富集的化合物本文稱為"大致純的,,立體異構體。在一些實施方案中,以特定立體異構體大致純的化合物含有超過99.0%、99.2%、99.4%、99.6%、99.8%或甚至更高的純度。含有>99.9%的所需立體異構體的立體異構體富集的化合物本文稱為"純的"立體異構體。如本領域技術人員所知,酮還原酶催化的還原反應通常需要輔因子。由本文描述的工程酮還原酶催化的還原反應通常也需要輔因子,儘管工程酮還原酶的許多實施方案需要的輔因子遠少於用野生型酮還原酶催化的反應。如本文所用,術語"輔因子"指與酮還原酶組合起作用的非蛋白質化合物。適合與本文描述的工程酮還原酶一起使用的輔因子包括但不限於NADP+(煙醯胺腺噪呤二核苷酸磷酸)、NADPH(NADP+的還原形式)、NAD+(煙醯胺腺噪呤二核苦酸)和NADH(NAD+的還原形式)。一般來說,將還原形式的輔因子添加到反應混合物。還原型NAD(P)H形式可使用輔因子再生系統從氧化型NAD(P)+形式任選地再生。可使用的合適的示例性輔因子再生系統包括但不限於葡萄糖和葡糖脫氫酶、甲酸鹽和曱酸脫氬酶、葡糖-6-磷酸和葡糖-6-磷酸脫氫酶、仲醇(例如異丙醇)和仲醇脫氫酶、亞磷酸酯和亞磷酸脫氫酶、分子氫和氬化酶,以及類似系統。這些系統可與作為輔因子的NADP+/NADPH或NAD+/NADH組合使用。使用氫化酶的電化學再生也可用作輔因子再生系統。參見,例如美國專利第5,538,867和6,495,023號,它們兩者通過引用在此併入。包含金屬催化劑和還原劑(例如,分子氫或甲酸鹽)的化學輔因子再生系統也是合適的。參見例如PCT公布WO2000/053731,其通過引用在此併入。本文中,術語"葡糖脫氫酶"和"GDH"可互換使用以指NAD+或NADP+依賴性酶,它們分別催化D-葡萄糖和NAD+或NADP+轉化為葡糖酸和NADH或NADPH。以下反應式(1)描述葡糖脫氫酶催化的葡萄糖對NAD+或NADP+的還原。/,、GDH(1)葡萄糖+NAD(P)++H20-葡糖酸+NAD(P)H十H+適合用於本文描述的方法的實踐的葡糖脫氫酶包括天然存在的葡糖脫氬酶以及非天然存在的葡糖脫氬酶。天然存在的葡糖脫氬酶編碼基因已經在文獻中報導。例如枯草芽孢桿菌61297GDH基因在大腸桿菌中被表達,並且已經報導它表現出與其固有宿主中產生的酶相同的物理化學性質(Vasantha等人,1983,Ato/.OSM80:785)。對應於Genbank登錄號M12276的枯草芽孢桿菌GDH基因的基因序列由Lampel等人,1986,《/.^f"e〃》/.166:238-243報導,並且由Yamane等人,1996,A//craZw/ogy142:3047-3056才艮道其修正形式為Genbank登錄號D50453。天然存在的GDH基因還包括編碼來自蠟狀芽孢桿菌cere仏v)ATCC145792003,423:87-91;Genbank登錄號AE017013)和巨大芽孢桿菌(及wegateramO歷oc/2e附.,1988,174:485-490,Genbank登錄號X12370;J.F^we"/.,1990,70:363-369,Genbank登錄號GI216270)的GDH的基因。來自芽孢桿菌(i^"〃WH/.)的葡糖脫氫酶在PCT公布WO2005/018579中提供為SEQIDNO:10和12(分別由對應於PCT公布的SEQIDNO:9和11的多核芬酸序列編碼),其公開通過引用在非天然存在的葡糖脫氬酶可使用已知的方法諸如,例如,誘變、定向進化以及類似方法製備。具有合適活性的GDH酶,不論是天然存在的還是非天然存在的,可使用PCT公布WO2005/018579的實施例4中描述的測定來容易地鑑別,所述專利的公開通過引用在此併入。示例性非天然存在的葡糖脫氫酶在PCT公布WO2005/018579中提供為SEQIDNO:62、64、66、68、122、124和126。編碼它們的多核普酸序列在PCT公布WO2005/018579中分別提供為SEQIDNO:61、63、65、67、121、123和125。所有這些序列通過引用在此併入。適合於在本文公開的酮還原酶催化的還原反應中使用的另外的非天然存在的葡糖脫氫酶在美國申請公布第2005/0095619和2005/0153417號中提供,其公開通過引用在此併入。在本文描述的酮還原酶催化的還原反應中使用的葡糖脫氫酶在PCT公布WO2005/018579的實施例4中描述的測定中可表現出至少約10Hmol/min/mg,並且有時為至少約102|imol/min/mg或約103jimol/min/mg、多達約104pmol/min/mg或更高的活性。本文描述的酮還原酶催化的還原反應一般在溶劑中進行。合適的溶劑包括水、有機溶劑(例如乙酸乙酯、乙酸丁酯、l-辛醇、庚烷、辛烷、甲基井又丁基醚(MTBE)、甲苯以及類似溶劑)和離子液體(例如l-乙基4-曱基咪唑鎿四氟硼酸鹽、l-丁基-3-曱基咪唑鎿四氟硼酸鹽、l-丁基-3-甲基咪唑鐺六氟磷酸鹽以及類似離子液體)。在一些實施方案中,使用水性溶劑,包括水和水性共溶劑系統。示例性水性共溶劑系統具有水和一種或多種有機溶劑。一4殳來說,選擇水性共溶劑系統的有機溶劑組分以使其不會完全使酮還原酶滅活。利用如本文描述的那些酶活性測定,通過在候選溶劑系統中用確定的關注底物測量指定的工程酮還原酶的酶促活性,可容易地鑑別合適的共溶劑系統。水性共溶劑系統的有機溶劑組分可以是與水性組分混溶的,提供單一的液相,或可以是與水性組分部分混溶的或不能混溶的,提供兩個液相。一般來說,當使用水性共溶劑系統時,選擇它是兩相的,水分散於有機溶劑,或相反。一般來說,當利用水性共溶劑系統時,需要選擇能夠容易地與水相分離的有機溶劑。一般來說,共溶劑系統中水比有機溶劑的比例通常在有機溶劑比水約90:10至約10:90(v/v)的範圍內,和有機溶劑比水在80:20和20:80(v/v)之間。共溶劑系統可在加入反應混合物前預先形成,或其可以在反應器內原位形成。水性溶劑(水或水性共溶劑系統)可以是pH緩衝的或未緩衝的。一般來說,可在約10或以下的pH,通常在約5至約10的範圍內進行還原。在一些實施方案中,在約9或以下的pH,通常在約5至約9的範圍內進行還原。在一些實施方案中,在約8或以下的pH,經常在約5至約8的範圍內並且通常在約6至約8的範圍內進行還原。還可以在約7.8或以下,或7.5或以下的pH下進行還原。可選地,可在中性pH(即約7)下進行還原。在還原反應過程期間,反應混合物的pH可以改變。通過在反應過程期間加入酸或鹼,可將反應混合物的pH維持在所需的pH或所需的pH範62圍內。可選地,通過使用包含緩衝劑的水性溶劑可控制pH。維持所需pH範圍的合適緩沖劑為本領域所知,並且包括,例如,磷酸鹽緩沖劑、三乙醇胺緩沖劑以及類似緩衝劑。還可使用緩沖和酸或鹼的添加的組合。當使用葡萄糖/葡糖脫氫酶輔因子再生系統時,如反應式(3)所代表,葡糖酸(pKa=3.6)的共同產生(co-production)引起反應混和物的pH的下降,如果產生的水性葡糖酸沒有通過其他途徑中和。可通過標準緩衝技術,其中緩衝劑中和葡糖酸直到所提供的緩衝容量,或通過與轉化過程同步加入鹼,將反應混合物的pH維持在所需水平。還可使用緩沖和鹼的添加的組合。維持所需pH範圍的合適緩沖劑如上所述。用於中和葡糖酸的合適的鹼是有機鹼例如胺、醇鹽以及類似有機鹼,和無機鹼例如氫氧化物鹽(例如NaOH)、碳酸鹽(例如NaHC03)、碳酸氫鹽(例如&0)3)、鹼式磷酸鹽(例如K2HP04、Na3P04)以及類似無機鹼。伴隨轉化過程的鹼添加,可在監測反應混合物pH的同時手動進行,或更加方便地,通過使用自動滴定計作為恆pH器(pHstat)來進行。部分緩衝容量和鹼的添加的組合也可用於過程控制。當使用鹼的添加來中和酮還原酶催化的還原反應期間釋放的葡糖酸時,轉化的過程可通過維持pH所添加的鹼的量來監測。通常,將在還原過程中加入到非緩衝的或部分緩衝的反應混合物的鹼以水性溶液添加。在一些實施方案中,輔因子再生系統可包括甲酸脫氫酶。本文中,術語"曱酸脫氫酶"和"FDH"可互換使用以指NAD+或NADP+依賴性酶,它們分別催化甲酸鹽和NAD+或NADP+轉化為二氧化碳和NADH或NADPH。適合於用作本文描述的酮還原酶催化的還原反應中的輔因子再生系統的曱酸脫氫酶包括天然存在的曱酸脫氫酶以及非天然存在的曱酸脫氬酶。甲酸脫氫酶包括對應於PCT公布WO2005/018579的SEQIDNO:70(假單胞菌(屍s^d/o/wo"osw.))和72(博伊丁假絲酵母(C""t/"^ZoWm7))的甲酸脫氬酶,SEQIDNO:70和72由對應於PCT公布2005/018579的SEQIDNO:69和71的多核苦酸序列分別編碼,所述專利的公開通過引用在此併入。在本文描述的方法中使用的甲酸脫氫酶,不論是天然存在的還是非天然存在的,可表現出至少約1pmol/min/mg、有時至少約10pmol/min/mg、或至少約102(xmol/min/mg,多達約103pmol/min/mg或更高的活性,並且在PCT公布WO2005/018579的實施例4中描述的測定中可容易地篩選其活性。如本文所用,術語"甲酸鹽"指甲酸陰離子(HC(V)、甲酸(HC02H)及其混合物。曱酸鹽可提供為鹽的形式,通常是鹼金屬鹽或銨鹽(例如HC02Na、KHCCbNH4以及類似的鹽);曱酸的形式,通常是曱酸水溶液;或其混合物的形式。曱酸是中度酸。在其pKa(水中pKa=3.7)的幾個pH單位內的水溶液中,甲酸鹽以平衡濃度的HC02—和HC02H存在。當pH值大於約pH4時,曱酸鹽主要以HC(V存在。當甲酸鹽作為甲酸提供時,反應混合物通常被緩衝或通過加入鹼來使酸性降低以提供所需的pH,通常是約pH5或更高。用於中和甲酸的合適的鹼包括但不限於有機鹼例如胺、醇鹽以及類似有機鹼,和無機鹼例如氫氧化物鹽(例如NaOH)、碳酸鹽(例如NaHC03)、石灰酸氫鹽(例如K2C03)、鹼式磷酸鹽(例如K2HP04、Na3P04)以及類似無才/U鹹。對於大於約pH5的pH值,此時甲酸鹽主要以HC(V存在,以下反應式(2)描述甲酸脫氫酶催化的甲酸鹽對NAD+或NADP+的還原。/,、iFDH(2)HCCV+NAD(P)+--C02+NAD(P)H當使用甲酸鹽和甲酸脫氫酶作為輔因子再生系統時,可通過標準緩沖技術,其中緩衝劑釋放質子至多為所提供的緩沖容量,或通過與轉化過程同時添加酸,將反應混合物的pH維持在所需的水平。反應過程期間添加以維持pH的合適的酸包括有機酸,例如羧酸、磺酸、膦酸以及類似有機酸,礦物酸例如氬卣酸(諸如鹽酸)、硫酸、磷酸以及類似礦物酸,酸式鹽例如二氬磷酸鹽(例如KH2P04)、硫酸氬鹽(例如NaHSOj以及類似酸式鹽。一些實施方案利用曱酸,藉此維持曱酸鹽濃度和溶液的pH。在使用甲酸鹽/甲酸脫氫酶輔因子再生系統的還原反應期間,當使用添加酸來維持pH時,可通過維持pH所添加的酸的量監測轉化過程。通常,轉化過程中加入到非緩衝的或部分緩沖的反應混合物的酸以水性溶液添加。本文中,術語"仲醇脫氫酶"和"sADH"互換使用以指NAD+或NADP+依賴性酶,它們分別催化仲醇和NAD+或NADP+轉化為酮和NADH或NADPH。以下,反應式(3)描述仲醇對NAD+或NADP+的還原,以異丙醇為例。,,、OH+sADHo丄(3)+NAD(P)+-^jj^+NAD(P)H+H+適合於用作本文描述的酮還原酶催化的還原反應中的輔因子再生系統的仲醇脫氫酶包括天然存在的仲醇脫氫酶以及非天然存在的仲醇脫氫酶。天然存在的仲醇脫氫酶包括來自布氏熱厭氧菌(77eww朋era/^w/7rachz)、紅平紅J求菌(7/2c^ococcwse0^ra/o/^)、克菲爾乳桿菌和短乳桿菌的已知醇脫氫酶,而非天然存在的仲醇脫氬酶包括由此衍生的工程醇脫氯酶。在本文描述的方法中使用的仲醇脫氳酶,不論是天然存在的還是非天然存在的,可表現出至少約1nmol/min/mg、有時至少約10nmol/min/mg、或至少約102nmol/min/mg,多達約103^mol/min/mg或更高的活性。合適的仲醇包括低級仲鏈烷醇和芳基-烷基曱醇。低級仲醇的實例包括異丙醇、2-丁醇、3-甲基-2-丁醇、2-戊醇、3-戊醇、3,3-二甲基-2-丁醇以及類似低級仲醇。在一個實施方案中,仲醇是異丙醇。合適的芳基-烷基甲醇包括未取代的和取代的l-芳基乙醇。當使用仲醇和仲醇脫氫酶作為輔因子再生系統時,通過仲醇脫氫酶將仲醇偶聯氧化為酮,進而還原產生的NAD+或NADP+。一些工程酮還原酶還具有使仲醇還原劑脫氫的活性。在一些使用仲醇作為還原劑的實施方案中,工程酮還原酶和仲醇脫氬酶是同一個酶。在使用輔因子再生系統執行本文描述的酮還原酶催化的還原反應的實施方案時,初始可提供氧化或還原形式的輔因子。如上所述,輔因子再生系統將氧化的輔因子轉化為其還原形式,然後在酮還原酶底物的還原中使用所述還原形式。在一些實施方案中,不使用輔因子再生系統。對於沒有使用輔因子再生系統執行的還原反應,向反應混合物加入還原形式的輔因子。65在一些實施方案中,當使用宿主生物體的全細胞才丸行該過程時,該全細胞可自身提供輔因子。可選地或在組合中,該細胞可自身或重組地提供葡糖脫氫酶。在執行本文描述的對映選擇性還原反應中,可向反應混合物加入純化酶、用編碼該酶的基因轉化的全細胞、和/或該細胞的細胞提取物和/或溶解產物的形式的工程酮還原酶和包含任選的輔因子再生系統的任何酶。編碼工程酮還原酶和任選的輔因子再生酶的基因可分別轉化到宿主細胞,或一起轉化到相同的宿主細胞。例如,在一些實施方案中,一組宿主細胞可用編碼工程酮還原酶的基因轉化,並且另一組可用編碼輔因子再生酶的基因轉化。可以以全細胞的形式或由此衍生的溶解產物或提取物的形式,將兩組轉化的細胞一起用於反應混合物。在其他的實施方案中,宿主細胞可以用編碼工程酮還原酶和輔因子再生酶的基因轉化。用編碼工程酮還原酶和/或任選的輔因子再生酶的基因轉化的全細胞,或其細胞提取物和/或溶解產物,可以多種不同的形式使用,包括固體(例如凍幹固體、噴霧乾燥的固體以及類似的固體)或半固體(例如粗糊劑)。通過沉澱(硫酸銨、聚乙烯亞胺、熱處理或類似處理),隨後通過凍千前的脫鹽程序(例如超濾、透析以及類似處理)可部分純化細胞提取物或細胞溶解產物。可通過使用已知交聯劑(諸如例如戊二醛)交聯或固定於固相(例如EupergitC以及類似固相)來穩定任何的細胞製品。可向反應提供各種不同形式的固體反應物(例如酶、鹽等等),包括粉末(例如凍千的、噴霧乾燥的以及類似的)、溶液、乳劑、懸浮液以及類似形式。使用本領域普通技術人員所知的方法和設備,可容易地凍千或噴霧乾燥反應物。例如,蛋白質溶液可以小的等份在-80。C下冷凍,然後加入到預冷的凍千室中,隨後施用真空。在除去樣品中的水後,通常將溫度升至4。C,持續2小時,然後釋放真空並回收凍幹樣品。在還原反應中所用的反應物的量通常將根椐所需產物的量和伴隨地所用酮還原酶底物的量而變化。以下指導可用於確定^f吏用的酮還原酶、輔因子和任選的輔因子再生系統的量。一般來說,使用約50mg至約5g的酮還原酶和約10mg至約150mg的輔因子,可使用濃度約20至300克/升的酮底物。本領域普通技術人員將容易地理解,如何改變這些量以將它們調整到生產力和生產規模的所需水平。根據所用的輔因子和/或酮還原酶的量,通過常規實驗可容易地確定任選的輔因子再生系統的合適的量。一般來說,使用的還原劑(例如葡萄糖、曱酸鹽、異丙醇等等)的水平超過酮還原酶底物的等摩爾水平,以實現酮還原酶底物基本完全或幾乎完全的轉化。反應物的加入順序並不重要。反應物可在相同的時間一起加入到溶劑(例如單相溶劑、兩相水性共溶劑系統以及類似溶劑)中,或可選地,可分別加入反應物中的一些,並且一些反應物在不同的時間點一起加入。例如,可首先將輔因子再生系統、輔因子、酮還原酶和酮還原酶底物加入到溶劑中。為了改善使用水性共溶劑系統時的混合效力,可首先將輔因子再生系統、酮還原酶和輔因子加入並混合到水相。然後可加入有機相併混合,隨後加入酮還原酶底物。可選地,酮還原酶底物可以在力Q入到水相之前,於有才幾相中預混合。用於執行本文描述的酮還原酶催化的還原反應的合適條件包括很多種條件,它們可容易地被常規實驗優化,實驗包括但不限於在實驗pH和溫度下使工程酮還原酶和底物接觸,並且例如,使用本文提供的實施例中描述的方法檢測產物。通常在約15。C至約75。C的溫度範圍內執行酮還原酶催化的還原。對於一些實施方案,在約2(TC至約55。C的溫度範圍內執行反應。在其他的實施方案中,在約20。C至約45。C的溫度範圍內執行反應。還可以在環境條件下執行反應。通常允許還原反應進行,直到實現底物的基本完全或幾乎完全還原。底物還原為產物可使用已知的方法,通過檢測底物和/或產物來監測。合適的方法包括氣相色譜、HPLC以及類似方法。在反應混合物中產生的醇還原產物的轉化收率通常大於約50%,還可大於約60%,還可大於約70%,還可大於約80%,還可大於90%並且通常大於約97%。7.實施例在以下的代表性實施例中闡明本/>開的各種特徵和實施方案,實施例意在示例而不是限制。在以下的描述中,不論何處使用葡糖脫氫酶(GDH),它是可從JulichChiralSolutions,Jtilich,德國獲得的GDHCDX901。7.1實施例l:野生型酮還原酶基因的獲得和表達載體的構建根據已報導的酮還原酶的胺基酸序列和如美國臨時申請序列號60/848,950(通過引用在此併入)的實施例1所描述的密碼子優化算法,設計用於在大腸桿菌中表達的酮還原酶(KRED)編碼基因。使用包括42個核香酸的寡核苷酸合成基因,並且將其克隆於表達載體pCKl10900(如美國專利申請公布20060195947的圖3所描述)並處於/ac啟動子的控制下。該表達載體還包含P15a複製起點和氯黴素抗性基因。使用標準方法將產生的質粒轉化到大腸桿菌W3110。可發現密碼子優化的基因和編碼多肽"W-Z^基因(Genbank登錄號GI:28400789)和a^-丄AT基因(Genbank登錄號AAP94029.1;GI:33112056)為SEQIDNO:l和3。如美國臨時申請序列號60/848,950所描述,確認了野生型酮還原酶的活性。本文使用的其他酮還原酶,包括密碼子優化的基因,以及M〃24w/(Genbank登錄號NP—010159.1;GI:6320079)、"W-Z^基因(Genbank登錄號1NXQ—A;GI:30749782)、a^-i^基因(Genbank登錄號AAN73270.1;GI:34776951)、]^W/基因(Genbank登錄號NP_010656.1;GI:6320576)、基因(Genbank登錄號NP014490.1;GI:6324421)的編碼多肽也公開於美國臨時申請序列號60/848,950,其通過引用在此併入。編碼本公開的工程酮還原酶的多核苷酸同樣地克隆於載體pCK110900,以便在大腸桿菌W3110中表達。7.2實施例2:用於底物特異性和轉化的LC/MS/MS測定將含有具有所關注的酮還原酶基因的質粒的大腸桿菌的單一微生物菌落接種於50ml含有30jig/ml氯黴素和1%葡萄糖的LB肉湯(LuriaBertanibroth)。30°C,250rpm振蕩下,使細胞在培養箱中生長過夜(至少16小時)。將培養物稀釋於250mlTerrific肉湯(TerrificBroth)(12g/L細菌用月爽蛋白腖、24g/L酵母提取物、4ml/L甘油、65mM磷酸鉀、pH7.0、ImMMgSO4、30昭/ml氯黴素於1升燒瓶中)至600nm處的光密度(OD600)為0.2,並允許其在30。C下生長。當培養物的OD600是0.6至0.8時,酮還原酶基因的表達用lmMIPTG誘導,並孵育過夜(至少16小時)。通過離心(5000rpm,15min,4°C)收穫細胞,並棄去上清液。將細胞沉澱物用等體積的冷(4°C)的100mM三乙醇胺(氯化物)緩沖液,pH7.0(在ADH-LK和ADH-LB以及由此衍生的工程酮還原酶的情況中,包括2mMMgS04)再次懸浮,並通過如上的離心收穫。將洗滌的細胞在兩體積的冷三乙醇胺(氯化物)緩衝液中再次懸浮,並在12000psi下穿過弗氏壓碎器2次,且保持在4。C。通過離心(9000rpm,45min,4°C)除去細胞碎片。收集澄清的溶解產物上清液,並在-2(TC下儲存。凍千冷凍的澄清溶解產物提供粗酮還原酶的乾燥粉末。如美國臨時申請序列號60/848,950所描述,確認了野生型酮還原酶的活性。向1mL100mM磷酸鹽(鈉)緩沖液,pH7.5的溶液加入10mg酮還原酶粉末、50mgNAD(P)H、100異丙醇和10mg4'-氯乙醯苯或未取代的乙醯苯。將反應混合物在室溫下攪拌16小時,然後用lmLMTBE萃取。通過手性HPLC分析MTBE相的樣品中4'-氯乙醯苯的轉化和產物l-(4'-氯苯基)乙醇的對映異構體組成。7.3實施例3:酮還原酶的生產;發酵過程。在充氣攪拌的15L發酵罐中,使6.0L的生長培養基達到30。C的溫度,所述培養基包括0.88g/L硫酸銨、0.98g/L的杵檬酸鈉;12.5g/L的磷酸氬二鉀三水合物、6.25g/L的磷酸二氬鉀、6.2g/L的Tastone-154酵母提取物、0.083g/L檸檬酸鐵銨和8.3ml/L的微量元素溶液,微量元素溶液含有2g/L的氯化鈣二水合物、2.2g/L好^酸鋅七水合物、0.5g/L硫酸鎂一水合物、1g/L石克酸亞銅七水合物、0.1g/L鉬酸4姿四水合物和0.02g/L四硼S吏鈉十水合物。發酵罐用大腸桿菌W3110的後期指數培養物接種,所述培養物含有具有所關注的酮還原酶基因的質粒,在如實施例3所描述的搖瓶中生長至起始OD600為0.5至2.0。發酵罐以500-1500rpm攪拌,並且以1.0-15.0L/min向發酵容器提供空氣以保持30。/。飽和的溶氧水平或更高。通過加入2Q/。v/v的氫氧化銨,將培養物的pH控制在7.0。通過添加含有500g/L工業葡萄糖(cerelose)、12g/L氯化銨和10.4g/L碌L酸鎂七水合物的神+液(feedsolution)來維持培養物的生長。培養物達到50的OD600後,通過加入異丙基-b-D-硫代半乳糖苷(IPTG)至lmM的最終濃度來誘導酮還原酶的表達。使培養物生長另外14個小時。然後將培養物冷卻至4'C,並維持在4。C直到收穫。4'C下在SorvalRC12BP離心才幾中以5000G離心40分鐘收穫細胞。收穫的細胞直接用於以下的下遊回收過程,或在4。C下儲存直到此類使用。4°C下,將細胞沉澱物再次懸浮於2體積的100mM三乙醇胺(氯化物)緩衝液,pH6.8(每體積的溼細胞糊狀物(wetcellpaste))。通過使用12000psig的壓力將該懸浮液通過安裝二級勻漿閥組件(assembly)的勻漿機,使細胞內酮還原酶從細胞釋放。破壞後,立即將細胞勻漿物冷卻至4匸。將10%w/v的聚乙烯亞胺溶液,pH7.2加入到溶解產物至最終濃度0.5%w/v,並攪拌30分鐘。通過在標準實驗室離心機中以5000G離心30分鐘,使產生的懸浮液澄清。傾出澄清的上清液,使用具有截留分子量為30Kd的纖維素超濾膜濃縮10倍。將最終濃縮物分散於淺容器,在-2(TC下冷凍,並凍幹成粉末。將酮還原酶粉末儲存於-80。C。7.4實施例4確定化合物(II)的轉化和對映體過量的分析方法。用於轉化的反相HPLC測定。以下HPLC方法用於在高通量下分析式(I)的化合物還原為式(II)的化合物儀器Agilent1100系列HP方法名稱1549-ISO柱型號EclipseXDBC18柱尺寸2.1x50mm填充尺寸3.5pmC18ZorbaxXDB運行時間3分鐘流動相50%乙腈50%0.25%乙酸流速0.6ml/min,溫度室溫檢測UV250nm洗脫時間醇0.9分鐘酮1.2分鐘。用於確定對映體過量的手性HPLC。以下的HPLC方法用於分離和分析式(II)的化合物的(S)和(R)對映體儀器Agilent1100系列HP柱ChiralpakAD-H,250x4.6mm溶劑等度(Isocratic),80%A(庚烷)和20%B(庚烷-異丙醇50:50)流速1ml/min,溫度室溫檢測UV220nm運行時間45min保留時間如下(I)29.1mm,R-(II)35.4min,S-(II)38.7min。R-和S-醇顯示出具有1:1面積比的基線分離。7.5實施例5:使用葡萄糖和葡糖脫氫酶用於輔因子再生的野生型酮A.還原酶還原化合物(I)的活性的評《將1ml反應體積的含有30mg/LKRED、12mg/mll-[4-(4-氟-2-曱基-1//-吲哚-5-基氧基)-5-曱基-吡咯並[2,1《[1,2,4]三嗪-6-基氧基]丙-2-酮(I)(可4艮據W006130657中的方案1和實施例1獲得,通過引用在此併入)、1.5mg/mLGDHCDX901(JulichChiralSolutions,Jiilich,德國)、lmMNADP+、66mg/mL葡萄糖、200mMNaH2P04/Na2HP04(pH7)、lOOmM三乙醇胺/氯化物緩沖液,pH7.0、1mMMgS04的反應混合物室溫下攪拌孵育20小時,然後用3mL乙酸乙酯萃取,通過如實施例4所描述的方法或根據WO06130657的實施例2的方法分析。結果如表3所示。表3:野生型KRED對化合物(I)的活性酵活性只十映選擇性GREc+SYDLC+S和RYPrR+SADH-LK+RRhoC+S十表明觀察到活性。野生型酮還原酶ADH-LK提供具有〉99.9%的對映選擇性(〉99.9%e.e.)的R-(TI)。該實施例闡明當與輔因子再生系統(葡萄糖和葡糖脫氫酶)組合使用時,對野生型酮還原酶活性和對映選擇性的評價。野生型酮還原酶ADH-LK提供所需的(R)-對映體。7.6實施例6:使用異丙醇用於輔因子再生的野生型酮還原酶還原化合物(I)的活性的評價將1ml的反應體積的含有15mg/mlKRED;在DMF或THF中的2mg/ml(I)(通過對20mg/ml的儲存溶液10倍稀釋來添加)、2mg/mLNADP+、0.4-0.5mlIPA、0.4mllOOmM三乙醇胺/氯化物緩衝液,pH7.0、1mMMgS04的反應混合物室溫下攪拌醉育8小時(當使用DMF時)或16小時(當使用THF時)。樣品通過實施例4和5的方法分析。在這些反應條件下,來自克菲爾乳桿菌的ADH-LK在DMF中提供21%的轉化,且在THF中提供61%的轉化,而來自短乳桿菌的ADH-LB在DMF中提供70%的轉化,且在THF中提供26%的轉化。所述實施例闡明當與用於輔因子再生的IPA組合使用時,對野生型乳桿菌(Z^ctokd〃ws)酮還原酶活性和對映選擇性的評i"介。野生型酮還原酶72ADH-LK在10%THF存在下4是供高e.e.的所需(R)-對映體。7.7實施例7:使用葡萄糖/葡糖脫氫酶用於輔因子再循環的對化合物(I)的酮還原酶活性的高通量HPLC測定。使用Q-bot自動菌落挑取器(GenetixUSA,Inc.,Beaverton,OR),將文庫菌落挑取到含有180pLLB肉湯(LB)、1%葡萄糖和30ng/mL氯黴素(CAM)的96孔淺孔微量滴定板。250rpm振蕩下,使細胞在37。C下生長過夜。然後,將10jiL的這一培養物轉移至含有390Terrific肉湯(TB)和30pg/mLCAM的96深孔^反上。30°C,250rpm振蕩下,將深孔板孵育2.5至3小時(OD6000.6-0.8)後,通過最終濃度1mM的異丙基硫代半乳糖苷(IPTG)誘導細胞培養物表達重組基因。然後,30°C,250rpm振蕩下,將板孵育過夜。細胞經由離心沉澱,在300pL溶解緩衝液中再次懸浮,並通過在室溫下振蕩至少2小時來溶解。溶解緩衝液含有100mM三乙醇胺(氯化物)緩衝液,pH7.0-7.2、1mg/mL溶菌酶和750將/mL硫酸多粘菌素B。通過將測量量的溶解混合物轉移到含有205測定混合物的微量滴定板的孔中,測量酮還原酶的活性,所述測定混合物含有1.7mg/mLGDHCDX901、0.7mg/mlNADP+、66.7mg/mL葡萄糖、200mMNaH2P04/Na2HP04(pH7)、lOOmM三乙醇胺/氯化物緩衝液,pH7.0、lmMMgS04。通過加入25在DMF中的2mg/ml(I)((I)的最終濃度是0.2mg/ml)啟動反應,並且在25。C下孵育1小時。每個孔加入500pL乙腈,混合孔,之後將200pL轉移至Solvinert(Millipore,MA)濾板。通過將solvenert濾板在200rpm下離心1分鐘,將濾液收集到Nunc圓底板。將樣品板密封以防止溶劑蒸發,並根據實施例4通過HPLC分析。7.8實施例8:使用IPA用於輔因子再循環的對化合物(I)的酮還原酶活性的高通量HPLC測定。根據實施例8製備細胞沉澱,將其再次懸浮於具有lmMMgS04的150pL200mM三乙醇胺/氯化物緩衝液,pH7.0。向再次懸浮的細胞加入150的異丙醇,並且在密封板後,通過在室溫下在定軌振蕩器上振蕩至少120分鐘來溶解細胞。通過將測量量的溶解混合物轉移到含有175nL測定混合物以及50在50%THF/50%IPA中的5mg/ml(I)的深孔(2ml)微量滴定板的孔中,測量酮還原酶的活性,所述測定混合物由100mM三乙醇胺/氯化物緩衝液,pH7.0、25%異丙醇(IPA)、2%丙酮、lmMMgS04和0.7mg/mlNADP+組成。通過加入25pL溶解產物(必要時,用等體積的IPA稀釋)啟動反應,熱封,並在25至50。C下,在振蕩培養箱中孵育18小時。在反應末期,將500pL乙酸乙酯加入各孔,再次密封該板,並在定軌振蕩器上劇烈振蕩至少5分鐘。將該板在4000rpm下離心20至30秒。將140乙腈和70pL的乙酸乙酯反應混合物轉移至Solvinert濾板(Millipore,MA),然後通過將solvenert濾板在200rpm下離心3分鐘,將濾液收集到Nunc圓底板。將樣品板密封以防止溶劑蒸發,並根據實施例4通過HPLC分析。7.9實施例9:酮還原酶對異丙醇的活性的高通量螢光預篩選。根據實施例8,使細胞生長,收穫並溶解細胞。在96孔黑色微量滴定板中,將20的樣品(必要時,稀釋於100mM三乙醇胺/氯化物》爰衝液,pH7.0、lmMMgS04)加入到180|iL測定混合物,所述測定混合物由100mM三乙醇胺/氯化物緩衝液,pH7.0、2%異丙醇(IPA)、1mMMgS04組成,並且通過在Flexstation(MolecularDevices,USA)中,監控(following)在330nm激發後NADP由於轉化為NADPH的445nm處螢光的減少來測量反應過程。7.10實施例10:丙酮穩定的酮還原酶的高通量篩選根據實施例8製備細胞沉澱,將其再次懸浮於具有1mMMgS04的150nL200mM三乙醇胺/氯化物緩沖液,pH7.0。將含有76%IPA、20%THF和4%丙酮的150|liL混合物加入到再次懸浮的細胞,並且在密封該板後,通過室溫下,在定軌振蕩器上振蕩18個小時來溶解細胞。通過將測量量的溶解混合物轉移到含有175pL測定混合物以及50在50%THF/50%IPA中的5mg/ml(I)的深孔(2ml)微量滴定板的孔中,測量酮還原酶的活性,所述測定混合物由80mM三乙醇胺/氯化物緩沖液,pH7.0、26.2。/o至37.P/o異丙醇(IPA)、1.8%丙酮、lmMMgS。4和0.7mg/mlNADP+組成。通過加入25溶解產物(必要時,用等體積的IPA稀釋)啟動反應,熱封,並在25至5(TC下,在振蕩培養箱中孵育18小時。在反應末期,將500pL乙酸乙酯加入各孔,再次密封該板,並在定軌振蕩器上劇烈振蕩至少5分鐘。將該板在4000rpm(3220xg)下離心20至30秒。將140乙腈和70的乙酸乙酯反應混合物轉移至Solvinert濾板(Millipore,MA),且通過將solvenert濾板在200rpm下離心3分鐘,將濾液收集到Nunc圓底板。將樣品板密封以防止溶劑蒸發,並根據實施例4通過HPLC分析。7.11實施例ll:使用異丙醇用於輔因子再生的衍生自野生型ADH-LK的工程酮還原酶將化合物(I)還原為(A)-2的改善的活性。將1ml反應體積的含有15mg/mlKRED;在THF中的2mg/ml(I)、2mg/mLNADP+、0.4mlIPA、0.5mllOOmM三乙醇胺/氯化物緩沖液,pH7.0、1mMMgS04的反應混合物室溫下攪拌孵育16小時。樣品通過實施例4和5的方法分^t。在這些反應條件下,在THF中,ADH-LK提供61。/。的轉化、ADH-LB提供26%的轉化;具有SEQIDNO:114的ADH-LK變體提供100%的轉化,且具有SEQIDNO:18的ADH-LK變體提供93%的轉化。當在相似的反應條件下只是用3mg/mlKRED和在THF中的1mg/ml(I)試驗時,2小時的反應時間後,ADH-LK、SEQIDNO:114和SEQIDNO:18的轉化分別是11、100和23%。將來自SEQIDNO:114的突變A94G導入ADH-LB提供了SEQIDNO:116。具有SEQIDNO:114和SEQIDNO:116的酮還原酶在10%DMF中具有相似的活性。通過對比酮還原酶的量、反應時間和轉化,該實施例闡明衍生自野生型酮還原酶ADH-LK的工程酮還原酶與酮還原酶ADH-LK相比,提供改善的活性。7.12實施例12:衍生自ADH-LK的工程酮還原酶對化合物(I)的改善的轉化。在如實施例7所描述的條件下,通過孵育1g/L的各種KRED確定工程ADH-LK多肽的轉化。表4提供對應酮還原酶粉末的SEQIDNO.、從野生型ADH-LK的胺基酸突變的數量和20分鐘反應中化合物(I)向(R)-2的轉化。tableseeoriginaldocumentpage76+:<20%轉化;++:25-75%轉化;+++:〉75%轉化7.13實施例13:衍生自ADH-LK的工程酮還原酶的改善的轉化和對丙酮的耐受性通過在室溫下,使在10。/。THF、40%IPA、50%100mM三乙醇胺-氯化物、1mMMgS04pH8.0、0.7mg/mlNADP+的混合物中的0.5g/L(I)與1g/L的各種KRED,在缺少或存在2%的丙酮下孵育20分鐘,隨後根據實施例4確定轉化,來確定工程ADH-LK變體的轉化和對丙酮的耐受性。表5提供對應酮還原酶粉末的SEQIDNO.、從野生型ADH-LK的胺基酸突變的數量和20分鐘反應中(I)向(R)-2的轉化。對丙酮的耐受性酮還原酶SEQIDNO.乂人ADH-LK的突變沒有丙酮的轉化有丙酮的轉化SEQIDNO:114176%12%SEQIDNO50798%62%SECIDNO:78499.10%96.0%SEQIDNO:110898.6%98.2%7.14實施例14:化合物(II)的R-異構體的製備向含有磁力攪拌子(4x12mm)的20ml樣品瓶(21mmOD)加入3.5mg的NADP+(來自OrientalYeast,Japan的一鈉鹽),25mgSEQIDNO:78的KRED和500mg的(I)。將1.5ml2扁甲基THF(Aldrich,USA)、1.0ml異丙醇和2.5ml100mM三乙醇胺/氯化物(pH8)、1mMMgS04的混合物加入到該固體,並且將產生的三相混合物在40。C下攪拌並加熱(油浴)24小時。從攪拌的混合物中取出樣品,用於根據實施例4或根據WO06130657的實施例2來分析何時(I)完全轉化為〉99.9。/。e.e.的R-(11)。7.15實施例15:使用IPA用於輔因子再循環的乙醯苯還原的高通量手性GC測定手性GC分析儀器AstecChiraldexB-DP柱(30mx0.25mm)溫度ll(TC入口溫度250。C分流比1:100壓力15psi氦檢測器FID,250。C保留時間酮6.6分鐘(TO-醇9.1分鐘(S)-醇9.5分鐘777.16實施例16:使用異丙醇用於輔因子再生的衍生自野生型克菲爾乳桿菌的工程酮還原酶將乙醯苯還原為(/)-l-苯基乙醇的改善的活性通過使用Q-bot自動菌落挑取器(GenetixUSA,Inc.,Beaverton,OR),將菌落挑取到含有180pLLB肉湯(LB)、1%葡萄糖和30貼/mL氯黴素(CAM)的96孔淺孔微量滴定板來製備細胞溶解產物。250rpm振蕩下,使細胞在37°C下生長過夜。然後,將10pL的這一培養物轉移至含有390nLTerrific肉湯(TB)和30嗎/mLCAM的%深孔板上。30°C,250rpm振蕩下,將深孔板孵育2.5至3小時(OD6Q。0.6-0.8)後,通過最終濃度1mM的異丙基硫代半乳糖苦(IPTG)誘導細胞培養物表達重組基因。然後,30°C,250rpm振蕩下,將板賻育過夜。細胞經由離心沉澱,在300pL溶解緩沖液中再次懸浮,並通過在室溫下振蕩至少2小時來溶解。溶解緩衝液含有100mM三乙醇胺(氯化物)緩衝液,pH7.0-7.2、1mg/mL溶菌酶和750昭/mL硫酸多粘菌素B。向100細胞溶解產物加入50100mM三乙醇胺-HCl緩衝液,pH7.0(其含有0.5mMNADP鈉鹽)、300異丙醇和在四氬^^喃(THF)中的5050g/L乙醯苯,並且將該板密封后,通過在室溫下,在定軌振蕩器上以850rpm振蕩4小時來孵育細胞。通過向每個樣品加入1mL的乙酸乙酯,並且在密封微量滴定板後,在室溫下以850rpm振蕩10分鐘來萃取反應產物(1-苯基乙醇)。板在4。C在平板離心機(platecentrifuge)(3220xg)中以4,000rpm離心2分鐘,將來自各孔的200有機相轉移至淺孔板,並在密封該板後進行手性GC分析。表6提供對應酮還原酶的SEQIDNO.、從野生型KEFc(ADH-LK)的胺基酸突變的數量和乙醯苯向(W)-l-苯基乙醇的轉化。表6:乙醯苯的轉化酮還原酶SEQIDNO.從ADH-LK的胺基酸突變的數量轉化tableseeoriginaldocumentpage79+:〈700/o轉化;++:70-90/0轉化;+++:>90%轉化。對於所有的目的,本申請引用的所有出版物、專利、專利申請和其他文件在此通過引用以其整體併入,其等同於對於所有的目的,單獨地指明每個個體出版物、專利、專利申請或其他文件通過引用併入。儘管已經闡述並描述了各個具體的實施方案,但應理解,可進行各種變化而不脫離本發明的精神和範圍。權利要求1.一種重組酮還原酶多肽,其能夠以SEQIDNO2的多肽活性的至少1.5倍將化合物1-[4-(4-氟2-甲基-IH-吲哚-5-基氧基)-5-甲基-吡咯並[2,1-f][1,2,4]三嗪-6-基氧基]-丙-2-酮轉化為1-[4-(4-氟-2-甲基-IH-吲哚-5-基氧基)-5-甲基吡咯並[2,1-f][1,2,4]三嗪-6-基氧基]-丙-2-醇,所述多肽包括與SEQIDNO2或SEQIDNO4具有至少90%序列同一性的胺基酸序列,並且具有(a)對應於SEQIDNO2或SEQIDNO4的殘基94的胺基酸殘基處的芳族胺基酸或G,或(b)對應於SEQIDNO2或SEQIDNO4的殘基96的胺基酸殘基處的S和N之外的胺基酸。2.如權利要求1所述的重組多肽,其中所述胺基酸序列包括對應於SEQIDNO:2或SEQIDNO:4的殘基94的胺基酸殘基處的芳族胺基酸或G。3.如權利要求2所述的重組多肽,其中所述殘基94是F、W、H或Y。4.如權利要求2所述的重組多肽,其中所述胺基酸序列進一步包括選自以下的一個或多個特徵殘基96是S/N之外的任何胺基酸;殘基153是L之外的脂肪族胺基酸殘基;殘基199是L之外的任何胺基酸殘基;殘基202是G,或是A之外的脂肪族胺基酸殘基;以及殘基206是芳族胺基酸殘基。5.如權利要求4所述的重組多肽,其中所述胺基酸序列具有選自以下的特徵中的一個或多個殘基153是G或A;殘基199是K、I、N、R、V、Q或W;殘基202是I、L或G;以及殘基206是F。6.如權利要求1至5中任一項所述的重組多肽,其中所述胺基酸序列進一步包括選自以下的特徵中的一個或多個殘基49是K之外的極性胺基酸殘基;殘基53是酸性胺基酸殘基;殘基54是T/P之外的小的或脂肪族胺基酸殘基;殘基60是V之外的脂肪族胺基酸殘基;殘基95是V之外的脂肪族胺基酸;殘基97是小的胺基酸或G;殘基109是K之外的鹼性胺基酸殘基;殘基147是脂肪族胺基酸殘基;殘基165是羥基或小的胺基酸殘基;殘基197是小的胺基酸殘基或G;殘基223是L之外的脂肪族胺基酸殘基;以及殘基233是小的胺基酸殘基或G。7.如權利要求6所述的重組多肽,其中所述胺基酸序列包括選自以下的一個或多個特徵殘基49是R;殘基53是D;殘基54是A;殘基60是A;殘基95是L;殘基97是G;殘基109是R;殘基147是L;殘基165是T;殘基197是G;殘基223是V;以及殘基233是G。8.如權利要求7所述的重組多肽,其中所述胺基酸序列具有選自以下的一個或多個特徵殘基54是A;殘基109是R;殘基147是L;以及殘基233是G。9.如權利要求1所述的重組多肽,其中所述胺基酸序列包括對應於SEQIDN0:2或SEQIDNO:4的殘基96的胺基酸殘基處的S和N之外的胺基酸。10.如權利要求9所述的重組多肽,其中所述胺基酸序列具有對應於SEQIDNO:2或SEQIDNO:4的殘基96的胺基酸殘基處的G、F、Y或I。11.如權利要求10所述的重組多肽,其中所述胺基酸序列進一步包括選自以下的下列特徵中的一個或多個殘基94是芳族胺基酸殘基或G;殘基153是L之外的脂肪族胺基酸殘基;殘基199是L之外的任何胺基酸殘基;殘基202是A之外的脂肪族胺基酸殘基;或殘基206是芳族胺基酸殘基。12.如權利要求11所述的重組多肽,其中所述胺基酸序列包括選自以下的下列特徵中的一個或多個殘基94是F或G;殘基153是G或A;殘基99是K、I、N、R、V、Q或W;殘基202是I、L或G;以及殘基206是F。13.如權利要求9至12中任一項所述的重組多肽,其中所述胺基酸序列進一步包括選自以下的下列特徵中的一個或多個殘基49是K之外的極性胺基酸殘基;殘基53是酸性胺基酸殘基;殘基54是T/P之外的小的或脂肪族胺基酸殘基;殘基60是V之外的脂肪族胺基酸殘基;殘基95是V之外的脂肪族胺基酸;殘基97是小的胺基酸或G;殘基109是K之外的鹼性胺基酸殘基;殘基147是脂肪族胺基酸殘基;殘基165是羥基或小的胺基酸殘基;殘基197是小的胺基酸殘基或G;殘基223是L之外的脂肪族胺基酸殘基;以及殘基233是小的胺基酸殘基或G。14.如權利要求13所述的重組多肽,其中所述胺基酸序列包括選自以下的一個或多個特徵殘基49是R;殘基53是D;殘基54是A;殘基60是A;殘基95是L;殘基97是G;殘基109是R;殘基147是L;殘基165是T;殘基197是G;殘基223是V;以及殘基233是G。15.如權利要求14所述的重組多肽,其中所述胺基酸序列具有選自以下的特徵中的一個或多個殘基54是A;殘基109是R;殘基147是L;以及殘基233是G。16.如權利要求9所述的重組多肽,其中所述胺基酸序列包括對應於SEQIDN0:2或SEQIDNO:4的殘基96的胺基酸殘基處的G、I、C或芳族胺基酸。17.如權利要求16所述的重組多肽,其中所述胺基酸序列進一步包括選自以下的特徵中的一個或多個殘基94是芳族胺基酸殘基或G;殘基153是L之外的脂肪族胺基酸殘基;殘基199是L之外的任何胺基酸殘基;殘基202是A之外的脂肪族胺基酸殘基;以及殘基206是芳族胺基酸殘基。18.如權利要求17所述的重組多肽,其中所述胺基酸序列包括選自以下的特徵中的一個或多個殘基94是F或G;殘基153是G或A;殘基199是K、I、N、R、V、Q或W;殘基202是I、L或G;以及殘基206是F。19.如權利要求16至18中任一項所述的重組多肽,其中所述tt酸序列進一步包括選自以下的特徵中的一個或多個殘基49是K之外的極性胺基酸殘基;殘基53是酸性胺基酸殘基;殘基54是T/P之外的小的或脂肪族胺基酸殘基;殘基60是V之外的脂肪族胺基酸殘基;殘基95是V之外的脂肪族胺基酸;殘基97是小的胺基酸或G;殘基109是K之外的鹼性胺基酸殘基;殘基147是脂肪族胺基酸殘基;殘基165是羥基或小的胺基酸殘基;殘基197是小的胺基酸殘基或G;殘基223是L之外的脂肪族胺基酸殘基;以及殘基233是小的胺基酸殘基或G。20.如權利要求19所述的重組多肽,其中所述胺基酸序列包括選自以下的特徵中的一個或多個殘基49是R;殘基53是D;殘基54是A;殘基60是A;殘基95是L;殘基97是G;殘基109是R;殘基147是L;殘基165是T;殘基197是G;殘基223是V;以及殘基233是G。21.如權利要求20所述的重組多肽,其中所述胺基酸序列具有選自以下的特徵中的一個或多個殘基54是A;殘基109是R;殘基147是L;以及殘基233是G。22.如權利要求1所述的重組多肽,其包括選自由SEQIDNO:6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、48、50、52、54、56、58、60、62、64、66、68、70、72、74、76、78、80、82、84、86、88、90、92、94、96、98、100、102、104、106、108、110、112、114、116、118、120、122、124、126、128、130、132、134、136和138組成的組的氣基酸序列。23.如權利要求1至21中任一項所述的重組多肽,其中所述重組多肽是分離的多肽。24.如權利要求23所述的重組多肽,其中所述分離的多肽是大致純的多肽。25.—種多核香酸,其編碼如權利要求1至22中任一項所述的重組多肽。26.如權利要求25所述的多核苷酸,其選自由SEQIDNO:5、7、9、11、13、15、17、19、21、23、25、27、29、3K33、35、37、39、41、43、45、47、49、51、53、55、57、59、61、63、65、67、69、71、73、75、77、79、81、83、85、87、89、91、93、95、97、99、101、103、105、107、109、111、113、115、117、119、121、123、125、127、129、131、133、135和137組成的組。27.如權利要求25所述的多核苷酸,其中所述多核苷酸在高度嚴格性條件下雜交於選自由SEQIDNO:5、7、9、11、13、15、17、19、21、23、25、27、29、31、33、35、37、39、41、43、45、47、49、51、53、`55、57、59、61、63、65、67、69、71、73、75、77、79、81、83、85、87、89、91、93、95、97、99、101、103、`105、107、109、川、113、115、117、119、121、123、125、127、129、131、133、135和137組成的組的多核苦酸。28.—種表達載體,其包括可操作地連接於適於指導在宿主細胞中表達的控制序列的如權利要求25和27中任一項所述的多核苷酸。29.如權利要求28所述的表達載體,其中所述控制序列是啟動子。30.如權利要求29所述的表達載體,其中所述啟動子包括大腸桿菌啟動子。31.如權利要求29所述的表達載體,其中所述控制序列是分泌信號。32.—種宿主細胞,其包括如權利要求28至31中任一項所述的表達載體。33.如權利要求32所述的宿主細胞,其與衍生工程酮還原酶的野生型酮還原酶的細胞類型是同源的。34.如權利要求32所述的宿主細胞,其與衍生工程酮還原酶的野生型酮還原酶的細胞類型是異源的。35.如權利要求32所述的宿主細胞,其中所迷細胞是大腸桿菌。36.如權利要求32或35所述的宿主細胞,其中包括所述表達載體的密碼子已經為在所述宿主細胞中表達而進行了優化。全文摘要本公開提供與天然存在的野生型酮還原酶相比,具有改善的性質的工程酮還原酶。還提供了編碼該工程酮還原酶的多核苷酸、能夠表達該工程酮還原酶的宿主細胞和使用該工程酮還原酶合成多種手性化合物的方法。文檔編號C12N9/04GK101627116SQ200880004582公開日2010年1月13日申請日期2008年2月8日優先權日2007年2月8日發明者利薩·M·紐曼,吉伽特·W·哈思曼,沙琳·奇恩,約翰·M·格魯伯,艾米麗·穆德弗申請人:科德克希思公司