識別蛋白質中大分子結合區域和易聚集區域的方法及其用途的製作方法
2023-07-04 23:33:06 1
專利名稱:識別蛋白質中大分子結合區域和易聚集區域的方法及其用途的製作方法
識別蛋白質中大分子結合區域和易聚集區域的方法及其用
途
背景技術:
了解和控制蛋白質穩定性已成為生物學家、化學家和工程師渴望的努力。胺基酸 取代和疾病之間的第一個聯繫(Ingram. Nature. 1957,180(4581) :326-8.)提供了健康和 疾病中對蛋白質穩定性的新的和重要的看法。基於蛋白質的藥物的近來巨大增長已產生了 新的挑戰。將治療用蛋白質在非常高的濃度下以液體貯藏幾個月。非單體種類的百分比隨 著時間增加。隨著聚集體形成,不但產品的效能降低,而且副作用諸如對給藥的免疫應答可 發生。保證蛋白質藥物的穩定性對於產品的貯存期限是必要的。由於抗體在各種疾病治療中的潛能,抗體目前構成人類治療學中增長最快速 的種類(Carter. Nature Reviews Immunology. 2006,6 (5),;343)。自從 2001 年,抗體市 場一直在以35%的平均年增長率——所有種類生物技術藥物之中最高的速率——增長 (S. Aggarwal, Nature.BioTech. 2007,25(10) 1097)。如疾病治療所需要的,治療用抗體以高濃度在水溶液中製備和貯藏。然而,這些抗 體在這些條件下在熱力學上是不穩定的,並由於聚集而降解。這種聚集進而導致抗體活性 的降低,使藥物無效,甚至能產生免疫應答。像這樣,存在迫切的需要來開發這些抗體,實際 上一般而言是蛋白質,如何聚集的機制了解,以發現蛋白質的什麼區域參與聚集和發展阻 止聚集的策略。這些作用對抗體治療學特別重要。抗體穩定的一個方法是將授予抗原結合特異性 的 CDR 環移植至Ij更穩、定的框架上(Ewert, Honegger, and Pluckthun, Biochemistry. 2003, 42(6) :1517-28.)。只有在CDR環中的胺基酸序列不是驅動聚集力的情況下,以及在將CDR 環移植到更穩定的框架不改變抗原結合特異性的情況下,該方法才起作用。可將與預測蛋白質易聚集區域相關的技術分成兩類,1)唯象模型 (Phenomenological models)和2)分子模擬技術。唯象模型主要是基於使用性質諸如疏水 性、β-摺疊傾向等預測來自蛋白質一級序列的聚集『熱點』,而分子模擬技術使用蛋白質的 三維結構和動力學來定位易聚集區域。這些技術中的大部分已指向了解澱粉樣蛋白原纖維 形成和其它小蛋白的聚集,其中摺疊形成是主要的。已基於理化性質諸如疏水性、摺疊傾向等發展了唯象模型以預測來自蛋白質 一級序列的易聚集區域(Caflisch,Current Opinion in Chemical Biology. 2006,10, 437-444 ;Chiti and Dobson. Annu. Rev. Biochem. 2006,75 :333-366)。一個最初的唯象模型 是基於小的球狀蛋白質『人肌肉醯基磷酸酶(AcP) 』連同其它的非結構化肽(unstructured peptides)和天然未摺疊的蛋白質的聚集的動力學突變研究(Chiti,etal. Nature. 2003, 424p. 805-808 ;U. S. Pat. No. 7379824] 該研究顯示聚集與理化性質諸如β-摺疊傾向、 疏水性和電荷之間的簡單關聯。這些研究是在蛋白質主要是非結構化的條件下進行的。 因此發展了將序列與聚集傾向聯繫的三參數經驗模型(Chiti,et al. Nature. 2003,424, 805-808)。該模型還用於提示32個殘基的肽類激素降鈣素的變體以降低其聚集傾向 (Fowler, et al. Proc Natl Acad Sci USA. 2005,102,10105-10110.)。DuBay 和同事已將三參數方程(Chiti,et al. Nature. 2003,424,805-808)擴展到包括多肽鏈的內在性質 和與環境相關的外在因素諸如肽濃度、溶液的PH值和離子強度的七參數公式(DiAay,et al. J Mol Biol. 2004,341,1317-1326)。使用該模型,他們能再現寬範圍的非結構化肽和 蛋白質的體外聚集率。然而,該七參數模型的主要限制是給予序列中的所有殘基相同的相 對重要性。這與實驗和模擬觀察結果不一致,實驗和模擬觀察結果顯示根據它們的二級結 構傾向,某些區域較其它區域更重要。最近,將該分析進一步擴展,包括保護因子以描述結 構化多月太鏈的聚集(Tartaglia, G. G.,Pawar, A. P.,Campioni, S, Dobson, C. M.,Chiti, F., and Vendruscolo, Μ. J Mol Biol (2008) in press)。預測的位點中的一些與蛋白質諸如 溶菌酶、肌紅蛋白等的已知易聚集位點一致。發展了無自由參數的唯象模型(Tartaglia, et al. Protein Sci.2004,13,1939-1941 ;Tartaglia et al.ProteinSci. 2005, 14, 2723-2734)以預測突變後聚集原纖維的延伸率的變化和識別易聚集區段。使用的理化性質 是突變後β傾向的變化、芳香族殘基數目的變化和總電荷的變化。此外,如果野生型和突 變側鏈都是極性的或都是非極性的,考慮可及表面區域的比率,而在非極性到極性(或極 性到非極性)突變的情況下使用極性側鏈的偶極矩。該模型再現了一組沈個七肽序列的 相對聚集傾向,預測其偏愛全符合狀態(in-register)平行β-摺疊排列。已改進了 DuBay 和同事的模型(Dubay et al. J Mol Biol. 2004,341,1317-1326), 其中包含α -螺旋傾向和疏水圖案,和比較給定的胺基酸序列的聚集傾向得分與為一組相 似長度的序列計算的平均傾向(Pawar, et al.,J Mol Biol. 2005,350,379-392)。已在三 個天然未摺疊的多肽鏈Aβ 42、α突觸核蛋白和tau蛋白的易聚集區段上驗證了該模型。發展了另一個稱作 TANGO 的算法(Fernandez-Escami 11a,et al.,Nat Biotechnol. 2004,22,1302-1306),其平衡相同的理化參數,附帶有胺基酸以聚集的狀態被 完全埋入的假設。這是基於二級結構傾向和去溶劑化處罰的估計以預測蛋白序列的β聚 集區域以及突變作用。與較早討論的模型相反,通過使用FOLD-X力場,TANGO考慮了天然 狀態穩定性。儘管,不可能用TANGO計算絕對聚集率,但是它提供了序列顯著不同的肽或蛋 白質之間的定性比較。Serrano 和同事(Linding, et al.,J MolBiol. 2004,342,345-353) 已使用TANGO分析一組具有40%序列同一性上限的非冗餘球狀蛋白質的β聚集傾向。最近,通過為在β-摺疊內互相面對的殘基編輯配對能量函數而引入了另外的 算法,澱粉樣蛋白結構聚集的預測(Erediction of Amyloid StrucTure Aggregation) (PASTA)(Trovato, et al. , Protein Engineering, Design&Selection.2007,20 (10), 521-523 ;Trovato, et al. , PLoS Comput. Biol. 2006,2,1608-1618 ;Trovato et al., J. Phys. =Condens. Matter. 200719,285221)。以三級接觸的數目為條件,Yoon 和 Welsh(Yoonand Welsh, Protein Sci. 2004,13 :2149-2160)已發展了用於檢測蛋白區段 β聚集傾向的基於結構的方法。使用滑動的七殘基窗,提示在緊密包裝的環境中具有強 β-摺疊傾向的區段(即具有大量的三級接觸)為原纖維形成的局部介質。雖然上面描述的唯象模型顯示對小肽和變性蛋白進行良好,但是聚集傾向對球狀 蛋白質諸如抗體可不同,其中天然狀態的三級結構和穩定性是非常重要的。用於預測易聚集區域和研究聚集機制的分子模擬技術已大部分利用較簡單的模 擬模型(Ma and Nussinov. Curr· Opin. Chem. Biol. 2006,10,445-452 ;Cellmer,et al., TRENDS in Biotechnology 2007,25 (6),254)。利用的模擬模型中最不詳細的是點陣模型,其中將每個殘基表示為佔據三維點陣上單一位點的珠子。更詳細的模型,諸如中間體分辨 率模型隨之產生但遭受相同的不能準確地代表蛋白質二級和三級結構。與較簡單的模型不同,原子論模型包括所有的原子論細節諸如氫鍵合,並因此較 點陣或中間體解析度模型更準確。這樣的原子論模型已與顯式溶劑或隱式溶劑一起使用, 其中將溶劑處理為連續體。顯式模型更準確但在計算上也要求多。後來發展了分子動力學 模擬方案以獲得關於澱粉樣多肽(amyloidogenicpolyp印tide)的有序β聚集的結構信息 (Cecchini et al.,J Mol Biol. 2006,357,1306-1321.)。然而,因為這樣的程序在計算上 要求非常多,尤其對於大蛋白諸如抗體,其看起來不是文獻中全部抗體原子論模擬。雖然如 此,已有小部分抗體的原子論模擬,大部分是針對Fab片段(N00n,et al.,,PNAS. 2002,99, 6466 ;Sinha andSmith-Gill, Cell Biochemistry and Biophysics. 2005,43,253)。用於阻止抗體聚集的許多現存的方法利用蛋白製劑中的添加劑的使用。這與本 文描述的直接方法不同,在該直接方法中抗體本身基於從分子模擬預測的易聚集區域被修 飾。在抗體穩定中通常使用的添加劑是含氮鹼基的鹽諸如精氨酸、胍或咪唑(EP0025275)。 用於穩定的其它合適的添加劑是聚醚(EPA0018609)、甘油、白蛋白和硫酸葡聚糖(美 國專利號4808705)、去垢劑和表面活性劑諸如基於聚山梨酯80的表面活性劑(公布 文本DA2652636和公布文本GB2175906 (英國專利申請號GB8514349))、蛋白伴侶諸如 GroEL (Mendoza, Biotechnol. Tech. 1991,(10) 535-540)、檸檬酸鹽緩衝劑(W09322335)或 螯合劑(W09115509)。儘管這些添加劑在一定程度上使蛋白在溶液中變得穩定,但是它們遭 受到某些缺點諸如用於添加劑去除的另外處理的必要性。因此,需要新方法來了解涉及蛋 白聚集的機制和識別介導該現象的蛋白區域。這樣的方法在許多診斷和治療區域將是有用 的,並將允許蛋白組合物,諸如抗體治療,成為直接穩定的,不需要添加劑的使用。發明概述本發明提供至少部分基於計算機模擬的方法和計算工具,其識別蛋白質的易聚集 區域。然後可在這些易聚集區域進行替代以設計具有增強的穩定性和/或降低的聚集傾向 的蛋白。此外,本發明提供至少部分基於計算機模擬的方法和計算工具,其識別蛋白質的 大分子結合區域。然後可在這些大分子結合區域進行替代和缺失以設計具有改變的對大分 子的結合親合力的蛋白。一方面,本發明提供針對蛋白質中的特定原子計算空間聚集傾向 (Spatial-Aggregation-Propensity) (SAP)的方法,包括(a)識別代表蛋白質的結構模型 中的一個或多個原子,其中一個或多個原子位於集中於特定原子上或其附近的限定空間區 域內;(b)針對限定空間區域中的一個或多個原子,計算原子的溶劑可及面積(SAA)與完全 暴露的同一殘基中的原子的SAA的比;(c)用一個或多個原子的原子疏水性乘以每個比;和 (d)合計步驟(c)的乘積;藉此該和是針對特定原子的SAP。在相關的實施方式中,針對蛋白質中的特定原子計算空間聚集傾向(SAP)的方法 包括(a)識別代表蛋白質的結構模型中的一個或多個胺基酸殘基,其中一個或多個胺基酸 殘基具有集中於特定原子上或其附近的限定空間區域內的至少一個原子;(b)針對限定空 間區域中的原子,計算原子的溶劑可及面積(SAA)與完全暴露的同一殘基中的原子的SAA 的比;(c)用如通過胺基酸疏水性標度所測定的一個或多個胺基酸殘基的疏水性乘以每個比;和(d)合計步驟(c)的乘積;藉此該和是針對特定原子的SAP。應當理解在特定的實施方式中,限定的空間區域是任何3維體積或區域。在具體 的實施方式中,限定的空間區域選自球體、立方體、圓柱體、錐體和橢圓的球狀體。在一些實 施方式中,限定的空間區域是具有與具有1-30A之間或更大半徑的球體相等的體積的區域。 在一些實施方式中,該半徑可以是50A或更大。在一些優選實施方式中限定的空間區域的半 徑是5Α_θΑ。在優選實施方式中,限定的空間區域是具有1-30A半徑的球體。在一些實施方式中 將該球體集中在特定的原子上,而在其它的實施方式中,將限定的空間區域或球體集中在 化學鍵中或集中在空間上接近將在其上計算SAP的原子的點上。在一些實施方式將限定的空間區域集中在空間上距特定原子30A內的點上,或在 一些優選實施方式中將限定的空間區域集中在空間上距特定原子20A內、IOA內、5A內、2A 內、IA內的點上。在一些實施方式中,限定的空間區域內的一個或多個原子是一個或多個胺基酸的 側鏈中的原子。在另外的實施方式中,結構模型中選擇的半徑內的一個或多個原子可以位於或需 要位於一個或多個胺基酸的側鏈中。可選地,結構模型中選擇的半徑內的一個或多個原子 可以是或需要是一個或多個胺基酸的主鏈原子。在一些實施方式中,可只在胺基酸側鏈的原子上計算溶劑可及面積 (SolventAccessibleArea) (SAA),其是SAP計算的部分,或在一些實施方式中只在主鏈原 子上。主鏈原子可包括或可不包括附著的氫原子。在一些特別優選的實施方式中,在SAP的計算之前,例如通過進行分子動力學模 擬處理蛋白質結構模型,該模擬任選地包括溶劑。該溶劑可以是水、本領域已知的另一溶 劑,或可缺少該溶劑。在一些特別優選的實施方式中,在SAP的計算之前,例如通過進行 Monte Carlo模擬處理蛋白質結構模型。在另一個方面,SAP的計算可進一步包括進行分子動力學模擬和求SAP值的平均 數,該值是通過分子動力學模擬中的多個時間步驟計算的。例如可通過在上面的步驟(a) 之前進行分子動力學模擬和重複步驟(a)-(d),每次以許多時間步驟進行進一步的分子動 力學模擬,由此產生如步驟(d)中的多個和,和計算這些和的平均數來計算針對特定原子 的SAP ;藉此該計算的平均數是針對特定原子的SAP。在其它的實施例中,Monte Carlo模 擬可替代分子動力學模擬使用或與分子動力學模擬組合使用。在另外的實施方式中,可合計多個胺基酸的SAP得分,例如在蛋白結構模型上的 易聚集區域或表面補丁中的1和50個胺基酸之間進行合計。在特別優選的實施方式中,合 計1-20個胺基酸、1-15個胺基酸、1-10個胺基酸、1-5個胺基酸、1-3個胺基酸的SAP,或可 合計跨2個相鄰胺基酸的SAP。在一些實施方式中,可合計相鄰胺基酸,其可沿著蛋白質序 列連續地相鄰或在蛋白質結構中空間地相鄰。在這些方法需要分子動力學模擬的時候,可使用選自包括ABINIT、AMBER、 Ascalaph、CASTEP,CPMD,CHARMM、DL_P0LY、FIREBALL、GROMACS、GROMOS、LAMMPS、MDynaMiχ、 MOLDY、M0SCIT0、NAMD, Newton-X、ProtoMol、PWscf、SIESTA、VASP, TINKER、YASARA,ORAC 和 XMD的集合或由它們構成的集合的模擬程序包進行模擬。在特別優選的實施方式中,模擬程
11序包是CHARMM模擬程序包。在其它的優選實施方式中,模擬程序包是NAMD模擬程序包。在這些方法需要針對側鏈、殘基或蛋白質內的一個或多個原子進行計算(例如, 針對一個或多個原子計算SAA)的時候,熟練的技術人員應當理解計算可針對空間區域、 側鏈、殘基、蛋白質等中的原子、原子對、原子的組合或組、原子的部分,或針對空間區域、側 鏈、殘基、蛋白質等中的每個原子或所有原子。當進行以本發明的方法學為特徵的計算時, 熟練的技術人員還應當理解也能針對包括原子、原子組等的胺基酸殘基、側鏈等進行計算 (例如SAA計算)。在另外的優選實施方式中,結構模型是蛋白質或其部分的X射線晶體結構模型; 或結構模型可以是蛋白質或其部分的理論蛋白結構模型。在相關的實施方式中,理論結構 模型是蛋白質或其部分的同源模型。在其它的實施方式中,理論結構模型是蛋白質或其部 分的從頭開始蛋白結構模型。在另一個方面,本發明提供識別蛋白上的易聚集區域的方法。在一個實施方式中, 識別蛋白上的易聚集區域的方法包括(a)將如根據本文描述的任何方法所計算的針對蛋 白質中原子的SAP繪製到結構模型上;和(b)識別具有SAP > 0的許多原子的蛋白質內區 域;其中易聚集區域包括包含所述許多原子的胺基酸。在一些實施方式中,該方法可包括識 別一個或多個胺基酸,該胺基酸含有一個或多個具有大於所選閾值的SAP的原子,其中根 據本文描述的任何方法計算SAP,且其中易聚集區域包括識別的胺基酸。在另一個實施方式中,識別蛋白上的易聚集區域的方法包括繪製如根據本文描述 的任何方法所計算的SAP值,進一步為圖中的峰計算曲線下面積(AUC)和識別一個或多個 具有正的AUC的蛋白區域,其中易聚集區域包括識別的蛋白區域。在另一個方面,本發明提供製備顯示降低的聚集傾向的蛋白質變體的方法。在一 個優選實施方式中,製備顯示降低的聚集傾向的蛋白質變體的方法包括替代或缺失蛋白質 中易聚集區域內的至少一個胺基酸殘基,其中使用根據本文描述的任何方法計算的SAP得 分識別易聚集區域;以及其中,如果替代胺基酸殘基,則用更親水的胺基酸殘基替代它,這 樣變體的聚集傾向降低了。在一些特定實施方式中替代至少一個殘基並缺失至少一個殘 基。在另一個實施方式中,製備顯示降低的聚集傾向的蛋白質變體的方法包括(a)在 每個變體中通過替代蛋白質中易聚集區域內的至少一個殘基而產生許多蛋白質變體,其中 使用根據本文描述的任何方法計算的SAP得分識別易聚集區域,其中在每個變體中,將一 個或多個不同殘基或不同的殘基組合進行替代;其中用更親水的殘基替代至少一個殘基; 和(b)選擇如(a)中製備的顯示降低的聚集傾向的蛋白質變體。在一些實施方式中,選擇的用於替代的胺基酸是易聚集區域中最疏水的胺基酸 (如通過領域公認的疏水性標度所測定的)。在具體的實施方式中,選擇的用於替代的氨 基酸是 Phe, Leu、lie、Tyr、Trp, Val、Met、Pro、Cys, Ala 或 Gly0 在這樣具體的實施方式 中,被替代進蛋白質中的更親水的胺基酸可選自Hir、Ser, Lys, Gin、Asn、His、Glu、Asp和 Arg。通常,用於測定哪些殘基較其它的更親水或疏水或更不親水或疏水的優選疏水性標度 是Black和Mould疏水性標度。在一些實施方式中替代易聚集區域內的至少兩個胺基酸殘基。在相關的實施方式 中替代易聚集區域內的至少三個胺基酸殘基。同樣,在相似的實施方式中替代蛋白質內超過一個易聚集區域內的至少一個殘基。在優選實施方式中,將本文描述的方法應用於選自抗體、Fab片段、Fab』片段、Fd 片段、Fv片段、F(ab' )2片段和Fc片段的蛋白質。在其它的優選實施方式中,將本文描述的方法應用於選自細胞因子、趨化因子、脂 因子(Iipokine)、肌因子(myokine)、神經遞質、神經營養蛋白、白細胞介素或幹擾素的蛋 白。在一些具體實施方式
中,蛋白可以是激素或生長因子、受體或受體域、或神經遞質或神 經營養蛋白。在一些實施方式中蛋白是擬肽(P印tidomimetic)、修飾的蛋白、包含非天然氨 基酸的蛋白或包含稀有胺基酸的蛋白。在另一個方面,本發明還提供計算針對蛋白質中胺基酸殘基的有效SAA的方法。 優選的計算針對蛋白質中胺基酸殘基的有效SAA的方法包括(a)針對胺基酸計算胺基酸中 原子的溶劑可及面積(SAA)與完全暴露的同一殘基中原子的SAA的比;(b)用如通過氨基 酸疏水性標度所測定的胺基酸殘基的疏水性乘以該比;藉此該乘積是胺基酸的有效SAA。 此外,可通過進一步包括合計3個胺基酸的有效SAA的方法計算蛋白質中胺基酸殘基的有 效SAA,或在一些實施方式中2、4、5或6個胺基酸,這些胺基酸在蛋白序列中是相鄰的。在另一個方面,本發明還包括識別蛋白質上的大分子結合區域的方法,包括(a) 將如根據先前方面中的任何一個所計算的蛋白質中原子的SAP繪製到蛋白質的結構模型 上;和(b)識別具有SAP > 0的許多原子的蛋白質內區域;其中大分子結合區域包括,包含 所述許多原子的胺基酸。在另一個方面,本發明包括識別蛋白質上的大分子結合區域的方法,包括識別一 個或多個胺基酸,該胺基酸含有一個或多個具有大於所選閾值的SAP的原子;其中根據先 前方面中的任何一個的方法計算SAP,且其中大分子結合區域包括識別的胺基酸。在另一個方面,本發明包括識別蛋白質上的大分子結合區域的方法,包括繪製如 先前方面中的任何一個所計算的SAP值,為圖中的峰計算曲線下面積(AUC)和識別一個或 多個具有正的AUC的蛋白區域,其中大分子結合區域包括識別的蛋白區域。在另一個方面,本發明包括製備顯示對大分子降低的結合親和力的蛋白質變體的 方法,包括替代或缺失針對蛋白質中大分子的大分子結合區域內的至少一個胺基酸殘基, 其中使用根據先前方面中的任何一個計算的SAP得分識別大分子結合區域;並且其中,如 果替代胺基酸殘基,則用更親水的胺基酸殘基替代它,這樣降低了變體的大分子結合親和 力。在某些實施方式中替代至少一個殘基並缺失至少一個殘基。在另一個方面,本發明還包 括製備顯示對大分子改變的結合親和力的蛋白質變體的方法,包括(a)在每個變體中通過 替代針對蛋白質中大分子的大分子結合區域內的至少一個殘基,產生許多蛋白質變體,其 中使用根據先前方面中的任何一個所計算的SAP得分識別大分子結合區域,其中在每個變 體中,替代一個或不同殘基或不同的殘基組合;和(b)選擇如(a)中所製備的顯示對大分子 改變的結合親和力的蛋白質變體。在某些實施方式中,大分子結合區域內的至少一個氨基 酸殘基是大分子結合區域中的最疏水的殘基。在某些實施方式中,易聚集區域內的至少一 個胺基酸殘基是Wie、Leu、lie、Tyr, Trp、Val、Met、Pro, Cys、Ala或Gly。在某些實施方式 中,更親水的胺基酸殘基選自Thr、Ser、Lys、Gln、Asn、His、Glu、Asp和Arg。在某些實施方 式中,更親水的胺基酸殘基是稀有的、非天然的或修飾的胺基酸。在某些實施方式中,根據 Black和Mould的疏水性標度測定更親水的胺基酸殘基。在某些實施方式中替代大分子結合區域內的至少兩個胺基酸殘基。在某些實施方式中替代大分子結合區域內的至少三個氨 基酸殘基。在某些實施方式中替代蛋白質內超過一個易聚集區域內的至少一個殘基。在某 些實施方式中,為了識別蛋白質上的易聚集區域,根據先前方面中的任何一個的方法識別 易聚集區域。在可與先前的實施方式結合的某些實施方式中,大分子是另一個蛋白、多核苷 酸或多糖。在可與先前的實施方式結合的某些實施方式中,蛋白選自抗體、Fab片段、Fab' 片段、Fd片段、Fv片段、F (ab' )2片段和Fc片段。在可與先前的實施方式結合的某些實施 方式中,蛋白是細胞因子、趨化因子、脂因子、肌因子、神經遞質、神經營養蛋白、白細胞介素 或幹擾素。在可與先前的實施方式結合的某些實施方式中,蛋白是激素或生長因子。在某 些實施方式中,大分子是激素受體或生長因子受體。在某些實施方式中,蛋白是受體或受體 域。在某些實施方式中,大分子是受體或受體域的受體激動劑或受體拮抗劑。在可與先前 的實施方式結合的某些實施方式中,蛋白是神經遞質或神經營養蛋白。在某些實施方式中, 大分子是神經遞質受體或神經營養蛋白受體。在另一個方面,本發明還包括製備包含蛋白質變體的藥物組合物的方法,該蛋白 質變體顯示改變的與結合配偶體相互作用的傾向,該方法包括配製根據先前方面中的任何 的方法獲得的蛋白質變體以及藥學上可接受的載體、佐劑和/或賦形劑。發明詳述本發明解決更深地了解蛋白質聚集的機制和識別參與聚集的蛋白區域的未滿足 的需要。本發明至少部分提供模擬技術,該技術能同時地與本文描述的實驗方法使用以改 進潛在地所有抗聚集的治療用蛋白的穩定性。鑑於基於抗體的治療正以所有種類的人類治 療中最高的速度增長,該技術顯示巨大的科學和商業潛能。聚集是抗體藥物開發的大多數 階段遇到的常見問題,阻礙潛在的抗體藥物候選物的快速商業化。因此使用本文描述方法 的聚集阻止會對蛋白藥物開發具有顯著的影響。此外,本發明解決準確地識別參與與其它大分子結合的蛋白區域的未滿足的需 要,這種結合常常至少部分是通過大的疏水補丁(patch)介導的,使用本文描述的方法能 容易地識別這些補丁。本發明至少部分提供模擬技術,該技術能同時地與本文描述的實驗 方法使用以改變潛在地所有蛋白質-分子相互作用的結合親和力,該結合親和力至少部分 是通過大的疏水補丁介導的。鑑於基於蛋白的治療正以所有種類的人類治療中最高的速度 增長,該技術顯示巨大的科學和商業潛能。改變針對一個或多個大分子的蛋白治療的結合 親和力的能力能用於提高效率和降低或除去通過不需要的第二大分子結合區域介導的活 性。本發明另外提供減少或阻止蛋白質聚集或改變針對大分子的結合親和力的方法。 特別地,提供識別蛋白質結構上的疏水區域的方法,該區域可參與蛋白質相互作用、蛋白 質-大分子相互作用或蛋白質聚集。提供的方法是基於本文公開的如「空間聚集傾向」或 「SAP」的新技術。該SAP工具還正確地識別易於與其它蛋白結合的抗體區域。除了抗體, 該工具能廣泛地應用於所有蛋白質,用於識別易聚集區域或結合其它蛋白或配體的區域。 本發明的方法可應用於任何蛋白質,其三維結構是可利用的或者其三維結構可使用同源建 模、分子建模或從頭開始結構測定產生。一般而言,可用多種方式計算「SAP」,其使用本文 描述的方程和方法學,例如,可在蛋白質結構模型上計算SAP,或可將SAP計算為結構模型 的分子動力學模擬的多個時間步驟的平均數。儘管特定的計算方法和獲得的結果可變化,如本文所描述的,但是潛在的原理是基於SAP是一個計量單位的事實,其不但說明蛋白質 中的殘基的疏水性,而且說明蛋白質三維結構和摺疊的蛋白質結構中的胺基酸殘基的接近度。「蛋白質」指兩個或多個胺基酸的任何序列,(本文也被稱為「胺基酸殘基」或「殘 基」)通過相鄰胺基酸的羧基和氨基之間的肽鍵連接在一起,不管長度、翻譯後修飾、化學修 飾或功能。「多肽」、「肽」和「蛋白質」在本文可交換地使用。在優選實施方式中,本發明的 方法應用於具有足夠長度以摺疊成三維結構的蛋白質。在一些實施方式中,蛋白質是天然 存在的蛋白質。在一些實施方式中,蛋白質是化學合成的。在一些實施方式中,蛋白質是重 組蛋白質,例如,雜合蛋白或嵌合蛋白。在一些實施方式中,蛋白是複合蛋白,(例如複合的 相互作用蛋白)。蛋白質能被分離(例如,從天然來源或化學環境中)。在一些實施方式 中,蛋白質可以是修飾的蛋白質或擬肽。在一些實施方式中,蛋白可以是衍生的蛋白,例如 化學共軛蛋白質(包括但並不限於聚合物共軛蛋白質(例如聚乙二醇化蛋白質)。如本文 所用,術語「蛋白質」也意欲包括蛋白質片段。示例性的蛋白質包括抗體(包括但並不限於 其片段、變體和衍生物)。實際上,預見本發明的方法可應用於任何基於胺基酸的分子,其結構模型是可利 用的或可被產生的。例如,本文描述的方法可應用於如本文所描述的修飾的蛋白質或摻入 稀有的或非天然胺基酸的蛋白質。在一些實施方式中,可將稀有的、非天然的或修飾的氨 基酸的結構計算地替代或插入到結構模型,用於本文描述的方法的應用。實驗上設計肽類 似物、衍生物和擬態的方法是本領域已知的。例如,參見Farmer,P. S. in Drug Design (Ε. J.Ariens, ed.)Academic Press, New York,1980, vol. 10, pp. 119-143 ;Ball. J. B. and Alewood,P. F. (1990) J. Mol. Recognition 3 55 ;Morgan, B. A. and Gainor,J. A. (1989) Ann. Rep. Med. Chem. 24 243 ;禾口 Freidinger,R. M. (1989) Trends Pharmacol. Sci.!^ :270。還參 JAL Sawyer,T. K. (1995)" Peptidomimetic Design and Chemical Approaches to Peptide Metabolism " in Taylor, MD. and Amidon, G. L. (eds. )Peptide-Based Drug Design Controlling Transport andMetabolism, Chapter 17 ;Smith, A. B. 3rd, et al. (1995) J. Am. Chem. Soc. 117 :11113-11123 ;Smith, A. B. 3rd, et al. (1994) J. Am. Chem. Soc. 116 9947-9962 和 Hirschman,R. , et al. (1993)J. Am. Chem. Soc. 115 :12550_12568。大量和各種肽、多肽和蛋白治療製劑是本領域已知的,並期望從本發明的方法受 益。這些治療製劑包括幾個非常寬的種類,包括激素、蛋白質、抗原、免疫球蛋白、抑制劑/ 激活劑、酶、細胞因子、趨化因子、肌因子、脂因子、生長因子、受體、受體域、神經遞質、神經 營養蛋白、白細胞介素和幹擾素等。能在本發明的範圍內使用的合適的激素包括蛋白質激素,諸如調節血糖的胰島素 和胰高血糖素。如具有本領域普通技術的人所理解的,著名的激素典型地用於包括癌症、代 謝病、心血管疾病、垂體狀況和絕經在內的各種狀況和疾病的治療。最初,人們認為只有一些蛋白質形成原纖維或聚集體。更近的證據表明更多超過 期望的蛋白質具有易聚集區域(Fandrich, M.,Fletcher, Μ. Α.,and Dobson, C. Μ. (2001) Nature 410,165-166)。實際上,據記錄短至4個殘基的肽能形成原纖維(J. Biol. Chem., Vol. 277,Issue 45,43243-43246, Nov.8,2002)。蛋白治療代表了治療市場的增長的份額。例如,胰島素和胰高血糖素是調節血糖的重要蛋白治療,可從本文描述的方法受益。胰島澱粉樣多肽(Islet AmyloidPolypeptide) (IAPP)是由胰腺分泌的另外的激素,其用於糖尿病的治療。另一個感 興趣的蛋白是粒細胞集落刺激因子或G-CSF,它是可用於增加血細胞產生的血液生長因子。 組織纖溶酶原激活劑是中風或心臟病發作的治療中使用的凝塊破裂劑。另外,紅細胞生成 素是腎產生的激素,它可用於AIDS、貧血、腎衰竭和其它狀況的治療。最後,降鈣素是已被發 現在高鈣血症、佩吉特病(Paget disease)和某些類型的骨質疏鬆症的治療中有效的肽。期望從本文描述的方法獲益的蛋白的另外例子包括,而沒有限制,ACTH、支鏈澱 粉、血管緊張素、血管生成素、抗炎肽、BNP、內啡肽、內皮素、GLIP、生長激素釋放因子(GRF)、 水蛭素、胰島素調理素、神經肽Y、PTH、VIP、生長激素釋放激素(GHRH)、奧曲肽、垂體激素 (例如hGH)、ANF、生長因子、bMSH、生長抑素、血小板衍生的生長因子釋放因子、人絨毛膜促 性腺素、水蛭肽、幹擾素α、幹擾素β、幹擾素Y、白細胞介素、粒細胞巨噬細胞集落刺激因 子(GM-CSF)、粒細胞集落刺激因子(G-CSF)、尿促性素(尿促卵泡素(FSH)和LH))、鏈激酶、 尿激酶、ANF、ANP、ANP清除抑制劑、抗利尿激素激動劑、降鈣素基因相關肽(CGRP)、IGF-U 噴替吉肽、蛋白C、蛋白S、胸腺素α-l、加壓素拮抗劑類似物、顯性負性TNF-α、α-MSH、 VEGF、PYY、和衍生自上述蛋白的多肽、片段、多肽類似物和衍生物。在特別優選的實施方式中,蛋白是抗體或免疫球蛋白。術語「抗體」以最寬的意義 使用,並且具體地覆蓋單克隆抗體(包括全長單克隆抗體)、多克隆抗體、多特異性抗體(例 如雙特異性抗體)、單鏈抗體、嵌合抗體、重組抗體、和抗體片段。全長抗體是包含由二硫鍵 相互連接的至少兩個重(H)鏈和兩個輕(L)鏈的糖蛋白。Ch2中的Asn-297殘基是N-糖基 化的。每個重鏈由重鏈可變區(本文縮寫為Vh)和重鏈恆定區組成。重鏈恆定區由三個結 構域CH1、Ch2和Ch3組成。Fc受體在較低的Ch2鉸鏈區結合併介導效應子作用諸如抗體依賴 的細胞介導的細胞毒性(ADCC)。蛋白A結合在Fc的Ch2-Ch3的連接處,在完全抗體的純化 中廣泛使用。每個輕鏈由輕鏈可變區(本文縮寫為VJ和輕鏈恆定區組成。輕鏈恆定區由 一個結構域Q組成。V1^Pt區能被進一步細分成稱作互補決定區(CDR)的高度可變區, 點綴著稱作框架區(FR)的更保守的區域。每個V1^Pt由三個CDR和四個FR組成,以下 面的順序從氨基末端至羧基末端排列FR1、CDRl、FR2、CDR2、FR3、CDR3、FR4。重鏈和輕鏈 的可變區含有與抗原相互作用的結合結構域。因此,術語「抗體」將包括各種抗體同種型 或亞類,例如 IgA、IgD、IgE、IgG 和 IgM,或 IgGl、IgG2、IgG3 和 IgG4。進一步包括的是 Fab 片段,它是由八、Vh、(^和ChI結構域組成的一價片段;F(ab' )2片段,它是包含由二硫鍵在 鉸鏈區連接的兩個Fab片段的二價片段;Fab』片段,它是本質上具有鉸鏈區部分的Fab (參 見 FUNDAMENTALIMMUNOLOGY (Paul ed.,3rd ed. 1993);由 Vh 禾口 ChI 結構域組成的 Fd 片段; 由抗體單臂的\和Vh結構域組成的Fv片段,dAb片段(Ward et al.,(1989)NatureMi M4-M6),其由Vh結構域組成;分離的互補決定區(CDR);和納米抗體(nanobody),其為含 有單個可變域和兩個恆定域的重鏈可變區。如本文所用蛋白質「結構模型」是蛋白質三維的二級、三級和/或四級結構的表 示。結構模型包括X射線晶體結構、NMR結構、理論蛋白質結構、從同源建模產生的結構、蛋 白質斷層照相模型和從電子微觀研究建立的原子論模型。典型地,「結構模型」將不僅包括 蛋白質的一級胺基酸序列,還將為蛋白質中的原子提供三維空間中的坐標,因此顯示蛋白 摺疊和胺基酸殘基位置。在優選的實施方式中,分析的結構模型是X射線晶體結構,例如從蛋白質資料庫(PDB,rcsb.org/pdb/home/home. do)獲得的結構或在相似蛋白質的已知結 構之上建立的同源模型。在優選的實施方式中,結構模型將在應用本發明的方法之前被預 處理。例如,可通過分子動力學模擬提出結構模型以允許蛋白質側鏈達到更自然的構象,或 可允許結構模型與溶劑例如水在分子動力學模擬中相互作用。預處理不限於分子動力學模 擬並能使用任何本領域公認的手段完成預處理以測定溶液中蛋白質的運動。示例性的可選 的模擬技術是Monte Carlo模擬。能使用模擬程序包或任何其它可接受的計算方法進行模 擬。在某些實施方式中,能在結構模型上進行搜索、探查或取樣蛋白質構象空間的模擬以測 定蛋白質的運動。「理論蛋白質結構」是使用計算的方法,通常沒有蛋白質天然結構的任何直接的 實驗測量結果而產生的三維蛋白結構模型。「理論蛋白質結構」包括通過從頭開始法和同 源建模產生的結構模型。「同源模型」是由同源建模產生的三維蛋白結構模型,其典型地 包括比較蛋白質的一級序列與相似蛋白質的已知三維結構。同源建模在本領域是眾所周 知的,並且被描述在 Kolinski et al. Proteins. 1999 ;37 (4) :592-610 ;Rost et al.,B, Potein Sci. 1996 ;5 (8) :1704_1718,和美國專利號 7212924 ;6256647 和 6125331 中,本文 通過引用將其併入。特別地,Xiang. (CurrProteinPept Sci. 2006Jun ;7 (3) :217_27,本文 通過引用併入)提供了同源建模技術的極好的描述和綜述,該同源建模技術可用於產生對 本發明的方法有用的結構。實際上,根據本發明的方法可使用本領域已知的任何同源建模 軟體,例如 MODELLER(Eswar, et al. , Comparative Protein Structure Modeling With MODELLER. Current Protocols inBioinformatics, John Wiley&Sons, Inc. , Supplement 15,5.6. 1-5.6.30,200.)、SEGMOD/ENCAD (Levitt M. JMolBiol 1992 ;226 :507-533)、 SWISS-MODEL(Schwede Τ,Κορρ J,Guex N,Peitsch MC. Nucleic Acids Research2003 ;31 3381-3385.)>3D-JIGSAff(Bates et al. , Proteins !Structure, Function andGenetics, Suppl 2001 ;5 :39-46), NEST (Xiang. Curr Protein P印t Sci. 2006June ;7 (3) :217-227) 和 BUILDER(Koehl and Delarue. Curr Opin Struct Bioll996 ;6 (2) :222-2 .)。對於抗 體,特別地,能使用規範的結構方法(Chothia C and LeskAM, J. Mol. Biol. 1987,196,901 ; Chothia C et al.,Nature 1989,342,877)準確地獲得抗體可變區的結構。在特定的實施方式中,可使用同源建模以從已知結構片段裝配完整蛋白質,諸如 當將抗體Fab片段模建到Fc片段上時,或當Fab片段作為理論蛋白質結構產生並模建到Fc 片段晶體結構上時。熟練的技術人員將了解存在各種可能性。在一個特定的實施方式中, 可將Fab片段做模型到不同種類或同種型的各種抗體Fc結構上。也可在本發明的方法中使用從頭開始模型。「從頭開始蛋白結構模型」是通過使用 物理化學中已知的方程模擬蛋白質摺疊過程從蛋白質一級序列直接產生的蛋白結構模型 (Bonneau and Baker. Annual Review of Biophysics and BiomolecularStructure. 2001, Vol.30, Pages 173-189 ;Lesk Proteins 1997 ;1 151-166.Suppl ;Zemla, et al.. Proteins 1997 ;1 :140-150. Suppl ;Ingwal1, et al.Biopolymers 1968;6 :331-368 ;和 美國專利號 6832162 ;5878373 ;5436850 ;6512981 ;7158891 ;6377893 ;和美國專利申請號 9/788,006 ;11/890,863和10/113,219,本文通過應用將其全部併入)。由於在模擬新形成 蛋白質摺疊中的困難在某些情況下可導致不精確的蛋白結構模型,典型地,以實驗測定的 結構(例如X射線晶體結構)和同源模型對從頭開始模型是優選的。
應理解,根據本發明,產生理論蛋白質結構的本領域已知的任何方法可以是有 用的。除了上面描述的方法,一些方法諸如在會議、用於蛋白質結構預測的技術的關鍵 評估(CASP)中描述的那些方法可在本方法學中使用。在CASP的學報中,例如在與7th Community Wide Experiment on the Critical Assessment of Techniquesfor Protein Structure Prediction Asilomar Conference Center, Pacific Grove, CANovember 26-30,2006 相關的出版物中和在 CASP6 學報· Proteins Structure, Function, and Bioinformatics. 2005. 61(S7) 1-236 ;CASP5 學 報· Proteins !Structure, Function, and Genetics. 2003,53(S6) :333-595 ;CASP4 學 報· Proteins :Structure, Function, and Genetics. 2001,45(S5) :1-199 ;CASP3 學 報 Proteins -Structure, Function, and Genetics, 1999, 37 (S3) :1-237(1999)中描述了各種例子。本發明還提供了製備顯示降低的聚集傾向的蛋白質變體的方法。如本文所用,「聚 集傾向」是蛋白質形成簇或塊的傾向。這樣的簇或塊可含有兩個、或更常常是3個、或更多 的蛋白質,蛋白質典型地是相同類型。相應地,顯示「降低的聚集傾向」的蛋白質是與未修 飾或未處理的相同蛋白質相比,當被修飾或處理時,形成較少聚集體或形成較小聚集體的 蛋白質。術語「抑制」指傳達現象中的可測量的減少,本文常常參考蛋白質結合相互作用或 聚集而使用它。本文常常將蛋白質表面上的胺基酸殘基、殘基簇、蛋白質區域、肽或補丁描述為親 水的或疏水的。根據本發明的方法,空間聚集傾向描述了疏水性,並部分地使用本領域已知 的胺基酸疏水性標度計算空間聚集傾向。在優選的實施方式中,胺基酸疏水性標度是Black 和Mould,Anal. Biochem. 1991,193,72-82 (本文通過引用併入)中提出的標度。一般而言, 根據Black和Mould,胺基酸疏水性進展如下(從最疏水的殘基開始)Phe > Leu = Ile > Tyr ^ Trp > Val > Met > Pro > Cys > Ala > Gly > Thr > Ser > Lys > Gln > Asn > His > Glu > Asp > Arg0如Black和Mould所報導的,疏水性的標度值顯示在下面的表1 中。表 權利要求
1.計算針對蛋白質中特定原子的空間聚集傾向(SAP)的方法,包括(a)識別代表所述蛋白質的結構模型中的一個或多個原子,其中所述一個或多個原子 位於集中於所述特定原子上或其附近的限定空間區域內;(b)針對所述限定空間區域中的所述一個或多個原子,計算所述原子的溶劑可及面積 (SAA)與完全暴露的同一殘基中的原子的SAA的比;(c)用所述一個或多個原子的原子疏水性乘以每個比;和(d)合計步驟(C)的乘積;藉此該和是針對所述特定原子的SAP。
2.計算針對蛋白質中特定原子的空間聚集傾向(SAP)的方法,包括(a)識別代表所述蛋白質的結構模型中的一個或多個胺基酸殘基,其中所述一個或多 個胺基酸殘基具有集中於所述特定原子上或其附近的限定空間區域內的至少一個原子;(b)針對所述限定空間區域中的所述一個或多個原子,計算所述原子的溶劑可及面積 (SAA)與完全暴露的同一殘基中的原子的SAA的比;(c)用如通過胺基酸疏水性標度所測定的所述一個或多個胺基酸殘基的疏水性乘以每 個比;和(d)合計步驟(C)的乘積;藉此該和是針對所述特定原子的SAP。
3.權利要求2的方法,其中步驟(a)的所述一個或多個原子是所述一個或多個胺基酸 的側鏈中的原子。
4.權利要求2的方法,其中步驟(a)的所述一個或多個原子是所述一個或多個胺基酸 的主鏈原子。
5.權利要求1或2的方法,其中所述限定的空間區域選自球體、立方體、圓柱體、錐體和 橢圓的球狀體。
6.權利要求1或2的方法,其中所述限定的空間區域是具有與具有i_30A之間半徑的球 體相等的體積的區域。
7.權利要求1或2的方法,其中所述限定的空間區域是具有I_30A之間半徑的球體。
8.權利要求1或2的方法,其中所述限定的空間區域集中在所述特定原子上。
9.權利要求1或2的方法,其中所述限定的空間區域集中在化學鍵上。
10.權利要求1或2的方法,其中所述限定的空間區域集中在空間上距所述特定原子 30A內的點上。
11.權利要求10的方法,其中所述限定的空間區域集中在空間上距所述特定原子20A 內的點上。
12.權利要求10的方法,其中所述限定的空間區域集中在空間上距所述特定原子IOA 內的點上。
13.權利要求10的方法,其中所述限定的空間區域集中在空間上距所述特定原子5A內 的點上。
14.權利要求10的方法,其中所述限定的空間區域集中在空間上距所述特定原子2A內 的點上。
15.權利要求10的方法,其中所述限定的空間區域集中在空間上距所述特定原子IA內的點上。
16.權利要求1或2的方法,其中只在胺基酸側鏈的原子上計算所述SAA。
17.權利要求1或2的方法,其中只在主鏈原子上計算所述SAA。
18.權利要求1或2的方法,其中只在排除附著的氫原子的主鏈原子上計算所述SAA。
19.權利要求1或2的方法,其中在步驟(a)之前通過進行任選地包括溶劑的分子動力 學模擬而處理所述結構模型。
20.權利要求19的方法,其中所述溶劑是水。
21.權利要求19的方法,其中使用選自包括ABINIT、AMBER、Ascalaph、CASTEP,CPMD, CHARMM、DL_P0LY、FIREBALL、GROMACS、GROMOS、LAMMP S、MDynaMiχ、MOLDY、MO SCITO、NAMD, Newton-X, ProtoMol, Pffscf, SIESTA, VASP, TINKER, YASARA, ORAC 和 XMD 的集合的模擬程序 包進行所述分子動力學模擬。
22.權利要求21的方法,其中使用CHARMM模擬程序包進行所述分子動力學模擬。
23.權利要求21的方法,其中使用NAMD模擬程序包進行所述分子動力學模擬。
24.權利要求1或2的方法,其中通過在步驟(a)之前進行分子動力學模擬和重複步 驟(a)-(d)計算針對所述特定原子的SAP,每次以許多時間步驟進行進一步的分子動力學 模擬,由此產生如步驟(d)中的多個和,和計算所述這些和的平均值;藉此所述計算的平均 值是針對所述特定原子的SAP。
25.權利要求M的方法,其中使用選自包括ABINIT、AMBER、Ascalaph、CASTEP,CPMD, CHARMM、DL_P0LY、FIREBALL、GROMACS、GROMOS、LAMMP S、MDynaMiχ、MOLDY、MO SCITO、NAMD, Newton-X, ProtoMol, Pffscf, SIESTA, VASP, TINKER, YASARA, ORAC 和 XMD 的集合的模擬程序 包進行所述分子動力學模擬。
26.權利要求對的方法,其中使用CHARMM模擬程序包進行所述分子動力學模擬。
27.權利要求M的方法,其中使用NAMD模擬程序包進行所述分子動力學模擬。
28.權利要求1、權利要求2和權利要求M中任一項所述的方法,進一步包括對1-5個 胺基酸合計所述SAP得分。
29.權利要求觀的方法,其中所述胺基酸是沿著所述蛋白質序列連續地相鄰的。
30.權利要求觀的方法,其中所述胺基酸在所述蛋白質結構模型中是空間地相鄰的。
31.權利要求1至權利要求30中任一項的方法,其中所述結構模型是所述蛋白質或其 部分的X射線晶體結構模型。
32.權利要求1至權利要求30中任一項的方法,其中所述結構模型是所述蛋白質或其 部分的理論蛋白結構模型。
33.權利要求1至權利要求30中任一項的方法,其中所述結構模型是所述蛋白質或其 部分的同源模型。
34.權利要求1至權利要求30中任一項的方法,其中所述結構模型是所述蛋白質或其 部分的從頭開始蛋白結構模型。
35.權利要求1至權利要求30中任一項的方法,其中所述半徑在之間。IA和30A
36.權利要求35的方法,其中所述半徑是5A。
37.權利要求35的方法,其中所述半徑是1OA。
38.識別蛋白上的易聚集區域的方法,包括(a)將如根據權利要求1、權利要求2和權利要求M中任一項所計算的針對所述蛋白 質中原子的SAP繪製到所述蛋白質的結構模型上;和(b)識別具有SAP> 0的許多原子的所述蛋白質內的區域; 其中所述易聚集區域包括包含所述許多原子的所述胺基酸。
39.識別蛋白上的易聚集區域的方法,包括識別一個或多個胺基酸,所述胺基酸含有一個或多個具有大於所選閾值的SAP的原子,其中根據權利要求1、權利要求2和權利要求M中任一項的方法計算所述SAP,並且其 中所述易聚集區域包括所述識別的胺基酸。
40.識別蛋白上的易聚集區域的方法,包括繪製如權利要求1、權利要求2和權利要求M中任一項所計算的所述SAP值, 為所述圖中的峰計算曲線下面積(AUC),和 識別一個或多個具有正的AUC的蛋白區域, 其中所述易聚集區域包括所述識別的蛋白區域。
41.製備顯示降低的聚集傾向的蛋白質變體的方法,包括替代或缺失所述蛋白質中易聚集區域內的至少一個胺基酸殘基, 其中使用根據權利要求1、權利要求2和權利要求M中任一項計算的SAP得分識別所 述易聚集區域;和其中,如果替代所述胺基酸殘基,用更親水的胺基酸殘基替代它,這樣所述變體的所述 聚集傾向降低了。
42.權利要求41的方法,其中替代至少一個殘基和缺失至少一個殘基。
43.製備顯示降低的聚集傾向的蛋白質變體的方法,包括(a)在每個變體中通過替代所述蛋白質中易聚集區域內的至少一個殘基而產生許多蛋 白質變體,其中使用根據權利要求1、權利要求2和權利要求M中任一項計算的SAP得分識別所 述易聚集區域,其中在每個變體中,將一個或多個不同殘基或不同的殘基組合替代; 其中用更親水的殘基替代所述至少一個殘基;和(b)選擇如(a)中製備的顯示降低的聚集傾向的蛋白質變體。
44.權利要求41至權利要求43中任一項的方法,其中易聚集區域內所述至少一個氨基 酸殘基是所述易聚集區域中最疏水的殘基。
45.權利要求41至權利要求43中任一項的方法,其中易聚集區域內所述至少一個氨基 酸殘基是 Phe> Leu、lie、Tyr> Trp> Val> Met> Pro、Cys> Ala 或 Gly0
46.權利要求41至權利要求43中任一項的方法,其中所述更親水的胺基酸殘基選自 Thrλ Serλ LysΛ Gin、Asn、His、Glu、Asp 禾口 Arg0
47.權利要求41至權利要求43中任一項的方法,其中所述更親水的胺基酸殘基是稀有 的、非天然的或修飾的胺基酸。
48.權利要求41至權利要求43的方法,其中根據Black和Mould的疏水性標度測定所 述更親水的胺基酸殘基。
49.權利要求41至權利要求43的方法,其中替代所述易聚集區域內的至少兩個胺基酸殘基。
50.權利要求41至權利要求43的方法,其中替代所述易聚集區域內的至少三個胺基酸殘基。
51.權利要求41至權利要求43的方法,其中替代所述蛋白質內超過一個易聚集區域內 的至少一個殘基。
52.權利要求41至權利要求43中任一項的方法,其中根據權利要求38至權利要求40 中任一項所述的方法識別所述易聚集區域。
53.權利要求1至權利要求52中任一項的方法,其中所述蛋白選自抗體、Fab片段、 Fab'片段、Fd片段、Fv片段、F(ab' )2片段和Fc片段。
54.權利要求1至權利要求52中任一項的方法,其中所述蛋白是細胞因子、趨化因子、 脂因子、肌因子、神經遞質、神經營養蛋白、白細胞介素或幹擾素。
55.權利要求1至權利要求52中任一項的方法,其中所述蛋白是激素或生長因子。
56.權利要求1至權利要求52中任一項的方法,其中所述蛋白是受體或受體域。
57.權利要求1至權利要求52中任一項的方法,其中所述蛋白是神經遞質或神經營養 蛋白。
58.權利要求1至權利要求52中任一項的方法,其中所述蛋白是擬肽,包含非天然氨基 酸的蛋白或包含稀有胺基酸的蛋白。
59.計算針對蛋白質中胺基酸殘基的有效SAA的方法,包括(a)針對胺基酸計算所述胺基酸中原子的溶劑可及面積(SAA)與完全暴露的同一殘基 中原子的SAA的比;(b)用如通過胺基酸疏水性標度所測定的所述胺基酸的疏水性乘以所述比;藉此所述 乘積是所述胺基酸的所述有效SAA。
60.權利要求59的方法,其進一步包括合計至少兩個胺基酸的有效SAA,所述胺基酸在 所述蛋白序列中是相鄰的。
61.權利要求59的方法,其進一步包括合計三個胺基酸的有效SAA,所述胺基酸在所述 蛋白序列中是相鄰的。
62.權利要求59的方法,其進一步包括合計四個胺基酸的有效SAA,所述胺基酸在所述 蛋白序列中是相鄰的。
63.權利要求59的方法,其進一步包括合計五個胺基酸的有效SAA,所述胺基酸在所述 蛋白序列中是相鄰的。
64.製備包括蛋白質變體的藥物組合物的方法,所述蛋白質變體顯示減小的聚集傾向, 所述方法包括配製根據權利要求41或43的方法獲得的蛋白質變體加上藥學上可接受的載 體、佐劑和/或賦形劑。
65.識別蛋白質上的大分子結合區域的方法,包括(a)將如根據權利要求1、權利要求2和權利要求M中任一項所計算的針對所述蛋白 質中原子的所述SAP繪製到所述蛋白質的結構模型上;和(b)識別具有SAP> 0的許多原子的所述蛋白質內的區域;其中所述大分子結合區域包括包含所述許多原子的所述胺基酸。
66.識別蛋白質上的大分子結合區域的方法,包括識別一個或多個胺基酸,所述胺基酸含有一個或多個具有大於所選閾值的SAP的原子;其中根據權利要求1、權利要求2和權利要求M中任一項的方法計算所述SAP,並且其 中所述大分子結合區域包括所述識別的胺基酸。
67.識別蛋白質上的大分子結合區域的方法,包括繪製如權利要求1、權利要求2和權利要求M中任一項中所計算的所述SAP值, 為所述圖中的峰計算曲線下面積(AUC),和 識別一個或多個具有正的AUC的蛋白區域, 其中所述大分子結合區域包括所述識別的蛋白區域。
68.製備顯示對大分子降低的結合親和力的蛋白質變體的方法,包括替代或缺失針對所述蛋白質中的所述大分子的大分子結合區域內的至少一個胺基酸 殘基,其中使用根據權利要求1、權利要求2和權利要求M中任一項計算的SAP得分識別所 述大分子結合區域;和其中,如果替代所述胺基酸殘基,用更親水的胺基酸殘基替代它,這樣降低了所述變體 對所述大分子的所述結合親和力。
69.權利要求68的方法,其中替代至少一個殘基和缺失至少一個殘基。
70.製備顯示針對大分子的改變的結合親和力的蛋白質變體的方法,包括(a)在每個變體中通過替代針對所述蛋白質中所述大分子的大分子結合區域內的至少 一個殘基,產生許多蛋白質變體,其中使用根據權利要求1、權利要求2和權利要求M中任一項計算的SAP得分識別所 述大分子結合區域,其中在每個變體中,替代一個或不同殘基或不同的殘基組合;和(b)選擇如(a)中所製備的顯示對所述大分子改變的結合親和力的蛋白質變體。
71.權利要求68至權利要求70中任一項的方法,其中所述大分子結合區域內的至少一 個胺基酸殘基是所述大分子結合區域中最疏水的殘基。
72.權利要求68至權利要求70中任一項的方法,其中易聚集區域內所述至少一個氨基 酸殘基是 Phe> Leu、lie、Tyr> Trp> Val> Met> Pro、Cys、Ala 或 Gly0
73.權利要求68至權利要求70中任一項的方法,其中所述更親水的胺基酸殘基選自 Thrλ Serλ LysΛ Gin、Asn、His、Glu、Asp 禾口 Arg0
74.權利要求68的方法,其中所述更親水的胺基酸殘基是稀有的、非天然的或修飾的 胺基酸。
75.權利要求68的方法,其中根據Black和Mould的疏水性標度測定所述更親水的胺基酸殘基。
76.權利要求68至權利要求70的方法,其中替代所述大分子結合區域內的至少兩個胺基酸殘基。
77.權利要求68至權利要求70的方法,其中替代大分子結合區域內的至少三個胺基酸殘基。
78.權利要求68至權利要求70的方法,其中替代所述蛋白質內超過一個大分子結合區 域內的至少一個殘基。
79.權利要求68至權利要求70中任一項的方法,其中根據權利要求65至權利要求67 中任一項所述的方法識別所述大分子結合區域。
80.權利要求68至權利要求79中任一項的方法,其中所述大分子是另一個蛋白、多核 苷酸或多糖。
81.權利要求68至權利要求80中任一項的方法,其中所述蛋白選自抗體、Fab片段、 Fab'片段、Fd片段、Fv片段、F(ab' )2片段和Fc片段。
82.權利要求68至權利要求80中任一項的方法,其中所述蛋白是細胞因子、趨化因子、 脂因子、肌因子、神經遞質、神經營養蛋白、白細胞介素或幹擾素。
83.權利要求68至權利要求80中任一項的方法,其中所述蛋白是激素或生長因子。
84.權利要求83的方法,其中所述大分子是激素受體或生長因子受體。
85.權利要求68至權利要求70中任一項的方法,其中所述蛋白是受體或受體域。
86.權利要求85的方法,其中所述大分子是所述受體或受體域的受體激動劑或受體拮 抗劑。
87.權利要求68至權利要求80中任一項的方法,其中所述蛋白是神經遞質或神經營養蛋白。
88.權利要求87的方法,其中所述大分子是神經遞質受體或神經營養蛋白受體。
89.製備包括蛋白質變體的藥物組合物的方法,所述蛋白質變體顯示改變的與結合配 偶體相互作用的傾向,所述方法包括配製根據權利要求68或70的方法獲得的蛋白質變體 加上藥學上可接受的載體、佐劑和/或賦形劑。
全文摘要
本發明提供至少部分基於計算機模擬的方法和計算工具,其識別蛋白質的大分子結合區域和易聚集區域。然後可在這些易聚集區域進行替代以設計具有增強的穩定性和/或降低的聚集傾向的蛋白質。相似地,然後可在這些大分子結合區域進行替代以設計具有改變的對大分子的結合親合力的蛋白質。
文檔編號G06F19/00GK102099809SQ200980128287
公開日2011年6月15日 申請日期2009年6月19日 優先權日2008年6月20日
發明者B·垂奧特, B·海爾克, N·陳納姆塞蒂, V·卡瑟爾, V·沃諾夫 申請人:諾華公司, 麻省理工學院