經由基於物理的模擬預測多肽中的肽切割的製作方法
2024-04-13 12:45:05 1
經由基於物理的模擬預測多肽中的肽切割
1.優先權要求
2.本技術要求於2020年7月13日提交的美國臨時申請號63/051,166的權益和優先權,該美國臨時申請出於所有目的通過引用以其整體併入本文。
技術領域
3.本公開涉及多肽降解,並且具體地涉及用於預測給定多肽分子的肽鍵易受切割反應影響的可能性的技術。
背景技術:
4.多肽療法已經取得成功,現在代表了新藥批准的很大一部分。這一成功可部分歸功於多肽(諸如針對重要疾病靶標的單克隆抗體(mab))可以實現的高親和力和特異性。此外,經由片段可結晶區(fc區)(抗體的尾部區)與fc區再循環受體(fcrn)的相互作用,mab可以具有長的血清半衰期,因此能夠降低給藥頻率。在一些疾病環境中,例如不希望長半衰期的急性治療或在fcrn再循環不活躍的組織環境(諸如眼部)中,抗原結合片段(fab)可能優於完整mab。
5.儘管作為治療劑具有這些優勢,但mab和抗體片段可能易於受到化學和物理不穩定性的影響,這可能導致多肽降解並最終限制其效用。物理不穩定性可能表現為可溶性聚集、沉澱和凝膠形成。化學不穩定性可能表現為脫醯胺(例如,天冬醯胺(asn)脫醯胺)、異構化(例如,天冬氨酸(asp)異構化)和氧化(例如,色氨酸(trp)和蛋氨酸(met)殘基的氧化),僅舉幾例。在生物製劑的背景下,降解可能會降低多肽治療的可用性和/或降低觸發目標生物效應的可能性。例如,asp異構化可能會導致多肽治療的效力喪失,而由asp異構化形成異天冬氨酸與阿爾茨海默病有關。能夠在治療劑開發過程的早期檢測給定多肽降解的可能性將是有利的。
技術實現要素:
6.在各種實施例中,提供了一種計算機實現方法,該方法包括:對於包含具有側鏈和主幹的胺基酸的多肽的多肽構象,確定該胺基酸在處於該多肽構象中時的該主幹的二面角和該側鏈的二面角;基於該主幹的二面角和該側鏈的二面角,確定該胺基酸在處於該多肽構象中時的兩個原子、官能團或其組合之間的親核攻擊距離,其中該兩個原子或官能團中的一個在該胺基酸的側鏈中,並且該兩個原子或官能團中的另一個在該胺基酸的主幹中;基於該胺基酸在處於該多肽構象中時的該親核攻擊距離,確定該多肽構象是易受切割反應影響的反應性構象;響應於確定該多肽構象是該反應性構象,確定該胺基酸在處於該反應性構象中時的該主幹的二面角和該側鏈的二面角的自由能;以及基於該胺基酸的該主幹的二面角和該側鏈的二面角的該自由能,預測該胺基酸的該側鏈被捕獲在該反應性構象中的概率。
7.在一些實施例中,該計算機實現方法進一步包括:生成該多肽的表示;以及使用該
表示執行分子動力學模擬,其中執行該分子動力學模擬的結果包含該多肽的一組多肽構象,該一組多肽構象包括該多肽構象。
8.在一些實施例中,該計算機實現方法進一步包括預測該多肽由於該胺基酸的該側鏈被捕獲在該反應性構象中而化學降解的概率。
9.在一些實施例中,該計算機實現方法進一步包括輸出該胺基酸的該側鏈被捕獲在至少一種反應性構象中的概率和/或該多肽化學降解的概率。
10.在一些實施例中,該計算機實現方法進一步包括:基於該胺基酸的該側鏈被捕獲在該至少一種反應性構象中的該概率和/或該多肽化學降解的該概率,從將用作治療劑的至少一部分的潛在多肽的列表中去除該多肽。
11.在一些實施例中,該計算機實現方法進一步包括:基於該胺基酸的該側鏈被捕獲在該至少一種反應性構象中的該概率和/或該多肽化學降解的該概率,在將用作治療劑的至少一部分的潛在多肽的列表中將該多肽排在比另一多肽低的位置,其中針對該另一多肽的該胺基酸的該側鏈被捕獲在該至少一種反應性構象中的概率和/或多肽化學降解的概率小於針對該多肽的該胺基酸的該側鏈被捕獲在該至少一種反應性構象中的該概率和/或該多肽化學降解的該概率。
12.在一些實施例中,該預測該多肽化學降解的該概率包括:識別可及性限制,該可及性限制當得到滿足時指示該多肽的醯胺基團具有高於閾值的空間可及性以與來自周圍溶劑的溶劑分子結合;以及對於該反應性構象,基於評估該多肽的一種或多種空間特徵,確定滿足該可及性限制。
13.在一些實施例中,該確定該多肽構象是該反應性構象包括:確定距離標準,該距離標準當得到滿足時指示該側鏈內的該原子在該主幹內的另一個原子的預定距離閾值內;以及基於該反應性構象的該胺基酸的該親核攻擊距離與該預定距離閾值的比較,確定針對該反應性構象滿足該距離標準。
14.在一些實施例中,基於對處於該反應性構象中的該胺基酸的該主幹的該二面角和該側鏈的該二面角的自由能分布的分析來確定該自由能,並且其中該主幹的該二面角和該側鏈的該二面角的空間中的該自由能分布是根據bin群體計算的。
15.在一些實施例中,該預測該胺基酸的該側鏈被捕獲在該反應性構象中的該概率包括:確定能量標準,該能量標準當得到滿足時指示該胺基酸的該主幹的該二面角和該側鏈的該二面角的該自由能在預定能量閾值內;以及基於處於該反應性構象中的該胺基酸的該主幹的該二面角和該側鏈的該二面角的該自由能與該預定能量閾值的比較,確定針對該反應性構象滿足該能量標準。
16.在一些實施例中,提供了一種系統,其包括:一個或多個數據處理器;以及包含指令的非暫時性計算機可讀存儲介質,所述指令在所述一個或多個數據處理器上被執行時使所述一個或多個數據處理器執行本文公開的一種或多種方法的部分或全部。
17.在一些實施例中,提供了一種電腦程式產品,其有形地體現在非暫時性機器可讀存儲介質中,並且其包括指令,所述指令被配置為使一個或多個數據處理器執行本文公開的一種或多種方法的部分或全部。
18.本公開的一些實施例包括一種系統,該系統包括一個或多個數據處理器。在一些實施例中,該系統包括包含指令的非暫時性計算機可讀存儲介質,所述指令在所述一個或
多個數據處理器上被執行時使所述一個或多個數據處理器執行本文公開的一種或多種方法的部分或全部和/或本文公開的一種或多種過程的部分或全部。本公開的一些實施例包括一種有形地體現在非暫時性機器可讀存儲介質中的電腦程式產品,其包括指令,所述指令被配置為使一個或多個數據處理器執行本文公開的一種或多種方法的部分或全部和/或本文公開的一種或多種過程的部分或全部。
19.已使用的術語和表述被用作描述性而非限制性的術語,並且在使用此類術語和表述時無意排除示出和描述的特徵或其部分的任何等效物,但應認識到在要求保護的本發明的範圍內可以進行各種修改。因此,應當理解,儘管所要求保護的本發明已通過實施例和任選特徵具體地公開了,但是本文所公開的概念的修改和變化可被本領域內的技術人員採用,並且這樣的修改和變化被認為是在由所附權利要求限定的本發明的範圍內。
附圖說明
20.結合以下附圖描述本公開:
21.圖1示出了根據各種實施例的示例性切割反應的表示;
22.圖2a和2b示出了根據各種實施例的兩個理想化反應性構象(a和b)和使天冬醯胺(asn)側鏈氮對主幹羰基的親核攻擊的距離最小化的二面角;
23.圖3a-3f示出了根據各種實施例的從1.5us分子動力學軌跡計算的沿著主幹二面角ψ的自由能分布以及沿著側鏈二面角χ1和χ2的二維自由能全景圖;
24.圖4示出了根據各種實施例的基於分子動力學模擬和分子空間特徵的評估來生成切割反應的概率的過程;
25.圖5示出了根據各種實施例的適於與用於分子動力學模擬的系統和方法一起使用的示例性計算設備;
26.圖6a-6c示出了根據各種實施例的帶有cdr-l3序列(圖6a)、n末端水解產物(圖6b)和c末端水解產物(圖6c)的天然肽的提取離子色譜圖;
27.圖7a-7d示出了根據各種實施例的在98.0min時洗脫的n末端水解產物的ms 1光譜(圖7a),在98.8min時洗脫的n末端水解產物的ms1光譜(圖7b),asn n末端水解產物的理論ms1光譜(圖7c)和asp n末端水解產物的理論ms1光譜(圖7d);
28.圖8a和8b示出了根據各種實施例的在fab2中的asn-pro肽鍵水解;以及
29.圖9示出了根據各種實施例的在測試抗體中asn-pro肽水解的速率。
30.在附圖中,相似部位和/或特徵可具有相同的參考標記。此外,可通過在參考標號後面加上破折號和區分相似部位的第二標號來區分相同類型的各種部位。如果說明書中僅使用第一參考標號,則該描述適用於任何一個具有相同的第一參考標號的相似部位,而與第二參考標號無關。
具體實施方式
31.i.概述
32.本公開描述了用於預測給定多肽分子的肽鍵(例如,天冬醯胺(asn)和本體殘基諸如脯氨酸(pro)之間的肽鍵)易受切割反應影響的可能性的技術。給定多肽可以具有任意數量的多重構象,其中一些是反應性構象,而一些是非反應性構象。會導致多肽降解的切割反
應可以包括多個原子之間的反應(例如,側鏈氮對主幹羰基的親核攻擊或主幹的氮對側鏈的γ-碳的親核攻擊)。多肽是否呈現使得原子可以在切割反應中發生反應的反應性構象取決於許多因素,包括原子的物理接近度(例如,親核攻擊距離(dn))、多肽的二面角的自由能分布、由於空間體量引起的空間位阻以及環境條件,諸如ph和溶劑的可及性。
33.i.a.原子間距離反應限制
34.分子的兩個原子之間是否發生反應(例如,對兩個原子之一進行親核攻擊)可取決於兩個原子的接近度。在一些實例中,肽構象的空間特徵可以包括絕對或相對原子位置和/或兩個原子之間的距離。在一些情況下,空間特徵可以包括其他幾何相關信息,這些信息可以影響或決定分子中的兩個原子彼此之間的接近程度(以及從而是否會發生反應),諸如多個原子之間的夾角或與反應中涉及的一些或所有原子有關的二面角(例如,與易受影響的位點(諸如易受水解的位點)相鄰的胺基酸的多個二面角)。例如,空間特徵可以包括:(i)由4個主幹原子(由n
n-c
α-c-n
n+1
原子構成)定義的單個主幹二面角ψ,和(ii)由4個側鏈原子(由c-c
α-c
β-c
γ
原子構成)定義和由4個側鏈原子(由c
α-c
β-c
γ-o原子構成)定義的兩個側鏈二面角χ1、χ2,這些二面角可用於估計側鏈氮原子與主幹的γ-碳之間的距離。
35.可以通過定義一個空間來估計二面角,該空間對應於沿著空間的一個軸的一個二面角(例如,ψ)、沿著空間的另一個軸的另一個二面角(例如,χ1)和沿著空間的另一個軸的另一個二面角(例如,χ2)。空間內的多個區域可以基於空間特徵來定義,每個區域與預測的反應概率相關聯,預測的反應概率可以包括數值概率、分類概率(例如,非常低、低、中等、高)或二元概率。例如,第一區域可以對應於二面角(例如,ψ、χ1和χ2)的特定範圍,其將配置多肽使得可以參與親核攻擊的兩個原子之間的距離最小化或低於閾值(例如,2埃或3埃)。同時,第二(例如,剩餘的)區域可以對應於二面角的特定範圍,其將配置多肽使得兩個原子間隔超過閾值並且因此不太可能參與親核攻擊。
36.i.b.空間位阻和自由能限制
37.可以經由確定分子動力學模型模擬中的側鏈構象來探索切割反應的概率。如果多肽的三維結構將側鏈限制在非反應性構象中,則對於側鏈進入反應性構象來說在能量上是不利的。因此,空間位阻的存在可能導致進入反應性構象的自由能壘過高。沿側鏈二面角的自由能分析可以揭示圍繞二面角向反應性構象的旋轉是否受到空間位阻的限制,並且因此使得不能降解。當沒有可用的實驗數據時,計算機模擬方法可對風險評估特別有用。然而,即使識別和進入反應性構象的能力對於確定是否可能發生切割反應很重要,但這並不是絕對決定是否會發生切割反應。換句話說,側鏈可能能夠進入反應性構象,但不會發生反應,因為切割反應可能在能量上並不有利。
38.因此,一個或多個區域(對應於反應概率)可以經由空間效應和/或能量分布範圍來定義,以指示能壘特性(例如,存在足夠的空間位阻,可能導致對於進入反應性構象來說自由能壘過高),用於結合上述結構構象來預測降解反應。應理解,可以單獨定義區域以表示空間位阻和/或自由能限制。因此,可以進行分子動力學模擬,該模擬預測多肽將轉變為可能經歷切割反應的反應性構象的可能性。這種預測可以包括識別使多肽易受特定切割反應影響的空間特徵,並使用具有經定義的空間位阻和/或自由能的分子動力學模擬來預測多肽將轉變為具有這些空間特徵的構象的可能性。
39.i.c.溶劑可及性反應限制
40.即使如果原子間距離標準得到滿足(例如,基於對主幹和側鏈的二面角的評估)並且如果自由能標準得到滿足(例如,基於對主幹和側鏈的二面角的自由能分布的評估),化學降解在沒有溶劑的情況下不會發生。因此,額外的化學降解限制可能要求水分子(或其他溶劑)可用於水解。可以通過在整個模擬中跟蹤一定量的水分子來實現限制。因此,除了追蹤多肽的各個原子的位置之外,該模擬還可以追蹤多個溶劑分子中的每一個的位置(例如,並且可能追蹤多個溶劑分子中的每個分子的每個原子)。在每個時間步長處,可以確定溶劑分子是否在距多肽上特定位點(例如,多肽分子的主幹醯胺位點)的預定距離內。由於(例如)多肽內的摺疊,一些構象可能會阻止溶劑分子進入特定的多肽位點。
41.i.d.環境限制
42.諸如mab和抗體片段的治療劑可能易受化學和物理不穩定性的影響,該不穩定性可能限制其效用。如果互補決定區(cdr)的殘基不穩定,這可能非常令人擔憂,因為這些位點處的化學變化更有可能對效力產生影響。開發使用蛋白質治療劑的有效的疾病治療,需要治療劑在製劑和生理條件下都顯示出足夠的穩定性才能有用。儘管在計算機模擬測試方面取得了進展,但在體外應用熱應激挑戰更常見,以對用於進一步開發的候選分子適用性進行排列。由於mab通常具有鹼性等電點,並且因為脫醯胺速率隨ph增加,因此通常在增加溶解度並減緩降解的微酸性(ph 5-6)條件下配製抗體並測試其穩定性。
43.這種方法可用於選擇在典型配製條件下具有良好保質期的候選物;然而,在生理離子強度和ph(~7.4)條件下穩定性較差的分子可能會被遺漏。因此,額外的化學降解限制可能要求存在一定的ph或ph範圍。可以通過在整個模擬中跟蹤反應的ph來實現限制。因此,除了跟蹤多肽的單個原子的位置之外,模擬還可以跟蹤ph條件。在每個時間步長處,可以確定ph是否在預定範圍內。由於(例如)發生反應的環境的當前ph,一些構象(反應性或其他)可能或多或少佔主導地位。應理解,考慮其他類型的環境因素來推斷影響構象的其他變量。例如,可替代地或另外地,溫度限制可以與諸如ph和空間特徵的其他因素組合使用,以預測多肽將轉變為可能經歷切割反應的反應性構象的可能性。
44.i.f.模擬和限制使用
45.通過檢測多肽的經預測降解,可以略過該多肽而選擇具有類似治療效果但沒有這種降解障礙的另一多肽,或者該多肽可以與減輕不需要的降解作用的方法相結合。預測給定分子是否會降解的一種方法是執行模擬。然而,化學降解可能涉及亞原子相互作用、共價鍵形成和共價鍵斷裂。使用傳統的分子動力學模擬這些類型的事件是不可能的。一些技術已經根據分子中存在哪些胺基酸基序來預測反應概率。雖然不同基序的反應概率可能會有很大差異,但基序的影響可能取決於其在分子中的位置(例如,基序是在重鏈還是輕鏈上以及它在鏈中的位置)。即使對於被認為高度穩定的基序,實驗數據也確定了一些基序發生反應的情況,儘管該基序具有相對普遍的穩定性。
46.為了解決這些限制和問題,本文描述的技術實施分子動力學模擬技術和分子幾何技術以生成反應概率。分子動力學模擬的一次或多次迭代可以模擬多肽的構象如何隨時間變化。可以基於空間特徵(例如,可以確定是否滿足各種反應限制)為一個或多個構象生成反應概率。例如,對於分子動力學模擬生成的每個構象,可以利用多肽在該構象中的空間特徵來確定是否原子間距離反應限制和能量分布限制得到滿足,進而可以指示具有該構象的多肽參與切割反應的時機已經成熟。包含溶劑和環境的建模可用於估計經配置有利於反應
的多肽分子的比例,這些分子可以接觸溶劑分子並與溶劑分子反應。基於每個限制得到滿足的模擬生成的多肽構象的一部分,可以生成指示給定多肽化學降解為特定目標產物的程度和/或速度的輸出。因此,本文公開的基於模擬的技術可以基於分子動力學和多肽的各種構象的三維結構分析(例如,而不是基於對應於多肽中氨基身份的構象獨立數據)生成預測的反應敏感性。
47.本公開的一個說明性實施例涉及一種計算機實現方法,該方法包括:對於包含具有側鏈和主幹的胺基酸的多肽的多肽構象,確定該胺基酸在處於該多肽構象中時的該主幹的二面角和該側鏈的二面角;基於該主幹的二面角和該側鏈的二面角,確定該胺基酸在處於該多肽構象中時的兩個原子、官能團或其組合之間的親核攻擊距離,其中該兩個原子或官能團中的一個在該胺基酸的側鏈中,並且該兩個原子或官能團中的另一個在該胺基酸的主幹中;基於該胺基酸在處於該多肽構象中時的該親核攻擊距離,確定該多肽構象是易受切割反應影響的反應性構象;響應於確定該多肽構象是該反應性構象,確定該胺基酸在處於該反應性構象中時的該主幹的二面角和該側鏈的二面角的自由能;以及基於該胺基酸的該主幹的二面角和該側鏈的二面角的該自由能,預測該胺基酸的該側鏈被捕獲在該反應性構象中的概率。在一些情況下,該方法進一步包括預測該多肽由於該胺基酸的該側鏈被捕獲在該反應性構象中而化學降解的概率。
48.本公開的另一說明性實施例涉及一種計算機實現方法,該方法包括:生成包含具有側鏈和主幹的胺基酸的多肽的表示;使用該表示進行分子動力學模擬,其中執行分子動力學模擬的結果包括該多肽的一組多肽構象;對於該一組多肽構象中的每個多肽構象,確定胺基酸在處於多肽構象中時的空間特徵,其中該空間特徵包括主幹的二面角和側鏈的二面角;基於主幹的二面角和側鏈的二面角的組合,估計每個多肽構象中的胺基酸的兩個原子、官能團或其組合之間的親核攻擊距離,其中兩個原子或官能團中的一個在胺基酸的側鏈中,並且兩個原子或官能團中的另一個在胺基酸的主幹中;基於每個多肽構象中的胺基酸的親核攻擊距離,識別至少一種易受切割反應影響的反應性構象;確定至少一種反應性構象中的胺基酸的主幹的二面角和側鏈的二面角的自由能;以及基於胺基酸的主幹的二面角和側鏈的二面角的自由能,預測胺基酸的側鏈被捕獲在至少一種反應性構象中的概率。在一些情況下,該方法進一步包括預測該多肽由於該胺基酸的該側鏈被捕獲在該至少一種反應性構象中而化學降解的概率。
49.ii.定義
50.如本文所用,術語「多肽」用於指具有任何長度的胺基酸的聚合物並且可以包括蛋白質、dna和/或rna。聚合物可以包括蛋白質,該蛋白質包括任何蛋白質形態,例如胺基酸取代(非天然胺基酸)、交替糖基化、蛋白質、dna複合物和/或病毒表面外殼蛋白質。聚合物可為線性或分支的,其可包含經過修飾的胺基酸,並且其可間插有非胺基酸。該術語還涵蓋已天然修飾或通過介入修飾的胺基酸聚合物;例如,二硫鍵形成、糖基化、脂質化、乙醯化、磷酸化或任何其他操作或修飾,諸如與標記組分綴合。在定義內還包括例如含有胺基酸(包括例如非天然胺基酸等)的一種或多種類似物以及本領域中已知的其他修飾的多肽。
51.如本文所用,術語「化學降解」用於指將分子(例如,多肽分子)分解成兩個或更多個片段的過程。在聚合物的上下文中,化學降解可包括聚合物完全解聚成相應單體或部分解聚(例如,解聚成一種或多種寡聚物和可能的一種或多種其他化學物質)。化學降解可以
包括特定類型的化學過程,諸如色氨酸氧化、蛋氨酸氧化、asn-pro剪接、天冬醯胺脫醯胺或天冬氨酸異構化。
52.如本文所用,術語「親核取代或攻擊」是基本類的反應,其中富含電子的親核試劑選擇性地結合或攻擊原子或原子組(例如,官能團)的正電荷或部分正電荷以取代離去基團。帶正電或部分帶正電的原子被稱為親電子試劑。
53.如本文所用,術語「親核攻擊距離」是富含電子的親核試劑與具有正電荷或部分正電荷的原子或原子組(例如,官能團)之間的平均(或均值或中值或其他類似度量)距離(例如,埃)。
54.如本文所用,術語「多重構象」意指給定多肽可以具有任意數量的原子空間排列,其中一些是反應性構象,而一些是非反應性構象。
55.如本文所用,術語「反應性構象」是胺基酸或多肽的構象,其中胺基酸或多肽易於或易受親核取代或攻擊。
56.如本文所用,術語「非反應性構象」是胺基酸或多肽的構象,其中該胺基酸或多肽例如由於空間位阻而不易於或不易受親核取代或攻擊。
57.如本文所用,當動作「基於」某物時,這意味著該動作至少部分地基於某物的至少一部分。
58.如本文所用,術語「基本上」、「大約」和「約」被定義為在很大程度上但不必完全是所規定的(並且包括完全是所規定的),如本領域普通技術人員所理解的。在任何公開的實施例中,術語「基本上」、「大約」或「約」可以用對於所指定的「在[某個百分比]內」替代,其中百分比包括0.1%、1%、5%和10%。
[0059]
iii.反應發生的示例性依賴性
[0060]
在生理條件下,天冬醯胺(asn)殘基易受脫醯胺,其中醯胺側鏈水解形成游離羧酸。這一反應的限速步驟是形成五元琥珀醯亞胺環中間體。然而,已經表明,含有asn隨後為本體殘基諸如脯氨酸(pro)的肽易受兩個殘基之間的肽主幹的水解切割影響。在至少一種mab的輕鏈cdr-l3的互補決定區3中鑑別的asn-pro位點的質譜數據導致鑑別出與此位點相關的三種肽:含有asn-pro位點的天然胰蛋白酶肽、含有asn和iso-asn的n末端水解產物肽,以及c末端水解產物肽。含有asn和iso-asn而非asp和iso-asp的n末端水解產物的鑑別表明,琥珀醯亞胺中間體的形成是側鏈醯胺氮對肽鍵羰基的攻擊的結果。接著此cooh末端琥珀醯亞胺中間體可以打開以形成觀察到的含有asn或iso-asn的n末端水解產物。
[0061]
圖1示出了此可產生化學降解產物的示例性切割反應的表示。更具體地說,圖1描繪了包含具有主幹的側鏈的asn殘基的表示。如果側鏈氮原子和主幹的γ-碳足夠接近並且主幹和側鏈的二面角的自由能分布有利於轉變為反應性構象,則多肽分子易受側鏈醯胺氮對肽鍵羰基的親核攻擊。作為親核攻擊的結果,可以產生亞穩定的cooh末端琥珀醯亞胺(環狀醯亞胺)中間體。接著此琥珀醯亞胺中間體可以打開,並且如果溶劑可接觸到該琥珀醯亞胺中間體,則該琥珀醯亞胺水解為天冬醯胺和異天冬醯胺鍵的混合物。對於天冬醯胺殘基,多肽可以保持其靶特徵。然而,對於異天冬醯胺殘基,相對於原始多肽,蛋白質的構象及其靜電特性可以改變。如果模擬能夠可靠地預測多肽將化學降解為不需要的產物的概率,則可以相應地選擇多肽和/或製劑以最小化不需要的化學降解並保持具有靶功能的活性多肽。
[0062]
iv.原子間距離和能量分布限制實施
[0063]
如本文所描述,asn-pro水解中的降解途徑經由asn側鏈氮對主幹羰基的親核攻擊進行。此過程的先決條件是asn側鏈採用減小asn側鏈氮和側鏈羰基之間的親核攻擊距離(dn)的反應性構象。距離dn的主要特徵是主幹二面角ψ(由n
n-c
α-c-n
n+1
原子構成)和側鏈二面角1χ1(由c-c
α-c
β-c
γ
原子構成;注意這與傳統的chi1不同,典型的指由n-c
α-c
β-c
γ
構成的側鏈二面角)和χ2(由c
α-c
β-c
γ-o原子構成)的組合。如圖2a和2b所示(圖2a顯示蛋白質結構內的asn-pro肽;並且圖2b顯示蛋白質結構內的asn-pro肽並且脯氨酸環可見),對於asn殘基,距離dn可以在二面角的以下兩種特定組合中最小化:第一為,當主幹二面角以ψ》120延伸並且側鏈二面角為χ1~-60
°
和χ2~-90
°
(圖2a和2b中的構象a)時;第二為,當主幹二面角在ψ《-60情況下成緊湊角並且χ1~60
°
和χ2~90
°
(圖2a和2b中的構象b)。更具體地說,給定原子是否會攻擊另一原子或與另一原子反應取決於其彼此的接近度(親核攻擊距離(dn))。在一些情況下,可以在整個模擬過程中跟蹤原子彼此的位置和角度,並且因此也可以跟蹤距離dn。在其他情況下,可以在整個模擬過程中跟蹤二面角,這可用於推斷或估計原子是否足夠接近以進行反應。圖2a和2b示出了三個二面角ψ、χ1和χ2如何影響側鏈氮原子和主幹的γ-碳之間的距離dn。
[0064]
在一些情況下,可以使用具有一個或多個側鏈的多肽的表示來進行分子動力學模擬。執行分子動力學模擬的結果可以包括一組多肽構象,該組多肽構象的每個多肽構象,針對多肽中的每個原子,識別原子的位置。對於該組多肽構象中的每個多肽構象,確定一個或多個空間特徵,該空間特徵是多肽的胺基酸(例如,asn)在多肽構象中時的空間特徵。一個或多個空間特徵可包括多個原子間距離、多個夾角和/或多個二面角。在某些情況下,空間特徵包括胺基酸的主幹的二面角和側鏈的兩個二面角。可以基於空間特徵(例如,主幹的二面角和側鏈的兩個二面角的組合)計算或估計每個多肽構象中的胺基酸的兩個原子、官能團或其組合之間的親核攻擊距離dn。一旦計算或估計出每個多肽構象中的胺基酸的親核攻擊距離,就可以確定多肽的至少一種易於或易受親核取代或攻擊的反應性構象。
[0065]
為了使用二面角和親核攻擊距離dn來鑑別至少一種反應性構象,可以確定距離標準,該距離標準對應於空間特徵(例如,二面角ψ、χ1和χ2)的值組合中的閾值親核攻擊距離。例如,可以將預定距離閾值(例如,最小親核攻擊距離)定義在和之間(例如,),以確定是否滿足距離標準。當空間特徵(例如,二面角ψ、χ1和χ2)導致親核攻擊距離dn等於或小於預定距離閾值時,可滿足距離標準。當滿足距離標準時,滿足預定距離閾值的構象被鑑別為反應性構象。當空間特徵(例如,二面角ψ、χ1和χ2)導致親核攻擊距離dn大於預定距離閾值時,可能不滿足距離標準。當不滿足距離標準時,構象被鑑別為非反應性構象。應理解,用於鑑別至少一種反應性構象的距離標準的滿足可以使用替代技術來確定,例如,將空間特徵(例如,二面角ψ、χ1和χ2)的值與指示多肽主幹鏈內的原子或官能團在側鏈的原子或官能團的預定距離內的獨立範圍或閾值進行比較。
[0066]
在一些情況下,可以計算側鏈沿二面角的自由能,以從機理上了解側鏈構象對水解速率的作用。自由能值可以經由分子動力學模型生成。圖3a-3f示出了從分子動力學模型模擬獲得的主幹二面角(ψ)和側鏈二面角(χ1和χ2)的自由能分布(根據bin群體計算)。具有低自由能值的構象(由較深的陰影表示)比具有高自由能值的構象(由較淺的陰影表示)更
穩定,因此分子更有可能處於前一構象中。較低的自由能對應於較高的群體(當確認是反應性構象時模擬中的框架數),因此在反應性構象的給定二面角組合中找到側鏈的概率較高。這些圓圈標識了特定的二面角範圍,在幾何上,將側鏈的氮和主幹的γ-碳定位在最小親核攻擊距離(例如,2或3埃)內。如果圓圈區域不包括與低自由能值相關的構象,則輸出表明多肽不太可能發生化學降解,因為多肽分子的構象沒有使該鏈氮原子足夠靠近主幹的γ-碳來反應。
[0067]
圖3a-3f中的每個自由能分布對應於使用特定多肽結構的模擬。值得注意的是,圖3a-3d的自由能分布表明,相應的多肽(fab1、fab2、mab3和mab4)可能具有其中側鏈的氮和主幹的γ-碳之間的距離處於最小親核攻擊距離的構象。同時,對應於圖3e和3f的自由能分布的多肽(mab5和fab6)不太可能處於原子呈此接近度的構象中。更具體地說,沿ψ的自由能分布示出了fab2主要採用緊湊的主幹二面角(ψ《-60),而其他結構fab1、fab6、mab3、mab4和mab5採用擴展構象(ψ》120)。因此,反應性構象對應於fab2中的構象b和結構fab1、mab3、mab4、mab5和fab6中的構象a。fab1、mab3和mab4的構象a的自由能非常低(分別為0.94、0.96和1.06kcal/mol),這與針對這些結構觀察到的高實驗水解率(分別為13%、15%和15%/周)相符。相比之下,mab5的構象a的自由能相對較高(1.56kcal/mol),而fab6的自由能最高(2.66kcal/mol),這與針對這些分子觀察到的低實驗速率(分別為5%和0%/周)完全一致。然而,fab2的反應性構象的自由能與實驗速率的一致性較差,雖然反應性構象的自由能很小(0.75kcal/mol),但實驗速率並沒有那麼高(9%/周)。懷疑即使側鏈採用反應性構象,化學反應在這種情況下在能量上也並非有利。因此,在一些情況下,在分子動力學模型模擬中包括反應能量作為限制可能是有益的。
[0068]
在一些情況下,多肽的胺基酸側鏈被捕獲在反應性構象中的概率是基於胺基酸的主幹和/或側鏈的一個或多個二面角的自由能分布來預測的。如果多肽的三維結構將側鏈限制在非反應性構象中,則對於側鏈進入反應性構象來說在能量上是不利的。因此,空間位阻的存在可能導致進入反應性構象的自由能壘過高。可替代地,如果多肽的三維結構將側鏈限制在反應性構象的給定二面角組合中,則側鏈可能會被捕獲於該反應性構象中。因此,沿二面角的自由能分析和親核攻擊距離分析可以揭示圍繞二面角向反應性構象的旋轉是否受到空間位阻的限制,因此使得不能降解。
[0069]
為了使用自由能分析連同二面角和親核攻擊距離,可以確定自由能標準,該標準對應於與空間特徵(例如,二面角ψ、χ1和χ2)的值組合中的預定距離閾值(例如,最小親核攻擊距離)相關聯的反應性構象。例如,第一預定能量閾值(最小自由能值)可以定義在1.0kcal/mol和2.0kcal/mol之間(例如,1.5kcal/mol),其對應於具有以ψ》120
°
延伸的主幹二面角以及作為χ1~-60
°
和χ2~-90
°
的側鏈二面角的第一構象。單獨地,第二預定能量閾值(最小自由能值)可以定義在1.0kcal/mol和2.5kcal/mol之間(例如,2.0kcal/mol),其對應於具有以ψ《-60緊湊的主幹二面角以及作為χ1~60
°
和χ2~90
°
的側鏈二面角的第二構象。可替代地,全局預定能量閾值(最小自由能值)可以定義在1.0kcal/mol和2.5kcal/mol之間(例如,處於2.0kcal/mol),其對應於所有使親核攻擊距離最小化的具有胺基酸的主幹的二面角和側鏈的兩個二面角的構象。在一些情況下,全局預定閾值(最小自由能值)可以定義在1.0kcal/mol和2.5kcal/mol之間(例如,處於2.0kcal/mol),其對應於主幹二面角ψ在120
°
和-60
°
之間以及側鏈二面角χ1在-60
°
和+60
°
之間以及χ2在-90
°
和+90
°
之間的所有構
象。當空間特徵(例如,二面角ψ、χ1和χ2)具有等於或小於最小自由能值(例如,全局預定能量閾值)的自由能時,滿足自由能標準。當空間特徵(例如,二面角ψ、χ1和χ2)具有大於最小自由能值(例如,全局預定能量閾值)的自由能時,不滿足自由能標準。應理解,用於識別至少一種反應性構象的自由能標準的滿足可以使用替代技術來確定,例如,將空間特徵(例如,二面角ψ、χ1和χ2)的值與指示胺基酸的主幹和/或側鏈的自由能在預定自由能值內的獨立範圍或閾值進行比較。
[0070]
多肽的胺基酸側鏈被捕獲在反應性構象中的概率可以定義為數值概率、分類概率(例如,非常低、低、中等、高)或基於胺基酸主幹和/或側鏈的一個或多個二面角的自由能分布的二元概率。例如,如果由距離標準確定的反應性構象與由自由能標準確定的低自由能值相關聯,則輸出可表明,多肽的胺基酸側鏈可能被捕獲在反應性構象中(側鏈可以進入反應性構象)。可替代地,如果由距離標準確定的反應性構象與由自由能標準確定的高自由能值相關聯,則輸出可表明,能壘太高並且多肽將很可能保持非反應性構象。
[0071]
一旦確定了多肽的胺基酸側鏈被捕獲在反應性構象中的概率,就有可能預測由於多肽分子的反應性構象引起側鏈氮原子足夠接近主幹的γ-碳進行反應而使多肽化學降解的概率。多肽化學降解(例如,經歷親核攻擊和水解反應)的概率可以定義為數值概率、分類概率(例如,非常低、低、中等、高)或基於多肽的胺基酸側鏈被捕獲在反應性構象中的概率的二元概率。例如,如果多肽的胺基酸側鏈可能被捕獲在反應性構象中,則輸出可表明,由於多肽分子的反應性構象引起側鏈氮原子足夠接近主幹的γ-碳進行反應而使多肽很可能發生化學降解。可替代地,如果能壘太高並且多肽將很可能保持非反應性構象,則輸出可表明,多肽不太可能發生化學降解或不能降解。然而,即使多肽可能呈現反應性構象,除非存在反應性構象的可能性之外的其他因素(例如,溶劑可接近),否則多肽可能不會降解。因此,在一些情況下,可以包括額外的限制作為預測構象行為和多肽化學降解概率的因素。
[0072]
v.環境和可及性限制實施
[0073]
可以通過分子動力學模擬研究環境因素諸如ph、溫度和溶劑的可及性對多肽的構象行為和/或化學降解的作用。環境因素(例如ph和溫度)可以在模擬中定義為常數。在一些情況下,可以通過計算組成分子的所有相關pka值並指定給定ph下的主要質子化態來定義ph。雖然此處使用了傳統的分子動力學協議,其中質子化態在模擬過程中是固定的,但可替代地,也可以使用允許在模擬中改變質子化態的方法,諸如恆定ph分子動力學。可替代地,可以使用量子力學/分子力學(qm/mm)方法添加h3o+和oh-離子以調節ph值。即使發生親核攻擊,多肽也不會被降解,除非環境條件合適且溶劑分子可接近。分子動力學模擬可以進一步配置為模擬溶劑中的多肽(例如,作為顯式溶劑或隱式溶劑)。阻溶劑度量可以定義為醯胺基團與非溶劑基團結合的框架數減去醯胺基團與溶劑分子(例如,水分子)結合的框架數。因此,與正度量相比,負度量對應於更大的溶劑可及性。正度量可以表明多肽的幾何形狀阻止溶劑分子到達醯胺基團。
[0074]
vi.預測多肽反應類型的過程
[0075]
圖4說明了基於分子動力學模擬和分子空間特性的評估來生成切割反應的概率的過程400。過程400開始於框405,其中生成包含具有側鏈和主幹的胺基酸的多肽的表示。該表示可以包括對多肽(以及可能的溶劑)的原子、質量、電荷和原子間連接的識別。該表示可以進一步包括多肽(以及可能的溶劑)的每個原子的起始坐標。該表示可以進一步包括要在
整個模擬中以計算方式應用的限制,諸如夾角或二面角的限制、van der wahl項、自由能、ph等。
[0076]
在塊410,使用表示進行一個或多個分子動力學模擬以生成一組多肽構象。該組多肽構象中的每個多肽構象可以對應於模擬中的時間步長。對於多肽的每個原子,該組多肽構象的每個多肽構象可以包括該原子的位置。該組多肽構象可以通過計算粒子位置的力和數值求解運動方程來確定。在每個時間步長,除了確定每個原子的位置外,還可以進一步估計每個原子的動量。
[0077]
在框415,對於該組多肽構象中的每個多肽構象,確定胺基酸在處於多肽構象中時的一個或多個空間特徵。一個或多個空間特徵可以包括夾角和/或二面角(例如,鄰近易受影響的位點的胺基酸的主幹和/或側鏈二面角ψ、χ1和χ2)。在一些情況下,空間特徵包括主幹的二面角(ψ)和側鏈的二面角(χ1或χ2)。在其他情況下,空間特徵包括主幹的二面角(ψ)、側鏈的第一二面角(χ1)和側鏈的第二二面角(χ2)。
[0078]
在框420,基於胺基酸處於多肽構象中時的一個或多個空間特徵,估計每個多肽構象的胺基酸的兩個原子、官能團或其組合之間的親核攻擊距離。例如,可針對每個多肽構象使用每個原子或官能團的位置、原子或官能團之間每個原子的動量以及二面角的組合來估計兩個原子、官能團或其組合之間的親核攻擊距離。在一些情況下,每個多肽構象的胺基酸的兩個原子、官能團或其組合之間的親核攻擊距離是基於夾角、二面角或二面角的組合(例如,主幹的二面角和側鏈的二面角)來估計的。在一些情況下,兩個原子或官能團中的一個在胺基酸的側鏈中,並且兩個原子或官能團中的另一個在胺基酸的主幹中。
[0079]
在框425,基於每個多肽構象的胺基酸的親核攻擊距離識別出至少一種易受切割反應影響的反應性構象。在一些情況下,確定可用於識別至少一種反應性構象的距離標準。距離標準可以對應於識別反應性構象的空間特徵(例如,二面角ψ、χ1和χ2)的值組合中的最小親核攻擊距離。例如,可以將預定距離閾值(最小親核攻擊距離)定義在和之間(例如,約),以確定是否滿足距離標準。確定至少一種反應性構象是否滿足距離標準可以包括將至少一種反應性構象的胺基酸的親核攻擊距離與預定距離閾值進行比較。當親核攻擊距離等於或小於預定距離閾值時,滿足距離標準。當滿足距離標準時,滿足距離標準的構象被鑑別為反應性構象。當親核攻擊距離大於預定距離閾值時,不滿足距離標準。當不滿足距離標準時,不滿足距離標準的構象被鑑別為非反應性構象。
[0080]
在框430,確定至少一種反應性構象中的夾角、二面角或二面角的組合(例如,胺基酸的主幹的二面角和側鏈的二面角)的自由能。可以基於對夾角、二面角或二面角組合的自由能分布的分析來確定自由能。在一些情況下,夾角、二面角或二面角組合的空間中的自由能分布和全景圖是使用根據bin群體計算的,其中kb是波耳茲曼常數(boltzmann’s constant),t是溫度,ni是bin i的群體,並且n
max
是具有最多bin的群體。可以給無群體的bin提供相當於0.5群體的人工勢壘。在每個時間步長,除了確定每個原子的位置外,還可以進一步估計自由能。在某些情況下,可以使用qm/mm方法對自由能進行建模。
[0081]
在框435,可以基於胺基酸的夾角、二面角或二面角的組合(例如,胺基酸的主幹的二面角和側鏈的二面角)的自由能來預測胺基酸的側鏈被捕獲在至少一種反應性構象中的
概率。在一些情況下,確定可用於預測胺基酸側鏈被捕獲在至少一種反應性構象中的概率的自由能標準。例如,預定能量閾值(最小自由能值)可以定義在0.0kcal/mol和1.0kcal/mol之間,其對應於所有反應性構象。確定至少一種反應性構象是否滿足能量標準可以包括將至少一種反應性構象中的夾角、二面角或二面角的組合(例如,胺基酸的主幹的二面角和側鏈的二面角)的自由能與預定能量閾值進行比較。當空間特徵(例如,二面角ψ、χ1和χ2)具有等於或小於預定能量閾值的自由能時,滿足自由能標準。當滿足自由能標準時,可以預測胺基酸的側鏈可能被捕獲在反應性構象中(側鏈可以接近反應性構象)。當空間特徵(例如,二面角ψ、χ1和χ2)具有大於預定能量閾值的自由能時,不滿足自由能標準。當不滿足自由能標準時,胺基酸的側鏈面臨過高的能壘,並且可以預測多肽可能保持非反應性構象。
[0082]
可確定可選框440,即環境和可及性限制,所述限制當得到滿足時,指示多肽的醯胺基團具有高於閾值的空間可及性以與來自周圍溶劑的溶劑分子結合。是否滿足環境和可及性限制是基於評估多肽在至少一種反應性構象中的一種或多種空間特徵、一種或多種環境因素(例如ph或溫度)、溶劑分子可及性或其組合。
[0083]
在框445,由於胺基酸的側鏈被捕獲在至少一種反應性構象中,可以預測多肽化學降解的概率。例如,如果多肽的胺基酸側鏈可能被捕獲在反應性構象中,則可以預測多肽可能由於反應性構象而經歷化學降解。可替代地,如果能壘太高並且多肽很可能會保持非反應性構象,則可以預測多肽不太可能經歷化學降解。在某些情況下,多肽化學降解的概率可以作為反應性構象以及環境和可及性限制的結果來預測。
[0084]
在框450,輸出胺基酸的側鏈被捕獲在至少一種反應性構象中的概率和/或多肽化學降解的概率。例如,胺基酸的側鏈被捕獲在至少一種反應性構象中的概率和/或多肽化學降解的概率可以顯示或傳輸到另一設備。在一些情況下,胺基酸的側鏈被捕獲在至少一種反應性構象中的概率和/或多肽化學降解的概率用於選擇以特定方式使用的多肽(例如,以開發針對特定病狀的治療)和/或選擇多肽的特定製劑(例如,以限制水進入多肽)。
[0085]
在一些情況下,胺基酸的側鏈被捕獲在至少一種反應性構象中的概率和/或多肽化學降解的概率用於從潛在多肽的列表中去除該多肽,該潛在多肽基於胺基酸的側鏈被捕獲在至少一種反應性構象中的概率和/或多肽化學降解的概率用作治療劑的至少一部分。
[0086]
在一些情況下,胺基酸的側鏈被捕獲在至少一種反應性構象中的概率和/或多肽化學降解的概率用於在潛在多肽的列表中將該多肽排在比另一多肽低的位置,該潛在多肽基於胺基酸的側鏈被捕獲在至少一種反應性構象中的概率和/或多肽化學降解的概率用作治療劑的至少一部分,其中該另一多肽的胺基酸側鏈被捕獲在至少一種反應性構象中的概率和/或多肽化學降解的概率小於多肽的胺基酸側鏈被捕獲在至少一種反應性構象中的概率和/或多肽化學降解的概率。
[0087]
vii.示例計算環境
[0088]
圖5說明了根據本公開的適於與用於分子動力學模擬的系統和方法一起使用的示例性計算設備500。示例計算設備500包括處理器505,其使用一個或多個通信總線515與存儲器510和計算設備500的其他組件通信。處理器505被配置為執行存儲在存儲器510中的處理器可執行指令以執行根據不同實例的用於分子動力學模擬的一種或多種方法,諸如本文關於圖4描述的示例方法400的部分或全部。在此實例中,存儲器510存儲處理器可執行指令,這些指令為一種或多種目標多肽提供多肽數據分析520和預測分析525,如上文關於圖
clara,ca)進行尺寸排阻色譜(sec)。使用tsk-gel g2000swxl(7.8x300 mm)柱(tosoh bioscience,south san francisco,ca)分離g6.31。將fab2樣品在流動相(0.2m磷酸鉀,0.25m氯化鉀ph 6.2)中稀釋至約0.5mg/ml。將70μl樣品注入至柱上並在25℃以等度模式以0.5ml/min的流速洗脫30分鐘,並且使用280nm處的uv吸收進行檢測。sec峰分為單體、高分子量物質(hmws)和片段。通過將每個組在每個時間點的峰面積除以總峰面積來計算峰面積百分比。
[0098]
使用agilent 1200系列hplc系統在dionex propac wcx-10柱(4x250)(tosoh bioscience,south san francisco,ca)上進行離子交換色譜(iec)。使用流動相a(20mm mes,ph 5.7)和b(流動相a中的200mm氯化鈉)進行分離。採用在85分鐘時從92%溶劑a開始到34%溶劑a的線性梯度,隨後為在95分鐘時從34%溶劑a到0%溶劑a的梯度,以在總共約100分鐘的運行時間內分離fab2電荷變體.將75μl樣品注入至柱上並在25℃以等度模式以0.8ml/min的流速洗脫,並且使用280nm處的uv吸收進行檢測。iec峰分為主峰、酸性峰和鹼性峰。通過將每個峰面積除以總峰面積來計算峰面積百分比。
[0099]
通過使用與所描述相似的方案(tesar等人,2017,mabs),在biacore t200儀器(ge healthcare,pittsburgh,pa)上使用表面等離子共振(spr)測量fab2的抗原結合能力。簡而言之,使用胺偶聯試劑盒(ge healthcare,pittsburgh,pa)將抗原以2000-3000響應單位(ru)範圍直接固定至羧基甲基化葡聚糖傳感器晶片(cm5)上。通過監測注射前後ru的變化180s來確定抗體fab片段與抗原的結合。用10mm甘氨酸-hcl緩衝液在ph 2.1和30μl/min流速下使傳感器晶片再生30s。所有結合測定均在環境溫度下在hepes緩衝液(0.01m hepes、0.15m nacl、0.005%(v/v)表面活性劑p20,ph 7.4)中進行。使用四參數擬合根據標準校準曲線(0.158
–
5μg/ml)計算抗原結合濃度。將每個時間點的抗原結合能力歸一化為t0時的抗原結合能力。
[0100]
iv.c.分子動力學模擬詳情
[0101]
模型建構器軟體(例如,modeller的修改版本)用於從序列構建fab結構。使fab結構的能量最小化以去除空間位阻。接著分析鬆弛的結構以確定可電離殘基在ph=7.4下的質子化狀態。接著使fab結構在tip3p水的八面體溶劑盒中進行溶劑化,該溶劑盒與具有周期性邊界條件的盒的邊緣有至少距離。溶質結構用ff14sb力場參數化。使系統電荷用na+和cl-抗衡離子中和。對溶質原子進行氫質量重分配,以實現4fs的模擬時間步長。
[0102]
示例性模擬協議包括以下步驟。首先,使用力常數為的諧波抑制勢將溶質限制到初始結構,以2000步的共軛梯度能量最小化使結構鬆弛。接著將壓力保持在1個大氣壓,並且恆溫器溫度在200ps的過程中增加到300k,同時對蛋白質結構施加強度為的諧波位置限制。接著將系統平衡500ps,限制力常數為在生產階段取消所有限制。仿真時間步長為4fs。截止半徑用於範圍有限的相互作用,粒子網格靜電用於長程相互作用。生產模擬是使用npt條件進行的。langevin動力學用於將溫度保持在300k,碰撞頻率為γ=1ps-1
。分子動力學模擬的生產階段進行了500ns。在動力學期間,使用shake算法來限制所有涉及氫原子的鍵。對於下面呈現的分析,分子動力學軌跡的快照每10ps保存一次。
[0103]
默認值用於所有其他模擬參數。具有spfp精度模型的amber 2015分子動力學模擬軟體包的gpu實現用於示例性分子動力學模擬。重複上述分子動力學模擬協議以每分子運行3個獨立的500ns分子動力學模擬。接著組合來自三個模擬的軌跡(總計達1.5μs)以用於分析。ambertools中的cpptraj軟體用於分析軌跡。二面角的空間中的自由能分布和全景圖是使用根據bin群體計算的,其中kb是波耳茲曼常數,t是溫度,ni是bin的群體,並且n
max
是具有最多bin的群體。給無群體的bin提供相當於0.5群體的人工勢壘。
[0104]
viii.d.結果
[0105]
將純化的fab1在pbs中於37℃下應激4周。接著對對照和應激樣品進行胰蛋白酶消化,隨後進行反相色譜分離和質譜分析,以識別潛在的降解產物。在fab1的cdr-l3中鑑定了易於水解的不穩定asn-pro位點(參見例如,圖6a-6c)。顯示了含有asn-pro位點的天然胰蛋白酶肽(圖6a)、n末端水解產物肽(圖6b)和c末端水解產物肽(圖6c)的提取離子色譜圖(xic)。觀察到兩種n末端水解產物(圖6b)對應於肽c末端的asn和iso-asn,而非c末端的asp和iso-asp。在n末端水解產物肽的c末端觀察到asn可見於圖7a和圖7b,這些圖分別顯示了對應於在98.0分鐘和98.8分鐘時洗脫的兩個n末端水解產物的質譜。對應於肽c末端的asn或asp的n末端水解產物的理論質譜分別顯示於圖7c和圖7d中。n末端水解產物的串聯質譜確認了肽c末端處的asn。
[0106]
fab2的長期穩定性在37℃下於pbs(ph 7.4)中進行了評估。圖8a總結了36周期間fab穩定性的變化。使用sec測量聚集表明fab在整個應激期期間保持單體。然而,分別使用iec和ce-sds對側鏈化學降解和主鏈斷裂的測量表明,fab經歷了緩慢且穩定的降解。如通過iec和ce-sds測得的36周後主峰分數下降分別為32.7%和36%。因此,在同一時間段期間,使用spr測量的抗原結合能力下降了27%。離子交換色譜圖顯示,iec主峰的減少是由於酸性電荷變體的增加所致,可能是由於脫醯胺反應所致。在變性條件下進行的凝膠電泳清楚地顯示,ce-sds主峰的減少是由於主鏈斷裂所致(圖8b)。應激樣品的質譜分析確認,斷裂是由於asn-pro水解所致。然而,sec數據顯示,在非變性條件下,儘管由於asn-pro水解導致斷裂,但fab仍保持完整。向孵育混合物中添加廣譜蛋白酶抑制劑混合物(complete
tm
,roche)不會影響fab2輕鏈斷裂的速率,這與自溶事件而非微量蛋白水解酶汙染的存在導致的水解一致。未檢測到含有asn-pro序列的非結構化17聚體肽的切割,該肽摻入fab2的中性ph製劑中並在37℃下孵育。這也與蛋白酶催化的斷裂不一致。
[0107]
對抗體集合的序列比較確定了cdr-l3中具有asn-pro基序的幾種潛在治療候選物。在所有這些抗體中,asn-pro固定在位置6-7,但cdr-l3中的其餘位置是不同的。其中的四種,即一種抗體fab片段和三種全長抗體經選擇用於分析在pbs中配製的蛋白質溶液在熱應激(37℃)後asn-pro水解的速率。所有都顯示出asn-pro肽鍵對水解的敏感性,其中切割動力學示於圖9中。mab3和mab4顯示出最高的水解速率(表1),大於針對fab1所觀察到的水解速率,而fab2的水解速率較慢,並且mab5具有最慢的速率。mab3在起始材料中含有大量的水解asn-pro,這可能是因為抗體先前已儲存在中性ph緩衝液中。儘管此數據集太小而無法描述相鄰序列對水解速率的影響,但值得注意的是,cdr-l3中的序列變異導致水解的3倍範圍。此外,fab4(其具有移植到替代、非人框架中的fab2 cdr序列)與fab2(8%/周)相比,顯
示出asn-pro水解速率低4倍(2%/周)。與這些結果相反,對在cdr-h2中具有asn-pro的一組抗體的分析表明,此位置不易受水解影響。例如,在pbs中配製的蛋白質熱應激(40℃)後,在fab3的cdr-h2(表1)中未檢測到asn-pro的水解。
[0108]
表1.訓練集抗體的cdr-l3序列和在ph 7.4下的asn-pro水解率
[0109][0110]
為了檢查抗體結構對asn-pro水解速率的影響,對代表fab1和mab3的cdr-l3序列的非結構化線性肽進行了熱應激。由於先前已表明在37℃下孵育的非結構化肽的水解速率較慢,因此進行了加速溫度條件(90℃和70℃),並外推溫度依賴性以計算37℃下的速率。觀察到非常緩慢的肽水解速率(表2),在37℃下計算的半衰期大於2000天。如所預期,對於在ph 5緩衝液中進行的孵育,水解速率慢了約3倍。
[0111]
表2.在ph 7.4、90℃下選定抗體cdr-l3片段的肽模擬物中asn-pro水解的速率
[0112]
[0113][0114]
nd=未檢測到
[0115]
為了進一步研究蛋白質結構對asn-pro水解速率的影響,對fab結構進行了分子動力學模擬。如本文所討論,asn-pro水解中的降解途徑經由asn側鏈氮對主幹羰基的親核攻擊進行。此過程的先決條件是asn側鏈採用使asn側鏈氮和側鏈羰基之間的親核攻擊距離dn最小化的構象(圖2a和2b)。該距離dn在二面角的以下兩個特定組合中最小化:第一為,當主幹二面角以ψ》120延伸並且側鏈二面角為χ1~-60
°
和χ2~-90
°
(即圖2a和2b中的構象a)時;第二為,當主幹二面角以ψ《-60成緊湊角並且χ1~60
°
和χ2~90
°
(即圖2a和2b中的構象b)。計算側鏈沿二面角的自由能以從機理上了解側鏈構象對水解速率的作用。
[0116]
圖3a-3f示出了從1.5微秒md模擬獲得的主幹二面角(ψ)和側鏈二面角(χ1和χ2)的自由能分布(根據bin群體計算,參見分子動力學模擬詳情部分)。較低的自由能對應於在給定的二面角組合中找到側鏈的較高概率。沿ψ的自由能分布示出了fab2主要採用緊湊的主幹二面角(ψ《-60),而其他結構採用擴展構象ψ》120)。因此,反應性構象對應於fab2中的構象b和其他分子中的構象a,如圖3a-3f中的圓圈所指示。fab1、mab3和mab4的構象a的自由能非常低(分別為0.94、0.96和1.06kcal/mol),這與針對這些結構的高實驗水解率(分別為13%、15%和15%/周)相符。相比之下,mab5的構象a的自由能相對較高(1.56kcal/mol),而fab6的自由能最高(2.66kcal/mol),這與針對這些分子的低實驗速率(分別為5%和0%/周)完全一致。然而,fab2的反應性構象的自由能與實驗速率的一致性較差,雖然反應性構象的自由能很小(0.75kcal/mol),但實驗速率並沒有那麼高(9%/周)。懷疑即使側鏈採用反應性構象,化學反應在這種情況下在能量上也並非有利。
[0117]
viii.e.討論
[0118]
在生理條件下,asn殘基易受脫醯胺,其中醯胺側鏈水解形成游離羧酸。這一反應的限速步驟是形成五元琥珀醯亞胺環中間體。然而,已經表明,含有asn隨後為本體殘基諸如脯氨酸的肽易受兩個殘基之間的肽主幹的水解切割影響。本文提供了asn-pro基序易受肽主幹水解切割影響的證據。在cdr-l3中鑑別的asn-pro位點的質譜數據導致鑑別出與此位點相關的三種肽:含有asn-pro位點的天然胰蛋白酶肽、含有asn和iso-asn的n末端水解產物肽,以及c末端水解產物肽。含有asn和iso-asn而非asp和iso-asp的n末端水解產物的鑑別表明,琥珀醯亞胺中間體的形成是b-側鏈醯胺氮對肽鍵羰基的攻擊的結果。接著此cooh末端琥珀醯亞胺中間體可以打開以形成觀察到的含有asn或iso-asn的n末端水解產物。
[0119]
對於鼠類抗體,或基於鼠類抗體人源化的抗體,輕鏈位置94-95(kabat編號)處的asn-pro可能由igkv4小鼠種系基因的選擇產生,因為此家族的一些成員具有在未重組基因中編碼的asn-pro。相反,在人輕鏈基因中沒有種系編碼的94asn-pro95,以至於對於人抗體來說,此基序將來自重組的v-j連接過程或經由體細胞超突變所致。同樣,在ighv1家族的人和小鼠種系基因中都發現了重鏈位置52-52a(cdr-2)處的asn-pro。因此,在抗體集合中,cdr-h2中的52asn-pro52a比cdr-l3中的94asn-pro95更常見。與其中asn-pro更可能在抗原結合中起直接作用的溶劑可及性更高的cdr-l3位置相比,cdr-h2中的基序往往更不易溶劑
可及,並且更多地參與維持cdr構象。這使得cdr-l3中的asn-pro更容易受到水解的影響,其切割更有可能對靶標結合產生影響。
[0120]
最近,jain等人(pnas,2017)發表了關於以下的報告:臨床階段抗體的生物物理特性,旨在為「可開發性」設定指標。在他們收集的137種抗體中,有8種抗體在cdr-l3中具有94asn-pro95。這些抗體是莫羅單抗、mab5、奧樂妥珠單抗、利妥昔單抗、替利珠單抗、託維妥單抗、維妥珠單抗和維西珠單抗。除了10個殘基的cdr具有p95a插入的託維妥單抗之外,所有抗體都具有9個殘基的cdr-l3序列。替利珠單抗似乎是莫羅單抗的人源化版本,而維妥珠單抗具有與利妥昔單抗的人源化版本一致的特徵。值得注意的是,替利珠單抗和維西珠單抗在cdr-h2中也有asn-pro。後續的出版物(lu等人,2018)測試了jain等人描述的抗體中的131種的脫醯胺和異構化傾向,並針對在cdr-l3中具有94asn-pro95的8種抗體,納入了ph 8.5應激測試。未報告這些抗體在此位點處切割的證據。使用本文所描述的計算機模擬技術,可以預測(表3)抗體託維妥單抗和維西珠單抗的輕鏈具有易受切割影響的鍵,而其他抗體應不易受切割影響。
[0121]
除了莫羅單抗、替利珠單抗、託維妥單抗和維西珠單抗之外,所有抗體均生成了中性ph、37c穩定性數據,表1和圖9中顯示的mab5的數據也如此。將pbs(ph 7.4)中配製的抗體在37℃下孵育至多4周,並通過質譜和毛細管電泳十二烷基硫酸鈉(ce-sds)獲得完整和還原樣品的斷裂證據。儘管未確定速率,但檢測到維妥珠單抗在cdr-l3中的asn-pro處的水解,而並沒有檢測到利妥昔單抗或奧樂妥珠單抗有此現象(表3)。預期利妥昔單抗和奧樂妥珠單抗中的鍵具有穩定性,但並不能預期維妥珠單抗中的鍵不穩定。這些結果支持以下結論:由於維妥珠單抗和利妥昔單抗在cdr-l3中具有相同的胺基酸序列,因此抗體框架可以影響水解速率。
[0122]
表3.cdr-l3中具有asn-pro的商業抗體
[0123][0124]
nt=未測試
[0125]
因此,已經證明在ph 7.4下延長熱應激後asn-pro肽鍵的水解導致fab2失去抗原結合。由於許多治療性抗體和抗體片段是在微酸性條件下配製的,在此條件下asn-pro切割的動力學較慢,因此在確定抗體製劑保質期的研究中,這種反應可能不受重視。雖然較低ph的液體或凍幹製劑可用於穩定易受影響抗體中的asn-pro切割,但這不會消除在中性ph生
理條件下的潛在降解。在一些情況下,可能需要通過對不穩定asn殘基作出胺基酸取代來重新設計抗體。實際上,經由asn-94取代從fab1和fab2產生能夠影響降解率的臨床候選物。因此,如果asn殘基與抗原結合密切相關,使得該殘基是不可變的,那麼改變序列環境可以穩定分子,同時保留靶標結合親和力。fab4分子證明了這一點,該分子的cdr被移植到非人框架中,其不穩定鍵的水解速率比親本抗體fab2中鍵的水解速率慢4倍。可替代地,可以選擇缺乏此序列基序的候選物進行開發,或者對於具有asn-pro的分子,針對此切割反應進行計算機模擬風險評估。
[0126]
ix.附加考慮
[0127]
本公開的一些實施例包括一種系統,該系統包括一個或多個數據處理器。在一些實施例中,該系統包括包含指令的非暫時性計算機可讀存儲介質,所述指令在所述一個或多個數據處理器上被執行時使所述一個或多個數據處理器執行本文公開的一種或多種方法的部分或全部和/或本文公開的一種或多種過程的部分或全部。本公開的一些實施例包括一種有形地體現在非暫時性機器可讀存儲介質中的電腦程式產品,其包括指令,所述指令被配置為使一個或多個數據處理器執行本文公開的一種或多種方法的部分或全部和/或本文公開的一種或多種過程的部分或全部。
[0128]
已使用的術語和表述被用作描述性而非限制性的術語,並且在使用此類術語和表述時無意排除示出和描述的特徵或其部分的任何等效物,但應認識到在要求保護的本發明的範圍內可以進行各種修改。因此,應當理解,雖然通過實施例和任選特徵具體公開了要求保護的本發明,但是本領域技術人員可以對本文公開的概念進行修改和變化,並且此類修改和變化被認為是在所附權利要求書所限定的本發明範圍內。
[0129]
隨後的描述僅提供優選的示例性實施例,並不旨在限制本公開的範圍、適用性或配置。相反,優選示例性實施例的隨後描述將為本領域技術人員提供用於實現各種實施例的可行描述。應當理解,在不脫離所附權利要求中闡述的精神和範圍的情況下,可以對元件的功能和布置進行各種改變。
[0130]
在以下描述中給出具體細節以提供對實施例的透徹理解。然而,應當理解,可以在沒有這些具體細節的情況下實踐實施例。例如,電路、系統、網絡、過程和其他組件可以以框圖形式顯示為部件,以免在不必要的細節中混淆實施例。在其他情況下,可以在沒有不必要的細節的情況下示出眾所周知的電路、過程、算法、結構和技術以避免混淆實施例。