新的hcdr3區域集合及其應用的製作方法
2023-06-11 04:44:31 1
專利名稱::新的hcdr3區域集合及其應用的製作方法新的HCDR3區域集合及其應用本申請要求2005年12月20日提交的序列號為60/751,633的臨時申請的優先權,其內容在此全部通過引用併入。
背景技術:
:免疫球蛋白重鏈的第三互補決定區(H-CDR3)構成了典型的抗原結合位點中心,通常在決定抗體的特異性和親和力中起到主要作用。在所有已知的具有適應性免疫系統的物種中,H-CDR3比其他五個CDR區域(H-CDR1、H-CDR2、L-CDR1、L-CDR2或者L-CDR3)中的任意一個都更為多樣化,它們共同構成抗原結合位點的外邊界(7b"egavra,C/w^a爭,7卵9)。已知H-CDR3的平均長度和長度範圍對物種現有的抗原結合結構的範圍和抗體譜(r印ertoire)的功能具有重要影響(Jo/ms朋&『m,7CWfo爭,從小鼠到人類到牛,H-CDR3的平均長度和長度範圍都是增加的(『m爭,7993)。同一物種中H-CDR3的多樣性也是可以調節的。例如,在人類和小鼠中,H-CDR3的長度範圍和多樣性會隨著個體發育增加(柳2,'Ze函爭,,2)。因其在抗原結合中的重要作用,H-CDR3區域可以作為載體引入高多樣性的合成抗體庫,其可用於治療性抗體工程(A:"a/p汝爭,26W)。以簡併引物隨機化該區域產生了大量序列多樣性,但是其中至少大部分結構是非正常、沒有功能的(Zem/z"爭,2003)。因此,巨大的合成抗體庫需要具有與已知耙點良好的親和力。Zemlin提到,按照Zemlin對鼠和人類唯一的、功能性的、發表的H-CDR3區域的分析,與鼠的H-CDR3區域相比人類H-CDR3區域的長度200680053024.7說明書第2/41頁範圍更大。Zemlin還指出,特定胺基酸的頻率隨H-CDR3區域長度的增加而改變。例如,Zemlin報導隨8-14個胺基酸殘基序列長度的增加,絲氨酸的頻率增加,但是在大於14個胺基酸殘基的序列中,卻表現出混雜的模式。近來,Hoet等在NatureBiotech23:(3)March2005中闡述了包含可變重鏈序列(VH)抗體庫的構建,這些序列是部分合成的,而且包含人類供體中得到的HCDR3區域。特別的是,不包含HCDR3區域的VH鏈部分(FR1-H-CDR1-FR2-H-CDR2-FR3)是合成的,並且#1併入VH基因中;包含HCDR3區域的VH鏈部分(H-CDR3-FR4)是從自然發生的人類自身免疫病人獲得的。Hoet以功能庫多樣性的相似的程度為基礎,選擇包括了來自人類供體的HCDR3序列,因此其品質不能通過結合合成的HCDR3區域入VH鏈而達到。這點是不足為奇的,^_定其他人釆用了產生所謂的集中HCDR3庫的方法(見示例,公布的美國專利申請US2006/0257937A1),其中通過致力於降低非功能性結合子(binder)的濃度來控制其多樣性(通過有限的分析已知的V、D和J片段),但是根據常識教導要在文庫中具有高的濃度才能包含儘量多的多樣性,這就使得文庫的篩選變得異常繁瑣(見專利申請,937A1)。事實上,Hoet提到,在自然產生的人抗體中,HCDR3在4個到大於35個殘基間變化,而且具有非隨機的序列多樣性;而合成像天然H-CDR3譜一樣,具有的編碼序列和長度都多樣的DNA是不可能的。最後,Hoet介紹了選擇種系基因D片段來幫助HCDR3庫成員正確摺疊和結合,和將D片段納入抗體庫是希望的,由此Hoet描述了專利申請,937Al中指導的HCDR3庫的使用。因為專利申請,937A1中指導的集中庫是由有限的數據集構建的(即已知的V、D和J片段),所以集中庫的一個實際的結果是它沒有在每個胺基酸殘基處達到最適宜的多樣性或變化。相對於Hoet和專利申請'937Al的教導,本發明特別提供了一種合成的人類或者人源化抗體H-CDR3區域的集合,這些區域具有本質上像天然H-CDR3譜的多樣性,而且通過在編碼H-CDR3的DNA序列中偏倚(biasing)完全隨機的胺基酸分布,模擬了天然胺基酸的分布。從這個角10度講,本發明提供了一種抗體庫,它是通過到目前為止糹皮認為不可能構建的方法構建的。
發明內容本發明提供了一種胺基酸範圍可變的、多樣化人類或者人源化抗體H-CDR3區域的集合,其中所述集合的多樣性由如下產生根據第一個多樣化因素將長度在第一胺基酸範圍內的H-CDR3區域多樣化,根據第二個多樣化因素將長度在第二胺基酸範圍內的H-CDR3區域多樣化,其中所述多樣化因素是不同的。本發明的目的是提供一種多樣化人類或者人源化抗體H-CDR3區域的集合,其中所述H-CDR3區域中至少有一部分的長度範圍為約4到約22個胺基酸。本發明的另一個目的是提供一種多樣化人類或者人源化抗體H-CDR3區域的集合,其中第一胺基酸範圍具有約4到約13個胺基酸,第二胺基酸範圍具有約14到約22個胺基酸。一方面,本發明提供了一種多樣化人類或者人源化抗體H-CDR3區域的集合,其中所述集合的多樣性由如下產生根據第一個多樣化因素將長度在第一胺基酸範圍內的H-CDR3區域多樣化,根據第二個多樣化因素將長度在第二胺基酸範圍內的H-CDR3區域多樣化,根據第三個多樣化因素將長度在第三胺基酸範圍內的H-CDR3區域多樣化,其中所述多樣化因素是不同的。本發明的這個集合可以包含多樣化人類或者人源化抗體H-CDR3區域,其中第一胺基酸範圍具有約4到約9個胺基酸,第二胺基酸範圍具有約10到約16個胺基酸,第三胺基酸範圍具有約17到約22個胺基酸。另一方面,本發明提供了一種多樣化人類或者人源化抗體H-CDR3區域的集合,其中所述集合的多樣性由如下產生根據第一個多樣化因素將長度在第一胺基酸範圍內的H-CDR3區域多樣化,根據第二個多樣化因素將長度在第二胺基酸範圍內的H-CDR3區域多樣化,根據第三個多樣化因素將長度在第三胺基酸範圍內的H-CDR3區域多樣化,根據第四個多樣化因素將長度在第四胺基酸範圍內的H-CDR3區域多樣化,根據第五個多樣化因素將長度在第五胺基酸範圍內的H-CDR3區域多樣化,根據第六個多樣化因素將長度在第六tt酸範圍內的H-CDR3區域多樣化,其中所述多樣化因素是不同的。本發明的這個集合可以包含多樣化人類或者人源化抗體H-CDR3區域,其中第一胺基酸範圍具有約4到約6個胺基酸,第二胺基酸範圍具有約7到約9個胺基酸,第三胺基酸範圍具有約10到約12個胺基酸,第四胺基酸範圍具有約13到約15個胺基酸,第五胺基酸範圍具有約16到約18個胺基酸,第六胺基酸範圍具有約19到約22個胺基酸。再一方面,本發明提供了一種多樣化人類或者人源化抗體H-CDR3區域的集合,其中所述集合的多樣性由如下產生根據第一個多樣化因素將長度在第一胺基酸範圍內的H-CDR3區域多樣化,根據第二個多樣化因素將長度在第二胺基酸範圍內的H-CDR3區域多樣化,根據第三個多樣化因素將長度在第三胺基酸範圍內的H-CDR3區域多樣化,根據第四個多樣化因素將長度在第四胺基酸範圍內的H-CDR3區域多樣化,根據第五個多樣化因素將長度在第五胺基酸範圍內的H-CDR3區域多樣化,根據第六個多樣化因素將長度在第六胺基酸範圍內的H-CDR3區域多樣化,根據第七個多樣化因素將長度在第七M酸範圍內的H-CDR3區域多樣化,根據第八個多樣化因素將長度在第八胺基酸範圍內的H-CDR3區域多樣化,其中所述多樣化因素是不同的。本發明的這個集合可以包含多樣化人類或者人源化抗體H-CDR3區域,其中第一胺基酸範圍具有約4到約5個胺基酸,第二胺基酸範圍具有約6到約7個胺基酸,第三胺基酸範圍具有約8到約9個胺基酸,第四胺基酸範圍具有約IO到約1]個胺基酸,第五胺基酸範圍具有約12到約13個胺基酸,第六胺基酸範圍具有約14到約15個胺基酸,第七氛基酸範圍具有約16到約17個胺基酸,第八胺基酸範圍具有約18到約19個胺基酸,第九胺基酸範圍具有約20到約22個胺基酸。本發明的再一個目的是提供一種多樣化人類或者人源化抗體H-CDR3區域的集合,其中第一胺基酸範圍具有約4到約8個胺基酸,且其中第一個多樣化因素要求1位上丙氨酸的頻率為約80%,2位上精氨酸的頻率為約60%,3位上甘氨酸的頻率為約40%,7位上天冬氨酸的頻率為約50%,8位上酪氨酸的頻率為約40%。另一方面,本發明提供了一種多樣化人類或者人源化抗體H-CDR3區域的集合,其中第一胺基酸範圍具有約9到約15個胺基酸,且其中第一個多樣化因素要求1位上丙氨酸的頻率為約90%,2位上精氨酸的頻率為約70%,10位上酪氨酸的頻率為約20%,11位上酪氨酸的頻率為約20%,12位上酪氨酸的頻率為約30%,13位上苯丙氨酸的頻率為約60%,14位上天冬氨酸的頻率為約80%,15位上酪氨酸的頻率為約40%。本發明提供了一種多樣化人類或者人源化抗體H-CDR3區域的集合,其中第一胺基酸範圍具有約16到約22個胺基酸,且其中第一個多樣化因素要求1位上丙氨酸的頻率為約90%,2位上精氨酸的頻率為約60%,3位上天冬氨酸的頻率為約30%,4位上甘氨酸的頻率為約20%,5位上精氨酸的頻率為約10%,6位上精氨酸的頻率為約10%,7位上酪氨酸的頻率為約20%,15位上酪氨酸的頻率為約40%,16位上酪氨酸的頻率為約50%,17位上酪氨酸的頻率為約50%,18位上酪氨酸的頻率為約60%,19位上酪氨酸的頻率為約40%,20位上甲硫氨酸的頻率為約50%,21位上天冬氨酸的頻率為約95%,22位上纈氨酸的頻率為約60%。另一方面,本發明提供了一種多樣化人類或者人源化抗體H-CDR3區域的集合,其中如果抗體H-CDR3區域的胺基酸長度為約9到約15個胺基酸,那麼多樣化由H-CDR3區域中高含量的甘氨酸和絲氨酸產生。在本發明的上下文中,與胺基酸或者其基團相關的術語"高含量"是指該胺基酸或者其基團的頻率大於10%。再一方面,本發明提供了一種多樣化人類或者人源化抗體H-CDR3區域的集合,其中如果抗體H-CDR3區域的胺基酸長度為約16到約22個胺基酸,那麼多樣化由H-CDR3區域中高含量的絲氨酸、H-CDR3區域末端部分高含量的鹼性胺基酸、HCDR3區域前端部分的天冬氨酸和整個H-CDR3區域中高含量的芳香胺基酸產生。本發明的再一個目的是提供一種多樣化人類或者人源化抗體H-CDR3區域的集合,其中如果抗體H-CDR3區域的胺基酸長度是5個胺基酸,那麼胺基酸組成為1位上60%的丙氨酸,20%的蘇氨酸和0.58%的除半胱氨酸外所有天然存在胺基酸的混合物,2位上30%的精氨酸,30%的賴氨酸,30%的蘇氨酸和0.55%的除半胱氨酸外所有天然存在胺基酸的混合物,3位上40%的天冬氨酸,40%的苯丙氨酸和0.58%的除半胱氨酸外所有天然存在胺基酸的混合物,4位上30%的天冬氨酸,30%的甘氨酸,30%的甲硫氨酸和0.63%的除半胱氨酸外所有天然存在胺基酸的混合物以及5位上30%的酪氨酸,30%的天冬氨酸和0.58%的除半胱氨酸外所有天然存在胺基酸的混合物。本發明的另一個目的是提供一種多樣化人類或者人源化抗體H-CDR3區域的集合,其中如果抗體H-CDR3區域的胺基酸長度是12個胺基酸,那麼胺基酸組成為1位上85%的丙氨酸和15%的蘇氨酸和纈氨酸的混合物,2位上70%的精氨酸和30%絲氨酸、蘇氨酸、甘氨酸和丙氨酸的混合物,9位上20%的丙氨酸、絲氨酸和酪氨酸的混合物以及0.63%的除半胱氨酸外所有天然存在的胺基酸,10位上60%的苯丙氨酸,10%的曱硫氨酸和0.58%的除半胱氨酸外所有天然存在的胺基酸,11位上80%的天冬氨酸,5%的甘氨酸和0.58%的除半胱氨酸外所有天然存在的胺基酸,以及12位上50%的酪氨酸,10%的纈氨酸和異亮氨酸的混合物和0.63%的除半胱氨酸外所有天然存在的胺基酸。本發明的另一個目的是提供一種多樣化人類或者人源化抗體H-CDR3區域的集合,其中如果抗體H-CDR3區域的胺基酸長度是20個胺基酸,那麼胺基酸組成為1位上100%的丙氨酸,2位上50%的精氨酸和50%的賴氨酸,3位上30%的甘氨酸和0.55%的除半胱氨酸外所有天然存在的胺基酸,4位上20%的精氨酸,20%的甘氨酸,20%的亮氨酸和0.63%的除半胱氨酸外所有天然存在的胺基酸,14位上20%的絲氨酸,20%的蘇氨酸,20%的半胱氨酸和0.63%的除半胱氨酸外所有天然存在的胺基酸,21位上95%的天冬氨酸以及22位上50%的纈氨酸和0.55%的除半胱氨酸外所有天然存在的胺基酸。本發明還涉及一種多樣化人類或者人源化抗體可變重鏈的集合,其包含具有不同胺基酸範圍的、多樣化人類或者人源化抗體H-CDR3區域的集合,其中所述集合的多樣性由如下產生根據第一個多樣化因素將長度在第一^^基酸範圍內的H-CDR3區域多樣化,根據第二個多樣化因素將長度在第二胺基酸範圍內的H-CDR3區域多樣化。另一方面,本發明還提供了一種多樣化人類或者人源化抗體或者其功能性片段的集合,該片段的集合包含人類或者人源化抗體可變重鏈的集合,根據本發明,該重鏈的集合包含不同胺基酸範圍的、多樣化人類或者人源化抗體H-CDR3區域的集合。再一方面,本發明還提供了一種合成的人類或者人源化抗體庫,其包含多樣化人類或者人源化抗體或者其功能性片段的集合,根據本發明,該抗體或其功能性片段的集合包含人類或者人源化抗體可變重鏈的集合。在另一個實施方案中,本發明涉及一種編碼多樣化人類或者人源化H-CDR3區域的核酸分子集合的製備方法,其包含合成多個DNA分子,其中每個DNA分子編碼一個H-CDR3區域,其中所述H-CDR3區域具有不同的範圍,其中根據第一個多樣化因素,合成編碼第一胺基酸範圍內H-CDR3區域的DNA分子;並且其中根據第二個多樣化因素,合成編碼第二M酸範圍內H-CDR3區域的DNA分子,其中所述多樣化因素是不同的。本發明還涉及一種編碼根據本發明的多樣化人類或者人源化抗體H-CDR3區域集合的核酸集合。本發明還涉及一種編碼胺基酸範圍可變的、多樣化人類或者人源化抗體H-CDR3區域集合的核酸集合,其中所述集合的多樣性由如下產生根據第一個多樣化因素將長度在第一胺基酸範圍內的H-CDR3區域多樣化,根據第二個多樣化因素將長度在第二胺基酸範圍內的H-CDR3區域多樣化,其中所述多樣化因素是不同的。本發明的又一個目的是提供一種得到不同長度的、多樣化人類或者人源化抗體H-CDR3區域的集合的方法,其包括表達核酸集合。應理解的是,本發明的上下文中,在其他多樣化H-CDR3區域中一個或者多個胺基酸位置是保持恆定的。本領域技術人員應理解為了在H-CDR3區域中引入多樣性的三核苷酸混合物的合成效率,以及克隆多種多樣化H-CDR3區域的效率,在H-CDR3區域中插入一個或多個恆定位點是希望的。這樣,本發明的另一個目的是提供一種多樣化人類或者人源化H-CDR3區域的集合,其中如果所述集合中成員的長度是4到8個胺基酸,那麼應用於所述長度是4-8個胺基酸的所述成員的多樣化因素在具有所述長度的所述成員的H-CDR3區域中定義了0,1,2或3個恆定的胺基酸位點。本發明還涉及一種多樣化人類或者人源化H-CDR3區域的集合,其中如果所述集合中成員的長度是9到IO個胺基酸,那麼應用於所述長度是9到10個胺基酸的所述成員的多樣化因素在具有所述長度的所述成員的H-CDR3區域中定義了0,1,2或3個恆定的胺基酸位點。本發明還涉及一種多樣化人類或者人源化H-CDR3區域的集合,其中如果所述集合中成員的長度是ll到13個胺基酸,那麼應用於所述長度是11到13個胺基酸的所述成員的多樣化因素在具有所述長度的所述成員的H-CDR3區域中定義了0,1,2或3個恆定的胺基酸位點。本發明的另一個目的是提供一種多樣化人類或者人源化H-CDR3區域的集合,其中如果所迷集合中成員的長度是14個胺基酸,那麼應用於所述長度是14個氨基定義了0,1,2,3,4或5個恆定的胺基酸位點。本發明還涉及一種多樣化人類或者人源化H-CDR3區域的集合,其中如果所述集合中成員的長度是15-16個胺基酸,那麼應用於所述長度是15-16個胺基酸的所述成員的多樣化因素在具有所述長度的所述成員的H-CDR3區域中定義了0,1,2,3,4,5,6,7或8個恆定的胺基酸位點。本發明的另一個目的是提供一種多樣化人類或者人源化H-CDR3區域的集合,其中如果所述集合中成員的長度是16-17個胺基酸,那麼應用於所述長度是16-17個胺基酸的所述成員的多樣化因素在具有所述長度的所述成員的H-CDR3區域中定義了0,1,2,3,4,5,6,7或8個恆定的胺基酸位點。本發明還涉及一種多樣化人類或者人源化H-CDR3區域的集合,其中如果所述集合中成員的長度是18個胺基酸,那麼應用於所述長度是18個胺基酸的所述成員的多樣化因素在具有所述長度的所述成員的H-CDR3區域中定義了0,1,2,3,4,5,6,7或8個恆定的胺基酸位點。本發明還涉及一種多樣化人類或者人源化H-CDR3區域的集合,其中如果所述集合中成員的長度是19個或更多胺基酸,那麼應用於所述長度是19個或更多胺基酸的所述成員的多樣化因素在具有所述長度的所述成員的H-CDR3區域中定義了0,1,2,3,4,5,6或7個恆定的胺基酸位點。圖1:左側對齊;圖lb所描繪"樓梯,,中的每一個臺階代表帶有一個定義HCDR3長度的平均380個序列的共有序列。在左側的對齊中,不同長度通過沿對角線加入另外的胺基酸殘基對齊,從左到右長度依次增加。圖2:右側對齊;圖2b所描繪"樓梯"中的每一個臺階代表帶有一個定義HCDR3長度的平均380個序列的共有序列。在右側的對齊中,不同長度通過沿對角線加入另外的胺基酸殘基對齊,從右到左長度依次增加。圖3a+3b+3c:中間對齊(側面區域,環區,混合-中心);右圖所描繪的圖中每一層代表帶有一個定義HCDR3長度的平均380個序列的共有序列。在側面區域對齊中,不同長度通過交替地沿對角線加入另外的胺基酸殘基對齊,從外面中點到裡面(從側面區域到環區)長度依次增加。黑灰色的方塊示例新加入的殘基。圖4:抗體可變區的編號圖例。具體實施例方式一方面,本發明特別提供了一種合成的人類或者人源化抗體H-CDR3區域的集合,這些區域具有本質像天然H-CDR3語中的多樣性,模擬了天然胺基酸的分布,這是通過根據特定的H-CDR區域長度,偏倚在編碼H-CDR3的DNA序列中隨機的胺基酸分布而實現的。對常規的資料庫(例如Ig-BLAST)得到的人類抗體序列進行分析並用作決定H-CDR3區域胺基酸分布的基礎,而不是僅使用有限的數據集,即已知的V、D和J片段。從這個角度講,本發明提供了一種抗體庫,它是通過到目前為止被認為不可能構建的方法構建的。本發明還提供了一種胺基酸長度不同的、多樣化人類或者人源化抗體H-CDR3區域的集合,其中所述集合的多樣性由如下產生根據第一個多樣化因素將長度在第一胺基酸範圍內的H-CDR3區域多樣化,以及4艮據第二個多樣化因素將長度在第二M酸範圍內的H-CDR3區域多樣化。本發明的上下文中,術語"多樣化因素"是指對於每一個H-CDR3區域中任何給定範圍的胺基酸殘基,某個胺基酸在所述H-CDR3區域中一個或多個給定位置出現的頻率。本發明的上下文中,一個胺基酸在給定位置的"頻率"是指該胺基酸在該位置出現的可能性,根據此處闡明的教導,這個頻率是0%-100%。在自然產生的人類抗體中,H-CDR3區域的長度在約4到35個胺基酸範圍內變動。因而本發明預期每一個H-CDR3區域中胺基酸殘基的長度可能為4到35個胺基酸,優選的是4,5,6,7,8,9,10,11,12,13,14,15,16,17,18,19,20,21或者22個胺基酸殘基長度,正如這裡更為詳細的描述,應用特定的多樣化因素的胺基酸的範圍會變化。本發明中人類或人源化的抗體和/或抗體H-CDR3區域能被應用到很多環境下,這裡將作更為全面的描述。一方面,本發明提供了根據二到四個多樣化因素將具有不同胺基酸長度的H-CDR3區域多樣化。因此,多樣化人類或者人源化抗體H-CDR3區域的集合由如下產生根據第一個多樣化因素將長度在第一胺基酸範圍內的H-CDR3區域多樣化,根據第二個多樣化因素將長度在第二胺基酸範圍內的H-CDR3區域多樣化。本發明的上下文中,第一個和第二個多樣化因素是不同的。第一胺基酸範圍具有約4到約13個氣基酸,第二胺基酸範圍具有約14到約22個胺基酸。多樣化人類或者人源化抗體H-CDR3區域集合的多樣性的產生可能應用如下規律第一個多樣化因素適用於約4到約9個胺基酸長度的H-CDR3區域成員,第二個多樣化因素適用於約10到約16個胺基酸長度的H-CDR3區域成員,第三個多樣化因素適用於約17到約22個胺基酸長度的H-CDR3區域成員。可選擇的,多樣化人類或者人源化抗體H-CDR3區域集合的多樣性的產生,舉例說明,應用如下規律第一個多樣化因素適用於約4到約8個胺基酸長度的H-CDR3區域成員,笫二個多樣化因素適用於約9到約13個胺基酸長度的H-CDR3區域成員,第三個多樣化因素適用於約14到約18個胺基酸長度的H-CDR3區域成員,第四個多樣化因素適用於約19到約22個tt酸長度的H-CDR3區J或成員。另一方面,本發明提供了根據五到七個多樣化因素將具有不同胺基酸長度的H-CDR3區域多樣化。多樣化人類或者人源化抗體H-CDR3區域集合的多樣性的產生可能應用如下規律第一個多樣化因素適用於約4到約7個胺基酸長度的H-CDR3區域成員,第二個多樣化因素適用於約8到約11個胺基酸長度的H-CDR3區域成員,第三個多樣化因素適用於約12到約15個胺基酸長度的H-CDR3區域成員,第四個多樣化因素適用於約16到約19個胺基酸長度的H-CDR3區域成員,第五個多樣化因素適用於約20到約22個胺基酸長度的H-CDR3區域成員。多樣化人類或者人源化抗體H-CDR3區域集合的多樣性的產生也可能應用如下規律第一個多樣化因素適用於約4到約6個胺基酸長度的H-CDR3區域成員,第二個多樣化因素適用於約7到約9個胺基酸長度的H-CDR3區域成員,第三個多樣化因素適用於約10到約12個胺基酸長度的H-CDR3區域成員,第四個多樣化因素適用於約13到約15個胺基酸長度的H-CDR3區域成員,第五個多樣化因素適用於約16到約]8個胺基酸長度的H-CDR3區域成員,第六個多樣化因素適用於約19到約22個胺基酸長度的H-CDR3區域成員。多樣化人類或者人源化抗體H-CDR3區域集合的多樣性的產生也可能應用如下規律第一個多樣化因素適用於約4到約6個胺基酸長度的H-CDR3區域成員,第二個多樣化因素適用於約7到約9個胺基酸長度的H-CDR3區域成員,第三個多樣化因素適用於約10到約12個M酸長度的H-CDR3區域成員,第四個多樣化因素適用於約13到約15個胺基酸長度的H-CDR3區域成員,第五個多樣化因素適用於約16到約18個tt酸長度的H-CDR3區域成員,第六個多樣化因素適用於約19到約20個胺基酸長度的H-CDR3區域成員,第七個多樣化因素適用於約21到約22個胺基酸長度的H-CDR3區i或成員。另一方面,本發明提供了根據八到十個多樣化因素將具有不同胺基酸長度的H-CDR3區域多樣化。多樣化人類或者人源化抗體H-CDR3區域集合的多樣性的產生可能應用如下規律第一個多樣化因素適用於約4到約6個胺基酸長度的H-CDR3區域成員,第二個多樣化因素適用於約7到約8個胺基酸長度的H-CDR3區域成員,第三個多樣化因素適用於約9到約11個胺基酸長度的H-CDR3區域成員,第四個多樣化因素適用於約12到約14個胺基酸長度的H-CDR3區域成員,第五個多樣化因素適用於約15到約16個胺基酸長度的H-CDR3區域成員,第六個多樣化因素適用於約17到約18個胺基酸長度的H-CDR3區域成員,第七個多樣化因素適用於約19到約20個胺基酸長度的H-CDR3區域成員,第八個多樣化因素適用於約21到約22個胺基酸長度的H-CDR3區域成員。可選擇的,多樣化人類或者人源化抗體H-CDR3區域集合的多樣性的產生可能應用如下規律第一個多樣化因素適用於約4到約5個胺基酸長度的H-CDR3區域成員,第二個多樣化因素適用於約6到約7個tt酸長度的H-CDR3區域成員,第三個多樣化因素適用於約8到約9個胺基酸長度的H-CDR3區域成員,第四個多樣化因素適用於約10到約11個胺基酸長度的H-CDR3區域成員,第五個多樣化因素適用於約12到約13個胺基酸長度的H-CDR3區域成員,第六個多樣化因素適用於約14到約15個tt酸長度的H-CDR3區域成員,第七個多樣化因素適用於約16到約17個胺基酸長度的H-CDR3區域成員,第八個多樣化因素適用於約18到約19個tt酸長度的H-CDR3區域成員,第九個多樣化因素適用於約20到約22個胺基酸長度的H-CDR3區域成員。多樣化人類或者人源化抗體H-CDR3區域集合的多樣性的產生也可能應用如下規律第一個多樣化因素適用於約4到約5個胺基酸長度的H-CDR3區域成員,第二個多樣化因素適用於約6到約7個胺基酸長度的H-CDR3區域成員,第三個多樣化因素適用於約8到約9個胺基酸長度的H-CDR3區域成員,第四個多樣化因素適用於約10到約11個胺基酸長度的H-CDR3區域成員,第五個多樣化因素適用於約12到約13個tt酸長度的H-CDR3區域成員,第六個多樣化因素適用於約14到約15個胺基酸長度的H-CDR3區域成員,第七個多樣化因素適用於約16到約17個胺基酸長度的H-CDR3區域成員,第八個多樣化因素適用於約18到約19個胺基酸長度的H-CDR3區域成員,第九個多樣化因素適用於約20到約21個胺基酸長度的H-CDR3區域成員,第十個多樣化因素適用於約22個胺基酸長度的H-CDR3區域成員。另一方面,本發明提供了根據十一到十四個多樣化因素將具有不同胺基酸長度的H-CDR3區域多樣化。多樣化人類或者人源化抗體H-CDR3區域集合的多樣性的產生可能應用如下規律第一個多樣化因素適用於約4到約5個胺基酸長度的H-CDR3區域成員,第二個多樣化因素適用於約6到約7個胺基酸長度的H-CDR3區域成員,第三個多樣化因素適用於約8個胺基酸長度的H-CDR3區域成員,第四個多樣化因素適用於約9到約10個胺基酸長度的H-CDR3區域成員,第五個多樣化因素適用於約11個胺基酸長度的H-CDR3區域成員,第六個多樣化因素適用於約12到約13個胺基酸長度的H-CDR3區域成員,第七個多樣化因素適用於約14到約15個M酸長度的H-CDR3區域成員,第八個多樣化因素適用於約16到約17個胺基酸長度的H-CDR3區域成員,第九個多樣化因素適用於約18到約19個胺基酸長度的H-CDR3區域成員,第十個多樣化因素適用於約20個胺基酸長度的H-CDR3區域成員,第十一個多樣化因素適用於約2]到約22個胺基酸長度的H-CDR3區域成員。多樣化人類或者人源化抗體H-CDR3區域集合的多樣性的產生也可能應用如下規律第一個多樣化因素適用於約4到約5個胺基酸長度的H-CDR3區域成員,第二個多樣化因素適用於約6個tt酸長度的H-CDR3區域成員,第三個多樣化因素適用於約7個胺基酸長度的H-CDR3區域成員,第四個多樣化因素適用於約8到約9個胺基酸長度的H-CDR3區域成員,第五個多樣化因素適用於約10個胺基酸長度的H-CDR3區域成員,第六個多樣化因素適用於約11到約12個胺基酸長度的H-CDR3區域成員,第七個多樣化因素適用於約13個M酸長度的H-CDR3區域成員,第八個多樣化因素適用於約14到約15個胺基酸長度的H-CDR3區域成員,第九個多樣化因素適用於約16到約17個胺基酸長度的H-CDR3區域成員,第十個多樣化因素適用於約18個tt酸長度的H-CDR3區域成員,第十一個多樣化因素適用於約19到約20個tt酸長度的H-CDR3區域成員,第十二個多樣化因素適用於約21到約22個胺基酸長度的H-CDR3區域成員。多樣化人類或者人源化抗體H-CDR3區域集合的多樣性的產生可能應用如下規律第一個多樣化因素適用於約4到約5個胺基酸長度的H-CDR3區域成員,第二個多樣化因素適用於約6個胺基酸長度的H-CDR3區域成員,第三個多樣化因素適用於約7個胺基酸長度的H-CDR3區域成員,第四個多樣化因素適用於約8到約9個胺基酸長度的H-CDR3區域成員,第五個多樣化因素適用於約10個胺基酸長度的H-CDR3區域成員,第六個多樣化因素適用於約11到約12個胺基酸長度的H-CDR3區域成員,第七個多樣化因素適用於約13個胺基酸長度的H-CDR3區域成員,第八個多樣化因素適用於約14到約15個胺基酸長度的H-CDR3區域成員,第九個多樣化因素適用於約16到約17個胺基酸長度的H-CDR3區域成員,第十個多樣化因素適用於約18個胺基酸長度的H-CDR3區域成員,第十一個多樣化因素適用於約19到約20個酸長度的H-CDR3區域成員,第十二個多樣化因素適用於約21個胺基酸長度的H-CDR3區域成員,第十三個多樣化因素適用於約22個胺基酸長度的H-CDR3區域成員。可選的,多樣化人類或者人源化抗體H-CDR3區域集合的多樣性的產生可能應用如下規律第一個多樣化因素適用於約4到約5個胺基酸長度的H-CDR3區域成員,第二個多樣化因素適用於6個胺基酸長度的H-CDR3區域成員,第三個多樣化因素適用於約7個胺基酸長度的H-CDR3區域成員,第四個多樣化因素適用於約8個胺基酸長度的H-CDR3區域成員,第五個多樣化因素適用於約9個胺基酸長度的H-CDR3區域成員,第六個多樣化因素適用於約10到約11個胺基酸長度的H-CDR3區域成員,第七個多樣化因素適用於約12個胺基酸長度的H-CDR3區域成員,第八個多樣化因素適用於約13到約14個胺基酸長度的H-CDR3區域成員,第九個多樣化因素適用於約15到約16個胺基酸長度的H-CDR3區域成員,第十個多樣化因素適用於約17個胺基酸長度的H-CDR3區域成員,第十一個多樣化因素適用於約18到約19個胺基酸長度的H-CDR3區域成員,第十二個多樣化因素適用於約20個tt酸長度的H-CDR3區域成員,第十三個多樣化因素適用於約21個胺基酸長度的H-CDR3區域成員,第十四個多樣化因素適用於約22個胺基酸長度的H-CDR3區域成員。另一方面,本發明提供了根據十五到十七個多樣化因素將具有不同胺基酸長度的H-CDR3區域多樣化。多樣化人類或者人源化抗體H-CDR3區域集合的多樣性的產生可能應用如下規律第一個多樣化因素適用於約4到約5個胺基酸長度的H-CDR3區域成員,第二個多樣化因素適用於約6個胺基酸長度的H-CDR3區域成員,第三個多樣化因素適用於約7個胺基酸長度的H-CDR3區域成員,第四個多樣化因素適用於約8個胺基酸長度的H-CDR3區域成員,第五個多樣化因素適用於約9個胺基酸長度的H-CDR3區域成員,第六個多樣化因素適用於約10到約11個胺基酸長度的H-CDR3區域成員,第七個多樣化因素適用於約12個胺基酸長度的H-CDR3區域成員,第八個多樣化因素適用於約13個胺基酸長度的H-CDR3區域成員,第九個多樣化因素適用於約14到約15個胺基酸長度的H-CDR3區域成員,第十個多樣化因素適用於約16個胺基酸長度的H-CDR3區域成員,第十一個多樣化因素適用於約17到約18個胺基酸長度的H-CDR3區域成員,第十二個多樣化因素適用於約19個胺基酸長度的H-CDR3區域成員,第十三個多樣化因素適用於約20個胺基酸長度的H-CDR3區域成員,第十四個多樣化因素適用於約21個胺基酸長度的H-CDR3區域成員,第十五個多樣化因素適用於約22個胺基酸長度的H-CDR3區域成員。多樣化人類或者人源化抗體H-CDR3區域集合的多樣性的產生可能應用如下少見律第一個多樣化因素適用於約4到約5個胺基酸長度的H-CDR3區域成員,第二個多樣化因素適用於約6個胺基酸長度的H-CDR3區域成員,第三個多樣化因素適用於約7個胺基酸長度的H-CDR3區域成員,第四個多樣化因素適用於約8個胺基酸長度的H-CDR3區域成員,第五個多樣化因素適用於約9個胺基酸長度的H-CDR3區域成員,第六個多樣化因素適用於約10到約11個胺基酸長度的H-CDR3區域成員,第七個多樣化因素適用於約12個胺基酸長度的H-CDR3區域成員,第八個多樣化因素適用於約13個胺基酸長度的H-CDR3區域成員,第九個多樣化因素適用於約14個胺基酸長度的H-CDR3區域成員,第十個多樣化因素適用於約15個M酸長度的H-CDR3區域成員,第十一個多樣化因素適用於約16個胺基酸長度的H-CDR3區域成員,第十二個多樣化因素適用於約17個胺基酸長度的H-CDR3區域成員,第十三個多樣化因素適用於約18到約19個胺基酸長度的H-CDR3區域成員,第十四個多樣化因素適用於約20個胺基酸長度的H-CDR3區域成員,第十五個多樣化因素適用於約21個胺基酸長度的H-CDR3區域成員,第十六個多樣化因素適用於約22個胺基酸長度的H-CDR3區域成員。多樣化人類或者人源化抗體H-CDR3區域集合的多樣性的產生可能應用如下規律第一個多樣化因素適用於約4個胺基酸長度的H-CDR3區域成員,第二個多樣化因素適用於約5個胺基酸長度的H-CDR3區域成員,第三個多樣化因素適用於約6到約7個胺基酸長度的H-CDR3區域成員,第四個多樣化因素適用於約8個胺基酸長度的H-CDR3區域成員,第五個多樣化因素適用於約9個tt酸長度的H-CDR3區域成員,第六個多樣化因素適用於約10個胺基酸長度的H-CDR3區域成員,第七個多樣化因素適用於約11個胺基酸長度的H-CDR3區域成員,第八個多樣化因素適用於約12個胺基酸長度的H-CDR3區域成員,第九個多樣化因素適用於約13個胺基酸長度的H-CDR3區域成員,第十個多樣化因素適用於約14個胺基酸長度的H-CDR3區域成員,第十一個多樣化因素適用於約15個胺基酸長度的H-CDR3區域成員,第十二個多樣化因素適用於約16個胺基酸長度的H-CDR3區域成員,第十三個多樣化因素適用於約17到約18個胺基酸長度的H-CDR3區域成員,第十四個多樣化因素適用於約19個胺基酸長度的H-CDR3區域成員,第十五個多樣化因素適用於約20個胺基酸長度的H-CDR3區域成員,第十六個多樣化因素適用於約21個胺基酸長度的H-CDR3區域成員,第十七個多樣化因素適用於約22個胺基酸長度的H-CDR3區域成員。另一方面,本發明提供了根據十八到十九個多樣化因素將具有不同胺基酸長度的H-CDR3區域多樣化。多樣化人類或者人源化抗體H-CDR3區域集合的多樣性的產生可能應用如下規律第一個多樣化因素適用於約4個tt酸長度的H-CDR3區域成員,第二個多樣化因素適用於約5個胺基酸長度的H-CDR3區域成員,第三個多樣化因素適用於約6個胺基酸長度的H-CDR3區域成員,第四個多樣化因素適用於約7個胺基酸長度的H-CDR3區域成員,第五個多樣化因素適用於約8個胺基酸長度的H-CDR3區域成員,第六個多樣化因素適用於約9個胺基酸長度的H-CDR3區域成員,第七個多樣化因素適用於約10個胺基酸長度的H-CDR3區域成員,第八個多樣化因素適用於約11個胺基酸長度的H-CDR3區域成員,第九個多樣化因素適用於約12個胺基酸長度的H-CDR3區域成員,第十個多樣化因素適用於約13個胺基酸長度的H-CDR3區域成員,第十一個多樣化因素適用於約14個胺基酸長度的H-CDR3區域成員,第十二個多樣化因素適用於約15個胺基酸長度的H-CDR3區域成員,第十三個多樣化因素適用於約16到約17個胺基酸長度的H-CDR3區域成員,第十四個多樣化因素適用於約18個胺基酸長度的H-CDR3區域成員,第十五個多樣化因素適用於約19個胺基酸長度的H-CDR3區域成員,第十六個多樣化因素適用於約20個M酸長度的H-CDR3區域成員,第十七個多樣化因素適用於約21個胺基酸長度的H-CDR3區域成員,第十八個多樣化因素適用於約22個胺基酸長度的H到CDR3區域成員。多樣化人類或者人源化抗體H-CDR3區域集合的多樣性的產生也可能應用如下規律第一個多樣化因素適用於約4個胺基酸長度的H-CDR3區域成員,第二個多樣化因素適用於約5個胺基酸長度的H-CDR3區域成員,第三個多樣化因素適用於約6個胺基酸長度的H-CDR3區域成員,第四個多樣化因素適用於約7個胺基酸長度的H-CDR3區域成員,第五個多樣化因素適用於約8個胺基酸長度的H-CDR3區域成員,第六個多樣化因素適用於約9個胺基酸長度的H-CDR3區域成員,第七個多樣化因素適用於約10個胺基酸長度的H-CDR3區域成員,第八個多樣化因素適用於約11個胺基酸長度的H-CDR3區域成員,第九個多樣化因素適用於約12個胺基酸長度的H-CDR3區域成員,第十個多樣化因素適用於約13個胺基酸長度的H-CDR3區域成員,第十一個多樣化因素適用於約14個胺基酸長度的H-CDR3區域成員,第十二個多樣化因素適用於約15個胺基酸長度的H-CDR3區域成員,第十三個多樣化因素適用於約16個胺基酸長度的H-CDR3區域成員,第十四個多樣化因素適用於約17個胺基酸長度的H-CDR3區域成員,第十五個多樣化因素適用於約18個胺基酸長度的H-CDR3區域成員,第十六個多樣化因素適用於約19個胺基酸長度的H-CDR3區域成員,第十七個多樣化因素適用於約20個胺基酸長度的H-CDR3區域成員,第十八個多樣化因素適用於約21個胺基酸長度的H-CDR3區域成員,第十九個多樣化因素適用於約22個胺基酸長度的H-CDR3區i或成員。本領域技術人員會理解,多樣化因素的數目總計可達到具有定義長度的H-CDR3區域成員中氨基S吏位置的數目。優選的是,應用多達19個的多樣化因素,而且本發明中多樣化H-CDR3區域的集合可以聯合形成多種多樣化H-CDR3區域的集合,其形式是以單獨的H-CDR3區域形式或者作為可變重鏈區的一部分或者免疫球蛋白鏈的全長或實質上的全長的形式。實施例下面非限制的例子通過指定某一多樣化因素的參數,更為特定地說明了本發明的多種實施方案,所述多樣化因素應用於胺基酸(aa)長度在特定範圍內的H-CDR3區域。本領域技術人員會理解,根據下面提到的理論設計方案,只要沒有偏離本發明的範圍,某些多樣性(胺基酸頻率)偏離是允許的,因此,舉例而言,可能有希望基於或者至少部分基於這樣的理論設計,實施某種克隆效率來構建一個庫。為了準備H-CDR3設計,修改和編輯序列供分析的數據集來自NCBI伺服器上的Ig-BLAST。下載包括Ig-BLAST數據記錄的以下文件ftp:〃ftp.ncbi.nih.gov/blast/db/FASTA/igSeqProt.gz。總共下載了40,808條數據記錄,分別是FASTA格式的人類、小鼠或者數據條目的名稱標籤上沒有歸屬的記錄。在名稱標籤中用MS-Word格式的關鍵字"人類"過濾數據,關於人類抗體的22,500個條目被提取出來。在關於人類抗體的22,500個條目中,有13,235個歸屬於重鏈,5,490個歸屬於輕鏈。剩餘的抗體進一步歸屬於hc,1c-k和1c-X,因為它們的名稱標籤中沒有關鍵字被發現。對於重鏈,在MS-Excel不同工作表中彙編了不同長度的長度依賴的H-CDR3集合。對於H-CDR3的分析,13,235個序列中有8,886個重鏈的序列可以用於分析。長度依賴的H-CDR3設計作為一個實例,根據三個多樣化因素,得到了下面三個單獨的設計4aa-7aa8aa-14aa15aa-23aaKabat中102位上,在8-23個胺基酸的長度中Y含量從50%降到5%,這個位點的V含量從12。/。升高到65。/。。另外,101位的D含量從75。/。升高到100%。為了實施長度範圍中的不同胺基酸的發現,但不限制本發明的範圍,在基於環區的設計中,決定用2個不同的多樣化因素會更好一個來自8-14個胺基酸,另一個來自15-23個胺基酸,而應用於4-7個胺基酸長度的H-CDR3區域的多樣化因素可依照左邊的設計。對齊類型為了總結多個胺基酸長度的一種設計,下面對齊類型可作為包含8-14和15-23個胺基酸的庫成員設計的典型選擇(表l):左側對齊,右側對齊和對稱對齊。imageseeoriginaldocumentpage27表l:對齊類型;前三個和最後一個位點是H-CDR3區域側翼的框架區的恆定胺基酸位點。"樓梯"中的每一個臺階代表某一長度的共有序列。前三個位點代表臨近框架區的部分Kabat中92,93和94位的CAR區及位於Kabat中103位的FW4(WGQG)開端的W。左側對齊(表1+圖1):對齊前三個位點(Kabat96、97和98位)為方塊形。這些位點位於V和D片段的邊界上,可能是V編碼的(即種系基因)。因此這些位點在組成上可能與HCDR3剩餘的位點不同,而且保持分離。96位和97位與H-CDR3其他的位點不同,因為它們的Y含量降低,但是96位的D含量是升高的。最後五個位點(Kabat1、m、n、101和102位)包括主要的FDY序列,其也對齊為方塊形。101和102位通常是J片段編碼的,且由此表現出相似的胺基酸分布。首先,用aa填充前三個和後五個位置後,左側對齊乂人Kabat99位開始,接連填滿Kabat99和"l"位之間的缺口。右側對齊(表1+圖2):這裡同才羊將Kabat96、97和98位以及Kabat1、m、n、101和102位對齊為方塊形,遵從與針對左側對齊所描述的同樣的考慮因素。首先,用aa填充前三個和後五個位置後,右側對齊從Kabat'T位開始,接連填滿KabatT'和99位之間的缺口。中間對齊(表l+圖3a、3b、3c):關於結構方面,對稱對齊是對齊的首選類型,另外對稱對齊允許進行環中相互作用胺基酸的快速識別。在這裡,新的胺基酸對稱地加入某些位點。對稱對齊在AHO123位的中間進行,如在"Yetanothernumberingschemeforimmunoglobulinvariabledomains:anautomaticmodelingananalysistool"(免疫球蛋白可變區的另一種編號方式,即分析工具的自動建模)(A.Honegger,A.Pltickthun,J.Mol.Biol(2001)309,657-670)中所描述。有兩種對稱對齊是可能的一種對齊是,在123位設置一個缺口,將序列轉移到框架區,另一種對齊是將序列以123位為對稱軸向123位轉換,將序列分割成具有相同數目胺基酸的兩個部分。第一種對齊描述了側翼區氬基酸的分布(圖3a),而第二種對齊描述了H-CDR3區域中的環端(圖3b),當然也可以採用同樣的序列並以另一種方法排列。對於環來講,新的氛基酸在環的基礎上對稱加入。在混合中間對齊中(圖3c),序列朝向AHO123位對稱對齊,但是結合了環和側翼區的對齊。圍繞123位的五個胺基酸的方塊保持恆定,但是其他的序列被安排進側翼區。可以用於抗體可變區的編號系統的示例如圖4所示。表2顯示的是4-7個胺基酸長度H-CDR3區域的中間對齊(側翼區)結果。"全部"代表半胱氨酸以外的全部19個胺基酸等量分布。tableseeoriginaldocumentpage29表2:4-7個胺基酸長度H-CDR3區域的中間對齊'天然胺基酸分布表3顯示的是4-7個胺基酸長度H-CDR3區域的中間對齊(環區)結果。"全部"代表半胱氨酸以外的全部19個胺基酸等量分布。所有序列結果環區,H-CDR3,4aa-7aatableseeoriginaldocumentpage30表3:4-7個胺基酸長度H-CDR3區域的中間對齊。表4顯示的是4-7個胺基酸長度H-CDR3區域的左側對齊結果。"全部,代表半胱氨酸以外的全部19個胺基酸等量分布。tableseeoriginaldocumentpage31表4:4-7個胺基酸長度H-CDR3區域的左側對豸表5顯示的是4-7個胺基酸長度H-CDR3區域的右側對齊結果。"全部,代表半胱氨酸以外的全部19個胺基酸等量分布。tableseeoriginaldocumentpage32表5:4:個胺基酸長度H-CDR3區域的右側對齊:表6顯示的是8-14個胺基酸長度H-CDR3區域的中間對齊(側翼區)結果。"全部"代表半胱氨酸以外的全部19個胺基酸等量分布。表7顯示的是8-14個胺基酸長度H-CDR3區域的中間對齊(環區)結果。"全部"代表半胱氨酸以外的全部19個胺基酸等量分布。表8顯示的是8-14個胺基酸長度H-CDR3區域的中間對齊(混合中間)結果。"全部"代表半胱氨酸以外的全部19個胺基酸等量分布。表9顯示的是8-14個胺基酸長度H-CDR3區域的左側對齊結果。"全部"代表半胱氨酸以外的全部19個胺基酸等量分布。表10顯示的是8-14個胺基酸長度H-CDR3區域的右側對齊結果。"全部,,代表半胱氨酸以外的全部19個胺基酸等量分布。表11顯示的是15-23個胺基酸長度H-CDR3區域的中間對齊(側翼區)結果。"全部"代表半胱氨酸以外的全部19個胺基酸等量分布。表12顯示的是15-23個胺基酸長度H-CDR3區域的中間對齊(環區)結果。"全部,,代表半胱氨酸以外的全部19個胺基酸等量分布。表13顯示的是15-23個胺基酸長度H-CDR3區域的中間對齊(混合中間)結果。"全部"代表半胱氨酸以外的全部19個胺基酸等量分布。表14顯示的是15-23個胺基酸長度H-CDR3區域的左側對齊結果。"全部"代表半胱氨酸以外的全部19個胺基酸等量分布。表15顯示的是15-23個胺基酸長度H-CDR3區域的右側對齊結果。"全部"代表半胱氨酸以外的全部19個胺基酸等量分布。tableseeoriginaldocumentpage34tableseeoriginaldocumentpage35imageseeoriginaldocumentpage36tableseeoriginaldocumentpage37tableseeoriginaldocumentpage38表10:8-14個胺基酸長度H-CDR3區域的右側對齊。tableseeoriginaldocumentpage39tableseeoriginaldocumentpage40tableseeoriginaldocumentpage41表13:15-23個胺基酸長度H-CDR3區域的中間對齊。imageseeoriginaldocumentpage42表14:15-23個胺基酸長度H-CDR3區域的左側對齊。tableseeoriginaldocumentpage43表15:15-23個胺基酸長度H-CDR3區域的右側對齊。200680053024.7轉溢也被35/41:H在另一個非限制性的示例中,本發明提供了一種具有不同長度的多樣化H-CDR3區域的集合,其中根據第一個多樣化因素,H-CDR3區域的多樣性由將長度為約4到約8個胺基酸的在第一胺基酸範圍內的H-CDR3區域多樣化而產生,其中第一個多樣化因素要求1位上丙氨酸的頻率為約80%,2位上精氨酸的頻率為約60%,3位上甘氨酸的頻率為約40%,7位上天冬氨酸的頻率為約50%,8位上酪氨酸的頻率為約40%(表16)。s齒位森HG0R32:'3::4多T...8.、R:節19:德C:1&由.C:物'^Wfc:'K::D'輸.Y恥.表16:該表顯示的是將長度為約4到約8個胺基酸的在第一胺基酸範圍內的H-CDR3區域多樣化的多樣化因素示例。在另一個非限制性的示例中,本發明提供了一種具有不同長度的多樣化人類或者人源化抗體H-CDR3區域的集合,其中根據第一個多樣化因素,H-CDR3區域的多樣性由將長度為約9到約15個胺基酸的在第一胺基酸範圍內的H-CDR3區域多樣化而產生,其中第一個多才羊化因素要求1位上丙氨酸的頻率為約90%,2位上精氨酸的頻率為約70%,10位上酪氨酸的頻率為約20%,11位上酪氨酸的頻率為約20%,12位上酪氨酸的頻率為約30%,13位上苯丙氨酸的頻率為約60%,14位上天冬氨酸的頻率為約80%,15位上酪氨酸的頻率為約40%。優選的是,胺基酸長度為約9到約15個胺基酸的人類或者人源化H-CDR3區域的多樣性由H-CDR3區域中高含量的甘氨酸和絲氨酸產生(表17)。imageseeoriginaldocumentpage44表17:該表顯示的是將長度為約9到約15個胺基酸的在第一胺基酸範圍內的H-CDR3區域多樣化的多樣化因素示例。在另一個非限制性的示例中,本發明提供了一種具有不同長度的多樣化人類或人源化抗體H-CDR3區域的集合,其中根據第一個多樣化因素,H-CDR3區域的多樣性由將長度為約16到約22個胺基酸的H-CDR3區域多樣化而產生,其中第一個多樣化因素要求1位上丙氨酸的頻率為約90%,2位上精氨酸的頻率為約60%,3位上天冬氨酸的頻率為約30%,4位上甘氨酸的頻率為約20%,5位上精氨酸的頻率為約10%,6位上精氨酸的頻率為約10%,7位上酪氨酸的頻率為約20%,15位上酪氨酸的頻率為約40%,16位上酪氨酸的頻率為約50%,17位上酪氨酸的頻率為約50%,18位上酪氨酸的頻率為約60%,19位上酪氨酸的頻率為約40%,20位上曱硫氨酸的頻率為約50%,21位上天冬氨酸的頻率為約95%,22位上纈氨酸的頻率為約60%(表18)。formulaseeoriginaldocumentpage45表18:該表顯示的是將長度為約16到約22個胺基酸的在第一胺基酸範圍內的H-CDR3區域多樣化的多樣化因素示例。此外,胺基酸長度為約16到約22個胺基酸的人類或者人源化H-CDR3區域集合的多樣性由H-CDR3區域中高含量的絲氨酸、H-CDR3區域末端部分(C末端)高含量的鹼性胺基酸、H-CDR3區域前端部分(N端)的天冬氨酸和整個H-CDR3區域中高含量的芳香胺基酸產生。在本發明的上下文中,應理解,對於H-CDR3區域中任意給定的胺基酸位點,指定胺基酸位點上沒有指定頻率的胺基酸的出現率大致是均等的,或者這種位點上某些胺基酸比其他胺基酸具有更高的頻率,在某些情況下,在一個或多個指定胺基酸位置上,某些胺基酸會被排除(例如半胱氨酸)。在本發明的上下文中,通過在編碼H-CDR3的DNA序列中偏倚完全隨機的胺基酸分布,來模擬已知天然胺基酸的分布,從而實現了多樣化H-CDR3區域的設計。多樣化H-CDR3區域的產生利用三核苷酸誘變(TRIM)技術(Virnekas等,1994)進行,這種技術可以任意在單個位點合成任何需要的混合胺基酸,因此可以在任何位點引入任意的胺基酸偏倚(bias)。一般而言,TRIM技術依靠利用預先裝配的三核苷酸作為標準DNA合成的輸入物,由此避免了移碼、終止密碼子或者不需要的胺基酸,從而產生大量的序列多樣性。因此,產生足夠大的功能序列空間需要非常大的庫。相應地,關於長度依賴的胺基酸組成的知識結合TRIM技術,可以設計出具有更高功能含量的更小的H-CDR3區域集合。另一方面,本發明提供了一種包含多樣化H-CDR3區域集合的多樣化人類或者人源化抗體可變重鏈的集合,其中每個H-CDR3區域的多樣性由如下產生根據第一個多樣化因素將長度在第一胺基酸範圍內的H-CDR3區域多樣化,根據第二個多樣化因素將長度在第二胺基酸範圍內的H-CDR3區域多樣化,其中每個多樣化因素是每個H-CDR3區域胺基酸長度的函數。而且,本發明提供了一種多樣化人類或者人源化抗體或其功能片段的集合,根據本發明,集合中每個成員包含一個人類或者人源化抗體的可變重鏈。在本發明的上下文中,應理解,為了產生多樣化人類或者人源化抗體或其功能片段的集合,本領域技術人員將可以修改多樣化H-CDR3區域集合的理論設計。本領域技術人員應理解例如通過加入那些在彼此相同摩爾濃度時表現出低於這種頻率的胺基酸的方法,在胺基酸以低頻率出現方面(例如胺基酸的頻率低於5%或者優選低於3%)修改設計是可以接受的;這樣一來,多樣化人類或者人源化抗體或其功能片段的集合可以通過包括這個濃度下這些胺基酸的混合物而產生。另一方面,本發明提供了一種包含多樣化人類或者人源化抗體或其功能片段集合的、合成的人類或者人源化抗體庫。合成的共有序列可以覆蓋人類基因組編碼的抗體的結構譜。合成的人類或者人源化抗體庫可以基於抗體或抗體片段,優選Fv,二硫化物連接的Fv,單鏈Fv(scFv)或者Fab片段,這些可以作為對抗新的靶抗原的特異性來源。在本發明的上下文中,合成的人類或者人源化抗體庫建立在計算機設計、合成核酸編碼的胺基酸序列的基礎上。例如,抗體序列的計算機設計是通過分析人類序列的資料庫並用由此得到的數據設計多肽序列而實現的。通過分析已知基因種系人類免疫球蛋白可變區的胺基酸序列,抗體基因可以根據序列同源性和標準結構分成多個亞家族(Chothia等,1992;Tomlinson等,1995)。由於胺基酸序列的高同源性和屬於一個亞家族標準結構,7VH和7VL共有序列(主宰基因)可以被設計並結合產生49個主宰框架結合(Knappik等,2000)。主宰基因可以化學合成,從而通過引入所有的功能模塊側翼的獨特性限制位點,產生完全模塊化的基因結構。設計和得到計算機創建序列的方法有描述,例如Knappik等,J.Mol.Biol.(2000)296:57;Krebs等,J.Immunol.Methods.(2001)254:67;以及授予Knappik等的美國專利第6,300,064號,在此全部通過引用併入本文。另一方面,本發明提供了一種編碼多樣化人類或者人源化H-CDR3區域的核酸分子集合的製備方法。例如,這可通過合成多個DNA分子進行,其中每個DNA分子編碼一個H-CDR3區域,且其中所述H-CDR3區域具有不同的範圍。為此目的,根據第一個多樣化因素,合成編碼第一胺基酸範圍內H-CDR3區域的DNA分子;根據第二個多樣化因素,合成編碼第二胺基酸範圍內H-CDR3區域的DNA分子,這些多樣化因素是不同的。一方面,本發明提供了一種編碼胺基酸範圍不同的、多樣化人類或者人源化抗體H-CDR3區域集合的核酸集合,其中所述集合的多樣性由如下產生根據第一個多樣化因素將長度在第一胺基酸範圍內的H-CDR3區域多樣化,根據第二個多樣化因素將長度在第二胺基酸範圍內的H-CDR3區域多樣化,其中所述多樣化因素是不同的。本發明還提供了得到多樣化人類或者人源化抗體H-CDR3區域的集合的方法。根據本發明,這可以通過表達編碼多樣化人類或者人源化抗體H-CDR3區域集合的核酸集合來實現。另一方面,本發明提供了識別一個或多個基因的方法,這些基因編碼本發明中的一個或多個H-CDR3區域,而H-CDR3區域結合給定革巴點。這可以例如通過表達H-CDR3區域,然後對它們進行篩選以分離出一個或多個結合給定靶分子的H-CDR3區域來實現。H-CDR3區域可以包含在抗體可變重鏈內。篩選可以利用本領域技術人員熟知的方法之一進行,例如噬菌體展示或者半胱氨酸展示技術(Cysdisplay)(例如美國專利第6,753,136號中描述)。在本發明的上下文中,人類或者人源化抗體庫可以建立在來自人類供體基因片段和設計合成DNA相結合的基礎上。例如,人類供體來源的編碼輕鏈可變區和一系列重鏈區的片段與合成的DNA結合,這些合成的DNA編碼在特定位點引入多樣性的人類抗體序列。正如這裡公開的,本發明還提供了來源於抗體或其片段的變異或者優化了的抗體(或其片段)。抗體包含兩條肽鏈,每一條包含一個(輕鏈)或三個(重鏈)的恆定區以及一個可變區(VL、VH),後者在各種情況下均由四個FR區和三個間隔的CDR構成。抗原結合位點由一個或多個CDR形成,而FR區為CDR提供結構框架,並且在抗原結合中也起著重要的作用。通過改變CDR或FR區的一個或多個胺基酸殘基,本領域技術人員能夠常規地生產出變異或多樣化的抗體序列,這些序列可以通過抗原來篩選,例如篩選出新的或改進的特性。此外,這裡提到的"免疫球蛋白"(Ig)定義為隸屬IgG,IgM,IgE,IgA或IgD類(或其任何亞類)的一種蛋白質,其包括所有常規已知的抗體和其功能片段。抗體/免疫球蛋白的"功能片段"由此定義為保留抗原結合區的抗體/免疫球蛋白(例如IgG的可變區)的片段。抗體的"抗原結合區"通常位於抗體的一個或多個高變區中,即CDR-1、-2和/或-3區;但是可變"框架區"在抗原結合中也起著重要的作用,例如為CDR提供支架。優選的是,"抗原結合區"包含至少可變輕鏈(VL)的4-103個胺基酸殘基和可變重鏈(VH)的5-109個胺基酸殘基,更優選的是,包含可變輕鏈(VL)的3-107個胺基酸殘基和可變重鏈(VH)的4-111個胺基酸殘基,尤其優選的是,全部的輕鏈和重鏈(輕鏈的胺基酸1-109位和重鏈的1-113位;根據WO97/08320編號)。本發明中使用的優選的免疫球蛋白類別為IgG。本發明的"功能片段"包括F(ab,)2片段,Fab片段和scFv的區域。F(ab,)2或Fab可以被改造,用來減小或完全消除CH1和CL域間發生的分子間二硫《建相互作用。這裡提到術語"高變區"時,是指負責與抗原結合的、抗體的胺基酸殘基。高變區包含來自"互補決定區"或"CDR,,的胺基酸殘基[即輕鏈可變區中殘基24-34(Ll)、50-56(L2)和89-97(L3)以及重鏈可變區中31-35(H1)、50-65(H2)和95-102(H3);Kabat等,SequencesofProteinsofImmunologicalInterest,5thEd.PublicHealthService,NationalInstitutesofHealth,Bethesda,Md.(1991)]和/或那些來自"高變環"的殘基[即輕鏈可變區中殘基26誦32(L1)、50-52(L2)和91-96(L3)以及重鏈可變區中26-32(Hl)、53-55(H2)和96-101(H3);Chothia&LeskJ.Mol,Biol.196:901-917(1987)]。"框架"或"FR"殘基是不同於這裡定義的高變區殘基的可變區殘基。"人類"抗體或功能性人類抗體片段由此定義為非嵌合的(例如非"人源化的")和(全部或部分)不是來自非人物種的。人類抗體或功能性抗體片段可以來源於人類或者是合成的人類抗體。"合成的人類抗體"在這裡定義為具有全部或部分序列來自計算機合成序列的抗體,這些合成序列是在分析已知人類抗體序列的基礎上得到的。舉例來說,計算機設計人類抗得到的數據設計多肽序列來實現的。人類抗體或功能性抗體片段的另一個例子是,由人源抗體序列庫(即這種庫建立在人類自然來源提取抗體的基礎上)中分離出的核酸編碼得來的抗體或功能性片段。"人源化抗體"或功能性人源化抗體片段在這裡定義為(i)是至少部分來自非人類來源(例如帶有異源免疫系統的轉基因小鼠),抗體建立在人類基因種系序列的基礎上;或(ii)是嵌合的,其中可變區至少有一部分是非人類來源的,恆定區是人類來源的;或(iii)是CDR移植的,其中可變區CDR至少有一部分是非人類來源的,而一個或多個可變區框架是人類來源的以及恆定區(如果有的話)是人類來源的。權利要求1.一種胺基酸範圍可變的、多樣化人類或者人源化抗體H-CDR3區域的集合,其中該集合的多樣性由如下產生根據第一個多樣化因素將長度在第一胺基酸範圍內的H-CDR3區域多樣化,以及根據第二個多樣化因素將長度在第二胺基酸範圍內的H-CDR3區域多樣化,其中所述多樣化因素是不同的。2.根據權利要求1所述的多樣化人類或者人源化抗體H-CDR3區域的集合,其中所述H-CDR3區域至少有一部分的長度範圍為約4到約22個胺基酸。3.根據權利要求2所述的多樣化人類或者人源化抗體H-CDR3區域的集合,其中所述第一胺基酸範圍具有約4到約13個胺基酸,且其中所述第二胺基酸範圍具有約14到約22個胺基酸。4.根據權利要求1所述的多樣化人類或者人源化抗體H-CDR3區域的集合,其中所述集合的多樣性由如下產生根據第一個多樣化因素將長度在第一胺基酸範圍內的H-CDR3區域多樣化,根據第二個多樣化因素將長度在第二胺基酸範圍內的H-CDR3區域多樣化,以及根據第三個多樣化因素將長度在第三胺基酸範圍內的H-CDR3區域多樣化,其中所述多樣化因素是不同的。5.根據權利要求4所述的多樣化人類或者人源化抗體H-CDR3區域的集合,其中所述第一胺基酸範圍具有約4到約9個氛基酸,其中所述第二胺基酸範圍具有約10到約16個胺基酸,並且其中所述第三胺基酸範圍具有約17到約22個胺基酸。6.根據權利要求1所述的多樣化人類或者人源化抗體H-CDR3區域的集合,其中所述集合的多樣性由如下產生根據第一個多樣化因素將長度在第一胺基酸範圍內的H-CDR3區域多樣化,根據第二個多樣化因素將長度在第二胺基酸範圍內的H-CDR3區域多樣化,根據第三個多樣化因素將長度在第三胺基酸範圍內的H-CDR3區域多樣化,根據第四個多樣化因素將長度在第四胺基酸範圍內的H-CDR3區域多樣化,根據第五個多樣化因素將長度在第五tt酸範圍內的H-CDR3區域多樣化,以及根據第六個多樣化因素將長度在第六胺基酸範圍內的H-CDR3區域多樣化,其中所述多樣化因素是不同的。7.根據權利要求6所述的多樣化人類或者人源化抗體H-CDR3區域的集合,其中所述第一胺基酸範圍具有約4到約6個胺基酸,其中所述第二^基酸範圍具有約7到約9個胺基酸,其中所述第三胺基酸範圍具有約10到約12個胺基酸,其中所述第四胺基酸範圍具有約13到約15個胺基酸,其中所述第五胺基酸範圍具有約16到約18個胺基酸,且其中所述第六胺基酸範圍具有約19到約22個胺基酸。8.根據權利要求1所述的多樣化人類或者人源化抗體H-CDR3區域的集合,其中所述集合的多樣性由如下產生根據第一個多樣化因素將長度在第一胺基酸範圍內的H-CDR3區域多樣化,根據第二個多樣化因素將長度在第二胺基酸範圍內的H-CDR3區域多樣化,根據第三個多樣化因素將長度在第三胺基酸範圍內的H-CDR3區域多樣化,根據第四個多樣化因素將長度在笫四胺基酸範圍內的H-CDR3區域多樣化,根據第五個多樣化因素將長度在第五胺基酸範圍內的H-CDR3區域多樣化,根據第六個多樣化因素將長度在第六胺基酸範圍內的H-CDR3區域多樣化,根據第七個多樣化因素將長度在第七胺基酸範圍內的H-CDR3區域多樣化,根據第八個多樣化因素將長度在第八胺基酸範圍內的H-CDR3區域多樣化,以及根據第九個多樣化因素將長度在第九胺基酸範圍內的H-CDR3區域多樣化,其中所述多樣化因素是不同的。9.根據權利要求8所述的多樣化人類或者人源化抗體H-CDR3區域的集合,其中所述第一胺基酸範圍具有約4到約5個胺基酸,所述第二胺基酸範圍具有約6到約7個胺基酸,所述第三胺基酸範圍具有約8到約9個胺基酸,所述第四胺基酸範圍具有約IO到約11個胺基酸,所述第五胺基酸範圍具有約12到約13個胺基酸,所述第六胺基酸範圍具有約14到約15個胺基酸,所述第七氛基酸範圍具有約16到約17個胺基酸,所述第八胺基酸範圍具有約18到約19個胺基酸,且其中所述第九胺基酸範圍具有約20到約22個胺基酸。10.根據權利要求2所述的多樣化人類或者人源化抗體H-CDR3區域的集合,其中所述第一範圍具有約4到約8個胺基酸,且其中所述第一個多樣化因素要求1位上丙氨酸的頻率為約80%,2位上精氨酸的頻率為約60%,3位上甘氨酸的頻率為約40%,7位上天冬氨酸的頻率為約50%,以及8位上酪氨酸的頻率為約40%。11.根據權利要求2所述的多樣化人類或者人源化抗體H-CDR3區域的集合,其中所述第一範圍具有約9到約15個胺基酸,且其中所述第一個多樣化因素要求1位上丙氨酸的頻率為約90%,2位上精氨酸的頻率為約70%,10位上酪氨酸的頻率為約20%,11位上酪氨酸的頻率為約20%,12位上酪氨酸的頻率為約30%,13位上苯丙氨酸的頻率為約60%,14位上天冬氨酸的頻率為約80%,15位上酪氨酸的頻率為約40%。12.根據權利要求2所述的多樣化人類或者人源化抗體H-CDR3區域的集合,其中所述第一範圍具有約16到約22個胺基酸,且其中所述第一個多樣化因素要求1位上丙氨酸的頻率為約90%,2位上精氨酸的頻率為約60%,3位上天冬氨酸的頻率為約30%,4位上甘氨酸的頻率為約20%,5位上精氨酸的頻率為約10%,6位上精氨酸的頻率為約10%,7位上酪氨酸的頻率為約20%,15位上酪氨酸的頻率為約40%,16位上酪氨酸的頻率為約50%,17位上酪氨酸的頻率為約50%,18位上酪氨酸的頻率為約60%,19位上酪氨酸的頻率為約40%,20位上甲硫氨酸的頻率為約50%,21位上天冬氨酸的頻率為約95%,22位上纈氨酸的頻率為約60%。13.根據權利要求2所述的多樣化人類或者人源化抗體H-CDR3區域的集合,其中所述第一範圍具有約9到約15個胺基酸,且其中所述第一個多樣化因素要求所述第一範圍中至少有兩個胺基酸位點上具有高含量的甘氨酸和絲氨酸。14.根據權利要求2所述的多樣化人類或者人源化抗體H-CDR3區域的集合,其中所述第一範圍具有約16到約22個胺基酸,且其中所述第一個多樣化因素要求(i)所述第一範圍中至少有一個胺基酸位點上具有高含量的絲氨酸,(ii)所述H-CDR3區域末端部分中具有高含量的鹼性胺基酸,(iii)所述H-CDR3前端部分中具有高含量的天冬氨酸和(iv)所述第一範圍中至少有兩個氨基S臾位點上具有高含量的芳香胺基酸。15.根據權利要求2所述的多樣化人類或者人源化抗體H-CDR3區域的集合,其中所述第一範圍具有約5個胺基酸,且其中所述第一個多樣化因素要求1位上丙氨酸的頻率為約60%,蘇氨酸的頻率為約20%和除半胱氨酸外的所有其他胺基酸的頻率為約0.58%;2位上精氨酸的頻率為約30%,賴氨酸的頻率為約30%,蘇氨酸的頻率為約30%和除半胱氨酸外的所有其他胺基酸的頻率為約0.55%;3位上天冬氨酸的頻率為約40%,苯丙氨酸的頻率為約40%和除半胱氨酸外的所有其他胺基酸的頻率為約0.58%;4位上天冬氨酸的頻率為約30%,甘氨酸的頻率為約30%,甲硫氨酸的頻率為約30%和除半胱氨酸外的所有其他胺基酸的頻率為約0.63%以及5位上酪氨酸的頻率為約30%,天冬氨酸的頻率為約30%和除半胱氨酸外的所有其他胺基酸的頻率為約0.58%。16.根據權利要求2所述的多樣化人類或者人源化抗體H-CDR3區域的集合,其中所述第一範圍具有約12個胺基酸,且其中所述第一個多樣化因素要求l位上丙氨酸的頻率為約80%,蘇氨酸和纈氨酸總共的頻率為約15%;2位上精氨酸的頻率為約70%,絲氨酸、蘇氨酸、甘氨酸和丙氨酸總共的頻率是約30%;9位上丙氨酸、絲氨酸和酪氨酸總共的頻率為約20%以及除半胱氨酸外的所有其他胺基酸的頻率為約0.63%;10位上苯丙氨酸的頻率為約60%,曱硫氨酸的頻率為約10%和除半胱氨酸外的所有其他胺基酸的頻率為約0.58%;11位上天冬氨酸的頻率為約80%,甘氨酸的頻率為約5%和除半胱氨酸外的所有其他胺基酸的頻率為約0.58%以及12位上酪氨酸的頻率為約50%,纈氨酸和異亮氨酸總共的頻率為約10%和除半胱氨酸外的所有其他胺基酸的頻率為約0.63%。17.根據權利要求2所述的多樣化人類或者人源化抗體H-CDR3區域的集合,其中所述第一範圍具有約20個胺基酸,且其中所迷第一個多樣化因素要求1位上丙氨酸的頻率為約100%;2位上精氨酸的頻率為約50%和賴氨酸的頻率為約50%;3位上甘氨酸的頻率為約30%和除半胱氨酸外的所有其他胺基酸的頻率為約0.55%;4位上精氨酸的頻率為約20%,甘氨酸的頻率為約20%,亮氨酸的頻率為約20%和除半胱氨酸外的所有其他胺基酸的頻率為約0.63%;14位上絲氨酸的頻率為約20%,蘇氨酸的頻率為約20%,半胱氨酸的頻率為約20%和除半胱氨酸外的所有其他胺基酸的頻率為約0.63%;21位上天冬氨酸的頻率為約95%以及22位上纈氨酸的頻率為約50%和除半胱氨酸外的所有其他胺基酸的頻率為約0.55%。18.—種多樣化人類或者人源化抗體可變重鏈的集合,其包含根據權利要求1的多樣化人類或者人源化抗體H-CDR3區域的集合。19.一種多樣化人類或者人源化抗體或其功能性片段的集合,其包含根據權利要求18的人類或者人源化抗體可變重鏈的集合。20.—種合成的人類或者人源化抗體庫,其包含根據權利要求19的多樣化人類或者人源化抗體或其功能性片段的集合。21.—種編碼範圍可變的多樣化人類或者人源化H-CDR3區域的核酸分子集合的製備方法,其包含以下步驟合成多個DNA分子,其中每個DNA分子編碼一個H-CDR3區域,所述H-CDR3區域具有不同的範圍,其中根據第一個多樣化因素,合成編碼第一胺基酸範圍的H-CDR3區域的DNA分子;以及根據第二個多樣化因素,合成編碼第二胺基酸範圍的H-CDR3區域的DNA分子,其中所述多樣化因素是不同的。22.—種編碼多樣化人類或者人源化抗體H-CDR3區域集合的核酸集合,其根據權利要求21的方法生產。23.—種編碼胺基酸範圍可變的、多樣化人類或者人源化抗體H-CDR3區域集合的核酸集合,其中所述集合的多樣性由如下產生根據第一個多樣化因素將長度在第一胺基酸範圍內的H-CDR3區域多樣化,以及根據第二個多樣化因素將長度在第二胺基酸範圍內的H-CDR3區域多樣化,其中所述多樣化因素是不同的。24.—種得到根據權利要求1所述的多樣化人類或者人源化抗體H-CDR3區域的集合的方法,所述方法包含以下步驟表達根據權利要求22或23的核酸集合。25.根據權利要求1所述的多樣化人類或者人源化H-CDR3區域的集合,其中如果所述集合中的成員長度是4-8個胺基酸,那麼應用於所述長度是4-8個胺基酸的所述成員的所述多樣化因素在具有所述長度的所述成員的所述H-CDR3區域中定義了0,1,2或3個恆定的胺基酸位點。26.根據權利要求1所述的多樣化人類或者人源化H-CDR3區域的集合,其中如果所述集合中的成員長度是9-10個胺基酸,那麼應用於所述長度是9-10個胺基酸的所述成員的所述多樣化因素在具有所述長度的所述成員的所述H-CDR3區域中定義了0,1,2或3個恆定的胺基酸位點。27.根據權利要求1所述的多樣化人類或者人源化H-CDR3區域的集合,其中如果所述集合中的成員長度是11-13個胺基酸,那麼應用於所述長度是11-13個胺基酸的所述成員的所述多樣化因素在具有所述長度的所述成員的所述H-CDR3區域中定義了0,1,2或3個恆定的胺基酸位點。28.根據權利要求1所述的多樣化人類或者人源化H-CDR3區域的集合,其中如果所述集合中的成員長度是14個胺基酸,那麼應用於所述長度是14個胺基酸的所述成員的所述多樣化因素在具有所述長度的所述成員的所迷H-CDR3區域中定義了0,1,2,3,4或5個恆定的胺基酸位點。29.根據權利要求1所述的多樣化人類或者人源化H-CDR3區域的集合,其中如果所述集合中的成員長度是15-16個胺基酸,那麼應用於所述長度是15-16個胺基酸的所迷成員的所述多樣化因素在具有所迷長度的所述成員的所述H-CDR3區域中定義了0,1,2,3,4,5,6,7或8個恆定的胺基酸位點。30.根據權利要求1所述的多樣化人類或者人源化H-CDR3區域的集合,其中如果所述集合中的成員長度是16-17個胺基酸,那麼應用於所述長度是16-17個胺基酸的所述成員的所述多樣化因素在具有所述長度的所述成員的所述H-CDR3區域中定義了0,1,2,3,4,5,6,7或8個恆定的胺基酸位點。31.根據權利要求1所述的多樣化人類或者人源化H-CDR3區域的集合,其中如果所述集合中的成員長度是18個胺基酸,那麼應用於所述長度是]8個胺基酸的所述成員的所述多樣化因素在具有所述長度的所述成員的所述H-CDR3區域中定義了0,1,2,3,4,5,6,7或8個恆定的胺基酸位點。32.根據權利要求1所述的多樣化人類或者人源化H-CDR3區域的集合,其中如杲所述集合中的成員長度是19個或更多胺基酸,那麼應用於所述長度是19個或更多胺基酸的所述成員的所述多樣化因素在具有所述長度的所述成員的所述H-CDR3區域中定義了0,1,2,3,4,5,6或7個恆定的胺基酸位點。全文摘要本發明涉及抗體重鏈互補決定區3(HCDR3)成員集合的製備和應用,這個集合的多樣性是HCDR3成員長度的函數。HCDR3區域集合的多樣性大體上代表了人HCDR3譜中天然胺基酸的分布。因此,在編碼HCDR3的DNA序列中利用三核苷酸誘變(TRIM)技術偏倚完全隨機分布的胺基酸可以描繪這種天然胺基酸的分布。本發明HCDR3集合中的每一個成員,都可以包含在抗體可變區(或者其片段)中,以形成合成的抗體或者抗體片段庫。本發明中的合成抗體庫可以設計成包含一些模塊的特性,例如化學合成的「主宰基因」框架區,這個框架區可能含有一個或多個CDR區域側翼的獨特限制性位點,包括按這裡描述製備的HCDR3區域。本發明還提供了編碼這種多樣化集合的核酸分子,和製備使用所述核酸分子的方法。文檔編號C40B40/10GK101389655SQ200680053024公開日2009年3月18日申請日期2006年12月15日優先權日2005年12月20日發明者克裡斯廷·羅斯,斯特法妮·尤林格,斯特法妮·特爾喬瑟夫·普拉斯勒,馬庫斯·恩澤爾伯格申請人:莫佛塞斯公司