合成編碼文庫的方法

2023-05-17 10:50:06 2

專利名稱：合成編碼文庫的方法
相關申請本申請要求2003年12月17日提交的美國臨時專利申請系列號60/530854、2004年1月30日提交的美國臨時專利申請系列號60/540681、2004年3月15日提交的美國臨時專利申請系列號60/553,715和2004年7月16日提交的美國臨時專利申請系列號60/588,672的優先權，這些專利的全部內容均在此引入作為參考。
背景技術：
探索鑑定具有有用生物活性的化合物的更有效方法，導致發展了篩選大量不同化合物的方法，這些化合物存在於被稱為組合文庫的集合中。這樣的文庫可含有105種或更多不同的化合物。有許多方法用於產生組合文庫，並且已經報導了肽、擬肽和有機小分子的組合合成。
組合方法應用於藥物發現的兩個主要挑戰是非常複雜的文庫的合成和在所用篩選中有活性的分子的鑑定。通常知道文庫的複雜程度越高，即文庫中存在的不同結構的數量越多，該文庫含有具有目標活性的分子的可能性就越大。因此，文庫合成中使用的化學方法必須能夠在合理時間範圍內生成大量化合物。但是對於給定的克式濃度和總濃度來說，提高文庫內不同成員的數目降低了任何特定文庫成員的濃度。這使得從高複雜性文庫中鑑定活性分子變得複雜。
克服這些障礙的一種方法是發展編碼文庫，特別是其中每個化合物均包含可擴增標籤的文庫。這樣的文庫包括DNA-編碼文庫，其中用於識別文庫成員的DNA標籤能夠用分子生物學技術如聚合酶鏈反應擴增。但是，這些方法在產生很大文庫中的應用尚未得到證明，顯然，為了實現該方法用於藥物發現的可能性，需要改進產生這種文庫的方法。
發明概述本發明提供一種合成包含編碼寡核苷酸標籤的分子文庫的方法。該方法使用「分離-組合」策略，其中將含有起始物的溶液分成(「分離」)多個部分，該起始物包括連接有一編碼寡核苷酸的第一結構單元(buildingblock)。在每個部分中，起始物與獨特的第二結構單元和標識該第二結構單元的獨特的第二寡核苷酸反應。這些反應可以同時或相繼進行，如果是相繼進行，則任一反應都可以在另一反應之前。將每個部分中產生的二聚體分子合併(「組合」)，然後再分為多個部分。這些部分中的每一個然後與獨特(每部分特異性)的第三結構單元和編碼(標識)該結構單元的獨特的第三寡核苷酸反應。產物文庫中存在的獨特分子的數目是以下數值的函數(1)在合成的每一步使用的不同結構單元的數目，和(2)組合和分離步驟的重複次數。
在一個實施方案中，本發明提供一種合成分子的方法，該分子包含或由與編碼寡核苷酸可操作連接的功能部分組成。該方法包括下列步驟(1)提供由包含n個結構單元的功能部分組成的起始化合物，其中n是1或大於1的整數，其中該功能部分含有至少一個反應基團，並且其中該功能部分與起始寡核苷酸可操作連接；(2)將該起始化合物與包含至少一個互補反應基團的結構單元反應，其中該至少一個互補反應基團與步驟(1)的反應基團互補，反應條件適合所述反應基團與互補反應基團反應形成共價鍵；(3)將起始寡核苷酸與標識步驟(b)的結構單元的引入寡核苷酸反應，反應條件適合所述引入寡核苷酸與起始寡核苷酸連接，並存在催化所述起始寡核苷酸與引入寡核苷酸連接的酶，從而產生包含功能部分或由該功能部分組成的分子，該功能部分含有n+1個結構單元，並且與編碼寡核苷酸可操作連接。如果步驟(3)的功能部分包含反應基團，則步驟1-3可以重複一次或多次，從而形成循環1至i，其中i是2或大於2的整數，循環s的步驟(3)的產物成為循環s+1的起始化合物，其中s是i-1或更小的整數。
在一個實施方案中，本發明提供一種合成化合物文庫的方法，其中化合物包含功能部分，該功能部分包含兩個或更多的結構單元，並且與標識該功能部分結構的寡核苷酸可操作連接。該方法包括下列步驟(1)提供包含m種起始化合物的溶液，其中m是1或大於1的整數，其中起始化合物由包含n個結構單元的功能部分組成，其中n是1或大於1的整數，該功能部分與識別該n個結構單元的起始寡核苷酸可操作連接；(2)將步驟(1)的溶液分成r個部分，其中r是2或大於2的整數；(3)每個部分中的起始化合物與r個結構單元之一反應，從而產生r個部分，包含由與起始寡核苷酸可操作連接的功能部分組成的化合物，該功能部分包含n+1個結構單元；(4)每個部分中的起始寡核苷酸與一組r個不同引入寡核苷酸之一反應，反應條件適合所述引入寡核苷酸與起始寡核苷酸進行酶連接，並存在催化所述引入寡核苷酸與起始寡核苷酸連接的酶，從而產生r個等份，包含由與延長的寡核苷酸可操作連接的功能部分組成的分子，該功能部分包含n+1個結構單元，該延長的寡核苷酸編碼(標識)該n+1個結構單元。任選地，該方法可進一步包括步驟(5)重新組合步驟(4)產生的r個部分，從而產生包含由功能部分組成的化合物的溶液，該功能部分包含n+1個結構單元並且與延長的寡核苷酸可操作連接。步驟(1)至(5)可以進行一次或多次，產生循環1至i，其中i是2或大於2的整數。在循環s+1中，其中s是i-1或更小的整數，步驟(1)的含有m種起始化合物的溶液是循環s的步驟(5)的溶液。同樣，循環s+1的步驟(1)的起始化合物是循環s的步驟(5)的化合物。
在一個優選實施方案中，在每一步驟中用常規化學反應偶聯結構單元。結構單元可以偶聯產生直鏈或分支聚合物或低聚物，如肽、擬肽和類肽，或非低聚物分子，如包含連接有一個或多個其他化學部分的支架結構的分子。例如，如果結構單元是胺基酸殘基，則該結構單元可以用標準肽合成方法偶聯，如本領域公知的應用適當保護/脫保護策略的溶液相或固相合成。優選地，結構單元採用溶液相化學法偶聯。編碼寡核苷酸是單鏈或雙鏈寡核苷酸，優選雙鏈寡核苷酸。編碼寡核苷酸優選是每個結構單元有4-12個鹼基或鹼基對的寡核苷酸；編碼寡核苷酸可以利用標準溶液相或固相寡核苷酸合成法偶聯，但是優選利用溶液相酶法偶聯。例如，如果編碼寡核苷酸的序列包含用於用一種這樣的酶進行連接的起始序列的話，則該寡核苷酸可以利用拓撲異構酶、連接酶或DNA聚合酶偶聯。編碼寡核苷酸的酶偶聯具有以下優點(1)比標準合成(非酶)偶聯更高的添加精確度；和(2)應用更簡單的保護/脫保護策略。
另一方面，本發明提供式I的化合物其中X是包含一個或多個結構單元的功能部分；Z是在其3』末端與B連接的寡核苷酸；Y是在其5』末端與C連接的寡核苷酸；A是與X形成共價鍵的官能團；B是與Z的3』-末端形成鍵的官能團；C是與Y的5』-末端形成鍵的官能團；D、F和E各自獨立地是雙功能連接基團；且S是原子或分子支架。這樣的化合物包括應用本發明的方法合成的那些化合物。
本發明進一步涉及一種化合物文庫，其包含含有功能部分的化合物，該功能部分包含兩個或多個結構單元，並且與編碼該功能部分結構的寡核苷酸可操作連接。這樣的文庫可包含約102至約1012或更多種不同的成員，例如102、103、104、105、106、107、108、109、1010、1011、1012或更多不同的成員，即不同的分子結構。
在一個實施方案中，該化合物文庫包含各自獨立地為式I的化合物
其中X是包含一個或多個結構單元的功能部分；Z是在其3』末端與B連接的寡核苷酸；Y是在其5』末端與C連接的寡核苷酸；A是與X形成共價鍵的官能團；B是與Z的3』-末端形成鍵的官能團；C是與Y的5』-末端形成鍵的官能團；D、F和E各自獨立地是雙功能連接基團；且S是原子或分子支架。這樣的文庫包括應用本發明的方法合成的那些文庫。
另一方面，本發明提供一種鑑定與生物靶標結合的化合物的方法，該方法包括以下步驟(a)使該生物靶標接觸本發明的化合物文庫，其中該化合物文庫包括含有功能部分的化合物，該功能部分包含兩個或多個結構單元，並且與編碼該功能部分結構的寡核苷酸可操作連接。該步驟在適合化合物文庫的至少一個成員與該靶標結合的條件下進行；(2)除去不與該靶標結合的文庫成員；(3)擴增能與該靶標結合的化合物文庫至少一個成員的編碼寡核苷酸；(4)對步驟(3)的編碼寡核苷酸進行測序；和利用步驟(5)測定的序列確定能與該生物靶標結合的化合物文庫成員的功能部分的結構。
本發明在鑑定具有所需性質的分子方面具有幾個優點。例如，本發明的方法允許在寡核苷酸標籤的存在下使用許多化學反應來構建分子。本發明的方法也提供了向這樣產生的化學結構中引入寡核苷酸標籤的高保真度手段。另外，它們能夠合成每個成員具有高拷貝數的文庫，從而允許對生物靶標進行多輪篩選，而在最後一輪後剩餘足夠數量的分子用於寡核苷酸標籤的擴增和測序。
附圖簡述

圖1是雙鏈寡核苷酸的連接的示意圖，其中起始寡核苷酸具有與引入寡核苷酸的突出端互補的突出端。起始鏈顯示為游離的、與氨基己基連接體偶聯的或通過氨基己基連接體與苯丙氨酸殘基偶聯的。
圖2是使用夾板(splint)鏈進行寡核苷酸連接的示意圖。在該實施方案中，夾板是12-mer的寡核苷酸，其序列與單鏈起始寡核苷酸和單鏈引入寡核苷酸互補。
圖3是當起始寡核苷酸是具有共價連接鏈的雙鏈，並且引入寡核苷酸是雙鏈時，起始寡核苷酸與引入寡核苷酸連接的示意圖。
圖4是使用聚合酶延長寡核苷酸的示意圖。起始鍊表示為游離的、與氨基己基連接體偶聯的或通過氨基己基連接體與苯丙氨酸殘基偶聯的。
圖5是本發明的一個實施方案的合成循環的示意圖。
圖6是應用本發明的文庫進行多輪篩選過程的示意圖。
圖7是實施例1所述循環1至5中每一個的產物以及在封閉引物連接後的產物的電泳凝膠。分子量標準顯示於泳道1，用於DNA定量的hyperladder的指定量顯示於泳道9至12中。
圖8是利用疊氮化物-炔環加成作用偶聯結構單元的示意圖。
圖9和10說明通過氯代三嗪上的親核芳族取代偶聯結構單元。
圖11顯示適合在功能部分合成中使用的代表性氯代雜芳環結構。
圖12說明應用疊氮化物/炔環加成反應環化直鏈肽。
圖13A是如實施例2所述在循環4之後產生的文庫的層析圖。
圖13B是如實施例2所述在循環4之後產生的文庫的質譜圖。
發明詳述本發明涉及製備化合物和組合化合物文庫的方法，通過本發明的方法製備的化合物和文庫，和利用該文庫鑑定具有所需性質如所需生物活性的化合物的方法。本發明進一步涉及應用這些方法鑑定的化合物。
已經應用了多種方法來產生和篩查組合化學文庫。例子包括將文庫的各成員彼此物理分離的方法，例如當在多個反應容器的每一個中合成單一化合物時。但是，這些文庫一般一次篩選一種化合物，或者最多一次篩選幾種化合物，因此不能獲得最有效的篩選過程。在另外一些方法中，在固體支持體上合成化合物。這樣的固體支持體包括晶片，其中特定化合物佔據晶片或膜上的特定區域(「可定位的」)。在另外一些方法中，在珠上合成化合物，每個珠含有不同的化學結構。
在篩查大文庫時遇到的兩個困難是(1)可以篩選的不同化合物的數量；和(2)在篩選中有活性的化合物的鑑定。在一種方法中，在篩選中有活性的化合物如下鑑定將原始文庫縮小為更小的部分或亞部，在每種情況下都選擇含有活性化合物的部分或亞部，並且進一步再分，直到獲得含有一組化合物的足夠小的活性亞部，以致該亞部的所有成員能夠單獨合成，並且評價所需的活性。這是一項單調的、費時的工作。
解析組合文庫篩查結果的另外一種方法是利用這樣的文庫，其中該文庫的成員用識別標籤進行標記，即，該文庫中存在的每個標籤都與該文庫中存在的不同化合物結構相關，因此該標籤的識別指出了標記分子的結構。一種標記文庫方法使用寡核苷酸標籤，如美國專利號5,573,905；5,708,153；5,723,598，6,060,596，公開的PCT申請WO 93/06121；WO93/20242；WO 94/13623；WO 00/23458；WO 02/074929和WO02/103008，Brenner和Lerner(Proc.Natl.Acad.Sci.USA 89，5381-5383(1992)；Nielsen和Janda(MethodsA Companion to Methods inEnzymology 6，361-371(1994)；Nielsen，Brenner和Janda(J.Am.Chem.Soc.115，9812-9813(1993))所述，這些文獻均在此全文引用作為參考。這樣的標籤可以利用如聚合酶鏈反應擴增，產生多個標籤拷貝，並且通過測序鑑定該標籤。標籤的序列確定了結合分子的結構，這些分子可以以純的形式合成並且檢測。迄今為止，還沒有報導使用Lerner等人公開的方法製備大文庫。本發明提供了產生DNA-編碼文庫的方法的改進，以及利用溶液相合成法合成功能部分的DNA編碼分子大(105個成員或更多)文庫的首批實例。
本發明提供了一種方法，該方法允許容易地合成寡核苷酸編碼的組合文庫，並且提供向大分子集合的每個成員上添加這種寡核苷酸標籤的有效、高保真的手段。
本發明的方法包括合成雙功能分子的方法，該雙功能分子包含由結構單元組成的第一部分(「功能部分」)，和與第一部分可操作連接的第二部分，第二部分包含標識第一部分的結構的寡核苷酸標籤，即該寡核苷酸標籤指示在第一部分構建中使用了哪些結構單元，以及結構單元連接的順序。通常，寡核苷酸標籤提供的信息足以確定用來構建活性部分的結構單元。在某些實施方案中，寡核苷酸標籤的序列足以確定功能部分中結構單元的排列，例如，對於擬肽，為胺基酸序列。
如此處所用的術語「功能部分」是指包含一個或多個結構單元的化學部分。優選地，功能部分中的結構單元不是核酸。功能部分可以是直鏈或支鏈或環形的聚合物或寡聚物或有機小分子。
如此處所用的術語「結構單元」是與其他化學結構單位連接的，或者能夠與其他這樣的單位連接的化學結構單位。當功能部分是多聚的或寡聚的時，結構單元是聚合物或寡聚物的單體單元。結構單元也可以包括支架結構(「支架結構單元」)，支架結構上連接有或者可以連接一個或多個其他的結構(「周圍結構單元」)。
應當理解，此處使用的術語「結構單元」是指存在於功能部分中的，也指以反應性形式用於合成功能部分的化學結構單位。在功能部分內，結構單元不含由於將該結構單元摻入功能部分中而丟失的結構單元的任何部分。例如，在鍵形成反應釋放小分子的情況中(見下文)，存在於功能部分中的結構單元是「結構單元殘基」，即，在貢獻釋放分子的原子丟失後在合成中使用的結構單元的剩餘部分。
結構單元可以是互補的任何化學化合物，即結構單元必須能夠一起反應，形成含有兩個或多個結構單元的結構。一般地說，使用的所有結構單元都具有至少兩個反應基團，儘管也可能有一些使用的結構單元(例如在寡聚功能部分中的最後一個結構單元)各自只含有一個反應基團。兩個不同結構單元上的反應基團應當互補，即，能夠一起反應形成共價鍵，任選地伴隨小分子如水、HCl、HF等的丟失。
為了本目的，如果兩個反應基團能夠一起反應形成共價鍵，則它們互補。在一個優選實施方案中，鍵形成反應在環境條件下快速發生，基本不形成副產物。優選地，特定反應基團將與特定互補反應基團反應正好一次。在一個實施方案中，兩個結構單元的互補反應基團例如通過親核取代反應，形成共價鍵。在一個實施方案中，一對互補反應基團的一個成員是親電子基團，而另一個成員是親核基團。
互補親電子和親核基團包括在適當條件下通過親核取代反應形成共價鍵的任何兩個基團。許多合適的鍵形成反應在本領域中公知。參見，例如，March，Advanced Organic Chemistry，第四版，New YorkJohnWiley and Sons(1992)，第10-16章；Carey和Sundberg，Advanced OrganicChemistry，Part B，Plenum(1990)，第1-11章；和Collman等，Principles andApplications of Organotransition Metal Chemistry，University ScienceBooks，Mill Valley，Calif.(1987)，第13-20章；均在此全文引用作為參考。合適的親電子基團的例子包括反應性羰基，如醯氯基，酯基，包括羰基五氟苯酯和琥珀醯亞胺酯，酮基和醛基；反應性磺醯基，如磺醯氯基，和反應性膦醯基。其他親電子基團包括末端環氧基、異氰酸酯基和烷基滷。合適的親核基團包括伯氨基、仲氨基、羥基和羧基。
合適的互補反應基團在下面描述。本領域技術人員能夠容易地確定可在本方法中使用的其他反應基團對，此處提供的實例不是限制性的。
在第一個實施方案中，互補反應基團包括活化的羧基、反應性磺醯基或反應性膦醯基或它們的組合，和伯氨基或仲氨基。在該實施方案中，互補反應基團在適當條件下反應，形成醯胺、磺醯胺或磷醯胺鍵。
在第二個實施方案中，互補反應基團包括環氧基和伯氨基或仲氨基。含環氧化物的結構單元與含胺的結構單元在適當條件下反應，形成碳-氮鍵，生成β-氨基醇。
在另一個實施方案中，互補反應基團包括吖丙啶基和伯氨基或仲氨基。在適當條件下，含吖丙啶的結構單元與含胺的結構單元反應，形成碳-氮鍵，生成1，2-二胺。在第三個實施方案中，互補反應基團包括異氰酸酯基和伯氨基或仲氨基。含異氰酸酯的結構單元將與含胺的結構單元在適當條件下反應，形成碳-氮鍵，生成脲基。
在第四個實施方案中，互補反應基團包括異氰酸酯基和羥基。含異氰酸酯的結構單元將與含羥基的結構單元在適當條件下反應，形成碳-氧鍵，生成氨基甲酸酯基。
在第五個實施方案中，互補反應基團包括氨基和含羰基的基團，如醛基或酮基。胺與這些基團通過還原性胺化反應，形成新的碳-氮鍵。
在第六個實施方案中，互補反應基團包括磷葉立德基和醛基或酮基。含磷葉立德的結構單元將與含醛或酮的結構單元在適當條件下反應，形成碳-碳雙鍵，生成烯。
在第七個實施方案中，互補反應基團通過環加成作用反應，形成環結構。這樣的互補反應基團的一個例子是炔和有機疊氮化物，它們在適當條件下反應，形成三唑環結構。使用這種反應連接兩個結構單元的一個例子在圖8中顯示。用於這樣的反應的適當條件在本領域中公知，包括WO 03/101972公開的那些，該專利的全部內容在此引用作為參考。
在第八個實施方案中，互補反應基團是烷基滷和親核基團，如氨基、羥基或羧基。這些基團在適當條件下反應，形成碳-氮(烷基滷加胺)或碳-氧(烷基滷加羥基或羧基)。
在第九個實施方案中，互補官能團是滷代雜芳基和親核基團，結構單元在適當條件下通過芳香親核取代連接。合適的滷代雜芳基包括氯代嘧啶、三嗪和嘌呤，它們與親核物質如胺在水溶液中在溫和條件下反應。寡核苷酸標記的三氯三嗪與胺反應的代表性例子在圖9和10中顯示。合適的氯代雜芳基的例子在圖11中顯示。
應當理解，功能部分的合成可以通過一種特定類型的偶聯反應進行，例如但不限於以上所述反應中的一種，或者通過兩種或多種偶聯反應如以上所述的兩種或多種偶聯反應的組合進行。例如，在一個實施方案中，通過醯胺鍵形成(氨基和羧酸互補基團)和還原性胺化(氨基和醛或酮互補基團)的組合，結構單元連接在一起。可以使用任何偶聯化學方法，只要與寡核苷酸的存在相匹配。在本發明某些實施方案中使用的雙鏈(雙鏈體)寡核苷酸標籤在化學上比單鏈標籤更強，因此，容許較寬的反應條件範圍，並且能夠採用用單鏈標籤不可能進行的鍵形成反應。
除了反應基團或形成功能部分使用的基團以外，結構單元還可包含一個或多個官能團。一個或多個這樣的其他官能團可以受到保護，以阻止這些官能團的不需要的反應。用於多種官能團的合適的保護基在本領域中公知(Greene和Wuts，Protective Groups in Organic Synthesis，第二版，New YorkJohn Wiley and Sons(1991)，在此引用作為參考)。特別有用的保護基包括叔丁基酯和醚、縮醛、三苯甲基醚和胺、乙醯基酯、三甲基矽烷基醚、三氯乙基醚和酯和氨基甲酸酯。
在一個實施方案中，每個結構單元都含有兩個反應基團，這兩個反應基團可以相同也可以不同。例如，在循環s中添加的每個結構單元可以包含兩個相同的反應基團，但是它們均與步驟s-1和s+1添加的結構單元的反應基團互補。在另外一個實施方案中，每個結構單元都含有兩個自身互補的反應基團。例如，包含聚醯胺分子的文庫可以通過含有兩個伯氨基的結構單元與含有兩個活化羧基的結構單元反應產生。產生的化合物沒有N-末端或C-末端，因為交替的醯胺基具有相反的方向性。或者，聚醯胺文庫也可以用各自含有氨基和活化羧基的結構單元產生。在該實施方案中，在循環的步驟n中添加的結構單元具有游離的反應基團，該反應基團與n-1結構單元上可用的反應基團互補，而優選地，第n個結構單元上的另一反應基團受到保護。例如，如果該文庫的成員從C向N方向合成，則添加的結構單元將包含活化的羧基和受到保護的氨基。
功能部分可以是多聚或寡聚部分，如肽、擬肽、肽核酸或類肽，或者它們可以是非聚合的小分子，例如具有包含中央支架的結構和繞支架周圍排列的結構的分子。直鏈多聚或寡聚文庫通過使用具有兩個反應基團的結構單元產生，而分支多聚或寡聚文庫通過使用具有三個或更多反應基團的結構單元產生，任選地與只具有兩個反應基團的結構單元組合。這樣的分子可以表示為通式X1X2...Xn，其中每一個X都是含有n個單體單元的聚合物的單體單元，其中n是大於1的整數。對於寡聚或多聚化合物，末端結構單元不需要含有兩個官能團。例如，對於聚醯胺文庫，C-末端結構單元可包含氨基，但是羧基的存在是任選的。類似地，N末端的結構單元可包含羧基，但是不需要含有氨基。
分支寡聚或多聚化合物也可以合成，只要至少一個結構單元包含三個可與其他結構單元反應的官能團。本發明的文庫可包含直鏈分子、支鏈分子或它們的組合。
也可以應用如含有兩個或多個反應基團的支架結構單元，與只具有一個可用反應基團的其他結構單元組合，來構建文庫，例如在任何其他反應基團被保護或者不與該支架結構單元中存在的其他反應基團反應時。在一個實施方案中，例如，合成的分子可以表示為通式X(Y)n，其中X是支架結構單元；每個Y都是與X連接的結構單元，n是至少為2的整數，優選2至大約6的整數。在一個優選實施方案中，循環1的起始結構單元是支架結構單元。在通式X(Y)n的分子中，每個Y可以相同或不同，但是在典型文庫的大多數成員中，每個Y都將不同。
在一個實施方案中，本發明的文庫包含聚醯胺化合物。聚醯胺化合物可以由來源於任何胺基酸的結構單元組成，這些胺基酸包括20個天然存在的α-胺基酸，如丙氨酸(Ala；A)、甘氨酸(Gly；G)、天冬醯胺(Asn；N)、天冬氨酸(Asp；D)、穀氨酸(Glu；E)、組氨酸(His；H)、亮氨酸(Leu；L)、賴氨酸(Lys；K)、苯丙氨酸(Phe；F)、酪氨酸(Tyr；Y)、蘇氨酸(Thr；T)、絲氨酸(Ser；S)、精氨酸(Arg；R)、纈氨酸(Val；V)、穀氨醯胺(Gln；Q)、異亮氨酸(Ile；I)、半胱氨酸(Cys；C)、甲硫氨酸(Met；M)、脯氨酸(Pro；P)和色氨酸(Trp；W)，其中給出了每個胺基酸的三字母和單字母編碼。在它們的天然存在的形式中，上述每個胺基酸都以L-構型存在，除非另外指出，此處即這樣假設。但是在本方法中，也可以使用這些胺基酸的D-構型形式。這些D-胺基酸在此用小寫三字母或單字母編碼表示，即，ala(a)、gly(g)、leu(l)、gln(q)、thr(t)、ser(s)等。結構單元也可以來源於其他α-胺基酸，包括但不限於3-芳基丙氨酸，如萘基丙氨酸、苯基取代的苯丙氨酸，包括4-氟-、4-氯、4-溴和4-甲基苯丙氨酸；3-雜芳基丙氨酸，如3-吡啶基丙氨酸、3-噻吩基丙氨酸、3-喹啉基丙氨酸和3-咪唑基丙氨酸；鳥氨酸；瓜氨酸；高瓜氨酸；肌氨酸；高脯氨酸；高半胱氨酸；取代的脯氨酸，如羥脯氨酸和氟脯氨酸；脫氫脯氨酸；正亮氨酸；O-甲基酪氨酸；O-甲基絲氨酸；O-甲基蘇氨酸和3-環己基丙氨酸。上述每個胺基酸都可以以D-或L-構型使用。
結構單元也可以是非α-胺基酸的胺基酸，如α-氮雜胺基酸；β，γ，δ，ε-胺基酸，和N-取代的胺基酸，如N-取代的甘氨酸，其中N-取代基可以是例如取代的或未取代的烷基、芳基、雜芳基、芳烷基或雜芳烷基。在一個實施方案中，N-取代基是來自天然存在的或非天然存在的α-胺基酸的側鏈。
結構單元也可以是擬肽結構，如二肽、三肽、四肽或五肽模擬物。這樣的擬肽結構單元優選來源於氨醯基化合物，使得將這些結構單元添加到生長的聚(氨醯)基上的化學與用於其他結構單元的化學相同或相似。結構單元也可以是能夠形成與肽鍵電子等排的鍵的分子，形成包含肽骨架修飾的擬肽功能部分，如ψ[CH2S]、ψ[CH2NH]、ψ[CSNH2]、ψ[NHCO]、ψ[COCH2]和ψ[(E)或(Z)CH＝CH]。在以上使用的命名中，ψ表示不存在醯胺鍵。代替醯胺基的結構在括號內指出。
在一個實施方案中，本發明提供一種合成化合物的方法，該化合物包含或由與編碼寡核苷酸可操作連接的功能部分組成。該方法包括下列步驟(1)提供由包含n個結構單元的起始功能部分組成的起始化合物，其中n是1或大於1的整數，其中該起始功能部分含有至少一個反應基團，並且其中該起始功能部分與編碼n個結構單元的起始寡核苷酸可操作連接；(2)將該起始化合物與包含至少一個互補反應基團的結構單元反應，其中該至少一個互補反應基團與步驟(1)的反應基團互補，反應條件適合所述反應基團與互補反應基團反應形成共價鍵；(3)將起始寡核苷酸與引入寡核苷酸反應，反應條件適合所述引入寡核苷酸與起始寡核苷酸連接，並存在催化所述起始寡核苷酸與引入寡核苷酸連接的酶，從而產生包含功能部分或由該功能部分組成的分子，該功能部分含有n+1個結構單元，並且與編碼寡核苷酸可操作連接。如果步驟(3)的功能部分包含反應基團，則步驟1-3可以重複一次或多次，從而形成循環1至i，其中i是2或大於2的整數，循環s-1的步驟(3)的產物成為循環s的步驟(1)的起始化合物，其中s是i或更小的整數。在每個循環中，一個結構單元添加到生長的功能部分上，並且編碼新結構單元的一個寡核苷酸序列添加到生長的編碼寡核苷酸上。
在一個優選實施方案中，每個單個結構單元與不同的寡核苷酸相聯，使得在特定循環中添加的寡核苷酸中的核苷酸序列標識在同一循環中添加的結構單元。
結構單元的偶聯和寡核苷酸的連接通常在相似濃度的起始材料和試劑中發生。例如，為了使結構單元有效偶聯，優選約為微摩爾至毫摩爾例如約10μM至約10mM的反應物濃度。
在某些實施方案中，該方法在步驟(2)之後進一步包括清除任何未反應的起始功能部分的步驟。清除特定循環中任何未反應的起始功能部分防止了該循環的起始功能部分與後一循環中添加的結構單元反應。這樣的反應可導致產生丟失了一個或多個結構單元的功能部分，可能產生對應於特定寡核苷酸序列的一系列功能部分結構。這種清除可以通過任何剩餘的起始功能部分與可與步驟(2)的反應基團反應的化合物進行反應來實現。優選地，清除化合物與步驟(2)的反應基團快速反應，並且不含能夠與後一循環中添加的結構單元反應的另外的反應基團。例如，在步驟(2)的反應基團是氨基的化合物合成中，適合的清除化合物是N-羥基琥珀醯亞胺酯，如乙酸N-羥基琥珀醯亞胺酯。
在另一實施方案中，本發明提供一種製備化合物文庫的方法，其中每個化合物都包含功能部分，該功能部分包含兩個或多個結構單元殘基，並且與寡核苷酸可操作連接。在一個優選實施方案中，每個分子中存在的寡核苷酸提供了足以鑑別該分子內的結構單元和任選地結構單元添加順序的信息。在該實施方案中，本發明的方法包括一種合成化合物文庫的方法，其中該化合物包含功能部分，該功能部分包括兩個或多個結構單元，並且與標識該功能部分結構的寡核苷酸可操作連接。該方法包括步驟(1)提供包含m種起始化合物的溶液，其中m是1或大於1的整數，其中起始化合物由包含n個結構單元的功能部分組成，其中n是1或大於1的整數，該功能部分與標識該n個結構單元的起始寡核苷酸可操作連接；(2)將步驟(1)的溶液分配到至少r個反應容器中，其中r是2或大於2的整數；(3)將每個部分與r個結構單元之一反應，從而產生r個等份，包含由功能部分組成的化合物，該功能部分包含n+1個結構單元，並且與起始寡核苷酸可操作連接；(4)將步驟(3)的r個部分中的每一個與一組r個不同引入寡核苷酸之一反應，反應條件適合所述引入寡核苷酸與起始寡核苷酸發生酶連接，從而產生r個部分，包含由功能部分組成的分子，該功能部分包含n+1個結構單元，並且與編碼該n+1個結構單元的延長的寡核苷酸可操作連接。任選地，該方法可進一步包括步驟(5)重新組合步驟(4)中產生的r個部分，從而產生包含由功能部分組成的分子的溶液，該功能部分包含n+1個結構單元，並且與編碼該n+1個結構單元的延長的寡核苷酸可操作連接。步驟(1)至(5)可以進行一次或多次，以產生循環1至i，其中i是2或大於2的整數。在循環s+1中，其中s是i-1或更小的整數，步驟(1)的含有m種起始化合物的溶液是循環s的步驟(5)的溶液。同樣，循環s+1的步驟(1)的起始化合物是循環s的步驟(4)的產物。
優選地，在文庫合成的每個循環中將步驟(2)的溶液分成r個部分。在該實施方案中，每個部分與獨特結構單元反應。
在本發明的方法中，結構單元和引入寡核苷酸的添加順序不是關鍵，分子合成的步驟(2)和(3)，和文庫合成中的步驟(3)和(4)可以顛倒，即在添加新結構單元之前，引入寡核苷酸可以與起始寡核苷酸連接。在某些實施方案中，可以同時進行這兩個步驟。
在某些實施方案中，該方法在步驟(2)之後進一步包括清除任何未反應的起始功能部分的步驟。清除特定循環中任何未反應的起始功能部分防止了該循環的起始功能部分與後一循環中添加的結構單元反應。這樣的反應可導致產生丟失了一個或多個結構單元的功能部分，可能產生對應於特定寡核苷酸序列的一系列功能部分結構。這種清除可以通過任何剩餘的起始功能部分與可與步驟(2)的反應基團反應的化合物進行反應來實現。優選地，清除化合物與步驟(2)的反應基團快速反應，並且不含能夠與後一循環中添加的結構單元反應的另外的反應基團。例如，在步驟(2)的反應基團是氨基的化合物合成中，適合的清除化合物是N-羥基琥珀醯亞胺酯，如乙酸N-羥基琥珀醯亞胺酯。
在一個實施方案中，通過評價候選結構單元與適當互補官能團在用於合成文庫的條件下反應的能力，從一組候選結構單元中選擇文庫合成中使用的結構單元。然後可以選擇在這些條件下顯示適當反應性的結構單元，用於引入文庫中。任選地可以純化特定循環的產物。當循環是中間循環時，即，最終循環之前的任何循環時，這些產物是中間產物，可以在下一循環開始前純化。如果該循環是最後一次循環，則該循環的產物是終產物，可以在該化合物的任何應用前純化。該純化步驟可以例如除去未反應的或過量的反應物和用於寡核苷酸連接的酶。可以使用適合將產物與溶液中存在的其他物質進行分離的任何方法，包括液相色譜，如高效液相色譜(HPLC)，和用合適的共溶劑如乙醇沉澱。合適的純化方法依賴於產物的性質和用於合成的溶劑系統。
反應優選地在水溶液如緩衝水溶液中進行，但是也可以在與結構單元、寡核苷酸、中間產物和終產物的溶解性質和用於催化寡核苷酸連接的酶相匹配的混合水/有機介質中進行。
應當理解，上述方法中特定循環產生的化合物的理論數目是該循環中使用的不同起始化合物的數目m與循環中添加的不同結構單元的數目r的積。循環中產生的不同化合物的實際數目可以高達r和m的積(r×m)，但是如果某些結構單元與某些其他結構單元的反應性有差異的話，則可能較低。例如，向特定起始化合物上添加特定結構單元的動力學可能是，在合成循環的時間尺度上，可能產生很少的反應產物，甚至不產生產物。
在某些實施方案中，在循環1之前、最後一次循環之後或任意兩次循環之間加入通用結構單元。例如，當功能部分是聚醯胺時，可以在最後一次循環後加入通用N-末端加帽結構單元。也可以在任意兩個循環之間引入通用結構單元，例如添加官能團，如炔基或疊氮基，它們可以在文庫合成後例如通過環化用來修飾功能部分。
如此處所用的術語「可操作連接」是指兩個化學結構以一種方式連接在一起，使得它們經受預期的各種操作後仍保持連接。一般來說，功能部分和編碼寡核苷酸通過合適的連接基團共價連接。該連接基團是具有寡核苷酸連接部位和功能部分連接部位的二價部分。例如，當功能部分是聚醯胺化合物時，該聚醯胺化合物可以與連接基團在其N-末端、C-末端或通過一個側鏈上的官能團連接。該連接基團足以通過至少一個原子，優選一個以上原子，如至少兩個、至少三個、至少四個、至少五個或至少六個原子，分隔聚醯胺化合物和寡核苷酸。優選地，該連接基團具有充分的柔性，可使聚醯胺化合物與靶分子以不依賴於該寡核苷酸的方式結合。
在一個實施方案中，連接基團與聚醯胺化合物的N-末端和寡核苷酸的5』-磷酸基連接。例如，連接基團可以來源於在一個末端上含有活化羧基而在另一末端上含有活化酯的連接基團前體。連接基團前體與N-末端氮原子的反應將形成一個醯胺鍵，將該連接基團與聚醯胺化合物或N-末端結構單元連接在一起，而連接基團前體與寡核苷酸的5』-羥基的反應將導致寡核苷酸與連接基團通過酯鍵連接。連接基團可包括，例如聚亞甲基鏈，如-(CH2)n-鏈，或聚(乙二醇)鏈，如-(CH2CH2O)n鏈，其中在兩種情況中，n都是1至約20的整數。優選地，n為2至約12，更優選約4至約10。在一個實施方案中，連接基團包括環己基(-(CH2)6-)。
當結構單元是胺基酸殘基時，得到的功能部分是聚醯胺。可以利用用於形成醯胺鍵的任何合適的化學方法將胺基酸偶聯。優選地，胺基酸結構單元的偶聯在與寡核苷酸的酶連接相匹配的條件下進行，例如在中性或接近中性的pH和水溶液中進行。在一個實施方案中，聚醯胺化合物以C-末端到N-末端的方向合成。在該實施方案中，第一個，或者C-末端的結構單元在其羧基處與寡核苷酸通過合適的連接基團連接。第一個結構單元與第二個結構單元反應，第二個結構單元優選具有活化的羧基和受到保護的氨基。可以使用適合溶液相醯胺鍵形成的任何活化/保護基團策略。例如，合適的活化羧基類型包括醯氟(美國專利號5,360,928，在此全文引用作為參考)、對稱酸酐和N-羥基琥珀醯亞胺酯。如本領域所知，通過與合適的活化化合物反應，醯基也可以原位活化。合適的活化化合物包括二環己基碳二亞胺(DCC)、二異丙基碳二亞胺(DIC)、1-乙氧羰基-2-乙氧基-1，2-二氫喹啉(EEDQ)、1-乙基-3-(3-二甲基氨丙基)碳二亞胺鹽酸鹽(EDC)、正丙烷-膦酸酐(PPA)、N，N-二(2-氧-3- 唑烷基)亞氨基-磷醯氯(BOP-Cl)、溴-三-吡咯烷基磷六氟磷酸(PyBrop)、二苯基磷醯基疊氮化物(DPPA)、Castro′s試劑(BOP，PyBop)、O-苯並三唑基-N，N，N′，N′-四甲基脲鹽(HBTU)、二乙基磷醯氰(DEPCN)、2，5-聯苯基-2，3-二氫-3-氧-4-羥基-噻吩二氧化物(Steglich′s試劑；HOTDO)、1，1′-羰基-二咪唑(CDI)和4-(4，6-二甲氧基-1，3，5-三嗪-2-基)-4-甲基嗎啉氯(DMT-MM)。偶聯試劑可以單獨使用或者與添加劑如N，N-二甲基-4-氨基吡啶(DMAP)、N-羥基-苯並三唑(HOBt)、N-羥基苯並三嗪(HOOBt)、N-羥基琥珀醯亞胺(HOSu)、N-羥基氮雜苯並三唑(HOAt)、氮雜苯並三唑基-四甲基脲鹽(HATU，HAPyU)或2-羥基吡啶組合使用。在某些實施方案中，文庫的合成需要使用兩個或多個活化策略，以能夠使用結構上多樣化的一組結構單元。對於每個結構單元，本領域技術人員能夠確定合適的活化策略。
N末端保護基可以是與該方法的條件相匹配的任何保護基，例如，適合溶液相合成條件的保護基。一種優選的保護基是芴甲氧羰基(「Fmoc」)。氨醯基結構單元側鏈上的任何潛在反應性官能團也可能需要適當保護。優選地，側鏈保護基與N末端保護基正交，即，在不同於除去N末端保護基所需條件的條件下除去該側鏈保護基。合適的側鏈保護基包括硝基藜蘆基，它可以用來既保護側鏈羧基又保護側鏈氨基。另外一種合適的側鏈胺保護基是N-戊-4-烯醯基。
結構單元可以在摻入功能部分後修飾，例如，通過涉及一個或多個結構單元上的官能團的適當反應進行。結構單元修飾可以在添加最後一個結構單元後發生，或者在功能部分合成的任一中間點發生，例如，在合成過程的任一循環後發生。當合成本發明的雙功能分子文庫時，可以對整個文庫或文庫的一部分進行結構單元修飾，從而提高文庫的複雜程度。合適的結構單元修飾反應包括可以在與功能部分和編碼寡核苷酸相匹配的條件下進行的那些反應。這樣的反應的例子包括氨基或羥基的醯化和磺化、氨基的烷基化、羧基的酯化或硫酯化、羧基的醯胺化、烯的環氧化和本領域公知的其他反應。當功能部分包括含有炔或疊氮官能團的結構單元時，可以利用疊氮/炔的環加成反應衍生化該結構單元。例如，包含炔的結構單元可與有機疊氮化物反應，或者包含疊氮的結構單元可與炔反應，在任一種情況下都形成三唑。結構單元修飾反應可以在添加最後一個結構單元後發生，或者在合成過程的中間點處發生，並且能夠用來向功能部分上添加多種化學結構，包括碳水化合物、金屬結合部分和用於靶向某些生物分子或組織類型的結構。
在另一個實施方案中，功能部分包含一系列直鏈結構單元，該直鏈系列利用適當的反應環化。例如，如果直鏈排列的至少兩個結構單元包括巰基，則巰基可以氧化形成二硫鍵，從而環化該直鏈系列。例如，功能部分可以是包含兩個或多個L或D-半胱氨酸和/或L或D-高半胱氨酸部分的寡肽。結構單元也可以包含能夠一起反應環化直鏈系列的其他官能團，如羧基和氨基或羥基。
在一個優選實施方案中，直鏈系列中的一個結構單元包含炔基，而直鍵系列中的另一個結構單元包含疊氮基。可以誘導疊氮基和炔基通過環加成作用反應，導致形成大環結構。在圖9所示的實施例中，功能部分是在C末端包含炔丙基甘氨酸結構單元而在N末端包含疊氮基乙醯基的多肽。炔基與疊氮基在適當條件下的反應導致環狀化合物的形成，包括大環內的三唑結構。對於文庫的情況，在一個實施方案中，文庫的每個成員都包含含炔和疊氮基的結構單元，並且可以以這種方式環化。在第二個實施方案中，文庫的所有成員都包含含炔和疊氮基的結構單元，但是只有文庫的一部分環化。在第三個實施方案中，只有某些功能部分包含含炔和疊氮基的結構單元，並且只有這些分子環化。在上述第二個和第三個實施方案中，該文庫在環加成反應後既包含環狀功能部分也包含直鏈功能部分。
利用酶法連接寡核苷酸。在一個實施方案中，起始結構單元與起始寡核苷酸可操作連接。在第二結構單元與起始結構單元偶聯之前或之後，標識第二結構單元的第二寡核苷酸序列與起始寡核苷酸連接。用於連接起始寡核苷酸序列和引入寡核苷酸序列的方法在圖1和圖2中描述。在圖1中，起始寡核苷酸是雙鏈，一條鏈包含與第二寡核苷酸的一個末端互補的突出端序列，並且使第二寡核苷酸接觸起始寡核苷酸。優選地，起始寡核苷酸的突出序列和第二寡核苷酸的互補序列都為至少約4個鹼基；更優選地兩個序列長度相同。可以用合適的酶將起始寡核苷酸和第二寡核苷酸連接起來。如果起始寡核苷酸在一條鏈(「頂鏈」)的5』末端與第一結構單元連接，則與該頂鏈互補的鏈(「底鏈」)將在其5』末端包含突出端序列，第二寡核苷酸將在其5』末端包含互補序列。在第二寡核苷酸連接後，可以添加與第二寡核苷酸的序列互補的一條鏈，其位於突出端互補序列的3』方向，並且包含另外的突出端序列。
在一個實施方案中，寡核苷酸如圖2所示延長。定位與生長的功能部分結合的寡核苷酸和引入寡核苷酸，用於利用「夾板」序列連接，該序列包括與起始寡核苷酸的3』末端互補的區域和與引入寡核苷酸的5』末端互補的區域。夾板使寡核苷酸的5』末端靠近引入寡核苷酸的3』末端，並且利用酶連接完成連接。在圖2所示的實施例中，起始寡核苷酸由16個核鹼基組成，夾板與3』末端的6個鹼基互補。引入寡核苷酸由12個核鹼基組成，夾板與5』末端的6個鹼基互補。夾板的長度和互補區的長度不是關鍵的。但是，互補區應當足夠長，以便在連接條件下能夠形成穩定的二聚體，而不是在終分子中產生過大的編碼核苷酸。互補區的長度優選為約4個鹼基至約12個鹼基，更優選約5個鹼基至約10個鹼基，最優選約5個鹼基至約8個鹼基。
在一個實施方案中，起始寡核苷酸是雙鏈，且兩條鏈共價連接。共價連接兩條鏈的一種手段如圖3所示，其中利用連接部分連接兩條鏈和功能部分。該連接部分可以是任何化學結構，其包含適合與結構單元反應的第一官能團，適合與寡核苷酸的3』-末端反應的第二官能團，和適合與寡核苷酸的5』-末端反應的第三官能團。優選地，第二和第三官能團的定向使兩條寡核苷酸鏈為相對的方向，這可使兩條鏈雜交。例如，連接部分可以具有通式結構(I)
其中A是能夠與結構單元形成共價鍵的官能團，B是能夠與寡核苷酸的5』-末端形成鍵的官能團，C是能夠與寡核苷酸的3』-末端形成鍵的官能團。D、F和E是將官能團A、C和B與S連接的化學基團，S為核心原子或支架。優選地，D、E和F各自獨立地為原子鏈，如亞烷基鏈或低聚(乙二醇)鏈，D、E和F可以相同或不同，並且優選地有效地使兩個寡核苷酸雜交及功能部分合成。在一個實施方案中，三價連接體具有結構在該實施方案中，NH基可用於連接結構單元，而末端磷酸基可用於連接寡核苷酸。
在起始寡核苷酸是雙鏈的實施方案中，引入寡核苷酸也是雙鏈。如圖3所示，起始寡核苷酸的一條鏈可以比另一條長，提供突出端序列。在該實施方案中，引入寡核苷酸包括與起始寡核苷酸的突出端序列互補的突出端序列。兩個互補突出端序列的雜交使引入寡核苷酸進入與起始寡核苷酸連接的位置。這種連接可以用DNA或RNA連接酶酶促進行。引入寡核苷酸和起始寡核苷酸的突出端序列優選地長度相同，並且由兩個或多個核苷酸，優選地2個至約10個核苷酸，更優選2個至約6個核苷酸組成。在一個優選的實施方案中，引入寡核苷酸是在每一末端都有一個突出端序列的雙鏈寡核苷酸。在一個末端處的突出端序列與起始寡核苷酸的突出端序列互補，而在引入寡核苷酸與起始寡核苷酸連接後，在另一末端處的突出端序列成為下一循環的起始寡核苷酸的突出端序列。在一個實施方案中，三個突出端序列長度均為2至6個核苷酸，引入寡核苷酸的編碼序列長度為3至10個核苷酸，優選3至6個核苷酸。在一個特定實施方案中，突出端序列的長度均為2個核苷酸，編碼序列的長度為5個核苷酸。
在圖4所示的實施方案中，引入鏈在其3』末端具有與起始寡核苷酸的3』末端互補的區域，在兩條鏈的5』末端留有突出端。5』末端可以利用如DNA聚合酶如vent聚合酶補平，產生雙鏈的延長寡核苷酸。該寡核苷酸的底鏈可以除去，並利用相同的方法向頂鏈的3』末端添加另外的序列。
連續添加識別每個連續結構單元的寡核苷酸導致形成編碼寡核苷酸標籤。在本發明方法的一個實施方案中，連續寡核苷酸標籤可以通過酶連接偶聯，產生編碼寡核苷酸。
酶催化的寡核苷酸連接可以用具有連接核酸片段能力的任何酶進行。酶的例子包括連接酶、聚合酶和拓撲異構酶。在本發明的特定實施方案中，應用DNA連接酶(EC 6.5.1.1)、DNA聚合酶(EC 2.7.7.7)、RNA聚合酶(EC 2.7.7.6)或拓撲異構酶(EC 5.99.1.2)連接寡核苷酸。每個EC類別中所含的酶可見於如Bairoch(2000)Nucleic Acids Research 28304-5所述。
在一個優選實施方案中，在本發明方法中使用的寡核苷酸是寡脫氧核苷酸，用來催化寡核苷酸連接的酶是DNA連接酶。為了在連接酶存在下發生連接，即為了在兩個寡核苷酸之間形成磷酸二酯鍵，一個寡核苷酸必須具有游離的5』磷酸基，而另一個寡核苷酸必須具有游離的3』羥基。可以在本發明的方法中使用的DNA連接酶的例子包括T4DNA連接酶、Taq DNA連接酶、T4RNA連接酶、DNA連接酶(大腸桿菌)(均獲自如New England Biolabs，MA)。
本領域技術人員應當理解，用於連接的各種酶在特定條件如溫度、緩衝液濃度、pH和時間下具有最佳活性。這些條件中的每一個都可以調節，例如根據製造商說明進行調節，以獲得寡核苷酸標籤的最佳連接。
引入寡核苷酸可以是任何需要的長度，但優選長度為至少三個核鹼基。更優選地，引入寡核苷酸的長度為4個或更多的核鹼基。在一個實施方案中，引入寡核苷酸的長度為3至約12個核鹼基。本發明文庫中的分子的寡核苷酸優選具有共同的末端序列，如本領域所知，該序列可以用作PCR的引物。這種共同末端序列可以在文庫合成的最後一個循環中引入作為引入寡核苷酸的末端，或者可以在文庫合成後添加，例如利用此處公開的酶連接方法添加。
本發明方法的一個優選實施方案如圖5所示。該過程開始於在5』末端與連接體連接的合成DNA序列，該連接體終止於氨基。在步驟1中，在Tris緩衝液中在夾板DNA鏈、DNA連接酶和二硫蘇糖醇的存在下，該起始DNA序列與引入DNA序列連接。產生標記DNA序列，該序列然後可以直接用於下一步驟中，或者在進行下一步驟之前例如利用HPLC或乙醇沉澱純化。在步驟2中，標記DNA與保護的活化胺基酸反應，在該實施例中，與Fmoc-保護的胺基酸氟化物反應，產生保護的胺基酸-DNA偶聯物。在步驟3中，例如在哌啶的存在下將保護的胺基酸-DNA偶聯物脫保護，任選地例如通過HPLC或乙醇沉澱純化產生的脫保護的偶聯物。脫保護的偶聯物是第一合成循環的產物，並且成為第二循環的起始材料，第二循環向脫保護偶聯物的游離氨基上添加第二胺基酸殘基。
在利用PCR擴增所選分子的編碼寡核苷酸的實施方案中，該編碼寡核苷酸優選地包括PCR引物序列。例如，在合成的第一循環之前，起始寡核苷酸中可以包含PCR引物序列，或者可以與第一引入寡核苷酸一起包含。編碼寡核苷酸在編碼序列之後也可以包含加帽PCR引物序列。在文庫合成的最後一個循環後，該加帽序列可以與編碼寡核苷酸連接，或者可以包含在最後一個循環的引入寡核苷酸中。在引入寡核苷酸包含PCR引物序列的情況中，這些引入寡核苷酸優選地明顯長於在其他循環中添加的引入寡核苷酸，因為它們既包含編碼序列也包含PCR引物序列。
對於在添加最後的結構單元和最後的引入寡核苷酸後添加加帽序列的情況，如此處所述的文庫的合成包括將加帽序列與編碼寡核苷酸連接的步驟，使基本所有文庫成員的寡核苷酸部分終止於包含PCR引物序列的序列中。適合在本發明的文庫中使用的PCR引物序列在本領域中公知；合適的引物和方法例如描述在Innis等人，編，PCR ProtocolsAGuide to Methods and Applications，San DiegoAcademic Press(1990)中，其內容在此全文引用作為參考。優選地，通過與作為最後合成循環的產物的組合組分連接，添加該加帽序列。加帽序列可以用文庫構建中使用的酶法添加。
如上所述，作為本發明方法一部分的寡核苷酸標籤的核苷酸序列可以用聚合酶鏈反應(PCR)確定。
寡核苷酸標籤由標識構成如此處所述功能部分的結構單元的多核苷酸組成。寡核苷酸標籤的核酸序列通過對寡核苷酸標籤進行如下PCR反應來測定。適當樣品與PCR引物對接觸，該引物對的每個成員具有預先選擇的核苷酸序列。該PCR引物對通過與編碼寡核苷酸標籤上的PCR引物結合部位雜交，能夠啟動引物延伸反應。該PCR引物結合部位優選地設計在編碼寡核苷酸標籤內部。例如，PCR引物結合部位可以摻入起始寡核苷酸標籤內，而第二PCR引物結合部位可以位於最終寡核苷酸標籤內。或者，第二PCR引物結合部位可以摻入如此處所述的加帽序列中。在優選實施方案中，該PCR引物結合部位的長度至少為約5、7、10、13、15、17、20、22或25個核苷酸。
通過將PCR引物對，優選預定量的該引物對，與編碼寡核苷酸標籤的核酸，優選預定量的該核酸，在PCR緩衝液中混合，形成PCR反應混合物，進行PCR反應。將該混合物熱循環一定的循環數，該循環數一般預先確定，足以形成PCR反應產物。足夠量的產物是能夠以足以進行DNA序列測定的量分離的產物。
PCR一般通過熱循環進行，即在一個溫度範圍內重複地提高和降低PCR反應混合物的溫度，該範圍的下限為約30℃至約55℃，上限為約90℃至約100℃。提高和降低可以是連續的，但優選是階段的，在有利於多核苷酸合成、變性和雜交的各個溫度下具有相對溫度穩定的時間段。
PCR反應用任何適當的方法進行。通常在緩衝的水溶液即PCR緩衝液中發生，優選為pH 7-9。優選含有摩爾過量的引物。為了提高該方法的效率，優選較大的摩爾過量。
PCR緩衝液還含有脫氧核糖核苷酸三磷酸(多核苷酸合成底物)dATP、dCTP、dGTP和dTTP，和聚合酶，一般是熱穩定的聚合酶，都是足以進行引物延伸(多核苷酸合成)反應的量。得到的溶液(PCR混合物)加熱至約90℃-100℃約1-10分鐘，優選1-4分鐘。該加熱階段之後將溶液冷卻至54℃，該溫度是引物雜交優選的。合成反應可以在一定溫度下發生，該溫度的範圍從室溫到高於該溫度聚合酶(誘導劑)即不再有效作用的溫度。因此，例如，如果使用DNA聚合酶，則溫度通常不高於約40℃。重複該熱循環，直到產生所需量的PCR產物。一種典型的PCR緩衝液每100微升緩衝液含有下列試劑50mM KCl；10mMTris-HCl pH 8.3；1.5mM MgCl2；0.001％(wt/vol)明膠，200μM dATP；200μM dTTP；200μM dCTP；200μM dGTP；和2.5單位棲熱水生菌(Thermus aquaticus)(Taq)DNA聚合酶I。
用於延伸引物序列的合適的酶包括例如大腸桿菌DNA聚合酶I、Taq DNA聚合酶、大腸桿菌DNA聚合酶I的Klenow片段、T4DNA聚合酶、其他可以使用的DNA聚合酶、逆轉錄酶，和其他酶，包括熱穩定的酶，其有利於以適當的方式組合核苷酸，形成與每條核酸鏈互補的引物延伸產物。合成通常開始於每個引物的3′末端，並沿著模板鏈以5′方向前進，直到合成終止，產生不同長度的分子。
新合成的DNA鏈與其互補鏈形成雙鏈分子，該雙鏈分子可以在分析方法的後續步驟中使用。
PCR擴增方法在美國專利號4,683,192、4,683,202、4,800,159和4,965,188中詳細描述，並且至少在PCR TechnologyPrinciples andApplications for DNA Amplification，H.Erlich，ed.，Stockton Press，NewYork(1989)；和PCR ProtocolsA Guide to Methods and Applications，Innis等人，編，Academic Press，San Diego，Calif.(1990)中詳細描述。上述所有文獻的內容在此引用作為參考。
如此處所用的術語「多核苷酸」用於引物、探針和將要通過引物延伸合成的核酸片段或區段時，定義為由兩個或多個、優選三個以上脫氧核糖核苷酸組成的分子。
如此處所用的術語「引物」是指從核酸限制性消化物中純化的或合成產生的多核苷酸，當置於誘導合成與核酸鏈互補的引物延伸產物的條件下時，即在核苷酸和聚合試劑如DNA聚合酶、逆轉錄酶等的存在下，以及在合適的溫度和pH下，它能夠作為核酸合成的起點。為了效率最高，引物優選是單鏈，但是也可以是雙鏈形式。如果是雙鏈，則在用來製備延伸產物之前首先處理該引物，使它與互補鏈分開。優選地，引物是一種聚脫氧核糖核苷酸。引物必須足夠長，以在聚合試劑存在下引發延伸產物的合成。引物的確切長度取決於許多因素，包括溫度和引物來源。
此處所用的引物選擇為與所要擴增的每個特定序列的不同鏈「基本」互補。意思是引物必須充分互補，以便與相應的模板鏈非隨機地雜交。因此，引物序列可能反映或者可能不反映模板的準確序列。
多核苷酸引物可以用任何合適的方法製備，例如Narang等人，(1979)Meth.Enzymol.，6890；美國專利號4,356,270，美國專利號4,458,066，美國專利號4,416,988，美國專利號4,293,652；和Brown等人，(1979)Meth.Enzymol.，68109所述的磷酸三酯或磷酸二酯法。上述所有文獻的內容在此引用作為參考。
一旦擴增出編碼寡核苷酸標籤，即可應用核酸序列分析確定該標籤的序列，並最終確定選擇的分子的組成，核酸序列分析是用於測定核苷酸序列的眾所周知的方法。核酸序列分析通過以下方法的組合進行(a)基於探針鏈與其互補靶標雜交或變性的生理化學技術，和(b)與聚合酶的酶反應。
本發明進一步涉及可以用本發明的方法製備的化合物，和這樣的化合物的集合，其作為分離的物質或組合形成化學結構文庫。本發明的化合物包括下式的化合物
其中X是包含一個或多個結構單元的功能部分，Z是在其3』末端與B連接的寡核苷酸，Y是在其5』末端與C連接的寡核苷酸。A是與X形成共價鍵的官能團，B是與Z的3』-末端形成鍵的官能團，C是與Y的5』-末端形成鍵的官能團。D、F和E是將官能團A、C和B與S連接的化學基團，S是核心原子或支架。優選地，D、E和F各自獨立地是原子鏈，如亞烷基鏈或低聚(乙二醇)鏈，D、E和F可以相同或不同，優選地有效地使兩個寡核苷酸雜交以及功能部分合成。
優選地，Y和Z基本互補，並且在化合物中定向，從而能夠在合適條件下發生Watson-Crick鹼基配對和雙鏈體形成。Y和Z的長度相同或不同。優選地，Y和Z的長度相同，或者Y和Z之一比另一個長1至10個鹼基。在一個優選實施方案中，Y和Z各自為10個或更多鹼基的長度，並且具有10個或更多個鹼基對的互補區。更優選地，Y和Z在其全長上基本互補，即它們每十個鹼基對具有不超過1個錯配。最優選地，Y和Z在其全長上互補，即，除了Y或Z上的任何突出端區域之外，這些鏈通過Watson-Crick鹼基配對雜交，在它們的全長上沒有錯配。
S可以是單一原子或分子支架。例如，S可以是碳原子、硼原子、氮原子或磷原子，或多原子支架，如磷酸基或環基，如環烷基、環烯基、雜環烷基、雜環烯基、芳基或雜芳基。在一個實施方案中，連接體是如下結構的基團
其中n、m和p各自獨立地是1至約20的整數，優選2至8，更優選3至6。在一個特定實施方案中，連接體具有以下所示的結構。
在一個實施方案中，本發明的文庫包括由功能部分組成的分子，該功能部分由結構單元組成，其中每個功能部分都與編碼寡核苷酸可操作連接。編碼寡核苷酸的核苷酸序列指示功能部分中存在的結構單元，在一些實施方案中，指示結構單元的連接性或排列。本發明具有以下優點，用來構建功能部分及用來構建寡核苷酸標籤的方法可以在相同的反應介質中，優選地在水性介質中進行，從而與現有技術的方法相比簡化了製備文庫的方法。在寡核苷酸連接步驟和結構單元添加步驟都可以在水性介質中進行的某些實施方案中，每個反應都具有不同的最適pH。在這些實施方案中，結構單元添加反應可以在合適的含水緩衝液中在合適的pH和溫度下進行。然後緩衝液可以用提供適於寡核苷酸連接之pH的含水緩衝液替換。
本發明的方法的一個優點是它們能夠用來製備含有大量化合物的文庫。利用公知方法如聚合酶鏈反應(「PCR」)擴增編碼寡核苷酸序列的能力意味著，即使回收的拷貝較少，也能夠鑑定選擇的分子。這允許實際應用極大的文庫，其由於高度複雜性，要麼包含相對較少拷貝的任何特定文庫成員，要麼需要使用極大的體積。例如，由108個獨特結構組成，其中每個結構具有1×1012個拷貝(約1皮摩爾)的文庫，需要約100L的1μM有效濃度的溶液。對於相同的文庫，如果每個成員有1,000,000個拷貝，則在1μM有效濃度下需要的體積為100μL。
在一個優選實施方案中，文庫包含約103至約1015個拷貝的每個文庫成員。假定文庫成員之間的合成效率有差異，則不同文庫成員在任何特定文庫中可能具有不同的拷貝數。因此，儘管文庫中理論存在的每個成員的拷貝數可能相同，但是任何特定文庫成員的實際拷貝數與任何其他成員的拷貝數無關。更優選地，本發明的化合物文庫包括至少約105、106或107個拷貝的每個文庫成員，或基本上所有文庫成員。「基本上所有」文庫成員含意是至少約85％的文庫成員，優選至少約90％，更優選至少約95％的文庫成員。
優選地，文庫包含足夠拷貝數的每個成員，可對生物靶標進行多輪(即兩輪或兩輪以上)選擇，在最後一輪選擇後剩餘足夠數量的結合分子，使剩餘的分子的寡核苷酸標籤能夠擴增，因此能夠識別結合分子的功能部分。這種選擇方法的示意圖在圖6中顯示，其中1和2代表文庫成員，B是靶分子，X是與B可操作連接的部分，使得能夠從選擇介質中除去B。在該實例中，化合物1與B結合，而化合物2不與B結合。如第1輪所示，該選擇過程包括(I)在適合化合物1與B結合的條件下使包含化合物1和2的文庫接觸B-X；(II)除去未結合的化合物2，(III)從B上解離化合物1，並從反應介質中除去BX。第1輪的結果是相對於化合物2富含化合物1的分子集合。後續使用步驟I-III的幾輪導致化合物1相對於化合物2的進一步富集。儘管圖6顯示了3輪選擇，但是實際上可以使用任何輪數，例如1至10輪，以實現所需的結合分子相對於非結合分子的富集。
在圖6所示的實施方案中，在任何選擇輪數之後剩餘的化合物沒有擴增(更多拷貝的合成)。這樣的擴增可以產生與選擇後剩餘的化合物的相對量不一致的化合物的混合物。這種不一致是由於這一事實，即某些化合物可能比其他化合物更容易合成，因此可能在選擇後以與其存在不成比例的方式擴增。例如，如果化合物2比化合物1更容易合成，則第2輪後剩餘的分子的擴增將導致化合物2相對於化合物1的不成比例擴增，獲得的化合物的混合物具有更低的(如果有的話)化合物1相對於化合物2的富集。
在一個實施方案中，利用任何公知的固定技術將靶標固定在固體支持體上。固體支持體可以是，例如層析柱或膜中所含的水不溶性基質。編碼文庫可以加到層析柱中所含的水不溶性基質上。然後洗柱，除去非特異性結合物。然後通過改變pH、鹽濃度、有機溶劑濃度或其他方法，如與已知配體競爭靶標，使與靶標結合的化合物解離。
在另外一個實施方案中，靶標在溶液中游離，與編碼文庫溫育。通過大小分離步驟，如凝膠過濾或超濾，選擇性分離與靶標(在此也稱作「配體」)結合的化合物。在一個實施方案中，編碼化合物與靶生物分子的混合物通過大小排阻層析柱(凝膠過濾)，從未結合的化合物中分離任何配體-靶標複合物。將該配體-靶標複合物轉移到反相層析柱上，將配體與靶標解離。解離的配體然後通過PCR擴增和編碼寡核苷酸的序列分析進行分析。在靶標的固定可導致活性喪失的情況下，該方法特別有利。
一旦通過上述方法鑑定了單一配體，即可以應用各種水平的分析獲得結構-活性關係的信息，並指導配體親和力、特異性和生物活性的進一步優化。對於來源於同一支架的配體，可以利用三維分子模建鑑定這些配體共同的顯著結構特徵，從而產生可能在靶生物分子上共同部位結合的小分子配體家族。
可以應用多種篩選方法獲得對一個靶標具有高親和力而對於另一個密切相關的靶標具有顯著較弱親和力的配體。一種篩選策略是在平行實驗中鑑定兩個生物分子的配體，接著通過交叉參考對比排除共同的配體。在該方法中，每個生物分子的配體都可以如以上所述單獨鑑定。該方法與固定的靶生物分子和在溶液中游離的靶生物分子都匹配。
對於固定的靶生物分子，另外一種策略是增加一個預選步驟，以從文庫中排除與非靶生物分子結合的所有配體。例如，第一生物分子可以如上所述與文庫接觸。然後從形成的任何第一生物分子-配體複合物中分離不與第一生物分子結合的化合物。然後第二生物分子接觸不與第一生物分子結合的化合物。與第二生物分子結合的化合物可以如上所述鑑定，它們對於第二生物分子比對於第一生物分子具有顯著較高的親和力。
也可以使用通過上述方法鑑定的具有未知功能的生物分子的配體，來確定該生物分子的生物功能。這是有利的，因為儘管新的基因序列不斷鑑定，但是這些序列編碼的蛋白質的功能和這些蛋白質作為新藥發現及開發靶標的有效性難以確定，並且可能是應用基因組信息治療疾病的最大障礙。通過本發明所述方法獲得的靶標特異性配體可以在全細胞生物測定或適當的動物模型中應用，用於理解靶蛋白質的功能和靶蛋白質用於治療性幹預的有效性。該方法也可證實靶標特別適合小分子藥物發現。
在一個實施方案中，本發明的文庫中的一種或多種化合物鑑定為特定生物分子的配體。然後可以在體外試驗中評價這些化合物與生物分子結合的能力。優選地，合成結合化合物的功能部分，其不含寡核苷酸標籤或連接體部分，並且評價這些功能部分與生物分子結合的能力。
也可以用體外無細胞或基於細胞的試驗評價功能部分與生物分子結合對生物分子功能的影響。對於具有已知功能的生物分子，試驗可以包括比較在存在及不存在配體的情況下生物分子的活性，例如，通過直接測定活性，如酶活性，或者通過間接測定，例如該生物分子影響的細胞功能。如果該生物分子具有未知的功能，則表達該生物分子的細胞可以接觸配體，並且評價該配體對該細胞的生存力、功能、表型和/或基因表達的影響。這樣的體外試驗可以是，例如，細胞死亡測定、細胞增殖測定或病毒複製試驗。例如，如果該生物分子是病毒表達的蛋白質，則感染病毒的細胞可以與該蛋白質的配體接觸。然後可以評價該配體與蛋白質的結合對病毒生存力的影響。
利用本發明的方法鑑定的配體也可以在體內模型中或在人體內進行評價。例如，配體可以在產生該生物分子的動物或生物體中進行評價。可以測定動物或生物體在健康狀態(例如疾病進展)上產生的任何變化。
對於一種未知功能的生物分子，如蛋白質或核酸分子，與生物分子結合的配體對產生該生物分子的細胞或生物體的影響可以提供關於該生物分子生物功能的信息。例如，觀察到特定細胞過程在配體存在下受到抑制，指示該過程至少部分依賴於該生物分子的功能。
利用本發明的方法鑑定的配體也可以用作與與它們結合的生物分子的親和試劑。在一個實施方案中，利用這樣的配體實現生物分子的親和純化，例如，通過利用連接有一種或多種這樣的配體的固相對含有該生物分子的溶液進行層析。
通過下面的實施例進一步說明本發明，這些實施例不應視為限制。在本申請全文中引用的所有參考文獻、專利和公布的專利申請以及附圖和序列表的內容，都在此引用作為參考。
實施例實施例1具有大約105個成員的文庫的合成和表徵含有大約105個不同成員的文庫的合成使用下列試劑完成化合物1 脫氧核糖核苷酸的單字母密碼A＝腺苷C＝胞苷G＝鳥苷T＝胸苷結構單元前體
寡核苷酸標籤
序列標籤編號5』-PO4-GCAACGAAG(SEQ ID NO1)1.1ACCGTTGCT-PO3-5』(SEQ ID NO2)5』-PO3-GCGTACAAG(SEQ ID NO3)1.2ACCGCATGT-PO3-5』(SEQ ID NO4)5』-PO3-GCTCTGTAG(SEQ ID NO5)1.3ACCGAGACA-PO3-5』(SEQ ID NO6)5』-PO3-GTGCCATAG(SEQ ID NO7)1.4ACCACGGTA-PO3-5』(SEQ ID NO8)5』-PO3-GTTGACCAG(SEQ ID NO9)1.5ACCAACTGG-PO3-5』(SEQ ID NO10)5』-PO3-CGACTTGAC(SEQ ID NO11) 1.6CAAGTCGCA-PO3-5』(SEQ ID NO12)5』-PO3-CGTAGTCAG(SEQ ID NO13) 1.7ACGCATCAG-PO3-5』(SEQ ID NO14)5』-PO3-CCAGCATAG(SEQ ID NO15) 1.8ACGGTCGTA-PO3-5』(SEQ ID NO16)5』-PO3-CCTACAGAG(SEQ ID NO17) 1.9ACGGATGTC-PO3-5』(SEQ ID NO18)5』-PO3-CTGAACGAG(SEQ ID NO19) 1.10CGTTCAGCA-PO3-5』(SEQ ID NO20)5』-PO3-CTCCAGTAG(SEQ ID NO21) 1.11ACGAGGTCA-PO3-5』(SEQ ID NO22)5』-PO3-TAGGTCCAG(SEQ ID NO23) 1.12ACATCCAGG-PO3-5』(SEQ ID NO24)5』-PO3-GCGTGTTGT(SEQ ID NO25) 2.1
TCCGCACAA-PO3-5』(SEQ ID NO26)5』-PO3-GCTTGGAGT(SEQ ID NO27)2.2TCCGAACCT-PO3-5』(SEQ ID NO28)5』-PO3-GTCAAGCGT(SEQ ID NO29)2.3TCCAGTTCG-PO3-5』(SEQ ID NO30)5』-PO3-CAAGAGCGT(SEQ ID NO31)2.4TCGTTCTCG-PO3-5』(SEQ ID NO32)5』-PO3-CAGTTCGGT(SEQ ID NO33)2.5TCGTCAAGC-PO3-5』(SEQ ID NO34)5』-PO3-CGAAGGAGT(SEQ ID NO35)2.6TCGCTTCCT-PO3-5』(SEQ ID NO36)5』-PO3-CGGTGTTGT(SEQ ID NO37)2.7TCGCCACAA-PO3-5』(SEQ ID NO38)5』-PO3-CGTTGCTGT(SEQ ID NO39)2.8TCGCAACGA-PO3-5』(SEQ ID NO40)5』-PO3-CCGATCTGT(SEQ ID NO41)2.9TCGGCTAGA-PO3-5』(SEQ ID NO42)5』-PO3-CCTTCTCGT(SEQ ID NO43)2.10TCGGAAGAG-PO3-5』(SEQ ID NO44)5』-PO3-TGAGTCCGT(SEQ ID NO45)2.11TCACTCAGG-PO3-5』(SEQ ID NO46)5』-PO3-TGCTACGGT(SEQ ID NO47)2.12TCAGATTGC-PO3-5』(SEQ ID NO48)5』-PO3-GTGCGTTGA(SEQ ID NO49)3.1CACACGCAA-PO3-5』(SEQ ID NO50)5』-PO3-GTTGGCAGA(SEQ ID NO51)3.2
CACAACCGT-PO3-5』(SEQ ID NO52)5』-PO3-CCTGTAGGA(SEQ ID NO53)3.3CAGGACATC-PO3-5』(SEQ ID NO54)5』-PO3-CTGCGTAGA(SEQ ID NO55)3.4CAGACGCAT-PO3-5』(SEQ ID NO56)5』-PO3-CTTACGCGA(SEQ ID NO57)3.5CAGAATGCG-PO3-5』(SEQ ID NO58)5』-PO3-TGGTCACGA(SEQ ID NO59)3.6CAACCAGTG-PO3-5』(SEQ ID NO60)5』-PO3-TCAGAGCGA(SEQ ID NO61)3.7CAAGTCTCG-PO3-5』(SEQ ID NO62)5』-PO3-TTGCTCGGA(SEQ ID NO63)3.8CAAACGAGC-PO3-5』(SEQ ID NO64)5』-PO3-GCAGTTGGA(SEQ ID NO65)3.9CACGTCAAC-PO3-5』(SEQ ID NO66)5』-PO3-GCCTGAAGA(SEQ ID NO67)3.10CACGGACTT-PO3-5』(SEQ ID NO68)5』-PO3-GTAGCCAGA(SEQ ID NO69)3.11CACATCGGT-PO3-5』(SEQ ID NO70)5』-PO3-GTCGCTTGA(SEQ ID NO71)3.12CACAGCGAA-PO3-5』(SEQ ID NO72)5』-PO3-GCCTAAGTT(SEQ ID NO73)4.1CTCGGATTC-PO3-5』(SEQ ID NO74)5』-PO3-GTAGTGCTT(SEQ ID NO75)4.2CTCATCACG-PO3-5』(SEQ ID NO76)5』-PO3-GTCGAAGTT(SEQ ID NO77)4.3CTCAGCTTC-PO3-5』(SEQ ID NO78)
5』-PO3-GTTTCGGTT(SEQ ID NO79) 4.4CTCAAAGCC-PO3-5』(SEQ ID NO80)5』-PO3-CAGCGTTTT(SEQ ID NO81) 4.5CTGTCGCAA-PO3-5』(SEQ ID NO82)5』-PO3-CATACGCTT(SEQ ID NO83) 4.6CTGTATGCG-PO3-5』(SEQ ID NO84)5』-PO3-CGATCTGTT(SEQ ID NO85) 4.7CTGCTAGAC-PO3-5』(SEQ ID NO86)5』-PO3-CGCTTTGTT(SEQ ID NO87) 4.8CTGCGAAAC-PO3-5』(SEQ ID NO88)5』-PO3-CCACAGTTT(SEQ ID NO89) 4.9CTGGTGTCA-PO3-5』(SEQ ID NO90)5』-PO3-CCTGAAGTT(SEQ ID NO91) 4.10CTGGACTTC-PO3-5』(SEQ ID NO92)5』-PO3-CTGACGATT(SEQ ID NO93) 4.11CTGACTGCT-PO3-5』(SEQ ID NO94)5』-PO3-CTCCACTTT(SEQ ID NO95) 4.12CTGAGGTGA-PO3-5』(SEQ ID NO96)5』-PO3-ACCAGAGCC(SEQ ID NO97) 5.1AATGGTCTC-PO3-5』(SEQ ID NO98)5』-PO3-ATCCGCACC(SEQ ID NO99) 5.2AATAGGCGT-PO3-5』(SEQ ID NO100)5』-PO3-GACGACACC(SEQ ID NO101)5.3AACTGCTGT-PO3-5』(SEQ ID NO102)5』-PO3-GGATGGACC(SEQ ID NO103)5.4AACCTACCT-PO3-5』(SEQ ID NO104)
5』-PO3-GCAGAAGCC(SEQ ID NO105)5.5AACGTCTTC-PO3-5』(SEQ ID NO106)5』-PO3-GCCATGTCC(SEQ ID NO107)5.6AACGGTACA-PO3-5』(SEQ ID NO108)5』-PO3-GTCTGCTCC(SEQ ID NO109)5.7AACAGACGA-PO3-5』(SEQ ID NO110)5』-PO3-CGACAGACC(SEQ ID NO111)5.8AAGCTGTCT-PO3-5』(SEQ ID NO112)5』-PO3-CGCTACTCC(SEQ ID NO113)5.9AAGCGATGA-PO3-5』(SEQ ID NO114)5』-PO3-CCACAGACC(SEQ ID NO115)5.10AAGGTGTCT-PO3-5』(SEQ ID NO116)5』-PO3-CCTCTCTCC(SEQ ID NO117)5.11AAGGAGAGA-PO3-5』(SEQ ID NO118)5』-PO3-CTCGTAGCC(SEQ ID NO119)5.12AAGAGCATC-PO3-5』(SEQ ID NO120)1X連接酶緩衝液50mM Tris，pH 7.5；10mM二硫蘇糖醇；10mMMgCl2；2.5mM ATP；50mM NaCl。
10X連接酶緩衝液500mM Tris，pH 7.5；100mM二硫蘇糖醇；100mM MgCl2；25mM ATP；500mM NaCl。
循環1向12個PCR管的每一個中加入50μL 1mM化合物1的水溶液；75μL 0.80mM標籤1.1-1.12之一的溶液；15μL 10X連接酶緩衝液和10μL去離子水。將這些管加熱到95℃1分鐘，然後冷卻到16℃10分鐘。向每個管中加入在50μl 1X連接酶緩衝液中的5,000單位的T4DNA連接酶(2.5μL，2,000,000單位/mL溶液(New England Biolabs，目錄號M0202))，獲得的溶液在16℃下溫育16小時。
連接後，將樣品轉移到1.5ml Eppendorf管中，用20μL 5M NaCl水溶液和500μL冷(-20℃)乙醇處理，在-20℃下保持1小時。離心後，棄去上清液，用70％乙醇水溶液在-20℃下洗滌沉澱物。然後將每個沉澱物溶解於150μL 150mM硼酸鈉緩衝液，pH 9.4中。
在DMF中製備以分別0.25M的濃度含有結構單元前體BB1至BB12之一、N，N-二異丙基乙醇胺和O-(7-氮雜苯並三唑-1-基)-1，1，3，3-四甲基脲六氟磷酸的貯存液，並在室溫下攪拌20分鐘。向上述每個沉澱溶液中添加結構單元前體溶液，提供相對於連接體10倍過量的結構單元前體。攪拌獲得的溶液。20分鐘後向反應混合物中加入另外10個當量的結構單元前體，40分鐘後加入另外10個當量。DMF在反應混合物中的終濃度為22％。然後在4℃下攪拌反應溶液過夜。使用50mM乙酸四乙銨水溶液(pH＝7.5)和乙腈，和2-46％乙腈的梯度，通過RP-HPLC在14分鐘內監測反應的進展。當約95％的起始材料(連接體)醯化時終止反應。醯化後合併反應混合物，凍幹至乾燥。然後通過HPLC純化凍幹的物質，合併對應於文庫的級分(醯化產物)，並凍幹。
該文庫溶解於2.5ml 0.01M磷酸鈉緩衝液(pH＝8.2)中，向其中加入0.1ml哌啶(4％v/v)。加入哌啶產生在混合時不溶解的混濁。反應混合物在室溫下攪拌50分鐘，然後離心(14,000rpm)混濁的溶液，用200μl移液管除去上清液，將沉澱物重懸浮於0.1ml水中。含水洗液與上清液混合，棄去沉澱。通過加入過量的冰冷的乙醇使乙醇在反應液中的終濃度為70％v/v，從溶液中沉澱脫保護的文庫。離心含水乙醇混合物，產生含有該文庫的白色沉澱物。用冷70％乙醇水溶液洗滌沉澱物一次。除去溶劑後，使沉澱物風乾(約5分鐘)，除去痕量的乙醇，然後在循環2中使用。在第1輪中使用的標籤和相應的結構單元前體在下面的表1中列出。
表1
循環2-5對於其中每一個循環，將前一循環產生的混合的溶液分成12等份，每份50μl，置於PCR管中。向每管中加入含有不同標籤的溶液，除循環3-5省略循環1所述的HPLC純化步驟之外，如循環1所述進行連接、純化和醯化。用於循環2-5的標籤與結構單元前體的對應關係在表2中給出。
利用以上對於標籤連接所述的方法，將循環5的產物與以下所示的封閉引物連接。
5』-PO3-GGCACATTGATTTGGGAGTCAGTGTAACTAAACCCTCAGT-PO3-5』
表2
結果上述合成過程具有產生含有125(約249,000)個不同結構的文庫的能力。通過對每一循環的產物進行凝膠電泳，監測文庫的合成。5個循環中每一個的結果和封閉引物連接後的最終文庫在圖7中顯示。標為「headpiece」的化合物是化合物1。該圖顯示每個循環導致預期的分子量增加，每一循環的產物在分子量上基本均勻。
實施例2具有大約108個成員的文庫的合成和表徵含有大約108個不同成員的文庫的合成使用下列試劑實現化合物2
脫氧核糖核苷酸的單字母密碼A＝腺苷C＝胞苷G＝鳥苷T＝胸苷結構單元前體

表3循環1中使用的寡核苷酸標籤
表4循環2中使用的寡核苷酸標籤
表5.循環3中使用的寡核苷酸標籤
表6.循環4中使用的寡核苷酸標籤
表7用於循環1-4的結構單元和寡核苷酸標籤之間的對應關係
1X連接酶緩衝液50mM Tris，pH 7.5；10mM二硫蘇糖醇；10mMMgCl2；2mM ATP；50mM NaCl。
10X連接酶緩衝液500mM Tris，pH 7.5；100mM二硫蘇糖醇；100mM MgCl2；20mM ATP；500mM NaCl。
水溶性間隔基與化合物2的連接將化合物2在硼酸鈉緩衝液(150mM，pH 9.4)中的溶液(60mL，1mM)冷卻到4℃，向其中加入在N，N-二甲基甲醯胺(DMF)(16mL，0.15M)中的40當量的N-Fmoc-15-氨基-4，7，10，13-四氧雜硬脂酸(S-Ado)，接著加入40當量的4-(4，6-二甲氧基[1.3.5]三嗪-2-基)-4-甲基嗎啉氯化物水合物(DMTMM)的水溶液(9.6mL，0.25M)。混合物在4℃下輕輕搖動2小時，之後加入40當量的S-Ado和DMTMM，並在4℃下再搖動16小時。
醯化後，加入0.1X體積的5M NaCl水溶液和2.5X體積的冷(-20℃)乙醇，使該混合物在-20℃下靜置至少1小時。然後在4℃下以14,000rpm離心該混合物15分鐘，獲得白色沉澱物，用冷EtOH洗滌，然後在凍幹機中室溫乾燥30分鐘。將固體溶解在40mL水中，使用WatersXterra RP18柱通過反相HPLC純化。使用50mM乙酸三乙銨緩衝液pH7.5和99％乙腈/1％水溶液，利用二元流動相梯度分布洗脫產物。通過凍幹濃縮純化的物質，將獲得的殘餘物溶解於5mL水中。向溶液中加入0.1X體積的哌啶，在室溫下輕輕搖動混合物45分鐘。然後如上所述通過乙醇沉澱純化產物，並且離心分離。將獲得的沉澱物用冷EtOH洗滌兩次，通過凍乾乾燥，獲得純化的化合物3。
循環1向96孔板的每個孔中加入12.5μL 4mM化合物3的水溶液；100μL如表3所示的寡核苷酸標籤1.1至1.96之一的1mM溶液(化合物3與標籤的摩爾比為1∶2)。將板加熱至95℃1分鐘，然後冷卻至16℃10分鐘。向每孔中加入10μL 10X連接酶緩衝液、30單位T4DNA連接酶(1μL 30單位/μL溶液(FermentasLife Science，目錄號EL0013))、76.5μl水，獲得的溶液在16℃下溫育16小時。
連接反應後，向每孔中直接加入20μL 5M NaCl水溶液，然後加入500μL冷(-20℃)乙醇，在-20℃下保持1小時。在Beckman CoulterAllegra 6R離心機上，使用Beckman Microplus Carriers，以3200g將板離心1小時。通過將板倒置小心除去上清液，用70％冷乙醇水溶液在-20℃下洗滌沉澱物。每種沉澱物然後溶解於硼酸鈉緩衝液(50μL，150mM，pH 9.4)中至濃度為1mM，並冷卻至4℃。
向每種溶液中加入在DMF中的40當量的96種結構單元前體之一(13μL，0.15M)，然後加入40當量的DMT-MM水溶液(8μL，0.25M)，溶液在4℃下輕輕搖動。2小時後，加入另外40當量的各種結構單元前體之一和DMTMM，溶液在4℃下輕輕搖動16小時。醯化後，向每種溶液中加入在DMF中的10當量乙酸-N-羥基-琥珀醯亞胺酯(2μL，0.25M)，輕輕搖動10分鐘。
醯化後，合併96個反應混合物，加入0.1倍體積的5M NaCl水溶液和2.5倍體積的冷無水乙醇，使溶液在-20℃下靜置至少1小時。然後離心該混合物。離心後，用微量移液器除去儘可能多的上清液，用冷乙醇洗滌沉澱物，再次離心。用200μL移液管除去上清液。向管中加入70％冷乙醇，獲得的混合物在4℃下離心5分鐘。
棄去上清液，剩餘的乙醇通過在室溫下凍幹10分鐘除去。然後將沉澱物溶解在2mL水中，並使用Waters Xterra RP18柱通過反相HPLC純化。使用50mM乙酸三乙銨水緩衝液pH 7.5和99％乙腈/1％水溶液，利用二元流動相梯度分布洗脫文庫。收集、合併和凍幹含有該文庫的級分。將獲得的殘餘物溶解在2.5mL水中，加入250μL哌啶。輕輕搖動溶液45分鐘，然後如前所述用乙醇沉澱。獲得的沉澱物通過凍乾乾燥，然後溶解在硼酸鈉緩衝液(4.8mL，150mM，pH 9.4)中至濃度為1mM。
將溶液冷卻至4℃，加入在DMF中的40當量的每種N-Fmoc-炔丙基甘氨酸(1.2mL，0.15M)和DMT-MM水溶液(7.7mL，0.25M)。混合物在4℃下輕輕搖動2小時，之後加入另外40當量的N-Fmoc-炔丙基甘氨酸和DMT-MM，溶液再搖動16小時。稍後如上所述通過EtOH沉澱和反相HPLC純化該混合物，並且如前所述用哌啶處理除去N-Fmoc基團。在通過EtOH沉澱進行最終純化後，通過凍乾乾燥獲得的沉澱物，並進入合成的下一循環。
循環2-4對於這些循環中的每一個，將來自前一循環的乾燥沉澱物溶解在水中，並且根據文庫DNA成分的消光係數，通過分光光度法測定文庫的濃度，其中化合物2的初始消光係數為131,500L/(mole.cm)。用水調節文庫的濃度，使後續連接反應中的終濃度為0.25mM。然後將文庫在96孔板中分成96個等份。向每個孔中加入含有不同標籤的溶液(文庫與標籤的摩爾比為1∶2)，如循環1所述進行連接。循環2、3、4中使用的寡核苷酸標籤分別在表4、5、6中列出。對於循環1-4中的每一個，標籤與結構單元前體之間的對應關係在表7中提供。如以上對於循環1所述，通過加入乙醇沉澱文庫，並將其溶解在硼酸鈉緩衝液(150mM，pH 9.4)中至濃度為1mM。隨後的醯化和純化如循環1所述進行，不同之處在於循環3中省略了HPLC純化。
利用以上對於標籤連接所述的方法，將循環4的產物與以下所示的封閉引物連接。
5』-PO3-CAG AAG ACA GAC AAG CTT CAC CTG C (SEQ IDNO889)5』-PO3-GCA GGT GAA GCT TGT CTG TCT TCT GAA (SEQ IDNO890)結果上述合成程序能夠產生含有964(約108)個不同結構的文庫。通過對每一循環的產物進行凝膠電泳和LC/MS，監測文庫的合成。完成後，用幾種方法分析文庫。圖13a是循環4後，但在封閉引物連接前的文庫的層析圖；圖13b是同一合成階段的文庫的質譜圖。平均分子量通過負離子LC/MS分析測定。離子信號用ProMass軟體解析。該結果與預測的該文庫的平均質量一致。
通過瓊脂糖凝膠電泳分析文庫的DNA成分，顯示文庫物質中的大多數對應於正確大小的連接產物。對從文庫採樣獲得的PCR產物的分子克隆進行DNA序列分析，顯示DNA連接高保真度地發生，並且接近於完成。
文庫環化在循環4結束時，在通常的醯化條件下，用疊氮基乙酸將文庫的一部分在N-末端加帽。將通過EtOH沉澱純化的產物溶解在磷酸鈉緩衝液(150mM，pH 8)中至濃度為1mM，並加入各為4當量的CuSO4水溶液(200mM)、抗壞血酸水溶液(200mM)和以下所示化合物的DMF溶液(200mM)。反應混合物然後在室溫下輕輕搖動2小時。
為了測定環化程度，從文庫環化反應中取出5μL等份，用如實施例4所述製備的螢光標記的疊氮化物或炔(1μL 100mM DMF貯存液)處理。16小時後，根據500nm下的HPLC分析，炔或疊氮化物標記都未摻入文庫中。該結果表示該文庫不再含有能夠環加成的疊氮基或炔基，因此該文庫一定已經通過環化或分子間反應與自身發生了反應。如前所述通過反相HPLC純化環化的文庫。用未環化的文庫進行的對照實驗顯示上述螢光標記完全摻入。
實施例4用於環化測定的螢光標記的製備在單獨的管中，炔丙基甘氨酸或2-氨基-3-苯丙基疊氮(各8μmol)與FAM-OSu(Molecular Probes Inc.)(1.2當量)在pH 9.4的硼酸鹽緩衝液(250μL)中混合。反應在室溫下進行3小時，然後凍幹過夜。經HPLC純化獲得定量產率的需要的螢光炔和疊氮化物。

實施例5利用疊氮/炔環加成反應環化各化合物疊氮基乙醯基-Gly-Pro-Phe-Pra-NH2的製備利用0.3mmol Rink-醯胺樹脂，以Fmoc-保護的胺基酸和HATU為活化劑，用標準固相合成技術合成指定的序列(Pra＝C-炔丙基甘氨酸)。使用疊氮基乙酸對該四肽加帽。用20％TFA/DCM從樹脂上切割肽4小時。經RP HPLC純化獲得為白色固體的產物(75mg，51％)。1H HMR(DMSO-d6，400MHz)8.4-7.8(m，3H)，7.4-7.1(m，7H)，4.6-4.4(m，1H)，4.4-4.2(m，2H)，4.0-3.9(m，2H)，3.74(dd，1H，J＝6Hz，17Hz)，3.5-3.3(m，2H)，3.07(dt，1H，J＝5Hz，14Hz)，2.92(dd，1H，J＝5Hz，16Hz)，2.86(t，1H，J＝2Hz)，2.85-2.75(m，1H)，2.6-2.4(m，2H)，2.2-1.6(m，4H)。IR(mull)2900，2100，1450，1300cm-1。ESIMS 497.4([M+H]，100％)，993.4([2M+H]，50％)。具有離子源破碎的ESIMS519.3([M+Na]，100％)，491.3(100％)，480.1([M-NH2]，90％)，452.2([M-NH2-CO]，20％)，424.2(20％)，385.1([M-Pra]，50％)，357.1([M-Pra-CO]，40％)，238.0([M-Pra-Phe]，100％)。
疊氮基乙醯基-Gly-Pro-Phe-Pra-NH2的環化疊氮基乙醯基肽(31mg，0.62mmol)溶解在MeCN(30mL)中。加入二異丙基乙胺(DIEA，1mL)和Cu(MeCN)4PF6(1mg)。攪拌1.5小時後，蒸發溶液，將獲得的殘餘物回收在20％MeCN/H2O中。離心除去不溶性鹽後，對溶液進行製備型反相用LC。需要的環肽分離為白色固體(10mg，32％)。1H NMR(DMSO-d6，400MHz)8.28(t，1H，J＝5Hz)，7.77(s，1H)，7.2-6.9(m，9H)，4.98(m，2H)，4.48(m，1H)，4.28(m，1H)，4.1-3.9(m，2H)，3.63(dd，1H，J＝5Hz，16Hz)，3.33(m，2H)，3.0(m，3H)，2.48(dd，1H，J＝11Hz，14Hz)，1.75(m，1H0，1.55(m，1H)，1.32(m，1H)，1.05(m，1H)。IR(mull)2900，1475，1400cm-1。ESIMS 497.2([M+H]，100％)，993.2([2M+H]，30％)，1015.2([2M+Na]，15％)。具有離子源破碎的ESIMS535.2(70％)，519.3([M+Na]，100％)，497.2([M+H]，80％)，480.1([M-NH2]，30％)，452.2([M-NH2-CO]，40％)，208.1(60％)。
疊氮基乙醯基-Gly-Pro-Phe-Pra-Gly-OH的製備利用0.3mmol甘氨酸-Wang樹脂，以Fmoc-保護的胺基酸和HATU為活化劑，合成指定的序列。在最後的偶聯步驟中使用疊氮基乙酸對該五肽加帽。用50％TFA/DCM切割該肽2小時。經RP HPLC純化獲得為白色固體的肽(83mg；50％)。1H NMR(DMSO-d6，400MHz)8.4-7.9(m，4H)，7.2(m，5H)，4.7-4.2(m，3H)，4.0-3.7(m，4H)，3.5-3.3(m，2H)，3.1(m，1H)，2.91(dd，1H，J＝4Hz，16Hz)，2.84(t，1H，J＝2.5Hz)，2.78(m，1H)，2.6-2.4(m，2H)，2.2-1.6(m，4H)。IR(mull)2900，2100，1450，1350cm-1。ESIMS 555.3([M+H]，100％)。具有離子源破碎的ESIMS577.1([M+Na]，90％)，555.3([M+H]，80％)，480.1([M-Gly]，100％)，385.1([M-Gly-Pra]，70％)，357.1([M-Gly-Pra-CO]，40％)，238.0([M-Gly-Pra-Phe]，80％)。
疊氮基乙醯基-Gly-Pro-Phe-Pra-Gly-OH的環化將肽(32mg，0.058mmol)溶解於MeCN(60mL)中。加入二異丙基乙胺(1mL)和Cu(MeCN)4PF6(1mg)，攪拌溶液2小時。蒸發溶劑，對粗產物進行RP HPLC以除去二聚體和三聚體。環狀單體分離為無色玻璃狀(6mg，20％)。ESIMS 555.6([M+H]，100％)，1109.3([2M+H]，20％)，1131.2([2M+Na]，15％)。具有離子源破碎的ESIMS555.3([M+H]，100％)，480.4([M-Gly]，30％)，452.2([M-Gly-CO]，25％)，424.5([M-Gly-2CO]，10％，只在環形結構中才有可能)。
直鏈肽與DNA的偶聯化合物2(45nmol)溶解在45μL硼酸鈉緩衝液(pH 9.4；150mM)中。在4℃下加入直鏈肽(18μL在DMF中的100mM貯存液；180nmol；40當量)，然後加入DMT-MM(3.6μL500mM在水中的貯存液；180nmol；40當量)。攪拌2小時後，LCMS顯示完全反應，經乙醇沉澱分離產物。ESIMS 1823.0([M-3H]/3，20％)，1367.2([M-4H]/4，20％)，1093.7([M-5H]/5，40％)，911.4([M-6H]/6，100％)。
環肽與DNA的偶聯化合物2(20nmol)溶解在20μL硼酸鈉緩衝液(pH 9.4，150mM)中。在4℃下加入直鏈肽(8μL 100mM在DMF中的貯存液；80nmol；40當量)，然後加入DMT-MM(1.6μL 500mM在水中的貯存液；80nmol；40當量)。攪拌2小時後，LCMS顯示完全反應，經乙醇沉澱分離產物。ESIMS 1823.0([M-3H]/3，20％)，1367.2([M-4H]/4，20％)，1093.7([M-5H]/5，40％)，911.4([M-6H]/6，100％)。
DNA-連接的肽的環化直鏈肽-DNA偶聯物(10nmol)溶解在pH 8的磷酸鈉緩衝液(10μL，150mm)中。在室溫下加入各為4當量的CuSO4、抗壞血酸和Sharpless配體(0.2μL 200mM貯存液)。反應進行過夜。RP HPLC顯示沒有直鏈肽-DNA，產物與標準環肽-DNA共洗脫。未見痕量二聚體或其他寡聚體。
4.48分鐘時洗脫 4.27分鐘時洗脫LC條件Targa C18，2.1×40mm，10-40％MeCN在40mM TEAA水溶液中，8分鐘實施例6芳香親核取代反應應用於功能部分的合成用氰尿醯氯對化合物3進行芳基化的一般程序化合物2以1mM的溶液溶解在pH 9.4硼酸鈉緩衝液中。將溶液冷卻至4℃，然後以MeCN中的500mM溶液加入20當量的氰尿醯氯。2小時後，經LCMS證實反應完全，獲得的二氯三嗪-DNA偶聯物經乙醇沉澱分離。
二氯三嗪-DNA的胺取代程序二氯三嗪-DNA偶聯物以1mM的濃度溶解在pH 9.5硼酸鹽緩衝液中。在室溫下以DMF溶液加入40當量的脂肪族胺。該反應後進行LCMS，通常在2小時後完成。獲得的烷基氨基-一氯三嗪-DNA偶聯物經乙醇沉澱分離。
一氯三嗪-DNA的胺取代程序烷基氨基-一氯三嗪-DNA偶聯物以1mM的濃度溶解在pH 9.5硼酸鹽緩衝液中。在42℃下以DMF溶液加入40當量的第二種脂肪族胺。該反應後進行LCMS，通常在2小時後完成。獲得的二氨基三嗪-DNA偶聯物經乙醇沉澱分離。
實施例7還原性胺化反應應用於功能部分的合成含仲胺的DNA-連接體與醛結構單元還原性胺化的一般程序化合物2與N-末端脯氨酸殘基偶聯。獲得的化合物以1mM的濃度溶解在磷酸鈉緩衝液(50μL，150mM，pH 5.5)中。向該溶液中加入各為40當量的DMF中的醛結構單元(8μL，0.25M)和DMF中的氰基硼氫化鈉(8μL，0.25M)，將溶液在80℃下加熱2小時。烷基化後，通過乙醇沉澱純化該溶液。
含醛的DNA-連接體與胺結構單元還原性胺化的一般程序與含醛基的結構單元偶聯的化合物2以1mM的濃度溶解在磷酸鈉緩衝液(50μL，250mM，pH 5.5)中。向該溶液中加入各為40當量的DMF中的胺結構單元(8μL，0.25M)和DMF中的氰基硼氫化鈉(8μL，0.25M)，將溶液在80℃下加熱2小時。烷基化後，通過乙醇沉澱純化該溶液。
實施例8類肽構建反應應用於功能部分的合成在DNA-連接體上進行類肽合成的一般程序化合物2以1mM的濃度溶解在硼酸鈉緩衝液(50μL，150mM，pH9.4)中，冷卻到4℃。向該溶液中加入40當量的DMF中的N-羥基琥珀醯亞氨基溴乙酸酯(13μL，0.15M)，該溶液在4℃下輕輕搖動2小時。醯化後，DNA-連接體經乙醇沉澱純化，以1mM的濃度再溶解在硼酸鈉緩衝液(50μL，150mM，pH 9.4)中，並冷卻到4℃。向該溶液中加入40當量的DMF中的胺結構單元(13μL，0.15M)，溶液在4℃下輕輕搖動16小時。烷化後，DNA-連接體經乙醇沉澱純化，以1mM的濃度再溶解在硼酸鈉緩衝液(50μL，150mM，pH 9.4)中，並冷卻到4℃。通過分步加入N-羥基琥珀醯亞氨基溴乙酸酯，接著加入胺結構單元，繼續類肽合成。
實施例9疊氮化物-炔環加成反應應用於功能部分合成一般程序含炔的DNA偶聯物以約1mM的濃度溶解在pH 8.0的磷酸鹽緩衝液。在室溫下向該混合物中加入10當量的有機疊氮化物和各為5當量的硫酸銅(II)、抗壞血酸和配體(三-((1-苄基三唑-4-基)甲基)胺。該反應後進行LCMS，通常在1-2小時後完成。獲得的三唑-DNA偶聯物可通過乙醇沉澱分離。
實施例10從編碼文庫內鑑定Abl激酶的配體為了鑑定對治療目標具有確定性質的單一化合物，在DNA-編碼文庫中相對於不需要的文庫成員富集目標分子的能力是極為重要的。為了證明這種富集能力，合成了rhAbl激酶(GenBank U07563)的已知結合分子(描述於Shah等人，Science 305，399-401(2004)，在此引用作為參考)。利用標準化學方法將該化合物通過前面實施例中所述的連接體連接到雙鏈DNA寡核苷酸上，產生與通過實施例1和2所述方法產生的產物(與寡核苷酸連接的功能部分)相類似的分子。通常如實施例2所述產生的文庫和DNA-連接的Abl激酶結合分子設計為具有獨特的DNA序列，使兩種物質都能進行qPCR分析。DNA-連接的Abl激酶結合分子與文庫以1∶1000的比例混合。該混合物用rhAble激酶平衡，該酶在固相上捕獲，洗滌除去未結合的文庫成員，洗脫結合的分子。洗脫物中文庫分子與DNA-連接的Abl激酶抑制劑的比例為1∶1，表示DNA-連接的Abl-激酶結合分子獲得500倍以上的富集，與文庫分子相比1000-倍過量。
等同方案本領域技術人員應當認識到，或者僅應用常規實驗就能夠確定此處所述的本發明的特定實施方案的許多等同方案。這些等同方案包括在權利要求書的範圍之內。
序列表110普雷西斯藥品公司等120合成編碼文庫的方法130PPI-156PC15060/5308541512003-12-1715060/5406811512004-01-3015060/5537151512004-03-1515060/5886721512004-07-16160890170FastSEQ for Windows Version 4.021012119212DNA213人工序列220
223合成構建體4001gcaacgaag921022119212DNA213人工序列220
223合成構建體4002tcgttgcca921032119212DNA213人工序列220
223合成構建體4003gcgtacaag921042119
212DNA213人工序列220
223合成構建體4004tgtacgcca921052119212DNA213人工序列220
223合成構建體4005gctctgtag921062119212DNA213人工序列220
223合成構建體4006acagagcca921072119212DNA213人工序列220
223合成構建體4007gtgccatag921082119212DNA213人工序列220
223合成構建體4008atggcacca921092119212DNA213人工序列220
223合成構建體4009gttgaccag9210102119212DNA213人工序列220
223合成構建體40010ggtcaacca9210112119212DNA213人工序列220
223合成構建體40011cgacttgac9210122119212DNA213人工序列220
223合成構建體40012acgctgaac9210132119212DNA213人工序列220
223合成構建體40013cgtagtcag9210142119212DNA213人工序列220
223合成構建體40014gactacgca921015
2119212DNA213人工序列220
223合成構建體40015ccagcatag9210162119212DNA213人工序列220
223合成構建體40016atgctggca9210172119212DNA213人工序列220
223合成構建體40017cctacagag9210182119212DNA213人工序列220
223合成構建體40018ctgtaggca9210192119212DNA213人工序列220
223合成構建體40019ctgaacgag9210202119212DNA213人工序列220
223合成構建體40020acgacttgc9210212119212DNA213人工序列220
223合成構建體40021ctccagtag9210222119212DNA213人工序列220
223合成構建體40022actggagca9210232119212DNA213人工序列220
223合成構建體40023taggtccag9210242119212DNA213人工序列220
223合成構建體40024ggacctaca9210252119212DNA213人工序列220
223合成構建體40025gcgtgttgt921026
2119212DNA213人工序列220
223合成構建體40026aacacgcct9210272119212DNA213人工序列220
223合成構建體40027gcttggagt9210282119212DNA213人工序列220
223合成構建體40028tccaagcct9210292119212DNA213人工序列220
223合成構建體40029gtcaagcgt9210302119212DNA213人工序列220
223合成構建體40030gcttgacct9210312119212DNA213人工序列220
223合成構建體40031caagagcgt9210322119212DNA213人工序列220
223合成構建體40032gctcttgct9210332119212DNA213人工序列220
223合成構建體40033cagttcggt9210342119212DNA213人工序列220
223合成構建體40034cgaactgct9210352119212DNA213人工序列220
223合成構建體40035cgaaggagt9210362119212DNA213人工序列220
223合成構建體40036tccttcgct921037
2119212DNA213人工序列220
223合成構建體40037cggtgttgt9210382119212DNA213人工序列220
223合成構建體40038aacaccgct9210392119212DNA213人工序列220
223合成構建體40039cgttgctgt9210402119212DNA213人工序列220
223合成構建體40040agcaacgct9210412119212DNA213人工序列220
223合成構建體40041ccgatctgt9210422119212DNA213人工序列220
223合成構建體40042agatcggct9210432119212DNA213人工序列220
223合成構建體40043ccttctcgt9210442119212DNA213人工序列220
223合成構建體40044gagaaggct9210452119212DNA213人工序列220
223合成構建體40045tgagtccgt9210462119212DNA213人工序列220
223合成構建體40046ggactcact9210472119212DNA213人工序列220
223合成構建體40047tgctacggt921048
2119212DNA213人工序列220
223合成構建體40048cgttagact9210492119212DNA213人工序列220
223合成構建體40049gtgcgttga9210502119212DNA213人工序列220
223合成構建體40050aacgcacac9210512119212DNA213人工序列220
223合成構建體40051gttggcaga9210522119212DNA213人工序列220
223合成構建體40052tgccaacac9210532119212DNA213人工序列220
223合成構建體40053cctgtagga9210542119212DNA213人工序列220
223合成構建體40054ctacaggac9210552119212DNA213人工序列220
223合成構建體40055ctgcgtaga9210562119212DNA213人工序列220
223合成構建體40056tacgcagac9210572119212DNA213人工序列220
223合成構建體40057cttacgcga9210582119212DNA213人工序列220
223合成構建體40058gcgtaagac921059
2119212DNA213人工序列220
223合成構建體40059tggtcacga9210602119212DNA213人工序列220
223合成構建體40060gtgaccaac9210612119212DNA213人工序列220
223合成構建體40061tcagagcga9210622119212DNA213人工序列220
223合成構建體40062gctctgaac9210632119212DNA213人工序列220
223合成構建體40063ttgctcgga9210642119212DNA213人工序列220
223合成構建體40064cgagcaaac9210652119212DNA213人工序列220
223合成構建體40065gcagttgga9210662119212DNA213人工序列220
223合成構建體40066caactgcac9210672119212DNA213人工序列220
223合成構建體40067gcctgaaga9210682119212DNA213人工序列220
223合成構建體40068ttcaggcac9210692119212DNA213人工序列220
223合成構建體40069gtagccaga9
210702119212DNA213人工序列220
223合成構建體40070tggctacac9210712119212DNA213人工序列220
223合成構建體40071gtcgcttga9210722119212DNA213人工序列220
223合成構建體40072aagcgacac9210732119212DNA213人工序列220
223合成構建體40073gcctaagtt9210742119212DNA213人工序列220
223合成構建體40074cttaggctc9210752119212DNA213人工序列
220
223合成構建體40075gtagtgctt9210762119212DNA213人工序列220
223合成構建體40076gcactactc9210772119212DNA213人工序列220
223合成構建體40077gtcgaagtt9210782119212DNA213人工序列220
223合成構建體40078cttcgactc9210792119212DNA213人工序列220
223合成構建體40079gtttcggtt9210802119212DNA213人工序列220
223合成構建體40080ccgaaactc9
210812119212DNA213人工序列220
223合成構建體40081cagcgtttt9210822119212DNA213人工序列220
223合成構建體40082aacgctgtc9210832119212DNA213人工序列220
223合成構建體40083catacgctt9210842119212DNA213人工序列220
223合成構建體40084gcgtatgtc9210852119212DNA213人工序列220
223合成構建體40085cgatctgtt9210862119212DNA213人工序列220
223合成構建體40086cagatcgtc9210872119212DNA213人工序列220
223合成構建體40087cgctttgtt9210882119212DNA213人工序列220
223合成構建體40088caaagcgtc9210892119212DNA213人工序列220
223合成構建體40089ccacagttt9210902119212DNA213人工序列220
223合成構建體40090actgtggtc9210912119212DNA213人工序列220
223合成構建體40091cctgaagtt921092
2119212DNA213人工序列220
223合成構建體40092cttcaggtc9210932119212DNA213人工序列220
223合成構建體40093ctgacgatt9210942119212DNA213人工序列220
223合成構建體40094tcgtcagtc9210952119212DNA213人工序列220
223合成構建體40095ctccacttt9210962119212DNA213人工序列220
223合成構建體40096agtggagtc9210972119212DNA213人工序列220
223合成構建體40097accagagcc9210982119212DNA213人工序列220
223合成構建體40098ctctggtaa9210992119212DNA213人工序列220
223合成構建體40099atccgcacc92101002119212DNA213人工序列220
223合成構建體400100tgcggataa92101012119212DNA213人工序列220
223合成構建體400101gacgacacc92101022119212DNA213人工序列220
223合成構建體400102tgtcgtcaa9210103
2119212DNA213人工序列220
223合成構建體400103ggatggacc92101042119212DNA213人工序列220
223合成構建體400104tccatccaa92101052119212DNA213人工序列220
223合成構建體400105gcagaagcc92101062119212DNA213人工序列220
223合成構建體400106cttctgcaa92101072119212DNA213人工序列220
223合成構建體400107gccatgtcc92101082119212DNA213人工序列220
223合成構建體400108acatggcaa92101092119212DNA213人工序列220
223合成構建體400109gtctgctcc92101102119212DNA213人工序列220
223合成構建體400110agcagacaa92101112119212DNA213人工序列220
223合成構建體400111cgacagacc92101122119212DNA213人工序列220
223合成構建體400112tctgtcgaa92101132119212DNA213人工序列220
223合成構建體400113cgctactcc9210114
2119212DNA213人工序列220
223合成構建體400114agtagcgaa92101152119212DNA213人工序列220
223合成構建體400115ccacagacc92101162119212DNA213人工序列220
223合成構建體400116tctgtggaa92101172119212DNA213人工序列220
223合成構建體400117cctctctcc92101182119212DNA213人工序列220
223合成構建體400118agagaggaa92101192119212DNA213人工序列220
223合成構建體400119ctcgtagcc92101202119212DNA213人工序列220
223合成構建體400120ctacgagaa921012121120212DNA213人工序列220
223合成構建體400121aaatcgatgt ggtcactcag2021012221120212DNA213人工序列220
223合成構建體400122gagtgaccac atcgatttgg2021012321120212DNA213人工序列220
223合成構建體400123aaatcgatgt ggactaggag2021012421120212DNA213人工序列220
223合成構建體400124cctagtccac atcgatttgg20210125
21120212DNA213人工序列220
223合成構建體400125aaatcgatgt gccgtatgag 2021012621120212DNA213人工序列220
223合成構建體400126catacggcac atcgatttgg 2021012721120212DNA213人工序列220
223合成構建體400127aaatcgatgt gctgaaggag 2021012821120212DNA213人工序列220
223合成構建體400128ccttcagcac atcgatttgg 2021012921120212DNA213人工序列220
223合成構建體400129aaatcgatgt ggactagcag 2021013021120212DNA213人工序列220
223合成構建體400130gctagtccac atcgatttgg 2021013121120212DNA213人工序列220
223合成構建體400131aaatcgatgt gcgctaagag 2021013221120212DNA213人工序列220
223合成構建體400132cttagcgcac atcgatttgg2021013321120212DNA213人工序列220
223合成構建體400133aaatcgatgt gagccgagag2021013421120212DNA213人工序列220
223合成構建體400134ctcggctcac atcgatttgg2021013521120212DNA213人工序列220
223合成構建體400135aaatcgatgt gccgtatcag 20210136
21120212DNA213人工序列220
223合成構建體400136gatacggcac atcgatttgg 2021013721120212DNA213人工序列220
223合成構建體400137aaatcgatgt gctgaagcag 2021013821120212DNA213人工序列220
223合成構建體400138gcttcagcac atcgatttgg 2021013921120212DNA213人工序列220
223合成構建體400139aaatcgatgt gtgcgagtag 2021014021120212DNA213人工序列220
223合成構建體400140actcgcacac atcgatttgg 2021014121120212DNA213人工序列220
223合成構建體400141aaatcgatgt gtttggcgag 2021014221120212DNA213人工序列220
223合成構建體400142cgccaaacac atcgatttgg 2021014321120212DNA213人工序列220
223合成構建體400143aaatcgatgt gcgctaacag 2021014421120212DNA213人工序列220
223合成構建體400144gttagcgcac atcgatttgg 2021014521120212DNA213人工序列220
223合成構建體400145aaatcgatgt gagccgacag 2021014621120212DNA213人工序列220
223合成構建體400146gtcggctcac atcgatttgg 20210147
21120212DNA213人工序列220
223合成構建體400147aaatcgatgt gagccgaaag 2021014821120212DNA213人工序列220
223合成構建體400148ttcggctcac atcgatttgg 2021014921120212DNA213人工序列220
223合成構建體400149aaatcgatgt gtcggtagag 2021015021120212DNA213人工序列220
223合成構建體400150ctaccgacac atcgatttgg 2021015121120212DNA213人工序列220
223合成構建體400151aaatcgatgt ggttgccgag 2021015221120212DNA213人工序列220
223合成構建體400152cggcaaccac atcgatttgg 2021015321120212DNA213人工序列220
223合成構建體400153aaatcgatgt gagtgcgtag 2021015421120212DNA213人工序列220
223合成構建體400154acgcactcac atcgatttgg 2021015521120212DNA213人工序列220
223合成構建體400155aaatcgatgt ggttgccaag 2021015621120212DNA213人工序列220
223合成構建體400156tggcaaccac atcgatttgg 2021015721120212DNA213人工序列220
223合成構建體400157aaatcgatgt gtgcgaggag 20210158
21120212DNA213人工序列220
223合成構建體400158cctcgcacac atcgatttgg 2021015921120212DNA213人工序列220
223合成構建體400159aaatcgatgt ggaacacgag 2021016021120212DNA213人工序列220
223合成構建體400160cgtgttccac atcgatttgg 2021016121120212DNA213人工序列220
223合成構建體400161aaatcgatgt gcttgtcgag 2021016221120212DNA213人工序列220
223合成構建體400162cgacaagcac atcgatttgg 2021016321120212DNA213人工序列220
223合成構建體400163aaatcgatgt gttccggtag 2021016421120212DNA213人工序列220
223合成構建體400164accggaacac atcgatttgg 2021016521120212DNA213人工序列220
223合成構建體400165aaatcgatgt gtgcgagcag 2021016621120212DNA213人工序列220
223合成構建體400166gctcgcacac atcgatttgg 2021016721120212DNA213人工序列220
223合成構建體400167aaatcgatgt ggtcaggtag 2021016821120212DNA213人工序列220
223合成構建體400168acctgaccac atcgatttgg 20210169
21120212DNA213人工序列220
223合成構建體400169aaatcgatgt ggcctgttag2021017021120212DNA213人工序列220
223合成構建體400170aacaggccac atcgatttgg2021017121120212DNA213人工序列220
223合成構建體400171aaatcgatgt ggaacaccag2021017221120212DNA213人工序列220
223合成構建體400172ggtgttccac atcgatttgg2021017321120212DNA213人工序列220
223合成構建體400173aaatcgatgt gcttgtccag2021017421120212DNA213人工序列220
223合成構建體400174ggacaagcac atcgatttgg 2021017521120212DNA213人工序列220
223合成構建體400175aaatcgatgt gtgcgagaag 2021017621120212DNA213人工序列220
223合成構建體400176tctcgcacac atcgatttgg 2021017721120212DNA213人工序列220
223合成構建體400177aaatcgatgt gagtgcggag 2021017821120212DNA213人工序列220
223合成構建體400178ccgcactcac atcgatttgg 2021017921120212DNA213人工序列220
223合成構建體400179aaatcgatgt gttgtccgag 20210180
21120212DNA213人工序列220
223合成構建體400180cggacaacac atcgatttgg 2021018121120212DNA213人工序列220
223合成構建體400181aaatcgatgt gtggaacgag 2021018221120212DNA213人工序列220
223合成構建體400182cgttccacac atcgatttgg 2021018321120212DNA213人工序列220
223合成構建體400183aaatcgatgt gagtgcgaag 2021018421120212DNA213人工序列220
223合成構建體400184tcgcactcac atcgatttgg 2021018521120212DNA213人工序列220
223合成構建體400185aaatcgatgt gtggaaccag 2021018621120212DNA213人工序列220
223合成構建體400186ggttccacac atcgatttgg 2021018721120212DNA213人工序列220
223合成構建體400187aaatcgatgt gttaggcgag 2021018821120212DNA213人工序列220
223合成構建體400188cgcctaacac atcgatttgg 2021018921120212DNA213人工序列220
223合成構建體400189aaatcgatgt ggcctgtgag 2021019021120212DNA213人工序列220
223合成構建體400190cacaggccac atcgatttgg 20210191
21120212DNA213人工序列220
223合成構建體400191aaatcgatgt gctcctgtag 2021019221120212DNA213人工序列220
223合成構建體400192acaggagcac atcgatttgg 2021019321120212DNA213人工序列220
223合成構建體400193aaatcgatgt ggtcaggcag 2021019421120212DNA213人工序列220
223合成構建體400194gcctgaccac atcgatttgg 2021019521120212DNA213人工序列220
223合成構建體400195aaatcgatgt ggtcaggaag 2021019621120212DNA213人工序列220
223合成構建體400196tcctgaccac atcgatttgg 2021019721120212DNA213人工序列220
223合成構建體400197aaatcgatgt ggtagccgag 2021019821120212DNA213人工序列220
223合成構建體400198cggctaccac atcgatttgg 2021019921120212DNA213人工序列220
223合成構建體400199aaatcgatgt ggcctgtaag 2021020021120212DNA213人工序列220
223合成構建體400200tacaggccac atcgatttgg 2021020121120212DNA213人工序列220
223合成構建體400201aaatcgatgt gctttcggag 20210202
21120212DNA213人工序列220
223合成構建體400202ccgaaagcac atcgatttgg 2021020321120212DNA213人工序列220
223合成構建體400203aaatcgatgt gcgtaaggag 2021020421120212DNA213人工序列220
223合成構建體400204ccttacgcac atcgatttgg 2021020521120212DNA213人工序列220
223合成構建體400205aaatcgatgt gagagcgtag 2021020621120212DNA213人工序列220
223合成構建體400206acgctctcac atcgatttgg 2021020721120212DNA213人工序列220
223合成構建體400207aaatcgatgt ggacggcaag 2021020821120212DNA213人工序列220
223合成構建體400208tgccgtccac atcgatttgg 2021020921120212DNA213人工序列220
223合成構建體400209aaatcgatgt gctttcgcag 2021021021120212DNA213人工序列220
223合成構建體400210gcgaaagcac atcgatttgg 2021021121120212DNA213人工序列220
223合成構建體400211aaatcgatgt gcgtaagcag 2021021221120212DNA213人工序列220
223合成構建體400212gcttacgcac atcgatttgg 20210213
21120212DNA213人工序列220
223合成構建體400213aaatcgatgt ggctatggag 2021021421120212DNA213人工序列220
223合成構建體400214ccatagccac atcgatttgg 2021021521120212DNA213人工序列220
223合成構建體400215aaatcgatgt gactctggag 2021021621120212DNA213人工序列220
223合成構建體400216ccagagtcac atcgatttgg 2021021721119212DNA213人工序列220
223合成構建體400217aaatcgatgt gctggaaag 1921021821119212DNA213人工序列220
223合成構建體400218ttccagcaca tcgatttgg 1921021921120212DNA213人工序列220
223合成構建體400219aaatcgatgt gccgaagtag 2021022021120212DNA213人工序列220
223合成構建體400220acttcggcac atcgatttgg 2021022121120212DNA213人工序列220
223合成構建體400221aaatcgatgt gctcctgaag 2021022221120212DNA213人工序列220
223合成構建體400222tcaggagcac atcgatttgg 2021022321120212DNA213人工序列220
223合成構建體400223aaatcgatgt gtccagtcag 20
21022421120212DNA213人工序列220
223合成構建體400224gactggacac atcgatttgg 2021022521120212DNA213人工序列220
223合成構建體400225aaatcgatgt gagagcggag 2021022621120212DNA213人工序列220
223合成構建體400226ccgctctcac atcgatttgg 2021022721120212DNA213人工序列220
223合成構建體400227aaatcgatgt gagagcgaag 2021022821120212DNA213人工序列220
223合成構建體400228tcgctctcac atcgatttgg 2021022921120212DNA213人工序列220
223合成構建體400229aaatcgatgt gccgaaggag 2021023021120212DNA213人工序列220
223合成構建體400230ccttcggcac atcgatttgg 2021023121120212DNA213人工序列220
223合成構建體400231aaatcgatgt gccgaagcag 2021023221120212DNA213人工序列220
223合成構建體400232gcttcggcac atcgatttgg 2021023321120212DNA213人工序列220
223合成構建體400233aaatcgatgt gtgttccgag 2021023421120212DNA213人工序列220
223合成構建體400234cggaacacac atcgatttgg 20210235
21120212DNA213人工序列220
223合成構建體400235aaatcgatgt gtctggcgag 2021023621120212DNA213人工序列220
223合成構建體400236cgccagacac atcgatttgg 2021023721120212DNA213人工序列220
223合成構建體400237aaatcgatgt gctatcggag 2021023821120212DNA213人工序列220
223合成構建體400238ccgatagcac atcgatttgg 2021023921120212DNA213人工序列220
223合成構建體400239aaatcgatgt gcgaaaggag 2021024021120212DNA213人工序列220
223合成構建體400240cctttcgcac atcgatttgg 2021024121120212DNA213人工序列220
223合成構建體400241aaatcgatgt gccgaagaag 2021024221120212DNA213人工序列220
223合成構建體400242tcttcggcac atcgatttgg 2021024321120212DNA213人工序列220
223合成構建體400243aaatcgatgt ggttgcagag 2021024421120212DNA213人工序列220
223合成構建體400244ctgcaaccac atcgatttgg 2021024521120212DNA213人工序列220
223合成構建體400245aaatcgatgt ggatggtgag 20210246
21120212DNA213人工序列220
223合成構建體400246caccatccac atcgatttgg 2021024721120212DNA213人工序列220
223合成構建體400247aaatcgatgt gctatcgcag 2021024821120212DNA213人工序列220
223合成構建體400248gcgatagcac atcgatttgg 2021024921120212DNA213人工序列220
223合成構建體400249aaatcgatgt gcgaaagcag 2021025021120212DNA213人工序列220
223合成構建體400250gctttcgcac atcgatttgg 2021025121120212DNA213人工序列220
223合成構建體400251aaatcgatgt gacactggag 2021025221120212DNA213人工序列220
223合成構建體400252ccagtgtcac atcgatttgg 2021025321120212DNA213人工序列220
223合成構建體400253aaatcgatgt gtctggcaag 2021025421120212DNA213人工序列220
223合成構建體400254tgccagacac atcgatttgg 2021025521120212DNA213人工序列220
223合成構建體400255aaatcgatgt ggatggtcag 2021025621120212DNA213人工序列220
223合成構建體400256gaccatccac atcgatttgg 20
21025721120212DNA213人工序列220
223合成構建體400257aaatcgatgt ggttgcacag 2021025821120212DNA213人工序列220
223合成構建體400258gtgcaaccac atcgatttgg 2021025921120212DNA213人工序列220
223合成構建體400259aaatcgatgt gggcatcgag 2021026021120212DNA213人工序列220
223合成構建體400260cgatgcccca tccgatttgg 2021026121120212DNA213人工序列220
223合成構建體400261aaatcgatgt gtgcctccag 2021026221120212DNA213人工序列220
223合成構建體400262ggaggcacac atcgatttgg 2021026321120212DNA213人工序列220
223合成構建體400263aaatcgatgt gtgcctcaag 2021026421120212DNA213人工序列220
223合成構建體400264tgaggcacac atcgatttgg 2021026521120212DNA213人工序列220
223合成構建體400265aaatcgatgt gggcatccag 2021026621120212DNA213人工序列220
223合成構建體400266ggatgcccac atcgatttgg 2021026721120212DNA213人工序列220
223合成構建體400267aaatcgatgt gggcatcaag 20210268
21120212DNA213人工序列220
223合成構建體400268tgatgcccac atcgatttgg 2021026921120212DNA213人工序列220
223合成構建體400269aaatcgatgt gcctgtcgag 2021027021120212DNA213人工序列220
223合成構建體400270cgacaggcac atcgatttgg 2021027121120212DNA213人工序列220
223合成構建體400271aaatcgatgt ggacggatag 2021027221120212DNA213人工序列220
223合成構建體400272atccgtccac atcgatttgg 2021027321120212DNA213人工序列220
223合成構建體400273aaatcgatgt gcctgtccag 2021027421120212DNA213人工序列220
223合成構建體400274ggacaggcac atcgatttgg 2021027521120212DNA213人工序列220
223合成構建體400275aaatcgatgt gaagcacgag 2021027621120212DNA213人工序列220
223合成構建體400276cgtgcttcac atcgatttgg 2021027721120212DNA213人工序列220
223合成構建體400277aaatcgatgt gcctgtcaag 2021027821120212DNA213人工序列220
223合成構建體400278tgacaggcac atcgatttgg 20
21027921120212DNA213人工序列220
223合成構建體400279aaatcgatgt gaagcaccag 2021028021120212DNA213人工序列220
223合成構建體400280ggtgcttcac atcgatttgg 2021028121120212DNA213人工序列220
223合成構建體400281aaatcgatgt gccttcgtag 2021028221120212DNA213人工序列220
223合成構建體400282acgaaggcac atcgatttgg 2021028321120212DNA213人工序列220
223合成構建體400283aaatcgatgt gtcgtccgag 2021028421120212DNA213人工序列220
223合成構建體400284cggacgacac atcgatttgg 2021028521120212DNA213人工序列220
223合成構建體400285aaatcgatgt ggagtctgag 2021028621120212DNA213人工序列220
223合成構建體400286cagactccac atcgatttgg 2021028721120212DNA213人工序列220
223合成構建體400287aaatcgatgt gtgatccgag 2021028821120212DNA213人工序列220
223合成構建體400288cggatcacac atcgatttgg 2021028921120212DNA213人工序列220
223合成構建體400289aaatcgatgt gtcaggcgag 20210290
21120212DNA213人工序列220
223合成構建體400290cgcctgacac atcgatttgg 2021029121120212DNA213人工序列220
223合成構建體400291aaatcgatgt gtcgtccaag 2021029221120212DNA213人工序列220
223合成構建體400292tggacgacac atcgatttgg 2021029321120212DNA213人工序列220
223合成構建體400293aaatcgatgt ggacggagag 2021029421120212DNA213人工序列220
223合成構建體400294ctccgtccac atcgatttgg 2021029521120212DNA213人工序列220
223合成構建體400295aaatcgatgt ggtagcagag 2021029621120212DNA213人工序列220
223合成構建體400296ctgctaccac atcgatttgg 2021029721120212DNA213人工序列220
223合成構建體400297aaatcgatgt ggctgtgtag 2021029821120212DNA213人工序列220
223合成構建體400298acacagccac atcgatttgg 2021029921120212DNA213人工序列220
223合成構建體400299aaatcgatgt ggacggacag 2021030021120212DNA213人工序列220
223合成構建體400300gtccgtccac atcgatttgg 20
21030121120212DNA213人工序列220
223合成構建體400301aaatcgatgt gtcaggcaag 2021030221120212DNA213人工序列220
223合成構建體400302tgcctgacac atcgatttgg 2021030321120212DNA213人工序列220
223合成構建體400303aaatcgatgt ggctcgaaag 2021030421120212DNA213人工序列220
223合成構建體400304ttcgagccac atcgatttgg 2021030521120212DNA213人工序列220
223合成構建體400305aaatcgatgt gccttcggag 2021030621120212DNA213人工序列220
223合成構建體400306ccgaaggcac atcgatttgg 2021030721120212DNA213人工序列220
223合成構建體400307aaatcgatgt ggtagcacag 2021030821120212DNA213人工序列220
223合成構建體400308gtgctaccac atcgatttgg 2021030921120212DNA213人工序列220
223合成構建體400309aaatcgatgt ggaaggtcag 2021031021120212DNA213人工序列220
223合成構建體400310gaccttccac atcgatttgg 2021031121120212DNA213人工序列220
223合成構建體400311aaatcgatgt ggtgctgtag 20210312
21120212DNA213人工序列220
223合成構建體400312acagcaccac atcgatttgg 202103132119212DNA213人工序列220
223合成構建體400313gttgcctgt 92103142119212DNA213人工序列220
223合成構建體400314aggcaacct 92103152119212DNA213人工序列220
223合成構建體400315caggacggt 92103162119212DNA213人工序列220
223合成構建體400316cgtcctgct92103172119212DNA213人工序列220
223合成構建體400317agacgtggt92103182119212DNA213人工序列220
223合成構建體400318cacgtctct92103192119212DNA213人工序列220
223合成構建體400319caggaccgt92103202119212DNA213人工序列220
223合成構建體400320ggtcctgct92103212119212DNA213人工序列220
223合成構建體400321caggacagt92103222119212DNA213人工序列220
223合成構建體400322tgtcctgct9210323
2119212DNA213人工序列220
223合成構建體400323cactctggt92103242119212DNA213人工序列220
223合成構建體400324cagagtgct92103252119212DNA213人工序列220
223合成構建體400325gacggctgt92103262119212DNA213人工序列220
223合成構建體400326agccgtcct92103272119212DNA213人工序列220
223合成構建體400327cactctcgt92103282119212DNA213人工序列220
223合成構建體400328gagagtgct92103292119212DNA213人工序列220
223合成構建體400329gtagcctgt92103302119212DNA213人工序列220
223合成構建體400330aggctacct92103312119212DNA213人工序列220
223合成構建體400331gccacttgt92103322119212DNA213人工序列220
223合成構建體400332aagtggcct92103332119212DNA213人工序列220
223合成構建體400333catcgctgt9210334
2119212DNA213人工序列220
223合成構建體400334agcgatgct92103352119212DNA213人工序列220
223合成構建體400335cactggtgt92103362119212DNA213人工序列220
223合成構建體400336accagtgct92103372119212DNA213人工序列220
223合成構建體400337gccactggt92103382119212DNA213人工序列220
223合成構建體400338cagtggcct92103392119212DNA213人工序列220
223合成構建體400339tctggctgt92103402119212DNA213人工序列220
223合成構建體400340agccagact92103412119212DNA213人工序列220
223合成構建體400341gccactcgt92103422119212DNA213人工序列220
223合成構建體400342gagtggcct92103432119212DNA213人工序列220
223合成構建體400343tgcctctgt92103442119212DNA213人工序列220
223合成構建體400344agaggcact9210345
2119212DNA213人工序列220
223合成構建體400345catcgcagt92103462119212DNA213人工序列220
223合成構建體400346tgcgatgct92103472119212DNA213人工序列220
223合成構建體400347caggaaggt92103482119212DNA213人工序列220
223合成構建體400348cttcctgct92103492119212DNA213人工序列220
223合成構建體400349ggcatctgt92103502119212DNA213人工序列220
223合成構建體400350agatgccct92103512119212DNA213人工序列220
223合成構建體400351cggtgctgt92103522119212DNA213人工序列220
223合成構建體400352agcaccgct92103532119212DNA213人工序列220
223合成構建體400353cactggcgt92103542119212DNA213人工序列220
223合成構建體400354gccagtgct92103552119212DNA213人工序列220
223合成構建體400355tctcctcgt9210356
2119212DNA213人工序列220
223合成構建體400356gaggagact92103572119212DNA213人工序列220
223合成構建體400357cctgtctgt92103582119212DNA213人工序列220
223合成構建體400358agacaggct92103592119212DNA213人工序列220
223合成構建體400359caacgctgt92103602119212DNA213人工序列220
223合成構建體400360agcgttgct92103612119212DNA213人工序列220
223合成構建體400361tgcctcggt92103622119212DNA213人工序列220
223合成構建體400362cgaggcact92103632119212DNA213人工序列220
223合成構建體400363acactgcgt92103642119212DNA213人工序列220
223合成構建體400364gcagtgtct92103652119212DNA213人工序列220
223合成構建體400365tcgtcctgt92103662119212DNA213人工序列220
223合成構建體400366aggacgact 9210367
2119212DNA213人工序列220
223合成構建體400367gctgccagt92103682119212DNA213人工序列220
223合成構建體400368tggcagcct92103692119212DNA213人工序列220
223合成構建體400369tcaggctgt92103702119212DNA213人工序列220
223合成構建體400370agcctgact92103712119212DNA213人工序列220
223合成構建體400371gccaggtgt92103722119212DNA213人工序列220
223合成構建體400372acctggcct92103732119212DNA213人工序列220
223合成構建體400373cggacctgt92103742119212DNA213人工序列220
223合成構建體400374aggtccgct92103752119212DNA213人工序列220
223合成構建體400375caacgcagt92103762119212DNA213人工序列220
223合成構建體400376tgcgttgct92103772119212DNA213人工序列220
223合成構建體400377cacacgagt9210378
2119212DNA213人工序列220
223合成構建體400378tcgtgtgct92103792119212DNA213人工序列220
223合成構建體400379atggcctgt92103802119212DNA213人工序列220
223合成構建體400380aggccatct92103812119212DNA213人工序列220
223合成構建體400381ccagtctgt92103822119212DNA213人工序列220
223合成構建體400382agactggct92103832119212DNA213人工序列220
223合成構建體400383gccaggagt92103842119212DNA213人工序列220
223合成構建體400384tcctggcct92103852119212DNA213人工序列220
223合成構建體400385cggaccagt92103862119212DNA213人工序列220
223合成構建體400386tggtccgct92103872119212DNA213人工序列220
223合成構建體400387ccttcgcgt92103882119212DNA213人工序列220
223合成構建體400388gcgaaggct9210389
2119212DNA213人工序列220
223合成構建體400389gcagccagt92103902119212DNA213人工序列220
223合成構建體400390tggctgcct92103912119212DNA213人工序列220
223合成構建體400391ccagtcggt92103922119212DNA213人工序列220
223合成構建體400392cgactggct92103932119212DNA213人工序列220
223合成構建體400393actgagcgt92103942119212DNA213人工序列220
223合成構建體400394gctcagtct92103952119212DNA213人工序列220
223合成構建體400395ccagtccgt92103962119212DNA213人工序列220
223合成構建體400396ggactggct92103972119212DNA213人工序列220
223合成構建體400397ccagtcagt92103982119212DNA213人工序列220
223合成構建體400398tgactggct92103992119212DNA213人工序列220
223合成構建體400399catcgaggt9210400
2119212DNA213人工序列220
223合成構建體400400ctcgatgct92104012119212DNA213人工序列220
223合成構建體400401ccatcgtgt92104022119212DNA213人工序列220
223合成構建體400402acgatggct92104032119212DNA213人工序列220
223合成構建體400403gtgctgcgt92104042119212DNA213人工序列220
223合成構建體400404gcagcacct92104052119212DNA213人工序列220
223合成構建體400405gactacggt92104062119212DNA213人工序列220
223合成構建體400406cgtagtcct92104072119212DNA213人工序列220
223合成構建體400407gtgctgagt92104082119212DNA213人工序列220
223合成構建體400408tcagcacct92104092119212DNA213人工序列220
223合成構建體400409gctgcatgt92104102119212DNA213人工序列220
223合成構建體400410atgcagcct9
2104112119212DNA213人工序列220
223合成構建體400411gagtggtgt92104122119212DNA213人工序列220
223合成構建體400412accactcct92104132119212DNA213人工序列220
223合成構建體400413gactaccgt92104142119212DNA213人工序列220
223合成構建體400414ggtagtcct92104152119212DNA213人工序列220
223合成構建體400415cggtgatgt92104162119212DNA213人工序列220
223合成構建體400416atcaccgct92104172119212DNA213人工序列220
223合成構建體400417tgcgactgt92104182119212DNA213人工序列220
223合成構建體400418agtcgcact92104192119212DNA213人工序列220
223合成構建體400419tctggaggt92104202119212DNA213人工序列220
223合成構建體400420ctccagact92104212119212DNA213人工序列220
223合成構建體400421agcactggt9
2104222119212DNA213人工序列220
223合成構建體400422cagtgctct92104232119212DNA213人工序列220
223合成構建體400423tcgcttggt92104242119212DNA213人工序列220
223合成構建體400424caagcgact92104252119212DNA213人工序列220
223合成構建體400425agcactcgt92104262119212DNA213人工序列220
223合成構建體400426gagtgctct92104272119212DNA213人工序列220
223合成構建體400427gcgattggt92104282119212DNA213人工序列220
223合成構建體400428caatcgcct92104292119212DNA213人工序列220
223合成構建體400429ccatcgcgt92104302119212DNA213人工序列220
223合成構建體400430gcgatggct92104312119212DNA213人工序列220
223合成構建體400431tcgcttcgt92104322119212DNA213人工序列220
223合成構建體400432gaagcgact9210433
2119212DNA213人工序列220
223合成構建體400433agtgcctgt92104342119212DNA213人工序列220
223合成構建體400434aggcactct92104352119212DNA213人工序列220
223合成構建體400435ggcataggt92104362119212DNA213人工序列220
223合成構建體400436ctatgccct92104372119212DNA213人工序列220
223合成構建體400437gcgattcgt92104382119212DNA213人工序列220
223合成構建體400438gaatcgcct92104392119212DNA213人工序列220
223合成構建體400439tgcgacggt92104402119212DNA213人工序列220
223合成構建體400440cgtcgcact92104412119212DNA213人工序列220
223合成構建體400441gagtggcgt92104422119212DNA213人工序列220
223合成構建體400442gccactcct92104432119212DNA213人工序列220
223合成構建體400443cggtgaggt9210444
2119212DNA213人工序列220
223合成構建體400444ctcaccgct92104452119212DNA213人工序列220
223合成構建體400445gctgcaagt92104462119212DNA213人工序列220
223合成構建體400446ttgcagcct92104472119212DNA213人工序列220
223合成構建體400447ttccgctgt92104482119212DNA213人工序列220
223合成構建體400448agcggaact92104492119212DNA213人工序列220
223合成構建體400449gagtggagt92104502119212DNA213人工序列220
223合成構建體400450tccactcct92104512119212DNA213人工序列220
223合成構建體400451acagagcgt92104522119212DNA213人工序列220
223合成構建體400452gctctgtct92104532119212DNA213人工序列220
223合成構建體400453tgcgaccgt92104542119212DNA213人工序列220
223合成構建體400454ggtcgcact9
2104552119212DNA213人工序列220
223合成構建體400455cctgtaggt92104562119212DNA213人工序列220
223合成構建體400456ctacaggct92104572119212DNA213人工序列220
223合成構建體400457tagccgtgt92104582119212DNA213人工序列220
223合成構建體400458acggctact92104592119212DNA213人工序列220
223合成構建體400459tgcgacagt92104602119212DNA213人工序列
220
223合成構建體400460tgtcgcact92104612119212DNA213人工序列220
223合成構建體400461ggtctgtgt92104622119212DNA213人工序列220
223合成構建體400462acagaccct92104632119212DNA213人工序列220
223合成構建體400463cggtgaagt92104642119212DNA213人工序列220
223合成構建體400464ttcaccgct92104652119212DNA213人工序列220
223合成構建體400465caacgaggt9
2104662119212DNA213人工序列220
223合成構建體400466ctcgttgct92104672119212DNA213人工序列220
223合成構建體400467gcagcatgt92104682119212DNA213人工序列220
223合成構建體400468atgctgcct92104692119212DNA213人工序列220
223合成構建體400469tcgtcaggt92104702119212DNA213人工序列220
223合成構建體400470ctgacgact92104712119212DNA213人工序列
220
223合成構建體400471agtgccagt92104722119212DNA213人工序列220
223合成構建體400472tggcactct92104732119212DNA213人工序列220
223合成構建體400473tagaggcgt92104742119212DNA213人工序列220
223合成構建體400474gcctctact92104752119212DNA213人工序列220
223合成構建體400475gtcagcggt92104762119212DNA213人工序列220
223合成構建體400476cgctgacct9
2104772119212DNA213人工序列220
223合成構建體400477tcaggaggt92104782119212DNA213人工序列220
223合成構建體400478ctcctgact92104792119212DNA213人工序列220
223合成構建體400479agcaggtgt92104802119212DNA213人工序列220
223合成構建體400480acctgctct92104812119212DNA213人工序列220
223合成構建體400481ttccgcagt92104822119212DNA213人工序列220
223合成構建體400482tgcggaact92104832119212DNA213人工序列220
223合成構建體400483gtcagccgt92104842119212DNA213人工序列220
223合成構建體400484ggctgacct92104852119212DNA213人工序列220
223合成構建體400485ggtctgcgt92104862119212DNA213人工序列220
223合成構建體400486gcagaccct92104872119212DNA213人工序列220
223合成構建體400487tagccgagt9210488
2119212DNA213人工序列220
223合成構建體400488tcggctact92104892119212DNA213人工序列220
223合成構建體400489gtcagcagt92104902119212DNA213人工序列220
223合成構建體400490tgctgacct92104912119212DNA213人工序列220
223合成構建體400491ggtctgagt92104922119212DNA213人工序列220
223合成構建體400492tcagaccct92104932119212DNA213人工序列220
223合成構建體400493cggacaggt92104942119212DNA213人工序列220
223合成構建體400494ctgtccgct92104952119212DNA213人工序列220
223合成構建體400495ttagccggt92104962119212DNA213人工序列220
223合成構建體400496cggctaact92104972119212DNA213人工序列220
223合成構建體400497gagacgagt92104982119212DNA213人工序列220
223合成構建體400498tcgtctcct9210499
2119212DNA213人工序列220
223合成構建體400499cgtaaccgt92105002119212DNA213人工序列220
223合成構建體400500ggttacgct92105012119212DNA213人工序列220
223合成構建體400501ttggcgtgt92105022119212DNA213人工序列220
223合成構建體400502acgccaact92105032119212DNA213人工序列220
223合成構建體400503atggcaggt92105042119212DNA213人工序列220
223合成構建體400504ctgccatct92105052119212DNA213人工序列220
223合成構建體400505cagctacga92105062119212DNA213人工序列220
223合成構建體400506gtagctgac92105072119212DNA213人工序列220
223合成構建體400507ctcctgcga92105082119212DNA213人工序列220
223合成構建體400508gcaggagac92105092119212DNA213人工序列220
223合成構建體400509gctgcctga9
2105102119212DNA213人工序列220
223合成構建體400510aggcagcac92105112119212DNA213人工序列220
223合成構建體400511caggaacga92105122119212DNA213人工序列220
223合成構建體400512gttcctgac92105132119212DNA213人工序列220
223合成構建體400513cacacgcga92105142119212DNA213人工序列220
223合成構建體400514gcgtgtgac92105152119212DNA213人工序列
220
223合成構建體400515gcagcctga92105162119212DNA213人工序列220
223合成構建體400516aggctgcac92105172119212DNA213人工序列220
223合成構建體400517ctgaacgga92105182119212DNA213人工序列220
223合成構建體400518cgttcagac92105192119212DNA213人工序列220
223合成構建體400519ctgaaccga92105202119212DNA213人工序列220
223合成構建體400520ggttcagac9
2105212119212DNA213人工序列220
223合成構建體400521tctggacga92105222119212DNA213人工序列220
223合成構建體400522gtccagaac92105232119212DNA213人工序列220
223合成構建體400523tgcctacga92105242119212DNA213人工序列220
223合成構建體400524gtaggcaac92105252119212DNA213人工序列220
223合成構建體400525ggcatacga92105262119212DNA213人工序列
220
223合成構建體400526gtatgccac92105272119212DNA213人工序列220
223合成構建體400527cggtgacga92105282119212DNA213人工序列220
223合成構建體400528gtcaccgac92105292119212DNA213人工序列220
223合成構建體400529caacgacga92105302119212DNA213人工序列220
223合成構建體400530gtcgttgac92105312119212DNA213人工序列220
223合成構建體400531ctcctctga9
2105322119212DNA213人工序列220
223合成構建體400532agaggagac92105332119212DNA213人工序列220
223合成構建體400533tcaggacga92105342119212DNA213人工序列220
223合成構建體400534gtcctgaac92105352119212DNA213人工序列220
223合成構建體400535aaaggcgga92105362119212DNA213人工序列220
223合成構建體400536cgcctttac92105372119212DNA213人工序列
220
223合成構建體400537ctcctcgga92105382119212DNA213人工序列220
223合成構建體400538cgaggagac92105392119212DNA213人工序列220
223合成構建體400539cagatgcga92105402119212DNA213人工序列220
223合成構建體400540gcatctgac92105412119212DNA213人工序列220
223合成構建體400541gcagcaaga92105422119212DNA213人工序列220
223合成構建體400542ttgctgcac9
2105432119212DNA213人工序列220
223合成構建體400543gtggagtga92105442119212DNA213人工序列220
223合成構建體400544actccacac92105452119212DNA213人工序列220
223合成構建體400545ccagtagga92105462119212DNA213人工序列220
223合成構建體400546ctactggac92105472119212DNA213人工序列220
223合成構建體400547atggcacga92105482119212DNA213人工序列220
223合成構建體400548gtgccatac92105492119212DNA213人工序列220
223合成構建體400549ggactgtga92105502119212DNA213人工序列220
223合成構建體400550acagtccac92105512119212DNA213人工序列220
223合成構建體400551ccgaactga92105522119212DNA213人工序列220
223合成構建體400552agttcggac92105532119212DNA213人工序列220
223合成構建體400553ctcctcaga9210554
2119212DNA213人工序列220
223合成構建體400554tgaggagac92105552119212DNA213人工序列220
223合成構建體400555cactgctga92105562119212DNA213人工序列220
223合成構建體400556agcagtgac92105572119212DNA213人工序列220
223合成構建體400557agcaggcga92105582119212DNA213人工序列220
223合成構建體400558gcctgctac92105592119212DNA213人工序列220
223合成構建體400559agcaggaga92105602119212DNA213人工序列220
223合成構建體400560tcctgctac92105612119212DNA213人工序列220
223合成構建體400561agagccaga92105622119212DNA213人工序列220
223合成構建體400562tggctctac92105632119212DNA213人工序列220
223合成構建體400563gtcgttgga92105642119212DNA213人工序列220
223合成構建體400564caacgacac9210565
2119212DNA213人工序列220
223合成構建體400565ccgaacgga92105662119212DNA213人工序列220
223合成構建體400566cgttcggac92105672119212DNA213人工序列220
223合成構建體400567cactgcgga92105682119212DNA213人工序列220
223合成構建體400568cgcagtgac92105692119212DNA213人工序列220
223合成構建體400569gtggagcga92105702119212DNA213人工序列220
223合成構建體400570gctccacac92105712119212DNA213人工序列220
223合成構建體400571gtggagaga92105722119212DNA213人工序列220
223合成構建體400572tctccacac92105732119212DNA213人工序列220
223合成構建體400573ggactgcga92105742119212DNA213人工序列220
223合成構建體400574gcagtccac92105752119212DNA213人工序列220
223合成構建體400575ccgaaccga9210576
2119212DNA213人工序列220
223合成構建體400576ggttcggac92105772119212DNA213人工序列220
223合成構建體400577cactgccga92105782119212DNA213人工序列220
223合成構建體400578ggcagtgac92105792119212DNA213人工序列220
223合成構建體400579cgaaacgga92105802119212DNA213人工序列220
223合成構建體400580cgtttcgac92105812119212DNA213人工序列220
223合成構建體400581ggactgaga92105822119212DNA213人工序列220
223合成構建體400582tcagtccac92105832119212DNA213人工序列220
223合成構建體400583ccgaacaga92105842119212DNA213人工序列220
223合成構建體400584tgttcggac92105852119212DNA213人工序列220
223合成構建體400585cgaaaccga92105862119212DNA213人工序列220
223合成構建體400586ggtttcgac9210587
2119212DNA213人工序列220
223合成構建體400587ctggcttga92105882119212DNA213人工序列220
223合成構建體400588aagccagac92105892119212DNA213人工序列220
223合成構建體400589cacacctga92105902119212DNA213人工序列220
223合成構建體400590aggtgtgac92105912119212DNA213人工序列220
223合成構建體400591aacgaccga92105922119212DNA213人工序列220
223合成構建體400592ggtcgttac92105932119212DNA213人工序列220
223合成構建體400593atccagcga92105942119212DNA213人工序列220
223合成構建體400594gctggatac92105952119212DNA213人工序列220
223合成構建體400595tgcgaagga92105962119212DNA213人工序列220
223合成構建體400596cttcgcaac92105972119212DNA213人工序列220
223合成構建體400597tgcgaacga9210598
2119212DNA213人工序列220
223合成構建體400598gttcgcaac92105992119212DNA213人工序列220
223合成構建體400599ctggctgga92106002119212DNA213人工序列220
223合成構建體400600cagccagac92106012119212DNA213人工序列220
223合成構建體400601cacaccgga92106022119212DNA213人工序列220
223合成構建體400602cggtgtgac92106032119212DNA213人工序列220
223合成構建體400603agtgcagga92106042119212DNA213人工序列220
223合成構建體400604ctgcactac92106052119212DNA213人工序列220
223合成構建體400605gaccgttga92106062119212DNA213人工序列220
223合成構建體400606aacggtcac92106072119212DNA213人工序列220
223合成構建體400607ggtgagtga92106082119212DNA213人工序列220
223合成構建體400608actcaccac9
2106092119212DNA213人工序列220
223合成構建體400609ccttcctga92106102119212DNA213人工序列220
223合成構建體400610aggaaggac92106112119212DNA213人工序列220
223合成構建體400611ctggctaga92106122119212DNA213人工序列220
223合成構建體400612tagccagac92106132119212DNA213人工序列220
223合成構建體400613cacaccaga92106142119212DNA213人工序列220
223合成構建體400614tggtgtgac92106152119212DNA213人工序列220
223合成構建體400615agcggtaga92106162119212DNA213人工序列220
223合成構建體400616taccgctac92106172119212DNA213人工序列220
223合成構建體400617gtcagagga92106182119212DNA213人工序列220
223合成構建體400618ctctgacac92106192119212DNA213人工序列220
223合成構建體400619ttccgacga9210620
2119212DNA213人工序列220
223合成構建體400620gtcggaaac92106212119212DNA213人工序列220
223合成構建體400621aggcgtaga92106222119212DNA213人工序列220
223合成構建體400622tacgcctac92106232119212DNA213人工序列220
223合成構建體400623ctcgactga92106242119212DNA213人工序列220
223合成構建體400624agtcgagac92106252119212DNA213人工序列220
223合成構建體400625tacgctgga92106262119212DNA213人工序列220
223合成構建體400626cagcgtaac92106272119212DNA213人工序列220
223合成構建體400627gttcggtga92106282119212DNA213人工序列220
223合成構建體400628accgaacac92106292119212DNA213人工序列220
223合成構建體400629gccagcaga92106302119212DNA213人工序列220
223合成構建體400630tgctggcac9210631
2119212DNA213人工序列220
223合成構建體400631gaccgtaga92106322119212DNA213人工序列220
223合成構建體400632tacggtcac92106332119212DNA213人工序列220
223合成構建體400633gtgctctga92106342119212DNA213人工序列220
223合成構建體400634agagcacac92106352119212DNA213人工序列220
223合成構建體400635ggtgagcga92106362119212DNA213人工序列220
223合成構建體400636gctcaccac92106372119212DNA213人工序列220
223合成構建體400637ggtgagaga92106382119212DNA213人工序列220
223合成構建體400638tctcaccac92106392119212DNA213人工序列220
223合成構建體400639ccttccaga92106402119212DNA213人工序列220
223合成構建體400640tggaaggac92106412119212DNA213人工序列220
223合成構建體400641ctcctacga9210642
2119212DNA213人工序列220
223合成構建體400642gtaggagac92106432119212DNA213人工序列220
223合成構建體400643ctcgacgga92106442119212DNA213人工序列220
223合成構建體400644cgtcgagac92106452119212DNA213人工序列220
223合成構建體400645gccgtttga92106462119212DNA213人工序列220
223合成構建體400646aaacggcac92106472119212DNA213人工序列220
223合成構建體400647gcggagtga92106482119212DNA213人工序列220
223合成構建體400648actccgcac92106492119212DNA213人工序列220
223合成構建體400649cgtgcttga92106502119212DNA213人工序列220
223合成構建體400650aagcacgac92106512119212DNA213人工序列220
223合成構建體400651ctcgaccga92106522119212DNA213人工序列220
223合成構建體400652ggtcgagac9210653
2119212DNA213人工序列220
223合成構建體400653agagcagga92106542119212DNA213人工序列220
223合成構建體400654ctgctctac92106552119212DNA213人工序列220
223合成構建體400655gtgctcgga92106562119212DNA213人工序列220
223合成構建體400656cgagcacac92106572119212DNA213人工序列220
223合成構建體400657ctcgacaga92106582119212DNA213人工序列220
223合成構建體400658tgtcgagac92106592119212DNA213人工序列220
223合成構建體400659ggagagtga92106602119212DNA213人工序列220
223合成構建體400660actctccac92106612119212DNA213人工序列220
223合成構建體400661aggctgtga92106622119212DNA213人工序列220
223合成構建體400662acagcctac92106632119212DNA213人工序列220
223合成構建體400663agagcacga9210664
2119212DNA213人工序列220
223合成構建體400664gtgctctac92106652119212DNA213人工序列220
223合成構建體400665ccatcctga92106662119212DNA213人工序列220
223合成構建體400666aggatggac92106672119212DNA213人工序列220
223合成構建體400667gttcggaga92106682119212DNA213人工序列220
223合成構建體400668tccgaacac92106692119212DNA213人工序列220
223合成構建體400669tggtagcga92106702119212DNA213人工序列220
223合成構建體400670gctaccaac92106712119212DNA213人工序列220
223合成構建體400671gtgctccga92106722119212DNA213人工序列220
223合成構建體400672ggagcacac92106732119212DNA213人工序列220
223合成構建體400673gtgctcaga92106742119212DNA213人工序列220
223合成構建體400674tgagcacac9210675
2119212DNA213人工序列220
223合成構建體400675gccgttgga92106762119212DNA213人工序列220
223合成構建體400676caacggcac92106772119212DNA213人工序列220
223合成構建體400677gagtgctga92106782119212DNA213人工序列220
223合成構建體400678agcactcac92106792119212DNA213人工序列220
223合成構建體400679gctccttga92106802119212DNA213人工序列220
223合成構建體400680aaggagcac92106812119212DNA213人工序列220
223合成構建體400681ccgaaagga92106822119212DNA213人工序列220
223合成構建體400682ctttcggac92106832119212DNA213人工序列220
223合成構建體400683cactgagga92106842119212DNA213人工序列220
223合成構建體400684ctcagtgac92106852119212DNA213人工序列220
223合成構建體400685cgtgctgga9210686
2119212DNA213人工序列220
223合成構建體400686cagcacgac92106872119212DNA213人工序列220
223合成構建體400687ccgaaacga92106882119212DNA213人工序列220
223合成構建體400688gtttcggac92106892119212DNA213人工序列220
223合成構建體400689gcggagaga92106902119212DNA213人工序列220
223合成構建體400690tctccgcac92106912119212DNA213人工序列220
223合成構建體400691gccgttaga92106922119212DNA213人工序列220
223合成構建體400692taacggcac92106932119212DNA213人工序列220
223合成構建體400693tctcgtgga92106942119212DNA213人工序列220
223合成構建體400694cacgagaac92106952119212DNA213人工序列220
223合成構建體400695cgtgctaga92106962119212DNA213人工序列220
223合成構建體400696tagcacgac9210697
2119212DNA213人工序列220
223合成構建體400697gcctgtctt92106982119212DNA213人工序列220
223合成構建體400698gacaggctc92106992119212DNA213人工序列220
223合成構建體400699ctcctggtt92107002119212DNA213人工序列220
223合成構建體400700ccaggagtc92107012119212DNA213人工序列220
223合成構建體400701actctgctt92107022119212DNA213人工序列220
223合成構建體400702gcagagttc92107032119212DNA213人工序列220
223合成構建體400703catcgcctt92107042119212DNA213人工序列220
223合成構建體400704ggcgatgtc92107052119212DNA213人工序列220
223合成構建體400705gccactatt92107062119212DNA213人工序列220
223合成構建體400706tagtggctc92107072119212DNA213人工序列220
223合成構建體400707cacacggtt9
2107082119212DNA213人工序列220
223合成構建體400708ccgtgtgtc92107092119212DNA213人工序列220
223合成構建體400709caacgcctt92107102119212DNA213人工序列220
223合成構建體400710ggcgttgtc92107112119212DNA213人工序列220
223合成構建體400711actgaggtt92107122119212DNA213人工序列220
223合成構建體400712cctcagttc92107132119212DNA213人工序列
220
223合成構建體400713gtgctggtt92107142119212DNA213人工序列220
223合成構建體400714ccagcactc92107152119212DNA213人工序列220
223合成構建體400715catcgactt92107162119212DNA213人工序列220
223合成構建體400716gtcgatgtc92107172119212DNA213人工序列220
223合成構建體400717ccatcggtt92107182119212DNA213人工序列220
223合成構建體400718ccgatggtc9
2107192119212DNA213人工序列220
223合成構建體400719gctgcactt92107202119212DNA213人工序列220
223合成構建體400720gtgcagctc92107212119212DNA213人工序列220
223合成構建體400721acagaggtt92107222119212DNA213人工序列220
223合成構建體400722cctctgttc92107232119212DNA213人工序列220
223合成構建體400723agtgccgtt92107242119212DNA213人工序列
220
223合成構建體400724cggcacttc92107252119212DNA213人工序列220
223合成構建體400725cggacattt92107262119212DNA213人工序列220
223合成構建體400726atgtccgtc92107272119212DNA213人工序列220
223合成構建體400727ggtctggtt92107282119212DNA213人工序列220
223合成構建體400728ccagacctc92107292119212DNA213人工序列220
223合成構建體400729gagacggtt9
2107302119212DNA213人工序列220
223合成構建體400730ccgtctctc92107312119212DNA213人工序列220
223合成構建體400731ctttccgtt92107322119212DNA213人工序列220
223合成構建體400732cggaaagtc92107332119212DNA213人工序列220
223合成構建體400733cagatggtt92107342119212DNA213人工序列220
223合成構建體400734ccatctgtc92107352119212DNA213人工序列
220
223合成構建體400735cggacactt92107362119212DNA213人工序列220
223合成構建體400736gtgtccgtc92107372119212DNA213人工序列220
223合成構建體400737actctcgtt92107382119212DNA213人工序列220
223合成構建體400738cgagagttc92107392119212DNA213人工序列220
223合成構建體400739gcagcactt92107402119212DNA213人工序列220
223合成構建體400740gtgctgctc9
2107412119212DNA213人工序列220
223合成構建體400741actctcctt92107422119212DNA213人工序列220
223合成構建體400742ggagagttc92107432119212DNA213人工序列220
223合成構建體400743accttggtt92107442119212DNA213人工序列220
223合成構建體400744ccaaggttc92107452119212DNA213人工序列220
223合成構建體400745agagccgtt92107462119212DNA213人工序列220
223合成構建體400746cggctcttc92107472119212DNA213人工序列220
223合成構建體400747accttgctt92107482119212DNA213人工序列220
223合成構建體400748gcaaggttc92107492119212DNA213人工序列220
223合成構建體400749aagtccgtt92107502119212DNA213人工序列220
223合成構建體400750cggactttc92107512119212DNA213人工序列220
223合成構建體400751ggactggtt9210752
2119212DNA213人工序列220
223合成構建體400752ccagtcctc92107532119212DNA213人工序列220
223合成構建體400753gtcgttctt92107542119212DNA213人工序列220
223合成構建體400754gaacgactc92107552119212DNA213人工序列220
223合成構建體400755cagcatctt92107562119212DNA213人工序列220
223合成構建體400756gatgctgtc92107572119212DNA213人工序列220
223合成構建體400757ctatccgtt92107582119212DNA213人工序列220
223合成構建體400758cggatagtc92107592119212DNA213人工序列220
223合成構建體400759acactcgtt92107602119212DNA213人工序列220
223合成構建體400760cgagtgttc92107612119212DNA213人工序列220
223合成構建體400761atccaggtt92107622119212DNA213人工序列220
223合成構建體400762cctggattc9
2107632119212DNA213人工序列220
223合成構建體400763gttcctgtt92107642119212DNA213人工序列220
223合成構建體400764caggaactc92107652119212DNA213人工序列220
223合成構建體400765acactcctt92107662119212DNA213人工序列220
223合成構建體400766ggagtgttc92107672119212DNA213人工序列220
223合成構建體400767gttcctctt92107682119212DNA213人工序列220
223合成構建體400768gaggaactc92107692119212DNA213人工序列220
223合成構建體400769ctggctctt92107702119212DNA213人工序列220
223合成構建體400770gagccagtc92107712119212DNA213人工序列220
223合成構建體400771acggcattt92107722119212DNA213人工序列220
223合成構建體400772atgccgttc92107732119212DNA213人工序列220
223合成構建體400773ggtgaggtt9
2107742119212DNA213人工序列220
223合成構建體400774cctcacctc92107752119212DNA213人工序列220
223合成構建體400775ccttccgtt92107762119212DNA213人工序列220
223合成構建體400776cggaaggtc92107772119212DNA213人工序列220
223合成構建體400777tacgctctt92107782119212DNA213人工序列220
223合成構建體400778gagcgtatc92107792119212DNA213人工序列
220
223合成構建體400779acggcagtt92107802119212DNA213人工序列220
223合成構建體400780ctgccgttc92107812119212DNA213人工序列220
223合成構建體400781actgacgtt92107822119212DNA213人工序列220
223合成構建體400782cgtcagttc92107832119212DNA213人工序列220
223合成構建體400783acggcactt92107842119212DNA213人工序列220
223合成構建體400784gtgccgttc9
2107852119212DNA213人工序列220
223合成構建體400785actgacctt92107862119212DNA213人工序列220
223合成構建體400786ggtcagttc92107872119212DNA213人工序列220
223合成構建體400787tttgcggtt92107882119212DNA213人工序列220
223合成構建體400788ccgcaaatc92107892119212DNA213人工序列220
223合成構建體400789tggtaggtt92107902119212DNA213人工序列
220
223合成構建體400790cctaccatc92107912119212DNA213人工序列220
223合成構建體400791gttcggctt92107922119212DNA213人工序列220
223合成構建體400792gccgaactc92107932119212DNA213人工序列220
223合成構建體400793gccgttctt92107942119212DNA213人工序列220
223合成構建體400794gaacggctc92107952119212DNA213人工序列220
223合成構建體400795ggagaggtt9
2107962119212DNA213人工序列220
223合成構建體400796cctctcctc92107972119212DNA213人工序列220
223合成構建體400797cactgactt92107982119212DNA213人工序列220
223合成構建體400798gtcagtgtc92107992119212DNA213人工序列220
223合成構建體400799cgtgctctt92108002119212DNA213人工序列220
223合成構建體400800gagcacgtc92108012119212DNA213人工序列220
223合成構建體400801aatccgctt92108022119212DNA213人工序列220
223合成構建體400802gcggatttc92108032119212DNA213人工序列220
223合成構建體400803aggctggtt92108042119212DNA213人工序列220
223合成構建體400804ccagccttc92108052119212DNA213人工序列220
223合成構建體400805gctagtgtt92108062119212DNA213人工序列220
223合成構建體400806cactagctc9210807
2119212DNA213人工序列220
223合成構建體400807ggagagctt92108082119212DNA213人工序列220
223合成構建體400808gctctcctc92108092119212DNA213人工序列220
223合成構建體400809ggagagatt92108102119212DNA213人工序列220
223合成構建體400810tctctcctc92108112119212DNA213人工序列220
223合成構建體400811aggctgctt92108122119212DNA213人工序列220
223合成構建體400812gcagccttc92108132119212DNA213人工序列220
223合成構建體400813gagtgcgtt92108142119212DNA213人工序列220
223合成構建體400814cgcactctc92108152119212DNA213人工序列220
223合成構建體400815ccatccatt92108162119212DNA213人工序列220
223合成構建體400816tggatggtc92108172119212DNA213人工序列220
223合成構建體400817gctagtctt9210818
2119212DNA213人工序列220
223合成構建體400818gactagctc92108192119212DNA213人工序列220
223合成構建體400819aggctgatt92108202119212DNA213人工序列220
223合成構建體400820tcagccttc92108212119212DNA213人工序列220
223合成構建體400821acagacgtt92108222119212DNA213人工序列220
223合成構建體400822cgtctgttc92108232119212DNA213人工序列220
223合成構建體400823gagtgcctt92108242119212DNA213人工序列220
223合成構建體400824ggcactctc92108252119212DNA213人工序列220
223合成構建體400825acagacctt92108262119212DNA213人工序列220
223合成構建體400826ggtctgttc92108272119212DNA213人工序列220
223合成構建體400827cgagctttt92108282119212DNA213人工序列220
223合成構建體400828aagctcgtc9210829
2119212DNA213人工序列220
223合成構建體400829ttagcggtt92108302119212DNA213人工序列220
223合成構建體400830ccgctaatc92108312119212DNA213人工序列220
223合成構建體400831cctcttgtt92108322119212DNA213人工序列220
223合成構建體400832caagaggtc92108332119212DNA213人工序列220
223合成構建體400833ggtctcttt92108342119212DNA213人工序列220
223合成構建體400834agagacctc92108352119212DNA213人工序列220
223合成構建體400835gccagattt92108362119212DNA213人工序列220
223合成構建體400836atctggctc92108372119212DNA213人工序列220
223合成構建體400837gagaccttt92108382119212DNA213人工序列220
223合成構建體400838aggtctctc92108392119212DNA213人工序列220
223合成構建體400839cacacagtt9210840
2119212DNA213人工序列220
223合成構建體400840ctgtgtgtc92108412119212DNA213人工序列220
223合成構建體400841cctcttctt92108422119212DNA213人工序列220
223合成構建體400842gaagaggtc92108432119212DNA213人工序列220
223合成構建體400843tagagcgtt92108442119212DNA213人工序列220
223合成構建體400844cgctctatc92108452119212DNA213人工序列220
223合成構建體400845gcacctttt92108462119212DNA213人工序列220
223合成構建體400846aaggtgctc92108472119212DNA213人工序列220
223合成構建體400847ggcttgttt92108482119212DNA213人工序列220
223合成構建體400848acaagcctc92108492119212DNA213人工序列220
223合成構建體400849gacgcgatt92108502119212DNA213人工序列220
223合成構建體400850tcgcgtctc9210851
2119212DNA213人工序列220
223合成構建體400851cgagctgtt92108522119212DNA213人工序列220
223合成構建體400852cagctcgtc92108532119212DNA213人工序列220
223合成構建體400853tagagcctt92108542119212DNA213人工序列220
223合成構建體400854ggctctatc92108552119212DNA213人工序列220
223合成構建體400855catccgttt92108562119212DNA213人工序列220
223合成構建體400856acggatgtc92108572119212DNA213人工序列220
223合成構建體400857ggtctcgtt92108582119212DNA213人工序列220
223合成構建體400858cgagacctc92108592119212DNA213人工序列220
223合成構建體400859gccagagtt92108602119212DNA213人工序列220
223合成構建體400860ctctggctc92108612119212DNA213人工序列220
223合成構建體400861gagaccgtt9
2108622119212DNA213人工序列220
223合成構建體400862cggtctctc92108632119212DNA213人工序列220
223合成構建體400863cgagctatt92108642119212DNA213人工序列220
223合成構建體400864tagctcgtc92108652119212DNA213人工序列220
223合成構建體400865gcaagtgtt92108662119212DNA213人工序列220
223合成構建體400866cacttgctc92108672119212DNA213人工序列220
223合成構建體400867ggtctcctt92108682119212DNA213人工序列220
223合成構建體400868ggagacctc92108692119212DNA213人工序列220
223合成構建體400869gccagactt92108702119212DNA213人工序列220
223合成構建體400870gtctggctc92108712119212DNA213人工序列220
223合成構建體400871ggtctcatt92108722119212DNA213人工序列220
223合成構建體400872tgagacctc9210873
2119212DNA213人工序列220
223合成構建體400873gagaccatt92108742119212DNA213人工序列220
223合成構建體400874tggtctctc92108752119212DNA213人工序列220
223合成構建體400875ccttcagtt92108762119212DNA213人工序列220
223合成構建體400876ctgaaggtc92108772119212DNA213人工序列220
223合成構建體400877gcacctgtt92108782119212DNA213人工序列220
223合成構建體400878caggtgctc92108792119212DNA213人工序列220
223合成構建體400879aaaggcgtt92108802119212DNA213人工序列220
223合成構建體400880cgccttttc92108812119212DNA213人工序列220
223合成構建體400881cagatcgtt92108822119212DNA213人工序列220
223合成構建體400882cgatctgtc92108832119212DNA213人工序列220
223合成構建體400883cataggctt9210884
2119212DNA213人工序列220
223合成構建體400884gcctatgtc92108852119212DNA213人工序列220
223合成構建體400885ccttcactt92108862119212DNA213人工序列220
223合成構建體400886gtgaaggtc92108872119212DNA213人工序列220
223合成構建體400887gcacctctt92108882119212DNA213人工序列220
223合成構建體400888gaggtgctc921088921125212DNA213人工序列220
223合成構建體400889cagaagacag acaagcttca cctgc2521089021127212DNA213人工序列220
223合成構建體400890gcaggtgaag cttgtctgtc ttctgaa 2權利要求
1.一種合成包含與編碼寡核苷酸可操作連接的功能部分的分子的方法，該方法包括以下步驟(a)提供由包含n個結構單元的起始功能部分組成的起始化合物，其中n是1或大於1的整數，其中該起始功能部分包含至少一個反應基團，並且與起始寡核苷酸可操作連接；(b)將該起始化合物與包含至少一個互補反應基團的結構單元反應，其中該至少一個互補反應基團與步驟(a)的反應基團互補，反應條件適合所述互補反應基團反應形成共價鍵；(c)將所述起始寡核苷酸與標識步驟(b)的結構單元的引入寡核苷酸反應，反應條件適合所述引入寡核苷酸與起始寡核苷酸連接形成編碼寡核苷酸，並存在催化起始寡核苷酸與引入寡核苷酸連接的酶；從而產生包含功能部分的分子，該功能部分含有n+1個結構單元，並且與編碼寡核苷酸可操作連接。
2.權利要求1的方法，其中步驟(c)的功能部分包含反應基團，重複步驟(a)至(c)一次或多次，從而形成循環1至i，其中i是2或大於2的整數，其中循環s的步驟(c)的產物是循環s+1的起始化合物，其中s是i-1或更小的整數。
3.權利要求1的方法，其中步驟(c)在步驟(b)之前，或者步驟(b)在步驟(c)之前。
4.權利要求1的方法，其中所述結構單元的至少一個是胺基酸或活化的胺基酸。
5.權利要求1的方法，其中所述反應基團和互補反應基團選自氨基、羧基、磺醯基、膦醯基、環氧基、吖丙啶基和異氰酸酯基。
6.權利要求1的方法，其中所述反應基團和互補反應基團選自羥基、羧基、磺醯基、膦醯基、環氧基、吖丙啶基和異氰酸酯基。
7.權利要求1的方法，其中所述反應基團和互補反應基團選自氨基和醛基或酮基。
8.權利要求7的方法，其中所述反應基團與互補反應基團之間的反應在還原條件下進行。
9.權利要求1的方法，其中所述反應基團和互補反應基團選自磷葉立德基和醛基或酮基。
10.權利要求1的方法，其中所述反應基團和互補反應基團通過環加成作用反應，形成環結構。
11.權利要求10的方法，其中所述反應基團和互補反應基團選自炔和疊氮基。
12.權利要求10的方法，其中所述反應基團和互補反應基團選自滷代雜芳基和親核基團。
13.權利要求12的方法，其中所述滷代雜芳基選自氯代嘧啶、氯代三嗪和氯代嘌呤。
14.權利要求12的方法，其中所述親核基團是氨基。
15.權利要求1的方法，其中所述酶選自DNA連接酶、RNA連接酶、DNA聚合酶、RNA聚合酶和拓撲異構酶。
16.權利要求1的方法，其中所述起始寡核苷酸是雙鏈或單鏈的。
17.權利要求16的方法，其中所述起始寡核苷酸包含PCR引物序列。
18.權利要求16的方法，其中所述起始寡核苷酸是單鏈的，且引入寡核苷酸是單鏈的；或者起始寡核苷酸是雙鏈的，且引入寡核苷酸是雙鏈的。
19.權利要求18的方法，其中起始功能部分和起始寡核苷酸通過連接部分連接。
20.權利要求19的方法，其中所述起始寡核苷酸是雙鏈的，所述連接部分與起始功能部分和與起始寡核苷酸的兩條鏈共價偶聯。
21.權利要求1的方法，其中所述引入寡核苷酸為3到10個核苷酸的長度。
22.權利要求2的方法，其中循環i的引入寡核苷酸包含PCR封閉引物。
23.權利要求2的方法，其在循環i中進一步包括以下步驟(d)將包含封閉PCR引物序列的寡核苷酸與編碼寡核苷酸連接。
24.權利要求23的方法，其中在催化所述連接的酶的存在下，將包含封閉PCR引物序列的寡核苷酸與編碼寡核苷酸連接。
25.權利要求2的方法，其在循環i後進一步包括以下步驟(e)環化所述功能部分。
26.權利要求25的方法，其中所述功能部分包含炔基和疊氮基，且將該化合物在適合炔基和疊氮基環加成作用形成三唑基的條件下處理，從而環化該功能部分。
27.一種合成化合物文庫的方法，其中化合物包含功能部分，該功能部分包含兩個或多個結構單元並且與標識該功能部分結構的起始寡核苷酸可操作連接，該方法包括下列步驟(a)提供包含m種起始化合物的溶液，其中m是1或大於1的整數，其中起始化合物由包含n個結構單元的功能部分組成，其中n是1或大於1的整數，該功能部分與標識該n個結構單元的起始寡核苷酸可操作連接；(b)將步驟(a)的溶液分配到r個反應容器中，其中r是2或大於2的整數，從而產生r個等份的溶液；(c)將每個反應容器中的起始化合物與r個結構單元之一反應，從而產生r個等份，該等份包含由功能部分組成的化合物，該功能部分包含n+1個結構單元，並且與起始寡核苷酸可操作連接；和(d)在適合引入寡核苷酸與起始寡核苷酸發生酶連接的條件下，在催化引入寡核苷酸與起始寡核苷酸連接的酶的存在下，將每個等份中的起始寡核苷酸與一組r個不同引入寡核苷酸之一反應；從而產生r個等份，這些等份包含由功能部分組成的分子，該功能部分包含n+1個結構單元，並且與編碼該n+1個結構單元的延長的寡核苷酸可操作連接。
28.權利要求27的方法，其進一步包括以下步驟(e)組合所述r個等份中的兩個或多個等份，從而產生包含由功能部分組成的分子的溶液，該功能部分包含n+1個結構單元，並且與編碼該n+1個結構單元的延長的寡核苷酸可操作連接。
29.權利要求28的方法，其中混合r個等份。
30.權利要求28的方法，其中步驟(a)至(e)進行一次或多次，產生循環1至i，其中i是2或大於2的整數，其中在循環s+1中，其中s是i-1或更小的整數，步驟(a)的含m種起始化合物的溶液是循環s的步驟(e)的溶液。
31.權利要求7或權利要求8的方法，其中在循環1至i的至少一個中，步驟(d)在步驟(c)之前。
32.權利要求28的方法，其中至少一個結構單元是胺基酸。
33.權利要求7的方法，其中所述酶是DNA連接酶、RNA連接酶、DNA聚合酶、RNA聚合酶或拓撲異構酶。
34.權利要求28的方法，其中所述起始寡核苷酸是雙鏈寡核苷酸。
35.權利要求34的方法，其中所述引入寡核苷酸是雙鏈寡核苷酸。
36.權利要求28的方法，其中所述起始化合物包含連接體部分，該連接體部分包含適合與結構單元鍵合的第一官能團、適合與寡核苷酸的5』末端鍵合的第二官能團，和適合與寡核苷酸的3』末端鍵合的第三官能團。
37.權利要求36的方法，其中所述連接體部分具有結構其中A是適合與結構單元鍵合的官能團；B是適合與寡核苷酸的5』末端鍵合的官能團；C是適合與寡核苷酸的3』末端鍵合的官能團；S是原子或支架；D是將A與S相連接的化學結構；E是將B與S相連接的化學結構；且F是將C與S相連接的化學結構。
38.權利要求37的方法，其中A是氨基；B是磷酸基；且C是磷酸基。
39.權利要求37的方法，其中D、E和F各自獨立地為亞烷基或低聚(乙二醇)基。
40.權利要求37的方法，其中S是碳原子、氮原子、磷原子、硼原子、磷酸基、環基或多環基。
41.權利要求40的方法，其中連接體部分具有結構其中n、m和p各自獨立地為1至約20的整數。
42.權利要求41的方法，其中n、m和p各自獨立地為2至8的整數。
43.權利要求42的方法，其中n、m和p各自獨立地為3至6的整數。
44.權利要求41的方法，其中連接體部分具有結構
45.權利要求27的方法，其中所述起始化合物的每一個都包含反應基團，並且其中所述r個結構單元的每一個都包含與所述反應基團互補的互補反應基團。
46.權利要求45的方法，其中所述反應基團和互補反應基團選自氨基、羧基、磺醯基、膦醯基、環氧基、吖丙啶基和異氰酸酯基。
47.權利要求45的方法，其中所述反應基團和互補反應基團選自羥基、羧基、磺醯基、膦醯基、環氧基、吖丙啶基團和異氰酸酯基。
48.權利要求45的方法，其中所述反應基團和互補反應基團選自氨基和醛基或酮基。
49.權利要求45的方法，其中所述反應基團與互補反應基團之間的反應在還原條件下進行。
50.權利要求45的方法，其中所述反應基團和互補反應基團選自磷葉立德基和醛基或酮基。
51.權利要求45的方法，其中所述反應基團和互補反應基團通過環加成作用反應，形成環結構。
52.權利要求51的方法，其中所述反應基團和互補反應基團選自炔和疊氮基。
53.權利要求45的方法，其中所述反應基團和互補官能團選自滷代雜芳基和親核基團。
54.權利要求53的方法，其中所述滷代雜芳基選自氯代嘧啶、氯代三嗪和氯代嘌呤。
55.權利要求53的方法，其中所述親核基團是氨基。
56.權利要求28的方法，其在循環i後進一步包括以下步驟(f)環化一個或多個功能部分。
57.權利要求56的方法，其中步驟(f)的功能部分包含疊氮基和炔基。
58.權利要求57的方法，其中所述功能部分保持在適合疊氮基和炔基環加成反應形成三唑基的條件下，從而形成環狀功能部分。
59.權利要求58的方法，其中所述環加成反應在銅催化劑的存在下進行。
60.權利要求59的方法，其中步驟(f)的一個或多個功能部分中的至少一個包含至少兩個巰基，並且該功能部分保持在適合兩個巰基反應形成二硫基的條件下，從而環化該功能部分。
61.權利要求27的方法，其中所述起始寡核苷酸包含PCR引物序列。
62.權利要求28的方法，其中循環i的引入寡核苷酸包含PCR封閉引物。
63.權利要求28的方法，其在循環i後進一步包括以下步驟(d)將包含封閉PCR引物序列的寡核苷酸與編碼寡核苷酸連接。
64.權利要求63的方法，其中在催化所述連接的酶的存在下，所述包含封閉PCR引物序列的寡核苷酸與編碼寡核苷酸連接。
65.下式的化合物其中X是包含一個或多個結構單元的功能部分；Z是在其3』末端與B連接的寡核苷酸；Y是在其5』末端與C連接的寡核苷酸；A是與X形成共價鍵的官能團；B是與Z的3』-末端形成鍵的官能團；C是與Y的5』-末端形成鍵的官能團；D、F和E各自獨立地是雙功能連接基團；且S是原子或分子支架。
66.權利要求65的化合物，其中D、E和F各自獨立地是亞烷基鏈或低聚(乙二醇)鏈。
67.權利要求65的化合物，其中Y和Z基本互補，並且在化合物中定向，從而在適當條件下能夠發生Watson-Crick鹼基配對和雙鏈體形成。
68.權利要求65的化合物，其中Y和Z具有相同的長度或不同的長度。
69.權利要求68的化合物，其中Y和Z具有相同的長度。
70.權利要求65的化合物，其中Y和Z各為10個或更多鹼基的長度，並且具有10個更多鹼基對的互補區。
71.權利要求65的化合物，其中S是碳原子、硼原子、氮原子、磷原子或多原子支架。
72.權利要求71的化合物，其中S是磷酸基或環基。
73.權利要求72的化合物，其中S是環烷基、環烯基、雜環烷基、雜環烯基、芳基或雜芳基。
74.權利要求65的化合物，其中連接體部分具有結構其中n、m和p各自獨立地為1至約20的整數。
75.權利要求74的化合物，其中n、m和p各自獨立地為2至8的整數。
76.權利要求75的化合物，其中n、m和p各自獨立地為3至6的整數。
77.權利要求65的化合物，其中連接體部分具有結構
78.權利要求65的化合物，其中X和Y包含PCR引物序列。
79.一種包含至少約102種不同化合物的化合物文庫，該化合物包含功能部分，該功能部分包含兩個或多個結構單元並且與識別該功能部分結構的寡核苷酸可操作連接。
80.權利要求79的化合物文庫，該文庫包含各為至少約105個拷貝的不同化合物。
81.權利要求79的化合物文庫，該文庫包含各為至少約106個拷貝的不同化合物。
82.權利要求79的化合物文庫，其包含至少約104種不同的化合物。
83.權利要求79的化合物文庫，其包含至少約106種不同的化合物。
84.權利要求79的化合物文庫，其包含至少約108種不同的化合物。
85.權利要求79的化合物文庫，其包含至少約1010種不同的化合物。
86.權利要求79的化合物文庫，其包含至少約1012種不同的化合物。
87.權利要求79的化合物文庫，其中該文庫包含多種獨立地為式I的化合物其中X是包含一個或多個結構單元的功能部分；Z是在其3』末端與B連接的寡核苷酸；Y是在其5』末端與C連接的寡核苷酸；A是與X形成共價鍵的官能團；B是與Z的3』-末端形成鍵的官能團；C是與Y的5』-末端形成鍵的官能團；D、F和E各自獨立地是雙功能連接基團；且S是原子或分子支架。
88.權利要求87的化合物文庫，其中對於每一種式I的化合物，A、B、C、D、E、F和S各自具有相同的身份。
89.權利要求87的化合物文庫，該文庫基本由多種式I的化合物組成。
90.權利要求87的化合物文庫，其中D、E和F各自獨立地是亞烷基鏈或低聚(乙二醇)鏈。
91.權利要求87的化合物文庫，其中Y和Z基本互補，並且在化合物中定向，從而在適當條件下能夠發生Watson-Crick鹼基配對和雙鏈體形成。
92.權利要求87的化合物文庫，其中Y和Z具有相同的長度或不同的長度。
93.權利要求87的化合物文庫，其中Y和Z具有相同的長度。
94.權利要求87的化合物文庫，其中Y和Z各自為10個或更多鹼基的長度，並且具有10個或更多鹼基對的互補區。
95.權利要求87的化合物文庫，其中S是碳原子、硼原子、氮原子、磷原子或多原子支架。
96.權利要求87的化合物文庫，其中S是磷酸基或環基。
97.權利要求96的化合物文庫，其中S是環烷基、環烯基、雜環烷基、雜環烯基、芳基或雜芳基。
98.權利要求87的化合物文庫，其中連接體部分具有結構其中n、m和p各自獨立地是1至約20的整數。
99.權利要求98的化合物文庫，其中n、m和p各自獨立地是2至8的整數。
100.權利要求99的化合物，其中n、m和p各自獨立地是3至6的整數。
101.權利要求87的化合物，其中連接體部分具有結構
102.權利要求87的化合物文庫，其中X和Z包含PCR引物序列。
103.由權利要求1的方法製備的一種化合物。
104.由權利要求27的方法製備的一種化合物文庫。
105.一種鑑定能與生物靶標結合的一種或多種化合物的方法，該方法包括以下步驟(a)在適合化合物文庫的至少一個成員與靶標結合的條件下使該生物靶標接觸通過權利要求27的方法製備的化合物文庫；(b)除去不與該靶標結合的文庫成員；(c)擴增能與該靶標結合的化合物文庫至少一個成員的編碼寡核苷酸；(d)對步驟(c)的編碼寡核苷酸進行測序；和(e)利用步驟(d)測定的序列確定能與該生物靶標結合的化合物文庫成員的功能部分的結構；從而鑑定能與生物靶標結合的一種或多種化合物。
106.一種鑑定能與生物靶標結合的化合物的方法，該方法包括以下步驟(a)在適合化合物文庫的至少一個成員與靶標結合的條件下，使生物靶標接觸包含至少約102種不同化合物的化合物文庫，該化合物包含功能部分，該功能部分包含兩個或多個結構單元，並且與標識該功能部分的結構的寡核苷酸可操作連接；(b)除去不與該靶標結合的文庫成員；(c)擴增能與該靶標結合的化合物文庫至少一個成員的編碼寡核苷酸；(d)對步驟(c)的編碼寡核苷酸進行測序；和(e)利用步驟(d)測定的序列確定能與該生物靶標結合的化合物文庫成員的功能部分的結構；從而鑑定能與該生物靶標結合的一種或多種化合物。
107.權利要求106的方法，其中所述文庫包含各為至少約105個拷貝的不同化合物。
108.權利要求106的方法，其中所述文庫包含各為至少約106個拷貝的不同化合物。
109.權利要求106的方法，其中所述文庫包含至少約104種不同的化合物。
110.權利要求106的方法，其中所述文庫包含至少約106種不同的化合物。
111.權利要求106的方法，其中所述文庫包含至少約108種不同的化合物。
112.權利要求106的方法，其中所述文庫包含至少約1010種不同的化合物。
113.權利要求106的方法，其中所述化合物文庫包含至少約1012種不同的化合物。
114.權利要求106的方法，其中所述化合物文庫包含多種獨立地為式I的化合物其中X是包含一個或多個結構單元的功能部分；Z是在其3』末端與B連接的寡核苷酸；Y是在其5』末端與C連接的寡核苷酸；A是與X形成共價鍵的官能團；B是與Z的3』-末端形成鍵的官能團；C是與Y的5』-末端形成鍵的官能團；D、F和E各自獨立地是雙功能連接基團；且S是原子或分子支架。
115.權利要求114的方法，其中對於每一種式I的化合物，A、B、C、D、E、F和S各自具有相同的身份。
116.權利要求114的方法，其中所述化合物文庫基本由多種式I的化合物組成。
117.權利要求114的方法，其中D、E和F各自獨立地是亞烷基鏈或低聚(乙二醇)鏈。
118.權利要求114的方法，其中Y和Z基本互補，並且在化合物中定向，從而在適當條件下能夠發生Watson-Crick鹼基配對和雙鏈體形成。
119.權利要求114的方法，其中Y和Z具有相同的長度或不同的長度。
120.權利要求119的方法，其中Y和Z具有相同的長度。
121.權利要求114的方法，其中Y和Z各自為10個或更多鹼基的長度，並且具有10個或更多鹼基對的互補區。
122.權利要求114的方法，其中S是碳原子、硼原子、氮原子、磷原子或多原子支架。
123.權利要求114的方法，其中S是磷酸基或環基。
124.權利要求123的方法，其中S是環烷基、環烯基、雜環烷基、雜環烯基、芳基或雜芳基。
125.權利要求114的方法，其中連接體部分具有結構其中n、m和p各自獨立地為1至約20的整數。
126.權利要求125的方法，其中n、m和p各自獨立地為2至8的整數。
127.權利要求126的方法，其中n、m和p各自獨立地為3至6的整數。
128.權利要求127的方法，其中連接體部分具有結構
129.權利要求114的方法，其中X和Z包含PCR引物序列。
全文摘要
本發明提供一種合成包含編碼寡核苷酸標籤的分子文庫的方法。
文檔編號C07B61/00GK1898257SQ200480037850
公開日2007年1月17日申請日期2004年12月17日優先權日2003年12月17日
發明者巴裡·摩根, 史蒂芬·黑爾, 克里斯多福·C·阿里科·馬恩德爾, 馬修·克拉克, 理察·華格納, 戴維德·I·伊斯雷爾, 馬爾科爾姆·L·格夫特, 丹尼斯·班傑明, 尼爾斯·雅各布·維斯特·漢森, 馬爾科爾姆·J·卡瓦爾納, 史蒂芬·菲利普·克裡澤, 喬治·J·富蘭克林, 保羅·A·森特裡爾拉, 雷克沙·A·阿查雅申請人:普雷西斯藥品公司

首页

算命

星座

感情

婚姻

風水

文化

生活

生肖

百科

解夢

娛樂

社會

合成編碼文庫的方法

一種新型多功能組合攝影箱的製作方法

壓縮模式圖樣重疊檢測方法與裝置與流程

個性化檯曆的製作方法

一種實現縮放的視頻解碼方法

基於加熱模壓的纖維增強PBT複合材料成型工藝的製作方法

一種pe滾塑儲槽的製作方法

釘的製作方法

直流氧噴裝置的製作方法

新型熱網閥門操作手輪的製作方法

用來自動讀取管狀容器所載識別碼的裝置的製作方法