新四季網

內源啟動子在表達異源蛋白中的用途的製作方法

2023-12-10 04:29:46

專利名稱:內源啟動子在表達異源蛋白中的用途的製作方法
技術領域:
本發明通常涉及內源轉錄控制途徑在調節異源蛋白的表達中的用途。
背景技術:
在哺乳動物細胞中表達重組蛋白提出了幾種挑戰。首先,異源DNA需要穩定地引入哺乳動物基因組中。許多方法,例如病毒轉染程序和非病毒轉染程序,將DNA隨機整合至基因組中,產生脫靶效應和可變表達。雖然基於重組的策略(例如,Cre-A^rP或Flp-/^T)能夠使異源DNA插入至限定的位置,但必須首先產生並表徵包含特定重組位點的細胞系。這不僅是個耗時的過程,而且還使重組酶位點隨機放置。第二,異源DNA需要與強啟動子連接。一般而言,使用病毒來源的啟動子但這些易於沉默。所需的是能精確地靶向並整合異源DNA至哺乳動物基因組中,使得其自強的內源啟動子表達。發明簡沭
本文提供了用於將編碼異源蛋白的序列整合至基因組中的靶定位置使得內源調節系統調節異源蛋白的表達的方法。本公開內容的一個方面包含一種方法,所述方法用於在細胞的染色體中整合編碼至少一種異源蛋白的序列,使得所述至少一種異源蛋白的表達通過內源調節系統調節。所述方法包括將以下物質引入細胞中(i)至少一種靶向內切核酸酶或編碼靶向內切核酸酶的核酸,其中所述靶向內切核酸酶能結合靶序列並切割編碼內源蛋白的染色體序列中的切割位點;和(ii)包含編碼所述至少一種異源蛋白的序列的至少一種供體多核苷酸,所述序列與編碼2A肽的序列連接以形成異源蛋白編碼序列。所述在供體多核苷酸中的異源蛋白編碼序列被上遊序列和下遊序列側接,所述上遊序列和下遊序列與染色體序列中切割位點的任一側有基本的序列同一性。所述方法還包括將細胞保持在這樣的條件下,所述條件使得通過同源性定向的修復過程修復通過靶向內切核酸酶引入所述染色體序列中的雙鏈斷裂,使得所述供體多核苷酸中的異源蛋白編碼序列符合讀框地整合至靶定染色體序列中,從而所述至少一種異源蛋白的表達通過調節內源蛋白表達的內源調節系統調節。另一個方面提供了包含編碼至少一種異源蛋白的染色體整合序列的細胞,其中所述編碼至少一種異源蛋白的序列與編碼內源蛋白的染色體序列符合讀框地整合。所述至少一種異源蛋白的表達與細胞內內源蛋白的表達被同等地控制。本公開內容的又一個方面包含供體多核苷酸。所述供體多核苷酸包含編碼至少一種異源蛋白的序列,所述序列與編碼2A肽的序列連接以形成異源蛋白編碼序列。此外,所述供體多核苷酸中的異源蛋白編碼序列被與靶細胞染色體序列中切割位點的任一側享有基本序列同一性的上遊序列和下遊序列側接。另一個方面提供了一種試劑盒,所述試劑盒用於將編碼至少一種異源蛋白的序列整合至編碼內源蛋白的染色體序列中。所述試劑盒包含編碼鋅指核酸酶的至少一種核酸,其中所述鋅指核酸酶能結合靶序列並切割染色體序列中的切割位點。所述試劑盒還包含至少一種供體多核苷酸。所述供體多核苷酸包含編碼至少一種異源蛋白的序列,所述序列與編碼2A肽的序列連接以形成異源蛋白編碼序列,其中所述異源蛋白序列被與細胞染色體序列中切割位點的任一側有基本序列同一性的上遊序列和下遊序列側接。而另一個方面提供了利用內源調節系統調節至少一種異源蛋白的表達的方法。所述方法包括提供包含與編碼2A肽的序列連接的編碼至少一種異源蛋白的染色體整合序列的細胞,其中所述編碼異源蛋白和2A肽的序列與編碼內源蛋白的染色體序列符合讀框地整合。所述方法還包括將所述細胞保持在這樣的條件下,所述條件使得內源調節系統的 活化產生編碼異源蛋白、2A肽和內源蛋白的一種轉錄物,其中所述2A肽中斷翻譯使得所述異源蛋白和內源蛋白各自作為不連續的實體產生。以下更完全地描述本公開內容的其它方面和特徵。彩圖的引用
本申請文件包含至少一張以彩色完成的圖片。含彩圖的本專利申請出版物的拷貝將在請求並支付必要費用時由專利局提供。附圖簡述
圖I描述了在人基因座上的靶定整合。(A)圖示用於整合異源編碼序列的靶區的染色體序列(SEQ ID NO:9)、染色體靶區上的ZFN結合位點(帶邊框的區域)、ZFN切割位點(黃色箭頭)和整合位點(綠色箭頭)。整合位點在切割位點的下遊7bp處。(B)出示了 TZ/似7沒基因座、整合位點、SH2生物傳感器(biosensor)的設計以及成功整合後表達的蛋白的不意圖。圖2描述了包含了被靶區上的TUBAlA序列側接的SH2生物傳感器序列的供體質粒的圖譜。圖3出示了野生型和含靶定整合的細胞的蛋白印跡的圖像。圖4出示了表達GFP-2xSH2(Grb2)-2A蛋白的單獨分離的細胞克隆的微分幹涉相差(DIC)顯微術圖像和螢光顯微術圖像。螢光圖像顯示了在曝露於100 ng/mL的EGF後生物傳感器易位的時程。圖5描述了人JCTi 基因座的靶定整合。顯示了用於整合異源編碼序列的靶區的染色體序列(SEQ ID NO: 10)、染色體靶區中的ZFN結合位點(黃色序列)、ZFN切割位點(上方,黃色箭頭)和標籤序列整合位點(下方,綠色/黃色箭頭)。圖6出示了包含被靶區上JCTS序列側接的SH2生物傳感器序列的供體質粒的圖
-i'TfeP曰。圖7描述了表達GFP-2XSH2 (Grb2) -2A (上圖)和RFP- β -肌動蛋白(下圖)的單獨分離的細胞克隆的螢光顯微術圖像。出示了在曝露於100 ng/mL的EGF後的時程。圖8描述了 LMNBl基因座的靶定整合。顯示了用於整合異源編碼序列的靶區的染色體序列(SEQ ID NO: 11)、染色體靶區中的ZFN結合位點(黃色序列)、ZFN切割位點(黃色箭頭)和標籤序列整合位點(綠色箭頭)。圖9顯示了中國倉鼠卵巢(CHO)細胞JCTS基因座中的靶定整合的位點。顯示了用於整合異源編碼序列的靶區的染色體序列(SEQ ID NO: 12)、ZFN結合位點(帶邊框的區域)、ZFN切割位點和靶定整合位點。

圖10描述了包含SEAP-2A-GFP序列的供體質粒的圖譜,所述序列被ZFN切割位點上遊和下遊的CHO ACTB序列側接。圖11描述了 SEAP-2A-GFP序列的靶定整合至CHO細胞的JCTS基因座的接頭PCR分析(junction PCR analysis)。擴增片段為預期大小。發明詳述 本文公開的各種方面之中為一種方法,所述方法用於將編碼至少一種異源蛋白的序列整合至細胞染色體中的靶定位置使得所述異源蛋白的表達通過內源的轉錄控制系統調節。因此,與其使用外源(例如,病毒的)啟動子,倒不如通過內源系統調節表達,所述內源系統不僅包含啟動子序列,而且還包含位於轉錄起始位點上遊和下遊的其它順式調節元件。有利地,內源系統不易於沉默效應。此外,通過連接異源編碼序列至2A肽編碼序列,翻譯期間得到單獨的異源蛋白和內源蛋白。通過靶向內切核酸酶基因組編輯方法將編碼所述異源蛋白的序列整合至靶定染色體位置。本文還提供了包含編碼至少一種異源蛋白的染色體整合序列的細胞和利用內源調節系統表達異源蛋白的方法,所述序列與內源調節系統可操作地連接。(I)包含異源序列的細胞,該序列的表達通過內源調節系統調節
本公開內容的一個方面包括一種細胞,所述細胞包含編碼至少一種異源蛋白的染色體整合序列,所述序列的表達通過內源調節系統調節。具體而言,編碼異源蛋白的序列與編碼內源蛋白的內源染色體序列符合讀框地整合。靶向內切核酸酶基因組編輯介導的方法用於靶定並整合異源編碼序列至目標內源染色體序列。此外,所述異源編碼序列與2A肽編碼序列連接。在轉錄的活化時,所述異源序列和所述內源序列作為單一轉錄物轉錄。翻譯期間,所述2A肽中斷翻譯使得所述異源蛋白從內源蛋白中「切離」,從而允許來自一個開放閱讀框的多於一種蛋白的同等合成。(a)異源序列
一種或多種異源蛋白的身份(identity)可改變並會改變。一般而言,編碼任何蛋白的序列可整合至靶定的染色體位置。所述異源蛋白可為天然存在的蛋白或其片段、重組蛋白、融合蛋白、報告蛋白、標籤蛋白、野生型蛋白、治療蛋白、診斷蛋白、抗體等。例如,所述異源蛋白可為抗體重鏈或抗體輕鏈。所述異源蛋白可來源於多種來源,包括例如哺乳動物、脊椎動物、無脊椎動物、植物、微生物、細菌和古細菌。在一些實施方案中,編碼多於一種異源蛋白的序列可整合至染色體序列中。例如,編碼兩種、三種、四種或更多種異源蛋白的序列可整合至染色體序列中使得內源調節系統調節兩種、三種、四種或更多種異源蛋白的表達。—般而言,編碼異源蛋白的序列可為針對目標細胞中的最佳表達而密碼子優化的。所述編碼異源蛋白的序列可包含外顯子(或蛋白編碼)序列。或者,所述編碼異源蛋白的序列可包含內含子序列和外顯子序列。
如上所示,編碼異源蛋白的序列與2A肽連接。本文所用術語「2A肽」是指任何2A肽或其片段、任何2A樣肽或其片段或包含必需胺基酸的人工肽。所述2A肽最初在正鏈RNA病毒中表徵,所述病毒產生多蛋白,所述多蛋白在翻譯期間「被切割」成成熟的單獨蛋白。更具體地,2A肽區(約20個胺基酸)介導在其自身C端的「切割」以將其從所述多蛋白的2B區中釋放出來。2A肽序列以甘氨酸殘基和脯氨酸殘基終止。在2A肽的翻譯期間,核糖體在甘氨酸殘基後中止,導致新生多肽鏈的釋放。翻譯重新開始,2A序列的脯氨酸殘基變為下遊蛋白的首個胺基酸。與異源編碼序列連接的2A肽編碼序列可編碼全長2A肽。或者,其可編碼2A肽的C端片段。所述C端片段可包含C末端的約19個、18個、 17個、16個、15個、14個、13個、12個、11個、10個、9個、8個、7個、6個、5個或4個胺基酸殘基。編碼2A肽的序列可連接至編碼異源蛋白的序列的5』端或3』端。在其中異源序列在內源編碼序列的起始附近整合的實施方案中,所述2A肽序列可連接至編碼異源蛋白的序列的3』端。因此,所得mRNA具有以下定向5』 _(異源蛋白-2A肽)n-內源蛋白-3』,其中η表示異源蛋白的數目。在其中異源序列在內源編碼序列末尾附近整合的實施方案中,所述2Α肽序列可連接至編碼異源蛋白的序列的5』端。因此,所得mRNA具有以下定向5』 -內源蛋白_(2Α肽-異源蛋白)η_3』,其中η如上定義。(b)內源調節系統
一般而言,選擇用於異源序列的整合的內源染色體序列可視所需的表達性質而定。本文所用術語「內源調節系統」是指共同協作以調節染色體序列轉錄的染色體序列(即,轉錄控制元件例如啟動子、增強子等)和調節控制蛋白(即,通用轉錄因子和特異性轉錄因子)。靶序列包含轉錄控制序列元件(例如,啟動子和其它控制元件)和被轉錄的染色體序列(即,非翻譯序列和翻譯序列)。儘管蛋白編碼序列的表達可被多種序列元件調節,但出於方便討論的目的在以下使用術語「啟動子」。在一些實施方案中,靶定利用組成型啟動子的內源靶序列可為所需的。組成型啟動子傾向於在許多類型的細胞中有活性。合適的組成型啟動子的非限制性實例包括調節以下物質的表達的那些細胞骨架蛋白(例如α-微管蛋白、β-微管蛋白、α-肌動蛋白、β_肌動蛋白等);普遍存在的細胞蛋白(例如組蛋白、核糖體蛋白、翻譯因子、轉錄因子、細胞周期蛋白、蛋白酶體蛋白等);涉及胺基酸代謝、碳水化合物代謝或脂類代謝、檸檬酸循環、線粒體功能等的酶。一些組成型啟動子還可被稱為強啟動子,因為它們的活化導致產生高水平的基因產物。在其它的實施方案中,表達在例如以下的特定細胞類型中可為所需肌肉細胞、神經細胞、肝細胞、胰β細胞、心臟細胞、乳腺細胞等。本領域的技術人員對可用於細胞特異性或組織特異性表達的合適的細胞特異性啟動子是熟悉的。而在另一個實施方案中,可調節表達或誘導型表達可為所需的。合適的誘導型啟動子包括被類固醇激素、生長因子、金屬離子、熱休克等調節的那些。示例性的人或哺乳動物表達調節系統的非限制性實例包括編碼和調節微管蛋白、肌動蛋白或核纖層蛋白的表達的那些。一般而言,編碼異源蛋白的序列與編碼目標蛋白的內源序列符合讀框地整合。所述異源序列可在內源編碼序列的起始密碼子之後被符合讀框地整合。或者,所述異源序列可在內源編碼序列的終止密碼子之前被符合讀框地整合。(C)細胞
包含編碼上述異源蛋白的染色體整合序列的細胞類型可改變並會改變。一般而言,所述細胞可為真核細胞。在一些實例中,所述細胞可為原代細胞、培養細胞或永生的細胞系細胞。合適的細胞包括真菌或酵母(例如畢赤酵母屬O0ZcAia)、酵母屬{Saccharomyces、或裂殖酵母屬{Schizosaccharomyces)、;昆蟲細胞(例如來自草地貪夜蛾{Spodopterafrugiperda)的SF9細胞或來自黑腹果蜆iJ)rosophila meIanogaster)的S2細胞)和動物細胞(例如小鼠細胞、大鼠細胞、倉鼠細胞、非人靈長類細胞或人細胞)。示例性細胞為哺乳動物。所述哺乳動物細胞可為原代細胞。一般而言,可使用對雙鏈斷裂敏感的任何原代細胞。所述細胞可為多種細胞類型,例如成纖維細胞、肌原細胞、T細胞或B細胞、巨噬細胞、上皮細胞等。當使用哺乳動物細胞系時,所述細胞系可為任何已建立的細胞系或尚未描述的原代細胞系。所述細胞系可為貼壁或不貼壁的,或者所述細胞系可利用本領域的技術人員已知的標準技術在一定條件下生長,所述條件促進貼壁、不貼壁或器官型生長。合適的哺乳動物細胞系的非限制性實例包括中國倉鼠卵巢(CHO)細胞、SV40轉化的猴腎CVI系(C0S7)、人胚腎系293、幼倉鼠腎細胞(BHK)、小鼠支持細胞(TM4)、猴腎細胞(CVI-76)、非洲綠猴腎細胞(VERO)、人宮頸癌細胞(HeLa)、犬腎細胞(MDCK)、布法羅大鼠肝細胞(BRL 3A)、人肺細胞(W138)、人肝細胞Ofep G2)、小鼠乳腺腫瘤細胞(MMT)、大鼠肝癌細胞(HTC)、HIH/3T3細胞、人U2-0S骨肉瘤細胞系、人A549細胞系、人K562細胞系、人HEK293細胞系、人HEK293T細胞系和TRI細胞。對於哺乳動物細胞系的廣泛列表,本領域普通技術人員可參考美國典型培養物保藏中心目錄(ATCC ,Mamassas, VA)。而在其它的實施方案中,所述細胞可為幹細胞。合適的幹細胞包括但不限於胚胎幹細胞、ES樣幹細胞、胎兒幹細胞、成體幹細胞、多潛能幹細胞、誘導多能幹細胞、多能幹細胞、寡能幹細胞和單能幹細胞。在另外的實施方案中,所述細胞可為單細胞胚胎。所述胚胎可為脊椎動物或無脊椎動物。合適的脊椎動物包括哺乳動物、鳥、爬行動物、兩棲動物和魚。合適的哺乳動物的實例包括但不限於齧齒動物、伴侶動物、家畜和非靈長類。嚙齒類動物的非限制性實例包括小鼠、大鼠、倉鼠、沙鼠和豚鼠。合適的伴侶動物包括但不限於貓、狗、兔、刺蝟和雪貂。家畜的非限制性實例包括馬、山羊、綿羊、豬、牛、駝馬和羊駝。合適的非靈長類包括但不限於捲尾猴、黑猩猩、狐猴、獼猴、狨猴、絹毛猴、蜘蛛猴、松鼠猴和黑長尾猴。鳥的非限制性實例包括雞、火雞、鴨和鵝。或者,所述動物可為無脊椎動物(例如昆蟲、線蟲等)。昆蟲的非限制性實例包括果蠅屬{Drosophila)和蚊子。(II)用於整合異源編碼序列的方法
本公開內容的另一個方面提供了一種方法,所述方法用於將編碼至少一種異源蛋白的核酸整合至細胞染色體中的靶定位置使得所述異源蛋白的表達通過內源調節系統控制。所述方法包括使用靶向內切核酸酶以介導異源編碼序列符合讀框地與內源編碼序列的整合。更具體地,所述方法包括向細胞內弓I入至少一種靶向內切核酸酶或編碼靶向內切核酸酶的核酸以及包含異源編碼序列的至少一種供體多核苷酸。所述方法還包括將細胞保持在一定條件下,所述條件使得通過同源性定向的修復過程修復通過靶向內切核酸酶引入內源染色體序列中的雙鏈斷裂,使得所述供體多核苷酸中的異源序列符合讀框地與靶定染色體序列的編碼序列整合,從而連接異源編碼序列至內源調節系統。在以下詳述所述方法的組成。(a)靶向內切核酸酶
所述方法部分包括向細胞內引入至少一種靶向內切核酸酶或編碼靶向內切核酸酶的核酸。所述靶向內切核酸酶可為天然存在的蛋白或改造的蛋白。在一些實施方案中,所述靶向內切核酸酶可為大範圍核酸酶或尋靶內切核酸酶。在其它的實施方案中,所述靶向內切核酸酶可為轉錄激活因子樣效應子(TALE)-核酸酶。在優選的實施方案中,所述靶向內切核酸酶可為鋅指核酸酶。典型地,鋅指核酸酶包含DNA結合結構域(即,鋅指)和切割結構域(即,核酸酶),其在以下描述。(1)鋅指結合結構域
鋅指結合結構域可被改造以識別並結合任何選定的核酸序列。參見,例如,Beerli 等(2002) Nat. Biotechnol. 20:135-141 ;Pabo 等(2001) Ann. Rev. Biochem.70:313-340 ;Isalan 等(2001) Nat. Biotechnol. 19:656-660 ;Segal 等(2001)Curr. Opin. Biotechnol. 12:632-637 ;Choo 等(2000) Curr. Opin. Struct. Biol.10:411-416 ;Zhang 等(2000) J. Biol. Chem. 275 (43):33850-33860 ;Doyon 等(2008)Nat. Biotechnol. 26:702-708 和 Santiago 等(2008) Proc. Natl. Acad. Sci. USA105:5809-5814。改造的鋅指結合結構域相對於天然存在的鋅指蛋白可具有新的結合特異性。改造方法包括但不限於合理設計和多種類型的選擇。合理設計包括,例如,利用包含雙聯體、三聯體和/或四聯體核苷酸序列和單獨的鋅指胺基酸序列的資料庫,其中各個雙聯體、三聯體或四聯體核苷酸序列與結合特定的三聯體或四聯體序列的鋅指的一條或多條胺基酸序列相關。參見例如,美國專利第6,453,242號和第6,534,261號,其公開內容通過引用以其整體結合於本文中。作為實例,美國專利6,453,242中所述的算法可用於設計鋅指結合結構域以靶向預選定的序列。備選方法,例如使用非簡併性識別密碼錶的合理設計也可用於設計鋅指結合結構域以祀向特定序列(Sera等(2002) Biochemistry41:7074-7081)。用於鑑定DNA序列中的潛在靶位點和設計鋅指結合結構域的公眾可用的基於網絡的工具可分別參見 http://www. zincfingertools. org 和 http://bindr. gdcb.iastate. edu/ZiFiT/ (Mandell 等(2006) Nuc. Acid Res. 34:W516-ff523 ;Sander 等(2007) Nuc. Acid Res. 35:W599-W605)。鋅指結合結構域可被設計以識別並結合長度在約3個核苷酸-約21個核苷酸的DNA序列,或長度在約8個核苷酸-約19個核苷酸的DNA序列。一般而言,本文公開的鋅指核酸酶的鋅指結合結構域包含至少三個鋅指識別區(即,鋅指)。在一個實施方案中,所述鋅指結合結構域可包含四個鋅指識別區。在另一個實施方案中,所述鋅指結合結構域可包含五個鋅指識別區。而在另一個實施方案中,所述鋅指結合結構域可包含六個鋅指識別區。鋅指結合結構域可被設計以結合任何合適的靶DNA序列。參見,例如,美國專利第6,607,882號;第6,534,261號和第6,453,242號,其公開內容通過引用以其整體結合於本文中。選擇鋅指識別區的示例性方法可包括噬菌體展示和雙雜交系統,並公開於美國專利第 5,789,538 號;第 5,925,523 號;第 6,007,988 號;第 6,013,453 號;第 6,410,248號;第 6,140,466 號;第 6,200,759 號和 6,242,568 號;以及 W098/37186 ;W098/53057 ;W000/27878 ;W001/88197和GB2,338,237,其各自通過引用以其整體結合於本文中。此外,針對鋅指結合結構域的結合特異性的增強已在例如W002/077227中描述。鋅指結合結構域和用於設計和構建融合蛋白(以及編碼所述融合蛋白的多核苷酸)的方法為本領域的技術人員已知並且詳述於美國專利申請公布號20050064474和20060188987,其各自通過引用以其整體結合於本文中。鋅指識別區和/或多指鋅指蛋白可利用合適的接頭序列連接在一 起,所述接頭序列包括例如長度在5個或更多個胺基酸的接頭。關於長度在六個或更多個胺基酸的接頭序列的非限制性實例,參見美國專利第6,479,626號;第6,903,185號和第7,153,949號,其公開內容通過引用以其整體結合於本文中。本文所述的鋅指結合結構域可包含蛋白的單獨鋅指之間的合適接頭的組合。在一些實施方案中,所述鋅指核酸酶還可包含核定位信號或核定位序列(NLS)。NLS為促進鋅指核酸酶蛋白靶向至核中以在染色體的靶序列上引入雙鏈斷裂的胺基酸序列。核定位信號為本領域已知。參見,例如Makkerh等(1996) Current Biology6:1025-1027。示例性鋅指DNA結合結構域識別並結合與選自SEQ ID NO: 1、2、3、4、5、6、8和9的序列有至少約80%序列同一性的序列。在其它的實施方案中,所述序列同一性可為約81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99% 或
100% O(H)切割結構域
鋅指核酸酶還包含切割結構域。本文所公開的鋅指核酸酶的切割結構域部分可獲自任何內切核酸酶或外切核酸酶。可自其獲得切割結構域的內切核酸酶的非限制性實例包括但不限於限制性內切核酸酶和尋靶內切核酸酶。參見,例如,2002-2003目錄,New EnglandBiolabs, Beverly, Mass.和 Belfort 等(1997) Nucleic Acids Res. 25:3379-3388 或www. neb. com。切割DNA的其它酶為已知的(例如,SI核酸酶;綠豆核酸酶;胰DNA酶I ;微球菌核酸酶;酵母HO內切核酸酶)。還參見Linn等(編輯)Nucleases, Cold SpringHarbor Laboratory Press, 1993。這些酶中的一種或多種(或其有功能的片段)可用作切割結構域的來源。切割結構域還可來源於如上所述的酶或其部分,其需要二聚化用於切割活性。切割可能需要兩個鋅指核酸酶,因為各個核酸酶包含有活性的酶二聚體的單體。或者,單個鋅指核酸酶可包含兩個單體以產生有活性的酶二聚體。本文所用「有活性的酶二聚體」為能切割核酸分子的酶二聚體。所述兩個切割單體可來源於相同的內切核酸酶(或其有功能的片段),或者各單體可來源於不同的內切核酸酶(或其有功能的片段)。當兩個切割單體用於形成有活性的酶二聚體時,優選布置兩個鋅指核酸酶的識別位點,使得兩個鋅指核酸酶與其各自的識別位點的結合使切割單體彼此以允許所述切割單體例如通過二聚化形成有活性的酶二聚體的空間定向放置。因此,識別位點的近邊可被約5個-約18個核苷酸分離。例如,所述近邊可被約5個、6個、7個、8個、9個、10個、11個、12個、13個、14個、15個、16個、17個或18個核苷酸分離。然而應理解的是,任何整數的核苷酸或核苷酸對可插入兩個識別位點之間(例如約2個-約50個核苷酸對或更多對)。鋅指核酸酶的識別位點的近邊,例如本文詳細描述的那些,可被6個核苷酸分離。一般而言,切割位點位於識別位點之間。
限制性內切核酸酶(限制性酶)存在於許多物種中並能序列特異性結合DNA(在識別位點上),並且在結合位點上或附近切割DNA。某些限制性酶(例如,IIS型)在遠離識別位點的位點上切割DNA並且具有可分離的結合結構域和切割結構域。例如,IIS型酶FokI在一條鏈上距其識別位點9個核苷酸處和在另一條鏈上距其識別位點13個核苷酸處催化DNA的雙鏈切割。參見,例如,美國專利第5,356,802號;第5,436,150號和第5,487,994號;以及 Li 等(1992) Proc. Natl. Acad. Sci. USA 89:4275-4279 ;Li 等(1993) Proc.Natl. Acad. Sci. USA 90:2764-2768 ;Kim 等(1994a) Proc. Natl. Acad. Sci. USA91:883-887 ;Kim 等(1994b) J. Biol. Chem. 269:31,978-31,982。因此,鋅指核酸酶可包含來自至少一種IIS型限制性酶的切割結構域和一種或多種鋅指結合結構域,其可被改造或可不被改造。示例性IIS型限制性酶描述於例如國際公布W007/014,275中,其公開內容通過引用以其整體結合於本文中。另外的限制性 酶還包含可分離的結合結構域和切割結構域,並且其也包含於本公開內容中。參見,例如,Roberts等(2003) Nucleic AcidsRes. 31:418-420。其切割結構域可從結合結構域中分離出來的示例性IIS型限制性酶為FokI。該特定酶作為二聚體是有活性的(Bitinaite等(1998) Proc. Natl. Acad. Sci. USA 95: 10,570-10, 575)。因此,對於本公開內容的目的,用於鋅指核酸酶中的FokI酶的部分被認為是切割單體。因此,對於使用FokI切割結構域的靶定雙鏈切割,各自包含FokI切割單體的兩個鋅指核酸酶,可用於重構有活性的酶二聚體。或者,也可使用包含鋅指結合結構域和兩個FokI切割單體的單個多肽分子。在某些實施方案中,切割結構域可包含一個或多個改造的切割單體,其使均二聚化最小化或阻止均二聚化,如描述於例如美國專利公布第20050064474號、第20060188987號和第20080131962號中,其各自通過引用以其整體結合於本文中。作為非限制實例,在FokI 的 446 位、447 位、479 位、483 位、484 位、486 位、487 位、490 位、491 位、496 位、498 位、499位、500位、531位、534位、537位和538位的胺基酸殘基為影響FokI切割半結構域的二聚化的全部靶標。形成強制性異二聚體的FokI的示例性的改造切割單體包含一對單體,其中第一切割單體在FokI的胺基酸殘基位置490和538處包含突變並且第二切割單體在胺基酸殘基位置486和499處包含突變。因此,在一個實施方案中,胺基酸位置490的突變用Lys(K)代替Glu (E);胺基酸殘基538的突變用Lys (K)代替Iso(I);胺基酸殘基486的突變用Glu(E)代替Gln (Q);並且499位的突變用Lys (K)代替Iso (I)。具體地,改造的切割單體可通過以下製備將一個切割單體中的490位從E突變成K並將538位從I突變成K以產生命名為〃E490K: I538K〃的改造切割單體,以及將另一個切割單體中的486位從Q突變成E並將499位從I突變成L以產生命名為〃Q486E:I499L〃的改造切割單體。上述改造的切割單體為必要的異二聚體突變體,其中異常的切割被最小化或被消除。改造的切割單體可利用合適的方法(例如,通過如美國專利公布第20050064474號中所述的野生型切割單體(FokI)的定向誘變(參見實施例5))來製備。上述的鋅指核酸酶可被改造以在整合的靶定位點引入雙鏈斷裂。所述雙鏈斷裂可在整合的靶定位點,或者其可距整合位點多至I個、2個、3個、4個、5個、10個、15個、20個、25個、30個、35個、40個、45個、50個、100個或1000個核苷酸。在一些實施方案中,所述雙鏈斷裂可在距整合位點多至I個、2個、3個、4個、5個、10個、15個或20個核苷酸處。在其它的實施方案中,所述雙鏈斷裂可在距整合位點多至10個、15個、20個、25個、30個、35個、40個、45個或50個核苷酸處。而在其它實施方案中,所述雙鏈斷裂可在距整合位點多至50個、100個或1000個核苷酸處。(Hi)勒1 定切割的另外的方法
染色體序列中具有靶位點的任何核酸酶可用於本文所公開的方法。例如尋靶內切核酸酶和大範圍核酸酶具有非常長的識別序列,其中的一些基於統計學可能在人大小的基因組中出現一次。在細胞基因組中具有獨特靶位點的任何此類核酸酶可代替鋅指核酸酶或加上鋅指核酸酶用於細胞染色體的靶定切割。尋靶內切核酸酶的非限制性實例包括I-SceI、I-CeuI、PI-PspI、PI-Sce、I-SceIV、I-CsmI、I-PanI, I-Scell, I-PpoI, I-SceIII, I-CreI, I-TevI, I-TevII 和 I-TevIII0 這些酶的識別序列為本領域已知。還參見美國專利第5,420,032號;美國專利第6,833,252 號;Be I fort 等(1997) Nucleic Acids Res. 25:3379-3388 ;Dujon 等(1989) Gene82:115-118 ;Perler 等(1994) Nucleic Acids Res. 22, 1125-1127; Jasin (1996)Trends Genet. 12:224-228 ;Gimble 等(1996) J. Mol. Biol. 263:163-180 ;Argast 等(1998) J. Mol. Biol. 280:345-353 和 the New England Biolabs 目錄。儘管大多數尋靶內切核酸酶的切割特異性並不絕對針對其識別位點,但所述位點具有足夠長度以致單個切割事件/哺乳動物大小的基因組可通過在包含其識別位點的單拷貝的細胞中表達尋靶內切核酸酶來獲得。還已報導尋靶內切核酸酶和大範圍核酸酶的特異性可被改造以結合非天然的祀位點。參見,例如,Chevalier等(2002) Molec. Cell10:895-905 ;Epinat 等(2003) Nucleic Acids Res. 31:2952-2962 ;Ashworth 等(2006)Nature 441:656-659 ;Paque 等(2007) Current Gene Therapy 7:49-66。(iv)編碼鋅指核酸酶的核酸
鋅指核酸酶可以編碼鋅指核酸酶的核酸引入細胞中。所述編碼鋅指核酸酶的核酸可為DNA或RNA。在一個實施方案中,所述編碼鋅指核酸酶的核酸可為DNA。例如,包含鋅指核酸酶編碼序列的質粒DNA可引入細胞中。在另一個實施方案中,所述編碼鋅指核酸酶的核酸可為RNA或mRNA。當所述編碼鋅指核酸酶的核酸為mRNA時,所述mRNA分子可為5』加帽的。相似地,當編碼鋅指核酸酶的核酸為mRNA時,所述mRNA分子可被聚腺苷酸化。因此,本方法的核酸可為編碼鋅指核酸酶的加帽和聚腺苷酸化的mRNA分子。用於加帽和聚腺苷酸化mRNA的方法為本領域已知。(b)供體多核苷酸
用於將異源編碼序列整合至靶定染色體序列的方法還包括向細胞中引入至少一種包含異源編碼序列的供體多核苷酸。供體多核苷酸不僅包含如章節(I) (a)在上文詳述的異源編碼序列,而且還包含上遊序列和下遊序列。所述上遊序列和下遊序列側接供體多核苷酸中的異源編碼序列。此外,所述上遊序列和下遊序列與染色體中整合位點的任一側享有基本的序列同一性。選擇供體多核苷酸中的上遊序列和下遊序列以促進靶定染色體序列和供體多核苷酸之間的重組。本文所用的上遊序列是指與整合的靶定位點上遊的染色體序列享有序列相似性的核酸序列。相似地,所述下遊序列是指與整合的靶定位點下遊的染色體序列享有序列相似性的核酸序列。所述供體多核苷酸中的上遊序列和下遊序列與靶定染色體序列可具有約75%、80%、85%、90%、95%或100%的序列同一性。在其它的實施方案中,所述供體多核苷酸中的上遊序列和下遊序列與靶定染色體序列可具有約95%、96%、97%、98%、99%或100%的序列同一性。在示例性實施方案中,所述供體多核苷酸中的上遊序列和下遊序列與靶定染色體序列可有約99%或100%的序列同一性。上遊序列或下遊序列可包含約20bp_約2500bp。在一個實施方案中,上遊序列或下遊序列可包含約 50、100、200、300、400、500、600、700、800、900、1000、1100、1200、1300、1400、1500、1600、1700、1800、1900、2000、2100、2200、2300、2400 或 2500bp。示例性的上遊序列或下遊序列可包含約200bp-約2000bp、約600bp-約IOOObp或更具體地約700bp-約IOOObp。典型地,所述供體多核苷酸可為DNA。所述供體多核苷酸可為DNA質粒、細菌人工染色體(BAC)、酵母人工染色體(YAC)、病毒載體、DNA的線性碎片、PCR片段、裸核酸或與遞送載體(例如脂質體或泊洛沙姆)複合的核酸。在一個實施方案中,包含異源編碼序列的供體多核苷酸可為DNA質粒。在另一個實施方案中,包含異源編碼序列的供體多核苷酸可為 BAC0本領域的技術人員能使用熟知的標準重組技術(參見,例如,Sambrook等,2001和Ausubel等,1996)構建如本文所述的供體多核苷酸。(C)遞送至細胞
將在上文章節(II) (a)和(II) (b)中詳述的鋅指核酸酶或編碼鋅指核酸酶的核酸和供體多核苷酸引入細胞中。合適的遞送方法包括顯微注射、電穿孔、聲致穿孔(sonoporation)、生物彈射、磷酸 丐介導的轉染、陽離子轉染、脂質體轉染、樹形高分子轉染、熱休克轉染、核轉染、磁轉染、脂轉染、基因交付(impalefection)、光轉染、核酸的專有試劑增強攝取以及經由脂質體、免疫脂質體、病毒顆粒或人工毒粒的遞送。在一個實施方案中,所述分子可通過核轉染引入細胞中。在另一個實施方案中,所述分子可通過顯微注射引入。所述分子可顯微注射進細胞的核或胞質中。包含異源編碼序列的供體多核苷酸與鋅指核酸酶或編碼鋅指核酸酶的核酸的比例可改變並會改變。一般而言,所述供體多核苷酸與所述鋅指核酸酶分子的比例可為約1:10-約10:1。在不同的實施方案中,供體多核苷酸與鋅指核酸酶分子的比例可為約1:10、1:9、1:8、1:7、1:6、1:5、1:4、1:3、1:2、1:1、2:1、3:1、4:1、5:1、6:1、7:1、8:1、9:1或10:1。在一個實施方案中,所述比例可為約1:1。在其中將多於一種鋅指核酸酶分子和多於一種供體多核苷酸引入細胞中的實施方案中,所述分子可同時或序貫引入。例如,各自對不同識別序列特異的鋅指核酸酶分子以及相應的供體多核苷酸,可同時引入。或者,各鋅指分子以及相應的供體多核苷酸可序貫引入。(d)培養細胞
所述方法還包括將細胞保持在合適的條件下,使得可發生鋅指核酸酶介導的整合。細胞可使用標準程序培養以允許鋅指核酸酶的表達。標準細胞培養技術描述於例如Santiago等(2008) PNAS 105:5809-5814 ;Moehle 等(2007) PNAS 104:3055-3060 ;Urnov 等(2005)Nature 435:646-651 和 Lombardo 等(2007) Nat. Biotechnology 25:1298-1306。本領域的技術人員理解的是用於培養細胞的方法為本領域已知並且可以且會視細胞類型而變化。在所有情況下可使用常規優化,以確定用於特定細胞類型的最佳技術。在其中細胞為單細胞胚胎的實施方案中,所述胚胎可在體外(例如,在細胞培養物中)培養。典型地,所述胚胎在合適的溫度下和含有必需的o2/co2比例的合適培養基中培養以允許鋅指核酸酶的表達。培養基的合適的非限制性實例包括M2、M16、KS0M、BM0C和HTF培養基。技術人員應理解的是培養條件可以並且會視胚胎的種類而變化。在所有情況下可使用常規優化,以確定用於胚胎的特定種類的最佳培養條件。在一些實例中,所述胚胎還可通過將胚胎轉移至雌性宿主的子宮中在體內培養。一般而言,所述雌性宿主來自與所述胚胎相同或相似的物種。優選地,所述雌性宿主為假孕的。製備假孕雌性宿主的方法為本領域已知。此外,將胚胎轉移至雌性宿主的方法是已知的。體內培養胚胎允許胚胎發育並且可導致來源於胚胎的動物的活產。在該方法的該步驟中,所述鋅指核酸酶(在一些情況下其表達自引入的核酸)識 另O、結合併切割染色體中的靶序列。通過鋅指核酸酶引入的雙鏈斷裂經由與供體多核苷酸同源重組而被修復,使得供體多核苷酸的異源編碼序列整合至染色體位置。所述供體多核苷酸可被物理地整合,或者所述供體多核苷酸可用作用於斷裂修復的模板,導致異源編碼序列以及供體多核苷酸的上遊序列和下遊序列的全部或部分整合至染色體。 (III)利用內源調節子系統調節異源蛋白的表達的方法
又一個方面提供了使用內源調節系統調節異源蛋白的表達的方法。所述方法包括利用如以上章節(I)中詳述的包含編碼至少一種異源蛋白的染色體整合序列的細胞,或如以上章節(II)中詳述地將編碼至少一種異源蛋白的序列整合至靶定染色體位置。所述方法還包括將細胞保持在一定條件下,所述條件使得內源調節系統被活化,並使內源編碼序列和異源編碼序列轉錄成單一轉錄物。由於2A肽的存在所致,在翻譯期間產生分離的內源蛋白和異源蛋白。因此,異源蛋白的表達通過內源的轉錄調節機制控制。(IV)應用
本文公開的方法可用於多種商業用途、研究用途和臨床用途。由於內源序列和異源序列轉錄為含一個開放閱讀框的轉錄物,所產生的各蛋白的量是基本相似的。因此,細胞中產生的異源蛋白的水平可通過選擇合適的內源調節系統來控制。此外,由於內源調節系統用於調節其表達,所述異源序列典型地不經歷沉默效應。本文提供的方法和細胞可用於產生大量具有多種商業應用的重組蛋白。所述重組蛋白可為抗體、抗體片段、單克隆抗體、抗體重鏈、抗體輕鏈、人源化抗體、人源化單克隆抗體、嵌合抗體、糖蛋白、酶、治療蛋白、營養製劑蛋白、疫苗和作血液因子、血栓溶解劑、抗凝血劑、激素、生長因子、幹擾素或白細胞介素起作用的蛋白。此外,本文公開的方法和細胞也可用於將治療蛋白遞送至細胞中,使得所述細胞在合適的水平下持續產生治療蛋白。定義
除非另外定義,否則本文所用的所有技術術語和科學術語具有本發明所屬領域的技術人員通常理解的含義。以下引用提供技術人員本發明所用的許多術語的普遍定義Singleton 等,Dictionary of Microbiology and Molecular Biology (第二片反 1994);The Cambridge Dictionary of Science and Technology (Walker 編輯,1988) ;TheGlossary of Genetics,第五版,R. Rieger 等(編輯),Springer Verlag (1991)以及Hale 和 Marham, The Harper Collins Dictionary of Biology (1991)。除非另有規定,否則本文所用的以下術語具有賦予其的含義。當介紹本公開內容或其優選實施方案的要素時,冠詞「一種」、「一個」、「所述」和「該」意指存在一個或多個要素。術語「包括」、「包含」和「具有」意味著包括性的並且意指可存在除列出要素之外的其它要素。本文所用「基因」是指編碼基因產物的DNA區(包含外顯子和內含子),以及調節所述基因產物產生的所有DNA區,無論此類調節序列是否與編碼序列和/或轉錄序列鄰接。因此,基因包括但並不一定限於啟動子序列、終止子、翻譯調節序列(例如核糖體結合位點和內部核糖體進入位點)、增強子、沉默子、絕緣子、邊界元件、複製起點、基質附著位點和基因座控制區。「異源蛋白」是對於目標細胞或有機體並非天然的(即,外來的)蛋白。術語「核酸」和「多核苷酸」是指呈線性或環狀構象和呈單鏈或雙鏈形式的脫氧核糖核苷酸或核糖核苷酸聚合物。對於本公開內容的目的,就聚合物的長度而言這些術語並不應理解為限制。所述術語可包含天然核苷酸的已知類似物以及在鹼基、糖和/或磷酸酯部分(或例如硫代磷酸酯骨架)被修飾的核苷酸。一般而言,特定核苷酸的類似物具有相同的鹼基配對特異性,即,A的類似物可與T鹼基配對。術語「多肽」和「蛋白」可互換用於指代胺基酸殘基的聚合物。術語「重組」是指遺傳信息在兩個多核苷酸之間的交換過程。對於本公開內容的目的,「同源重組」是指例如在細胞的雙鏈斷裂的修復期間發生的此類交換的專化形式。該過程需要兩個多核苷酸之間的序列相似性,將「供體」或「交換」分子用於「靶」分子(即經歷雙鏈斷裂的那個分子)的模板修復,以及不同地被稱作「非交換型基因轉換」或「短道基 因轉換」,因為其導致遺傳信息從供體向靶的轉移。在不被任何特定理論限制的情況下,此類轉移可涉及異源雙鏈DNA的錯配校正(所述異源雙鏈DNA在斷裂的靶和供體之間形成),和/或「合成依賴性鏈退火」(其中所述供體用於重新合成將成為靶的一部分的遺傳信息),和/或相關過程。此類專化同源重組往往導致靶分子中序列的改變,使得所述供體多核苷酸中序列的部分或全部摻入靶多核苷酸中。 本文所用術語「靶位點」或「靶序列」是指這樣的核酸序列,其限定待編輯的染色體序列的一部分,並且鋅指核酸酶經改造以識別並結合該核酸序列,條件是存在用於結合的充足條件。用於確定核酸和胺基酸的序列同一性的技術為本領域已知。典型地,此類技術包括確定基因的mRNA的核苷酸序列和/或確定由其編碼的胺基酸序列,並將這些序列與第二核苷酸或胺基酸序列比較。還可以該方式確定並比較基因組序列。一般而言,同一性是指兩個多核苷酸或多肽序列分別的精確的核苷酸與核苷酸對應性或胺基酸與胺基酸對應性。兩個或更多個序列(多核苷酸或胺基酸)可通過確定其同一性百分比來比較。兩個序列(無論核酸或胺基酸的序列)的同一性百分比,為兩個比對序列之間的精確匹配的數目除以較短序列的長度,並乘以100。核酸序列的近似比對由Smith和Waterman, Advancesin Applied Mathematics 2:482-489 (1981)的局部同源性算法提供。該算法可通過使用由 Dayhoff, Atlas of Protein Sequences and Structure, M. 0. Dayhoff 編,5 增刊3:353-358, National Biomedical Research Foundation, Washington, D. C. , USA 開發並由Gribskov, NucI. Acids Res. 14(6) :6745-6763 (1986)歸一化的打分矩陣而應用於胺基酸序列。確定序列同一'I"生百分比的該算法的示例性工具由Genetics Computer Group(Madison, ffis.)提供於「BestFit」實用應用中。計算序列之間的同一'I"生百分比或相似性的其它合適的程序一般在本領域中為已知的,例如,另一個比對程序是BLAST,其使用默認參數。例如,BLASTN和BLASTP可通過使用下面的默認參數來使用遺傳密碼=標準;過濾器=無;鏈=兩者;截止=60 ;期望=10 ;矩陣=BL0SUM62 ;描述=50個序列;排序=高分;資料庫=非冗餘的,GenBank+EMBL+DDBJ+PDB +GenBank CDS 翻譯+Swiss 蛋白 +Spupdate+PIR。這些程序的細節可見於GenBank網站。關於本文所述的序列,序列同一性的所需程度的範圍為約80%至100%以及其之間的任何整數值。通常,序列之間的同一性百分比為至少70-75%、優選80-82%、更優選85-90%、甚至更優選92%、仍更優選95%和最優選98%序列同一性。。或者,多核苷酸之間的序列相似性的程度可通過如下確定在允許享有一定程度序列同一性的區之間形成穩定雙鏈體的條件下雜交多核苷酸,隨後用單鏈特異性的核酸酶消化,並確定消化片段的大小。當如使用以上方法所確定的,在分子的限定長度內序列表現出至少約70%-75%,優選80%-82%,更優選85%_90%,甚至更優選92%,還更優選95%並且最優選98%序列同一性時,兩個核酸或兩個多肽序列為彼此基本相似的。本文所用的基本相似還指對特定的DNA或多肽序列顯示出完全同一性的序列。基本相似的DNA序列可在例如如對該特定系統限定的嚴格條件下的Southern雜交實驗中鑑定。限定合適的雜交條件在本領域的技術之內。參見,例如,Sambrook等,見上文;Nucleic Acid Hybridization: APractical Approach,編者B. D. Hames和S. J. Higgins, (1985) Oxford; Washington,D. C. ; IRL Press)。兩個核酸片段的選擇性雜交可如下確定。兩個核酸分子之間的序列同一性的程度影響此類分子之間雜交事件的效率和強度。部分相同的核酸序列可至少部分抑制完全相同序列與靶分子的雜交。完全相同序列的雜交的抑制可使用本領域熟知的雜交測定來評價(例如,Southern (DNA)印跡、Northern (RNA)印跡、溶液雜交等,參見Sambrook等,Molecular Cloning: A Laboratory Manual,第二版,(1989) Cold Spring Harbor,N. Y.)。這類測定可用不同程度的選擇性來進行,例如使用從低嚴格性到高嚴格性變化的條件。若應用低嚴格性的條件,則非特異性結合的缺乏可利用第二探針來評價,所述第二探針甚至缺少部分程度的序列同一性(例如,與靶分子有少於約30%序列同一性的探針),使得在不存在非特異性結合事件的情況下,所述第二探針不會與靶標雜交。當運用基於雜交的檢測系統時,選擇與參考核酸序列互補的核酸探針,並接著通過選擇合適條件,使探針與參考序列彼此選擇性地雜交或結合以形成雙鏈體分子。在中度嚴格性的雜交條件下能選擇性地與參考序列雜交的核酸分子典型地在一定條件下雜交,所述條件允許檢測與選定核酸探針的序列有至少約70%序列同一性的、長度為至少約10-14個核苷酸的靶核酸序列。嚴格的雜交條件典型地允許檢測與選定核酸探針的序列有大於約90-95%的序列同一性的、長度為至少約10-14個核苷酸的靶核酸序列。當探針和參考序列有特定程度的序列同一性時,可如本領域已知地來確定可用於探針/參考序列雜交的雜交條件(參見,例如 Nucleic Acid Hybridization: A Practical Approach,編者 B. D.Hames 和 S. J. Higgins, (1985) Oxford; Washington, D. C. ; IRL Press))。雜交的條件為本領域的技術人員所熟知。
雜交嚴格性是指雜交條件不利於包含錯配核苷酸的雜合體的形成的程度,更高的嚴格性與不匹配雜合體的較低容許限度相關。影響雜交嚴格性的因素為本領域的技術人員熟知並且包括但不限於溫度、pH、離子強度和有機溶劑(例如甲醯胺和二甲基亞碸)的濃度。如本領域的技術人員已知,雜交嚴格性通過較高的溫度、較低的離子強度和較低的溶劑濃度來增加。關於雜交的嚴格性條件,本領域熟知的是,可應用許多同等條件以通過改變例如以下因素來建立特定的嚴格性序列的長度和性質、不同序列的鹼基組成、鹽和其它雜交溶液組分的濃度、雜交溶液中存在或不存在阻斷劑(例如,葡聚糖硫酸酯和聚乙二醇)、雜交反應溫度和時間參數以及不同的洗滌條件。雜交條件的具體組合可依據本領域中的標準方法來選擇(參見,例如,Sambrook 等,Molecular Cloning: A Laboratory Manual,第二版,(1989) Cold Spring Harbor, N. Y.)。 實施例包含以下實施例以闡述本發明。實施例I:利用TUBAlB啟動子表達異源蛋白
以下實施例詳述了利用微管蛋白啟動子調節異源蛋白的表達。編碼微管蛋白α-lB,被選擇為靶染色體序列。設計一對鋅指核酸酶(ZFN)以靶向人TZ/似7沒基因座的位置。對於關於ZFN和用於編輯染色體區的方法的更多細節參見PCT/US2010/43167,其公開內容通過引用以其整體結合於本文中。設計了一種結合序列5』 CTTCGCCTCCTAATC 3』(SEQID NO: I)的 ZFN,並設計了另一種結合序列 5』 CACTATGGTGAGTAA 3』(SEQ ID NO: 2)的 ZFN(圖1Α)。在結合時,所述ZFN對在位於兩個ZFN識別序列之間的序列5』 CCTAGC 3』中引入雙鏈斷裂。利用已知的分子生物學技術產生了編碼ZFN對的加帽的、聚腺苷腺化的mRNA。目標基因(即,SH2生物傳感器)包含編碼GFP的序列,其與兩個SH2結構域(來自Grb2銜接蛋白)和2A肽結構域連接(參見圖1B)。構建質粒(圖2)以用作將SH2生物傳感器序列靶定整合至人細胞系的TZ/似基因座的供體多核苷酸。該質粒包含被通過ZFN對引入的切割位點上遊和下遊的IKb和700 bp TZ/似7沒基因座序列側接的SH2生物傳感器編碼序列。設計質粒使得SH2生物傳感器編碼序列與恰好在微管蛋白起始密碼子下遊處的內源序列符合讀框地整合。在基因座活化時,得到兩種分離的蛋白,如圖IB中所述。將供體質粒和編碼ZFN的RNA對轉染至U20S、A549、K562、HEK293或HEK293T細胞中。所述核酸混合物包含一份供體DNA比一份ZFN RNA。接著將轉染的細胞在標準條件下培養。單獨的細胞克隆的分析表明了 GFP螢光,提示異源生物傳感器的表達。蛋白印跡分析證實了 α -微管蛋白的表達不受靶定整合的影響(圖3)。包含SH2 (Grb2)的生物傳感器被EGF激活並經歷核易位。將A549細胞用核酸轉染並培養以允許TUBAlB基因座的整合和表達。將細胞暴露於100ng/ml的EGF下並拍照。圖4出示了 SH2生物傳感器的核易位的時程。實施例2使用ACTB啟動子表達異源蛋白
設計以下實施例以檢測更強啟動子的用途。熟知的強啟動子在JCTS基因座內,JCTS基因座編碼β-肌動蛋白。設計一對ZFN靶向人JCTS基因座(圖5)。設計了一種結合序列 5』 GTCGTCGACAACGGCTCC 3,(SEQ ID NO: 3)的 ZFN,並設計了另一種結合序列 5』TGCAAGGCCGGCTTCGCGG 3』(SEQ ID NO:4)的ZFN。在結合時,ZFN對將雙鏈斷裂引入位於兩個ZFN識別序列之間的序列5』 GGCATG 3,中。設計供體質粒以提供SH2生物傳感器序列,以及標記內源產生的β -肌動蛋白(即,GFP-2x-SH2 (Grb2)-2A-RFP)(圖6)。將核酸引入細胞中,並製得兩種螢光蛋白(即,GFP-SH2生物傳感器和RFP-肌動蛋白)。利用螢光顯微術監控各蛋白的螢光。將A549細胞用核酸轉染並培養以允許JCTS基因座的整合和表達。將細胞暴露於100 ng/ml的EGF下並拍照。圖7出示了 GFP_Grb2生物傳感器的易位的時程以及RFP-肌動蛋白的位置。產生的生物傳感器的量如此高以致於有高水平的未結合或「游離」的生物傳感器,從而極大地增加了背景螢光的量。實施例3使用LMNBI啟動子表達異源蛋白
為了靶向基因座(其編碼核纖層蛋白BI蛋白),製備了另一對ZFN (圖8)。設計了一種結合序列5』 CCTCGCCGCCCCGCT 3』(SEQ ID NO: 5)的ZFN,並設計了另一種結合序列5』GCCGCCCGCCATGGCG 3』 (SEQ ID NO:6)的ZFN。在結合時,ZFN對將雙鏈斷裂引入位於兩個識別序列之間的序列5』 GTCTCC 3』中。可構建供體質粒以包含編碼異源蛋白的序列,所述序列被ZFN切割位點上遊和下mUMNBl序列側接。編碼ZFN的核酸和供體質粒可被引入細胞中,並且可如上詳述地監測細胞。實施例4使用ACTB啟動子表達兩種異源蛋白
設計該實施例以確定是否可從相同的內源啟動子同時表達兩種異源蛋白。選擇JCTS基因座用於編碼分泌性鹼性磷酸酶(SEAP ;約56kD)和GFP (約27kD)的序列的整合。選擇這些蛋白是由於其具有與抗體的輕鏈和重鏈近似相同的大小。設計ZFN靶向中國倉鼠卵巢(CHO)細胞的JCTS基因座(參見圖9),使得異源序列恰好整合至起始密碼子的下遊。設計了一種結合序列5』 CTTTTGTGCCCTGATA 3』 (SEQ IDNO:8)的 ZFN,並設計另一種結合序列 5』 GCCATGGATGACGATATC 3』 (SEQ ID NO:9)的 ZFN。在結合時,ZFN對將雙鏈斷裂引入位於兩個識別序列之間的序列5』 TAGTTC 3』中。構建包含待整合序列(即,SEAP-2A-GFP)的供體質粒,所述待整合序列被ZFN切割位點上遊和下遊的CHO JCTS序列側接(圖10)。編碼ZFN的核酸和供體質粒(以低濃度或高濃度)核轉染至CHO細胞中,並如上詳述地保持細胞。靶定整合通過利用HAdet+2和SEAP-500引物的接頭PCR分析來證實,所述引物如預期地擴增1,232個鹼基對的片段(圖11)。CHO細胞的特徵在於供體DNA的高速隨機整合。為了檢查這個特徵,利用GFP追蹤靶定插入和隨機插入基因座的靶定整合產生GFP-肌動蛋白,其可在細胞中作為綠色微絲可見。隨機整合產生均勻的綠色細胞而無定位的GFP蛋白。然而,編碼SEAP和GFP的序列至ACTS基因座U20S細胞的整合(如以上的實施例2中所詳述地),導致靶定整合對比隨機整合的高得多的比例。可能的是,通過摻入自殺基因至供體質粒來消除CHO細胞中的隨機整合。通過隨機整合僅發生自殺基因的摻入。由於自殺基因的活性,在隨機整合的情況下將無活細胞。因此,可分離靶定整合克隆。實施例5使用ACTB啟動子表達抗體
CHO細胞常用於生產治療蛋白(例如抗體)。以上詳細描述的CHO供體質粒中的SEAP編碼序列可交換為編碼抗體的輕鏈和重鏈的序列。供體質粒中的序列可如上詳述地 整合至CHO細胞的JCTS基因座中。表達的抗體分子可使用標準程序從CHO細胞中純化。
權利要求
1.一種將編碼至少一種異源蛋白的序列整合至細胞的染色體中使得所述至少一種異源蛋白的表達通過內源調節系統來調節的方法,所述方法包括 a)將以下物質引入細胞中(i)至少一種靶向內切核酸酶或編碼靶向內切核酸酶的核酸,所述靶向內切核酸酶能結合靶序列並切割編碼內源蛋白的靶定染色體序列中的切割位點;和(ii)包含編碼所述至少一種異源蛋白的序列的至少一種供體多核苷酸,所述序列與編碼2A肽的序列連接以形成異源蛋白編碼序列,所述異源蛋白編碼序列被與切割位點任一側有基本序列同一性的上遊序列和下遊序列側接;和 (b)將所述細胞保持在這樣的條件下,所述條件使得通過同源性定向的修復過程修復通過靶向內切核酸酶引入靶定染色體序列中的雙鏈斷裂,使得所述供體多核苷酸中的所述異源蛋白編碼序列符合讀框地整合至靶定染色體序列中,從而所述至少一種異源蛋白的表達通過調節內源蛋白表達的內源調節系統來調節。
2.權利要求I的方法,其中所述靶向內切核酸酶為鋅指核酸酶。
3.權利要求I的方法,其中所述編碼2A肽的序列連接至編碼異源蛋白的序列的5』或3,。
4.權利要求I的方法,其中所述異源蛋白編碼序列在靶定染色體序列的蛋白編碼序列的起始或末尾附近整合。
5.權利要求I的方法,其中所述至少一種異源蛋白為抗體重鏈或抗體輕鏈。
6.權利要求I的方法,其中所述細胞為人細胞或哺乳動物細胞。
7.權利要求I的方法,其中所述靶定染色體序列編碼肌動蛋白、微管蛋白或核纖層蛋白。
8.權利要求I的方法,其中所述靶向內切核酸酶為鋅指核酸酶,其結合與選自SEQIDNO: 1、2、3、4、5、6、7和8的序列有至少約80%序列同一1丨生的序列。
9.權利要求8的方法,其中所述序列同一性為約85%、90%、95%、99%或100%。
10.權利要求8的方法,其中所述細胞為中國倉鼠卵巢(CHO)細胞,所述靶定染色體序列編碼肌動蛋白,並且所述鋅指核酸酶結合選自SEQ ID NO: 7和SEQ ID NO: 8的序列。
11.一種包含編碼至少一種異源蛋白的染色體整合序列的細胞,所述編碼至少一種異源蛋白的序列與編碼內源蛋白的染色體序列符合讀框地整合,使得所述至少一種異源蛋白的表達與所述內源蛋白的表達被同等地控制。
12.權利要求11的細胞,其中編碼所述至少一種異源蛋白的序列通過編碼2A肽的序列與編碼所述內源蛋白的染色體序列連接。
13.權利要求12的細胞,其中所述內源蛋白和異源蛋白各自作為不連續的實體產生。
14.權利要求12的細胞,其中編碼2A肽的序列連接至編碼異源蛋白的序列的5』或3,。
15.權利要求11的細胞,其中所述編碼異源蛋白的序列在內源蛋白編碼序列的起始或末尾附近整合。
16.權利要求11的細胞,其中所述染色體序列編碼肌動蛋白、微管蛋白或核纖層蛋白。
17.權利要求11的細胞,其中所述細胞為人細胞或哺乳動物細胞。
18.權利要求11的細胞,其中所述細胞為中國倉鼠卵巢(CHO)細胞,所述染色體序列編碼肌動蛋白,並且所述異源蛋白為抗體重鏈或抗體輕鏈。
19.一種供體多核苷酸,所述供體多核苷酸包含編碼至少一種異源蛋白的序列,所述序列與編碼2A肽的序列連接以形成異源蛋白編碼序列,所述異源蛋白編碼序列被與靶細胞的染色體序列中切割位點的任一側享有基本序列同一性的上遊序列和下遊序列側接。
20.權利要求19的供體多核苷酸,其中所述供體多核苷酸為質粒載體。
21.權利要求19的供體多核苷酸,其中所述編碼2A肽的序列連接至編碼異源蛋白的序列的5』或3』。
22.權利要求19的供體多核苷酸,其中所述染色體序列編碼肌動蛋白、微管蛋白或核纖層蛋白。
23.權利要求19的供體多核苷酸,其中所述靶細胞為人細胞或哺乳動物細胞。
24.權利要求19的供體多核苷酸,其中所述供體多核苷酸為質粒載體,所述靶細胞為中國倉鼠卵巢(CHO)細胞,並且所述染色體序列編碼肌動蛋白。
25.權利要求24的供體多核苷酸,其中所述異源蛋白為抗體重鏈或抗體輕鏈。
26.一種將編碼至少一種異源蛋白的序列整合至編碼內源蛋白的染色體序列中的試劑盒,所述試劑盒包括 (a)至少一種編碼鋅指核酸酶的核酸,所述鋅指核酸酶能結合靶序列並切割染色體序列中的切割位點,和 (b)至少一種供體多核苷酸,所述供體多核苷酸包含編碼至少一種異源蛋白的序列,所述序列與編碼2A肽的序列連接以形成異源蛋白編碼序列,所述異源蛋白序列被與細胞染色體序列中切割位點的任一側有基本序列同一性的上遊序列和下遊序列側接。
27.權利要求26的試劑盒,其中所述至少一種編碼鋅指核酸酶的核酸為核糖核酸。
28.權利要求26的試劑盒,其中所述鋅指核酸酶結合與選自SEQID N0:l、2、3、4、5、6、7和8的序列有至少約80%序列同一性的序列。
29.權利要求28的試劑盒,其中所述序列同一性為約85%、90%、95%、99%或100%。
30.權利要求26的試劑盒,其中所述至少一種供體多核苷酸為質粒載體。
31.權利要求26的試劑盒,其中所述編碼2A肽的序列連接至編碼異源蛋白的序列的.5,或 3,。
32.權利要求26的試劑盒,其中所述染色體序列編碼肌動蛋白、微管蛋白或核纖層蛋白。
33.權利要求26的試劑盒,其中所述靶細胞為人細胞或哺乳動物細胞。
34.權利要求26的試劑盒,其中所述供體多核苷酸為質粒載體,所述靶細胞為中國倉鼠卵巢(CHO)細胞,並且所述染色體序列編碼肌動蛋白。
35.權利要求34的試劑盒,其中所述鋅指核酸酶結合選自SEQID NO: 7和SEQ ID NO:8的序列。
36.權利要求34的試劑盒,其中所述異源蛋白為抗體重鏈或抗體輕鏈。
37.一種利用內源調節系統調節至少一種異源蛋白的表達的方法,所述方法包括 (a)提供包含編碼至少一種異源蛋白的染色體整合序列的細胞,所述染色體整合序列與編碼2A肽的序列連接,所述編碼異源蛋白和2A肽的序列與編碼內源蛋白的染色體序列符合讀框地整合,和(b)將所述細胞保持在這樣的條件下,所述條件使得內源調節系統的活化產生編碼異源蛋白、2A肽和所述內源蛋白的一種轉錄物,其中所述2A肽中斷翻譯使所述異源蛋白和所述內源蛋白各自作為不連續的實體產生。
38.權利要求37的方法,其中所述編碼2A肽的序列連接至編碼異源蛋白的序列的5』或3,。
39.權利要求37的方法,其中編碼異源蛋白的序列在內源蛋白編碼序列的起始或末尾附近整合。
40.權利要求37的方法,其中所述染色體序列編碼肌動蛋白、微管蛋白或核纖層蛋白。
41.權利要求37的方法,其中所述細胞為人細胞或哺乳動物細胞。
42.權利要求37的方法,其中所述細胞為中國倉鼠卵巢(CHO)細胞,所述染色體序列編碼肌動蛋白,並且所述異源蛋白為抗體重鏈或抗體輕鏈。
全文摘要
本發明提供了利用內源的轉錄控制系統調節異源蛋白的表達的方法。具體而言,靶定基因組編輯用於將編碼異源蛋白的序列符合讀框地與內源的編碼序列整合,使得所述異源序列和內源序列的表達通過內源控制系統來調節。
文檔編號C12N15/00GK102959078SQ201180029129
公開日2013年3月6日 申請日期2011年4月13日 優先權日2010年4月13日
發明者G.戴維斯, D.馬爾科夫, N.津澤 申請人:西格馬-奧爾德裡奇有限責任公司

同类文章

一種新型多功能組合攝影箱的製作方法

一種新型多功能組合攝影箱的製作方法【專利摘要】本實用新型公開了一種新型多功能組合攝影箱,包括敞開式箱體和前攝影蓋,在箱體頂部設有移動式光源盒,在箱體底部設有LED脫影板,LED脫影板放置在底板上;移動式光源盒包括上蓋,上蓋內設有光源,上蓋部設有磨沙透光片,磨沙透光片將光源封閉在上蓋內;所述LED脫影

壓縮模式圖樣重疊檢測方法與裝置與流程

本發明涉及通信領域,特別涉及一種壓縮模式圖樣重疊檢測方法與裝置。背景技術:在寬帶碼分多址(WCDMA,WidebandCodeDivisionMultipleAccess)系統頻分復用(FDD,FrequencyDivisionDuplex)模式下,為了進行異頻硬切換、FDD到時分復用(TDD,Ti

個性化檯曆的製作方法

專利名稱::個性化檯曆的製作方法技術領域::本實用新型涉及一種檯曆,尤其涉及一種既顯示月曆、又能插入照片的個性化檯曆,屬於生活文化藝術用品領域。背景技術::公知的立式檯曆每頁皆由月曆和畫面兩部分構成,這兩部分都是事先印刷好,固定而不能更換的。畫面或為風景,或為模特、明星。功能單一局限性較大。特別是畫

一種實現縮放的視頻解碼方法

專利名稱:一種實現縮放的視頻解碼方法技術領域:本發明涉及視頻信號處理領域,特別是一種實現縮放的視頻解碼方法。背景技術: Mpeg標準是由運動圖像專家組(Moving Picture Expert Group,MPEG)開發的用於視頻和音頻壓縮的一系列演進的標準。按照Mpeg標準,視頻圖像壓縮編碼後包

基於加熱模壓的纖維增強PBT複合材料成型工藝的製作方法

本發明涉及一種基於加熱模壓的纖維增強pbt複合材料成型工藝。背景技術:熱塑性複合材料與傳統熱固性複合材料相比其具有較好的韌性和抗衝擊性能,此外其還具有可回收利用等優點。熱塑性塑料在液態時流動能力差,使得其與纖維結合浸潤困難。環狀對苯二甲酸丁二醇酯(cbt)是一種環狀預聚物,該材料力學性能差不適合做纖

一種pe滾塑儲槽的製作方法

專利名稱:一種pe滾塑儲槽的製作方法技術領域:一種PE滾塑儲槽一、 技術領域 本實用新型涉及一種PE滾塑儲槽,主要用於化工、染料、醫藥、農藥、冶金、稀土、機械、電子、電力、環保、紡織、釀造、釀造、食品、給水、排水等行業儲存液體使用。二、 背景技術 目前,化工液體耐腐蝕貯運設備,普遍使用傳統的玻璃鋼容

釘的製作方法

專利名稱:釘的製作方法技術領域:本實用新型涉及一種釘,尤其涉及一種可提供方便拔除的鐵(鋼)釘。背景技術:考慮到廢木材回收後再加工利用作業的方便性與安全性,根據環保規定,廢木材的回收是必須將釘於廢木材上的鐵(鋼)釘拔除。如圖1、圖2所示,目前用以釘入木材的鐵(鋼)釘10主要是在一釘體11的一端形成一尖

直流氧噴裝置的製作方法

專利名稱:直流氧噴裝置的製作方法技術領域:本實用新型涉及ー種醫療器械,具體地說是ー種直流氧噴裝置。背景技術:臨床上的放療過程極易造成患者的局部皮膚損傷和炎症,被稱為「放射性皮炎」。目前對於放射性皮炎的主要治療措施是塗抹藥膏,而放射性皮炎患者多伴有局部疼痛,對於止痛,多是通過ロ服或靜脈注射進行止痛治療

新型熱網閥門操作手輪的製作方法

專利名稱:新型熱網閥門操作手輪的製作方法技術領域:新型熱網閥門操作手輪技術領域:本實用新型涉及一種新型熱網閥門操作手輪,屬於機械領域。背景技術::閥門作為流體控制裝置應用廣泛,手輪傳動的閥門使用比例佔90%以上。國家標準中提及手輪所起作用為傳動功能,不作為閥門的運輸、起吊裝置,不承受軸向力。現有閥門

用來自動讀取管狀容器所載識別碼的裝置的製作方法

專利名稱:用來自動讀取管狀容器所載識別碼的裝置的製作方法背景技術:1-本發明所屬領域本發明涉及一種用來自動讀取管狀容器所載識別碼的裝置,其中的管狀容器被放在循環於配送鏈上的文檔匣或託架裝置中。本發明特別適用於,然而並非僅僅專用於,對引入自動分析系統的血液樣本試管之類的自動識別。本發明還涉及專為實現讀