新四季網

使用鋅指核酸酶在大鼠中進行基因組編輯的製作方法

2023-06-01 14:06:21 2

專利名稱:使用鋅指核酸酶在大鼠中進行基因組編輯的製作方法
技術領域:
本公開屬於大鼠基因組工程領域,包括體細胞的和可遺傳的基因中斷、基因組改變、在大鼠基因特定位置上產生攜帶隨機突變的等位基因以及誘導同源定向修復。
背景技術:
大鼠(Rattus norvegicus)是在高血壓、心血管生理學、糖尿病、代謝紊亂、行為研究以及毒性測試領域中廣泛使用的動物模型。Michalkiewicz等人(2007) J. Amer. Phys.Society 293 :H881-H894。這些模型系統的可用性,以及在大鼠基因組學和大鼠、人類和小鼠基因組序列中的進展大大加速了用於發現複雜疾病遺傳基礎的近交系大鼠模型的使用,並且提供了用於治療性藥物發現的動物模型。然而,有關大鼠基因組信息的進步並未伴隨有基因組修飾技術的平行發展。與小鼠不同,用於基因靶向的大鼠胚胎幹細胞克隆並不容易產生。前核注射經證實也較為困難,並且在產生轉基因大鼠時成功率較低。Michalkiewicz等人(2007) J. Amer. Phys.Society293 :H881_H894報導了使用表達增強型綠色螢光蛋白質(eGFP)報告基因的慢病毒構建體來產生轉基因大鼠,其中eGFP轉基因經發現存在於整合在基因組內隨機位點上的1-4個拷貝中。仍然需要以靶向方式修飾大鼠基因組的方法。基因組基因座的精確靶向位點特異性裂解對常規的同源重組提供了有效補充和/或替代方案。雙鏈斷裂(DSB)的產生使得在靶向基因座上的同源重組頻率增加了 1000倍多。更簡單來說,通過非同源端連接(NHEJ)對位點特異性DSB的不精確修復也可能產生基因中斷。產生兩種此類DSB會導致缺失任意的大區。鋅指蛋白的模塊化DNA識別偏好使得可以合理設計位點特異性多指DNA結合蛋白。核酸酶域從II型限制性酶Fok I融合到位點特異性鋅指蛋白使得可以產生位點特異性核酸酶。參見(例如)美國專利公布20030232410、20050208489、20050026157、20050064474、20060188987、20060063231、20070134796、2008015164、20080131962、2008015996 以及國際公布WO 07/014275和W02008/133938,這些均描述了鋅指核酸酶的使用,並且為了所有目的而將它們以引用方式全文併入。發明概述本文公開了用於在大鼠中進行基因組編輯的組合物,該基因組編輯包括但不限於裂解大鼠中的一種或多種基因,導致一種或多種大鼠基因中的靶向改變(插入、缺失和/或置換突變),包括將這些靶向改變摻入胚系中;靶向引入非內源性核酸序列,使大鼠中的一種或多種基因部分或完全失活;還公開了誘導同源定向修復和/或產生編碼大鼠基因的新型等位基因形式的隨機突變的方法。在一個方面,本文描述了一種結合到大鼠基因組內所關注區域中的靶位點上的鋅指蛋白(ZFP),其中所述ZFP包含一個或多個改造的鋅指結合域。在一個實施方案中,ZFP是一種裂解大鼠內所關注的靶基因組區域的鋅指核酸酶(ZFN),其中所述ZFN包含一個或多個改造的鋅指結合域和核酸酶裂解域或裂解半域。裂解域和裂解半域可以(例如)由各種限制性核酸內切酶和/或歸巢核酸內切酶獲得。在一個實施方案中,裂解半域是源自IIS型限制性核酸內切酶(例如FokI)。具體地說,ZFN可以裂解一種特定的大鼠基因序列。或者,ZFN可以裂解兩種或兩種以上同源大鼠基因序列。ZFN可以結合和/或裂解大鼠基因,該大鼠基因位於基因的編碼區內,或者位於在基因內的或鄰近於基因的非編碼序列中(如前導序列、尾隨序列或內含子),或者位於編碼區上遊或下遊的非轉錄區內。在某些實施方案中,ZFN結合和/或裂解靶大鼠基因的編碼序列或調控序列。在另一方面,本文描述了包含一種或多種本文所述鋅指核酸酶的組合物。在某些實施方案中,該組合物包含一種或多種鋅指核酸酶與藥學上可接受的賦形劑的組合。在另一方面,本文描述了編碼一種或多種本文所述的ZFN的多核苷酸。該多核苷酸可以是(例如)mRNA。在另一方面,本文描述了包含多核苷酸的ZFN表達載體,該多核苷酸編碼一種或多種本文所述的ZFN,並且可經操作連接到啟動子上。在另一方面,本文描述了包含一種或多種ZFN表達載體的大鼠宿主細胞。大鼠宿主細胞可以是穩定轉化的或瞬時轉染的,或者是其與一種或多種ZFP表達載體的組合。在一個實施方案中,大鼠宿主細胞是胚胎幹細胞。在其它實施方案中,一種或多種ZFP表達載體表達大鼠宿主細胞中的一種或多種ZFN。在另一實施方案中,大鼠宿主細胞可以還包含外源多核苷酸供體序列。在本文所述的任何實施方案中,大鼠宿主細胞可以包含胚細胞,例如一種或多種細胞胚胎。在另一方面,本文描述了一種裂解大鼠細胞中的一種或多種基因的方法,該方法包括(a)把編碼一種或多種ZFN的一種或多種多核苷酸引入大鼠細胞,該ZFN在使得ZFN被表達並且一種或多種基因被裂解的條件下結合到一種或多種基因中的靶位點上。在又一方面,本文描述了把外源序列引入大鼠細胞基因組中的方法,該方法包括以下步驟(a)把編碼一種或多種ZFN的一種或多種多核苷酸引入大鼠細胞,該ZFN在使得ZFN被表達並且一種或多種基因被裂解的條件下結合到一種或多種基因中的靶位點上;和(b)使細胞接觸外源多核苷酸,以使得基因的裂解刺激外源多核苷酸通過同源重組整合到基因組中。在某些實施方案中,外源多核苷酸被物理性整合到基因組中。在其它實施方案中,外源多核苷酸是通過核酸複製程序(例如,雙鏈斷裂的同源定向修復)把外源序列拷貝到宿主細胞基因組中而整合到基因組中的。還在其它實施方案中,整合到基因組中是通過非同源依賴性靶向整合(例如,「末端捕獲」)來進行的。在某些實施方案中,一種或多種核酸酶是IIS型限制性核酸內切酶的裂解域與改造的鋅指結合域之間的融合體。在另一實施方案中,本文描述了修飾大鼠細胞的基因組中的一種或多種基因序列的方法,該方法包括(a)提供包含一種或多種靶基因序列的大鼠細胞;和(b)表達細胞中的第一和第二鋅指核酸酶(ZFN),其中第一 ZFN在第一裂解位點進行裂解,第二 ZFN在第二裂解位點進行裂解,其中該基因序列位於第一裂解位點與第二裂解位點之間。其中第一和第二裂解位點的裂解導致通過非同源端連接來修飾基因序列。在某些實施方案中,非同源端連接導致第一裂解位 點與第二裂解位點之間的缺失。基因序列中缺失的大小是由第一裂解位點與第二裂解位點之間的距離決定的。因此,在所關注的任何基因組區域中,可以獲得任意大小的缺失。可以獲得25個、50個、100個、200個、300個、400個、500個、600個、700個、800個、900個、1,000個核苷酸對或此範圍內任意整數值個數的核苷酸對的缺失。此外,可以用本文公開的方法和組合物來獲得大於1,000個核苷酸對的一系列任意整數值個數的核苷酸對的缺失。在其它實施方案中,非同源端連接在第一裂解位點與第二裂解位點之間產生插入物。修飾如本文所述大鼠的基因組的方法可用於產生動物(例如人類)疾病的模型,例如通過以下方式使基因(部分或完全地)失活或者在允許鑑定或選擇攜帶那些基因的新型等位基因形式的轉基因大鼠的基因的確定位置上形成隨機突變,插入人化的大鼠基因(以非限制性例子的方式,用於研究藥物代謝)或者插入所關注的突變體等位基因來檢驗(例如)這種突變體等位基因的表型效應。在又一方面,本文描述了胚系中斷大鼠中的一種或多種靶基因的方法,該方法包括通過本文所述的任何方法,修飾在大鼠胚胎的一個或多個細胞的基因組中的一種或多種基因序列;以及使大鼠胚胎發育,其中修飾的基因序列存在於性成熟大鼠的至少一部分配子中。在另一方面,本文描述了一種在所關注的大鼠基因座中產生一種或多種可遺傳突變體等位基因的方法,該方法包括通過本文所述的任何方法,修飾在大鼠胚胎的一個或多個細胞的基因組中的一個或多個基因座;飼養大鼠胚胎直到性成熟;和使性成熟的大鼠產生後代;其中後代中的至少一些包含突變體等位基因。在本文所述的任何方法中,編碼鋅指核酸酶的多核苷酸可以包含DNA、RNA或它們的組合。在某些實施方案中,多核苷酸包含質粒。在其它實施方案中,編碼核酸酶的多核苷酸包含mRNA。還在其它方面,本文提供將核酸序列位點特異性整合到染色體中的方法。在某些實施方案中,該方法包括(a)注入胚胎,該胚胎具有(i)至少一種DNA載體,其中該DNA載體包含在待整合核酸序列側翼的上遊序列和下遊序列,和(ii)編碼識別染色體整合位點的鋅指核酸酶的至少一種RNA分子;以及(b)培養該胚胎以使表達鋅指核酸酶,其中由鋅指核酸酶引入到整合位點中的雙鏈斷裂通過用DNA載體來同源重組而修復,以便將核酸序列整合到染色體中。合適的胚胎可來自若干不同的有脊椎物種,包括哺乳動物、鳥類、爬行動物、兩棲動物和魚類。一般而言,合適的胚胎是可以被收集、注射並且培養來表達鋅指核酸酶的胚胎。在一些實施方案中,合適的胚胎可以包括來自齧齒動物、寵物、牲畜和靈長類的胚胎。齧齒動物的非限制性例子可以包括小鼠、大鼠、倉鼠、沙鼠和豚鼠。寵物的非限制性例子可以包括貓、狗、兔、刺蝟和雪貂。牲畜的非限制性例子可以包括馬、山羊、綿羊、豬、駱馬、羊駝和牛。靈長類的非限制性例子可以包括僧帽猴、黑猩猩、狐猴、獼猴、絨猴、絹毛猴、蛛猴、松鼠猴和長尾猴。在其它實施方案中,合適的胚胎可以包括來自魚類、爬行動物、兩棲動物或鳥類的胚胎。或者,合適的胚胎可以是昆蟲胚胎,例如,果蠅胚胎或蚊子胚胎。
還提供了包含至少一種DNA載體的胚胎,其中該DNA載體包含在待整合核酸序列側翼的上遊序列和下遊序列,以及編碼識別染色體整合位點的鋅指核酸酶的至少一種RNA分子。還提供了來自本文所述的任何胚胎的生物體。



圖I示出對大鼠C6細胞中p53特異性ZFN對的Surveyor 核酸酶("CEL-1")測定結果。各泳道中的所用ZFN對在泳道上方示出,通過Surveyor錯配試驗檢測的NHEJ活性百分比在底部示出。圖2示出在攜帶eGFP基因的大鼠C6細胞中的eGFP靶向ZFN對16834/16833、16856/16855 和 16859/16860 的 Surveyor 核酸酶(「CEL-I」)測定結果。所用 ZFN 對在各泳道上方示出,並且非同源端連接百分比(%NHEJ)在適當時於各泳道下方顯示。圖3是示出使用轉基因GFP大鼠中ZFN的GFP轉基因的靶向修飾的示意圖。圖4(圖A和B)示出通過大鼠幼仔中的ZFN進行的GFP靶向中斷,所述大鼠幼仔是通過將GFP靶向ZFN前核注射到得自轉基因GFP大鼠的胚胎中而產生的。圖4A示出了紫外光下的5個幼仔,顯示出3個GFP陽性動物和2個未表達GFP (GFP陰性)的動物。圖4B示出GFP+和GFP-幼仔的尾部活組織檢查的PCR分析結果。圖5示出使用由CMV啟動子(CMV)或CAG啟動子驅動的ZFN在C6細胞中的內源IgM的外顯子I中進行的ZFN介導的裂解。「連接的」是指在由2A肽連接的相同質粒上的ZFN對,而「未連接的」是指未由2A肽連接的ZFN對。圖6示出由Surveyor 核酸酶進行的基因組DNA分析,該基因組DNA是通過IgMZFN注射的單細胞胚胎的活產所得到的43個動物的尾部來製備的。如所示,大鼠6#、7#、8#、19#和46#針對在IgM基因座上的修飾被記為陽性。具有白色數字的條指示產生自單獨(編號的)母體的幼仔。圖7示出針對ZFN質粒插入基因組而言對IgM修飾的大鼠(如圖6中標識的6#、7#、8#、19#和46#)的PCR分析結果。圖8 (圖A和B)示出IgM修飾的大鼠19#的CEL-I和序列分析。WT、大鼠19野生型等位基因和大鼠19缺失等位基因的序列比對(圖8B)顯不了已從大鼠19缺失等位基因中刪除的序列。圖9(圖A至C)示出針對在8個不同脫祀位點上的活性對I gm修飾的大鼠(如圖
6中標識的6#、7#、8#、19#和46#)的分析。脫靶位點(位點I、位點2等)如表9中所描述。圖10示出Rab38的ZFN介導修飾的序列分析。此圖中所示的是具有兩個缺失等位基因(Λ6和Λ42)的野生型等位基因比對。圖11 (圖A至C)示出對得自雜交ZFN-IgM修飾的大鼠和野生型大鼠的幼仔的分析。圖IlA示出了來自雜交大鼠19# (實施例3)的5個幼仔(編號224到228)與野生型大鼠的PCR和CEL-I分析。圖IlB示出序列分析確認,即3個IgM修飾的幼仔(如圖中標識的225#、227#和228#)具有與親代大鼠19#相同的IgM上的64個鹼基對缺失等位基因。圖IlC示出對大鼠19#的增加幼仔以及來自IgM修飾的大鼠46#和8#的雜交幼仔的PCR和CEL-I分析。IgM修飾的親代大鼠在頂部以「F0」指示,而幼仔編號在各泳道上方指示。圖12是示出靶向ZFN誘導的雙鏈斷裂之後修復結果的示意圖。陰影條代表供體片段,而白色條示出ZFN雙鏈斷裂的靶位點。
圖13是示出RFLP供體質粒構造的示意圖。示出的是該質粒,以及與整合祀位點同源的左右PCR-擴增片段。指示了用於克隆的限制性酶。左方片段使用KpnI和NotI或PmeI0右方片段使用NotI或PmeI和SacII。圖14是示出GFP-表達供體質粒構造的示意圖。GFP盒是從現有質粒中PCR擴增並使用NotI位點被封閉到NotI RFLP供體中的。圖15 (圖A和B)示出檢測RFLP整合的方法。圖15A是示出檢測RFLP整合和限制性酶消化的方法的示意圖。圖15B是示出使用PCR擴增進行GFP表達盒整合的示意圖。圖16是在瓊脂糖凝膠上解析的螢光染色PCR片段的攝影圖像。最左方泳道含DNA梯。泳道I至6含使用小鼠Mdrla特異性引物從整個或一部分小鼠胚泡中擴增的PCR片段。泳道I和2是分別從5/6和1/6個胚泡中擴增的。泳道3來自整個胚泡。泳道4至6分別來自1/2、1/3和1/6個相同胚泡。泳道7含使用相同引物從提取的小鼠趾DNA中擴增的陽性對照PCR片段。圖17(圖A和B)示出在瓊脂糖凝膠上解析的螢光染色DNA片段的攝影圖像。最左方泳道含DNA梯。圖17A的泳道I至39含使用mMdrla特異性引物從37個小鼠胚胎中擴增的PCR片段以及用於PCR擴增的一個陽性和陰性對照物,所述小鼠胚胎是在相對於含有NotI位點的小鼠Mdrla和RFLP供體用ZFN RNA顯微注射之後,在活體外培養的。圖17B的泳道I至39含在進行Surveyor 突變檢測測定之後圖17A的PCR片段。圖18 (圖A和B)是在瓊脂糖凝膠上解析的螢光染色DNA片段的攝影圖像。最左方和最右方的泳道含DNA梯。泳道含使用mMdrla特異性引物從圖17中所示小鼠胚胎中擴增的以及在未純化PCR產物的情況下用NotI消化的PCR片段。圖18B是圖18A中相同凝膠上更持久的電泳擴增。未切PCR產物為約I. 8kb,並且消化產物是約900bp的兩個條帶。圖19是在瓊脂糖凝膠上解析的螢光染色DNA片段的攝影圖像。最左方泳道含DNA梯。泳道I到6含一些如圖18中所示的PCR片段,所述PCR片段是在PCR產物被柱純化以便NotI可以在其最佳緩衝液中工作之後,經NotI消化的。線7和線8是用NotI消化的樣本中的兩個(如圖18中)。該凝膠顯示PCR反應中的NotI消化已完全。圖20是在瓊脂糖凝膠上解析的螢光染色PCR片段的攝影圖像。最左方泳道含DNA梯。泳道I到5含使用PXR特異性引物從I、1/2、1/6、1/10、1/30個大鼠胚泡中擴增的PCR片段。泳道6是使用相同引物從純化的Sprague Dawley基因組DNA中擴增的陽性對照物。圖21 (圖A和B)是在瓊脂糖凝膠上解析的螢光染色DNA片段的攝影圖像。最左方和最右方的泳道含DNA梯。圖21A顯示使用PXR特異性引物從大鼠胚胎中擴增並用NotI消化的PCR片段,所述大鼠胚胎是在顯微注射PXR ZFN mRNA和NotI RFLP供體之後在活體外培養的,圖21B顯示在進行Surveyor 突變檢測測定之後與圖21A中所示相同的PCR片段。圖22是在瓊脂糖凝膠上解析的螢光染色DNA片段的攝影圖像。頭4個泳道是從胚胎受孕後12. 5天的4個良好發育胎鼠中PCR擴增的,該胚胎注射了具有NotI RFLP供體的mMdrla ZFN mRNA。PCR用NotI消化。泳道4是陽性的。泳道5_8是4個蛻膜的失效植入。所有四個泳道均為陰性。圖23 (圖A至E)是在瓊脂糖凝膠上解析的螢光染色DNA片段的示意圖和攝影圖像。圖23A是示出所用引物的位置的示意圖。圖23B和圖23C示出引物PF和GR的結果。圖23D和圖23E示出引物PR+GF的結果。期望的片段大小為2. 4kb。40個胎鼠中有兩個為GFP陽性。圖24是在瓊脂糖凝膠上解析的DNA片段的攝影圖像。泳道8代表NotI位點陽性的13dpc胎鼠。
具體實施例方式本文描述了用於在大鼠中進行基因組編輯(例如,裂解基因;改變基因,例如通過裂解然後插入(物理插入或經由同源定向修復的複製來插入)外源序列和/或裂解然後進行非同源端連接(NHEJ);使一個或多個基因部分或完全地失活;用隨機突變產生等位基因以產生內源基因的改變表達;等等)以及改變被攜帶入胚系中的大鼠基因組的組合物和方法。還公開了製備和使用這些組合物(試劑)以(例如)編輯(改變)靶大鼠細胞中的一種或多種基因的方法。因此,本文所述的方法和組合物提供了用於靶向基因改變(例如敲入)和/或(部分或完全)敲除一種或多種大鼠基因和/或用於使任意靶等位基因的序列隨機性突變的高效方法,因此,可以產生人類疾病的動物模型。本文所述的組合物和方法提供了在不需要勞動密集型選擇和/或篩選的情況下,以最小的脫靶效應對大鼠中內源基因座進行快速、完全和永久的靶向中斷。整個動物基因的敲除也可以通過注入ZFN mRNA或ZFN表達盒來容易地以單個步驟進行。概述本文所公開的實施方法以及組合物的製備和使用採用了(除非另外指明)在分子生物學、生物化學、染色質結構和分析、計算化學、細胞培養、重組DNA和如本領域技術人員所知範圍內的相關領域中的常規技術。這些技術在文獻中有全面解釋。參見(例如),Sambrook 等人,MOLECULAR CLONING A LABORATORY MANUAL,第二版,Cold SpringHarbor Laboratory 出版社,1989 年和第三版,2001 年;Ausubel 等人,CURRENT PROTOCOLSIN MOLECULAR BIOLOGY, John ffiley&Sons, New York,1987 年和周期性更新;METHODS INENZYM0L0GY 系列叢書,Academic 出版社,San Diego ;ffolffe, CHROMATIN STRUCTURE ANDFUNCTION,第三版,Academic 出版社,San Diego,1998 年;METH0DS IN ENZYM0L0GY,第 304卷,「Chromatin」 (P. M. Wassarman 和 A. P. Wolffe 編),Academic 出版社,San Diego, 1999年;以及 METHODS IN MOLECULAR BIOLOGY,第 119 卷,「Chromatin Protocols」(P. B. Becker編)Humana 出版社,Totowa, 1999 年。定義術語「核酸」、「多核苷酸」和「寡聚核苷酸」可互換地使用,並且是指線狀或環狀構象的以及呈單鏈或雙鏈形式的脫氧核糖核苷酸或核糖核苷酸的聚合物。就本公開的目的而言,這些術語不應解釋為對聚合物長度的限制。這些術語可以涵蓋天然核苷酸的已知類似物,以及在鹼基、糖和/或磷酸酯部分(例如硫代磷酸酯主鏈)上被修飾的核苷酸。通常,具體核苷酸的類似物具有相同的鹼基配對特異性;即,A的類似物能與T鹼基配對。術語「多肽」、「肽」和「蛋白」可互換地使用,用於指胺基酸殘基的聚合物。這些術語還適用於胺基酸聚合物,其中一個或多個胺基酸是相應天然胺基酸的化學類似物或經修飾的衍生物。
「結合」是指大分子之間(例如在蛋白與核酸之間)的序列特異性、非共價相互作用。並非所有結合相互作用的部件都必需為序列特異性的(例如與DNA主鏈中的磷酸酯殘基接觸),只要相互作用總體上為序列特異性即可。這種相互作用一般而言特徵為KT6M4或更低的離解常數(Kd)。「親和力」是指結合強度高結合親和力與較低Kd相關。「結合蛋白」是能夠非共價性結合到另一分子的蛋白。結合蛋白可以結合到(例如)DNA分子(DNA結合蛋白)、RNA分子(RNA結合蛋白)和/或蛋白分子(蛋白結合蛋白)。就蛋白結合蛋白來說,其可以結合到其自身(以形成同型二聚體、同型三聚體等)和/或其可以結合不同蛋白的一個或多個分子。結合蛋白可以具有一種以上類型的結合活性。例如,鋅指蛋白具有DNA結合、RNA結合和蛋白結合活性。
「鋅指DNA結合蛋白」(或結合域)是以序列特異性方式通過一個或多個鋅指結合DNA的蛋白或較大蛋白內的域,所述鋅指是通過鋅離子配位穩定結構的結合域內的胺基酸序列區。術語鋅指DNA結合蛋白通常簡稱為鋅指蛋白或ZFP。鋅指結合域可以被「改造」以結合到預定核苷酸序列。改造鋅指蛋白的方法的非限制性例子是設計和選擇。設計的鋅指蛋白是天然不存在的蛋白,其設計/組成主要來自合理性準則。設計的合理性準則包括應用取代法則和計算機化算法,用於處理在儲存現有ZFP設計和結合數據信息的資料庫中的信息。參見(例如),美國專利6,140,081;6,453,242 和 6,534,261 ;還參見 WO 98/53058 ;W0 98/53059 ;W0 98/53060 ;W0 02/016536和 TO 03/016496。「選擇的」鋅指蛋白是天然未發現的蛋白,其產生主要是來自經驗過程,諸如噬菌體展示、相互作用陷阱或雜交體選擇。參見(例如)US 5, 789, 538 ;US 5,925, 523 ;US6,007,988 ;US 6,013,453 ;US 6,200,759 ;W0 95/19431 ;W0 96/06166 ;W0 98/53057;W098/54311 ;W0 00/27878 ;W0 01/60970 ;W0 01/88197 和 TO 02/099084。術語「序列」是指任意長度的核苷酸序列,其可以是DNA或RNA ;可以是線狀、環狀或分支狀,而且可以是單鏈或者雙鏈。術語「供體序列」是指被插入基因組中的核苷酸序列。供體序列可以為任意長度,例如長度在2個與10,000個核苷酸之間(或它們之間或之上的任意整數值),優選長度在約100個與1,000個核苷酸之間(或它們之間的任意整數值),更優選長度在約200個與500個核苷酸之間。「同源但不相同序列」是指與第二序列存在一定程度的序列相同性的第一序列,但其序列不同於第二序列。例如,包含野生型序列的突變基因的多核苷酸與突變基因序列同源但不相同。在某些實施方案中,這兩個序列間的同源性程度足以使它們之間利用正常細胞機制發生同源重組。兩種同源非相同序列可以是任意長度的,它們的非同源性程度可以小到單個核苷酸(例如,通過靶向同源重組來校正基因組的點突變)或者可大到10萬或更多個鹼基(例如,在染色體的預定異位位點上插入基因)。包含同源但不相同序列的兩種多核苷酸不必等長。例如,可以使用20個與10,000個之間的核苷酸或核苷酸對的外源多核苷酸(即供體多核苷酸)。測定核酸和胺基酸序列相同性的技術是本領域已知的。此類技術一般包括測定基因mRNA的核苷酸序列和/或測定其編碼的胺基酸序列,並將這些序列與另一核苷酸或胺基酸序列作比較。以此方式還可以測定和比較基因組序列。通常,相同性分別指兩種多核苷酸或多肽序列中的核苷酸-核苷酸或胺基酸-胺基酸正確對應。通過測定序列相同性百分比可以比較兩個或多個(多核苷酸或胺基酸)序列。將兩個比對序列(無論是核酸或是胺基酸序列)之間正確匹配的數目除以較短序列長度再乘以100得到兩個序列的相同性百分比。Smith 和 Waterman, Advances in Applied Mathematics 2:482-489(1981)的局部同源性算法提供了核酸序列的近似比對。利用Dayhoff, Atlas of Protein Sequencesand Structure, M. 0. Dayhoff 編,5 增刊,3 :353-358,國家生物醫學研究基金會(NationalBiomedical Research Foundation) (Washington, D. C.,美國)開發和 Gribskov, NucI.Acids Res. 14(6) :6745-6763(1986)標準化的評分矩陣,可將此算法應用於胺基酸序列。Genetics Computer Group (Madison, WI)在「最佳擬合(BestFit) 」實際應用中不範了該算法的執行以測定序列相同性百分比。Wisconsin序列分析軟體包程序手冊第8版(1995)(可購自Genetics Computer Group,Madison,WI)描述了該方法的默認參數。本公開內容中確立相同性百分比的優選方法是使用愛丁堡大學(University of Edinburgh)版權所有的、John F. Collins 和 Shane S. Sturrok 開發的、IntelliGenetics 公司(Mountain View,CA)發行的MPSRCH軟體包。可以使用該軟體包的Smith-Waterman算法,其中默認參數用於評分表(例如,缺口開放罰12分,缺口延伸罰I分和缺口罰6分)。所生成數據中「匹配」值反映序列相同性。本領域通常已知計算序列間相同性或相似性百分比的其它合適程序,例如另一比對程序是BLAST (使用默認參數)。例如,可以採用基於BLASTN和BLASTP確立相同性百分比的優選方法,使用以下默認參數遺傳密碼=標準;過濾=無;鏈=雙鏈;截止值=60 ;期望值=10 ;矩陣=BL0SUM62 ;說明=50個序列;分選=HIGH S⑶RE ;資料庫=非冗餘,GenBank+EMBL+DDBJ+PDB+GenBank CDS translations+Swiss protein+Spupdate+PIR。可以在以下網址上找到這些程序的詳情http://www. ncbi. nlm. gov/cgi-bin/BLAST。至於本文所述的序列,序列相同性的程度的所需範圍是大約80%到100%和二者之間的任意整數值。序列之間相同性百分比通常為至少70-75%、優選80-82%、更優選85-90%、甚至更優選92%、還更優選95%和最優選98%的序列相同性。或者,可以通過多核苷酸雜化來測定多核苷酸間的序列相似性程度,雜交條件應能使同源區之間形成穩定的雙鏈體,隨後用單鏈特異性核酸酶消化,並測定消化片段的大小。當使用上述方法測定,兩個核酸或兩個多肽序列在確定的分子長度上顯示至少約70% -75%,優選80% -82%、更優選85% -90%、甚至更優選92%、還更優選95%、最優選98%的序列相同性時,則它們彼此是基本同源的。如本文所用,基本同源還指與特定DNA或多肽序列完全相同的序列。在例如該具體系統規定的嚴格條件下的Southern雜交實驗中,可以鑑定基本同源的DNA序列。本領域技術人員能確定合適的雜交條件。參見(例如)Sambrook等人,同上Nucleic Acid Hybridization A Practical Approach, B. D. Hames和S. J. Higgins 編(1985)Oxford !Washington, DC ;IRL 出版社。可以用下述方法測定兩個核酸片段的選擇性雜交。兩個核酸分子間的序列相同性程度影響這兩個分子間的雜交效率和強度。部分相同的核酸序列能至少部分地抑制與靶分子完全相同序列 的雜交。可以使用本領域熟知的雜交試驗評估完全相同序列的雜交抑制(例如,Southern (DNA)印跡,Northern (RNA)印跡,溶液雜交等,參見Sambrook,等人,Molecular Cloning A Laboratory Manual,第二版,(1989), Cold Spring Harbor, N. Y.)。此類試驗可以使用不同程度的選擇性來進行,例如使用從低到高的不同嚴格性的條件。如果使用低嚴格性條件,則可以使用缺乏甚至部分序列相同度的輔探針(例如,與靶分子的序列相同性小於約30%的探針)來評估不存在非特異性結合,以使得在不存在非特異性結合時,輔探針不會與IE雜交。當利用基於雜交的檢測系統時,應選擇與參考核酸序列互補的核酸探針,然後選擇合適條件使探針與參考序列彼此選擇性雜交或結合來形成雙鏈體分子。能夠在中等嚴格雜交條件下與參考序列選擇性雜交的核酸分子通常在以下條件下雜交,該條件能檢測至少長約10-14個核苷酸的靶核酸序列且至少約70%序列與所選核酸探針相同的靶核酸序列。嚴格雜交條件通常能檢測與所選核酸探針的序列的相同性大於約90-95%的至少約10-14個核苷酸的靶核酸序列。當探針與參考序列具有特定程度的序列相同性時,可用於探針/參考序列雜交的雜交條件可以按本領域已知那樣來確定(參見(例如),Nucleic AcidHybridization A Practical Approach, B. D. Hames 和 S. J. Higgins 編,(1985)Oxford ;Washington, DC ;IRL 出版社)。雜交條件為本領域技術人員所熟知。雜交嚴格性是指雜交條件不利於包含錯配核苷酸的雜交體形成的程度,較高的嚴格性與對錯配雜交體的較低容忍度有關。影響雜交嚴格性的因素為本領域技術人員所熟知,包括但不限於溫度、pH、離子強度和有機溶劑(如甲醯胺和二甲基亞碸)的濃度。如本領域技術人員所知,較高溫度、較低離子強度和較低溶劑濃度可提高雜交嚴格性。至於雜交的嚴格性條件,本領域熟知的可以使用許多等效條件通過改變(例如)以下因素來建立特定的嚴格性序列長度和性質、各種序列的鹼基組成、鹽和其它雜交溶液組分的濃度、雜交溶液中存在或不存在阻斷劑(例如硫酸右旋糖酐和聚乙二醇)、雜交反應溫度和時間參數以及變化的洗滌條件。按照本領域標準方法(參見(例如),Sambrook,等人,Molecular CloninR A Laboratory Manual,第二版,(1989) Cold Spring Harbor,N. Y.)來選擇雜交條件的具體設定。「重組」是指兩個多核苷酸之間交換遺傳信息的過程。就本公開而言,「同源重組(HR)」是指(例如)在通過同源定向修復機制修復細胞內雙鏈斷裂期間所發生的此類交換的特殊形式。這一過程需要核苷酸序列同源,使用「供體」分子為模板來修復「靶」分子(即發生雙鏈斷裂的分子),分別稱為「非交換型基因轉換」或「短段基因轉換」,因為其導致遺傳信息從供體轉移到靶上。不希望受限於任何特定理論,此類轉移可涉及對斷裂靶與供體間形成的異源雙鏈體DNA進行錯配校正,和/或「合成依賴性鏈退火」,其中使用供體再次合成遺傳信息(該信息將成為靶的一部分),和/或相關過程。此類特殊HR常常導致靶分子序列的改變,以使得供體多核苷酸部分或全部併到靶多核苷酸中。在本公開的方法中,一種或多種本文所述的靶向核酸酶在靶序列(例如細胞染色質)中預定位點上產生雙鏈斷裂,並且可以將與斷裂區中的核苷酸序列具有同源性的「供體」多核苷酸引入細胞中。雙鏈斷裂的存在已表明有助於供體序列的整合。供體序列可以被物理整合,或者,供體多核苷酸可用作通過同源重組來修復斷裂的模板,導致將例如供體中的核苷酸序列的全部或一部分引入細胞染色質。因此,細胞染色質中的第一序列可以改變,並且在某些實施方案中,可以轉化為供體多核苷酸中存在的序列。因此,術語「替換(replace) 」或「替換(replacement) 」的使用可以理解為表示用一個核苷酸序列替換另一個核苷酸序列(即,具有信息性含義的序列替換),並且不必需要用一個多核苷酸來物理或化學地替換另一個多核苷酸。
在本文所述的任何方法中,另外的鋅指蛋白可用於細胞內的另外靶位點的另外的雙鏈裂解。在用於對細胞染色質中所關注的區域內的序列進行靶向重組和/或替換和/或改變的方法的某些實施方案中,通過與外源「供體」核苷酸序列的同源重組來改變染色體序列。如果存在與斷裂區域同源的序列,則細胞染色質中雙鏈斷裂的存在會刺激此類同源重組。在本文所述的任何方法中,第一核苷酸序列(「供體序列」)可以含與所關注的區 域中的基因組序列同源但不相同的序列,從而刺激同源重組以在所關注的區域中插入不相同序列。因此,在某些實施方案中,與所關注的區域中序列同源的供體序列的某些部分顯示出與被替換基因組序列約80%至99% (或其間任意整數)的序列相同性。在其它實施方案中,例如,如果在100個毗連鹼基對上僅有I個核苷酸不同,則供體與基因組序列間的同源性高於99%。在某些情況下,供體序列的非同源部分可含有所關注區域中不存在的序列,從而使得新的序列引入所關注區域中。在這些情況下,非同源序列一般具有50-1,000個鹼基對(或它們間任意整數值)或大於1,000的任意數量鹼基對的側翼,這些側翼鹼基對與所關注區域中的序列同源或相同。在其它實施方案中,供體序列與第一序列不同源,並且通過非同源重組機制被插入基因組中。可以用本文所述的任何方法,通過靶向整合中斷所關注的基因表達的供體序列,使細胞內的一個或多個靶序列部分或完全失活。還提供了具有部分或完全失活基因的細胞系O此外,如本文所述的靶向整合的方法還可用於整合一個或多個外源序列。外源核酸序列可以包含(例如)一個或多個基因或cDNA分子,或任何類型的編碼或非編碼序列,以及一個或多個控制元件(例如啟動子)。另外,外源核酸序列可以產生一個或多個RNA分子(例如,小髮夾 RNA(shRNA)、抑制性 RNA(RNAi)、微 RNA(miRNA)等)。「裂解」是指使DNA分子的共價主鏈的斷裂。裂解可以通過各種方法引發,包括但不限於磷酸二酯鍵的酶或化學水解。單鏈裂解和雙鏈裂解都可以,並且雙鏈裂解可以作為兩個不同的單鏈裂解的結果而發生。DNA裂解可以導致產生平端或交錯端。在某些實施方案中,使用融合多肽來進行靶向雙鏈DNA裂解。「裂解半域」是與第二多肽(相同或不同)一起形成具有裂解活性(優選雙鏈裂解活性)的複合物的多肽序列。術語「第一和第二裂解半域」;「+和-裂解半域」和「右和左裂解半域」可互換使用來指能二聚的裂解半域對。「改造的裂解半域」是經修飾以便與另一裂解半域(如另一改造的裂解半域)形成專性異型二聚體的裂解半域。還參見美國專利公布No. 2005/0064474,2007/0218528和2008/0131962,它們的全文以引用方式併入本文。「染色質」是包含細胞基因組的核蛋白結構。細胞染色質包含核酸(主要是DNA)和蛋白質,蛋白質包括組蛋白和非組蛋白染色體蛋白。大多數真核細胞染色質以核小體形式存在,其中核小體核心包含約150個鹼基對的DNA,與包含組蛋白H2A、H2B、H3和H4各一對的八聚物締合;並且接頭DNA(各生物體長度可不同)在核小體核心間延伸。組蛋白Hl分子通常與接頭DNA締合。就本公開而言,術語「染色質」意味著涵蓋所有類型細胞(原核和真核)的核蛋白。細胞染色質包括染色體和附加體染色質。
「染色體」是包含全部細胞基因組或其一部分的染色質複合物。細胞基因組的特徵常常是其核型,它是包含細胞基因組的所有染色體的集合。細胞基因組可以包含一個或多個染色體。「附加體」是複製性核酸、核蛋白複合物或包含不是細胞染色體核型的一部分的核酸的其它結構。附加體的例子包括質粒和某些病毒基因組。「靶位點」或「靶序列」是限定核酸的一部分的核酸序列,在存在足以結合的條件下,結合分子與該部分核酸結合。例如,序列5』-GAATTC-3』是Eco RI限制性核酸內切酶的革巴位點。「外源」分子是通常不存在於細胞中、但可通過一種或多種遺傳學、生化或其它方法引入細胞中的分子。「通常存在於細胞中」是根據細胞的具體發育階段和環境條件來確定的。因此,例如僅在肌肉的胚胎發育期間存在的分子對成人肌肉細胞而言是外源分子。類 似地,熱休克誘導的分子對非熱休克細胞而言是外源分子。外源分子可包括(例如)功能失常內源分子的有功能型或功能正常的內源分子的功能失常型。外源分子還可以是通常發現於另一物種中的分子,例如,引入大鼠基因組的人類序列。除了別的方面外,外源分子可以是小分子或大分子,小分子如組合化學方法產生的分子,大分子如蛋白質、核酸、糖、脂質、糖蛋白、脂蛋白、多糖、上述分子的修飾衍生物,或包含一種或多種上述分子的任意複合物。核酸包括DNA和RNA,可以是單鏈或雙鏈的;可以是直鏈、支鏈或環形的;並且可以具有任意長度。核酸包括能形成雙鏈體的核酸,以及形成三聯體的核酸。參見(例如),美國專利No. 5,176,996和5,422,251。蛋白質包括但不限於=DNA結合蛋白、轉錄因子、染色質重塑因子、甲基化DNA結合蛋白、聚合酶、甲基化酶、去甲基化酶、乙醯基轉移酶、去乙醯基酶、激酶、磷酸酶、整合酶、重組酶、連接酶、拓撲異構酶、促旋酶和解旋酶。外源分子可以是與內源分子類型相同的分子,例如外源蛋白質或核酸。例如,外源核酸可以包括感染性病毒基因組、引入細胞的質粒或附加體或通常不存在於細胞中的染色體。將外源分子引入細胞的方法是本領域技術人員已知的,包括但不限於脂質介導的轉移(即脂質體,包括中性和陽離子脂質)、電穿孔、直接注射、細胞融合、粒子轟擊、磷酸鈣共沉澱、DEAE-右旋糖酐介導的轉移和病毒載體介導的轉移。相反,「內源」分子是在特定環境條件下的特定發育階段的特定細胞中通常存在的分子。例如,內源核酸可以包括染色體,線粒體、葉綠體或其它細胞器的基因組,或天然的附加體核酸。其它內源分子可以包括蛋白質,例如轉錄因子和酶。「融合」分子是兩個或多個亞基分子連接(優選共價連接)的分子。亞基分子可以是相同化學類型的分子,或可以是不同化學類型的分子。第一類型的融合分子的例子包括但不限於融合蛋白(例如,ZFP DNA結合域和裂解域之間的融合體)和融合核酸(例如,編碼上述融合蛋白的核酸)。第二類型的融合分子的例子包括但不限於形成三聯體的核酸與多肽之間的融合體以及小溝結合物與核酸之間的融合體。可以將融合蛋白遞送到細胞中或將編碼融合蛋白的多核苷酸遞送到細胞中使融合蛋白在細胞中表達,在細胞中多核苷酸被轉錄,轉錄物被翻譯,以產生融合蛋白。在細胞中表達蛋白質還可涉及反式剪接、多肽裂解和多肽連接。本公開其它地方給出將多核苷酸和多肽遞送到細胞中的方法。
就本公開而言,「基因」包括編碼基因產物的DNA區(見下),以及調節基因產物產生的所有DNA區,不論這種調控序列是否鄰近於編碼和/或轉錄的序列。因此,基因包括但不必限於啟動子序列、終止子、翻譯調控序列(如核糖體結合位點和內部核糖體進入位點)、增強子、沉默子、絕緣子、邊界元件、複製起點、基質附著位點和基因座控制區。「基因表達」是指將基因所含信息轉化為基因產物。基因產物可以是基因的直接轉錄產物(例如mRNA、tRNA、rRNA、反義RNA、核酶、結構RNA或任何其它類型的RNA)或mRNA翻譯產生的蛋白質。基因產物還包括通過諸如加帽、聚腺苷酸化、甲基化和編輯修飾的RNA,以及通過(例如)甲基化、乙醯化、磷酸化、泛素化、ADP-核糖基化、十四烷基化和糖基化修飾的蛋白質。 基因表達的「調控」是指改變基因活性。表達調控可以包括但不限於基因活化和基因阻抑。可以用基因組編輯(例如,裂解、改變、失活、隨機突變)來調控表達。基因失活是指相對於不具有本文所述ZFP的細胞而言基因表達的任何降低。因此,基因失活可以是部分的或完全的。「所關注區域」是細胞染色質的任何區域(如基因或基因內或鄰近於基因的非編碼序列),其中期望結合外源分子。結合的目的可以是為了靶向DNA裂解和/或靶向重組。所關注區域可存在於(例如)染色體、附加體、細胞器基因組(例如線粒體、葉綠體)或感染性病毒基因組中。所關注區域可以位於基因的編碼區內,轉錄的非編碼區(如前導序列、尾隨序列或內含子)內,或位於編碼區上遊或下遊的非轉錄區內。所關注區域可以短到單個核苷酸對或長達2,000個核苷酸對,或任何整數值的核苷酸對。術語「操作性連接」和「操作性連接的」(或「可操作連接的」)可互換使用,指並列的兩個或多個部件(如序列元件),其中各部件的布置使其發揮正常功能,並使至少一個部件能調節對至少一個其它部件施加的作用。例如,如果轉錄調控序列在對一種或多種轉錄調控因子的存在與否的反應中能控制編碼序列的轉錄水平,則該轉錄調控序列(如啟動子)操作性連接到編碼序列。轉錄調控序列通常與編碼序列順式操作性連接,但不一定直接與其鄰接。例如,增強子是操作性連接到編碼序列的轉錄調控序列,即使它們不毗連。對融合多肽而言,術語「操作性連接的」可以指這樣的事實,即各部件在連接其它部件時可執行與不如此連接時相同的功能。例如,對ZFP DNA結合域融合到裂解域的融合多肽而言,如果在該融合多肽中ZFP DNA結合域部分能夠結合其靶位點和/或其結合位點,而裂解域能夠裂解靶位點附近的DNAJU ZFP DNA結合域和裂解域是操作性連接的。蛋白質、多肽或核酸的「功能片段」是序列與全長蛋白質、多肽或核酸不同,但保留與全長蛋白質、多肽或核酸相同功能的蛋白質、多肽或核酸。功能片段可以具有比對應的天然分子更多、更少或與其相同數目的殘基,和/或功能片段可以含有一個或多個胺基酸或核苷酸取代。測定核酸功能(例如編碼功能、與另一核酸雜交的能力)的方法是本領域熟知的。類似地,測定蛋白質功能的方法是熟知的。例如,可以通過(例如)濾膜結合、電泳遷移率變動或免疫沉澱試驗來測定多肽的DNA結合功能。可以通過凝膠電泳來測定DNA裂解。參見Ausubel等人,同上。可以通過(例如)免疫共沉澱、雙雜交試驗或互補(遺傳和生化)測定蛋白質與另一種蛋白質相互作用的能力。參見(例如),Fields等人(1989)Nature 340 :245-246 ;美國專利 No. 5,585,245 和 PCT WO 98/44350。鋅指核酸酶
本文描述了可用於一種或多種大鼠基因的基因組編輯(例如裂解、改變、失活和/或隨機突變)的鋅指核酸酶(ZFN)。ZFN包含鋅指蛋白(ZFP)和核酸酶(裂解)域(例如裂解半域)。A.鋅指蛋白可以改造鋅指結合域以結合到選擇的序列。參見(例如),Beerli等人(2002)Nature Biotechnol. 20 :135-141 ;Pabo 等人(2001)Ann. Rev. Biochem. 70 :313-340 ;Isalan 等人(2001)Nature Biotechnol. 19 :656-660 ;Segal 等人(2001)Curr. Opin.Biotechnol. 12 :632-637 ;Choo 等人(2000) Curr. Opin. Struct. Biol. 10 :411_416。與天然的鋅指蛋白相比,改造的鋅指結合域可具有 新穎的結合特異性,改造方法包括但不限於合理設計和各種類型的選擇。合理設計包括(例如)使用含有三聯體(或四聯體)核苷酸序列和單獨鋅指胺基酸序列的資料庫,其中各三連體或四連體核苷酸序列與結合特定三連體或四連體序列的一種或多種鋅指胺基酸序列相關。參見(例如),共同擁有的美國專利6,453,242和6,534,261,它們的全文以引用方式併入本文。示例性選擇方法(包括噬菌體展示和雙雜交系統)描述在以下專利中美國專利 5,789,538,5, 925,523,6, 007,988,6, 013,453,6, 410,248,6, 140,466,6, 200,759 和6,242,568 ;以及 WO 98/37186,WO 98/53057,WO 00/27878,WO 01/88197 和 GB 2,338,237。另外,在(例如)共同擁有的WO 02/077227中已描述了增強鋅指結合域的結合特異性的方法。靶位點選擇、ZFP和用於設計和構造融合蛋白(和編碼該融合蛋白的多核苷酸)的方法對本領域技術人員來說是已知的,並且詳細描述於美國專利申請公布No. 20050064474和20060188987中,它們的全文以引用方式併入本文。另外,如在這些和其它參考文獻中公開的,鋅指結構域和/或多指鋅指蛋白可使用任何合適的接頭序列(包括例如長度為5個或更多胺基酸的接頭,如TGEKP (SEQ ID NOI) ,TGGQRP(SEQ ID NO :2)、TGQKP(SEQ ID NO :3)和/或TGSQKP(SEQ ID NO :4))來連接在一起。對於長度為6個或更多胺基酸的示例性接頭序列來說,另參見美國專利No. 6,479,626、6,903,185和7,153,949。本文所述的蛋白質可以包括蛋白質的單獨鋅指間的合適接頭的任意組合。如下文所述,在某些實施方案中,四指、五指或六指結合域融合到裂解半域,例如II型限制性核酸內切酶(如FokI)的裂解域。一對或多對此類鋅指/核酸酶半域融合體可用於靶向裂解,如在(例如)美國專利公布No. 20050064474中所描述。對於靶向裂解,結合位點的近邊緣可以間隔有5個或更多核苷酸對,並且各融合蛋白均可結合到DNA靶的相對鏈。所有成對組合均可用於大鼠基因的靶向裂解。按照本發明來說,ZFN可靶向到大鼠基因組中的任意序列。在一些實施方案中,DNA結合域是由源自植物病原黃單胞菌的TAL效應子改造的結構域(參見 Boch 等人,(2009) Science 29 Oct 2009 (10. 1126/science. 117881)和Moscou and Bogdanove, (2009)Science 29 Oct 2009 (10. 1126/science. 1178817)。B.裂解域ZFN還包含核酸酶(裂解域、裂解半域)。本文公開的融合蛋白的裂解域部分可得自任何核酸內切酶或核酸外切酶。可獲得裂解域的示例性核酸內切酶包括但不限於限制性核酸內切酶和歸巢核酸 內切酶。參見(例如),2002-2003 Catalogue, New EnglandBiolabs,Beverly,MA ;和 Belfort 等人(1997)Nucleic Acids Res. 25 :3379_3388。裂解DNA的其它酶是已知的(例如SI核酸酶;綠豆核酸酶;胰DNase I ;微球菌核酸酶;酵母HO核酸內切酶;還參見 Linn 等人(編)Nucleases, Cold Spring Harbor Laboratory 出版社,1993)。這些酶(或其功能片段)中的一種或多種可用作裂解域和裂解半域的來源。類似地,如上所述,裂解半域可來自需要針對裂解活性二聚化的任何核酸酶或其部分。通常,如果融合蛋白包含裂解半域,則裂解需要兩種融合蛋白。或者,可使用含有兩個裂解半域的單一蛋白質。兩個裂解半域可來自相同的核酸內切酶(或其功能片段),或者每個裂解半域可來自不同的核酸內切酶(或其功能片段)。另外,優選彼此相對地設置兩種融合蛋白的靶位點,以使得兩種融合蛋白與其各自靶位點的結合而將這些裂解半域定位於使這些裂解半域形成功能性裂解域(例如通過二聚化)的空間取向上。因此,在某些實施方案中,靶位點的近邊緣間隔有5-8個核苷酸或15-18個核苷酸。然而,可將任何整數量的核苷酸或核苷酸對插入兩個靶位點之間(例如2至50個核苷酸對或更多)。通常,裂解位點位於靶位點之間。許多物種中存在限制性核酸內切酶(限制性酶),它們能夠序列特異性地結合DNA(在識別位點處),並且在結合位點或結合位點附近裂解DNA。某些限制性酶(例如IIS型)在遠離識別位點的位點上裂解DNA,並且具有可分離的結合域和裂解域。例如,IIS型酶Fok I能在在一條鏈上距離識別位點9個核苷酸處和另一條鏈上距離識別位點13個核苷酸處催化DNA雙鏈裂解。參見(例如),美國專利5,356,802 ;5,436,150和5,487,994 ;以及 Li 等人(1992) Proc. Natl. Acad. Sci. USA 89 :4275-4279 ;Li 等人(1993) Proc. Natl.Acad. Sci. USA 90 :2764-2768 ;Kim 等人(1994a)Proc. Natl. Acad. Sci. USA 91 :883-887 ;Kim等人(1994b) J. Biol. Chem. 269 :31,978-31,982。因此,在一個實施方案中,融合蛋白包含至少一種IIS型限制性酶的裂解域(或裂解半域)以及一個或多個鋅指結合域,該鋅指結合域可經過或未經過改造。裂解域可與結合域分離的示例性IIS型限制性酶是Fok I。這種特定酶的二聚體具有活性。Bitinaite 等人(1998) Proc. Natl. Acad. Sci. USA 95 :10,570-10,575。因此,為了本公開的目的而言,認為用於所公開融合蛋白的Fok I酶的一部分是裂解半域。因此,為了用鋅指-Fok I融合體來靶向雙鏈裂解和/或靶向替換細胞序列,可使用各自含有Fok I裂解半域的兩種融合蛋白來重建有催化活性的裂解域。或者,也可使用含有鋅指結合域和兩個Fok I裂解半域的單一多肽分子。在本公開其它地方提供了用鋅指-Fok I融合體進行靶向裂解和靶向序列改變的參數。裂解域或裂解半域可以是保留裂解活性或保留多聚化(例如二聚化)以形成功能性裂解域的能力的蛋白質的任何部分。。示例性IIS型限制性酶在國際公布WO 07/014275中有所描述,該公布全文併入本文。其它限制性酶也含有可分離的結合域和裂解域,本公開也設想了這些限制性酶。參見(例如),Roberts 等人(2003) Nucleic Acids Res. 31 :418_420。在某些實施方案中,裂解域包含最小化或防止均二聚的一個或多個改造的裂解半域(也稱為二聚化域突變體),例如在美國專利公布No. 20050064474,20060188987和20080131962中所述,所有這些專利公布的公開內容以引用方式全文併入本文。在Fok I的446、447、479、483、484、486、487、490、491、496、498、499、500、531、534、537 和 538 位置上的
胺基酸殘基全部都是影響Fok I裂解半域二聚化的靶形成專性異質二聚體的Fok I的示例性改造裂解半域包括這樣的對,其中第一裂解半域在Fok I的490和538位置上的胺基酸殘基處具有突變,而第二裂解半域在486和499胺基酸殘基處具有突變。因此,在一個實施方案中,490上的突變用Lys(K)替換Glu(E) ;538上的突變用Lys (K)替換Iso(I) ;486上的突變用Glu(E)替換Gln(Q) ;499上的突變用Lys (K)替換Iso(I)。具體來說,本文所述改造的裂解半域是通過以下方式製備在一個裂解半域中使位置490突變(E — K)和使538突變(I — K)以製備稱為「E490K: I538K」的改造裂解半域,以及在另一裂解半域中使位置486突變(Q — E)和使位置499突變(I — L)以製備稱為「Q486E: I499L」的改造裂解半域。本文所述的改造裂解半域是專性異質二聚體突變體,其中異常裂解被最小化或消除。參見(例如)美國專利公布No. 2008/0131962的實施例1,其公開內容出於所有目的以引用方式全文併入本文。本文所述的改造裂解半域可以通過任何合適的方法來製備,例如,通過野生型裂解半域(Fok I)的位點定向誘變,如在美國專利公布如.2005006447400.10/912,932,實施例5)和美國專利臨時申請No. 60/721,054實施例38)中所述。C.在大鼠中靶向裂解的其它方法本文公開的方法中可以使用在任何大鼠基因中具有靶位點的任何核酸酶。例如,歸巢核酸內切酶和巨核酸酶具有十分長的識別序列,其中一些在統計上在人類基因組中可能僅出現一次。不使用鋅指核酸酶,或除了使用鋅指核酸酶之外,可以使用任何在大鼠基因中具有靶位點的此類核酸酶來在大鼠基因中靶向裂解。示例性歸巢核酸內切酶包括I-Scel、I-CeuI、PI-PspI、ΡΙ-Sce、Ι-SceIV、I-CsmI,
I-PanI、I-SceII、I-PpoI、Ι-SceIII、I-CreI、I-TevI、I-TevII 和 I-TevIII。它們的識別序列是已知的。還參見美國專利No. 5,420,032 ;美國專利No. 6,833,252 ;Belfort等人(1997)Nucleic Acids Res. 25 :3379-3388 ;Dujon 等人(1989)Gene 82 :115-118 ;Perler等人(1994)Nucleic Acids Res. 22,1125-1127 Jasin(1996)Trends Genet. 12 :224-228 ;Gimble 等人(1996) J. Mol. Biol. 263 :163-180 ;Argast 等人(1998) J. Mol. Biol. 280 345-353以及新英格蘭生物實驗室公司(New England Biolabs)目錄。雖然就識別位點而言,大多數歸巢核酸內切酶的裂解特異性並不是絕對的,但這些位點足夠長,使得通過在含有其識別位點的單個拷貝的細胞中表達歸巢核酸內切酶可以獲得每個哺乳動物大小的基因組的單裂解事件。此外有報導,歸巢核酸內切酶和巨核酸酶的特異性可以被改造成結合非天然祀位點。參見(例如),Chevalier等人(2002)Molec.Cell 10 :895-905 ;Epinat 等人(2003)Nucleic Acids Res. 31 :2952-2962 ;Ashworth 等人(2006) Nature 441 :656-659 ;Paques 等人(2007) Current Gene Therapy 7 :49-66 遞送本文所述的ZFN可以通過任何合適的方式(包括例如通過ZFN mRNA注射)遞送到革巴大鼠細胞。參見 Hammerschmidt 等人(1999)Methods Cell Biol. 59 :87_115。遞送包含鋅指的蛋白質的方法在以下文獻中有所描述美國專利No. 6,453,242、6,503,717、6,534,261,6, 599,692、6,607,882、6,689,558,6, 824,978,6, 933,113、·6,979,539,7, 013, 219和7,163,824,所有這些專利的公開內容以引用方式全文併入本文。本文所述的ZFN還可用含有編碼一種或多種ZFN的序列的載體來遞送。可以使用任何系統,包括但不限於質粒載體、逆轉錄病毒載體、慢病毒載體、腺病毒載體、痘病毒載體、皰疹病毒載體和腺相關病毒載體等。還可參見美國專利No. 6,534,261,6, 607,882、6,824,978,6, 933,113,6, 979,539,7, 013,219 和 7,163,824,它們的全文以引用方式併入本文。此外,顯而易見的是,任何這些載體可以包含一種或多種ZFN編碼序列。因此,當把一對或多對ZFN引入細胞時,ZFN可以攜帶在相同載體或在不同載體上。當使用多種載體時,各載體可包含編碼一種或多種ZFN的序列。可以使用基於常規病毒和非病毒的基因轉移方法來在大鼠細胞中引入編碼經改造的ZFP的核酸。這種方法還可用於對大鼠細胞離體施用編碼ZFP的核酸。在某些實施方案中,施加編碼ZFP的核酸用於活體內或活體外的用途。非病毒載體遞送系統包括電穿孔、脂質轉染、顯微注射、生物彈道術、病毒小體、月旨質體、免疫脂質體、聚陽離子或脂質核酸共軛物、裸露DNA、人造病毒粒子以及藥劑增強攝取的DNA。使用(例如)Sonitron 2000系統(Rich-Mar)的聲穿孔也可用於遞送核酸。病毒載體遞送系統包括DNA病毒和RNA病毒,它們在遞送到細胞之後具有附加體或整合基因組。其它示例性核酸遞送系統包括以下公司提供那些Amaxa Biosystems (Cologne, Germany)、Maxcyte 公司(Rockville, Maryland)> BTX Molecular Delivery Systems(Holliston,MA)和 Copernicus Therapeutics 公司(參見如 US6008336)。脂質轉染在(例如)US5,049,386、US 4,946,787和US 4,897,355中有所描述,脂質轉染試劑是市售的(例如Transfectam11^P Lipofectin )。適於多核苷酸的有效受體識別脂質轉染的陽離子脂質和中性脂質包括Feigner在WO 91/17424、WO 91/16024中所描述的那些。可遞送到細胞(活體外施用)或靶組織(活體內施用)。脂質核酸複合物(包括諸如免疫脂質複合物之類的靶向脂質體)的製備為本領域技術人員所熟知(參見(例如)Crystal,Science 270:404-410(1995) ;Blaese 等人,Cancer Gene Ther. 2 :291-297 (1995);Behr 等人,Bioconjugate Chem. 5 :382-389 (1994) ;Remy 等人,Bioconjugate Chem. 5 647-654(1994) ;Gao 等人,Gene Therapy 2:710-722(1995) ;Ahmad 等人,CancerRes. 52 :4817-4820(1992);美國專利 No. 4,186,183,4, 217,344,4, 235,871,4, 261,975、4,485,054,4, 501,728,4, 774,085,4, 837,028 和 4,946,787)。如上所示,所公開方法和組合物可用於任何類型的大鼠細胞。也可以使用大鼠細胞的子代、變體和衍生物。應用所公開方法和組合物可用於任何大鼠基因的基因組編輯。在某些應用中,所述方法和組合物可用於大鼠基因組序列的失活。在其它應用中,所述方法和組合物使得可以產生隨機突變,包括產生基因的新型等位基因形式(其與未編輯的基因相比具有不同的表達)或人化大鼠基因的整合,從而又使得可以產生動物模型。在其它應用中,所述方法和組合物可用於在基因的確定位置上產生隨機突變,該隨機突變使得可以識別或選擇攜帶了那些基因的新型等位基因形式的動物。在其它應用中,所述方法和組合物使得可以將外源(供體)序列靶向整合到大鼠基因組的任何所選區域中。調控序列(例如啟動子)可在所關注位點上以靶向方式整合。「整合」意味著物理插入(例如插入到宿主細胞基因組中),也意味著通過核酸複製程序將供體序列拷貝到宿主細胞基因組中來進行的整合。供體序列也可以包含核苷酸,如shRNA、miRNA等等。這些小核酸供體可用於研究它們對大鼠基因組內所關注基因的作用。大鼠基因的基因組編輯(例如失活、整合和/或靶向突變或隨機突變)可以通過(例如)以下方式實現單裂解事件;非同源端連接後裂解;同源定向修復機制後裂解;物理整合供體序列後裂解;連接後在兩個位點上的裂解,以便刪除該兩個裂解位點間的序列;將錯義或無義密碼子靶向重組到編碼區中;將無關序列(即,「填充片段」序列)靶向重組到基因或其調控區中,以便中斷該基因或調控區;或者將剪接受體序列靶向重組到內含子中以導致轉錄物錯剪接。參見美國專利公布No. 20030232410,20050208489,20050026157,20050064474,20060188987,20060063231 以及國際公布 WO 07/014275,這些申請的公開內容出於所有目的以引用 方式全文併入本文。大鼠ZFN介導的基因組編輯有許多應用。本文所述的方法和組合物使得可以產生人類疾病的大鼠模型。例如,編輯P53基因使得可以產生「腫瘤大鼠」,為研究腫瘤和測試腫瘤療法提供動物模型。實施例實施例I :ZFN誘導大鼠C6細胞中的靶向中斷設計了靶向大鼠p53的ZFN,並將其併到質粒中,基本上如在Urnov等人(2005)Nature 435(7042) :646-651中所述。代表性大鼠p53設計的識別螺旋示於下表I中。這些ZFN的靶位點示於表2中。表I :大鼠p53特異性ZFN設計
ZFN Fl F2 F3 F4 名稱_10356 RSDDLTR RSDHLSR DNPNLNR RSDDLSR
(SEQ ID (SEQ ID (SEQ ID (SEQ ID NO:16) NO:44) NO:55) N0:100)
權利要求
1.一種修飾大鼠細胞中的ー種或多種內源細胞基因的方法,所述方法包括 把編碼ー種或多種鋅指核酸酶(ZFN)的一種或多種多核苷酸引入所述大鼠細胞,所述鋅指核酸酶(ZFN)在使得所述ZFN被表達並且所述ー種或多種內源細胞基因被裂解和修飾的條件下,結合到所述ー種或多種基因中的靶位點上。
2.根據權利要求I所述的方法,其中所述修飾包括通過由裂解所述ー種或多種內源細胞基因所刺激的同源重組來將外源序列引入到大鼠細胞的所述基因組中。
3.根據權利要求2所述的方法,其中所述外源序列被物理性整合到所述基因組中。
4.根據權利要求2所述的方法,其中通過核酸複製程序將所述外源序列拷貝到所述宿主細胞基因組中來使所述外源序列整合到所述基因組中。
5.根據權利要求4所述的方法,其中所述核酸複製程序包括同源定向修復雙鏈斷裂。
6.根據權利要求4所述的方法,其中所述核酸複製程序包括非同源依賴性靶向整合。
7.根據權利要求I所述的方法,其中所述修飾是在裂解之後非同源端連接的結果。
8.根據權利要求7所述的方法,其中第一和第二鋅指核酸酶在兩個位點上裂解所述基因組,而且其中所述非同源端連接導致在所述第一裂解位點與所述第二裂解位點之間的缺失。
9.根據權利要求I到8中任一項所述的方法,其中所述鋅指核酸酶包含IIS型限制性核酸內切酶的裂解域或裂解半域。
10.一種胚系中斷大鼠中ー種或多種靶基因的方法,所述方法包括修飾在大鼠胚胎的一個或多個細胞的所述基因組中的ー種或多種基因序列,所述方法包括 根據權利要求I到9中任一項所述的方法,修飾大鼠胚胎的一個或多個細胞中的ー種或多種所述靶基因;和 使所述大鼠胚胎發育,其中修飾的基因序列存在於性成熟大鼠的至少一部分配子中。
11.ー種在所關注的大鼠基因座中產生ー種或多種可遺傳突變體等位基因的方法,所述方法包括 通過權利要求I到9中任一項所述的方法,修飾大鼠胚胎的一個或多個細胞的所述基因組中的ー個或多個基因座;和 將所述大鼠胚胎飼養至性成熟;和 使所述性成熟大鼠產生後代;其中所述後代中的至少ー些包含所述突變體等位基因。
12.ー種包含一種或多種修飾的等位基因的大鼠,其是通過權利要求I至11中任ー項所述的方法來產生的。
全文摘要
本文公開了用於大鼠中一個或多個基因座的基因組編輯的方法和組合物,該方法和組合物使用包含鋅指蛋白和裂解域或裂解半域的融合蛋白。還提供了編碼所述融合蛋白的多核苷酸,以及包含所述多核苷酸和融合蛋白的細胞。
文檔編號C12N15/11GK102625655SQ200980154833
公開日2012年8月1日 申請日期2009年12月3日 優先權日2008年12月4日
發明者崔曉霞, 費奧多·厄諾夫, 阿榮·M·戈特斯 申請人:桑格摩生物科學股份有限公司, 西格瑪奧德裡奇有限公司

同类文章

一種新型多功能組合攝影箱的製作方法

一種新型多功能組合攝影箱的製作方法【專利摘要】本實用新型公開了一種新型多功能組合攝影箱,包括敞開式箱體和前攝影蓋,在箱體頂部設有移動式光源盒,在箱體底部設有LED脫影板,LED脫影板放置在底板上;移動式光源盒包括上蓋,上蓋內設有光源,上蓋部設有磨沙透光片,磨沙透光片將光源封閉在上蓋內;所述LED脫影

壓縮模式圖樣重疊檢測方法與裝置與流程

本發明涉及通信領域,特別涉及一種壓縮模式圖樣重疊檢測方法與裝置。背景技術:在寬帶碼分多址(WCDMA,WidebandCodeDivisionMultipleAccess)系統頻分復用(FDD,FrequencyDivisionDuplex)模式下,為了進行異頻硬切換、FDD到時分復用(TDD,Ti

個性化檯曆的製作方法

專利名稱::個性化檯曆的製作方法技術領域::本實用新型涉及一種檯曆,尤其涉及一種既顯示月曆、又能插入照片的個性化檯曆,屬於生活文化藝術用品領域。背景技術::公知的立式檯曆每頁皆由月曆和畫面兩部分構成,這兩部分都是事先印刷好,固定而不能更換的。畫面或為風景,或為模特、明星。功能單一局限性較大。特別是畫

一種實現縮放的視頻解碼方法

專利名稱:一種實現縮放的視頻解碼方法技術領域:本發明涉及視頻信號處理領域,特別是一種實現縮放的視頻解碼方法。背景技術: Mpeg標準是由運動圖像專家組(Moving Picture Expert Group,MPEG)開發的用於視頻和音頻壓縮的一系列演進的標準。按照Mpeg標準,視頻圖像壓縮編碼後包

基於加熱模壓的纖維增強PBT複合材料成型工藝的製作方法

本發明涉及一種基於加熱模壓的纖維增強pbt複合材料成型工藝。背景技術:熱塑性複合材料與傳統熱固性複合材料相比其具有較好的韌性和抗衝擊性能,此外其還具有可回收利用等優點。熱塑性塑料在液態時流動能力差,使得其與纖維結合浸潤困難。環狀對苯二甲酸丁二醇酯(cbt)是一種環狀預聚物,該材料力學性能差不適合做纖

一種pe滾塑儲槽的製作方法

專利名稱:一種pe滾塑儲槽的製作方法技術領域:一種PE滾塑儲槽一、 技術領域 本實用新型涉及一種PE滾塑儲槽,主要用於化工、染料、醫藥、農藥、冶金、稀土、機械、電子、電力、環保、紡織、釀造、釀造、食品、給水、排水等行業儲存液體使用。二、 背景技術 目前,化工液體耐腐蝕貯運設備,普遍使用傳統的玻璃鋼容

釘的製作方法

專利名稱:釘的製作方法技術領域:本實用新型涉及一種釘,尤其涉及一種可提供方便拔除的鐵(鋼)釘。背景技術:考慮到廢木材回收後再加工利用作業的方便性與安全性,根據環保規定,廢木材的回收是必須將釘於廢木材上的鐵(鋼)釘拔除。如圖1、圖2所示,目前用以釘入木材的鐵(鋼)釘10主要是在一釘體11的一端形成一尖

直流氧噴裝置的製作方法

專利名稱:直流氧噴裝置的製作方法技術領域:本實用新型涉及ー種醫療器械,具體地說是ー種直流氧噴裝置。背景技術:臨床上的放療過程極易造成患者的局部皮膚損傷和炎症,被稱為「放射性皮炎」。目前對於放射性皮炎的主要治療措施是塗抹藥膏,而放射性皮炎患者多伴有局部疼痛,對於止痛,多是通過ロ服或靜脈注射進行止痛治療

新型熱網閥門操作手輪的製作方法

專利名稱:新型熱網閥門操作手輪的製作方法技術領域:新型熱網閥門操作手輪技術領域:本實用新型涉及一種新型熱網閥門操作手輪,屬於機械領域。背景技術::閥門作為流體控制裝置應用廣泛,手輪傳動的閥門使用比例佔90%以上。國家標準中提及手輪所起作用為傳動功能,不作為閥門的運輸、起吊裝置,不承受軸向力。現有閥門

用來自動讀取管狀容器所載識別碼的裝置的製作方法

專利名稱:用來自動讀取管狀容器所載識別碼的裝置的製作方法背景技術:1-本發明所屬領域本發明涉及一種用來自動讀取管狀容器所載識別碼的裝置,其中的管狀容器被放在循環於配送鏈上的文檔匣或託架裝置中。本發明特別適用於,然而並非僅僅專用於,對引入自動分析系統的血液樣本試管之類的自動識別。本發明還涉及專為實現讀