核酸酶介導的使用大靶向載體的靶向的製作方法
2023-05-15 18:56:16 2
核酸酶介導的使用大靶向載體的靶向的製作方法
【專利摘要】本申請提供了通過使用同源重組在基因組的靶基因座製備一種或多種經靶向的基因修飾的組合物和方法,其中通過在所述靶基因組的基因座或其附近的單鏈或雙鏈的斷裂促進所述同源重組。本申請還提供了使用工程改造的核酸酶在原核或真核細胞中提高LTVEC和基因組的靶基因座之間同源重組效率的組合物和方法。
【專利說明】核酸酶介導的使用大靶向載體的靶向
[0001] 相關申請的奪叉引用
[0002] 本申請要求2012年4月25日提交的美國臨時申請號61/638, 267的優先權,其全 部內容通過引用併入本申請。 發明領域
[0003] 核酸酶和DNA構建體包括靶向載體(例如,大靶向載體,"LTVEC")以用於實現在 基因組的靶基因座的同源重組。本申請提供了通過使用同源重組製備經靶向的基因修飾的 組合物和方法,其中通過在基因組的靶基因座或其附近的單鏈或雙鏈斷裂促進所述同源重 組。本申請提供了使用工程改造的核酸酶在原核或真核細胞中提高LTVEC和基因組的靶基 因座之間同源重組效率的組合物和方法。
【背景技術】
[0004] 使用靶向載體的同源重組是一種在非人動物中獲得所需基因組修飾的流行方法, 所述靶向載體被特別設計以便在基因組的基因座加入、缺失或取代特定的核酸序列。被特 異性工程改造以便在基因組的靶基因座或其附近引入單鏈或雙鏈斷裂的核酸酶能夠與靶 向載體一起使用以提高在基因組的靶基因座同源重組的效率。
[0005] 儘管通過同源重組進行基因組修飾的技術在最近二十年中已經相當先進,但是在 很多情況下使用非常大的靶向載體LTVEC達到可接受的靶向頻率仍存在困難,例如當使用 較多的人源基因組片段取代較大部分的齧齒動物基因組時,或者靶向某些細胞類型時存在 困難,例如成纖維細胞或其他體細胞。在本領域中需要用於使用LTVEC修飾真核基因組的 較大基因組基因座的更多的和改進的方法。
[0006] 發明概沭
[0007] 本申請提供了使用大靶向載體(LTVEC)聯合核酸酶試劑修飾基因組中感興趣的 基因座的組合物和方法,所述組合物和方法使得在基因組中感興趣的基因座上能夠有效進 行較大的核酸序列的缺失、加入(例如插入)和/或取代。
[0008] 本申請提供了使用LTVEC和核酸酶試劑通過細菌同源重組(BHR)在原核細胞中修 飾哺乳動物基因組的靶基因座的組合物和方法,其中通過所述核酸酶試劑在基因組的靶基 因座或其附近產生的單鏈或雙鏈斷裂促進所述BHR。本申請提供了包含LTVEC和核酸酶試 劑的原核細胞,所述核酸酶試劑在表達後能夠在靶位點或其附近引入單鏈或雙鏈斷裂。本 申請提供了用於通過使用本申請所述的各種LTVEC和核酸酶在發生重組的原核細胞中使 用外源性的核酸序列(例如,同源的或直系同源的人源基因組核酸序列)取代非人動物較 大的基因組基因座的組合物和方法。
[0009] 本申請提供了在各種多能性哺乳動物細胞中使用LTVEC和核酸酶試劑修飾基因 組中感興趣的基因座的組合物和方法。本申請提供了用於通過使用本申請所述的各種 LTVEC和核酸酶在非人動物的多能細胞中使用外源性的核酸序列(例如,同源的或直系同 源的人源基因組核酸序列)取代非人動物較大的基因組基因座的組合物和方法。
[0010] 本申請提供了非人動物的多能細胞,所述細胞包含本申請所述的各種LTVEC和核 酸酶試劑。
[0011] 本申請提供了用於生成經基因修飾的非人動物的組合物和方法,所述經基因修飾 的非人動物包含如本申請所述的一個或多個經靶向的基因修飾。
[0012] 在一個方面,本申請提供了 一種原核細胞,所述原核細胞包含大靶向載體 (LTVEC),所述載體包含定向至靶基因座的同源臂,和編碼核酸酶試劑的核酸序列,所述核 酸酶試劑在所述靶基因座或其附近形成單鏈或雙鏈斷裂。
[0013] 在一個實施方式中,所述原核細胞能表達介導細菌同源重組(BHR)的重組酶。在 一個實施方式中,所述原核細胞是大腸桿菌的具有重組能力的菌株。
[0014] 在一個實施方式中,所述LTVEC的範圍為約50kb至約300kb。在一個實施方式中, 所述LTVEC的範圍為約50kb至約75kb。在一個實施方式中,所述LTVEC的範圍為約75kb至 約100kb。在一個實施方式中,所述LTVEC的範圍為約IOOkb至約125kb。在一個實施方式 中,所述LTVEC的範圍為約125kb至約150kb。在一個實施方式中,所述LTVEC的範圍為約 150kb至約175kb。在一個實施方式中,所述LTVEC的範圍為約175kb至約200kb。在一個 實施方式中,所述LTVEC的範圍為約200kb至約225kb。在一個實施方式中,所述LTVEC的 範圍為約225kb至約250kb。在一個實施方式中,所述LTVEC的範圍為約250kb至約275kb。 在一個實施方式中,所述LTVEC的範圍為約275kb至約300kb。
[0015] 在一個實施方式中,所述靶向載體的同源臂來源於BAC文庫、粘粒文庫或Pl噬菌 體文庫。在一個實施方式中,所述同源臂來源於使用常規方法不能靶向的非人動物基因組 基因座。在一個實施方式中,所述同源臂來源於合成的DNA。
[0016] 在一個實施方式中,上遊同源臂和下遊同源臂的總和是至少10kb。在一個實施方 式中,所述上遊同源臂的範圍為約5kb至約100kb。在一個實施方式中,所述下遊同源臂的 範圍為約5kb至約100kb。在一個實施方式中,所述上遊和所述下遊同源臂的範圍為約5kb 至約10kb。在一個實施方式中,所述上遊和所述下遊同源臂的範圍為約IOkb至約20kb。在 一個實施方式中,所述上遊和所述下遊同源臂的範圍為約20kb至約30kb。在一個實施方式 中,所述上遊和所述下遊同源臂的範圍為約30kb至約40kb。在一個實施方式中,所述上遊 和所述下遊同源臂的範圍為約40kb至約50kb。在一個實施方式中,所述上遊和所述下遊同 源臂的範圍為約50kb至約60kb。在一個實施方式中,所述上遊和所述下遊同源臂的範圍 為約60kb至約70kb。在一個實施方式中,所述上遊和所述下遊同源臂的範圍為約70kb至 約80kb。在一個實施方式中,所述上遊和所述下遊同源臂的範圍為約SOkb至約90kb。在 一個實施方式中,所述上遊和所述下遊同源臂的範圍為約90kb至約100kb。在一個實施方 式中,所述上遊和所述下遊同源臂的範圍為約IOOkb至約110kb。在一個實施方式中,所述 上遊和所述下遊同源臂的範圍為約IlOkb至約120kb。在一個實施方式中,所述上遊和所述 下遊同源臂的範圍為約120kb至約130kb。在一個實施方式中,所述上遊和所述下遊同源臂 的範圍為約130kb至約140kb。在一個實施方式中,所述上遊和所述下遊同源臂的範圍為約 140kb至約150kb。在一個實施方式中,所述上遊和所述下遊同源臂的範圍為約150kb至約 160kb。在一個實施方式中,所述上遊和所述下遊同源臂的範圍為約160kb至約170kb。在 一個實施方式中,所述上遊和所述下遊同源臂的範圍為約170kb至約180kb。在一個實施方 式中,所述上遊和所述下遊同源臂的範圍為約180kb至約190kb。在一個實施方式中,所述 上遊和所述下遊同源臂的範圍為約190kb至約200kb。
[0017] 在一個實施方式中,所述LTVEC包含選擇性表達盒。在一個實施方式中,所述選擇 性表達盒包含編碼選擇性標記物的核酸序列,其中所述核酸序列與啟動子可操作地連接。 在一個實施方式中,所述啟動子在原核細胞中具有活性。在一個實施方式中,所述啟動子在 原核和真核細胞中均具有活性。在一個實施方式中,所述選擇性標記物選自新黴素磷酸轉 移酶(nec/)、潮黴素 B磷酸轉移酶(hyg〇、嘌呤黴素-N-乙醯基轉移酶(pure/)、殺稻瘟菌 素 S脫氨酶(bsrO、黃嘌呤/鳥嘌呤磷酸核糖轉移酶(gpt)和單純皰疹病毒胸腺嘧啶激酶 (HSV-k)及其組合。
[0018] 在一個實施方式中,所述LTVEC包含範圍為約5kb至約200kb的插入核酸。在一 個實施方式中,所述插入核酸為約5kb至約10kb。在一個實施方式中,所述插入核酸為約 IOkb至約20kb。在一個實施方式中,所述插入核酸為約20kb至約30kb。在一個實施方式 中,所述插入核酸為約30kb至約40kb。在一個實施方式中,所述插入核酸為約40kb至約 50kb。在一個實施方式中,所述插入核酸為約60kb至約70kb。在一個實施方式中,所述插 入核酸為約80kb至約90kb。在一個實施方式中,所述插入核酸為約90kb至約100kb。在 一個實施方式中,所述插入核酸為約IOOkb至約110kb。在一個實施方式中,所述插入核酸 為約120kb至約130kb。在一個實施方式中,所述插入核酸為約130kb至約140kb。一個 實施方式中,所述插入核酸為約140kb至約150kb。在一個實施方式中,所述插入核酸為約 150kb至約160kb。在一個實施方式中,所述插入核酸為約160kb至約170kb。在一個實施 方式中,所述插入核酸為約17〇kb至約180kb。在一個實施方式中,所述插入核酸為約180kb 至約190kb。在一個實施方式中,所述插入核酸為約190kb至約200kb。
[0019] 在一個實施方式中,所述LTVEC包含插入核酸,所述插入核酸含有翼側為位點特 異性重組祀序列的核酸。在一個實施方式中,所述核酸含有基因組核酸。在一個實施方式 中,所述基因組核酸來源於小鼠、人或其組合。在一個實施方式中,所述位點特異性重組靶 序列選自下組:l〇xP、l〇x511、lox2272、lox66、lox71、loxM2、lox5171、FRT、FRT11、FRT71、 attp、att、FRT、rox 及其組合。
[0020] 在一個實施方式中,所述LTVEC包含插入核酸,所述插入核酸含有條件型等位基 因。在一個實施方式中,所述條件型等位基因是如在US 2011/0104799中所描述的多功能 等位基因,其全部內容通過引用併入本申請。在一個實施方式中,所述條件型等位基因包 含:(a)在相對於靶基因轉錄而言有意義方向的驅動序列,和在有意義或反義方向的藥物 選擇性表達盒;(b)在反義方向的感興趣的核苷酸序列(NSI)和條件型倒置模塊(COIN,其 利用外顯子分割的內含子和可逆的基因捕獲樣分子;參見例如US 2011/0104799,其全部 內容通過引用併入和(c)可重組單元,其在與第一重組酶接觸後重組形成(i)缺乏驅動序 列和DSC以及(ii)在有意義方向含有NSI和在反義方向含有COIN的條件型等位基因。
[0021] 在一個實施方式中,所述LTVEC包含插入核酸,所述插入核酸含有選擇性表達盒。 在一個實施方式中,所述選擇性表達盒包含編碼選擇性標記物的核酸序列,其中所述核酸 序列與啟動子可操作地連接。在一個實施方式中,所述啟動子在原核細胞中具有活性。在一 個實施方式中,所述核酸在原核和真核細胞中均具有活性。在一個實施方式中,所述選擇性 表達盒的翼側具有位點特異性重組靶序列。在一個實施方式中,所述選擇性標記物選自新 黴素磷酸轉移酶(nee/)、潮黴素 B磷酸轉移酶(hyg〇、嘌呤黴素-N-乙醯基轉移酶(pure/)、 殺稻瘟菌素 S脫氨酶(bsrO、黃嘌呤/鳥嘌呤磷酸核糖轉移酶(gpt)和單純皰疹病毒胸腺 嘧啶激酶(HSV-k)及其組合。
[0022] 在一個實施方式中,所述LTVEC包含插入核酸,所述插入核酸含有與啟動子可操 作地連接的報告基因,其中所述報告基因編碼選自下組的報告蛋白:LacZ、mPl Um、mChenT、 tdTomato、mStrawberry、J-RecU DsRecU mOrange、mKO、mCitrine、Venus、YPet、增強的黃 色螢光蛋白(EYFP)、Emerald、增強的綠色螢光蛋白(EGFP)、CyPet、青色螢光蛋白(CFP)、 Cerulean、T_Sapphire、突光素酶、鹼性磷酸酶及其組合。在一個實施方式中,所述報告基因 在誘導型啟動子的控制下表達。在一個實施方式中,所述報告基因在內源性啟動子的控制 下表達。在一個實施方式中,所述報告基因在外源性啟動子的控制下表達。在一個實施方 式中,所述報告基因在特定的細胞類型中表達。在一個實施方式中,所述報告基因以組織特 異性的方式表達。在一個實施方式中,所述報告基因以發育階段特異性的方式表達。
[0023] 在一個方面,本申請提供了一種真核細胞,所述真核細胞包含大靶向載體,所述靶 向載體含有定向至所述真核細胞基因組中的靶基因座的同源臂和編碼核酸酶試劑的核酸 序列,所述核酸酶試劑在靶基因座或其附近形成單鏈或雙鏈斷裂。
[0024] 在一個實施方式中,所述真核細胞是多能細胞。在一個實施方式中,所述多能細胞 是胚胎幹(ES)細胞。在一個實施方式中,所述多能細胞是非人ES細胞。在一個實施方式 中,所述多能細胞是誘導多能性幹(iPS)細胞。在一個實施方式中,所述誘導多能性(iPS) 細胞來源於成纖維細胞。在一個實施方式中,所述誘導多能性(iPS)細胞來源於人成纖維 細胞。在一個實施方式中,所述多能細胞是造血幹細胞(HSC)。在一個實施方式中,所述多 能細胞神經幹細胞(NSC)。在一個實施方式中,所述多能細胞是外胚層幹細胞。在一個實施 方式中,所述多能細胞是發育受限的祖細胞。在一個實施方式中,所述多能細胞是齧齒動物 多能細胞。在一個實施方式中,所述齧齒動物多能細胞是大鼠多能細胞。在一個實施方式 中,所述大鼠多能細胞是大鼠 ES細胞。在一個實施方式中,所述齧齒動物多能細胞是小鼠 多能細胞。在一個實施方式中,所述多能細胞是小鼠胚胎幹(ES)細胞。
[0025] 在一個實施方式中,所述真核細胞是永生化的小鼠或大鼠細胞。在一個實施方式 中,所述真核細胞是永生化的人源細胞。在一個實施方式中,所述真核細胞是人成纖維細 胞。在一個實施方式中,所述真核細胞是癌細胞。在一個實施方式中,所述真核細胞是人癌 細胞。
[0026] 在一個實施方式中,所述LTVEC的範圍為約50kb至約300kb。在一個實施方式中, 所述LTVEC的範圍為約50kb至約75kb。在一個實施方式中,所述LTVEC的範圍為約75kb 至約100kb。在一個實施方式中,所述LTVEC的範圍為約IOOkb至125kb。在一個實施方式 中,所述LTVEC的範圍為約125kb至約150kb。在一個實施方式中,所述LTVEC的範圍為約 150kb至約175kb。在一個實施方式中,所述LTVEC的範圍為約175kb至約200kb。在一個 實施方式中,所述LTVEC的範圍為約200kb至約225kb。在一個實施方式中,所述LTVEC的 範圍為約225kb至約250kb。在一個實施方式中,所述LTVEC的範圍為約250kb至約275kb。 在一個實施方式中,所述LTVEC的範圍為約275kb至約300kb。
[0027] 在一個實施方式中,所述靶向載體的同源臂來源於BAC文庫、粘粒文庫或Pl噬菌 體文庫。在一個實施方式中,所述同源臂來源於使用常規方法不能靶向的非人動物的基因 組基因座。在一個實施方式中,所述同源臂來源於合成的DNA。
[0028] 在一個實施方式中,上遊同源臂和下遊同源臂的總和為至少10kb。在一個實施方 式中,所述上遊同源臂的範圍為約5kb至約100kb。在一個實施方式中,所述下遊同源臂的 範圍為約5kb至約100kb。在一個實施方式中,所述上遊和所述下遊同源臂的範圍為約5kb 至約10kb。在一個實施方式中,所述上遊和所述下遊同源臂的範圍為約IOkb至約20kb。在 一個實施方式中,所述上遊和所述下遊同源臂的範圍為約20kb至約30kb。在一個實施方式 中,所述上遊和所述下遊同源臂的範圍為約30kb至約40kb。在一個實施方式中,所述上遊 和所述下遊同源臂的範圍為約40kb至約50kb。在一個實施方式中,所述上遊和所述下遊同 源臂的範圍為約50kb至約60kb。在一個實施方式中,所述上遊和所述下遊同源臂的範圍 為約60kb至約70kb。在一個實施方式中,所述上遊和所述下遊同源臂的範圍為約70kb至 約80kb。在一個實施方式中,所述上遊和所述下遊同源臂的範圍為約SOkb至約90kb。在 一個實施方式中,所述上遊和所述下遊同源臂的範圍為約90kb至約100kb。在一個實施方 式中,所述上遊和所述下遊同源臂的範圍為約IOOkb至約llOkb。在一個實施方式中,所述 上遊和所述下遊同源臂的範圍為約IlOkb至約120kb。在一個實施方式中,所述上遊和所述 下遊同源臂的範圍為約120kb至約130kb。在一個實施方式中,所述上遊和所述下遊同源臂 的範圍為約130kb至約140kb。在一個實施方式中,所述上遊和所述下遊同源臂的範圍為約 140kb至約150kb。在一個實施方式中,所述上遊和所述下遊同源臂的範圍為約150kb至約 160kb。在一個實施方式中,所述上遊和所述下遊同源臂的範圍為約160kb至約170kb。在 一個實施方式中,所述上遊和所述下遊同源臂的範圍為約170kb至約180kb。在一個實施方 式中,所述上遊和所述下遊同源臂的範圍為約180kb至約190kb。在一個實施方式中,所述 上遊和所述下遊同源臂的範圍為約190kb至約200kb。
[0029] 在一個實施方式中,所述LTVEC包含選擇性表達盒。在一個實施方式中,所述選擇 性表達盒包含編碼選擇性標記物的核酸序列,其中所述核酸序列與啟動子可操作地連接。 在一個實施方式中,所述啟動子在原核細胞中具有活性。在一個實施方式中,所述核酸在 原核和真核細胞中均具有活性。在一個實施方式中,所述選擇性標記物選自新黴素磷酸轉 移酶(nec/)、潮黴素 B磷酸轉移酶(hyg〇、嘌呤黴素-N-乙醯基轉移酶(pure/)、殺稻瘟菌 素 S脫氨酶(bsrO、黃嘌呤/鳥嘌呤磷酸核糖轉移酶(gpt)和單純皰疹病毒胸腺嘧啶激酶 (HSV-k)及其組合。
[0030] 在一個實施方式中,所述LTVEC包含範圍為約5kb至約200kb的插入核酸。在一 個實施方式中,所述插入核酸為約5kb至約10kb。在一個實施方式中,所述插入核酸為約 IOkb至約20kb。在一個實施方式中,所述插入核酸為約20kb至約30kb。在一個實施方式 中,所述插入核酸為約30kb至約40kb。在一個實施方式中,所述插入核酸為約40kb至約 50kb。在一個實施方式中,所述插入核酸為約60kb至約70kb。在一個實施方式中,所述插 入核酸為約80kb至約90kb。在一個實施方式中,所述插入核酸為約90kb至約100kb。在 一個實施方式中,所述插入核酸為約IOOkb至約110kb。在一個實施方式中,所述插入核酸 為約120kb至約130kb。在一個實施方式中,所述插入核酸為約130kb至約140kb。一個 實施方式中,所述插入核酸為約HOkb至約150kb。在一個實施方式中,所述插入核酸為約 150kb至約160kb。在一個實施方式中,所述插入核酸為約160kb至約170kb。在一個實施 方式中,所述插入核酸為約17〇kb至約180kb。在一個實施方式中,所述插入核酸為約180kb 至約190kb。在一個實施方式中,所述插入核酸為約190kb至約200kb。
[0031] 在一個實施方式中,所述LTVEC包含插入核酸,所述插入核酸含有翼側為位點特 異性重組祀序列的核酸。在一個實施方式中,所述核酸含有基因組核酸。在一個實施方式 中,所述基因組核酸來源於小鼠、人或其組合。在一個實施方式中,所述位點特異性重組靶 序列選自下組:l〇xP、l〇x511、lox2272、lox66、lox71、loxM2、lox5171、FRT、FRT11、FRT71、 attp、att、FRT、rox 及其組合。
[0032] 在一個實施方式中,所述LTVEC包含插入核酸,所述插入核酸含有條件型等位基 因。在一個實施方式中,所述條件型等位基因是如在US 2011/0104799中所描述的多功能 等位基因,其全部內容通過引用併入本申請。在一個實施方式中,所述條件型等位基因包 含:(a)在相對於靶基因轉錄而言有意義方向的驅動序列,和在有意義或反義方向的藥物 選擇性表達盒;(b)在反義方向的感興趣的核苷酸序列(NSI)和條件倒置模塊(COIN,其利 用外顯子分割的內含子和可逆的基因捕獲樣分子;參見例如US 2011/0104799,其全部內 容通過引用併入)和(c)可重組單元,其在與第一重組酶接觸後重組形成(i)缺乏驅動序 列和DSC以及(ii)在有意義方向含有NSI和在反義方向含有COIN的條件型等位基因。
[0033] 在一個實施方式中,所述LTVEC包含插入核酸,所述插入核酸含有選擇性表達盒。 在一個實施方式中,所述選擇性表達盒包含編碼選擇性標記物的核酸序列,其中所述核酸 序列與啟動子可操作地連接。在一個實施方式中,所述啟動子在原核細胞中具有活性。在一 個實施方式中,所述核酸在原核和真核細胞中均具有活性。在一個實施方式中,所述選擇性 表達盒的翼側具有位點特異性重組靶序列。在一個實施方式中,所述選擇性標記物選自新 黴素磷酸轉移酶(nec/)、潮黴素 B磷酸轉移酶(hyg〇、嘌呤黴素-N-乙醯基轉移酶(pure/)、 殺稻瘟菌素 S脫氨酶(bsrO、黃嘌呤/鳥嘌呤磷酸核糖轉移酶(gpt)和單純皰疹病毒胸腺 嘧啶激酶(HSV-k)及其組合。
[0034] 在一個實施方式中,所述LTVEC包含插入核酸,所述插入核酸含有與啟動子可操 作地連接的報告基因,其中所述報告基因編碼選自下組的報告蛋白:LacZ、mPl Um、mChenT、 tdTomato、mStrawberry、J-RecU DsRecU mOrange、mKO、mCitrine、Venus、YPet、增強的黃 色螢光蛋白(EYFP)、Emerald、增強的綠色螢光蛋白(EGFP)、CyPet、青色螢光蛋白(CFP)、 Cerulean、T_Sapphire、突光素酶、鹼性磷酸酶及其組合。在一個實施方式中,所述報告基因 在誘導型啟動子的控制下表達。在一個實施方式中,所述報告基因在內源性啟動子的控制 下表達。在一個實施方式中,所述報告基因在外源性啟動子的控制下表達。在一個實施方 式中,所述報告基因在特定的細胞類型中表達。在一個實施方式中,所述報告基因以組織特 異性的方式表達。在一個實施方式中,所述報告基因以發育階段特異性的方式表達。
[0035] 在一個方面,本申請提供了一種在原核細胞中通過細菌同源重組(BHR)修飾哺乳 動物細胞基因組的靶基因座的方法,
[0036] 所述方法包括:
[0037] (a)引入包含哺乳動物基因組的靶基因座的原核細胞:
[0038] (i)靶向載體,所述靶向載體包含翼側為第一上遊同源臂和第一下遊同源臂的插 入核酸,和
[0039] (ii)核酸酶試劑,所述核酸酶試劑在所述基因組的靶基因座或其附近產生單鏈或 雙鏈斷裂,和
[0040] (i)選擇經靶向的原核細胞,所述原核細胞包含所述插入核酸,
[0041] 其中所述原核細胞能夠表達介導所述BHR的重組酶。
[0042] 在一個實施方式中,所述基因組的靶基因座選自FcERIa基因座、TLR4基因座、 PRLR基因座、Notch4基因座、Accn2基因座、Adamts5基因座、TRPAl基因座、FolHl基因座、 LRP5基因座和ERBB4基因座。
[0043] 在一個實施方式中,所述基因組的靶基因座存在於大靶向載體(LTVEC)中,所述 大靶向載體包含第二上遊同源臂和第二下遊同源臂。在一個實施方式中,所述第二上遊同 源臂和所述第二下遊同源臂的總和為至少l〇kb。在一個實施方式中,所述第二上遊同源臂 的範圍為約5kb至約lOOkb。在一個實施方式中,所述第二下遊同源臂的範圍為約5kb至 約lOOkb。在一個實施方式中,所述第二上遊和所述下遊同源臂的範圍為約5kb至約10kb。 在一個實施方式中,所述第二上遊和所述下遊同源臂的範圍為約IOkb至約20kb。在一個實 施方式中,所述第二上遊和所述下遊同源臂的範圍為約20kb至約30kb。在一個實施方式 中,所述第二上遊和所述下遊同源臂的範圍為約30kb至約40kb。在一個實施方式中,所述 第二上遊和所述下遊同源臂的範圍為約40kb至約50kb。在一個實施方式中,所述第二上遊 和所述下遊同源臂的範圍為約50kb至約60kb。在一個實施方式中,所述第二上遊和所述下 遊同源臂的範圍為約60kb至約70kb。在一個實施方式中,所述第二上遊和所述下遊同源臂 的範圍為約70kb至約80kb。在一個實施方式中,所述第二上遊和所述下遊同源臂的範圍為 約SOkb至約90kb。在一個實施方式中,所述第二上遊和所述下遊同源臂的範圍為約90kb 至約100kb。在一個實施方式中,所述第二上遊和所述下遊同源臂的範圍為約IOOkb至約 110kb。在一個實施方式中,所述第二上遊和所述下遊同源臂的範圍為約IlOkb至約120kb。 在一個實施方式中,所述第二上遊和所述下遊同源臂的範圍為約120kb至約130kb。在一個 實施方式中,所述第二上遊和所述下遊同源臂的範圍為約130kb至約140kb。在一個實施方 式中,所述第二上遊和所述下遊同源臂的範圍為約HOkb至約150kb。在一個實施方式中, 所述第二上遊和所述下遊同源臂的範圍為約150kb至約160kb。在一個實施方式中,所述第 二上遊和所述下遊同源臂的範圍為約160kb至約170kb。在一個實施方式中,所述第二上遊 和所述下遊同源臂的範圍為約170kb至約180kb。在一個實施方式中,所述第二上遊和所述 下遊同源臂的範圍為約180kb至約190kb。在一個實施方式中,所述第二上遊和所述下遊同 源臂的範圍為約190kb至約200kb。
[0044] 在一個實施方式中,所述哺乳動物是人並且所述靶向是離體的人細胞。在一個實 施方式中,所述哺乳動物是齧齒動物。在一個實施方式中,所述齧齒動物選自小鼠、大鼠和 倉鼠。
[0045] 在一個實施方式中,所述核酸酶試劑與所述祀向載體一起引入。在一個實施方式 中,在一段時間中所述核酸酶試劑與所述靶向載體分別引入。在一個實施方式中,所述核酸 酶試劑先於所述靶向載體引入。在一個實施方式中,所述核酸酶試劑在所述靶向載體引入 之後引入。
[0046] 在一個實施方式中,將所述靶向載體與所述核酸酶試劑聯用與單獨使用所述靶向 載體相比使靶向效率提高。在一個實施方式中,當將所述靶向載體與所述核酸酶試劑聯用 時,與當將所述靶向載體單獨使用時相比,所述靶向載體的靶向效率提高至少2倍。在一個 實施方式中,當將所述靶向載體與所述核酸酶試劑聯用時,與當將所述靶向載體單獨使用 時相比,所述祀向載體的祀向效率提高至少3倍。在一個實施方式中,當將所述祀向載體與 所述核酸酶試劑聯用時,與當將所述靶向載體單獨使用時相比,所述靶向載體的靶向效率 提高至少4倍。
[0047] 在一個實施方式中,所述原核細胞是具有重組能力的大腸桿菌菌株。在一個實施 方式中,所述原核細胞包含編碼所述重組酶的核酸。在一個實施方式中,所述原核細胞不包 含編碼所述重組酶的核酸,並且編碼所述重組酶的核酸被引入所述原核細胞中。在一個實 施方式中,所述核酸包含編碼所述重組酶的DNA或mRNA。在一個實施方式中,編碼所述重組 酶的所述核酸是PABG。在一個實施方式中,所述重組酶在誘導型啟動子的控制下表達。在 一個實施方式中,所述重組酶的表達由阿拉伯糖控制。
[0048] 在一個實施方式中,所述核酸酶試劑是表達構建體,所述構建體包含編碼核酸酶 的核酸序列,其中所述核酸序列與啟動子可操作地連接。在一個實施方式中,所述啟動子是 組成型激活的啟動子。在一個實施方式中,所述啟動子是誘導型啟動子。在一個實施方式 中,所述啟動子在所述原核細胞中具有活性。在一個實施方式中,所述核酸酶試劑是編碼核 酸內切酶的mRNA。
[0049] 在一個實施方式中,所述核酸酶試劑是鋅指核酸酶(ZFN)。在一個實施方式中,所 述ZFN的各個單體均含有3個或更多個基於鋅指的DNA結合結構域,其中各基於鋅指的DNA 結合結構域均結合至3bp子位點。在一個實施方式中,所述ZFN是嵌合蛋白,所述嵌合蛋白 包含與獨立的核酸酶可操作地連接的基於鋅指的DNA結合結構域。在一個實施方式中,所 述獨立的核酸內切酶是Fokl核酸內切酶。在一個實施方式中,所述核酸酶試劑包含第一 ZFN和第二ZFN,其中各個所述第一 ZFN和所述第二ZFN均與FokI核酸酶可操作地連接,其 中所述第一和所述第二ZFN識別各條靶DNA序列鏈中的被約6bp至約40bp的切割位點所 分隔的兩個相鄰的靶DNA序列,並且其中所述Fokl核酸酶二聚化且形成雙鏈斷裂。
[0050] 在一個實施方式中,所述核酸酶試劑是轉錄激活因子樣效應物核酸酶(TALEN)。在 一個實施方式中,所述TALEN的各個單體均包含12-25個TAL重複,其中各個TAL重複均與 Ibp子位點結合。在一個實施方式中,所述核酸酶試劑是嵌合蛋白,所述嵌合蛋白包含與獨 立的核酸酶可操作地連接的基於TAL重複的DNA結合結構域。在一個實施方式中,所述獨 立的核酸酶是FokI核酸內切酶。在一個實施方式中,所述核酸酶試劑包含第一基於TAL重 復的DNA結合結構域和第二基於TAL重複的DNA結合結構域,其中各個所述第一和所述第 二基於TAL重複的DNA結合結構域均與FokI核酸酶可操作地連接,其中所述第一和所述第 二基於TAL重複的DNA結合結構域識別各條靶DNA序列鏈中的被約6bp至約40bp的切割 位點所分隔的兩個相鄰的靶DNA序列,並且其中所述Fokl核酸酶二聚化且在靶序列形成雙 鏈斷裂。
[0051] 在一個實施方式中,所述核酸酶的各個單體均識別至少9個核苷酸的靶序列。在 一個實施方式中,所述祀序列的長度為約9至約12個核苷酸。在一個實施方式中,所述革巴 序列的長度為約12至約15個核苷酸。在一個實施方式中,所述靶序列的長度為約15至約 18個核苷酸。在一個實施方式中,所述祀序列的長度為約18至約21個核苷酸。
[0052] 在一個實施方式中,所述核酸酶試劑的祀序列位於內含子中。在一個實施方式中, 所述祀序列位於外顯子中。在一個實施方式中,所述祀序列位於啟動子中。在一個實施方 式中,所述靶序列在非蛋白編碼區中。在一個實施方式中,所述非蛋白編碼區是調控區。在 一個實施方式中,所述靶序列位於啟動子調控區。在一個實施方式中,所述靶序列位於增強 子區中。
[0053] 在一個實施方式中,所述核酸酶試劑是大範圍核酸酶。在一個實施方式中,所述大 範圍核酸酶識別12至40個鹼基對的雙鏈DNA序列。在一個實施方式中,所述大範圍核酸 酶識別在所述基因組中的一個極佳匹配的靶序列。在一個實施方式中,所述大範圍核酸酶 是歸巢核酸酶。在一個實施方式中,所述歸巢核酸酶是LAGLIDADG家族的歸巢核酸酶。在 一個實施方式中,所述LAGLIDADG家族的歸巢核酸酶選自I-Scel、I-Crel和I-Dmol。
[0054] 在一個實施方式中,所述靶向載體是大靶向載體(LTVEC)。
[0055] 在一個實施方式中,所述LTVEC的範圍為約50kb至約300kb。在一個實施方式中, 所述LTVEC的範圍為約50kb至約75kb。在一個實施方式中,所述LTVEC的範圍為約75kb 至約100kb。在一個實施方式中,所述LTVEC的範圍為約IOOkb至125kb。在一個實施方式 中,所述LTVEC的範圍為約125kb至約150kb。在一個實施方式中,所述LTVEC的範圍為約 150kb至約175kb。在一個實施方式中,所述LTVEC的範圍為約175kb至約200kb。在一個 實施方式中,所述LTVEC的範圍為約200kb至約225kb。在一個實施方式中,所述LTVEC的 範圍為約225kb至約250kb。在一個實施方式中,所述LTVEC的範圍為約250kb至約275kb。 在一個實施方式中,所述LTVEC的範圍為約275kb至約300kb。
[0056] 在一個實施方式中,所述靶向載體的同源臂來源於BAC文庫、粘粒文庫或Pl噬菌 體文庫。在一個實施方式中,所述同源臂來源於使用常規方法不能靶向的非人動物的基因 組基因座。在一個實施方式中,所述同源臂來源於合成的DNA。
[0057] 在一個實施方式中,上遊同源臂和下遊同源臂的總和為至少10kb。在一個實施方 式中,所述上遊同源臂的範圍為約5kb至約100kb。在一個實施方式中,所述下遊同源臂的 範圍為約5kb至約100kb。在一個實施方式中,所述上遊和所述下遊同源臂的範圍為約5kb 至約10kb。在一個實施方式中,所述上遊和所述下遊同源臂的範圍為約IOkb至約20kb。在 一個實施方式中,所述上遊和所述下遊同源臂的範圍為約20kb至約30kb。在一個實施方式 中,所述上遊和所述下遊同源臂的範圍為約30kb至約40kb。在一個實施方式中,所述上遊 和所述下遊同源臂的範圍為約40kb至約50kb。在一個實施方式中,所述上遊和所述下遊同 源臂的範圍為約50kb至約60kb。在一個實施方式中,所述上遊和所述下遊同源臂的範圍 為約60kb至約70kb。在一個實施方式中,所述上遊和所述下遊同源臂的範圍為約70kb至 約80kb。在一個實施方式中,所述上遊和所述下遊同源臂的範圍為約SOkb至約90kb。在 一個實施方式中,所述上遊和所述下遊同源臂的範圍為約90kb至約100kb。在一個實施方 式中,所述上遊和所述下遊同源臂的範圍為約IOOkb至約110kb。在一個實施方式中,所述 上遊和所述下遊同源臂的範圍為約IlOkb至約120kb。在一個實施方式中,所述上遊和所述 下遊同源臂的範圍為約120kb至約130kb。在一個實施方式中,所述上遊和所述下遊同源臂 的範圍為約130kb至約140kb。在一個實施方式中,所述上遊和所述下遊同源臂的範圍為約 140kb至約150kb。在一個實施方式中,所述上遊和所述下遊同源臂的範圍為約150kb至約 160kb。在一個實施方式中,所述上遊和所述下遊同源臂的範圍為約160kb至約170kb。在 一個實施方式中,所述上遊和所述下遊同源臂的範圍為約170kb至約180kb。在一個實施方 式中,所述上遊和所述下遊同源臂的範圍為約180kb至約190kb。在一個實施方式中,所述 上遊和所述下遊同源臂的範圍為約190kb至約200kb。
[0058] 在一個實施方式中,所述靶向載體包含選擇性表達盒。在一個實施方式中,所述 選擇性表達盒包含編碼選擇性標記物的核酸序列,其中所述核酸序列與啟動子可操作地連 接。在一個實施方式中,所述啟動子在原核細胞中具有活性。在一個實施方式中,所述核酸 在原核和真核細胞中均具有活性。在一個實施方式中,所述選擇性標記物選自新黴素磷酸 轉移酶(nec/)、潮黴素 B磷酸轉移酶(hyg〇、嘌呤黴素-N-乙醯基轉移酶(pure/)、殺稻瘟菌 素 S脫氨酶(bsrO、黃嘌呤/鳥嘌呤磷酸核糖轉移酶(gpt)和單純皰疹病毒胸腺嘧啶激酶 (HSV-k)及其組合。
[0059] 在一個實施方式中,所述插入核酸為約5kb至約200kb。在一個實施方式中,所述 插入核酸為約5kb至約10kb。在一個實施方式中,所述插入核酸為約IOkb至約20kb。在 一個實施方式中,所述插入核酸為約20kb至約30kb。在一個實施方式中,所述插入核酸為 約30kb至約40kb。在一個實施方式中,所述插入核酸為約40kb至約50kb。在一個實施方 式中,所述插入核酸為約60kb至約70kb。在一個實施方式中,所述插入核酸為約80kb至 約90kb。在一個實施方式中,所述插入核酸為約90kb至約100kb。在一個實施方式中,所 述插入核酸為約IOOkb至約llOkb。在一個實施方式中,所述插入核酸為約120kb至約
[0060] 130kb。在一個實施方式中,所述插入核酸為約130kb至約140kb。一個實施方式 中,所述插入核酸為約140kb至約150kb。在一個實施方式中,所述插入核酸為約150kb至 約160kb。在一個實施方式中,所述插入核酸為約160kb至約170kb。在一個實施方式中, 所述插入核酸為約170kb至約180kb。在一個實施方式中,所述插入核酸為約180kb至約 190kb。在一個實施方式中,所述插入核酸為約190kb至約200kb。
[0061] 在一個實施方式中,所述插入核酸含有翼側為位點特異性重組靶序列的核酸。在 一個實施方式中,所述核酸含有基因組核酸。在一個實施方式中,所述基因組核酸來源於小 鼠、人或其組合。在一個實施方式中,所述位點特異性重組靶序列選自下組:1〇χΡ、10X511、 1οχ2272、1οχ66、1οχ71、loxM2、lox5171、FRT、FRTll、FRT71、attp、att、FRT、rox 及其組合。
[0062] 在一個實施方式中,所述插入核酸包含條件等位基因。在一個實施方式中,所述條 件等位基因是如在US 2011/0104799中所描述的多功能等位基因,其全部內容通過引用並 入本申請。在一個實施方式中,所述條件等位基因包含:(a)在相對於靶基因轉錄的有意義 方向的驅動序列,和在有意義或反義方向的藥物選擇性表達盒;(b)在反義方向的感興趣 的核苷酸序列(NSI)和條件倒置模塊(COIN,其利用外顯子分割的內含子和可逆的基因捕 獲樣分子;參見例如US 2011/0104799,其全部內容通過引用併入)和(c)可重組的單元, 其在與第一重組酶接觸後重組形成條件等位基因,所述條件等位基因(i)缺乏驅動序列和 DSC並且(ii)在有意義方向含有NSI和在反義方向含有COIN。
[0063] 在一個實施方式中,所述插入核酸包含選擇性表達盒。在一個實施方式中,所述 選擇性表達盒包含編碼選擇性標記物的核酸序列,其中所述核酸序列與啟動子可操作地連 接。在一個實施方式中,所述啟動子在原核細胞中具有活性。在一個實施方式中,所述核酸 在原核和真核細胞中均具有活性。在一個實施方式中,所述選擇性表達盒的翼側具有位點 特異性重組靶序列。在一個實施方式中,所述選擇性標記物選自新黴素磷酸轉移酶(nee/)、 潮黴素 B磷酸轉移酶(hyg〇、嘌呤黴素-N-乙醯基轉移酶(pure/)、殺稻瘟菌素 S脫氨酶 (bsrO、黃嘌呤/鳥嘌呤磷酸核糖轉移酶(gpt)和單純皰疹病毒胸腺嘧啶激酶(HSV-k)及 其組合。
[0064] 在一個實施方式中,所述插入核酸含有與啟動子可操作地連接的報告基因,其中 所述報告基因編碼選自下組的報告蛋白:LacZ、mPlum、mCherry、tdTomato、mStrawberry、 ]~1^(1、〇81^(1、111〇四1^6、1111(〇、11£;[1:1';[116、/011118、¥?61:、增強的黃色突光蛋白出¥卩?)41116四1(1、 增強的綠色螢光蛋白(EGFP)、CyPet、青色螢光蛋白(CFP)、Cerulean、T-Sapphire、螢光素 酶、鹼性磷酸酶及其組合。在一個實施方式中,所述報告基因在誘導型啟動子的控制下表 達。在一個實施方式中,所述報告基因在內源性啟動子的控制下表達。在一個實施方式中, 所述報告基因在外源性啟動子的控制下表達。在一個實施方式中,所述報告基因在特定的 細胞類型中表達。在一個實施方式中,所述報告基因以組織特異性的方式表達。在一個實 施方式中,所述報告基因以發育階段特異性的方式表達。
[0065] 在一個實施方式中,所述插入核酸整合進入所述基因組的靶基因座引入如本申請 所述的一個或多個基因修飾。在一個實施方式中,所述基因修飾是內源性核酸序列的缺失。 在一個實施方式中,所述基因修飾是將外源性核酸序列加入所述基因組的靶基因座中。在 一個實施方式中,所述基因修飾是在所述基因組的靶基因座使用外源性核酸序列取代內源 性核酸序列。在一個實施方式中,所述外源性核酸序列是非小鼠核酸序列。在一個實施方 式中,所述外源性核酸序列是人源核酸序列。在一個實施方式中,所述基因修飾是敲除、缺 失、插入、取代("敲入")、點突變、結構域交換、外顯子交換、內含子交換、調控序列交換、基 因交換或其組合。
[0066] 在一個實施方式中,所述插入核酸與小鼠核酸序列是同源的。在一個實施方式中, 所述插入核酸序列是人源核酸。在一個實施方式中,所述插入核酸是基因組核酸的片段。在 一個實施方式中,所述基因組核酸是小鼠基因組核酸、人源基因組核酸或其組合。在一個實 施方式中,如上文所述的插入核酸的範圍為約5kb至約200kb。
[0067] 在一個實施方式中,所述插入核酸與小鼠核酸序列是直系同源的。在一個實施方 式中,所述插入核酸是人源核酸。在一個實施方式中,所述插入核酸是基因組核酸的片段。 在一個實施方式中,所述基因組核酸是小鼠基因組核酸、人源基因組核酸或其組合。在一個 實施方式中,如上文所述的插入核酸的範圍為約5kb至約200kb。
[0068] 在一個實施方式中,所述插入核酸包含基因組基因座,所述基因座編碼在神經系 統、骨骼系統、消化系統、循環系統、肌肉系統、呼吸系統、心血管系統、淋巴系統、內分泌系 統、泌尿系統、生殖系統或其組合中表達的蛋白。在一個實施方式中,所述插入核酸包含基 因組基因座,所述基因座編碼在骨髓或骨髓來源細胞中表達的蛋白。在一個實施方式中,所 述插入核酸包含基因組基因座,所述基因座編碼在脾細胞中表達的蛋白。在一個實施方式 中,所述基因組基因座包含小鼠基因組核酸序列、人源基因組核酸序列或其組合。在一個實 施方式中,所述核酸包含基因組基因座,所述基因座編碼在B細胞中表達的蛋白。在一個實 施方式中,所述核酸包含基因組基因座,所述基因座編碼在未成熟的B細胞中表達的蛋白。 在一個實施方式中,所述核酸包含基因組基因座,所述基因座編碼在成熟的B細胞中表達 的蛋白。
[0069] 在一個實施方式中,所述插入核酸包含基因組核酸序列,所述核酸序列編碼人源 免疫球蛋白重鏈可變區胺基酸序列。
[0070] 在一個實施方式中,所述基因組核酸序列包含與免疫球蛋白重鏈恆定區核酸序列 可操作地連接的未經重排的人源免疫球蛋白重鏈可變區核酸序列。在一個實施方式中,所 述免疫球蛋白重鏈恆定區核酸序列是小鼠免疫球蛋白重鏈恆定區核酸序列或人源免疫球 蛋白重鏈恆定區核酸序列或者其組合。在一個實施方式中,所述免疫球蛋白重鏈恆定區核 酸序列選自C0U鉸鏈、CH2、CH3及其組合。在一個實施方式中,所述重鏈恆定區核酸序列包 含C hI-鉸鏈-CH2-CH3。在一個實施方式中,所述基因組核酸序列包含與免疫球蛋白重鏈恆 定區核酸序列可操作地連接的重排的人源免疫球蛋白重鏈可變區核酸序列。在一個實施方 式中,所述免疫球蛋白重鏈恆定區核酸序列是小鼠免疫球蛋白重鏈恆定區核酸序列或人源 免疫球蛋白重鏈恆定區核酸序列或者其組合。在一個實施方式中,所述免疫球蛋白重鏈恆 定區核酸序列選自C H1、鉸鏈、CH2、CH3及其組合。在一個實施方式中,所述重鏈恆定區核酸 序列包含C hI-絞鏈_Ch2_Ch3。
[0071] 在一個實施方式中,所述插入核酸包含基因組核酸序列,所述核酸序列編碼人源 免疫球蛋白輕鏈可變區胺基酸序列。在一個實施方式中,所述基因組核酸序列包含未經重 排的人源λ和/或 κ輕鏈可變區核酸序列。在一個實施方式中,所述基因組核酸序列包 含重排的人源λ和/或κ輕鏈可變區核酸序列。在一個實施方式中,所述未經重排的或 重排的λ和/或 κ輕鏈可變區核酸序列可操作地連接至小鼠、大鼠或人源免疫球蛋白輕 鏈恆定區核酸序列,所述輕鏈恆定區核酸序列選自λ輕鏈恆定區核酸序列和κ輕鏈恆定 區核酸序列。
[0072] 在一個實施方式中,所述插入核酸包含人源核酸序列。在一個實施方式中,所述人 源核酸序列編碼胞外蛋白。在一個實施方式中,所述人源核酸序列編碼受體的配體。在一個 實施方式中,所述配體是細胞因子。在一個實施方式中,所述細胞因子是選自下述的趨化因 子:CCL、CXCL、CX3CL和XCL。在一個實施方式中,所述細胞因子是腫瘤壞死因子(TNF)。在 一個實施方式中,所述細胞因子是白介素(IL)。在一個實施方式中,所述白介素選自IL-1、 IL-2、IL-3、IL-4、IL-5、IL-6、IL-7、IL-8、IL-9、IL-10、IL-11、IL-12、IL-13、IL-14、IL-15、 IL-16、 IL-17、 IL-18、 IL-19、 IL-20、 IL-21、 IL-22、 IL-23、 IL-24、 IL-25、 IL-26、 IL-27、 IL-28、IL-29、IL-30、IL-31、IL-32、IL-33、IL-34、IL-35 和 IL-36。在一個實施方式中,所 述白介素是IL-2。在一個實施方式中,所述人源基因組核酸序列編碼細胞質蛋白。在一個 實施方式中,所述人源基因組核酸序列編碼膜蛋白。在一個實施方式中,所述膜蛋白是受 體。在一個實施方式中,所述受體是細胞因子受體。在一個實施方式中,所述細胞因子受體 是白介素受體。在一個實施方式中,所述白介素受體是白介素2受體α。在一個實施方式 中,所述白介素受體是白介素2受體β。在一個實施方式中,所述白介素受體是白介素2受 體Y。在一個實施方式中,所述人源基因組核酸序列編碼核蛋白。在一個實施方式中,所述 核蛋白是核受體。
[0073] 在一個實施方式中,所述插入核酸包含在編碼序列中的基因修飾。在一個實施方 式中,所述基因修飾包含編碼序列的缺失突變。在一個實施方式中,所述基因修飾包含兩個 內源性編碼序列的融合。
[0074] 在一個實施方式中,所述插入核酸包含編碼突變的人源蛋白的人源核酸序列。在 一個實施方式中,所述突變的人源蛋白的特徵在於具有改變的結合特性、改變的位置、改變 的表達和/或改變的表達模式。在一個實施方式中,所述人源核酸序列包含至少一個人類 疾病等位基因。在一個實施方式中,所述人類疾病等位基因是神經系統疾病等位基因。在 一個實施方式中,所述人類疾病等位基因是心血管疾病等位基因。在一個實施方式中,所述 人類疾病等位基因是腎臟疾病等位基因。在一個實施方式中,所述人類疾病等位基因是肌 肉疾病等位基因。在一個實施方式中,所述人類疾病等位基因是血液疾病等位基因。在一 個實施方式中,所述人類疾病等位基因是致癌基因等位基因。在一個實施方式中,所述人類 疾病等位基因是免疫系統疾病等位基因。在一個實施方式中,所述人類疾病等位基因是顯 性等位基因。在一個實施方式中,所述人類疾病等位基因是隱性等位基因。在一個實施方 式中,所述人類疾病等位基因包含單核苷酸多態性(SNP)等位基因。
[0075] 在一個實施方式中,所述插入核酸包含調控序列。在一個實施方式中,所述調控序 列是啟動子序列。在一個實施方式中,所述調控序列是增強子序列。在一個實施方式中,所 述調控序列是轉錄阻遏結合序列。在一個實施方式中,所述插入核酸包含人源核酸序列,其 中所述人源核酸序列包含非蛋白編碼序列的缺失,但是不包含蛋白編碼序列的缺失。在一 個實施方式中,所述非蛋白編碼序列的缺失包含調控序列的缺失。在一個實施方式中,所述 調控元件的缺失包括啟動子序列的缺失。在一個實施方式中,所述調控元件的缺失包括增 強子序列的缺失。
[0076] 在一個方面,本申請提供了在哺乳動物細胞中修飾基因組的靶基因座的方法,所 述方法包括引入哺乳動物細胞:(i)核酸酶試劑,所述核酸酶試劑在所述基因組的靶基因 座或其附近形成單鏈或雙鏈斷裂,和(ii)大靶向載體(LTVEC),所述大靶向載體包含翼側 為上遊同源臂和下遊同源臂的插入核酸。
[0077] 在一個實施方式中,所述哺乳動物細胞是多能細胞。在一個實施方式中,所述多能 細胞是胚胎幹(ES)細胞。在一個實施方式中,所述多能細胞是非人ES細胞。在一個實施 方式中,所述多能細胞是誘導多能幹(iPS)細胞。在一個實施方式中,所述誘導多能(iPS) 細胞來源於成纖維細胞。在一個實施方式中,所述誘導多能(iPS)細胞來源於人成纖維細 胞。在一個實施方式中,所述多能細胞是造血幹細胞(HSC)。在一個實施方式中,所述多能 細胞是神經幹細胞(NSC)。在一個實施方式中,所述多能細胞是外胚層幹細胞。在一個實施 方式中,所述多能細胞是發育受限的祖細胞。
[0078] 在一個實施方式中,所述多能細胞是齧齒動物多能細胞。在一個實施方式中,所述 齧齒動物多能細胞是大鼠多能細胞。在一個實施方式中,所述大鼠多能細胞是大鼠 ES細 胞。在一個實施方式中,所述齧齒動物多能細胞是小鼠多能細胞。在一個實施方式中,所述 多能細胞是小鼠胚胎幹(ES)細胞。
[0079] 在一個實施方式中,所述哺乳動物細胞是永生化的小鼠或大鼠細胞。在一個實施 方式中,所述哺乳動物細胞是永生化的人源細胞。在一個實施方式中,所述哺乳動物細胞是 人成纖維細胞。在一個實施方式中,所述哺乳動物細胞是癌細胞。在一個實施方式中,所述 哺乳動物細胞是人癌細胞。
[0080] 在一個實施方式中,所述哺乳動物細胞是從患有疾病的患者中分離的人源細胞。 在一個實施方式中,所述人源細胞包含編碼突變蛋白的人源核酸序列。在一個實施方式中, 所述突變的人源蛋白的特徵在於具有改變的結合特性、改變的位置、改變的表達和/或改 變的表達模式。在一個實施方式中,所述人源核酸序列包含至少一個人類疾病等位基因。在 一個實施方式中,所述人源核酸序列包含至少一個人類疾病等位基因。在一個實施方式中, 所述人類疾病等位基因是神經系統疾病等位基因。在一個實施方式中,所述人類疾病等位 基因是心血管疾病等位基因。在一個實施方式中,所述人類疾病等位基因是腎臟疾病等位 基因。在一個實施方式中,所述人類疾病等位基因是肌肉疾病等位基因。在一個實施方式 中,所述人類疾病等位基因是血液疾病等位基因。在一個實施方式中,所述人類疾病等位基 因是致癌基因等位基因。在一個實施方式中,所述人類疾病等位基因是免疫系統疾病等位 基因。在一個實施方式中,所述人類疾病等位基因是顯性等位基因。在一個實施方式中,所 述人類疾病等位基因是隱性等位基因。在一個實施方式中,所述人類疾病等位基因包含單 核苷酸多態性(SNP)等位基因。
[0081] 在一個實施方式中,所述基因組的靶基因座選自FcERla基因座、TLR4基因座、 PRLR基因座、Notch4基因座、Accn2基因座、Adamts5基因座、TRPAl基因座、FolHl基因座、 LRP5基因座和ERBB4基因座。
[0082] 在一個實施方式中,所述基因組的靶基因座包含人源基因組序列。在一個實施方 式中,所述基因組的靶基因座包含非人動物的基因組核酸序列。在一個實施方式中,所述非 人動物是齧齒動物。在一個實施方式中,所述齧齒動物選自小鼠、大鼠和倉鼠。
[0083] 在一個實施方式中,位於所述基因組的靶基因座的上文所述的至少一個人類疾病 等位基因被所述插入核酸取代。在一個實施方式中,所述人類疾病等位基因的取代是由敲 除、缺失、插入、取代("敲入")、結構域交換、外顯子交換、內含子交換、調控序列交換、基因 交換或其組合所介導。
[0084] 在一個實施方式中,所述核酸酶試劑與所述大祀向載體(LTVEC) -起引入。在一 個實施方式中,在一段時間中所述核酸酶試劑與所述LTVEC分別引入。在一個實施方式中, 所述核酸酶試劑先於所述LTVEC引入。在一個實施方式中,所述核酸酶試劑在所述LTVEC 引入之後引入。
[0085] 在一個實施方式中,與單獨使用所述LTVEC相比,將所述LTVEC與所述核酸酶試 劑聯用具有提高的靶向效率。在一個實施方式中,與單獨使用所述LTVEC相比,當將所述 LTVEC與所述核酸酶試劑聯用時,所述LTVEC的靶向效率提高至少兩倍。在一個實施方式 中,與單獨使用所述LTVEC相比,當將所述LTVEC與所述核酸酶試劑聯用時,所述LTVEC的 靶向效率提高至少三倍。在一個實施方式中,與單獨使用所述LTVEC相比,當將所述LTVEC 與所述核酸酶試劑聯用時,所述LTVEC的靶向效率提高至少四倍。
[0086] 在一個實施方式中,所述核酸酶試劑是表達構建體,所述表達構建體包含編碼核 酸酶的核酸序列,其中所述核酸序列與啟動子可操作地連接。在一個實施方式中,所述啟動 子是組成型激活的啟動子。在一個實施方式中,所述啟動子是誘導型啟動子。在一個實施 方式中,所述啟動子在哺乳動物細胞中具有活性。在一個實施方式中,所述核酸酶試劑是編 碼核酸內切酶的mRNA。
[0087] 在一個實施方式中,所述核酸酶試劑是鋅指核酸酶(ZFN)。在一個實施方式中,所 述ZFN的各個單體均含有3個或更多個基於鋅指的DNA結合結構域,其中各基於鋅指的DNA 結合結構域均結合至3bp子位點。在一個實施方式中,所述ZFN是嵌合蛋白,所述嵌合蛋白 包含與獨立的核酸酶可操作地連接的基於鋅指的DNA結合結構域。在一個實施方式中,所 述獨立的核酸內切酶是Fokl核酸內切酶。在一個實施方式中,所述核酸酶試劑包含第一 ZFN和第二ZFN,其中各個所述第一 ZFN和所述第二ZFN均與FokI核酸酶可操作地連接,其 中所述第一和所述第二ZFN識別各條靶DNA鏈中的被約6bp至約40bp的切割位點所分隔 的兩個相鄰的靶DNA序列,並且其中所述FokI核酸酶二聚化並且形成雙鏈斷裂。
[0088] 在一個實施方式中,所述核酸酶試劑是轉錄激活因子樣效應物核酸酶(TALEN)。在 一個實施方式中,所述TALEN的各個單體均包含12-25個TAL重複,其中各個TAL重複均與 Ibp子位點結合。在一個實施方式中,所述核酸酶試劑是嵌合蛋白,所述嵌合蛋白包含與獨 立的核酸酶可操作地連接的基於TAL重複的DNA結合結構域。在一個實施方式中,所述獨 立的核酸酶是FokI核酸內切酶。在一個實施方式中,所述核酸酶試劑包含第一基於TAL重 復的DNA結合結構域和第二基於TAL重複的DNA結合結構域,其中各個所述第一和所述第 二基於TAL重複的DNA結合結構域與FokI核酸酶可操作地連接,其中所述第一和所述第二 基於TAL重複的DNA結合結構域識別各條靶DNA序列中的被約6bp至約40bp的切割位點 所分隔的兩個相鄰的靶DNA序列,並且其中所述FokI核酸酶二聚化並且形成雙鏈斷裂。
[0089] 在一個實施方式中,所述核酸酶的各個單體識別至少9個核苷酸的靶序列。在一 個實施方式中,所述靶序列的長度為約9至約12個核苷酸。在一個實施方式中,所述靶序 列的長度為約12至約15個核苷酸。在一個實施方式中,所述靶序列的長度為約15至約18 個核苷酸。在一個實施方式中,所述祀序列的長度為約18至約21個核苷酸。
[0090] 在一個實施方式中,所述核酸酶試劑的祀核酸序列位於內含子中。在一個實施方 式中,所述靶核酸序列位於外顯子中。在一個實施方式中,所述靶核酸序列位於啟動子中。 在一個實施方式中,所述靶核酸序列在非蛋白編碼區中。在一個實施方式中,所述非蛋白編 碼區是調控區。在一個實施方式中,所述靶核酸序列位於啟動子調控區。在一個實施方式 中,所述靶核酸序列位於增強子區中。
[0091] 在一個實施方式中,所述核酸酶試劑是大範圍核酸酶。在一個實施方式中,所述大 範圍核酸酶識別12至40個鹼基對的雙鏈DNA序列。在一個實施方式中,所述大範圍核酸 酶識別在所述基因組中的一個極佳匹配的靶序列。在一個實施方式中,所述大範圍核酸酶 是歸巢核酸酶。在一個實施方式中,所述歸巢核酸酶是LAGLIDADG家族的歸巢核酸酶。在 一個實施方式中,所述LAGLIDADG家族的歸巢核酸酶選自I-Scel、I-Crel和I-Dmol。
[0092] 在一個實施方式中,所述LTVEC的範圍為約50kb至約300kb。在一個實施方式中, 所述LTVEC的範圍為約50kb至約75kb。在一個實施方式中,所述LTVEC的範圍為約75kb至 約lOOkb。在一個實施方式中,所述LTVEC的範圍為約IOOkb至約125kb。在一個實施方式 中,所述LTVEC的範圍為約125kb至約150kb。在一個實施方式中,所述LTVEC的範圍為約 150kb至約175kb。在一個實施方式中,所述LTVEC的範圍為約175kb至約200kb。在一個 實施方式中,所述LTVEC的範圍為約200kb至約225kb。在一個實施方式中,所述LTVEC的 範圍為約225kb至約250kb。在一個實施方式中,所述LTVEC的範圍為約250kb至約275kb。 在一個實施方式中,所述LTVEC的範圍為約275kb至約300kb。
[0093] 在一個實施方式中,所述LTVEC的同源臂來源於BAC文庫、粘粒文庫或Pl噬菌體 文庫。在一個實施方式中,所述同源臂來源於使用常規方法不能靶向的非人動物基因組基 因座。在一個實施方式中,所述同源臂來源於合成的DNA。
[0094] 在一個實施方式中,上遊同源臂和下遊同源臂的總和是至少10kb。在一個實施方 式中,所述上遊同源臂的範圍為約5kb至約lOOkb。在一個實施方式中,所述下遊同源臂的 範圍為約5kb至約lOOkb。在一個實施方式中,所述上遊和所述下遊同源臂的範圍為約5kb 至約10kb。在一個實施方式中,所述上遊和所述下遊同源臂的範圍為約IOkb至約20kb。在 一個實施方式中,所述上遊和所述下遊同源臂的範圍為約20kb至約30kb。在一個實施方式 中,所述上遊和所述下遊同源臂的範圍為約30kb至約40kb。在一個實施方式中,所述上遊 和所述下遊同源臂的範圍為約40kb至約50kb。在一個實施方式中,所述上遊和所述下遊同 源臂的範圍為約50kb至約60kb。在一個實施方式中,所述上遊和所述下遊同源臂的範圍 為約60kb至約70kb。在一個實施方式中,所述上遊和所述下遊同源臂的範圍為約70kb至 約80kb。在一個實施方式中,所述上遊和所述下遊同源臂的範圍為約SOkb至約90kb。在 一個實施方式中,所述上遊和所述下遊同源臂的範圍為約90kb至約100kb。在一個實施方 式中,所述上遊和所述下遊同源臂的範圍為約IOOkb至約llOkb。在一個實施方式中,所述 上遊和所述下遊同源臂的範圍為約IlOkb至約120kb。在一個實施方式中,所述上遊和所述 下遊同源臂的範圍為約120kb至約130kb。在一個實施方式中,所述上遊和所述下遊同源臂 的範圍為約130kb至約140kb。在一個實施方式中,所述上遊和所述下遊同源臂的範圍為約 140kb至約150kb。在一個實施方式中,所述上遊和所述下遊同源臂的範圍為約150kb至約 160kb。在一個實施方式中,所述上遊和所述下遊同源臂的範圍為約160kb至約170kb。在 一個實施方式中,所述上遊和所述下遊同源臂的範圍為約170kb至約180kb。在一個實施方 式中,所述上遊和所述下遊同源臂的範圍為約180kb至約190kb。在一個實施方式中,所述 上遊和所述下遊同源臂的範圍為約190kb至約200kb。
[0095] 在一個實施方式中,所述靶向載體包含選擇性表達盒。在一個實施方式中,所述 選擇性表達盒包含編碼選擇性標記物的核酸序列,其中所述核酸序列與啟動子可操作地連 接。在一個實施方式中,所述啟動子在原核細胞中具有活性。在一個實施方式中,所述啟動 子在原核和真核細胞中均具有活性。在一個實施方式中,所述選擇性標記物選自新黴素磷 酸轉移酶(nec/)、潮黴素 B磷酸轉移酶(hyg〇、嘌呤黴素-N-乙醯基轉移酶(pure/)、殺稻瘟 菌素 S脫氨酶(bsrO、黃嘌呤/鳥嘌呤磷酸核糖轉移酶(gpt)和單純皰疹病毒胸腺嘧啶激 酶(HSV-k)及其組合。
[0096] 在一個實施方式中,所述插入核酸為約5kb至約200kb。在一個實施方式中,所述 插入核酸為約5kb至約10kb。在一個實施方式中,所述插入核酸為約IOkb至約20kb。在 一個實施方式中,所述插入核酸為約20kb至約30kb。在一個實施方式中,所述插入核酸為 約30kb至約40kb。在一個實施方式中,所述插入核酸為約40kb至約50kb。在一個實施方 式中,所述插入核酸為約60kb至約70kb。在一個實施方式中,所述插入核酸為約80kb至約 90kb。在一個實施方式中,所述插入核酸為約90kb至約100kb。在一個實施方式中,所述插 入核酸為約IOOkb至約110kb。在一個實施方式中,所述插入核酸為約120kb至約130kb。 在一個實施方式中,所述插入核酸為約130kb至約140kb。一個實施方式中,所述插入核酸 為約140kb至約150kb。在一個實施方式中,所述插入核酸為約150kb至約160kb。在一個 實施方式中,所述插入核酸為約160kb至約170kb。在一個實施方式中,所述插入核酸為約 170kb至約180kb。在一個實施方式中,所述插入核酸為約180kb至約190kb。在一個實施 方式中,所述插入核酸為約190kb至約200kb。
[0097] 在一個實施方式中,所述插入核酸含有翼側為位點特異性重組靶序列的核酸。在 一個實施方式中,所述核酸含有基因組核酸。在一個實施方式中,所述基因組核酸來源於小 鼠、人或其組合。在一個實施方式中,所述位點特異性重組靶序列選自下組:1〇χΡ、1〇χ511、 1οχ2272、1οχ66、1οχ71、1οχΜ2、1〇叉5171、卩町、卩1?1'11、卩町71、&--、&?、卩1?1'、1'(?及其組合。
[0098] 在一個實施方式中,所述插入核酸含有條件等位基因。在一個實施方式中,所述條 件等位基因是如在US 2011/0104799中所描述的多功能等位基因,其全部內容通過引用並 入本申請。在一個實施方式中,所述條件等位基因包含:(a)在相對於靶基因轉錄的有意義 方向的驅動序列,和在有意義或反義方向的藥物選擇性表達盒;(b)在反義方向的感興趣 的核苷酸序列(NSI)和條件倒置模塊(COIN,其利用外顯子分割的內含子和可逆的基因捕 獲樣分子;參見例如US 2011/0104799,其全部內容通過引用併入)和(c)可重組的單元, 其在與第一重組酶接觸後重組形成條件等位基因,所述條件等位基因(i)缺乏驅動序列和 DSC並且(ii)在有意義方向含有NSI和在反義方向含有COIN。
[0099] 在一個實施方式中,所述插入核酸包含選擇性表達盒。在一個實施方式中,所述 選擇性表達盒包含編碼選擇性標記物的核酸序列,其中所述核酸序列與啟動子可操作地連 接。在一個實施方式中,所述啟動子在哺乳動物細胞中具有活性。在一個實施方式中,所述 核酸在原核細胞中具有活性。在一個實施方式中,所述選擇性表達盒的翼側具有位點特異 性重組靶序列。在一個實施方式中,所述選擇性標記物選自新黴素磷酸轉移酶(nec/)、潮黴 素 B磷酸轉移酶(hyg〇、嘌呤黴素-N-乙醯基轉移酶(pure/)、殺稻瘟菌素 S脫氨酶(bsrO、 黃嘌呤/鳥嘌呤磷酸核糖轉移酶(gpt)和單純皰疹病毒胸腺嘧啶激酶(HSV-k)及其組合。 [0100] 在一個實施方式中,所述插入核酸含有與啟動子可操作地連接的報告基因,其中 所述報告基因編碼選自下組的報告蛋白:LaeZ、mPlum、mCherry、tdTomato、mStrawberry、 ]~1^(1、〇81^(1、111〇四1^6、1111(〇、11£;[1:1';[116、/011118、¥?61:、增強的黃色突光蛋白出¥卩?)41116四1(1、 增強的綠色螢光蛋白(EGFP)、CyPet、青色螢光蛋白(CFP)、Cerulean、T-Sapphire、螢光素 酶、鹼性磷酸酶及其組合。在一個實施方式中,所述報告基因在誘導型啟動子的控制下表 達。在一個實施方式中,所述報告基因在內源性啟動子的控制下表達。在一個實施方式中, 所述報告基因在外源性啟動子的控制下表達。在一個實施方式中,所述報告基因在特定的 細胞類型中表達。在一個實施方式中,所述報告基因以組織特異性的方式表達。在一個實 施方式中,所述報告基因以發育階段特異性的方式表達。
[0101] 在一個實施方式中,所述插入核酸整合進入所述基因組的靶基因座引入如本申請 所述的一個或多個基因修飾。在一個實施方式中,所述基因修飾是內源性核酸序列的缺失。 在一個實施方式中,所述基因修飾是將外源性核酸序列加入所述基因組的靶基因座中。在 一個實施方式中,所述基因修飾是在所述基因組的靶基因座使用外源性核酸序列取代內源 性核酸序列。在一個實施方式中,所述外源性核酸序列是非小鼠核酸序列。在一個實施方 式中,所述外源性核酸序列是人源核酸序列。在一個實施方式中,所述基因修飾是敲除、缺 失、插入、取代("敲入")、點突變、結構域交換、外顯子交換、內含子交換、調控序列交換、基 因交換或其組合。
[0102] 在一個實施方式中,所述插入核酸與小鼠核酸序列是同源的。在一個實施方式中, 所述插入核酸序列是人源核酸。在一個實施方式中,所述插入核酸是基因組核酸的片段。在 一個實施方式中,所述基因組核酸是小鼠基因組核酸、人源基因組核酸或其組合。在一個實 施方式中,如上文所述的插入核酸的範圍為約5kb至約200kb。
[0103] 在一個實施方式中,所述插入核酸與小鼠核酸序列是直系同源的。在一個實施方 式中,所述插入核酸是人源核酸。在一個實施方式中,所述插入核酸是基因組核酸的片段。 在一個實施方式中,所述基因組核酸是小鼠基因組核酸、人源基因組核酸或其組合。在一個 實施方式中,如上文所述的插入核酸的範圍為約5kb至約200kb。
[0104] 在一個實施方式中,所述插入核酸包含基因組基因座,所述基因座編碼在神經系 統、骨骼系統、消化系統、循環系統、肌肉系統、呼吸系統、心血管系統、淋巴系統、內分泌系 統、泌尿系統、生殖系統或其組合中表達的蛋白。在一個實施方式中,所述插入核酸包含基 因組基因座,所述基因座編碼在骨髓或骨髓來源細胞中表達的蛋白。在一個實施方式中,所 述插入核酸包含基因組基因座,所述基因座編碼在脾細胞中表達的蛋白。在一個實施方式 中,所述基因組基因座包含小鼠基因組核酸序列、人源基因組核酸序列或其組合。在一個實 施方式中,所述核酸包含基因組基因座,所述基因座編碼在B細胞中表達的蛋白。在一個實 施方式中,所述核酸包含基因組基因座,所述基因座編碼在未成熟的B細胞中表達的蛋白。 在一個實施方式中,所述核酸包含基因組基因座,所述基因座編碼在成熟的B細胞中表達 的蛋白。
[0105] 在一個實施方式中,所述插入核酸包含基因組核酸序列,所述核酸序列編碼人源 免疫球蛋白重鏈可變區胺基酸序列。
[0106] 在一個實施方式中,所述基因組核酸序列包含與免疫球蛋白重鏈恆定區核酸序列 可操作地連接的未經重排的人源免疫球蛋白重鏈可變區核酸序列。在一個實施方式中,所 述免疫球蛋白重鏈恆定區核酸序列是小鼠免疫球蛋白重鏈恆定區核酸序列或人源免疫球 蛋白重鏈恆定區核酸序列或者其組合。在一個實施方式中,所述免疫球蛋白重鏈恆定區核 酸序列選自C 0U鉸鏈、CH2、CH3及其組合。在一個實施方式中,所述重鏈恆定區核酸序列包 含C hI-鉸鏈-CH2_CH3。在一個實施方式中,所述基因組核酸序列包含與免疫球蛋白重鏈恆 定區核酸序列可操作地連接的重排的人源免疫球蛋白重鏈可變區核酸序列。在一個實施方 式中,所述免疫球蛋白重鏈恆定區核酸序列是小鼠免疫球蛋白重鏈恆定區核酸序列或人源 免疫球蛋白重鏈恆定區核酸序列或者其組合。在一個實施方式中,所述免疫球蛋白重鏈恆 定區核酸序列選自C H1、鉸鏈、CH2、CH3及其組合。在一個實施方式中,所述重鏈恆定區核酸 序列包含C hI-絞鏈_Ch2_Ch3。
[0107] 在一個實施方式中,所述插入核酸包含基因組核酸序列,所述核酸序列編碼人源 免疫球蛋白輕鏈可變區胺基酸序列。在一個實施方式中,所述基因組核酸序列包含未經重 排的人源λ和/或 κ輕鏈可變區核酸序列。在一個實施方式中,所述基因組核酸序列包 含重排的人源λ和/或κ輕鏈可變區核酸序列。在一個實施方式中,所述未經重排的或 重排的λ和/或 κ輕鏈可變區核酸序列可操作地連接至小鼠或人源免疫球蛋白輕鏈恆定 區核酸序列,所述疫球蛋白輕鏈恆定區核酸序列選自λ輕鏈恆定區核酸序列和 κ輕鏈恆 定區核酸序列。
[0108] 在一個實施方式中,所述插入核酸包含人源核酸序列。在一個實施方式中,所述人 源核酸序列編碼胞外蛋白。在一個實施方式中,所述人源核酸序列編碼受體的配體。在一個 實施方式中,所述配體是細胞因子。在一個實施方式中,所述細胞因子是選自下述的趨化因 子:CCL、CXCL、CX3CL和XCL。在一個實施方式中,所述細胞因子是腫瘤壞死因子(TNF)。在 一個實施方式中,所述細胞因子是白介素(IL)。在一個實施方式中,所述白介素選自IL-1、 IL-2、IL-3、IL-4、IL-5、IL-6、IL-7、IL-8、IL-9、IL-10、IL-11、IL-12、IL-13、IL-14、IL-15、 IL-16、 IL-17、 IL-18、 IL-19、 IL-20、 IL-21、 IL-22、 IL-23、 IL-24、 IL-25、 IL-26、 IL-27、 IL-28、IL-29、IL-30、IL-31、IL-32、IL-33、IL-34、IL-35 和 IL-36。在一個實施方式中,所 述白介素是IL-2。在一個實施方式中,所述人源基因組核酸序列編碼細胞質蛋白。在一個 實施方式中,所述人源基因組核酸序列編碼膜蛋白。在一個實施方式中,所述膜蛋白是受 體。在一個實施方式中,所述受體是細胞因子受體。在一個實施方式中,所述細胞因子受體 是白介素受體。在一個實施方式中,所述白介素受體是白介素2受體α。在一個實施方式 中,所述白介素受體是白介素2受體β。在一個實施方式中,所述白介素受體是白介素2受 體Y。在一個實施方式中,所述人源基因組核酸序列編碼核蛋白。在一個實施方式中,所述 核蛋白是核受體。
[0109] 在一個實施方式中,所述插入核酸包含在編碼序列中的基因修飾。在一個實施方 式中,所述基因修飾包含編碼序列的缺失突變。在一個實施方式中,所述基因修飾包含兩個 內源性編碼序列的融合。
[0110] 在一個實施方式中,所述插入核酸包含編碼突變的人源蛋白的人源核酸序列。在 一個實施方式中,所述突變的人源蛋白的特徵在於具有改變的結合性質、改變的位置、改變 的表達和/或改變的表達模式。在一個實施方式中,所述人源核酸序列包含至少一個人類 疾病等位基因。在一個實施方式中,所述人類疾病等位基因是神經系統疾病等位基因。在 一個實施方式中,所述人類疾病等位基因是心血管疾病等位基因。在一個實施方式中,所述 人類疾病等位基因是腎臟疾病等位基因。在一個實施方式中,所述人類疾病等位基因是肌 肉疾病等位基因。在一個實施方式中,所述人類疾病等位基因是血液疾病等位基因。在一 個實施方式中,所述人類疾病等位基因是致癌基因等位基因。在一個實施方式中,所述人類 疾病等位基因是免疫系統疾病等位基因。在一個實施方式中,所述人類疾病等位基因是顯 性等位基因。在一個實施方式中,所述人類疾病等位基因是隱性等位基因。在一個實施方 式中,所述人類疾病等位基因包含單核苷酸多態性(SNP)等位基因。
[0111] 在一個實施方式中,所述插入核酸包含調控序列。在一個實施方式中,所述調控序 列是啟動子序列。在一個實施方式中,所述調控序列是增強子序列。在一個實施方式中,所 述調控序列是轉錄阻遏蛋白結合序列。在一個實施方式中,所述插入核酸包含人源核酸序 列,其中所述人源核酸序列包含非蛋白編碼序列的缺失,但是不包含蛋白編碼序列的缺失。 在一個實施方式中,所述非蛋白編碼序列的缺失包含調控序列的缺失。在一個實施方式中, 所述調控元件的缺失包括啟動子序列的缺失。在一個實施方式中,所述調控元件的缺失包 括增強子序列的缺失。
[0112] 在一個方面,本申請提供了一種由如本申請所述的方法製備的哺乳動物細胞。在 一個實施方式中,所述哺乳動物細胞包含插入核酸,所述插入核酸包含在基因組的靶基因 座的一個或多個如本申請所述的基因修飾。
[0113] 在一個實施方式中,所述哺乳動物細胞是多能細胞。在一個實施方式中,所述多能 細胞是胚胎幹(ES)細胞。在一個實施方式中,所述多能細胞是誘導多能幹(iPS)細胞。在 一個實施方式中,所述誘導多能(iPS)細胞來源於成纖維細胞。在一個實施方式中,所述誘 導多能(iPS)細胞來源於人成纖維細胞。在一個實施方式中,所述多能細胞是造血幹細胞 (HSC)。在一個實施方式中,所述多能細胞神經幹細胞(NSC)。在一個實施方式中,所述多能 細胞是外胚層幹細胞。在一個實施方式中,所述多能細胞是發育受限的祖細胞。
[0114] 在一個實施方式中,所述多能細胞是小鼠多能細胞。在一個實施方式中,所述多能 細胞是小鼠胚胎幹(ES)細胞。
[0115] 在一個實施方式中,所述哺乳動物細胞是永生化的小鼠或大鼠細胞。在一個實施 方式中,所述哺乳動物細胞是永生化的人源細胞。在一個實施方式中,所述哺乳動物細胞是 人成纖維細胞。在一個實施方式中,所述哺乳動物細胞是癌細胞。在一個實施方式中,所述 哺乳動物細胞是人癌細胞。
[0116] 在一個實施方式中,所述基因組的靶基因座選自FcERla基因座、TLR4基因座、 PRLR基因座、Notch4基因座、Accn2基因座、Adamts5基因座、TRPAl基因座、FolHl基因座、 LRP5基因座和ERBB4基因座。
[0117] 在一個實施方式中,所述基因組的靶基因座包含一個或多個如本申請所述的基因 修飾。在一個實施方式中,所述基因修飾是內源性核酸序列的缺失。在一個實施方式中,所 述基因修飾是將外源性核酸序列加入所述基因組的靶基因座中。在一個實施方式中,所述 基因修飾是在所述基因組的靶基因座使用外源性核酸序列取代內源性核酸序列。在一個實 施方式中,所述外源性核酸序列是非小鼠核酸序列。在一個實施方式中,所述外源性核酸序 列是人源核酸序列。在一個實施方式中,所述基因組的靶基因座包含選自敲除、缺失、插入、 取代("敲入")、結構域交換、外顯子交換、內含子交換、調控序列交換、基因交換及其組合 的修飾。
[0118] 在一個實施方式中,所述基因組的靶基因座包含插入核酸,所述插入核酸與小鼠 核酸序列是同源的。在一個實施方式中,所述插入核酸序列是人源核酸。在一個實施方式 中,所述插入核酸是基因組核酸的片段。在一個實施方式中,所述基因組核酸是小鼠基因組 核酸、人源基因組核酸或其組合。在一個實施方式中,如上文所述的插入核酸的範圍為約 5kb 至約 200kb。
[0119] 在一個實施方式中,所述基因組的靶基因座包含插入核酸,所述插入核酸與小鼠 核酸序列是直系同源的。在一個實施方式中,所述插入核酸是人源核酸。在一個實施方式 中,所述插入核酸是基因組核酸的片段。在一個實施方式中,所述基因組核酸是小鼠基因組 核酸、人源基因組核酸或其組合。在一個實施方式中,如上文所述的插入核酸的範圍為約 5kb 至約 200kb。
[0120] 在一個實施方式中,所述基因組的靶基因座包含條件等位基因。在一個實施方式 中,所述條件等位基因是如在US 2011/0104799中所描述的多功能的等位基因,其全部內 容通過引用併入本申請。在一個實施方式中,所述條件等位基因包含:(a)在相對於靶基因 轉錄的有意義方向的驅動序列,和在有意義或反義方向的藥物選擇性表達盒;(b)在反義 方向的感興趣的核苷酸序列(NSI)和條件倒置模塊(COIN,其利用外顯子分割的內含子和 可逆的基因捕獲樣分子;參見例如US 2011/0104799,其全部內容通過引用併入)和(c)可 重組的單元,其在與第一重組酶接觸後重組形成條件等位基因,所述條件等位基因(i)缺 乏驅動序列和DSC以及(ii)在有意義方向含有NSI並在反義方向含有COIN。
[0121] 在一個實施方式中,所述插入核酸含有與啟動子可操作地連接的報告基因,其中 所述報告基因編碼選自下組的報告蛋白:LacZ、mPlum、mCherry、tdTomato、mStrawberry、 ]~1^(1、〇81^(1、111〇四1^6、1111(〇、11£;[1:1';[116、/011118、¥?61:、增強的黃色突光蛋白出¥卩?)41116四1(1、 增強的綠色螢光蛋白(EGFP)、CyPet、青色螢光蛋白(CFP)、Cerulean、T-Sapphire、螢光素 酶、鹼性磷酸酶及其組合。在一個實施方式中,所述報告基因在誘導型啟動子的控制下表 達。在一個實施方式中,所述報告基因在內源性啟動子的控制下表達。在一個實施方式中, 所述報告基因在外源性啟動子的控制下表達。在一個實施方式中,所述報告基因在特定的 細胞類型中表達。在一個實施方式中,所述報告基因以組織特異性的方式表達。在一個實 施方式中,所述報告基因以發育階段特異性的方式表達。
[0122] 在一個實施方式中,所述插入核酸包含人源核酸序列,所述人源核酸序列編碼在 神經系統、骨骼系統、消化系統、循環系統、肌肉系統、呼吸系統、心、血管系統、淋巴系統、內 分泌系統、泌尿系統、生殖系統或其組合中表達的蛋白。在一個實施方式中,所述人源核酸 序列編碼在骨髓或骨髓來源細胞中表達的蛋白。在一個實施方式中,所述小鼠 ES細胞的基 因組包含人源基因組的基因座,所述人源基因組的基因座編碼在脾細胞中表達的蛋白。在 一個實施方式中,所述人源核酸編碼在B細胞中表達的蛋白。在一個實施方式中,所述人源 核酸編碼在未成熟的B細胞中表達的蛋白。在一個實施方式中,所述人源核酸編碼在成熟 的B細胞中表達的蛋白。
[0123] 在一個實施方式中,所述插入核酸包含人源核酸序列,所述人源核酸序列編碼人 源免疫球蛋白重鏈可變區胺基酸序列。在一個實施方式中,所述人源核酸序列包含未經重 排的人源免疫球蛋白重鏈可變區核酸序列。在一個實施方式中,所述未經重排的人源免疫 球蛋白重鏈可變區核酸序列與小鼠免疫球蛋白重鏈恆定區核酸序列、人源免疫球蛋白重鏈 恆定區核酸序列或其組合可操作地連接。在一個實施方式中,所述免疫球蛋白重鏈恆定區 核酸序列選自C 0U鉸鏈、CH2、CH3及其組合。在一個實施方式中,所述重鏈恆定區核酸序列 包含C hI-鉸鏈-CH2-CH3。在一個實施方式中,所述人源核酸序列包含重排的人源免疫球蛋 白重鏈可變區核酸序列。在一個實施方式中,所述人源免疫球蛋白重鏈可變區核酸序列與 小鼠免疫球蛋白重鏈恆定區核酸序列、人源免疫球蛋白重鏈恆定區核酸序列或其組合可操 作地連接。在一個實施方式中,所述免疫球蛋白重鏈恆定區核酸序列選自C hU鉸鏈、Ch2、Ch3 及其組合。在一個實施方式中,所述重鏈恆定區核酸序列包含C hI-鉸鏈-Ch2-Ch3。
[0124] 在一個實施方式中,所述插入核酸包含人源核酸序列,所述核酸序列編碼人源免 疫球蛋白輕鏈可變區胺基酸序列。在一個實施方式中,所述人源核酸序列包含未經重排的 人源λ和/或 K輕鏈可變區核酸序列。在一個實施方式中,所述人源核酸序列包含重排 的人源λ和/或Κ輕鏈可變區核酸序列。在一個實施方式中,所述未經重排的λ和/或 κ輕鏈可變區核酸序列與選自λ輕鏈恆定區核酸序列和Κ輕鏈恆定區核酸序列的小鼠或 人源免疫球蛋白輕鏈恆定區核酸序列可操作地連接。
[0125] 在一個實施方式中,所述插入核酸包含人源核酸序列。在一個實施方式中,所述人 源核酸序列編碼胞外蛋白。在一個實施方式中,所述人源核酸序列編碼受體的配體。在一個 實施方式中,所述配體是細胞因子。在一個實施方式中,所述細胞因子是選自下述的趨化因 子:CCL、CXCL、CX3CL和XCL。在一個實施方式中,所述細胞因子是腫瘤壞死因子(TNF)。在 一個實施方式中,所述細胞因子是白介素(IL)。在一個實施方式中,所述白介素選自IL-1、 IL-2、IL-3、IL-4、IL-5、IL-6、IL-7、IL-8、IL-9、IL-10、IL-11、IL-12、IL-13、IL-14、IL-15、 IL-16、 IL-17、 IL-18、 IL-19、 IL-20、 IL-21、 IL-22、 IL-23、 IL-24、 IL-25、 IL-26、 IL-27、 IL-28、IL-29、IL-30、IL-31、IL-32、IL-33、IL-34、IL-35 和 IL-36。在一個實施方式中,所 述白介素是IL-2。在一個實施方式中,所述人源基因組核酸序列編碼細胞質蛋白。在一個 實施方式中,所述人源基因組核酸序列編碼膜蛋白。在一個實施方式中,所述膜蛋白是受 體。在一個實施方式中,所述受體是細胞因子受體。在一個實施方式中,所述細胞因子受體 是白介素受體。在一個實施方式中,所述白介素受體是白介素2受體α。在一個實施方式 中,所述白介素受體是白介素2受體β。在一個實施方式中,所述白介素受體是白介素2受 體Y。在一個實施方式中,所述人源基因組核酸序列編碼核蛋白。在一個實施方式中,所述 核蛋白是核受體。
[0126] 在一個實施方式中,所述插入核酸包含在編碼序列中的基因修飾。在一個實施方 式中,所述基因修飾包含編碼序列的缺失突變。在一個實施方式中,所述基因修飾包含兩個 內源性編碼序列的融合。
[0127] 在一個實施方式中,所述插入核酸包含編碼突變的人源蛋白的人源核酸序列。在 一個實施方式中,所述突變的人源蛋白的特徵在於具有改變的結合性質、改變的位置、改變 的表達和/或改變的表達模式。在一個實施方式中,所述人源核酸序列包含至少一個人類 疾病等位基因。在一個實施方式中,所述人類疾病等位基因是神經系統疾病等位基因。在 一個實施方式中,所述人類疾病等位基因是心血管疾病等位基因。在一個實施方式中,所述 人類疾病等位基因是腎臟疾病等位基因。在一個實施方式中,所述人類疾病等位基因是肌 肉疾病等位基因。在一個實施方式中,所述人類疾病等位基因是血液疾病等位基因。在一 個實施方式中,所述人類疾病等位基因是致癌基因等位基因。在一個實施方式中,所述人類 疾病等位基因是免疫系統疾病等位基因。在一個實施方式中,所述人類疾病等位基因是顯 性等位基因。在一個實施方式中,所述人類疾病等位基因是隱性等位基因。在一個實施方 式中,所述人類疾病等位基因包含單核苷酸多態性(SNP)等位基因。
[0128] 在一個實施方式中,所述插入核酸包含調控序列。在一個實施方式中,所述調控序 列是啟動子序列。在一個實施方式中,所述調控序列是增強子序列。在一個實施方式中,所 述調控序列是轉錄阻遏蛋白結合序列。在一個實施方式中,所述插入核酸包含人源核酸序 列,其中所述人源核酸序列包含非蛋白編碼序列的缺失,但是不包含蛋白編碼序列的缺失。 在一個實施方式中,所述非蛋白編碼序列的缺失包含調控序列的缺失。在一個實施方式中, 所述調控元件的缺失包括啟動子序列的缺失。在一個實施方式中,所述調控元件的缺失包 括增強子序列的缺失。
[0129] 在一個方面,本申請提供了一種製備非人動物的方法,所述非人動物在其種系中 包含如本申請所述的一個或多個基因修飾,所述方法包括:
[0130] (a)在原核細胞中使用大靶向載體(LTVEC)和核酸酶試劑修飾非人動物基因組的 感興趣的基因座,所述核酸酶試劑在基因組的感興趣的基因座中或其附近產生單鏈或雙鏈 斷裂,其中所述LTVEC包含翼側為上遊和下遊同源臂的插入核酸,並且所述原核細胞能夠 表達重組酶;
[0131] (b)選擇包含經基因修飾的LTVEC的經修飾的原核細胞;
[0132] (c)分離所述經基因修飾的LTVEC ;
[0133] (d)將所述經基因修飾的LTVEC引入所述非人動物的多能細胞以生成經基因修 飾的多能細胞,所述經基因修飾的多能細胞在基因組的感興趣的基因座中包含所述插入核 酸;
[0134] (e)選擇所述經基因修飾的多能細胞;
[0135] (f)將所述經基因修飾的多能細胞在前桑葚胚期引入所述非人動物的宿主胚胎; 和
[0136] (g)將包含經基因修飾的多能細胞的所述宿主胚胎引入代孕母體以生成來源於所 述經基因修飾的多能細胞的代。
[0137] 在一個實施方式中,所述非人動物是哺乳動物。在一個實施方式中,所述哺乳動物 是哨齒動物。在一個實施方式中,所述哨齒動物選自小鼠、大鼠和倉鼠。在一個實施方式中, 所述非人動物是小鼠,並且所述多能細胞是小鼠 ES細胞。在一個實施方式中,所述非人動 物是大鼠,並且所述多能細胞是大鼠 ES細胞。
[0138] 在一個實施方式中,所述基因組的靶基因座包含如本申請所述的一個或多個基因 修飾。
[0139] 在一個實施方式中,分離步驟(c)還包含(c) '線性化所述經基因修飾的LTVEC。
[0140] 在一個實施方式中,引入步驟(d)還包含(d)'將如本申請所述的核酸酶試劑引入 所述多能細胞。在一個實施方式中,所述核酸酶試劑是鋅指核酸酶(ZFN)。在一個實施方式 中,所述核酸酶試劑是轉錄激活因子樣效應物核酸酶(TALEN)。
[0141] 在一個實施方式中,通過應用如本申請所述的對所述原核細胞或所述多能細胞而 言可選擇的試劑進行選擇步驟(b)和/或(e)。
[0142] 在一個實施方式中,通過如本申請所述的等位基因修飾(MOA)檢測進行選擇步驟 (b)和 / 或(e)。
[0143] 附圖簡沭
[0144] 圖1描述了在小鼠112rg基因上的鋅指核酸酶(ZFN)的切割位點。該圖沒有按照 比例繪製。在圖下部的加框的序列代表ZFN靶序列。
[0145] 發明詳沭
[0146] 本發明不限於特定方法,並且所描述的實驗條件如方法和條件可以改變。還應理 解本申請中使用的術語僅用於描述特定實施方式的目的,其並非旨在進行限制,因為本發 明的範圍是由權利要求所限定的。
[0147] 除非另有定義,本申請使用的所有術語和短語包括所述術語和短語在本領域中已 有的含義,除非有明確相反的指示或者從使用該術語或短語的上下文中有明確相反的顯 示。儘管與本申請所述的那些類似或等價的任意方法和材料都能夠用於實施或檢測本發 明,但是在此還是描述了特定的方法和材料。提及的所有出版物均通過引用併入本申請。
[0148] 定義
[0149] 本申請使用的術語"胚胎幹細胞"或"ES細胞"包括胚胎來源的全能性或多能細胞, 所述細胞能夠在體外進行不分化的增殖,並且能夠通過引入胚胎中促成發育胚胎的任何組 織。本申請使用的術語"多能細胞"包括具有發育成一種以上分化的細胞類型的能力的、未 經分化的細胞。
[0150] 術語"種系"指包括能夠傳遞給後代的核酸序列的免疫球蛋白核酸序列。
[0151] 短語"重鏈"或"免疫球蛋白重鏈"包括來自任意生物體的包括免疫球蛋白重鏈恆 定區序列的免疫球蛋白重鏈序列。除非另有說明,重鏈可變結構域包括三個重鏈CDR和四 個框架(FR)區。重鏈的片段包括CDR、CDR和FR、及其組合。典型的重鏈具有下述可變結 構域(從N末端到C末端):C H1結構域、鉸鏈、CH2結構域和CH3結構域。重鏈的功能性片 段包括能夠特異性識別表位的片段(例如以微摩、納摩或皮摩範圍的K d識別表位),所述片 段能夠由細胞表達和分泌,並且其包含至少一個CDR。重鏈可變結構域由可變區核苷酸序列 編碼,其通常包括來源於在種系中存在的V H、Dh和Jh區段庫的VH、Dh和J h區段。各種生物 體的V、D和J重鏈區段的序列、位置和名稱能夠在IMGT資料庫中找到,該資料庫可以通過 網際網路在全球資訊網(WWW)上的URL "imgt.org. "進行訪問。
[0152] 短語"輕鏈"包括來自任意生物體的免疫球蛋白輕鏈序列,並且除非另有說明 包括人源κ和λ輕鏈和VpreB,以及替代輕鏈。除非另有說明,輕鏈可變結構域通常包 括三個輕鏈CDR和四個FR。通常情況下,全長的輕鏈從氨基末端到羧基末端包括包含 FR1-CDR1-FR2-CDR2-FR3-CDR3-FR4的可變結構域和輕鏈恆定區胺基酸序列。輕鏈可變結構 域由輕鏈可變區核苷酸序列編碼,其通常包括來源於在種系中存在的輕鏈V和J基因區段 庫的輕鏈' 和輕鏈1基因區段。各種生物體的輕鏈V和J基因區段的序列、位置和名稱能 夠在MGT資料庫中找到,該資料庫可以通過網際網路在全球資訊網上的URL "imgt. org. " 進行訪問。輕鏈包括那些例如存在於與第一或第二表位選擇性地結合的表位結合蛋白中但 即不與第一表位又不與第二表位選擇性地結合的那些。輕鏈還包括存在於與第一或第二表 位選擇性地結合的表位結合蛋白中,並且結合和識別或者輔助重鏈結合和識別一個或多個 表位的那些。
[0153] 本申請中使用的術語"同源性核酸"包括與已知的對照序列相同或基本相似的核 酸序列。在一個實施方式中,術語"同源性核酸"用於表徵與已知的對照序列相比具有至 少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少 98%、至少99%或者甚至100% -致性的DNA或RNA序列。
[0154] 本申請中使用的術語"直系同源性核酸"包括來自一個物種的核酸序列,所述核酸 序列與已知的對照序列在另一個物種中的功能等效。
[0155] 本申請中使用的術語"大靶向載體"或"LTVEC"包括來源於克隆的基因組核酸片 段的用於原核細胞的大靶向載體,其大於通常用於在原核細胞中通過其他方法旨在進行 同源靶向的那些。所述LTVEC的尺寸過大以至於不能通過常規檢測篩選靶向事件,例如 southern印跡和長範圍(例如lkb-5kb)PCR。所述LTVEC的示例包括但不限於來源於細菌 人工染色體(BAC)和酵母人工染色體(YAC)的載體。
[0156] 術語"等位基因修飾"或"Μ0Α"包括在基因組中的基因或染色體基因座(loci)的 一個等位基因的精確DNA序列的修飾。"等位基因修飾(MOA) "的示例包括但不限於缺失、取 代或插入少至單個的核苷酸或缺失幾千鹼基跨距的感興趣的基因或染色體基因座(loci), 以及在這兩個端值之間的任意和全部可能的修飾。
[0157] 本申請中使用的術語"核酸酶"包括在核酸序列中誘導斷裂(例如,在雙鏈DAN 序列中的單鏈或雙鏈斷裂)的試劑。核酸酶包括結合預先選定的或特定序列,並且在預先 選定的或特定序列處或其附近切斷的那些,例如經工程改造的鋅指核酸酶和經工程改造的 TAL效應物核酸酶。核酸酶不限於ZFN和TAL效應物核酸酶,而是可以是適用於LTVEC以實 現改善的靶向效率的任意核酸酶。非限制性示例包括其他的基於鋅指的核酸酶和經工程改 造的大範圍核酸酶,其在預先選定的或特定序列處切斷。
[0158] 適用於本發明的TAL效應物核酸酶包括本領域公知的任意TAL核酸酶。適 宜的TAL核酸酶和用於製備適宜的TAL核酸酶的方法的示例在例如美國專利申請號 2011/0239315A1、2011/0269234A1、2011/0145940A1、2003/0232410A1、2005/0208489A1、 2005/0026157Α1、2005/0064474Α1、2006/0188987Α1 和 2006/0063231A1 (其均通過引用並 入本申請)中所公開的。在各種實施方式中,TAL效應物核酸酶被工程改造,使其在例如感 興趣的基因組中的靶核酸序列或其附近切斷,其中所述靶核酸序列位於被LTVEC修飾的序 列或在其附近。TAL效應物核酸酶是蛋白,所述蛋白包含核酸內切酶結構域和一個或多個 TAL效應物DNA結合結構域,其中所述一個或多個TAL效應物DNA結合結構域包含識別預先 選定的或特定核酸序列的序列。適用於本發明的TAL核酸酶包括如本申請所述的特別設計 為在被LTEVC修飾的靶核酸序列或其附近結合的那些。
[0159] 短語"可操作地連接"包括某種關係,其中所述可操作地連接的組件以其預期的方 式發揮功能。在一個例子中,編碼蛋白的核酸序列可以與調控序列(例如啟動子、增強子、 沉默子序列等)可操作地連接以保持適當的轉錄調控。在一個例子中,免疫球蛋白可變區 (或V(D) J區段)的核酸序列可以與免疫球蛋白恆定區的核酸序列可操作地連接以使得所 述序列之間適當地重組成為免疫球蛋白的重鏈或輕鏈序列。
[0160] 本申請中使用的術語"啟動子"和"啟動子調控元件"等包括在核酸片段或基因中 的控制該基因表達的核苷酸序列元件。
[0161] 本申請中使用的術語"重組位點"包括被位點特異性重組酶識別並且能夠作為重 組事件的底物的核苷酸序列。
[0162] 本申請中使用的術語"位點特異性重組酶"包括一組酶,所述酶能夠促進"重組位 點"間的重組,這兩個重組位點在單一核酸分子中是物理上隔離的或在彼此分離的核酸分 子上。"位點特異性重組酶"的示例包括但不限於Cre、Flp和Dre重組酶。
[0163] 使用LTVEC和核酸酶試劑的基因組基因座的修飾
[0164] 儘管對非人動物的各種基因組基因座的靶向已經取得了進步,但是仍有很多的基 因組基因座或細胞類型不能使用常規的靶向策略靶向。失敗的原因可能不同,但是在本申 請中使用時原因包括基因座或細胞使用常規的靶向方法根本不能成功靶向或者不能正確 靶向或效率非常低。常規的靶向方法包括通過常規靶向載體使用同源重組靶向。難於靶向 的基因座包括甚至單獨使用LTVEC不能靶向的基因座,即在缺乏以重組的單鏈或雙鏈斷裂 的形式的輔助的情況下,或者在缺乏重組的單鏈或雙鏈斷裂的情況下使用LTVEC不能正確 靶向或靶向基因座的效率較低的基因座。
[0165] 本申請提供了用於靶向核酸序列的組合物和方法,其使用能夠形成重組的單鏈或 雙鏈斷裂的核酸酶試劑以及大靶向載體或LTVEC,其中所述經靶向的核酸序列(或經靶向 的核酸序列附近的序列)被所述LTVEC修飾。所述組合物和方法能用於修飾那些使用常規 的靶向策略甚至單獨使用LTVEC難於或無法修飾的基因組核酸序列。
[0166] 在各種方面,本申請提供了使用LTVEC以便在例如基因組的基因座進行靶核酸修 飾的組合物和方法,其中所述靶核酸包含擬通過所述LTVEC的序列修飾的靶序列(通過使 用所述LTVEC的靶核酸的同源重組),其中在所述靶核酸處或所述靶序列附近形成單鏈或 雙鏈斷裂。
[0167] 在各種實施方式中,在所述靶核酸或其附近存在單鏈或雙鏈斷裂增加 LTVEC和靶 核酸之間的重組效率和/或頻率。在一個實施方式中,所述重組是同源重組。在另一個實 施方式中,所述重組是通過非同源末端連接的插入。在各種實施方式中,當存在所述單鏈或 雙鏈斷裂時,LTVEC序列在基因組靶基因座的靶向效率與不存在單鏈或雙鏈斷裂時(使用 例如相同的LTVEC和相同的包含相同靶序列的靶核酸,但不存在形成單鏈或雙鏈斷裂的附 加核酸酶)相比高至少約2倍、至少約3倍、至少約4倍。
[0168] 適用於本發明的LTVEC以及製備其的方法在例如美國專利號6, 586, 251、 6, 596, 541、7, 105, 348 和 TO 2002/036789 (PCT/US01/45375)中進行了描述。
[0169] 儘管對直接將LTVEC引入小鼠多能細胞例如小鼠 ES細胞的實施方式進行了大量 地討論,但是本申請還提供了將LTVEC引入各種哺乳動物細胞類型的其他方法。此類哺乳 動物細胞包括能夠根據如本申請所公開的方法被基因修飾的任意哺乳動物細胞,包括例如 小鼠細胞、大鼠細胞、家兔細胞、豬細胞、牛細胞、鹿細胞、綿羊細胞、山羊細胞、雞細胞、貓細 胞、犬細胞、雪貂細胞、靈長類(例如絨猴、恆河猴)細胞等。在一些實施方式中,對於適宜 的可基因修飾的多能細胞不易獲得的那些哺乳動物而言,使用其他方法將體細胞重編程成 多能細胞,例如通過將多能誘導因子的組合引入體細胞,所述多能性誘導因子包括但不限 於 0ct3/4、Sox2、KLF4、Myc、Nanog、LIN28 和 Glis 1。
[0170] 在一個實施方式中,所述上遊和下遊同源臂來自與所述經靶向的基因組相同的基 因組。在一個實施方式中,所述同源臂來自相關的基因組,例如所述經靶向的基因組是第一 個品系的小鼠基因組,而所述靶向臂來自第二個品系的小鼠基因組,其中所述第一個品系 和所述第二個品系是不同的。在一個實施方式中,所述靶向臂來源於BAC文庫、粘粒文庫或 Pl噬菌體文庫。在一個實施方式中,所述同源臂來源於合成的DNA。在一個實施方式中,所 述同源臂來源於使用常規方法不能靶向的基因。在一個特定的實施方式中,所述同源臂來 自於基因,所述基因在不存在由核酸酶試劑誘導的單鏈或雙鏈斷裂的情況下使用常規的靶 向技術不能被靶向,或僅能夠被不正確的靶向或僅能夠被以非常低的效率靶向。
[0171] 在各種實施方式中,為了便於鑑定經靶向的修飾,使用了一種高通量定量檢測 (即:等位基因修飾(MOA)檢測)。本申請所述的MOA檢測允許在基因修飾後對母體染色體 中的經修飾的等位基因進行大規模篩選。所述MOA檢測能夠通過各種分析技術實施,包括 但不限於定量PCR,例如實時PCR (qPCR)。例如,所述實時PCR包括識別所述靶基因座的第一 引物集合和識別非靶向對照基因座的第二引物集合。此外,所述引物集合包含識別所述擴 增序列的螢光探針。所述定量檢測還能夠通過各種分析技術實施,包括但不限於螢光介導 的原位雜交(FISH)、比較基因組雜交、等溫DNA擴增、與固定探針的定量雜交、Invader探針 ?、MMP檢測j?、T叫Man?'分子信標和Eclipse?探針技術。(參見例如US2005/0144655, 其通過引用整體併入本申請)。
[0172] 在一些實施方式中,本申請所述的靶基因組基因座的各種基因修飾能夠通過 使用VELOCIGENE?基因工程技術利用來源於細菌人工染色體(BAC)DNA的LTVEC在 細菌細胞中進行一系列同源重組反應(BHR)來實施(參見例如美國專利號6, 586, 251 和 Valenzuela, D. M.等(2003), High-throughput engineering of the mouse genome coupled with high-resolution expression analysis (與高分辨表達分析偶聯的小鼠基 因組的高通量工程改造 ),Nature Biotechnology 21 (6) :652-659,其通過引用整體併入本 申請)。
[0173] 在一些實施方式中,使用包含如本申請所述的各種基因修飾的經靶向的小鼠 ES 細胞作為供體ES細胞並通過VElOClNiOUSEli法將其引入前桑葚胚階段的小鼠胚胎中例 如8-細胞階段的小鼠胚胎中(參見例如US 7, 576, 259、US 7, 659, 442、US 7, 294, 754和US 2008-0078000A1,其均通過引用整體併入本申請)。對包含經基因修飾的ES細胞的小鼠胚 胎進行孵育直至胚泡階段,然後將其植入代孕母體中以產生小鼠。可以通過如本申請所 述的等位基因修飾(MOA)檢測對攜帶所述經基因修飾的基因組基因座的小鼠進行鑑定。將 所得到的來源於所述經基因修飾的ES細胞的R)代小鼠與野生型小鼠交配以獲得Fl代子 代。在使用特定的引物和/或探針進行基因分型後,將針對所述經基因修飾的基因組基因 座是雜合子的Fl代幼仔彼此之間交配以產生針對所述經基因修飾的基因組基因座是純合 子的小鼠。
[0174] 必須注意的是,除非上下文中另有明示,在本申請中和所附的權利要求書使用的 單數形式的"一個(a)"、"一種(an)"和"所述(the)"包括複數形式。本申請中使用的所有 技術和科學術語具有相同的含義。
[0175] 提供本申請所討論的出版物僅為了其先於本申請的申請日所公開的內容。本申請 中沒有任何內容可以被解釋為承認由於在先發明所述發明沒有資格早於此類出版物。此 夕卜,所提供的出版物的日期可能不同於實際出版日期,可能需要對其進行獨立地確認。
[0176] 在不脫離其精神或基本屬性的前提下,可以將所述發明以其他特定的形式體現, 並且應參照所附的權利要求而非前述的說明書表示本發明的範圍。 實施例
[0177] 列出下述實施例以便向那些本領域的普通技術人員完整地公開和描述如何實現 和使用本發明,並非旨在限制發明人所認為的其發明的範圍,也不是旨在表示下述實驗是 所進行的全部或唯一的實驗。已做出努力來確保所使用數字(例如數量、溫度等)的準確 性,但是應考慮一些實驗誤差和偏差。除非另有明示,份數以重量份計,分子量是重均分子 量,溫度是攝氏度,並且壓力是處於或接近大氣壓。
[0178] 實施例1 :通過鋅指核酸酶(ZFN)增強的LTVEC靶向
[0179] 為了檢測利用鋅指核酸酶(ZFN)在基因中誘導雙鏈斷裂是否能夠增強LTVEC(基 於BAC的大靶向載體)對相同基因的靶向,使用靶向112rg基因的LTVEC和編碼以下 述組合中ZFN對的每一半的質粒在F1H4ES細胞中進行三次電穿孔:(1)單獨的Uyg 112rg LTVEC ; (2) 20yg 112rg ZFN-l+20yg 112rg LTVEC ZFN-2+1.5yg 112rg LTVEC 和 (3)20yg 112rg ZFN-l+20yg 112rg LTVEC ZFN-2 無 LTVEC。
[0180] 對本申請中使用的ZFN-I和ZFN-2進行設計以含有(I)鋅指DNA結合結構域, 所述結構域識別在所述靶序列的各條鏈中由6bp的切割位點分隔的兩個相鄰的靶DNA序 列和(2)Fokl核酸酶,所述核酸酶二聚化並且在所述靶位點形成雙鏈斷裂。更具體地,將 ZFN-I的鋅指結構域設計為識別在外顯子1的有意義鏈中的5'-AGCTCCAAGGTCCTC-3'(SEQ ID N0:1);並且將ZFN-2的鋅指結構域設計為識別在112rg基因的外顯子1的反義鏈中的 5'-GTCTTCATTCGCACT-3' (SEQ ID N0:2)。
[0181] 將所述 LTVEC (VelociGene MAID 5057L1)設計為缺失 112rg 基因的約 3, 000 個 鹼基對(3kb),包括全部IL-2受體γ鏈的編碼序列,並且使用表達潮黴素磷酸轉移酶的 選擇性表達盒取代內源性序列,這使其具有潮黴素 B的抗性。從市售的BAC文庫(BAC ES Release 2 ;Incyte Genomics)中分離來源於母體 BAC 克隆 290〇15 的 LTVEC 5057L1,並且 其含有約90kb(同源臂1)和約8kb(同源臂2)的兩個較大的同源臂。
[0182] 針對電穿孔(1)和(2),分離具有潮黴素 B抗性的集落。針對電穿孔(3),允許在 不使用藥物選擇的情況下形成集落。從各次電穿孔中挑取集落並且在96孔板中培養,隨後 通過等位基因缺失(LOA)檢測篩選靶向事件,所述檢測設計為檢測由LTVEC正確靶向112rg 基因形成的3kb缺失。還使用LOA檢測檢測ZFN在外顯子1中誘導的切割事件。
[0183] 表1 :針對經靶向的3kb缺失的LOA檢測
【權利要求】
1. 一種在哺乳動物細胞中修飾基因組的靶基因座的方法,所述方法包括: (a) 引入哺乳動物細胞: (i) 核酸酶試劑,所述核酸酶試劑在基因組的靶基因座或其附近產生單鏈或雙鏈斷裂, 和 (ii) 大靶向載體(LTVEC),所述大靶向載體包含翼側為上遊同源臂和下遊同源臂的插 入核酸;以及 (b) 選擇經靶向的哺乳動物細胞,所述哺乳動物細胞包含在所述基因組的靶基因座中 的所述插入核酸。
2. 根據權利要求1所述的方法,其中所述哺乳動物細胞是多能細胞。
3. 根據權利要求1所述的方法,其中所述哺乳動物細胞是誘導性多能幹(iPS)細胞。
4. 根據權利要求2所述的方法,其中所述多能細胞是小鼠胚胎幹(ES)細胞。
5. 根據權利要求2所述的方法,其中所述多能細胞是造血幹細胞。
6. 根據權利要求2所述的方法,其中所述多能細胞是神經元幹細胞。
7. 根據權利要求1所述的方法,其中所述哺乳動物細胞是人源成纖維細胞。
8. 根據權利要求1所述的方法,其中所述哺乳動物細胞是分離自患有疾病的患者的人 源細胞,並且其中所述人源細胞在其基因組中包含至少一個人疾病等位基因。
9. 根據權利要求8所述的方法,其中將所述插入核酸整合進入所述基因組的靶基因座 取代所述基因組中的至少一個人疾病等位基因。
10. 根據權利要求1所述的方法,其中與單獨使用LTVEC相比,將所述LTVEC與所述核 酸酶試劑聯合使用使得靶向效率增加。
11. 根據權利要求10所述的方法,其中與單獨使用LTVEC相比,所述LTVEC的靶向效率 增加至少2倍。
12. 根據權利要求1所述的方法,其中所述核酸酶試劑是表達構建體,所述表達構建體 包含編碼核酸酶的核酸序列,並且其中所述核酸與在哺乳動物中有活性的啟動子可操作地 連接。
13. 根據權利要求1所述的方法,其中所述核酸酶試劑是編碼核酸酶的mRNA。
14. 根據權利要求12所述的方法,其中所述核酸酶是鋅指核酸酶(ZFN)。
15. 根據權利要求12所述的方法,其中所述核酸酶是轉錄激活因子樣效應物核酸酶 (TALEN)。
16. 根據權利要求12所述的方法,其中所述核酸酶是大範圍核酸酶。
17. 根據權利要求1所述的方法,其中所述核酸酶試劑的靶序列位於所述基因組的靶 基因座的內含子、外顯子、啟動子、啟動子調節區或增強子區中。
18. 根據權利要求1所述的方法,其中所述上遊同源臂和所述下遊同源臂的總和是至 少 10kb。
19. 根據權利要求1所述的方法,其中所述插入核酸的長度範圍為約5kb至300kb。
20. 根據權利要求1所述的方法,其中所述插入核酸包含選擇性表達盒。
21. 根據權利要求1所述的方法,其中所述插入核酸包含報告基因。
22. 根據權利要求1所述的方法,其中將所述插入核酸整合進入所述基因組的靶基因 座使得在所述基因組的靶基因座缺失內源性基因。
23. 根據權利要求1所述的方法,其中將所述插入核酸整合進入所述基因組的靶基因 座使得在所述基因組的靶基因座加入外源性序列。
24. 根據權利要求1所述的方法,其中將所述插入核酸整合進入所述基因組的靶基因 座導致敲除、敲入、點突變、結構域交換、外顯子交換、內含子交換、調節序列交換、基因交換 或其組合。
25. 根據權利要求1所述的方法,其中所述插入核酸包含人源核酸序列。
26. 根據權利要求25所述的方法,其中所述插入核酸包含與免疫球蛋白重鏈恆定區核 酸序列可操作地連接的未經重排的人源免疫球蛋白重鏈可變區核酸序列。
27. 根據權利要求26所述的方法,其中所述免疫球蛋白重鏈恆定區序列是小鼠免疫球 蛋白重鏈恆定區序列、人源免疫球蛋白重鏈恆定區序列或其組合。
28. 根據權利要求26所述的方法,其中所述免疫球蛋白重鏈恆定區核酸序列選自CH1、 鉸鏈、CH2、CH3及其組合。
29. 根據權利要求1所述的方法,其中所述插入核酸包含與小鼠或人源免疫球蛋白輕 鏈恆定區核酸序列可操作地連接的未經重排的人源A或k輕鏈可變區核酸序列,所述小 鼠或人源免疫球蛋白輕鏈恆定區核酸序列選自A輕鏈恆定區核酸序列和K輕鏈恆定區核 酸序列。
30. 根據權利要求1所述的方法,其中所述插入核酸包含與小鼠或人源免疫球蛋白輕 鏈恆定區核酸序列可操作地連接的重排的人源A或k輕鏈可變區核酸序列,所述小鼠或 人源免疫球蛋白輕鏈恆定區核酸序列選自A輕鏈恆定區核酸序列和k輕鏈恆定區核酸序 列。
31. 根據權利要求1所述的方法,其中選擇步驟(b)通過等位基因修飾(MOA)檢測實 施。
32. 根據權利要求1所述的方法,其中所述插入核酸包含與在所述哺乳動物細胞基因 組中的所述核酸序列具有同源性的核酸序列。
33. 根據權利要求1所述的方法,其中所述插入核酸包含與在所述哺乳動物細胞基因 組中的所述核酸序列具有直系同源性的核酸序列。
34. 根據權利要求1所述的方法,其中所述插入核酸包含來自不同物種的核酸序列。
35. 根據權利要求1所述的方法,其中所述經靶向的哺乳動物細胞在其基因組中包含 範圍為約5kb至約300kb的插入核酸。
36. -種通過在原核細胞中的細菌同源重組(BHR)修飾哺乳動物基因組的靶基因座的 方法,所述方法包括: (a) 引入包含哺乳動物基因組的靶基因座的原核細胞: (i) 靶向載體,所述靶向載體包含翼側為第一上遊同源臂和第一下遊同源臂的插入核 酸,和 (ii) 核酸酶試劑,所述核酸酶試劑在所述基因組的靶基因座或其附近產生單鏈或雙鏈 斷裂,和 (b) 選擇經靶向的原核細胞,所述原核細胞包含所述插入核酸,其中所述基因組的靶基 因座存在於大靶向載體(LTVEC)中,所述大靶向載體包含第二上遊同源臂和第二下遊同源 臂,並且 其中所述原核細胞能夠表達介導所述BHR的重組酶。
37. 根據權利要求36所述的方法,其中所述哺乳動物是人。
38. 根據權利要求36所述的方法,其中所述哺乳動物是齧齒動物。
39. 根據權利要求38所述的方法,其中所述齧齒動物是小鼠、大鼠或倉鼠。
40. 根據權利要求36所述的方法,其中與單獨使用靶向載體相比,將所述靶向載體與 所述核酸酶試劑聯合使用使得靶向效率增加。
41. 根據權利要求40所述的方法,其中與單獨使用靶向載體相比,所述靶向效率增加 至少2倍。
42. 根據權利要求36所述的方法,其中所述原核細胞是具有重組能力的大腸桿菌菌 株。
43. 根據權利要求36所述的方法,其中所述原核細胞包含編碼所述重組酶的核酸。
44. 根據權利要求36所述的方法,其中所述原核細胞不包含編碼所述重組酶的核酸, 並且編碼所述重組酶的核酸被引入所述原核細胞中。
45. 根據權利要求36所述的方法,其中所述核酸酶試劑是表達構建體,所述表達構建 體包含編碼核酸酶的核酸序列,並且其中所述核酸與在原核細胞中具有活性的啟動子可操 作地連接。
46. 根據權利要求36所述的方法,其中所述核酸酶試劑是編碼核酸酶的mRNA。
47. 根據權利要求45所述的方法,其中所述核酸酶是鋅指核酸酶(ZFN)。
48. 根據權利要求45所述的方法,其中所述核酸酶是轉錄激活因子樣效應物核酸酶 (TALEN)。
49. 根據權利要求45所述的方法,其中所述核酸酶是大範圍核酸酶。
50. 根據權利要求36所述的方法,其中所述核酸酶試劑的靶序列位於所述基因組的靶 基因座的內含子、外顯子、啟動子、啟動子調節區或增強子區中。
51. 根據權利要求36所述的方法,其中所述第二上遊同源臂和所述第二下遊同源臂的 總和是至少l〇kb。
52. 根據權利要求36所述的方法,所述插入核酸的長度範圍為約5kb至300kb。
53. 根據權利要求36所述的方法,所述插入核酸包含選擇性表達盒。
54. 根據權利要求36所述的方法,所述插入核酸包含報告基因。
55. 根據權利要求36所述的方法,將所述插入核酸整合進入所述基因組的靶基因座使 得在所述靶基因組的基因座缺失內源性基因。
56. 根據權利要求36所述的方法,其中將所述插入核酸整合進入所述基因組的靶基因 座使得在所述靶基因組的基因座加入外源性序列。
57. 根據權利要求36所述的方法,其中將所述插入核酸整合進入所述靶基因組的基因 座導致敲除、敲入、點突變、結構域交換、外顯子交換、內含子交換、調節序列交換、基因交換 或其組合。
58. 根據權利要求36所述的方法,其中所述插入核酸是人源核酸序列。
59. 根據權利要求58所述的方法,其中所述插入核酸包含與免疫球蛋白重鏈恆定區核 酸序列可操作地連接的未經重排的人源免疫球蛋白重鏈可變區核酸序列。
60. 根據權利要求59所述的方法,其中所述免疫球蛋白重鏈恆定區序列是小鼠免疫球 蛋白重鏈恆定區序列、人源免疫球蛋白重鏈恆定區序列或其組合。
61. 根據權利要求59所述的方法,其中所述免疫球蛋白重鏈恆定區核酸序列選自CH1、 鉸鏈、CH2、CH3及其組合。
62. 根據權利要求36所述的方法,其中所述插入核酸包含與小鼠或人源免疫球蛋白輕 鏈恆定區核酸序列可操作地連接的未經重排的人源A或k輕鏈可變區核酸序列,所述小 鼠或人源免疫球蛋白輕鏈恆定區核酸序列選自A輕鏈恆定區核酸序列和k輕鏈恆定區核 酸序列。
63. 根據權利要求36所述的方法,其中所述插入核酸包含與小鼠或人源免疫球蛋白輕 鏈恆定區核酸序列可操作地連接的重排的人源A或k輕鏈可變區核酸序列,所述小鼠或 人源免疫球蛋白輕鏈恆定區核酸序列選自A輕鏈恆定區核酸序列和k輕鏈恆定區核酸序 列。
64. 根據權利要求36所述的方法,其中選擇步驟(b)通過等位基因修飾(MOA)檢測實 施。
【文檔編號】C07K14/715GK104364380SQ201380030738
【公開日】2015年2月18日 申請日期:2013年4月25日 優先權日:2012年4月25日
【發明者】D·弗倫德維, W·奧爾巴克, D·M·瓦倫澤拉, G·D·揚科普洛斯, K·V·萊 申請人:瑞澤恩製藥公司