一對轉錄激活子樣效應因子核酸酶及其編碼基因與應用的製作方法
2023-05-20 12:26:36 3
專利名稱:一對轉錄激活子樣效應因子核酸酶及其編碼基因與應用的製作方法
技術領域:
本發明涉及基因工程領域,尤其涉及一對轉錄激活子樣效應因子核酸酶及其編碼基因與應用。
背景技術:
按照人類的意願對基因組進行定向靶向修飾一直是許多科學家的夢想。在內源的基因組上特異地刪除或加入我們需要的序列,一方面可以構建出各種動物模型用於生物學基礎研究和疾病機理研究,另一方面可以生產動物反應器用以廉價生產我們需要的又很難從其他途徑得到的生物組分。朊蛋白類疾病,也叫傳染性海綿狀腦病,是一類致命的傳染性中樞神經系統退行性疾病,主要包括發生在綿羊和山羊的羊搔癢病,發生在牛的牛海綿狀腦病(即狂牛症),以及發生在人的克雅氏病(CJD)、G綜合症、致死性家族失眠症(FFI)等。動物基因組編碼的朊蛋白(prpC,一種錨定在神經細胞、淋巴細胞和別的細胞外表面的膜糖蛋白)是一種與傳染性海綿狀腦病的發生直接相關的分子。雖然已有實驗證明缺失PrpC的小鼠不僅能夠正常發育和繁殖後代並且具有抵抗傳染性海綿狀腦病的能力,然而缺失PrpC的大型動物,尤其是那些在自然條件下可以自發感染該類疾病的大型動物,目前的研究距離實用性差距仍然很遠。2001年英國的科學家使用綿羊胎兒成纖維細胞基因打靶再通過體細胞克隆獲得了四隻Prnp+/-的羊羔,但其中三隻都在出生後死亡,存活最久的也僅僅在世12天。2004年Kuroiwa等使用胎牛成纖維細胞敲除了牛編碼PrP的基因。2006年,Golding MC等利用RNAi幹涉技術針對引起牛狂牛症和羊搔癢病的PRNP基因序列設計有效的siRNA,獲得一頭轉基因羊胎兒,對其檢測發現siRNA很好地抑制了體內PRNP基因的表達。我國科學家也致力於羊瘙癢症的研究,成國祥等獲得了 5隻成活的Prnp+/-山羊。此後,他們將Prnp+/-的成年山羊體細胞進行二次基因打靶,將獲得的Prnp-/-體細胞進行克隆,但僅僅獲得了孕73天的Prnp-/-山羊胎兒,未得到成活的轉基因羊。從中我們可以推測Prnp+/-山羊的繁育情況並不容樂觀,二次基因打靶加再次的體細胞克隆的難度遠遠大於Prnp+/-山羊的自然交配獲得純合體。目前為止,雖然國內外的科學家們付出了艱苦的努力,但仍未獲得Prnp-/-的成年羊。此外,綿羊和山羊雖然都可能得羊瘙癢症,但該病是主要發生於綿羊中的,而綿羊與山羊是同科而不同屬的動物,綿羊和山羊之間不能交配產羔,因此獲得PRNP基因敲除的綿羊是具有重要的科學和經濟價值的。但人們一直沒有找到簡單高效的方法對基因組進行基因組靶向修飾。傳統的基因打靶技術依賴於細胞內自然發生的同源染色體隨機交換,其打靶效率非常低,通常只有10_6-10_8,這種打靶方法只在小鼠中得到了廣泛了應用,而在其他模式動物及大型哺乳動物中都因效率太低而得不到廣泛應用。近年發展很快的序列特異的核酸酶可以用於精確的基因組靶向修飾。一般由序列特異的核酸酶由一個DNA識別結構域和一個非特異性核酸內切酶結構域構成。原理是首先由DNA識別域把核酸酶定位到需要編輯的基因組區域,然後非特異性核酸內切酶切斷雙鏈DNA從而造成DNA雙鏈斷裂(double-strand break,DSB),引入的DSB激活的DNA自我修復可以引起基因的突變和促進該位點DNA同源重組。鋅指核酸酶(Zinc-finger nucleases,ZFN)是現在研究最清楚也是應用最廣的序列特異的核酸酶。其原理是兩個鋅指蛋白特異識別兩段相隔5-7bp的DNA序列,並把與之融合表達的非特異性DNA切割蛋白Fokl的兩個單聚體定位到了一起,DNA切割蛋白形成雙聚體時可以切斷該位置的雙鏈DNA,從而造成DSB0 ZFN的出現使基因組靶向修飾技術向前邁進了一大步,然而,ZFN技術還存在靶向不確定性、效率低、拖把率高等問題,研究者很難自行設計出特異和高效的靶向基因組目的序列的鋅指核酸酶仍然是制約ZFN廣泛應用的瓶頸。而商業購買高效特異的鋅指核酸酶又價格昂貴(20萬人民幣/基因),一般研究者或商業公司根本無法承受這筆費用。2009年兩個研究組發現植物病原體Xanthomonas中的一種可以調節植物基因表達的轉錄激活子樣效應因子(transcription activator-like effector, TALE)表現出DNA結合特異性,而其識別密碼具有模塊化和簡單化的特點,為科學家們開發出更簡易的新型基因組祀向修飾技術帶來了新希望。TALE與Fokl融合後即形成轉錄激活子樣效應因子核酸酶(transcriptionactivator-like effector nucleases, TALEN)。TALEN 的打革E原理與 ZFN 相同,只是識別特異DNA的蛋白不同。TALEs由數十個特異性識別DNA的串聯「蛋白模塊」和兩側的N-末端及C-末端序列組成。每個「蛋白模塊」包含34個胺基酸,第12和13位殘基是靶向識別的關鍵位點,被稱作重複可變的di-residues (RVDs)位點。然而不同於每個鋅指蛋白識別特異性的三聯體鹼基,TALEs上的每個RVDs僅能識別一個鹼基。Sangamo BioSciences公司和哈佛大學的兩個研究小組分別利用TALEs技術進行了基因組靶向修飾相關研究,兩篇研究論文發表在同一期的《自然生物技術》(NatureBiotechnology)雜誌上。Edward Rebar領導的研究小組將帶有不同C-末端TALE的截短片段連接到核酸酶FokI的催化結構域上。當研究人員將構建的TALENs靶向內源性的人類NTF3和CCR5基因時,證實TALENs能夠特異性地對這些基因片段進行剪切。哈佛大學研究小組開發了一種基於分層連接的策略來構建包含12個重複模塊的TALEs。他們在保留RVDs的基礎上減少了每個模塊的DNA序列,同時將剩餘序列的重複性降到最低。進而通過12重PCR獲得了帶有特異性連接序列的單體,並將其克隆至包含TALE N-末端和C-末端序列的骨架載體中。為了構建TALE轉錄因子,研究人員又將TALE融合到一個轉錄因子的激活域。在接下來的靶向性檢測中,研究人員證實其能特異地使四個檢測內源基因中的兩個基因表達上調。今年7月MIT的Rudolf Jaenisch小組也驗證了 TALEN在人胚胎幹細胞和人iPSC中的打靶效果。其通過在五個位點的TALENs與之前其在相同位置的ZFNs的打靶效果作對t匕,得出五組TALENs在打靶效率和精確度上都與從Sangamo BioSciences公司購買的ZFNs相似,進一步驗證了 TALENs是非常好的基因組編輯工具。
發明內容
本發明提供了一對短肽,利用這對短肽構建獲得的一對轉錄激活子樣效應因子(TALE)能夠特異性地識別山羊或綿羊朊蛋白基因(PRNP)基因組上的二段相鄰核苷酸;利用這對轉錄激活子樣效應因子構建獲得的一對轉錄激活子樣效應因子核酸酶(TALEN),能夠對山羊或綿 羊朊蛋白基因進行準確、高效地打靶。一對短肽,所述一對短肽分別具有如SEQ ID NO. I和SEQ ID NO. 2所示的胺基酸序列。本發明提供了一對多核苷酸,所述一對多核苷酸分別編碼上述的一對短肽。優選地,所述一對多核苷酸分別具有如SEQ ID NO. 3和SEQ ID NO. 4所示的鹼基序列。其中,所述的多核苷酸由分別識別山羊或綿羊朊蛋白基因上核苷酸序列SEQ IDNO 17和SEQ ID NO 20中相應鹼基的TALENs識別模塊依序連接而成,其中,識別鹼基A的TALENs識別模塊為NI-A (如SEQ ID NO 22所示),識別鹼基T的TALENs識別模塊為NG-T (如SEQ ID NO 23所示),識別鹼基C的TALENs識別模塊為HD-C (如SEQ ID NO 24所示),識別鹼基G的TALENs識別模塊為NK-G (如SEQ ID NO 25所示)。本發明還提供了一對蛋白質,所述一對蛋白質由上述的一對短肽兩端分別加上轉錄激活子樣效應因子胺基酸序列框架的N端和C端組成;其中,所述的轉錄激活子樣效應因子胺基酸序列框架的N端和C端為天然的或經過人工改造的序列。這對蛋白質可以分別特異性地識別山羊或綿羊朊蛋白基因(PRNP)上的二段核苷酸序列,所述二段核苷酸序列分別選自以下二個核苷酸序列(I)SEQ ID N0:17序列或SEQ ID NO : 17序列的一個或二個核苷酸經過取代所衍生的核苷酸序列;(2) SEQ ID NO :20序列或SEQ ID NO :20序列的一個或二個核苷酸經過取代所衍
生的核苷酸序列。優選地,所述的這對蛋白質分別具有如SEQ ID NO. 5和SEQ ID NO. 6所示的胺基酸序列。該蛋白質為轉錄激活子樣效應因子,命名為PRNP-TALE-L614和PRNP-TALE-R629。本發明還提供了一對多核苷酸,所述一對多核苷酸分別編碼上述的一對蛋白質。優選地,所述一對多核苷酸分別具有如SEQ ID NO. 7和SEQ ID NO. 8所示的鹼基序列。本發明還提供了一對融合蛋白,所述一對融合蛋白由上述的一對蛋白質分別與DNA切割蛋白融合而成。優選地,所述的DNA切割蛋白為DNA內切酶。優選地,所述的一對蛋白質分別與DNA切割蛋白的二個亞基融合。更優選地,所述的DNA切割蛋白為天然的或經過人工改造的FoklDNA內切酶。最優選地,所述一對融合蛋白分別具有如SEQ ID NO. 9和SEQ ID NO. 10所示的胺基酸序列。該融合蛋白為轉錄激活子樣效應因子核酸酶,命名為PRNP-TALEN-L614和PRNP-TALEN-R629。本發明還提供了一對多核苷酸,所述一對多核苷酸分別編碼上述的一對融合蛋白質。優選地,所述一對多核苷酸分別具有如SEQ ID NO. 11和SEQ ID NO. 12所示的鹼
基序列。本發明還提供了一種包含上述一對多核苷酸中的任意一條多核苷酸的載體。
優選地,可以先將能特異性識別SEQ ID NO. 17或SEQ ID NO. 20所示鹼基序列的多核苷酸連接到中間載體pCMV-NLS-TALE backbone-Fokl (R) -intermediate上,再將該中間載體連接到最終載體PEF la-NLS-TALE backbone-Fokl (R) -pA或最終載體pEFla-NLS-TALE backbone-Fokl (L) -IRES-PURO-pA上,構建獲得包含編碼轉錄激活子樣效應因子核酸酶基因的質粒載體,能表達轉錄激活子樣效應因子核酸酶。本發明還提供了一種用上述載體轉化的宿主細胞。
優選地,所述宿主細胞為山羊或綿羊細胞;更優選地,所述宿主細胞為山羊或綿羊IPS細胞。本發明還提供了一種上述一對融合蛋白或上述一對多核苷酸在對山羊或綿羊朊蛋白基因靶向修飾中的應用。優選地,所述一對融合蛋白分別具有如SEQ ID NO. 9和SEQ ID NO. 10所示的胺基酸序列;所述一對多核苷酸分別具有如SEQ ID NO. 11和SEQ ID NO. 12所示的鹼基序列。本發明還提供了一種山羊或綿羊朊蛋白基因打靶的方法,包括將上述一對融合蛋白或者上述一對多核苷酸或者含有這對多核苷酸的載體轉入山羊或綿羊IPS細胞,於30-37°C擴增培養3-7天,得到朊蛋白基因被靶向修飾的細胞。優選地,所述一對融合蛋白分別具有如SEQ ID NO. 9和SEQ ID NO. 10所示的胺基酸序列;所述一對多核苷酸分別具有如SEQ ID NO. 11和SEQ ID NO. 12所示的鹼基序列。優選地,所述山羊或綿羊IPS細胞中還轉入有抗puro蛋白或能表達抗puro蛋白的質粒,便於篩選。優選地,所述擴增培養過程中至少有I天在30°C下進行,能獲得更好的打靶效果。本發明針對山羊或綿羊PRNP基因的一個位點設計了一對轉錄激活子樣效應因子核酸酶(PRNP-TALEN-L614和PRNP-TALEN-R629),這對TALENs分別由可以識別PRNP基因上一段核苷酸的DNA識別結構域與一個Fokl DNA內切酶的兩個異源亞基融合得到。將這對轉錄激活子樣效應因子核酸酶同時轉入宿主細胞時,其能對宿主細胞PRNP基因的位點打靶,並使打靶位點發生基因突變,包括鹼基缺失、鹼基插入等,從而實現對山羊或綿羊PRNP基因的靶向修飾,具有特異性強、打靶效率高、準確度高等優點。
圖I為人工設計的轉錄激活子樣效應因子核酸酶識別的DNA序列及位點;圖2為18個識別模塊連接策略示意圖;其中,A =PCR為每個識別模塊添加酶切識別序列和連接接頭過程示意圖;B =PCR為每個識別模塊添加酶切識別序列和連接接頭後示意圖;C =PCR擴增6模塊片段與中間載體示意圖;D :最終構建的TALEN質粒示意圖;圖3 為中間載體 pCMV-NLS-TALE backbone-Fokl (R)-intermediate 不意圖;圖4 為最終載體 pEF la-NLS-TALE backbone-Fokl (R)-pA 不意圖;圖5 為最終載體 pEF la-NLS-TALE backbone-Fokl (L)-IRES-PURO-pA 示意圖;圖6為PRNP基因在打靶位點的基因型變化;其中,-表示鹼基缺失。具體實施 方式以下實施例中所使用的技術,包括PCR擴增與檢測、細胞轉染等分子生物學技術,以及細胞培養、檢測技術等,除非特別說明,均為本領域內的技術人員已知的常規技術;所使用的儀器設備、試劑和細胞系等,除非是本說明書特別註明,均為一般本領域的研究和技術人員可以通過公共途徑獲得的。實施例I TALENs靶序列的設計I、從NCBI上下載山羊和綿羊PRNP基因組序列(綿羊Gene ID :493887,山羊PRNP基因序列與綿羊的相同)2、設計引物並PCR擴增基因組上打靶位點片段,並測序,其中,PCR引物及測序引物見表I ;表I
權利要求
1.一對短肽,其特徵在於,所述ー對短肽分別具有如SEQ ID NO. I和SEQ ID NO. 2所示的胺基酸序列。
2.—對多核苷酸,其特徵在於,所述ー對多核苷酸分別編碼如權利要求I所述的ー對短肽。
3.如權利要求2所述ー對多核苷酸,其特徵在於,所述ー對多核苷酸分別具有如SEQID NO. 3和SEQ ID NO. 4所示的鹼基序列。
4.ー對蛋白質,其特徵在於,所述ー對蛋白質由權利要求I所述的ー對短肽兩端分別加上轉錄激活子樣效應因子胺基酸序列框架的N端和C端組成;其中,所述的轉錄激活子樣效應因子胺基酸序列框架的N端和C端為天然的或經過人工改造的序列。
5.如權利要求4所述ー對蛋白質,其特徵在於,所述ー對蛋白質分別具有如SEQIDNO. 5和SEQ ID NO. 6所示的胺基酸序列。
6.—對多核苷酸,其特徵在於,所述ー對多核苷酸分別編碼如權利要求4或5所述的ー對蛋白質。
7.如權利要求6所述ー對多核苷酸,其特徵在於,所述ー對多核苷酸分別具有如SEQID NO. 7和SEQ ID NO. 8所示的鹼基序列。
8.ー對融合蛋白,其特徵在於,所述ー對融合蛋白由權利要求4所述的ー對蛋白質分別與DNA切割蛋白融合而成。
9.如權利要求8所述ー對融合蛋白,其特徵在於,所述的ー對蛋白質分別與DNA切割蛋白的ニ個亞基融合。
10.如權利要求9所述ー對融合蛋白,其特徵在於,所述的DNA切割蛋白為天然的或經過人工改造的FoklDNA內切酶。
11.如權利要求8-10任ー權利要求所述ー對融合蛋白,其特徵在於,所述ー對融合蛋白分別具有如SEQ ID NO. 9和SEQ ID NO. 10所示的胺基酸序列。
12.—對多核苷酸,其特徵在於,所述ー對多核苷酸分別編碼如權利要求8-10任ー權利要求所述的ー對融合蛋白。
13.—對多核苷酸,其特徵在於,所述ー對多核苷酸分別編碼如權利要求11所述的ー對融合蛋白。
14.如權利要求13所述的ー對多核苷酸,其特徵在於,所述ー對多核苷酸分別具有如SEQ ID NO. 11和SEQ ID NO. 12所示的鹼基序列。
15.—種包含權利要求2_3、6_7、13或14任一權利要求所述一對多核苷酸中的任意一條多核苷酸的載體。
16.一種用權利要求15所述載體轉化的宿主細胞。
17.—種包含權利要求12所述ー對多核苷酸中的任意一條多核苷酸的載體。
18.一種用權利要求17所述載體轉化的宿主細胞。
19.如權利要求16或18所述宿主細胞,其特徵在於,所述宿主細胞為山羊或綿羊IPS細胞。
20.一種如權利要求11所述ー對融合蛋白或如權利要求14所述ー對多核苷酸在對山羊或綿羊朊蛋白基因靶向修飾中的應用。
21.—種山羊或綿羊朊蛋白基因打靶的方法,其特徵在於,包括將權利要求11所述ー對融合蛋白或者權利要求13或14所述ー對多核苷酸或者含有權利要求13或14所述ー對多核苷酸的載體轉入山羊或綿羊IPS細胞,於30-37°C擴增培養3-7天,得到朊蛋白基因被靶向修飾的細胞。
22.如權利要求21所述的方法,其特徵在於,所述山羊或綿羊IPS細胞中還轉入有抗puro蛋白或能表達抗puro蛋白的質粒。
23.如權利要求21或22所述的方法,其特徵在於,所述擴增培養過程中至少有I天在30°C下進行。
全文摘要
本發明公開了一對轉錄激活子樣效應因子核酸酶及其編碼基因與應用。這對轉錄激活子樣效應因子核酸酶(TALEN)由一對DNA識別蛋白分別與Fok1 DNA內切酶的兩個異源亞基融合得到,可以特異性地識別山羊或綿羊朊蛋白基因(PRNP)exon2上的兩個相鄰位點。將這對轉錄激活子樣效應因子核酸酶同時轉入宿主細胞時,其能對宿主細胞PRNP基因的exon2位點打靶,並使打靶位點發生基因突變,從而實現對山羊或綿羊PRNP基因的靶向修飾,具有特異性強、打靶效率高、準確度高等優點。
文檔編號C12N15/85GK102627692SQ20121009777
公開日2012年8月8日 申請日期2012年4月5日 優先權日2012年4月5日
發明者莊慶剛, 肖磊 申請人:浙江大學