一種具有高催化活性的Ppmar1轉座酶V376A突變體及其應用的製作方法
2023-08-12 11:40:26 1
本發明屬於生物技術領域,具體涉及一種具有高催化活性的Ppmar1轉座酶V376A突變體及其應用。
背景技術:
轉座子(transposon)是指在基因組上能從一個位點轉移到另一個位點的一段DNA序列。自20世紀40年代美國遺傳學家McClintock首先在玉米中發現轉座子(Ac/Ds)以來,科學家們發現了多種類型的轉座子,它們廣泛存在於細菌、酵母和高等動植物中。隨著人們在分子水平上對轉座子結構和功能認識的不斷深化,一些轉座子已被改造為基因標籤應用於基因分析,並逐漸成為大規模分離基因的重要手段之一。
Mariner-Like轉座子(Mariner-Like Elements,MLE)是轉座子中一個重要家族,最早是在研究茅利塔尼亞果蠅(Drosophila mauristiana)白眼基因的一個不穩定突變時發現的。此後在其他動物以及植物基因組中也發現了大量MLE轉座子的存在。與其它轉座子相比較,MLE轉座子具有結構簡單、異源轉座率高、在基因組插入位點接近隨機等特點,在開發基因標籤,分離基因,研究基因功能上,遠遠優於其他轉座子。
MLE轉座子由兩端反向重複序列(Terminal Inverted Repeats,TIRs)和編碼轉座酶的基因組成,轉座酶負責催化轉座子轉座,因此轉座酶的活性是影響轉座子的轉座頻率的主要因素。然而自然界分離的MLE轉座酶由於在進化過程中「垂直失活」效應積累了或多或少的突變,部分或全部喪失了催化轉座能力,成為低活性或非活性的轉座酶,嚴重影響了MLE轉座子的應用,因此人工構建高活性的轉座酶就顯得十分重要。
技術實現要素:
本發明的目的是提供一種具有高催化活性的Ppmar1轉座酶V376A突變體及其應用,解決了現有自然界分離的MLE轉座酶催化活性較低或者不具備催化活性的問題。
本發明提供了一種具有高催化活性的Ppmar1轉座酶V376A突變體,所述的Ppmar1轉座酶V376A突變體的胺基酸序列如SEQ ID NO.1所示。
本發明還提供了一種編碼所述Ppmar1轉座酶V376A突變體的基因,編碼所述Ppmar1轉座酶V376A突變體的基因的核苷酸序列如SEQ ID NO.2所示。
本發明還提供了一種重組質粒,所述重組質粒攜帶有編碼所述Ppmar1轉座酶V376A突變體的基因。
本發明還提供了一種工程菌株,所述工程菌株攜帶有上述重組質粒。
本發明還提供了一種具有高催化活性的Ppmar1轉座酶V376A突變體在構建酵母突變體中的應用。
與現有技術相比,本發明提供的一種具有高催化活性的Ppmar1轉座酶V376A突變體,具有以下有益效果:
本發明從毛竹中克隆到的活性轉座酶,對其進行人工改造之後獲得較高活性的MLE轉座酶突變體(Ppmar1轉座酶V376A突變體),Ppmar1轉座酶V376A突變體催化轉座子轉座的活性是野生型轉座酶的活性的2.59倍,為利用MLE轉座子開發基因標籤奠定了基礎,為後基因組時代大規模分離和標記基因,研究基因的功能提供了新工具。
具體實施方式
下面結合具體實施方式對本發明進行詳細說明,但應當理解本發明的保護範圍並不受具體實施方式的限制。下列實施例中未註明具體條件的試驗方法,通常按照常規條件操作,如Sambrook等主編的《分子克隆實驗指南》中所述條件,或按照試劑盒陳述的步驟進行操作,由於不涉及發明點,故不對其步驟進行詳細描述。
當實施例給出數值範圍時,應理解,除非本發明另有說明,每個數值範圍的兩個端點以及兩個端點之間任何一個數值均可選用。除非另外定義,本發明中使用的所有技術和科學術語與本技術領域技術人員通常理解的意義相同。除實施例中使用的具體方法、設備、材料外,根據本技術領域的技術人員對現有技術的掌握及本發明的記載,還可以使用與本發明實施例中所述的方法、設備、材料相似或等同的現有技術的任何方法、設備和材料來實現本發明。
一、野生型MLE轉座酶和去除轉座酶的非自主性轉座子的獲得
步驟1.1,採集新鮮的毛竹葉片(Phyllostachys pubescens,採集於浙江農林大學植物園,北緯N30°15′14.67″東經E119°43′33.47″),利用CTAB法提取毛竹基因組DNA,根據MLE轉座子TIR保守序列設計引物Ppmar1-5-3(Ppmar1-5-3的序列信息見表1),進行PCR擴增,得到MLE轉座子擴增產物。
PCR擴增的體系為20μl,包括0.2μl rTaq Polymerase(5U/μl),1μl Ppmar1-5-3(10μmol/L),2μl 10×rTaq Buffer(Mg2+plus),1.6μl dNTP mix(2.5mmol/L),100ng毛竹基因組DNA,加無菌水補齊20μl。
PCR擴增的反應條件為:預變性94℃5min;變性94℃30s,60℃30s,延伸72℃40s,35個循環;72℃2min,4℃10min。
步驟1.2,擴增出序列後,採用TaKaRa公司pMDTM18-T Vector Cloning Kit試劑盒的方法將步驟1.1的MLE轉座子擴增產物連接到pMD18-T載體,測序確認後,命名為Ppmar1轉座子,Ppmar1轉座子全長序列如SEQ ID NO.3所示。
步驟1.3,採用QIAGEN公司的RNeasy Mini Kit試劑盒提取毛竹葉片RNA,通過Invitrogen公司的SuperScriptTMVILOTMcDNA Synthesis Kit試劑盒將RNA反轉錄為cDNA,根據Ppmar1轉座酶序列設計一對引物PpTpase1-5和PpTpase1-3(PpTpase1-5和PpTpase1-3的序列信息見表1),進行PCR擴增,回收得到Ppmar1轉座酶擴增產物,即為Ppmar1轉座酶核苷酸序列。
PCR擴增的體系為20μl,包括0.2μl rTaq Polymerase(5U/μl),0.5μl PpTpase1-5(10μmol/L),0.5μl PpTpase1-3(10μmol/L),2μl 10×rTaq Buffer(Mg2+plus),1.6μl dNTP mix(2.5mmol/L),10ng毛竹葉片cDNA,加無菌水補齊20μl。
PCR擴增的反應條件為:預變性94℃5min;變性94℃30s,55℃30s,延伸72℃40s,35個循環;72℃2min,4℃10min。
步驟1.4,採用TaKaRa公司pMDTM18-T Vector Cloning Kit試劑盒的方法將步驟1.3的Ppmar1轉座酶核苷酸序列連接到pMD18-T載體克隆,測序確認,Ppmar1轉座酶核苷酸序列和相應的胺基酸序列分別如SEQ ID NO.4和SEQ ID NO.5所示。
將含有Ppmar1轉座子全長序列的pMD18-T載體用BseR I切除Ppmar1中間轉座酶的大部分序列。
酶切體系為50μl,包括5μl 10×buffer,1μl BseR I(1U/μl),1μg質粒(含有Ppmar1全長序列的pMD18-T載體),加無菌水補齊50μl,37℃溫浴6小時。回收質粒大片段,用T4DNA Ligase將質粒大片段自連接,得到Ppmar1的非自主性轉座子pMD18-T-Ppmar1-Tn(Tn表示非自主性轉座子)。
其中,自連接的體系為10μl,包括1μl 10×T4DNA Ligase buffer,1μl T4DNA Ligase(10U/μl),50ng質粒大片段,加無菌水補齊10μl,16℃溫浴8小時。
Ppmar1的非自主性轉座子的序列如SEQ ID NO.6所示。
二、酵母轉座表達載體的構建
步驟2.1,Ppmar1轉座酶表達載體的構建
將步驟1.3的Ppmar1轉座酶核苷酸序列經Not I和EcoR V雙酶切,回收Ppmar1轉座酶酶切產物的大片段;將pAG413-gal-ccdB載體經Not I和EcoR V雙酶切,回收pAG413-gal-ccdB載體酶切產物的大片段;且Ppmar1轉座酶核苷酸序列的雙酶切體系、雙酶切條件與pAG413-gal-ccdB載體的雙酶切體系、雙酶切條件均相同;
其中雙酶切體系為50μl,包括5μl 10×buffer,1μl Not I(1U/μl),1μl EcoR(1U/μl),1μg質粒(Ppmar1轉座酶核苷酸序列或者pAG413-gal-ccdB載體),加無菌水補齊50μl,雙酶切條件為:37℃溫浴6小時。
將Ppmar1轉座酶酶切產物的大片段和pAG413-gal-ccdB載體酶切產物的大片段相連接;
連接體系為10μl,包括1μl 10×T4DNA Ligase buffer,1μl T4DNA Ligase(10U/μl),50ng pAG413-gal-ccdB載體酶切產物的大片段,20ng Ppmar1轉座酶酶切產物的大片段,加無菌水補齊10μl,16℃溫浴8小時。
此時完成了用Ppmar1轉座酶核苷酸序列替換pAG413-gal-ccdB質粒中的ccdB核苷酸序列,得到重組質粒pAG413-gal-Tpase(Tpase表示轉座酶);
該重組質粒pAG413-gal-Tpase即為Ppmar1轉座酶表達載體,其攜帶有編碼所述Ppmar1轉座酶的基因。該表達載體具有His(組氨酸)篩選標記,使導入pAG413-gal-Tpase載體的宿主能夠缺乏His的缺失培養基上生長。
步驟2.2,Ppmar1非自主轉座子供體載體的構建
以步驟1.4的Ppmar1的非自主性轉座子pMD18-T-Ppmar1-Tn為模板,利用Ppmar1-5-3引物擴增Ppmar1的非自主性轉座子,進行PCR擴增,得到Ppmar1的非自主性轉座子擴增產物。
PCR擴增的體系為20μl,包括0.2μl rTaq Polymerase(5U/μl),1μl Ppmar1-5-3(10μmol/L),2μl 10×rTaq Buffer(Mg2+plus),1.6μl dNTP mix(2.5mmol/L),10ng pMD18-T-Ppmar1-Tn,加無菌水補齊20μl。
PCR擴增的反應條件為:預變性94℃5min;變性94℃30s,60℃30s,延伸72℃40s,35個循環;72℃2min,4℃10min。
同時,將載體pWL89a用Xho Ⅰ酶切(酶切位點位於ADE2基因內),回收載體pWL89a骨架。酶切體系為50μl,包括5μl 10×buffer,1μl Xho Ⅰ(1U/μl),1μg載體pWL89a,加無菌水補齊50μl,37℃溫浴6小時。
然後用In-Fusion Advantage PCR Cloning Kit(TaKaRa公司,日本)將Ppmar1的非自主性轉座子擴增產物插入到載體pWL89a骨架的ADE2基因中,導致報告基因ADE2插入失活,得到pWL89a-Tn重組質粒,即為Ppmar1非自主轉座子供體載體。若轉座子發生轉座從ADE2基因上離開,那麼ADE2基因閱讀框得到回覆。該載體具有URA3篩選標記,使導入pWL89a-Tn的宿主能夠在缺乏Ura(尿素)的缺失培養基上生長。
三、Ppmar1轉座酶V376A突變體的獲得
將Ppmar1轉座酶核苷酸序列與其他植物MLE轉座酶的核苷酸序列進行同源性比對,選取Ppmar1轉座酶核苷酸序列376位置上的纈氨酸開展突變,計劃將其突變為丙氨酸(V376A)。
步驟3.1,根據QuikChangeTMSite-Directed Mutagenesis Kit(Stratagene公司,美國)試劑盒說明書,設計定點突變引物V376A-F和V376A-R(V376A-F和V376A-R的序列信息見表1),按照QuikChangeTMSite-Directed Mutagenesis Kit試劑盒方法,以步驟2.1的重組質粒pAG413-gal-Tpase為模板,利用PfuTurboTM DNA polymerase重新合成含有Ppmar1轉座酶V376A突變體的質粒DNA;
步驟3.2,然後在合成的質粒DNA中加入2μL的Dpn I限制性內切酶,於37℃條件下反應5min,將原始模板序列徹底降解。將新合成的質粒DNA測序確認後得到Ppmar1轉座酶V376A突變體;
Ppmar1轉座酶V376A突變體的胺基酸序列如SEQ ID NO.1所示,編碼所述Ppmar1轉座酶V376A突變體的基因的核苷酸序列如SEQ ID NO.2所示。
四、轉座酶活性的檢測
實驗組是將步驟3.1的含有Ppmar1轉座酶V376A突變體的質粒DNA和步驟2.2的pWL89a-Tn重組質粒,用PEG/LiAc法共同轉化到酵母中,用His/Ura雙缺固體培養基上進行選擇培養。用半乳糖誘導轉座酶表達,促使非自主轉座子發生轉座。
以野生型Ppmar1轉座酶為對照組,步驟2.1的帶有野生型的Ppmar1轉座酶的重組質粒pAG413-gal-Tpase和步驟2.2的pWL89a-Tn重組質粒,用PEG/LiAc法共同轉化到酵母中,用His/Ura雙缺固體培養基上進行選擇培養。用半乳糖誘導轉座酶表達,促使非自主轉座子發生轉座。
實驗組和對照組的經誘導培養的酵母用缺失His/Ura/Ade固體培養基上進行選擇培養,計算培養基上長出的酵母菌斑。如果轉座發生,pWL89a-Tn重組質粒上的ADE2基因就能表達,因此陽性酵母株能夠在缺乏腺嘌呤的培養基上生長。
以野生型Ppmar1轉座酶為對照,比較轉化有Ppmar1轉座酶V376A突變體的酵母菌落數目,篩選出較高活性的轉座酶突變株,結果如表2所示。
由表2可知,野生型Ppmar1轉座酶的陽性酵母菌落數量明顯小於Ppmar1轉座酶V376A突變體,且Ppmar1轉座酶V376A突變體催化轉座能力提高到原來的259%。這個高活性人工改造的Ppmar1轉座酶V376A突變體將為利用Ppmar1轉座子開發基因標籤奠定了重要基礎。
表1本發明應用的引物序列
表2不同轉座酶誘導的陽性酵母菌落數量和催化活性
儘管已描述了本發明的優選實施例,但本領域內的技術人員一旦得知了基本創造性概念,則可對這些實施例作出另外的變更和修改。所以,所附權利要求意欲解釋為包括優選實施例以及落入本發明範圍的所有變更和修改。
顯然,本領域的技術人員可以對本發明進行各種改動和變型而不脫離本發明的精神和範圍。這樣,倘若本發明的這些修改和變型屬於本發明權利要求及其等同技術的範圍之內,則本發明也意圖包含這些改動和變型在內。
序列表
浙江農林大學
一種具有高催化活性的Ppmar1轉座酶V376A突變體及其應用
6
PatentIn version 3.3
1
499
PRT
人工序列
1
Met Ala Asp Pro Ile Asp Ser Gly Phe Asp Leu Asn Val Arg Leu Glu
1 5 10 15
Glu Asp Asp Asp Gly Asn Leu Pro Phe Asp Leu Asn Glu Pro Ile Leu
20 25 30
Glu Asp His Asn Asn Gly Ile Asp Leu Asn Leu Pro Leu Asp Glu Phe
35 40 45
Gly Ala Val Asp Phe Asp Tyr Val Gln Asn Leu Ala Glu Gln Asp Val
50 55 60
Glu Ala Pro Val Gln Val His Pro Pro Lys His Asp Tyr Pro Glu His
65 70 75 80
Val Arg Lys Leu Val Tyr Gln Ala Leu Leu Met Arg Ser Lys Asn Gly
85 90 95
Lys Leu Gly Asn His Asp Thr Thr Ile Val Ser Ser Gln Phe Gly Val
100 105 110
Lys Ile Arg Ser Val Gln Arg Ile Trp Lys Gln Gly Lys Asn Gln Leu
115 120 125
Ala Gln Asn Ile Pro Val Val Val Ala Asn Leu Lys Lys Gly Arg Ser
130 135 140
Gly Arg Lys Ala Thr Pro Leu Asp Leu Glu Gln Leu Arg Asn Ile Pro
145 150 155 160
Leu Lys Gln Arg Met Thr Ile Glu Asp Val Ser Ser Arg Leu Gly Ile
165 170 175
Ser Lys Ser Arg Ile Gln Arg Tyr Leu Lys Lys Gly Leu Leu Arg Arg
180 185 190
His Ser Ser Ser Ile Lys Pro Tyr Leu Thr Asp Ala Asn Lys Lys Thr
195 200 205
Arg Leu Lys Trp Cys Ile Asp Met Ile Glu Gln Gly Leu Val Asp Asp
210 215 220
Pro Lys Phe Arg Asp Leu Phe Asp Phe Val Phe Ile Asp Glu Lys Trp
225 230 235 240
Phe Asn Leu Ser Gln Lys Ser Glu Arg Tyr Tyr Leu Leu Pro Asp Glu
245 250 255
Asp Glu Pro His Arg Thr Cys Lys Asn Lys Asn Tyr Ile Pro Arg Ile
260 265 270
Met Phe Leu Cys Val Cys Ala Arg Pro Arg Phe Arg Asn Gly Glu Cys
275 280 285
Val Phe Asp Gly Lys Ile Gly Cys Phe Pro Leu Val Thr Phe Glu Gln
290 295 300
Ala Ile Arg Gly Ser Gln Asn Arg Leu Arg Gly Glu Gln Val Ile Lys
305 310 315 320
Pro Ile Gln Ser Ile Asn Arg Glu Val Ile Arg Asp Phe Met Ile Asn
325 330 335
Arg Val Leu Pro Ala Ile Arg Ala Lys Trp Pro Arg Glu Asp Val His
340 345 350
Lys Pro Ile Phe Ile Gln Gln Asp Asn Val Pro Ser His Leu Lys Val
355 360 365
Asp Asp Pro Gln Phe Arg Glu Ala Ala Lys Gln Asp Gly Phe Asp Ile
370 375 380
Arg Leu Ile Cys Gln Pro Pro Asn Ser Pro Asp Phe Asn Ile Leu Asp
385 390 395 400
Leu Gly Phe Phe Arg Ala Ile Gln Ala Ile Gln Tyr Lys Lys Asp Ala
405 410 415
Lys Thr Leu Lys Asp Leu Ile Pro Ala Val Gln Gln Ala Phe Leu Glu
420 425 430
Tyr Ser Pro Trp Lys Ala Asn Arg Ile Phe Val Thr Leu Gln Thr Val
435 440 445
Leu Lys Glu Ala Met Lys Ile Lys Gly Cys Asn Lys Ile Lys Ile Pro
450 455 460
His Ile Gln Lys Gln Arg Leu Glu Arg Glu Asp Arg Leu Pro Leu Gln
465 470 475 480
Ile Pro Cys Glu Ala Ser Leu Leu Ala Glu Ala Leu Ala Ser Leu Pro
485 490 495
Ala Ala Asn
2
1500
DNA
人工序列
2
atggctgacc caatagattc tggcttcgat ctgaacgttc ggttagaaga agatgatgac 60
ggcaatcttc cctttgatct caacgagcca atattggaag atcacaacaa tggaattgat 120
ttgaacttgc cattagatga gtttggtgcc gtcgacttcg actatgtaca aaacctcgct 180
gaacaagatg ttgaggctcc cgttcaagta caccctccga agcatgacta tcctgaacat 240
gttagaaaac tagtgtacca agcattgttg atgagaagca agaatgggaa actaggcaat 300
catgatacaa caattgtttc cagtcaattt ggagtaaaga ttcgatcagt tcagcgcata 360
tggaagcaag gtaaaaacca acttgctcaa aacattccgg tcgtggttgc taatctaaag 420
aaaggtagaa gtggccgtaa agcaacccct cttgatttgg aacaattgcg caacattcct 480
ctcaagcaaa gaatgaccat agaagatgtg tctagtagac ttggtattag caaatctagg 540
atacaaaggt atttgaaaaa gggtttgctt aggcgccact ctagtagcat aaaaccttac 600
ctcaccgatg ctaacaagaa gactaggttg aagtggtgca ttgacatgat tgagcaaggt 660
ttggttgatg atccaaagtt cagggatttg tttgactttg tgtttattga tgagaagtgg 720
ttctacctct ctcaaaaatc cgagagatac tacttgctac ccgacgaaga tgaaccacat 780
cgcacttgca agaacaagaa ttacatccct aggatcatgt ttttgtgtgt ttgtgctcgg 840
ccaagattta gaaatggaga atgtgtgttt gatggcaaaa taggttgttt tccactagtc 900
acttttgaac aagctattag aggaagccaa aaccgtcttc gtggagaaca agtaatcaag 960
ccaattcaat caattaatag ggaagtgata agagatttca tgataaatag agtgttgcct 1020
gcaattagag caaagtggcc aagagaagat gtacacaagc caattttcat acaacaagat 1080
aatgttccat ctcatttaaa ggtggatgat cctcagtttc gtgaggctgc taagcaagat 1140
gggtttgaca ttaggctcat atgtcaacca cccaattctc cagattttaa cattctagat 1200
ttgggttttt ttcgagctat tcaagcaatt caatacaaga aagatgctaa gacattgaaa 1260
gatctaattc cagcagtcca acaggcattt ttggagtact ctccatggaa agcaaatagg 1320
atatttgtga cactacaaac tgttttgaag gaagcaatga agataaaagg ttgcaacaaa 1380
atcaaaattc ctcacatcca gaaacaaaga cttgagagag aagataggct gccattgcaa 1440
atcccttgtg aagcttcctt gctagccgaa gcacttgcaa gccttcctgc agctaattag 1500
3
3435
DNA
毛竹基因組
3
tactccctcc atacccgaaa ttcctgacgt ttaggacatg attgtggtaa ccaaggagtg 60
attaattagg ggttagtttt ccatctttgc ccctaataaa tatggttacg ggtgctcttt 120
gtacgagaaa gtaaaccagc tcgactggct agcgcgcgga ggcctcagtc ctgtggtgcg 180
cgttcgatac ctcgcggacg caggtttttt tcttgttgct gtttattcat ttttgcatgg 240
cactgtttag gcaacgcacg tcgcgcgcgc ttagccgctg cgggcgttag ttttcgagtg 300
gatttgggcc tggcgcacgg aggaggttgc atggctgccc gaaaatttcg ttgcatgcac 360
tggattttca aaattttgtc ctcgcgctgt ggaggctcgt ttgaggccgc gttttttttc 420
atctggcgcg ctggaaggcc gacgtttgga gtgctcgttg cttgttctat ttaaacgcct 480
ggaaccttcc ttgttgtctt cctatgccgg actcctgtac tatggctgac ccaatagatt 540
ctggcttcga tctgaacgtt cggttagaag aagatgatga cggcaatctt ccctttgatc 600
tcaacgagcc aatattggaa gatcacaaca atggtaagca aaaacgtcaa attagtttct 660
cagtttctcg tttccttttt tctttactga gcttgtcgtt tcctttttcg ataggaattg 720
atttgaactt gccattagat gagtttggtg ctgtcgactt cgactatgta caaaacctcg 780
ctggtaagca tggctagtat tatgaattcg cttgtttttt tatttccttt tgctggaaca 840
tgccgtgaat aatagtatta tgaactcgct tgttttttat ttccttttac tagaacatgt 900
gcttgtttta ttcctatagc tagatcatga cgtcaatact ttttacgatg aatatgctcg 960
ttacagtata gctagaacat gccgtgacta catagtagta tgaatatgct tgttttattt 1020
ctataactat aacatgccgt gagtatattt agatcatgcc gtgagtacta agtactatta 1080
aaatgcttgt tttttatttc cttttgctag aacaagatgt tgaggctccc gttcaagtac 1140
accctccgaa gcatgactat cctgaacatg ttagaaaact agtgtaccaa gcattgttga 1200
tgagaagcaa gaatgggaaa ctaggcaatc atgatacaac aattgtttcc agtcaatttg 1260
gagtaaagat tcgatcagtt cagcgcatat ggaagcaagg taaaaaccaa cttgctcaaa 1320
acattccggt cgtggttgct aatctaaaga aaggtagaag tggccgtaaa gcaacccctc 1380
ttgatttgga acaattgcgc aacattcctc tcaagcaaag aatgaccata gaagatgtgt 1440
ctagtagact tggtattagc aaatctagga tacaaaggta tttgaaaaag ggtttgctta 1500
ggcgccactc tagtagcata aaaccttacc tcaccgatgc taacaagaag actaggttga 1560
agtggtgcat tgacatgatt gagcaaggtt tggttgatga tccaaagttc agggatttgt 1620
ttgactttgt gtttattgat gagaagtggt tctacctctc tcaaaaatcc gagagatact 1680
acttgctacc cgacgaagat gaaccacatc gcacttgcaa gaacaagaat tacatcccta 1740
ggatcatgtt tttgtgtgtt tgtgctcggc caagatttag aaatggagaa tgtgtgtttg 1800
atggcaaaat aggttgtttt ccactagtca cttttgaaca agctattaga ggaagccaaa 1860
accgtcttcg tggagaacaa gtaatcaagc caattcaatc aatcaatagg gaagtgataa 1920
gagatttcat gataaataga gtgttgcctg caattagagc aaagtggcca agagaagatg 1980
tacacaagcc aattttcata caacaagata atgctccatc tcatttaaag gtggatgatc 2040
ctcagttttg tgaggttgct aagcaagatg ggtttgacat taggctcata tgtcaaccac 2100
ccaattctcc agattttaac attctagatt tgggtttttt tcgagctatt caagcaattc 2160
aatacaagaa agatgctaag acattgaaag atctaattcc agcagtccaa caggtaaatg 2220
atcatccatt acagtgttta aattgatctt gaacaaataa tataatcact gatcttgaac 2280
atgttttgta ggcatttttg gagtactctc catggaaagc aaataggata tttgtgacac 2340
tacaaactgt tttgaaggaa gcaatgaaga taaaaggttg caacaaaatc aaaattcctc 2400
acatccagaa acaaagactt gagagagaag ataggctgcc attgcaaatc ccttgtgaag 2460
cttccttgct agccgaagca cttgcaagcc ttcctgcggc taattagaag atgcaagcat 2520
gttactcttt tgcagcagca agcatgtaag aagacgcgag catgttagta gcaaactatg 2580
aacaaactag tttatgcatg tagtagtatg ttagcttgtg caccttagtc atctcgtccc 2640
aaccgcttga taacatgctc aggaagaagt attgtgtcac catccatttc aagtttctcc 2700
acatcaggaa tgtagacctc acaatcaaac ttttccatgt catcgagcca cttcgctgtc 2760
atgtcgtagt cttcatgtaa aaggccacaa cgggcacaca tgcgagcttc gcggcgagct 2820
tggtagcagg cttctccgaa gacgccgccg gcgtggaacg taacacagcg aggacacaga 2880
gactcgacgg agtcgggatc gacggtgtcg ggcaccatct cgagggagtc tgcaaccatg 2940
tcgacggagt ccggcagctc ctcgacggag tccggcacca tgtcgacggt gtccggcagc 3000
tcctcgacgg agtctggcac ctcctgcggc gccatgtcca cggtgtccag cgacgctatg 3060
gagcccgacg agatgtcctg cacggcgacg tccagcgccg caacggactc cgtcgtttcc 3120
atctgatccg acgaggcatc gacgtcctgc gacgagcgtg gcggcgagag cacggcgagc 3180
gggcaggcga gcgggcaggc gagcgagcca ttcgcgcgag cgatgaatgc gagctgctgt 3240
accaggcgca cacacgcgca atcaatgcgg gcgagtaacg atgcgagcat gcgcggcgga 3300
agcgcaacag acgggcagca gcgcatggcc aggggcaaac gcgtgaaaag aagaccacgc 3360
gaggccacaa cgtcagcttt tgcgcaaacg ggcacttcgc ctagaacgtc aggaatttcg 3420
ggtatggagg gagta 3435
4
1500
DNA
人工序列
4
atggctgacc caatagattc tggcttcgat ctgaacgttc ggttagaaga agatgatgac 60
ggcaatcttc cctttgatct caacgagcca atattggaag atcacaacaa tggaattgat 120
ttgaacttgc cattagatga gtttggtgcc gtcgacttcg actatgtaca aaacctcgct 180
gaacaagatg ttgaggctcc cgttcaagta caccctccga agcatgacta tcctgaacat 240
gttagaaaac tagtgtacca agcattgttg atgagaagca agaatgggaa actaggcaat 300
catgatacaa caattgtttc cagtcaattt ggagtaaaga ttcgatcagt tcagcgcata 360
tggaagcaag gtaaaaacca acttgctcaa aacattccgg tcgtggttgc taatctaaag 420
aaaggtagaa gtggccgtaa agcaacccct cttgatttgg aacaattgcg caacattcct 480
ctcaagcaaa gaatgaccat agaagatgtg tctagtagac ttggtattag caaatctagg 540
atacaaaggt atttgaaaaa gggtttgctt aggcgccact ctagtagcat aaaaccttac 600
ctcaccgatg ctaacaagaa gactaggttg aagtggtgca ttgacatgat tgagcaaggt 660
ttggttgatg atccaaagtt cagggatttg tttgactttg tgtttattga tgagaagtgg 720
ttctacctct ctcaaaaatc cgagagatac tacttgctac ccgacgaaga tgaaccacat 780
cgcacttgca agaacaagaa ttacatccct aggatcatgt ttttgtgtgt ttgtgctcgg 840
ccaagattta gaaatggaga atgtgtgttt gatggcaaaa taggttgttt tccactagtc 900
acttttgaac aagctattag aggaagccaa aaccgtcttc gtggagaaca agtaatcaag 960
ccaattcaat caattaatag ggaagtgata agagatttca tgataaatag agtgttgcct 1020
gcaattagag caaagtggcc aagagaagat gtacacaagc caattttcat acaacaagat 1080
aatgttccat ctcatttaaa ggtggatgat cctcagtttc gtgaggttgc taagcaagat 1140
gggtttgaca ttaggctcat atgtcaacca cccaattctc cagattttaa cattctagat 1200
ttgggttttt ttcgagctat tcaagcaatt caatacaaga aagatgctaa gacattgaaa 1260
gatctaattc cagcagtcca acaggcattt ttggagtact ctccatggaa agcaaatagg 1320
atatttgtga cactacaaac tgttttgaag gaagcaatga agataaaagg ttgcaacaaa 1380
atcaaaattc ctcacatcca gaaacaaaga cttgagagag aagataggct gccattgcaa 1440
atcccttgtg aagcttcctt gctagccgaa gcacttgcaa gccttcctgc agctaattag 1500
5
499
PRT
人工序列
5
Met Ala Asp Pro Ile Asp Ser Gly Phe Asp Leu Asn Val Arg Leu Glu
1 5 10 15
Glu Asp Asp Asp Gly Asn Leu Pro Phe Asp Leu Asn Glu Pro Ile Leu
20 25 30
Glu Asp His Asn Asn Gly Ile Asp Leu Asn Leu Pro Leu Asp Glu Phe
35 40 45
Gly Ala Val Asp Phe Asp Tyr Val Gln Asn Leu Ala Glu Gln Asp Val
50 55 60
Glu Ala Pro Val Gln Val His Pro Pro Lys His Asp Tyr Pro Glu His
65 70 75 80
Val Arg Lys Leu Val Tyr Gln Ala Leu Leu Met Arg Ser Lys Asn Gly
85 90 95
Lys Leu Gly Asn His Asp Thr Thr Ile Val Ser Ser Gln Phe Gly Val
100 105 110
Lys Ile Arg Ser Val Gln Arg Ile Trp Lys Gln Gly Lys Asn Gln Leu
115 120 125
Ala Gln Asn Ile Pro Val Val Val Ala Asn Leu Lys Lys Gly Arg Ser
130 135 140
Gly Arg Lys Ala Thr Pro Leu Asp Leu Glu Gln Leu Arg Asn Ile Pro
145 150 155 160
Leu Lys Gln Arg Met Thr Ile Glu Asp Val Ser Ser Arg Leu Gly Ile
165 170 175
Ser Lys Ser Arg Ile Gln Arg Tyr Leu Lys Lys Gly Leu Leu Arg Arg
180 185 190
His Ser Ser Ser Ile Lys Pro Tyr Leu Thr Asp Ala Asn Lys Lys Thr
195 200 205
Arg Leu Lys Trp Cys Ile Asp Met Ile Glu Gln Gly Leu Val Asp Asp
210 215 220
Pro Lys Phe Arg Asp Leu Phe Asp Phe Val Phe Ile Asp Glu Lys Trp
225 230 235 240
Phe Tyr Leu Ser Gln Lys Ser Glu Arg Tyr Tyr Leu Leu Pro Asp Glu
245 250 255
Asp Glu Pro His Arg Thr Cys Lys Asn Lys Asn Tyr Ile Pro Arg Ile
260 265 270
Met Phe Leu Cys Val Cys Ala Arg Pro Arg Phe Arg Asn Gly Glu Cys
275 280 285
Val Phe Asp Gly Lys Ile Gly Cys Phe Pro Leu Val Thr Phe Glu Gln
290 295 300
Ala Ile Arg Gly Ser Gln Asn Arg Leu Arg Gly Glu Gln Val Ile Lys
305 310 315 320
Pro Ile Gln Ser Ile Asn Arg Glu Val Ile Arg Asp Phe Met Ile Asn
325 330 335
Arg Val Leu Pro Ala Ile Arg Ala Lys Trp Pro Arg Glu Asp Val His
340 345 350
Lys Pro Ile Phe Ile Gln Gln Asp Asn Val Pro Ser His Leu Lys Val
355 360 365
Asp Asp Pro Gln Phe Arg Glu Val Ala Lys Gln Asp Gly Phe Asp Ile
370 375 380
Arg Leu Ile Cys Gln Pro Pro Asn Ser Pro Asp Phe Asn Ile Leu Asp
385 390 395 400
Leu Gly Phe Phe Arg Ala Ile Gln Ala Ile Gln Tyr Lys Lys Asp Ala
405 410 415
Lys Thr Leu Lys Asp Leu Ile Pro Ala Val Gln Gln Ala Phe Leu Glu
420 425 430
Tyr Ser Pro Trp Lys Ala Asn Arg Ile Phe Val Thr Leu Gln Thr Val
435 440 445
Leu Lys Glu Ala Met Lys Ile Lys Gly Cys Asn Lys Ile Lys Ile Pro
450 455 460
His Ile Gln Lys Gln Arg Leu Glu Arg Glu Asp Arg Leu Pro Leu Gln
465 470 475 480
Ile Pro Cys Glu Ala Ser Leu Leu Ala Glu Ala Leu Ala Ser Leu Pro
485 490 495
Ala Ala Asn
6
779
DNA
人工序列
6
tactccctcc atacccgaaa ttcctgacgt ttaggacatg attgtggtaa ccaaggagtg 60
attaattagg ggttagtttt ccatctttgc ccctaataaa tatggttacg ggtgctcttt 120
gtacgagaaa gtaaaccagc tcgactggct agcgcgcgga ggcctcagtc ctgtggtgcg 180
cgttcgatac ctcgcggacg caggtttttt tcttgttgct gtttattcat ttttgcatgg 240
cactgtttag gcaacgcacg tcgcgcgcgc ttagccgctg cgggcgttag ttttcgagtg 300
gatttgggcc tggcgcacgg aggaggttgc atggctccgg cagctcctcg acggagtctg 360
gcacctcctg cggcgccatg tccacggtgt ccagcgacgc tatggagccc gacgagatgt 420
cctgcacggc gacgtccagc gccgcaacgg actccgtcgt ttccatctga tccgacgagg 480
catcgacgtc ctgcgacgag cgtggcggcg agagcacggc gagcgggcag gcgagcgggc 540
aggcgagcga gccattcgcg cgagcgatga atgcgagctg ctgtaccagg cgcacacacg 600
cgcaatcaat gcgggcgagt aacgatgcga gcatgcgcgg cggaagcgca acagacgggc 660
agcagcgcat ggccaggggc aaacgcgtga aaagaagacc acgcgaggcc acaacgtcag 720
cttttgcgca aacgggcact tcgcctagaa cgtcaggaat ttcgggtatg gagggagta 779