一種具有高催化活性的Ppmar1轉座酶V376A突變體及其應用的製作方法

2023-08-12 11:40:26 2

本發明屬於生物技術領域，具體涉及一種具有高催化活性的Ppmar1轉座酶V376A突變體及其應用。

背景技術：

轉座子(transposon)是指在基因組上能從一個位點轉移到另一個位點的一段DNA序列。自20世紀40年代美國遺傳學家McClintock首先在玉米中發現轉座子(Ac/Ds)以來，科學家們發現了多種類型的轉座子，它們廣泛存在於細菌、酵母和高等動植物中。隨著人們在分子水平上對轉座子結構和功能認識的不斷深化，一些轉座子已被改造為基因標籤應用於基因分析，並逐漸成為大規模分離基因的重要手段之一。

Mariner-Like轉座子(Mariner-Like Elements，MLE)是轉座子中一個重要家族，最早是在研究茅利塔尼亞果蠅(Drosophila mauristiana)白眼基因的一個不穩定突變時發現的。此後在其他動物以及植物基因組中也發現了大量MLE轉座子的存在。與其它轉座子相比較，MLE轉座子具有結構簡單、異源轉座率高、在基因組插入位點接近隨機等特點，在開發基因標籤，分離基因，研究基因功能上，遠遠優於其他轉座子。

MLE轉座子由兩端反向重複序列(Terminal Inverted Repeats，TIRs)和編碼轉座酶的基因組成，轉座酶負責催化轉座子轉座，因此轉座酶的活性是影響轉座子的轉座頻率的主要因素。然而自然界分離的MLE轉座酶由於在進化過程中「垂直失活」效應積累了或多或少的突變，部分或全部喪失了催化轉座能力，成為低活性或非活性的轉座酶，嚴重影響了MLE轉座子的應用，因此人工構建高活性的轉座酶就顯得十分重要。

技術實現要素：

本發明的目的是提供一種具有高催化活性的Ppmar1轉座酶V376A突變體及其應用，解決了現有自然界分離的MLE轉座酶催化活性較低或者不具備催化活性的問題。

本發明提供了一種具有高催化活性的Ppmar1轉座酶V376A突變體，所述的Ppmar1轉座酶V376A突變體的胺基酸序列如SEQ ID NO.1所示。

本發明還提供了一種編碼所述Ppmar1轉座酶V376A突變體的基因，編碼所述Ppmar1轉座酶V376A突變體的基因的核苷酸序列如SEQ ID NO.2所示。

本發明還提供了一種重組質粒，所述重組質粒攜帶有編碼所述Ppmar1轉座酶V376A突變體的基因。

本發明還提供了一種工程菌株，所述工程菌株攜帶有上述重組質粒。

本發明還提供了一種具有高催化活性的Ppmar1轉座酶V376A突變體在構建酵母突變體中的應用。

與現有技術相比，本發明提供的一種具有高催化活性的Ppmar1轉座酶V376A突變體，具有以下有益效果：

本發明從毛竹中克隆到的活性轉座酶，對其進行人工改造之後獲得較高活性的MLE轉座酶突變體(Ppmar1轉座酶V376A突變體)，Ppmar1轉座酶V376A突變體催化轉座子轉座的活性是野生型轉座酶的活性的2.59倍，為利用MLE轉座子開發基因標籤奠定了基礎，為後基因組時代大規模分離和標記基因，研究基因的功能提供了新工具。

具體實施方式

下面結合具體實施方式對本發明進行詳細說明，但應當理解本發明的保護範圍並不受具體實施方式的限制。下列實施例中未註明具體條件的試驗方法，通常按照常規條件操作，如Sambrook等主編的《分子克隆實驗指南》中所述條件，或按照試劑盒陳述的步驟進行操作，由於不涉及發明點，故不對其步驟進行詳細描述。

當實施例給出數值範圍時，應理解，除非本發明另有說明，每個數值範圍的兩個端點以及兩個端點之間任何一個數值均可選用。除非另外定義，本發明中使用的所有技術和科學術語與本技術領域技術人員通常理解的意義相同。除實施例中使用的具體方法、設備、材料外，根據本技術領域的技術人員對現有技術的掌握及本發明的記載，還可以使用與本發明實施例中所述的方法、設備、材料相似或等同的現有技術的任何方法、設備和材料來實現本發明。

一、野生型MLE轉座酶和去除轉座酶的非自主性轉座子的獲得

步驟1.1，採集新鮮的毛竹葉片(Phyllostachys pubescens，採集於浙江農林大學植物園，北緯N30°15′14.67″東經E119°43′33.47″)，利用CTAB法提取毛竹基因組DNA，根據MLE轉座子TIR保守序列設計引物Ppmar1-5-3(Ppmar1-5-3的序列信息見表1)，進行PCR擴增，得到MLE轉座子擴增產物。

PCR擴增的體系為20μl，包括0.2μl rTaq Polymerase(5U/μl)，1μl Ppmar1-5-3(10μmol/L)，2μl 10×rTaq Buffer(Mg2+plus)，1.6μl dNTP mix(2.5mmol/L)，100ng毛竹基因組DNA，加無菌水補齊20μl。

PCR擴增的反應條件為：預變性94℃5min；變性94℃30s，60℃30s，延伸72℃40s，35個循環；72℃2min，4℃10min。

步驟1.2，擴增出序列後，採用TaKaRa公司pMDTM18-T Vector Cloning Kit試劑盒的方法將步驟1.1的MLE轉座子擴增產物連接到pMD18-T載體，測序確認後，命名為Ppmar1轉座子，Ppmar1轉座子全長序列如SEQ ID NO.3所示。

步驟1.3，採用QIAGEN公司的RNeasy Mini Kit試劑盒提取毛竹葉片RNA，通過Invitrogen公司的SuperScriptTMVILOTMcDNA Synthesis Kit試劑盒將RNA反轉錄為cDNA，根據Ppmar1轉座酶序列設計一對引物PpTpase1-5和PpTpase1-3(PpTpase1-5和PpTpase1-3的序列信息見表1)，進行PCR擴增，回收得到Ppmar1轉座酶擴增產物，即為Ppmar1轉座酶核苷酸序列。

PCR擴增的體系為20μl，包括0.2μl rTaq Polymerase(5U/μl)，0.5μl PpTpase1-5(10μmol/L)，0.5μl PpTpase1-3(10μmol/L)，2μl 10×rTaq Buffer(Mg2+plus)，1.6μl dNTP mix(2.5mmol/L)，10ng毛竹葉片cDNA，加無菌水補齊20μl。

PCR擴增的反應條件為：預變性94℃5min；變性94℃30s，55℃30s，延伸72℃40s，35個循環；72℃2min，4℃10min。

步驟1.4，採用TaKaRa公司pMDTM18-T Vector Cloning Kit試劑盒的方法將步驟1.3的Ppmar1轉座酶核苷酸序列連接到pMD18-T載體克隆，測序確認，Ppmar1轉座酶核苷酸序列和相應的胺基酸序列分別如SEQ ID NO.4和SEQ ID NO.5所示。

將含有Ppmar1轉座子全長序列的pMD18-T載體用BseR I切除Ppmar1中間轉座酶的大部分序列。

酶切體系為50μl，包括5μl 10×buffer，1μl BseR I(1U/μl)，1μg質粒(含有Ppmar1全長序列的pMD18-T載體)，加無菌水補齊50μl，37℃溫浴6小時。回收質粒大片段，用T4DNA Ligase將質粒大片段自連接，得到Ppmar1的非自主性轉座子pMD18-T-Ppmar1-Tn(Tn表示非自主性轉座子)。

其中，自連接的體系為10μl，包括1μl 10×T4DNA Ligase buffer，1μl T4DNA Ligase(10U/μl),50ng質粒大片段，加無菌水補齊10μl，16℃溫浴8小時。

Ppmar1的非自主性轉座子的序列如SEQ ID NO.6所示。

二、酵母轉座表達載體的構建

步驟2.1，Ppmar1轉座酶表達載體的構建

將步驟1.3的Ppmar1轉座酶核苷酸序列經Not I和EcoR V雙酶切，回收Ppmar1轉座酶酶切產物的大片段；將pAG413-gal-ccdB載體經Not I和EcoR V雙酶切，回收pAG413-gal-ccdB載體酶切產物的大片段；且Ppmar1轉座酶核苷酸序列的雙酶切體系、雙酶切條件與pAG413-gal-ccdB載體的雙酶切體系、雙酶切條件均相同；

其中雙酶切體系為50μl，包括5μl 10×buffer，1μl Not I(1U/μl),1μl EcoR(1U/μl)，1μg質粒(Ppmar1轉座酶核苷酸序列或者pAG413-gal-ccdB載體)，加無菌水補齊50μl，雙酶切條件為：37℃溫浴6小時。

將Ppmar1轉座酶酶切產物的大片段和pAG413-gal-ccdB載體酶切產物的大片段相連接；

連接體系為10μl，包括1μl 10×T4DNA Ligase buffer，1μl T4DNA Ligase(10U/μl),50ng pAG413-gal-ccdB載體酶切產物的大片段，20ng Ppmar1轉座酶酶切產物的大片段，加無菌水補齊10μl，16℃溫浴8小時。

此時完成了用Ppmar1轉座酶核苷酸序列替換pAG413-gal-ccdB質粒中的ccdB核苷酸序列，得到重組質粒pAG413-gal-Tpase(Tpase表示轉座酶)；

該重組質粒pAG413-gal-Tpase即為Ppmar1轉座酶表達載體，其攜帶有編碼所述Ppmar1轉座酶的基因。該表達載體具有His(組氨酸)篩選標記，使導入pAG413-gal-Tpase載體的宿主能夠缺乏His的缺失培養基上生長。

步驟2.2，Ppmar1非自主轉座子供體載體的構建

以步驟1.4的Ppmar1的非自主性轉座子pMD18-T-Ppmar1-Tn為模板，利用Ppmar1-5-3引物擴增Ppmar1的非自主性轉座子，進行PCR擴增，得到Ppmar1的非自主性轉座子擴增產物。

PCR擴增的體系為20μl，包括0.2μl rTaq Polymerase(5U/μl)，1μl Ppmar1-5-3(10μmol/L)，2μl 10×rTaq Buffer(Mg2+plus)，1.6μl dNTP mix(2.5mmol/L)，10ng pMD18-T-Ppmar1-Tn，加無菌水補齊20μl。

PCR擴增的反應條件為:預變性94℃5min；變性94℃30s，60℃30s，延伸72℃40s，35個循環；72℃2min，4℃10min。

同時，將載體pWL89a用Xho Ⅰ酶切(酶切位點位於ADE2基因內)，回收載體pWL89a骨架。酶切體系為50μl，包括5μl 10×buffer，1μl Xho Ⅰ(1U/μl),1μg載體pWL89a，加無菌水補齊50μl，37℃溫浴6小時。

然後用In-Fusion Advantage PCR Cloning Kit(TaKaRa公司，日本)將Ppmar1的非自主性轉座子擴增產物插入到載體pWL89a骨架的ADE2基因中，導致報告基因ADE2插入失活，得到pWL89a-Tn重組質粒，即為Ppmar1非自主轉座子供體載體。若轉座子發生轉座從ADE2基因上離開，那麼ADE2基因閱讀框得到回覆。該載體具有URA3篩選標記，使導入pWL89a-Tn的宿主能夠在缺乏Ura(尿素)的缺失培養基上生長。

三、Ppmar1轉座酶V376A突變體的獲得

將Ppmar1轉座酶核苷酸序列與其他植物MLE轉座酶的核苷酸序列進行同源性比對，選取Ppmar1轉座酶核苷酸序列376位置上的纈氨酸開展突變，計劃將其突變為丙氨酸(V376A)。

步驟3.1，根據QuikChangeTMSite-Directed Mutagenesis Kit(Stratagene公司，美國)試劑盒說明書，設計定點突變引物V376A-F和V376A-R(V376A-F和V376A-R的序列信息見表1)，按照QuikChangeTMSite-Directed Mutagenesis Kit試劑盒方法，以步驟2.1的重組質粒pAG413-gal-Tpase為模板，利用PfuTurboTM DNA polymerase重新合成含有Ppmar1轉座酶V376A突變體的質粒DNA；

步驟3.2，然後在合成的質粒DNA中加入2μL的Dpn I限制性內切酶，於37℃條件下反應5min，將原始模板序列徹底降解。將新合成的質粒DNA測序確認後得到Ppmar1轉座酶V376A突變體；

Ppmar1轉座酶V376A突變體的胺基酸序列如SEQ ID NO.1所示，編碼所述Ppmar1轉座酶V376A突變體的基因的核苷酸序列如SEQ ID NO.2所示。

四、轉座酶活性的檢測

實驗組是將步驟3.1的含有Ppmar1轉座酶V376A突變體的質粒DNA和步驟2.2的pWL89a-Tn重組質粒，用PEG/LiAc法共同轉化到酵母中，用His/Ura雙缺固體培養基上進行選擇培養。用半乳糖誘導轉座酶表達，促使非自主轉座子發生轉座。

以野生型Ppmar1轉座酶為對照組，步驟2.1的帶有野生型的Ppmar1轉座酶的重組質粒pAG413-gal-Tpase和步驟2.2的pWL89a-Tn重組質粒，用PEG/LiAc法共同轉化到酵母中，用His/Ura雙缺固體培養基上進行選擇培養。用半乳糖誘導轉座酶表達，促使非自主轉座子發生轉座。

實驗組和對照組的經誘導培養的酵母用缺失His/Ura/Ade固體培養基上進行選擇培養，計算培養基上長出的酵母菌斑。如果轉座發生，pWL89a-Tn重組質粒上的ADE2基因就能表達，因此陽性酵母株能夠在缺乏腺嘌呤的培養基上生長。

以野生型Ppmar1轉座酶為對照，比較轉化有Ppmar1轉座酶V376A突變體的酵母菌落數目，篩選出較高活性的轉座酶突變株，結果如表2所示。

由表2可知，野生型Ppmar1轉座酶的陽性酵母菌落數量明顯小於Ppmar1轉座酶V376A突變體，且Ppmar1轉座酶V376A突變體催化轉座能力提高到原來的259％。這個高活性人工改造的Ppmar1轉座酶V376A突變體將為利用Ppmar1轉座子開發基因標籤奠定了重要基礎。

表1本發明應用的引物序列

表2不同轉座酶誘導的陽性酵母菌落數量和催化活性

儘管已描述了本發明的優選實施例，但本領域內的技術人員一旦得知了基本創造性概念，則可對這些實施例作出另外的變更和修改。所以，所附權利要求意欲解釋為包括優選實施例以及落入本發明範圍的所有變更和修改。

顯然，本領域的技術人員可以對本發明進行各種改動和變型而不脫離本發明的精神和範圍。這樣，倘若本發明的這些修改和變型屬於本發明權利要求及其等同技術的範圍之內，則本發明也意圖包含這些改動和變型在內。

序列表

浙江農林大學

一種具有高催化活性的Ppmar1轉座酶V376A突變體及其應用

PatentIn version 3.3

499

PRT

人工序列

Met Ala Asp Pro Ile Asp Ser Gly Phe Asp Leu Asn Val Arg Leu Glu

1 5 10 15

Glu Asp Asp Asp Gly Asn Leu Pro Phe Asp Leu Asn Glu Pro Ile Leu

20 25 30

Glu Asp His Asn Asn Gly Ile Asp Leu Asn Leu Pro Leu Asp Glu Phe

35 40 45

Gly Ala Val Asp Phe Asp Tyr Val Gln Asn Leu Ala Glu Gln Asp Val

50 55 60

Glu Ala Pro Val Gln Val His Pro Pro Lys His Asp Tyr Pro Glu His

65 70 75 80

Val Arg Lys Leu Val Tyr Gln Ala Leu Leu Met Arg Ser Lys Asn Gly

85 90 95

Lys Leu Gly Asn His Asp Thr Thr Ile Val Ser Ser Gln Phe Gly Val

100 105 110

Lys Ile Arg Ser Val Gln Arg Ile Trp Lys Gln Gly Lys Asn Gln Leu

115 120 125

Ala Gln Asn Ile Pro Val Val Val Ala Asn Leu Lys Lys Gly Arg Ser

130 135 140

Gly Arg Lys Ala Thr Pro Leu Asp Leu Glu Gln Leu Arg Asn Ile Pro

145 150 155 160

Leu Lys Gln Arg Met Thr Ile Glu Asp Val Ser Ser Arg Leu Gly Ile

165 170 175

Ser Lys Ser Arg Ile Gln Arg Tyr Leu Lys Lys Gly Leu Leu Arg Arg

180 185 190

His Ser Ser Ser Ile Lys Pro Tyr Leu Thr Asp Ala Asn Lys Lys Thr

195 200 205

Arg Leu Lys Trp Cys Ile Asp Met Ile Glu Gln Gly Leu Val Asp Asp

210 215 220

Pro Lys Phe Arg Asp Leu Phe Asp Phe Val Phe Ile Asp Glu Lys Trp

225 230 235 240

Phe Asn Leu Ser Gln Lys Ser Glu Arg Tyr Tyr Leu Leu Pro Asp Glu

245 250 255

Asp Glu Pro His Arg Thr Cys Lys Asn Lys Asn Tyr Ile Pro Arg Ile

260 265 270

Met Phe Leu Cys Val Cys Ala Arg Pro Arg Phe Arg Asn Gly Glu Cys

275 280 285

Val Phe Asp Gly Lys Ile Gly Cys Phe Pro Leu Val Thr Phe Glu Gln

290 295 300

Ala Ile Arg Gly Ser Gln Asn Arg Leu Arg Gly Glu Gln Val Ile Lys

305 310 315 320

Pro Ile Gln Ser Ile Asn Arg Glu Val Ile Arg Asp Phe Met Ile Asn

325 330 335

Arg Val Leu Pro Ala Ile Arg Ala Lys Trp Pro Arg Glu Asp Val His

340 345 350

Lys Pro Ile Phe Ile Gln Gln Asp Asn Val Pro Ser His Leu Lys Val

355 360 365

Asp Asp Pro Gln Phe Arg Glu Ala Ala Lys Gln Asp Gly Phe Asp Ile

370 375 380

Arg Leu Ile Cys Gln Pro Pro Asn Ser Pro Asp Phe Asn Ile Leu Asp

385 390 395 400

Leu Gly Phe Phe Arg Ala Ile Gln Ala Ile Gln Tyr Lys Lys Asp Ala

405 410 415

Lys Thr Leu Lys Asp Leu Ile Pro Ala Val Gln Gln Ala Phe Leu Glu

420 425 430

Tyr Ser Pro Trp Lys Ala Asn Arg Ile Phe Val Thr Leu Gln Thr Val

435 440 445

Leu Lys Glu Ala Met Lys Ile Lys Gly Cys Asn Lys Ile Lys Ile Pro

450 455 460

His Ile Gln Lys Gln Arg Leu Glu Arg Glu Asp Arg Leu Pro Leu Gln

465 470 475 480

Ile Pro Cys Glu Ala Ser Leu Leu Ala Glu Ala Leu Ala Ser Leu Pro

485 490 495

Ala Ala Asn

1500

DNA

人工序列

atggctgacc caatagattc tggcttcgat ctgaacgttc ggttagaaga agatgatgac 60

ggcaatcttc cctttgatct caacgagcca atattggaag atcacaacaa tggaattgat 120

ttgaacttgc cattagatga gtttggtgcc gtcgacttcg actatgtaca aaacctcgct 180

gaacaagatg ttgaggctcc cgttcaagta caccctccga agcatgacta tcctgaacat 240

gttagaaaac tagtgtacca agcattgttg atgagaagca agaatgggaa actaggcaat 300

catgatacaa caattgtttc cagtcaattt ggagtaaaga ttcgatcagt tcagcgcata 360

tggaagcaag gtaaaaacca acttgctcaa aacattccgg tcgtggttgc taatctaaag 420

aaaggtagaa gtggccgtaa agcaacccct cttgatttgg aacaattgcg caacattcct 480

ctcaagcaaa gaatgaccat agaagatgtg tctagtagac ttggtattag caaatctagg 540

atacaaaggt atttgaaaaa gggtttgctt aggcgccact ctagtagcat aaaaccttac 600

ctcaccgatg ctaacaagaa gactaggttg aagtggtgca ttgacatgat tgagcaaggt 660

ttggttgatg atccaaagtt cagggatttg tttgactttg tgtttattga tgagaagtgg 720

ttctacctct ctcaaaaatc cgagagatac tacttgctac ccgacgaaga tgaaccacat 780

cgcacttgca agaacaagaa ttacatccct aggatcatgt ttttgtgtgt ttgtgctcgg 840

ccaagattta gaaatggaga atgtgtgttt gatggcaaaa taggttgttt tccactagtc 900

acttttgaac aagctattag aggaagccaa aaccgtcttc gtggagaaca agtaatcaag 960

ccaattcaat caattaatag ggaagtgata agagatttca tgataaatag agtgttgcct 1020

gcaattagag caaagtggcc aagagaagat gtacacaagc caattttcat acaacaagat 1080

aatgttccat ctcatttaaa ggtggatgat cctcagtttc gtgaggctgc taagcaagat 1140

gggtttgaca ttaggctcat atgtcaacca cccaattctc cagattttaa cattctagat 1200

ttgggttttt ttcgagctat tcaagcaatt caatacaaga aagatgctaa gacattgaaa 1260

gatctaattc cagcagtcca acaggcattt ttggagtact ctccatggaa agcaaatagg 1320

atatttgtga cactacaaac tgttttgaag gaagcaatga agataaaagg ttgcaacaaa 1380

atcaaaattc ctcacatcca gaaacaaaga cttgagagag aagataggct gccattgcaa 1440

atcccttgtg aagcttcctt gctagccgaa gcacttgcaa gccttcctgc agctaattag 1500

3435

DNA

毛竹基因組

tactccctcc atacccgaaa ttcctgacgt ttaggacatg attgtggtaa ccaaggagtg 60

attaattagg ggttagtttt ccatctttgc ccctaataaa tatggttacg ggtgctcttt 120

gtacgagaaa gtaaaccagc tcgactggct agcgcgcgga ggcctcagtc ctgtggtgcg 180

cgttcgatac ctcgcggacg caggtttttt tcttgttgct gtttattcat ttttgcatgg 240

cactgtttag gcaacgcacg tcgcgcgcgc ttagccgctg cgggcgttag ttttcgagtg 300

gatttgggcc tggcgcacgg aggaggttgc atggctgccc gaaaatttcg ttgcatgcac 360

tggattttca aaattttgtc ctcgcgctgt ggaggctcgt ttgaggccgc gttttttttc 420

atctggcgcg ctggaaggcc gacgtttgga gtgctcgttg cttgttctat ttaaacgcct 480

ggaaccttcc ttgttgtctt cctatgccgg actcctgtac tatggctgac ccaatagatt 540

ctggcttcga tctgaacgtt cggttagaag aagatgatga cggcaatctt ccctttgatc 600

tcaacgagcc aatattggaa gatcacaaca atggtaagca aaaacgtcaa attagtttct 660

cagtttctcg tttccttttt tctttactga gcttgtcgtt tcctttttcg ataggaattg 720

atttgaactt gccattagat gagtttggtg ctgtcgactt cgactatgta caaaacctcg 780

ctggtaagca tggctagtat tatgaattcg cttgtttttt tatttccttt tgctggaaca 840

tgccgtgaat aatagtatta tgaactcgct tgttttttat ttccttttac tagaacatgt 900

gcttgtttta ttcctatagc tagatcatga cgtcaatact ttttacgatg aatatgctcg 960

ttacagtata gctagaacat gccgtgacta catagtagta tgaatatgct tgttttattt 1020

ctataactat aacatgccgt gagtatattt agatcatgcc gtgagtacta agtactatta 1080

aaatgcttgt tttttatttc cttttgctag aacaagatgt tgaggctccc gttcaagtac 1140

accctccgaa gcatgactat cctgaacatg ttagaaaact agtgtaccaa gcattgttga 1200

tgagaagcaa gaatgggaaa ctaggcaatc atgatacaac aattgtttcc agtcaatttg 1260

gagtaaagat tcgatcagtt cagcgcatat ggaagcaagg taaaaaccaa cttgctcaaa 1320

acattccggt cgtggttgct aatctaaaga aaggtagaag tggccgtaaa gcaacccctc 1380

ttgatttgga acaattgcgc aacattcctc tcaagcaaag aatgaccata gaagatgtgt 1440

ctagtagact tggtattagc aaatctagga tacaaaggta tttgaaaaag ggtttgctta 1500

ggcgccactc tagtagcata aaaccttacc tcaccgatgc taacaagaag actaggttga 1560

agtggtgcat tgacatgatt gagcaaggtt tggttgatga tccaaagttc agggatttgt 1620

ttgactttgt gtttattgat gagaagtggt tctacctctc tcaaaaatcc gagagatact 1680

acttgctacc cgacgaagat gaaccacatc gcacttgcaa gaacaagaat tacatcccta 1740

ggatcatgtt tttgtgtgtt tgtgctcggc caagatttag aaatggagaa tgtgtgtttg 1800

atggcaaaat aggttgtttt ccactagtca cttttgaaca agctattaga ggaagccaaa 1860

accgtcttcg tggagaacaa gtaatcaagc caattcaatc aatcaatagg gaagtgataa 1920

gagatttcat gataaataga gtgttgcctg caattagagc aaagtggcca agagaagatg 1980

tacacaagcc aattttcata caacaagata atgctccatc tcatttaaag gtggatgatc 2040

ctcagttttg tgaggttgct aagcaagatg ggtttgacat taggctcata tgtcaaccac 2100

ccaattctcc agattttaac attctagatt tgggtttttt tcgagctatt caagcaattc 2160

aatacaagaa agatgctaag acattgaaag atctaattcc agcagtccaa caggtaaatg 2220

atcatccatt acagtgttta aattgatctt gaacaaataa tataatcact gatcttgaac 2280

atgttttgta ggcatttttg gagtactctc catggaaagc aaataggata tttgtgacac 2340

tacaaactgt tttgaaggaa gcaatgaaga taaaaggttg caacaaaatc aaaattcctc 2400

acatccagaa acaaagactt gagagagaag ataggctgcc attgcaaatc ccttgtgaag 2460

cttccttgct agccgaagca cttgcaagcc ttcctgcggc taattagaag atgcaagcat 2520

gttactcttt tgcagcagca agcatgtaag aagacgcgag catgttagta gcaaactatg 2580

aacaaactag tttatgcatg tagtagtatg ttagcttgtg caccttagtc atctcgtccc 2640

aaccgcttga taacatgctc aggaagaagt attgtgtcac catccatttc aagtttctcc 2700

acatcaggaa tgtagacctc acaatcaaac ttttccatgt catcgagcca cttcgctgtc 2760

atgtcgtagt cttcatgtaa aaggccacaa cgggcacaca tgcgagcttc gcggcgagct 2820

tggtagcagg cttctccgaa gacgccgccg gcgtggaacg taacacagcg aggacacaga 2880

gactcgacgg agtcgggatc gacggtgtcg ggcaccatct cgagggagtc tgcaaccatg 2940

tcgacggagt ccggcagctc ctcgacggag tccggcacca tgtcgacggt gtccggcagc 3000

tcctcgacgg agtctggcac ctcctgcggc gccatgtcca cggtgtccag cgacgctatg 3060

gagcccgacg agatgtcctg cacggcgacg tccagcgccg caacggactc cgtcgtttcc 3120

atctgatccg acgaggcatc gacgtcctgc gacgagcgtg gcggcgagag cacggcgagc 3180

gggcaggcga gcgggcaggc gagcgagcca ttcgcgcgag cgatgaatgc gagctgctgt 3240

accaggcgca cacacgcgca atcaatgcgg gcgagtaacg atgcgagcat gcgcggcgga 3300

agcgcaacag acgggcagca gcgcatggcc aggggcaaac gcgtgaaaag aagaccacgc 3360

gaggccacaa cgtcagcttt tgcgcaaacg ggcacttcgc ctagaacgtc aggaatttcg 3420

ggtatggagg gagta 3435