新四季網

豬核受體輔激活因子1基因的蛋白編碼序列的製作方法

2023-05-15 11:14:41 1

專利名稱:豬核受體輔激活因子1基因的蛋白編碼序列的製作方法
技術領域:
本發明涉及的是一種用於生物基因工程領域的蛋白質編碼序列,特別是一種豬核受體輔激活因子1基因(NCOA-1/SRC-1)的蛋白編碼序列。
背景技術:
核受體輔激活因子1(NCOA-A/SRC-1)是類固醇受體輔激活蛋白(SRC)家族的一個主要成員。SRC家族的蛋白質可以通過與核受體的互作來提高這些核受體基因的轉錄激活功能。由於它們易於由基礎轉錄因子裝配為穩定的前起始複合體從而可以激活基因的表達,在核受體激素基因表達過程中起主要調節作用。
核激素受體是一種配體依賴的轉錄因子,它們主要調控那些與發育、繁殖和體內穩態等生物學過程有關的基因的轉錄活性。這些受體作為一個「分子開關」分別隨著與之相關的激素的有無,在轉錄激活和抑制狀態間變化。大部分受體的活化過程都需要核受體輔調控蛋白的參與。這些輔調控蛋白在受體和基礎轉錄因子之間起著信號傳導介質的作用,包括輔激活因子和輔阻遏因子兩類。在沒有激素存在的情況下,一些核受體通過輔阻遏因子與輔激活因子的相互作用來抑制靶基因的轉錄;當與激素結合以後,這些輔阻遏因子便從DNA結合受體上解離出來然後募集成為核受體輔激活因子複合物。這些輔激活因子與核受體相互作用可以提高靶基因的轉錄活性。由於它們在轉錄調控過程中起著極其重要的作用,因此這類輔調控蛋白已經成為核受體研究的熱點。
類固醇受體輔激活蛋白(SRC)家族是核受體輔激活因子中非常重要的一類,目前在人類已被克隆的SRC家族成員有SRC-1/NCOA-1,TIF2/GRIP1/NCOA-2和RAC3/ACTR/AIB-1/pCIP。其中SRC-1是用生物化學和遺傳學方法分離到的第一個輔激活因子,它也是類固醇受體輔激活蛋白P160家族的成員之一。大量的實驗表明,SRC-1可增強GR,ER,RXR和TR介導的體內轉錄,可增強轉錄水平的10倍。
經對現有技術文獻的檢索發現,在Onate SA,Tsai SY,Tsai MJ et al,「Sequence and characterization of a coactivator for the steroid hormonereceptor superfamily」.Science,1995,2701354-1357.即由Onate等在《Science》(1995,270卷)上的「類固醇激素受體超家族輔激活因子的序列及其特點」一文中報導,他們是用酵母雙雜合系統以人PR的HBD作為釣餌從人的cDNA文庫中將人的SRC-1基因篩選出來的,其分子量是125ku。在Zhu Y,Qi C,Calandra C,et al.「Cloning and identification of mouse steroid receptorcoactivator-1(mSRC-1),as a coactivator of peroxisome proliferator-activated receptor gamma」.[J].Gene Expression,1996,6(3)185.即由Zhu Y等在《基因表達》(1996,6卷)上的「過氧化物酶增殖體活化受體γ激活因子——鼠的類固醇受體輔激活因子1的克隆和鑑定」一文中報導,他們是用酵母雙雜合系統以GAL4-PPAR gamma作為釣餌將鼠的SRC-1基因從鼠的肝細胞cDNA文庫中篩選出來的。在Carapeti M.,Aguiar R.C.,Chase A.,Goldman J.M.,Cross N.C.P..「Assignment of the steroid receptor coactivator-1(SRC-1)gene to human chromosome band 2p23」.Genomics.1998,52(2)242-244.即Melina Carapeti等在《基因組》上的「定位SRC-1基因於人的染色體2p23上」一文中報導了,他們用螢光原位雜交的方法將人的SRC-1基因定位於2號染色體上。但至今尚未發現克隆獲得豬NCOA-1/SRC-1基因編碼蛋白序列。
目前對NCOA-1/SRC-1基因的研究更多的集中在對人類的乳腺癌、肥胖症、糖尿病等疾病的發病機理上以及鼠的肥胖症及相關激素抗性的研究上。

發明內容
本發明的目的在於針對現有技術的不足,提供一種豬核受體輔激活因子1基因的蛋白編碼序列。使其一方面能夠為人類乳腺癌、肥胖症及糖尿病等相關疾病的研究提供動物模型;另一方面可以為提高豬繁殖性能的分子標記輔助育種起指導作用,具有很大的應用價值。
本發明是通過以下技術方案實現的,本發明所獲得的豬NCOA-1基因蛋白編碼序列具有SEQ ID NO.1中從第1-4323位的核苷酸序列,其與人、小鼠等物種NCOA-1/SRC-1基因CDS序列同源性為93.73%。
所述的獲得的豬NCOA-1基因蛋白編碼序列具有SEQ ID NO.1所示的胺基酸序列的多肽、或其保守性變異多肽、或其活性片段,或其活性衍生物,其同人、小鼠、大鼠的胺基酸序列同源性為94.99%。
所述的豬NCOA-1基因蛋白編碼序列,指與SEQ ID NO.1的胺基酸序列相比,有5-10個胺基酸被性質相似或相近的胺基酸所替換而形成多肽。
本發明中,豬核受體輔激活因子1(NCOA-1)基因的cDNA序列是通過以豬的小腸組織總RNA為模板,參考人、鼠的核受體輔激活因子1基因的同源序列設計了四對引物,進行反轉錄PCR,克隆獲得四條新基因的部分序列,對四條部分序列的重疊區進行拼接,從而獲得了NCOA-1基因的大部分序列;同時以人的SRC-1基因mRNA序列為探針進行電子克隆得到部分編碼蛋白的核苷酸序列,將兩種方法克隆得到的部分序列進行拼接,得到完整的編碼蛋白序列。並在電子克隆得到的序列上設計兩對引物,克隆測序,驗證了電子克隆的結果,最終獲得了完整的新基因序列。獲得的豬NCOA-1基因蛋白編碼序列見SEQ ID NO.1。將豬NCOA-1基因cDNA序列中的編碼序列(CDS)按通用密碼子翻譯成的蛋白質編碼序列見SEQ IDNO.1。
所述的SEQ ID NO.1,該基因全長4323bp,開放閱讀框1bp-4323bp區段,編碼1440個胺基酸的蛋白質,分子量為156731道爾頓。本發明獲得的NCOA-1基因蛋白編碼序列上的1-3位為起始密碼子ATG,4321-4323位為終止密碼子TAA,1-4323位為編碼蛋白質區域(CDS);全長核苷酸序列是由四個RT-PCR產物克隆測序得到的序列和兩個電子克隆獲得的序列拼接而成的,長度分別為599bp、724bp、1059bp、1454bp和827bp、824bp。6個RT-PCR擴增產物克隆測序並驗證了電子克隆得到的部分序列,從而獲得基因全長。
本發明中的豬核受體輔激活蛋白1基因在GeneBank核苷酸資料庫中搜索同源序列,發現該基因編碼蛋白的核苷酸序列(CDS)同其它哺乳動物的同源基因具有高度的同源性。同人的類固醇受體輔激活因子1a(AJ000881)同源性為94.11%;同小鼠的同源性為85.79%(NM-010881);同大鼠的同源性為76.82%(XM233944)。
本發明中的豬核受體輔激活蛋白1基因編碼的胺基酸序列,在GeneBank蛋白質資料庫中搜索同源序列,發現其同其它哺乳動物的同源基因的胺基酸序列同樣具有高度的同源性。同人的類固醇受體輔激活因子1胺基酸序列(AAC50631)同源性為96.39%;同小鼠的同源性為88.11%(AAB06177);同大鼠的同源性為88.84%(XP233944)。
在本發明中,「豬核受體輔激活蛋白1基因蛋白編碼序列」指與SEQ ID NO.1的胺基酸序列相比,有5-10個胺基酸被性質相似或相近的胺基酸所替換而形成多肽。這些保守性變異多肽最好根據表1進行替換而產生。
表1

本發明首次從豬的小腸組織中克隆得到了豬的NCOA-1的蛋白編碼序列,為研究NCOA-1在為人類相關疾病的研究提供動物模型以及養豬生產中提高豬的繁殖性能奠定了基礎。


圖1豬核受體輔激活蛋白1基因cDNA序列克隆過程簡圖。
具體實施例方式
下面結合具體實施例,進一步闡述本發明。這些實施例僅用於說明本發明而不用於限制本發明的範圍。下列實施例中未註明具體條件的實驗方法,通常按照常規條件,例如Sambrook等分子克隆實驗室手冊(New YorkCold Spring HarborLaboratory Press,1989)中所述的條件,或按照製造廠商所建議的條件。
實施例1豬NCOA-1基因cDNA序列的克隆,其過程見附圖1。
在基因克隆過程中所用到的實驗方法具體操作方法如下1.組織分離(Isolation)在豬場屠宰30日齡杜長大商品仔豬,取結腸組織樣,迅速放入液氮中,冷凍後保存於實驗室-80℃冰箱中,準備提取組織總RNA。
2.總RNA的分離(Total RNA isolation)(1)提取RNA的準備工作玻璃製品用0.1M的NaOH浸泡過夜,用自來水反覆衝洗,再用蒸餾水衝洗2遍,180℃烘烤4小時。
勻漿器、電泳槽用3%的雙氧水浸泡20-30分鐘,再用0.1%的DEPC水衝洗.由於未滅活的DEPC對PCR反應有影響,可用0.5%的SDS處理。
Tip頭、EP管用0.1%的DEPC水浸泡過夜,高壓滅菌使DEPC失活。
雙蒸水和溶液用DEPC處理,即每100ml水或溶液加0.1mlDEPC液,室溫放置過夜,高壓滅菌30分鐘DEPC失活。
(2)組織總RNA提取取100mg在液氮中凍存的組織樣放入1ml Trizol(trizalreagent,invitrogenBRL,USA)的勻漿器管中勻漿。4℃ 12000g離心10分鐘。吸取上清液,15-30℃溫育5分鐘。加0.2ml氯仿,蓋上蓋子,用手劇烈震蕩15秒。15-30℃溫育2-3分鐘。4℃ 12000g離心15分鐘。吸取上清液,加0.8ml異丙醇,混合均勻。15-30℃溫育10分鐘,4℃ 12000g離心10分鐘,離心管底部白色沉澱即為RNA。倒掉上清,加1ml 75%乙醇洗滌RNA,4℃ 7500g離心10分鐘。自然乾燥或真空乾燥RNA.溶於水(RNase free)中分裝,-70℃保存。
(3)組織總RNA的鑑定通過分光光度計上測定RNA含量並且用瓊脂糖電泳分析RNA的質量,具體方法如下電泳槽用RNA清洗液(100mM NaOH,1mM EDTA)浸泡4-5小時,再用DEPC處理過的水反覆衝洗數次後倒入1×TBE待用。瓊脂糖凝膠用1×TBE配製。在10ul上樣緩衝液(2×TBE,13%菲可,0.1%溴酚蘭,7M尿素)中加入1ul以上組織總RNA,65℃變性10分鐘後立即放入冰水中2-3分鐘。點樣於瓊脂糖凝膠中電泳。
3.引物設計及合成首先用GeneBank中提供的人的SRC-1基因的mRNA序列(AJ000881)在NCBI的EST Other庫中進行Blast分析,尋找出所有與該序列高度相似的EST。Blast的結果共有10條左右的豬的EST序列。除去重複序列,其中本實驗應用到的EST有CK449131、NM003743、DN113177、DN344959、AW436788。
引物對N2根據GenBank發表的人(AJ000881)、小鼠(NM-010881)等物種的NCOA-1基因的mRNA序列,在物種間高度保守的區域,設計上遊引物NF2;在豬的EST序列CK449131上設計下遊引物NR2。用於以豬cDNA為模版的PCR擴增,以獲得豬NCOA-1基因部分cDNA序列,長度為1454bp。引物用Primer Premier 5.0自行設計,由上海華諾生物技術有限公司合成。引物對N2如下NF25』-TAGTCAAGGGGTGATAGAA-3』 NR25』-CTTTGTTATCTTTGGACTC-3』②引物對N3根據GenBank發表的人(AJ000881)、小鼠(NM-010881)等物種的NCOA-1基因的mRNA序列,在物種間高度保守的區域,設計上遊引物NF3;在由引物對N2克隆得到的序列上設計下遊引物NR3,用於以豬cDNA為模版的PCR擴增,以獲得豬NCOA-1基因部分cDNA序列,長度為599bp。該引物對克隆的序列包含起始密碼子。引物用Primer Premier 5.0自行設計,由上海華諾生物技術有限公司合成。引物對A2如下NF35』-AAGTCTCCCCAGGTGTGA-3』NR35』-CTATTTCGTCGTGTTGC-3』③引物對N4
在由引物對N2克隆測序得到的序列上設計上遊引物NF4;在豬的EST序列DN113177上設計下遊引物NR4。用於以豬cDNA為模版的PCR擴增,以獲得豬NCOA-1基因部分cDNA序列,長度為724bp。引物用Primer Premier 5.0自行設計,由上海華諾生物技術有限公司合成。引物對N4如下NF45』-CTGTTGGCTTTTCTGCTGGTT-3』 NR45』-GTCATTGGGGTTGGATTTGT-3』④引物對N5在豬的EST序列DN113177上設計上遊引物NF5;在豬的EST序列BI344959上設計下遊引物。用於以豬cDNA為模版的PCR擴增,以獲得豬NCOA-1基因部分cDNA序列,長度為1059bp。引物用Primer Premier 5.0自行設計,由上海華諾生物技術有限公司合成。引物對N5如下NF55』-CCAGCGTAACCATCAAAT-3』NR55』-GTTTCTCTCCAGTTGTGA-3』⑤引物對N6在由N4引物對克隆測序得到的序列上設計上遊引物NF6;在由N3引物對克隆測序得到的序列上設計下遊引物NR6。用於以豬cDNA為模版的PCR擴增,以驗證電子克隆豬NCOA-1基因部分cDNA序列的結果,長度為435bp。引物用PrimerPremier 5.0自行設計,由上海華諾生物技術有限公司合成。引物對N6如下NF65』-CAACTTTGTCTGTGGAGCCT-3』 NR65』-CCGATTTGATGGTTACGC-3』⑥引物對N7在由N5引物對克隆測序得到的序列上設計上遊引物NF7;在豬的EST序列AW436788上設計下遊引物NR7。用於以豬cDNA為模版的PCR擴增,以驗證電子克隆豬NCOA-1基因部分cDNA序列的結果,長度為949bp。引物用Primer Premier 5.0自行設計,由上海華諾生物技術有限公司合成。引物對N7如下NF75』-CCCTACCCACCAAACTAT-3』NR75』-TCCAAATGCTACGACCTG-3』4.RT-PCR擴增按大連寶生物反轉錄試劑盒(BcaBEST RNA PCR Kit Ver.1.1)要求進行反轉錄。反轉錄反應液組成10ul 2×Bca 1st Buffer,4ul 25Mm MgSO4,1ul dNTPMixture,0.5ul Rnase Inhibitor(40U/ul),1ul BcaBEST Polymerase(22U/ul),1ul Oligo dT Primer,1ul RNA Sample,1.5ul Rnase Free dH2O,總體系為20ul。反轉錄反應條件65℃1分鐘,30℃5分鐘(15分鐘-30分鐘內勻速升溫),65℃25分鐘,98℃5分鐘,5℃5分鐘。PCR擴增條件97℃變性5分鐘;95℃30秒→55℃30秒→72℃1分鐘,如此進行30次循環;72℃延伸10分鐘,4℃保存。
5.克隆和測序PCR擴增片段的回收。片段回收按上海華舜小量膠回收試劑盒說明進行,操作過程如下儘可能小的割下含DNA的瓊脂糖塊,放入1.5mlEP管中。按每100mg瓊脂糖加入300ulS1液的比例加S1液,50℃水浴10分鐘。將溶化的瓊脂糖液移入吸附柱,10000g離心1分鐘,倒掉管中液體。在吸附柱中加入500ul W1液,10000g離心15秒,倒掉管中液體。在吸附柱中加入500ul W1液,靜置1分鐘後,10000g離心15秒,倒掉管中液體。離心1分鐘。將吸附柱放入一個乾淨的1.5mlEP管中,在吸附膜中央加入30ulT1液,靜置1分鐘後,10000g離心1分鐘,EP管中液體即為回收的DNA。
回收片段同T載體的連接。連接用TaKaRa pMD18-T Vector試劑盒,操作過程如下在EP管中製備下列連接反應液pMD18-T Vector(50ng/ul)0.5ul,DNA20-40ng,Solution 15ul,加dH2O至10ul。將上述反應液在16℃反應30分鐘(過夜也可以),產物用於轉化感受態細胞。
質粒的轉化。從-70℃冰箱中取出保存的感受態細胞,冰浴助溶。100ul感受態細胞加入10ul連接產物,冰浴30分鐘。42℃水浴熱應激90秒鐘,立即置入冰浴中2分鐘。加400ul液體LB培養基,37℃復活50分鐘。取100ul鋪於LB平板上,平板含0.1%(V/V)的氨苄青黴Amp(100mg/ml)。37℃恆溫培養10-15小時。
轉化菌落的PCR鑑定與培養。用記號筆標記轉化培養的單菌落,用滅菌的牙籤蘸取單菌落。將牙籤頭放入在加有PCR反應液(不含模板)的EP管中晃動,使單菌落充當模板。用獲得該片段的PCR條件進行擴增。PCR產物同Marker一起進行瓊脂糖凝膠電泳,鑑別T載體上是否含有目的片段。若得到目的片段,可用滅菌槍頭挑取在平板上的與之對應的單菌落,放入40ml LB液體培養基中,先在液體中加入0.1%(V/V)的青黴素鈉(100mg/ml),37℃過夜搖菌培養,用於質粒回收。
質粒的回收。質粒回收用上海華舜小量質粒抽提純化試劑盒,操作步驟如下將轉化培養的菌液加入1.5mlEP管中,4000轉/分鐘離心,倒掉液體獲細菌沉澱。細菌沉澱不夠時可再加一次菌液離心。在細菌沉澱中加入250ulP1液,振蕩懸浮。加入250ulP2液,溫和搖勻,室溫靜置4分鐘。加入350ulP3液,溫和搖勻。離心10分鐘,將上清液小心移入吸附柱,離心15秒,倒掉液體。在吸附柱中加入500ulW1,離心15秒,倒掉液體。在吸附柱中加入500ulW1,靜置1分鐘,離心15秒,倒掉液體。離心1分鐘。將吸附柱放入一個乾淨的1.5mlEP管中,在吸附膜中央加入25-30ulT1液,靜置1分鐘後,離心1分鐘.EP管中液體即為回收的質粒。
質粒的酶切鑑定。為了證明回收質粒確為插入目的片段的重組質粒,採用雙酶切法鑑定.本研究具體操作如下根據TaKaRa pMD18-T Vector圖,選擇內切酶Bam HI和Hind III.保證目的片段中無這兩種酶的切點。組成如下酶切反應體系Bam HI 1ul,Hind III 1ul,10×K Buffer 2ul,DNA≤1ul,加dH2O至20ul。30℃反應3小時。瓊脂糖凝膠電泳檢測.
重組質粒的測序。取20ul重組質粒於EP管中,封口膜密封,交生物技術公司測序。
6.電子克隆以人SRC-1基因mRNA核苷酸序列(GeneBank登錄號AJ000881)為信息探針運行NCBI中的BLASTn程序在EST Other資料庫中搜索,得到與探針高度吻合的一系列長短不一的豬EST序列,然後將這些序列進行拼裝連接得到一個長的序列,然後再分別以得到的這段長序列為探針再次在豬EST資料庫中進行BLASTn,得到更多的EST序列,從而使序列向兩端延伸,最終將所獲得的序列進行拼接得到部分的CDS序列。
實施例2豬NCOC-1/SRC-1基因編碼序列同源性比較在GenBank上搜索並獲得人、小鼠、大鼠NCOA-1基因編碼蛋白序列,將其同本發明克隆測序獲得的SEQ ID NO.1序列一起,在分子生物學軟體DNAman上進行序列同源性比較。比較結果顯示SEQ ID NO.1序列與人、小鼠等物種NCOA-1基因CDS序列同源性為93.73%,與人、小鼠、大鼠的胺基酸序列同源性為94.99%。
本發明涉及的序列及記號分列如下SEQ ID NO.1的信息110上海交通大學120豬核受體輔激活因子1基因的蛋白編碼序列140
1412005-05-181602170PatentIn version 3.121012114323212DNA213豬(sus scrofa)4001atg agt ggc ctt ggg gac agt tca tct gac cct gct aac cca gac tca 48Met Ser Gly Leu Gly Asp Ser Ser Ser Asp Pro Ala Asn Pro Asp Ser15 10 15cat aag aga aaa gga tca cca tgt gac aca ttg gca tca agc act gaa 96His Lys Arg Lys Gly Ser Pro Cys Asp Thr Leu Ala Ser Ser Thr Glu20 25 30aaa agg cgc agg gaa caa gaa aat aaa tat tta gaa gag cta gct gag 144Lys Arg Arg Arg Glu Gln Glu Asn Lys Tyr Leu Glu Glu Leu Ala Glu35 40 45tta ctg tct gcc aac atc agt gac att gac agc ttg agt gta aaa cca 192Leu Leu Ser Ala Asn Ile Ser Asp Ile Asp Ser Leu Ser Val Lys Pro50 55 60gac aaa tgc aag ata tta aag aag aca gtc gat cag ata cag cta atg 240Asp Lys Cys Lys Ile Leu Lys Lys Thr Val Asp Gln Ile Gln Leu Met65 70 75 80aag aga atg gaa caa gag aaa tca aca act gat gat gaa gta cag aaa 288Lys Arg Met Glu Gln Glu Lys Ser Thr Thr Asp Asp Glu Val Gln Lys85 90 95tca gat atc tcg tcg agt agt caa ggg gtg ata gaa aaa gaa tcc ttg 336Ser Asp Ile Ser Ser Ser Ser Gln Gly Val Ile Glu Lys Glu Ser Leu100 105 110gga cct ctt ctt ttg gag gct ttg gat gga ttt ttc ttt gtt gtg aac 384Gly Pro Leu Leu Leu Glu Ala Leu Asp Gly Phe Phe Phe Val Val Asn115 120 125
tgt gaa ggg agg att gta ttt gtg tca gag aat gtg acc agc tac ttg 432Cys Glu Gly Arg Ile Val Phe Val Ser Glu Asn Val Thr Ser Tyr Leu130 135 140ggt tac aat cag gag gag tta atg aac acc agt gtc tat agc ata ctg 480Gly Tyr Asn Gln Glu Glu Leu Met Asn Thr Ser Val Tyr Ser Ile Leu145 150 155 160cac gtg ggg gat cat gca gaa ttt gtg aag aat ctg ctg cca aaa tca 528His Val Gly Asp His Ala Glu Phe Val Lys Asn Leu Leu Pro Lys Ser165 170 175cta gta aat gga gtt cct tgg cct caa gag gca aca cga cga aat agc 576Leu Val Asn Gly Val Pro Trp Pro Gln Glu Ala Thr Arg Arg Asn Ser180 185 190cat acc ttt aac tgc agg atg cta att cac cct cca gat gag cca ggc 624His Thr Phe Asn Cys Arg Met Leu Ile His Pro Pro Asp Glu Pro Gly195 200 205acc gag aac caa gaa gct tgc cag cgg tat gaa gta atg cag tgt ttc 672Thr Glu Asn Gln Glu Ala Cys Gln Arg Tyr Glu Val Met Gln Cys Phe210 215 220act gtg tca cag cca aaa tca att caa gag gat gga gaa gat ttc cag 720Thr Val Ser Gln Pro Lys Ser Ile Gln Glu Asp Gly Glu Asp Phe Gln225 230 235 240tca tgt ttg att tgt att gcc cgg cga tta cct cgg cct cca gct att 768Ser Cys Leu Ile Cys Ile Ala Arg Arg Leu Pro Arg Pro Pro Ala Ile245 250 255atg ggt gta gaa tcc ttt atg acc aag caa gat act aca ggt aaa atc 816Met Gly Val Glu Ser Phe Met Thr Lys Gln Asp Thr Thr Gly Lys Ile260 265 270atc tct att gat acc agt tcc ctg aga gct gcg ggc aga act ggc tgg 864Ile Ser Ile Asp Thr Ser Ser Leu Arg Ala Ala Gly Arg Thr Gly Trp275 280 285gaa gaa ttt atg aga aag tgc ata tat gct ttc ttc caa cct caa ggc 912Glu Glu Phe Met Arg Lys Cys Ile Tyr Ala Phe Phe Gln Pro Gln Gly290 295 300aga gag cca tcg tat gcc aga caa cta ttt caa gaa gtg atg act cgt 960Arg Glu Pro Ser Tyr Ala Arg Gln Leu Phe Gln Glu Val Met Thr Arg305 310 315 320ggc act gcc tcc agc cca tcc tat agg ttc ata ttg aat gat ggg aca 1008Gly Thr Ala Ser Ser Pro Ser Tyr Arg Phe Ile Leu Asn Asp Gly Thr325 330 335atg ctt agc gcc cac acc aag tgt aaa ctt tgc tac cct caa agt cca 1056Met Leu Ser Ala His Thr Lys Cys Lys Leu Cys Tyr Pro Gln Ser Pro340 345 350gac atg cag cct ttc atc atg gga att cat atc atc gac agg gaa cac 1104Asp Met Gln Pro Phe Ile Met Gly Ile His Ile Ile Asp Arg Glu His
355 360 365agt ggt ctt tct cct caa gat gac act aat tct gga atg tca att ccc 1152Ser Gly Leu Ser Pro Gln Asp Asp Thr Asn Ser Gly Met Ser Ile Pro370 375 380cgg gta aat cct ccc gtc aat cct agt atc tct cca gct cac ggt gtg 1200Arg Val Asn Pro Pro Val Asn Pro Ser Ile Ser Pro Ala His Gly Val385 390 395 400gcc cgt tca tct tca ttg cca cca tcc aac agc aac atg gta tcc acc 1249Ala Arg Ser Ser Ser Leu Pro Pro Ser Asn Ser Asn Met Val Ser Thr405 410 415aga gta aac cgc caa cag agc tca gac ctt cac agc agc agt cac agt 1296Arg Val Asn Arg Gln Gln Ser Ser Asp Leu His Ser Ser Ser His Ser420 425 430aat tct agc aac agc caa ggg agt ttt gga tgc tca cct gga aat cag 1344Asn Ser Ser Asn Ser Gln Gly Ser Phe Gly Cys Ser Pro Gly Asn Gln435 440 445att gta gcc ggt gtt gcc tta aac cag gga cag gct agt tcc cag agc 1392Ile Val Ala Gly Val Ala Leu Asn Gln Gly Gln Ala Ser Ser Gln Ser450 455 460act aat ccc cct tta aac ctc aat aat tct cct atg gaa ggt aca gga 1440Thr Asn Pro Pro Leu Asn Leu Asn Asn Ser Pro Met Glu Gly Thr Gly465 470 475 480ata tcc ctt gca cag ttc atg tct cca agg agg caa gtt agt tct gga 1488Ile Ser Leu Ala Gln Phe Met Ser Pro Arg Arg Gln Val Ser Ser Gly485 490 495ttg gca aca aga ccc aga atg ccg aac aat tca ttt cct cct aat att 1536Leu Ala Thr Arg Pro Arg Met Pro Asn Asn Ser Phe Pro Pro Asn Ile500 505 510ccg aca tta aac tcc cct gtt agc atg aca agt act gcc tgt aat aat 1584Pro Thr Leu Asn Ser Pro Val Ser Met Thr Ser Thr Ala Cys Asn Asn515 520 525agt aac cga tct tat tca aac atc cca gta aca tct ttg cag agt atg 1632Ser Asn Arg Ser Tyr Ser Asn Ile Pro Val Thr Ser Leu Gln Ser Met530 535 540aat gaa gga ccc aat aac tct gtt ggc ttt tct gct ggt tct cca gtc 1680Asn Glu Gly Pro Asn Asn Ser Val Gly Phe Ser Ala Gly Ser Pro Val545 550 555 560ctc agg cag atg agc tca cag aat tca cct agc aga tta aat ata cag 1728Leu Arg Gln Met Ser Ser Gln Asn Ser Pro Ser Arg Leu Asn Ile Gln565 570 575cca gca aaa gct gag tcc aaa gat aac aaa gag act gca tcc att tta 1776Pro Ala Lys Ala Glu Ser Lys Asp Asn Lys Glu Thr Ala Ser Ile Leu580 585 590aat gaa atg att cag tct gac aac agc tct aat gat ggc aaa cct ctg 1824
Asn Glu Met Ile Gln Ser Asp Asn Ser Ser Asn Asp Gly Lys Pro Leu595 600 605gat tct ggg ctt ctg cat aac aat gac aga ctc tca gat ggg gac aat 1872Asp Ser Gly Leu Leu His Asn Asn Asp Arg Leu Ser Asp Gly Asp Asn610 615 620aaa tac tct caa acc agt cac aaa ctg gtg cag ctt ttg aca aca act 1920Lys Tyr Ser Gln Thr Ser His Lys Leu Val Gln Leu Leu Thr Thr Thr625 630 635 640gca gag cag cag tta cgg cat gct gat ata gac aca agc tgc aaa gag 1968Ala Glu Gln Gln Leu Arg His Ala Asp Ile Asp Thr Ser Cys Lys Glu645 650 655gta ttg tct tgc aca ggc act tcc agc tct gcc tct gct aac tct tca 2016Val Leu Ser Cys Thr Gly Thr Ser Ser Ser Ala Ser Ala Asn Ser Ser660 665 670agt ggc tct tgc ccc tcc tct cat agc tca ctg acg gag cgg cac aaa 2064Ser Gly Ser Cys Pro Ser Ser His Ser Ser Leu Thr Glu Arg His Lys675 680 685att ctc cac cga ctc tta cag gag ggt agc ccc tcg gat atc aca act 2112Ile Leu His Arg Leu Leu Gln Glu Gly Ser Pro Ser Asp Ile Thr Thr690 695 700ttg tct gtg gag cct gat aaa aag gac agt gcc tct act tct gtg tca 2160Leu Ser Val Glu Pro Asp Lys Lys Asp Ser Ala Ser Thr Ser Val Ser705 710 715 720gtg act ggg cag gta cca ggg aac tcc ggt ata aaa ctg gaa ctg gat 2208Val Thr Gly Gln Val Pro Gly Asn Ser Gly Ile Lys Leu Glu Leu Asp725 730 735gct tca aag aaa aaa gaa tca aaa gac cat cag ctt cta cgc tac ctt 2256Ala Ser Lys Lys Lys Glu Ser Lys Asp His Gln Leu Leu Arg Tyr Leu740 745 750tta gat aaa gat gag aaa gat tta aga tca act cct aac ctg agc ctg 2304Leu Asp Lys Asp Glu Lys Asp Leu Arg Ser Thr Pro Asn Leu Ser Leu755 760 765gat gac gta aag gta aaa gtg gaa aag aag gaa cag atg gat cct tgt 2352Asp Asp Val Lys Val Lys Val Glu Lys Lys Glu Gln Met Asp Pro Cys770 775 780aac aca aac cca acc cca atg aca aaa cct cct cct gag gaa att aaa 2400Asn Thr Asn Pro Thr Pro Met Thr Lys Pro Pro Pro Glu Glu Ile Lys785 790 795 800ctg gag tca cag agc cag ttt aca gct gac ctt gac cag ttt gat cag 2448Leu Glu Ser Gln Ser Gln Phe Thr Ala Asp Leu Asp Gln Phe Asp Gln805 810 815tta cta ccc aca ctg gag aag gca gca cag tta cca ggc tta tgt gag 2496Leu Leu Pro Thr Leu Glu Lys Ala Ala Gln Leu Pro Gly Leu Cys Glu820 825 830
aca gag agg atg gat ggt gcg gtc acc agc gta acc atc aaa tcg gag 2544Thr Glu Arg Met Asp Gly Ala Val Thr Ser Val Thr Ile Lys Ser Glu835 840 845atc ctg cca gct aca ctt cag tcc acc act gcc aga cct act tcc agg 2592Ile Leu Pro Ala Thr Leu Gln Ser Thr Thr Ala Arg Pro Thr Ser Arg850 855 860ctg aat aga tta cct gag cta gaa ttg gaa gca att gat aac cag ttt 2640Leu Asn Arg Leu Pro Glu Leu Glu Leu Glu Ala Ile Asp Asn Gln Phe865 870 875 880gga caa ccg gga aca ggt gat cag att cca tgg gca aat aat aca gtg 2688Gly Gln Pro Gly Thr Gly Asp Gln Ile Pro Trp Ala Asn Asn Thr Val885 890 895aca gct gta aat cag aat aaa cca gaa gac cag tgt att agt tca caa 2736Thr Ala Val Asn Gln Asn Lys Pro Glu Asp Gln Cys Ile Ser Ser Gln900 905 910tta gat gag ctt ctc tgt cca cca aca aca gtt gaa gga aga aat gat 2784Leu Asp Glu Leu Leu Cys Pro Pro Thr Thr Val Glu Gly Arg Asn Asp915 920 925gag aag gct ctt ctt gaa cag ctg gta tcc ttc ctc agc ggc aaa gat 2832Glu Lys Ala Leu Leu Glu Gln Leu Val Ser Phe Leu Ser Gly Lys Asp930 935 940gaa act gag tta gcg gaa cta gac aga gct ctg gga atc gac aaa ctt 2880Glu Thr Glu Leu Ala Glu Leu Asp Arg Ala Leu Gly Ile Asp Lys Leu945 950 955 960gtt cag gga gga gga ttg gat gta tta tca gag aga ttt cca cca caa 2928Val Gln Gly Gly Gly Leu Asp Val Leu Ser Glu Arg Phe Pro Pro Gln965 970 975caa gca aca ccg cca ttg atg atg gaa gaa aga ccc aac ctt tat tca 2976Gln Ala Thr Pro Pro Leu Met Met Glu Glu Arg Pro Asn Leu Tyr Ser980 985 990cag cct tat tct tct cca tca cct act gcc aat ctc tct ggc ccc ttc 3024Gln Pro Tyr Ser Ser Pro Ser Pro Thr Ala Asn Leu Ser Gly Pro Phe995 1000 1005caa ggc atg gtc agg caa aaa cct tca ttg ggg act atg cct gtt caa 3072Gln Gly Met Val Arg Gln Lys Pro Ser Leu Gly Thr Met Pro Val Gln1010 1015 1020gta aca cct ccc cga ggt gct ttt tca cct ggc atg ggc atg cag ccc 3120Val Thr Pro Pro Arg Gly Ala Phe Ser Pro Gly Met Gly Met Gln Pro1025 1030 1035 1040agg cag act cta aac aga cct cca gct gca ccc aac caa cta aga ctt 3168Arg Gln Thr Leu Asn Arg Pro Pro Ala Ala Pro Asn Gln Leu Arg Leu1045 1050 1055cag ctt cag caa cga tta cag gga caa cag cag ttg ata cac caa aat 3216Gln Leu Gln Gln Arg Leu Gln Gly Gln Gln Gln Leu Ile His Gln Asn
1060 1065 1070cgg cag gct atc ttg aac cag ttt gca gca aac gct cct gtt ggc atc 3264Arg Gln Ala Ile Leu Asn Gln Phe Ala Ala Asn Ala Pro Val Gly Ile1075 1080 1085aat atg aga tca ggc atg caa cag caa att aca cct cag cca ccc ctg 3312Asn Met Arg Ser Gly Met Gln Gln Gln Ile Thr Pro Gln Pro Pro Leu1090 1095 1100aat gcc caa atg ttg gcc cag cgc cag cgg gag tta tac agt caa cag 3360Asn Ala Gln Met Leu Ala Gln Arg Gln Arg Glu Leu Tyr Ser Gln Gln1105 1110 1115 1120cac cga cgg agg cag cta ata cag cag cag aga gcc atg ctc atg agg 3408His Arg Arg Arg Gln Leu Ile Gln Gln Gln Arg Ala Met Leu Met Arg1125 1130 1135cag caa agc ttt ggg aac aac ctc cct ccc tcg tct gga ctg cca gtt 3456Gln Gln Ser Phe Gly Asn Asn Leu Pro Pro Ser Ser Gly Leu Pro Val1140 1145 1150cca atg ggg aac ccc cgt ctt cct cag ggt gct ccg cag caa ttc ccc 3504Pro Met Gly Asn Pro Arg Leu Pro Gln Gly Ala Pro Gln Gln Phe Pro1155 1160 1165tac cca cca aac tat ggt aca aat ccc gga act cca ccc gct tct acc 3552Tyr Pro Pro Asn Tyr Gly Thr Asn Pro Gly Thr Pro Pro Ala Ser Thr1170 1175 1180agc ccc ttt tca caa ctg gca gaa aac cct gag gca acc ttg ggc aac 3600Ser Pro Phe Ser Gln Leu Ala Glu Asn Pro Glu Ala Thr Leu Gly Asn1185 1190 1195 1200cgc aac agc atg gtg aac aga ggc atg aca gga aac atg gga gga cag 3648Arg Asn Ser Met Val Asn Arg Gly Met Thr Gly Asn Met Gly Gly Gln1205 1210 1215ttt ggc act gga atc aat cct cag atg cag cag aat gtc ttc cag tat 3696Phe Gly Thr Gly Ile Asn Pro Gln Met Gln Gln Asn Val Phe Gln Tyr1220 1225 1230cca gga tca gga atg gtt ccc caa ggt gag gcc aac ttt gct cca tct 3744Pro Gly Ser Gly Met Val Pro Gln Gly Glu Ala Asn Phe Ala Pro Ser1235 1240 1245ctt agc cct ggg agc tcc atg gtg ccg atg cca atc cct ccg cct cag 3792Leu Ser Pro Gly Ser Ser Met Val Pro Met Pro Ile Pro Pro Pro Gln1250 1255 1260agc tct ctg ctc cag cag act ccg cct gct tct ggc tac cag tca cca 3840Ser Ser Leu Leu Gln Gln Thr Pro Pro Ala Ser Gly Tyr Gln Ser Pro1265 1270 1275 1280gac atg aag gcc tgg cag caa gga gca atg gga aac aac aat gtg ttc 3888Asp Met Lys Ala Trp Gln Gln Gly Ala Met Gly Asn Asn Asn Val Phe1285 1290 1295agt caa gct gtc cag aac cag ccc acg cct gca cag cca gga gtg tac 3936
Ser Gln Ala Val Gln Asn Gln Pro Thr Pro Ala Gln Pro Gly Val Tyr1300 1305 1310aac aat atg agc atc acc gtg tcc atg gca ggt gga aat aca aat gtt 3984Asn Asn Met Ser Ile Thr Val Ser Met Ala Gly Gly Asn Thr Asn Val1315 1320 1325cag aac atg aac cca atg atg ggc cag atg cag atg agc tct ttg cag 4032Gln Asn Met Asn Pro Met Met Gly Gln Met Gln Met Ser Ser Leu Gln1330 1335 1340atg cca gga atg aac act gtg tgc cct gag cag ata aat gat cca gcc 4080Met Pro Gly Met Asn Thr Val Cys Pro Glu Gln Ile Asn Asp Pro Ala1345 1350 1355 1360ctg aga cac aca ggc ctc tac tgc aac cag ctc tca tct act gac ctt 4128Leu Arg His Thr Gly Leu Tyr Cys Asn Gln Leu Ser Ser Thr Asp Leu1365 1370 1375ctc aaa aca gaa gca gat gga acc cag gtg caa cag gtt cag gtg ttt 4176Leu Lys Thr Glu Ala Asp Gly Thr Gln Val Gln Gln Val Gln Val Phe1380 1385 1390gct gac gtc cag tgt aca gtg aat ctg gta ggc ggg gac cct tac ctg 4224Ala Asp Val Gln Cys Thr Val Asn Leu Val Gly Gly Asp Pro Tyr Leu1395 1400 1405aac cag cct ggt cca ctg gga act caa aaa ccc acg gca gga cca cag 4272Asn Gln Pro Gly Pro Leu Gly Thr Gln Lys Pro Thr Ala Gly Pro Gln1410 1415 1420acc ccc cag gcc cag cag aag agc ctc ctt cag cag cta ctg act gaa 4320Thr Pro Gln Ala Gln Gln Lys Ser Leu Leu Gln Gln Leu Leu Thr Glu1425 1430 1435 1440taa 432321022111440212PRT213豬(sus scrofa)4002Met Ser Gly Leu Gly Asp Ser Ser Ser Asp Pro Ala Asn Pro Asp Ser15 10 15His Lys Arg Lys Gly Ser Pro Cys Asp Thr Leu Ala Ser Ser Thr Glu20 25 30Lys Arg Arg Arg Glu Gln Glu Asn Lys Tyr Leu Glu Glu Leu Ala Glu35 40 45Leu Leu Ser Ala Asn Ile Ser Asp Ile Asp Ser Leu Ser Val Lys Pro
50 55 60Asp Lys Cys Lys Ile Leu Lys Lys Thr Val Asp Gln Ile Gln Leu Met65 70 75 80Lys Arg Met Glu Gln Glu Lys Ser Thr Thr Asp Asp Glu Val Gln Lys85 90 95Ser Asp Ile Ser Ser Ser Ser Gln Gly Val Ile Glu Lys Glu Ser Leu100 105 110Gly Pro Leu Leu Leu Glu Ala Leu Asp Gly Phe Phe Phe Val Val Asn115 120 125Cys Glu Gly Arg Ile Val Phe Val Ser Glu Asn Val Thr Ser Tyr Leu130 135 140Gly Tyr Asn Gln Glu Glu Leu Met Asn Thr Ser Val Tyr Ser Ile Leu145 150 155 160His Val Gly Asp His Ala Glu Phe Val Lys Asn Leu Leu Pro Lys Ser165 170 175Leu Val Asn Gly Val Pro Trp Pro Gln Glu Ala Thr Arg Arg Asn Ser180 185 190His Thr Phe Asn Cys Arg Met Leu Ile His Pro Pro Asp Glu Pro Gly195 200 205Thr Glu Asn Gln Glu Ala Cys Gln Arg Tyr Glu Val Met Gln Cys Phe210 215 220Thr Val Ser Gln Pro Lys Ser Ile Gln Glu Asp Gly Glu Asp Phe Gln225 230 235 240Ser Cys Leu Ile Cys Ile Ala Arg Arg Leu Pro Arg Pro Pro Ala Ile245 250 255Met Gly Val Glu Ser Phe Met Thr Lys Gln Asp Thr Thr Gly Lys Ile260 265 270Ile Ser Ile Asp Thr Ser Ser Leu Arg Ala Ala Gly Arg Thr Gly Trp275 280 285Glu Glu Phe Met Arg Lys Cys Ile Tyr Ala Phe Phe Gln Pro Gln Gly290 295 300Arg Glu Pro Ser Tyr Ala Arg Gln Leu Phe Gln Glu Val Met Thr Arg305 310 315 320Gly Thr Ala Ser Ser Pro Ser Tyr Arg Phe Ile Leu Asn Asp Gly Thr325 330 335Met Leu Ser Ala His Thr Lys Cys Lys Leu Cys Tyr Pro Gln Ser Pro340 345 350Asp Met Gln Pro Phe Ile Met Gly Ile His Ile Ile Asp Arg Glu His355 360 365Ser Gly Leu Ser Pro Gln Asp Asp Thr Asn Ser Gly Met Ser Ile Pro370 375 380Arg Val Asn Pro Pro Val Asn Pro Ser Ile Ser Pro Ala His Gly Val385 390 395 400Ala Arg Ser Ser Ser Leu Pro Pro Ser Asn Ser Asn Met Val Ser Thr
405 410 415Arg Val Asn Arg Gln Gln Ser Ser Asp Leu His Ser Ser Ser His Ser420 425 430Asn Ser Ser Asn Ser Gln Gly Ser Phe Gly Cys Ser Pro Gly Asn Gln435 440 445Ile Val Ala Gly Val Ala Leu Asn Gln Gly Gln Ala Ser Ser Gln Ser450 455 460Thr Asn Pro Pro Leu Asn Leu Asn Asn Ser Pro Met Glu Gly Thr Gly465 470 475 480Ile Ser Leu Ala Gln Phe Met Ser Pro Arg Arg Gln Val Ser Ser Gly485 490 495Leu Ala Thr Arg Pro Arg Met Pro Asn Asn Ser Phe Pro Pro Asn Ile500 505 510Pro Thr Leu Asn Ser Pro Val Ser Met Thr Ser Thr Ala Cys Asn Asn515 520 525Ser Asn Arg Ser Tyr Ser Asn Ile Pro Val Thr Ser Leu Gln Ser Met530 535 540Asn Glu Gly Pro Asn Asn Ser Val Gly Phe Ser Ala Gly Ser Pro Val545 550 555 560Leu Arg Gln Met Ser Ser Gln Asn Ser Pro Ser Arg Leu Asn Ile Gln565 570 575Pro Ala Lys Ala Glu Ser Lys Asp Asn Lys Glu Thr Ala Ser Ile Leu580 585 590Asn Glu Met Ile Gln Ser Asp Asn Ser Ser Asn Asp Gly Lys Pro Leu595 600 605Asp Ser Gly Leu Leu His Asn Asn Asp Arg Leu Ser Asp Gly Asp Asn601 615 620Lys Tyr Ser Gln Thr Ser His Lys Leu Val Gln Leu Leu Thr Thr Thr625 630 635 640Ala Glu Gln Gln Leu Arg His Ala Asp Ile Asp Thr Ser Cys Lys Glu645 650 655Val Leu Ser Cys Thr Gly Thr Ser Ser Ser Ala Ser Ala Asn Ser Ser660 665 670Ser Gly Ser Cys Pro Ser Ser His Ser Ser Leu Thr Glu Arg His Lys675 680 685Ile Leu His Arg Leu Leu Gln Glu Gly Ser Pro Ser Asp Ile Thr Thr690 695 700Leu Ser Val Glu Pro Asp Lys Lys Asp Ser Ala Ser Thr Ser Val Ser705 710 715 720Val Thr Gly Gln Val Pro Gly Asn Ser Gly Ile Lys Leu Glu Leu Asp725 730 735Ala Ser Lys Lys Lys Glu Ser Lys Asp His Gln Leu Leu Arg Tyr Leu740 745 750Leu Asp Lys Asp Glu Lys Asp Leu Arg Ser Thr Pro Asn Leu Ser Leu
755 760 765Asp Asp Val Lys Val Lys Val Glu Lys Lys Glu Gln Met Asp Pro Cys770 775 780Asn Thr Asn Pro Thr Pro Met Thr Lys Pro Pro Pro Glu Glu Ile Lys785 790 795 800Leu Glu Ser Gln Ser Gln Phe Thr Ala Asp Leu Asp Gln Phe Asp Gln805 810 815Leu Leu Pro Thr Leu Glu Lys Ala Ala Gln Leu Pro Gly Leu Cys Glu820 825 830Thr Glu Arg Met Asp Gly Ala Val Thr Ser Val Thr Ile Lys Ser Glu835 840 845Ile Leu Pro Ala Thr Leu Gln Ser Thr Thr Ala Arg Pro Thr Ser Arg850 855 860Leu Asn Arg Leu Pro Glu Leu Glu Leu Glu Ala Ile Asp Asn Gln Phe865 870 875 880Gly Gln Pro Gly Thr Gly Asp Gln Ile Pro Trp Ala Asn Asn Thr Val885 890 895Thr Ala Val Asn Gln Asn Lys Pro Glu Asp Gln Cys Ile Ser Ser Gln900 905 910Leu Asp Glu Leu Leu Cys Pro Pro Thr Thr Val Glu Gly Arg Asn Asp915 920 925Glu Lys Ala Leu Leu Glu Gln Leu Val Ser Phe Leu Ser Gly Lys Asp930 935 940Glu Thr Glu Leu Ala Glu Leu Asp Arg Ala Leu Gly Ile Asp Lys Leu945 950 955 960Val Gln Gly Gly Gly Leu Asp Val Leu Ser Glu Arg Phe Pro Pro Gln965 970 975Gln Ala Thr Pro Pro Leu Met Met Glu Glu Arg Pro Asn Leu Tyr Ser980 985 990Gln Pro Tyr Ser Ser Pro Ser Pro Thr Ala Asn Leu Ser Gly Pro Phe995 1000 1005Gln Gly Met Val Arg Gln Lys Pro Ser Leu Gly Thr Met Pro Val Gln1010 1015 1020Val Thr Pro Pro Arg Gly Ala Phe Ser Pro Gly Met Gly Met Gln Pro1025 1030 1035 1040Arg Gln Thr Leu Asn Arg Pro Pro Ala Ala Pro Asn Gln Leu Arg Leu1045 1050 1055Gln Leu Gln Gln Arg Leu Gln Gly Gln Gln Gln Leu Ile His Gln Asn1060 1065 1070Arg Gln Ala Ile Leu Asn Gln Phe Ala Ala Asn Ala Pro Val Gly Ile1075 1080 1085Asn Met Arg Ser Gly Met Gln Gln Gln Ile Thr Pro Gln Pro Pro Leu1090 1095 1100Asn Ala Gln Met Leu Ala Gln Arg Gln Arg Glu Leu Tyr Ser Gln Gln
1105 1110 1115 1120His Arg Arg Arg Gln Leu Ile Gln Gln Gln Arg Ala Met Leu Met Arg1125 1130 1135Gln Gln Ser Phe Gly Asn Asn Leu Pro Pro Ser Ser Gly Leu Pro Val1140 1145 1150Pro Met Gly Asn Pro Arg Leu Pro Gln Gly Ala Pro Gln Gln Phe Pro1155 1160 1165Tyr Pro Pro Asn Tyr Gly Thr Asn Pro Gly Thr Pro Pro Ala Ser Thr1170 1175 1180Ser Pro Phe Ser Gln Leu Ala Glu Asn Pro Glu Ala Thr Leu Gly Asn1185 1190 1195 1200Arg Asn Ser Met Val Asn Arg Gly Met Thr Gly Asn Met Gly Gly Gln1205 1210 1215Phe Gly Thr Gly Ile Asn Pro Gln Met Gln Gln Asn Val Phe Gln Tyr1220 1225 1230Pro Gly Ser Gly Met Val Pro Gln Gly Glu Ala Asn Phe Ala Pro Ser1235 1240 1245Leu Ser Pro Gly Ser Ser Met Val Pro Met Pro Ile Pro Pro Pro Gln1250 1255 1260Ser Ser Leu Leu Gln Gln Thr Pro Pro Ala Ser Gly Tyr Gln Ser Pro1265 1270 1275 1280Asp Met Lys Ala Trp Gln Gln Gly Ala Met Gly Asn Asn Asn Val Phe1285 1290 1295Ser Gln Ala Val Gln Asn Gln Pro Thr Pro Ala Gln Pro Gly Val Tyr1300 1305 1310Asn Asn Met Ser Ile Thr Val Ser Met Ala Gly Gly Asn Thr Asn Val1315 1320 1325Gln Asn Met Asn Pro Met Met Gly Gln Met Gln Met Ser Ser Leu Gln1330 1335 1340Met Pro Gly Met Asn Thr Val Cys Pro Glu Gln Ile Asn Asp Pro Ala1345 1350 1355 1360Leu Arg His Thr Gly Leu Tyr Cys Asn Gln Leu Ser Ser Thr Asp Leu1365 1370 1375Leu Lys Thr Glu Ala Asp Gly Thr Gln Val Gln Gln Val Gln Val Phe1380 1385 1390Ala Asp Val Gln Cys Thr Val Asn Leu Val Gly Gly Asp Pro Tyr Leu1395 1400 1405Asn Gln Pro Gly Pro Leu Gly Thr Gln Lys Pro Thr Ala Gly Pro Gln1410 1415 1420Thr Pro Gln Ala Gln Gln Lys Ser Leu Leu Gln Gln Leu Leu Thr Glu1425 1430 1435 1440
權利要求
1.一種豬核受體輔激活因子1基因的蛋白編碼序列,其特徵在於,所獲得的豬NCOA-1基因蛋白編碼序列,具有SEQ ID NO.1中從第1-4323位的核苷酸序列,其與人、小鼠物種NCOA-1/SRC-1基因CDS序列同源性為93.73%。
2.根據權利要求1所述的豬核受體輔激活因子1基因的蛋白編碼序列,其特徵是,所述的獲得的豬NCOA-1基因蛋白編碼序列,具有SEQ ID NO.1所示的胺基酸序列的多肽、或其保守性變異多肽、或其活性片段,或其活性衍生物,其同人、小鼠、大鼠的胺基酸序列同源性為94.99%。
3.根據權利要求1所述的豬核受體輔激活因子1基因的蛋白編碼序列,其特徵是,所述的豬NCOA-1基因蛋白編碼序列,指與SEQ ID NO.1的胺基酸序列相比,有5-10個胺基酸被性質相似或相近的胺基酸所替換而形成多肽。
4.根據權利要求1或者2或者3所述的豬核受體輔激活因子1基因的蛋白編碼序列,其特徵是,所述的SEQ ID NO.1,在其中,電子克隆產物長度分別為144bp和747bp,其中1-3位為起始密碼子ATG,4321-4323位為終止密碼子TAA,1-4323位為編碼蛋白質區域(CDS),6個RT-PCR擴增產物克隆測序並驗證了電子克隆得到的部分序列,從而獲得基因全長。
5.根據權利要求1或者2或者3所述的豬核受體輔激活因子1基因的蛋白編碼序列,其特徵是,所述的SEQ ID NO.1,在其中,豬NCOA-1基因編碼1440個胺基酸。
全文摘要
一種用於生物基因工程領域的豬核受體輔激活因子1基因的蛋白編碼序列。具有SEQ ID NO.1中從第1-4323位的核苷酸序列,其同人、小鼠物種NCOA-1/SRC-1基因CDS序列同源性為93.73%。具有SEQ ID NO.1所示的胺基酸序列的多肽、或其保守性變異多肽、或其活性片段,或其活性衍生物,其同人、小鼠、大鼠的胺基酸序列同源性為94.99%。本發明能夠為人類乳腺癌、糖尿病、肥胖症等相關疾病的研究提供動物模型。參考其它哺乳動物NCOA-1/SRC-1基因序列,並利用同源克隆和電子克隆相結合的方法,克隆測序獲得豬NCOA-1基因的cDNA序列,並對不同物種NCOA-1基因的CDS序列進行同源性比較,將大大有益於今後研究NCOA-1基因與豬繁殖性能的關係以及人類相關疾病的研究。
文檔編號C12N15/12GK1699567SQ20051002638
公開日2005年11月23日 申請日期2005年6月2日 優先權日2005年6月2日
發明者潘玉春, 於丹丹, 白春豔, 王起山, 張令剛 申請人:上海交通大學

同类文章

一種新型多功能組合攝影箱的製作方法

一種新型多功能組合攝影箱的製作方法【專利摘要】本實用新型公開了一種新型多功能組合攝影箱,包括敞開式箱體和前攝影蓋,在箱體頂部設有移動式光源盒,在箱體底部設有LED脫影板,LED脫影板放置在底板上;移動式光源盒包括上蓋,上蓋內設有光源,上蓋部設有磨沙透光片,磨沙透光片將光源封閉在上蓋內;所述LED脫影

壓縮模式圖樣重疊檢測方法與裝置與流程

本發明涉及通信領域,特別涉及一種壓縮模式圖樣重疊檢測方法與裝置。背景技術:在寬帶碼分多址(WCDMA,WidebandCodeDivisionMultipleAccess)系統頻分復用(FDD,FrequencyDivisionDuplex)模式下,為了進行異頻硬切換、FDD到時分復用(TDD,Ti

個性化檯曆的製作方法

專利名稱::個性化檯曆的製作方法技術領域::本實用新型涉及一種檯曆,尤其涉及一種既顯示月曆、又能插入照片的個性化檯曆,屬於生活文化藝術用品領域。背景技術::公知的立式檯曆每頁皆由月曆和畫面兩部分構成,這兩部分都是事先印刷好,固定而不能更換的。畫面或為風景,或為模特、明星。功能單一局限性較大。特別是畫

一種實現縮放的視頻解碼方法

專利名稱:一種實現縮放的視頻解碼方法技術領域:本發明涉及視頻信號處理領域,特別是一種實現縮放的視頻解碼方法。背景技術: Mpeg標準是由運動圖像專家組(Moving Picture Expert Group,MPEG)開發的用於視頻和音頻壓縮的一系列演進的標準。按照Mpeg標準,視頻圖像壓縮編碼後包

基於加熱模壓的纖維增強PBT複合材料成型工藝的製作方法

本發明涉及一種基於加熱模壓的纖維增強pbt複合材料成型工藝。背景技術:熱塑性複合材料與傳統熱固性複合材料相比其具有較好的韌性和抗衝擊性能,此外其還具有可回收利用等優點。熱塑性塑料在液態時流動能力差,使得其與纖維結合浸潤困難。環狀對苯二甲酸丁二醇酯(cbt)是一種環狀預聚物,該材料力學性能差不適合做纖

一種pe滾塑儲槽的製作方法

專利名稱:一種pe滾塑儲槽的製作方法技術領域:一種PE滾塑儲槽一、 技術領域 本實用新型涉及一種PE滾塑儲槽,主要用於化工、染料、醫藥、農藥、冶金、稀土、機械、電子、電力、環保、紡織、釀造、釀造、食品、給水、排水等行業儲存液體使用。二、 背景技術 目前,化工液體耐腐蝕貯運設備,普遍使用傳統的玻璃鋼容

釘的製作方法

專利名稱:釘的製作方法技術領域:本實用新型涉及一種釘,尤其涉及一種可提供方便拔除的鐵(鋼)釘。背景技術:考慮到廢木材回收後再加工利用作業的方便性與安全性,根據環保規定,廢木材的回收是必須將釘於廢木材上的鐵(鋼)釘拔除。如圖1、圖2所示,目前用以釘入木材的鐵(鋼)釘10主要是在一釘體11的一端形成一尖

直流氧噴裝置的製作方法

專利名稱:直流氧噴裝置的製作方法技術領域:本實用新型涉及ー種醫療器械,具體地說是ー種直流氧噴裝置。背景技術:臨床上的放療過程極易造成患者的局部皮膚損傷和炎症,被稱為「放射性皮炎」。目前對於放射性皮炎的主要治療措施是塗抹藥膏,而放射性皮炎患者多伴有局部疼痛,對於止痛,多是通過ロ服或靜脈注射進行止痛治療

新型熱網閥門操作手輪的製作方法

專利名稱:新型熱網閥門操作手輪的製作方法技術領域:新型熱網閥門操作手輪技術領域:本實用新型涉及一種新型熱網閥門操作手輪,屬於機械領域。背景技術::閥門作為流體控制裝置應用廣泛,手輪傳動的閥門使用比例佔90%以上。國家標準中提及手輪所起作用為傳動功能,不作為閥門的運輸、起吊裝置,不承受軸向力。現有閥門

用來自動讀取管狀容器所載識別碼的裝置的製作方法

專利名稱:用來自動讀取管狀容器所載識別碼的裝置的製作方法背景技術:1-本發明所屬領域本發明涉及一種用來自動讀取管狀容器所載識別碼的裝置,其中的管狀容器被放在循環於配送鏈上的文檔匣或託架裝置中。本發明特別適用於,然而並非僅僅專用於,對引入自動分析系統的血液樣本試管之類的自動識別。本發明還涉及專為實現讀