新四季網

抗稻瘟病的水稻基團的製作方法

2023-09-12 16:00:20

專利名稱:抗稻瘟病的水稻基團的製作方法
技術領域:
本發明涉及調控植物稻瘟病抗性的基團,由所述基因編碼的蛋白質,及其用途。
稻瘟病(Blast disease)是植物(例如水稻)的一種嚴重疾病,該病由稻瘟病真菌Magnaporthe grisea引起。該病實際上損害了日本和很多其他水稻種植國的水稻產量。這種損害在低溫和高溼度環境尤其嚴重。這種疾病已經通過培育抗性品種和應用農藥得以清除。起初,存在抗該病的水稻品系。這些品系和品種具有抗特別種稻瘟病真菌的基團,這些基團曾被研究過很長時間。目前,約30種基因經鑑定屬稻瘟病抗性基團(Kinoshita,水稻遺傳學通訊,716-57(1990),Iwata,水稻遺傳學通訊,1312-35(1996),Iwata,水稻遺傳學通訊,147-22(1997))。這些基因被用於培育高抗性品種,結果,培育出大量抗性品種。然而,由於稻瘟病真菌新種的出現,導入的抗性基因逐漸失效(抗性品種的失效)。而且,稻瘟病抗性表達的分子機理以及稻瘟病真菌與抗性基因之間的相互作用仍然不清楚。
抗性基團Pi-b定位在水稻染色體2的長臂末端,並對由日本鑑定的除033b之外的所有稻瘟病真菌表現出抗性(表1)。
這種基因存在於印度尼西亞和馬來西亞的Indica品種例如Engkatek,Milek kuning,Tjina,和Tjahaja中。在日本,一種Pi-b純合併具有敏感品種Sasanishiki遺傳背景的TohokuIL9品系,已經由Miyagi Prefectural Furukawa農業實驗站培育出來。
然而,抗性表達機理還不清楚,而且Pi-b基因也沒有分離出來。
表1真菌菌株品種 基因 Ine Cho 2101 Ine TH89 Cho F67- Ine P-2b Ai7484- 69- -472-41 68- 57168 -13491A 150 182#003 #007 #013 #031 #033 #035 #047 #101 #303 #477b+Shin 2 - S S S S S S S S S SAichiasahi Pi-aS S S R S R S R S SInabawase Pi-iR S R R R S S R R SKanto 51 Pi-kR R S S S S R R R STsuyuake Pi-km R R R S S S R R R SFukunishikiPi-zR R R R R R S R R SYashiromochi Pi-ta R R R R R R R R S RPi No.4Pi-ta2 R R R R R R R R S RToride1Pi-zt R R R R R R R R R SOuu 316Pi-bR R R R S R R R R RR抗性S敏感性本發明的目的是提供一種抗稻瘟病的抗性基因Pi-b,與之功能相當的基因,及由上述基因編碼的蛋白質。本發明的另一目的是用該基因製備抗稻瘟病的植物。
本發明人利用基於圖譜的克隆從大染色體區分離出基因Pi-b,從而成功地分離到稻瘟病抗性基因。具體地說,本發明人還用分子標記進行了連鎖分析。首先,指定特異標記之間的染色體區為Pi-b基因座。然後,在指定區附近排列粘粒克隆以構建物理圖譜。然後確定所述克隆的核苷酸序列,以尋找包含核苷酸結合位點(NBS)的Pi-b候選基因區,所述結合位點發現普遍存在於幾種植物的抗性基因中。然後用抗稻瘟病品種構建cDNA文庫。利用上述候選基因組區域作為探針篩選基因文庫,分離與所述基因組區相對應的cDNA。在分離到的cDNA的核苷酸序列的基礎上製備寡核苷酸引物,利用該引物對由稻瘟病敏感和抗性品種製備的每個mRNA級分進行RT-PCR,以分析分離到的Pi-b的候選cDNA的表達模式。特異性擴增抗性品種中的cDNA。因此,本發明人發現分離到的cDNA克隆是Pi-b基因。本發明人還發現,可以利用分離到的基因或其同源基因產生抗稻瘟病植物,因為在分離到的基因和稻瘟病抗性之間存在密切關係。
本發明涉及水稻稻瘟病抗性基因Pi-b,其同源基因,以及由所述基因編碼的蛋白質。本發明還涉及利用所述基因製備抗稻瘟病植物的方法。本發明具體涉及下列內容(1)賦予植物抗稻瘟病抗性的蛋白質,其中所述蛋白質包括SEQ ID NO1所示的胺基酸序列,或其中一個或多個胺基酸被取代、缺失和/或添加得到的修飾序列,(2)賦予植物抗稻瘟病抗性的蛋白質,其中所述蛋白質由可與包含SEQ IDNO2和/或NO3核苷酸序列的DNA雜交的DNA編碼,(3)編碼蛋白質(1)或(2)的DNA,(4)包含DNA(3)的載體,(5)攜有載體(4)的宿主細胞,(6)(5)的宿主細胞,其中所述宿主細胞為植物細胞,(7)製備蛋白質(1)或(2)的方法,所述方法包括培養宿主細胞(5),(8)包括宿主細胞(6)的經轉化植物,(9)植物(8),其中所述植物為禾本科(Poaceae),(10)植物(8),其中所述植物為禾木科稻屬(P.oryza),(11)植物(8)、(9)或(10)之任一種,其中所述植物表現出抗稻瘟病的抗性,(12)與蛋白質(1)或(2)結合的抗體,和(13)包括至少15個核苷酸的DNA,其中所述DNA與DNA(3)特異性雜交。
圖的簡述

圖1顯示了初步連鎖分析後推定的Pi-b基因座區域。
圖2顯示了精密連鎖分析後推定的Pi-b基因座區域。
圖3所示為Pi-b候選cDNA在稻瘟病敏感和抗性品種中表達的RT-PCR分析結果的電泳模式照片。A中使用了包括cDNA克隆c23第二內含子的引物。B中使用了特異於4.6kb片段的引物,該引物包含緊鄰c23區的NBS。泳道1和2中使用的模板由來源於Sasanishiki和TohokuIL9的基因組DNA組成;泳道3和4中使用的模板分別為來源於TohokuIL9的粘粒克隆#40和#147;泳道5的模板為包含TohokuIL9的cDNAc23的質粒DNA;泳道6的模板為由TohokuIL9未處理葉製備的mRNA(200ng;下文的mRNA使用同樣量);泳道7,8和9的模板分別為用水稻稻瘟真菌接種TohokuIL9 12小時、24小時、或4天後,由其葉製備的mRNA;泳道10的模板來自Sasanishiki未處理葉的mRNA;泳道10和11的模板分別為用真菌接種Sasanishiki 12小時和24小時後,由其葉製備的mRNA;泳道12為無菌水。從上到下,分子量標記的大小分別為1.4k、1.0k、0.9k和0.6k。
圖4為Pi-b基因與已知抗性基因的保守區的比較。
發明詳述本發明涉及賦予植物抗稻瘟病表型的蛋白質。由「Pi-b」基因編碼的包括在本發明範圍的蛋白質內(下文稱為Pi-b蛋白)的胺基酸序列如SEQ IDNO1所示。已知編碼賦予水稻抗稻瘟病表型之蛋白質的Pi-b基因位於水稻染色體2大區域的某處。本發明人首次成功地鑑定了其基因座,並分離到單個基因。Pi-b蛋白賦予水稻對除033b之外的日本所有種稻瘟病真菌品種具有抗性。這是目前鑑定的基因中最寬範圍的抗性(表1)。Pi-b蛋白的這些特徵表明Pi-b蛋白或功能與其等同的蛋白質非常適於製備抗稻瘟病的植物品種。
製備與Pi-b蛋白功能等同的蛋白質是可能的,例如,可使用下述方法。在Pi-b蛋白的胺基酸序列中導入突變的方法是本領域技術人員的公知技術。即本領域技術人員能夠通過定點誘變技術(Kramer,W.和Fritz,H.-J.經帶缺口的雙鏈體DNA構建寡核苷酸定向誘變,酶學方法154350-367,(1987))改變Pi-b蛋白的胺基酸序列(SEQ ID NO1)以製備突變蛋白,其在功能上與Pi-b蛋白等同。胺基酸突變可以自發發生。本發明的蛋白質包括使野生型Pi-b蛋白胺基酸序列的一個或多個胺基酸被取代、缺失或添加得到,且與野生型Pi-b蛋白功能等同的蛋白質。該蛋白質中改變的胺基酸殘基的位置和數目沒有限制,只要改變後的蛋白質與野生型Pi-b蛋白功能等同即可。通常改變的胺基酸殘基不超過50個,優選不超過30個,更優選不超過10個,最優選不超過3個。此處所用的術語「與野生型Pi-b蛋白功能上等同」指改變後的蛋白質賦予植物抗稻瘟病的抗性。「賦予植物抗稻瘟病的抗性」指該蛋白質賦予至少一個植物品種對至少一種稻瘟病真菌的抗性。被賦予抗性的植物優選為禾本科,更優選禾本科水稻。可以通過下述幾條判斷是否蛋白質賦予植物抗稻瘟病的抗性,例如,(i)將某種稻瘟病真菌形成的孢子懸液用直接噴灑在幼小植物(例如,三到四周大的稻苗)上以接種稻瘟病真菌,(ii)接種後立即在25℃ 100%溼度下將接種後的植物培養24小時,然後在正常條件下培養約兩周,(iii)觀察是否局部損傷由於壞死而停止生長,這是含有抗性基因的植物超敏反應的結果,或者局部損傷特異性置仍繼續生長導致植物死亡(無抗性基因的植物)。
同時,雜交技術(Southern,E.M.,分子生物學雜誌,98,503,(1975))和聚合酶鏈反應(PCR)技術(Saiki,R.K.等,科學,2301350-1354(1985);Saiki,R.K.等,科學,239487-491(1988))是本領域技術人員已知的製備功能等同蛋白質的其它方法。即本領域技術人員通常能夠利用Pi-b基因的核苷酸序列(SEQ ID NO2或3)或其片段作為探針,或利用與Pi-b基因(SEQ IDNO2或3)特異性雜交的寡核苷酸引物,從水稻或其他植物中分離與Pi-b基因高度同源的DNA,從所述DNA獲得與Pi-b蛋白功能等同的蛋白質。本發明的蛋白質包括利用雜交技術或PCR技術分離到的與Pi-b蛋白功能等同的蛋白質。此處所述的「與Pi-b蛋白功能等同」指通過雜交技術或PCR技術分離到的蛋白質賦予植物抗稻瘟病抗性。除水稻外,利用上述技術分離基因所用的植物包括可以作為稻瘟病真菌宿主的作物,例如大麥屬、小麥屬、狗尾草屬、黍屬、稗屬、和薏苡屬(作物病害大全(1998),Kishi,K.編,Japan Agriculture Education Association)。通常,由分離到的基因編碼的蛋白質當功能上與Pi-b蛋白等同時,其胺基酸水平也與Pi-b蛋白高度同源。高度同源指同源性優選為30%或更高,更優選50%或更高,更優選70%或更高,最優選90%或更高。
本發明的蛋白質可以用本領域技術人員已知的方法,通過重組DNA技術製備為重組蛋白質,也可以為天然蛋白質。例如,可以通過在合適的表達載體中插入編碼本發明蛋白質的DNA,將所述載體導入合適的細胞,然後從所述轉化細胞中純化蛋白質以製備重組蛋白質。天然蛋白質可以如下製備,例如,將表達本發明蛋白質的細胞(例如水稻細胞)提取物上親合柱,該親合柱由用重組蛋白質或其片段免疫合適動物製備的抗體裝填,然後從所述柱上純化結合的蛋白質。
本發明也涉及編碼本發明蛋白質的DNA。本發明的DNA沒有限制,包括基因組DNA、cDNA、以及化學合成的DNA,只要該DNA編碼本發明的蛋白質即可。本發明的Pi-b cDNA和Pi-b基因組DNA的核苷酸序列分別如SEQ ID NO2和NO3所示。
本領域技術人員可以用標準方法製備基因組DNA或cDNA。例如,可以用兩個步驟製備基因組DNA。首先,利用含稻瘟病抗性基因的水稻品種(例如TohokuIL9)葉提取的基因組DNA構建基因組文庫(使用載體例如質粒、噬菌體、粘粒或BAC)。其次,利用以編碼本發明蛋白質(例如SEQ IDNO1或2)的DNA的核苷酸序列為基礎製備的探針,對上述擴展文庫進行菌落雜交或噬斑雜交。或者,利用特異性引物對編碼本發明蛋白質(例如SEQID NO1或2)的DNA進行PCR來製備基因組DNA。cDNA也可以利用下述方法製備,例如,用含稻瘟病抗性基因的水稻品種(例如TohokuIL9)葉提取的mRNA合成cDNA,然後將該cDNA插入載體例如λZAP以構建cDNA文庫,然後對該擴展文庫進行菌落雜交或噬斑雜交,或者如上述方法進行PCR。
本發明的DNA可以用來製備重組蛋白質或生產抗稻瘟病的轉化植物。通常,通過將編碼本發明蛋白質的DNA插入合適的表達載體,將所述載體導入合適的細胞,培養轉化細胞,純化表達出來的蛋白以製備重組蛋白質。重組蛋白質可以表達成與其他蛋白質融合的蛋白質以便於純化,例如,在大腸桿菌中與麥芽糖結合蛋白融合的蛋白質(New England Biolabs,USA,載體pMAL系列),與穀胱甘肽-S-轉移酶(GST)融合的蛋白質(Amersham Pharmacia Biotech,載體pGEX系列),或者經組氨酸標記的蛋白質(Novagen,pET系列)。對宿主細胞沒有限制,只要該細胞適於表達重組蛋白質即可。除了上述之腸桿菌外,還可以使用酵母菌或各種動物、植物、或昆蟲細胞。可以用各種本領域技術人員已知的方法將載體導入宿主細胞。例如,可以用鈣離子轉化法(Mandel,M.和Higa,A.,分子生物學雜誌53158-162,(1970);Hanahan,D.,分子生物學雜誌166557-580,(1983))將載體導入E.Coli。在宿主細胞表達的重組重白質可以用已知方法純化。當重組蛋白質被表達為與麥芽糖結合蛋白或其他蛋白質融合的形式時,可以很容易地用親合層析純化該重組蛋白質。
可以用本發明的DNA生產抗稻瘟病的轉化植物。換句話說,將編碼本發明蛋白質的DNA插入合適的載體,將該載體導入植物細胞,再生所得的轉化植物細胞。對所述載體沒有限制,只要該載體能夠表達插入植物細胞的基因即可。例如,可以使用含有在植物細胞中組成型基因表達的啟動子(例如花椰菜花葉病毒35S啟動子),或者由外源刺激物誘導的啟動子的載體。對用載體轉染的植物細胞沒有限制,但最好是禾本科植物細胞。除了水稻,還可以包括下列細胞,例如,大麥屬、小麥屬、狗尾草屬、黍屬、稗屬、和薏苡屬。此處所說的「植物細胞」包括各種形式的植物細胞,例如培養的細胞懸浮液、原生質體、葉切片、和愈傷組織。可以用已知方法將載體導入植物細胞,例如聚乙二醇法,電穿孔法、農桿菌介導的轉移,以及微粒轟擊。可以利用已知方法,使轉化的不同種類的植物細胞再生為植物(Toki等,(1995)植物生理學1001503-1507)。
另外,本發明涉及與本發明蛋白質結合的抗體。本發明抗體可以是多克隆抗體,也可以是單克隆抗體。多克隆抗體可以用下述方法製備,用本發明的純化蛋白質或其片段免疫免疫動物例如兔,一定時間後取血,除去凝血塊。單克隆抗體可以用下述方法製備,將骨髓瘤細胞與被上述蛋白質或其片段免疫過的動物的抗體生成細胞融合,分離表達所需抗體的單克隆細胞(雜交瘤),從所述細胞中提取抗體。獲得的抗體可以用於純化或檢測本發明的蛋白質。
另外,本發明還涉及與編碼本發明蛋白質的DNA特異性雜交的DNA,其包括至少15個核苷酸殘基。此處所說的「特異性雜交」指在標準雜交條件下,最好是嚴緊雜交條件下,該DNA可以與編碼本發明蛋白的DNA雜交,而不與任何編碼其他蛋白質的DNA雜交。該DNA可以用於,例如,作為探針以檢測或分離編碼本發明蛋白質的DNA,或者作為PCR擴增的引物。DNA的一個例子為由至少15個與SEQ ID NO2或NO3的核苷酸序列互補的核苷酸組成。
本發明提供了稻瘟病抗性基因Pi-b,其功能等同基因,以及由上述基因編碼的蛋白質。本發明的抗病基因賦予植物對廣譜的稻瘟病真菌抗性。因此,例如,當將該基因導入有益作物例如水稻時,所述基因對控制該病害以及提高作物產量將極為有利。
下面將參考實施例對本發明作詳細描述,但該實施例不構成對本發明的限制。
實施例1初步連鎖分析為確定Pi-b基因在水稻染色體2連鎖圖譜中的大概位置,首先利用DNA標記進行連鎖分析。使用的來源為94個植株的分離群體,得自Sasanishiki與Sasanishiki和TohokuIL9之間雜交的F1代之間兩個回交的F1代的自體受精。連鎖分析表明Pi-b基因定位於染色體2的RFLP標記C2782和C379之間,其間被R1792、R257和R2821共分隔(cosegregate)(日本育種協會,第87次會議,圖1)。
實施例2精密連鎖分析對大量分離的群體進行分析以分離基因。從上述94個植株群體中,選擇出20個對Pi-b基因座為雜的植株,將約20,000個分離群體的種子,包括自體受精種子用於分析(日本育種協會,第89次會議)。分析中,使用了集中取樣法(pool sampling method)以減小任務量(Churchill等,美國國家科學進展9016-20(1993))。
為增加連鎖分析的精確性,需要增加目標基因附近的DNA標記的數量,並增大取樣的群體。因此,亞克隆經初步連鎖分析確定的具有Pi-b基因座的YAC克隆,以增加Pi-b基因附近的DNA標記數量(Monna等,遺傳學理論和應用94170-176(1997))。利用大群體進行連鎖分析,將Pi-b基因座縮小到RFLP標記S1916和G7073之間的區域。另外,Pi-b基因被三種RFLP標記共同分隔開(G7010、G7021和G7023;圖2)。
實施例3用粘粒克隆排列Pi-b基因座為進一步縮小Pi-b基因座的範圍,使用粘粒克隆進行排列。從含有抗性基因的TohokuIL9中,用CTAB法提取基因組DNA。然後用限制性核酸內切酶Sau3A部分消化上述DNA。用蔗糖密度梯度離心法從消化產物中分級分離約30-50kb的片段。得到的DNA片段和粘粒載體SuperCos(Stratagene,Wahl等,Proc.Natl.Acad.Sci.USA 842160-2164(1987))用於構建粘粒文庫。利用Pi-b基因座附近的五個DNA克隆(S1916、G7010、G7021、G7023和G7030)作為探針篩選粘粒文庫。結果選擇出六個粘粒克降(COS140、COS147、COS117、COS137、COS205和COS207)。這些克隆的限制性圖譜的構建和其重疊區域的檢測表明,Pi-b基因座位於由三個克隆(COS140、COS147、和COS117;圖2)覆蓋的基因組區域。
實施例4序列分析確定候選基因組區對推測含有Pi-b基因的三個排列的粘粒克隆進行亞克隆,部分分析它們的核苷酸序列。利用在公共核苷酸資料庫中進行BLAST同源性檢索,分析獲得的核苷酸序列。結果表明,從COS140獲得的2.3kb克隆的部分核苷酸序列和從COS147獲得的4.6kb克隆的部分核苷酸序列包含核苷酸結合位點(NBS),所述位點普遍存在於幾種植物的抗性基因中,例如,擬南芥屬(Arabidoposis)中的PRM1病抗性基因中。因此,這些核苷酸序列有望成為Pi-b基因的候選區。
實施例5cDNA的分離和序列分析分離cDNA,以檢測是否核苷酸序列分析揭示的候選區在抗性品種TohokuIL9中得以表達。使抗性品種TohokuIL9發芽,待小苗長出四片葉子時,按照標準方法接種稻瘟病真菌TH68-141(003種)。然後在接種後的三個時間點,即6小時、12小時、和24小時,收集葉片。從樣品中提取信使RNA,並構建cDNA文庫。進一步亞克隆候選基因組區的2.3kb的片段,得到1kb的片段(SEQ ID NO3的3471-4507位),將該片段用作篩選上述文庫的探針。結果選擇出八個cDNA克隆。該克隆的序列分析表明,c23的核苷酸序列與粘粒克降COS 140的核苷酸序列完全配對。因此確定候選基因組區在TohokuIL9中表達。選擇出的c23克隆約有4kb,估計包含該基因的幾乎全部區域。確定了該克隆的全部核苷酸序列(SEQ ID NO2)。
實施例6候選cDNA表達模式的分析在敏感品種(Sasanishiki)和抗性品種(TohokuIL9)中,發現候選cDNA區的不同表達模式。用003種稻瘟病真菌接種處於4葉期的上述兩個品種,接種後6小時、12小時和24小時,收集葉片。然後提取mRNA,用作RT-PCR的模板。在cDNA克隆c23核苷酸序列基礎上設計了引物SEQ ID NO4/5′-AGGGAAAAATGGAAATGTGC-3′(反義鏈)和SEQ ID NO5/5′-AGTAACCTTCTGCTGCCCAA-3′(有義鏈)用於RT-PCR以特異性擴增該區。PCT條件如下94℃2分鐘循環1次;94℃1分鐘,55℃2分鐘,72℃3分鐘,循環30次;72℃7分鐘循環1次。PCR後,檢測到抗性品種TohokuIL9中的特異性擴增,但用敏感品種(Sasanishiki;圖3)的mRNA沒有檢測到擴增。這表明cDNA克隆c23在抗性品種中特異性表達。同時,在包含NBS並臨近c23區的4.6kb片段的核苷酸序列基礎上設計了引物SEQID NO6/5′-TTACCATCCCAGCAATCAGC-3′(有義鏈)和SEQ ID NO7/5′-AGACACCCTGCCACACAACA-3′(反義鏈),利用該引物進行RT-PCR。該4.6kb片段區既不在敏感品種(Sasanishiki)中擴增,也不在抗性品種(TohokuIL9;圖3)中擴增。進一步表明克隆c23的相應基因組區是Pi-b基因座。
實施例7Pi-b候選基因的基因組DNA的序列分析確定了對應於cDNA克隆c23的基區組區的完全核苷酸序列。用五種不同的限制酶酶切,對粘粒克隆COS 140進行亞克隆,儘可能地從兩端確定得到的亞克隆重的核苷酸序列。不適合上述分析的區域,通過刪除切割得更短後,再進行DNA測序。確定的區域擴展到10.3kb(SEQ ID NO3)。
實施例8Pi-b基因的結構Pi-b的候選cDNA c23全長有3925個鹼基對,並含有3618個鹼基對的ORF,該ORF包含由兩個內含子分隔開的三個外顯子。Pi-b翻譯產物為含有1205個胺基酸殘基的蛋白質(SEQ ID NO1),該蛋白質含有在很多抗性基因中可發現的兩個NBS(386-395位胺基酸的P-環,和474-484位的激酶2),以及三個保守區(1區在503-513位胺基酸,2區在572-583位,3區在631-638位)。這些區域與已知抗性基因例如RPM1的保守區表現高度同源性(圖4)。同時,該基因在3′-側還含有12個不完全的、富含亮氨酸的重複序列(LRR在755-1058胺基酸位置)。這些結構與以前報導的NBS-LRR類抗性基因具有非常高度的同源性。基於上述結果,本發明人論斷上述經分析的cDNA和對應的基因組區為稻瘟病抗性基因Pi-b。
序列表(1)一般資料(i)申請人NAKAGAWARA Masahiro,Director General of THENATIONAL INSTITUTE OF AGROBIOLOGICAL RESOURCES(NIAR),MAFF SOCIETY for TECHNO-INNOVATION of AGRICUTURE,FORESTRYand FISHERIES(ii)發明題目抗稻瘟病的水稻基因(iii)序列數7(v)計算機可讀形式(A)介質類型軟盤-3.50英寸,1.44Mb內存(B)計算機IBMPC(C)作業系統MS-DOS 3.30版本或更高(D)軟體(2)SEQ ID NO1的資料(i)序列特徵(A)長度1205(B)類型胺基酸(D)拓撲結構線性(ii)分子類型蛋白質(xi)序列描述SEQ ID NO1Met Met Arg Ser Phe Met Met Glu Ala His1 5 10Glu Glu Gln Asp Asn Ser Lys Val Val Lys Thr Trp Val Lys Gln Val15 20 25Arg Asp Thr Ala Tyr Asp Val Glu Asp Ser Leu Gln Asp Phe Ala Val
30 35 40His Leu Lys Arg Pro Ser Trp Trp Arg Phe Pro Arg Thr Leu Leu Glu45 50 55Arg His Arg Val Ala Lys Gln Met Lys Glu Leu Arg Asn Lys Val Glu60 65 70Asp Val Ser Gln Arg Asn Val Arg Tyr His Leu Ile Lys Gly Ser Ala75 80 85 90Lys Ala Thr Ile Asn Ser Thr Glu Gln Ser Ser Val Ile Ala Thr Ala95 100 105Ile Phe Gly Ile Asp Asp Ala Arg Arg Ala Ala Lys Gln Asp Asn Gln110 115 120Arg Val Asp Leu Val Gln Leu Ile Asn Ser Glu Asp Gln Asp Leu Lys125 130 135Val Ile Ala Val Trp Gly Thr Ser Gly Asp Met Gly Gln Thr Thr Ile140 145 150Ile Arg Met Ala Tyr Glu Asn Pro Asp Val Gln Ile Arg Phe Pro Cys155 160 165 170Arg Ala Trp Val Arg Val Met His Pro Phe Ser Pro Arg Asp Phe Val175 180 185Gln Ser Leu Val Asn Gln Leu His Ala Thr Gln Gly Val Glu Ala Leu190 195 200Leu Glu Lys Glu Lys Thr Glu Gln Asp Leu Ala Lys Lys Phe Asn Gly205 210 215Cys Val Asn Asp Arg Lys Cys Leu Ile Val Leu Asn Asp Leu Ser Thr220 225 230Ile Glu Glu Trp Asp Gln Ile Lys Lys Cys Phe Gln Lys Cys Arg Lys235 240 245 250Gly Ser Arg Ile Ile Val Ser Ser Thr Gln Val Glu Val Ala Ser Leu255 260 265Cys Ala Gly Gln Glu Ser Gln Ala Ser Glu Leu Lys Gln Leu Ser Ala270 275 280Asp Gln Thr Leu Tyr Ala Phe Tyr Asp Lys Gly Ser Gln Ile Ile Glu285 290 295Asp Ser Val Lys Pro Val Ser Ile Ser Asp Val Ala Ile Thr Ser Thr300 305 310Asn Asn His Thr Val Ala His Gly Glu Ile Ile Asp Asp Gln Ser Met315 320 325 330Asp Ala Asp Glu Lys Lys Val Ala Arg Lys Ser Leu Thr Arg Ile Arg335 340 345Thr Ser Val Gly Ala Ser Glu Glu Ser Gln Leu Ile Gly Arg Glu Lys350 355 360Glu Ile Ser Glu Ile Thr His Leu Ile Leu Asn Asn Asp Ser Gln Gln365 370 375Val Gln Val Ile Ser Val Trp Gly Met Gly Gly Leu Gly Lys Thr Thr380 385 390Leu Val Ser Gly Val Tyr Gln Ser Pro Arg Leu Ser Asp Lys Phe Asp395 400 405 410Lys Tyr Val Phe Val Thr Ile Met Arg Pro Phe Ile Leu Val Glu Leu415 420 425Leu Arg Ser Leu Ala Glu Gln Leu His Lys Gly Ser Ser Lys Lys Glu430 435 440Glu Leu Leu Glu Asn Arg Val Ser Ser Lys Lys Ser Leu Ala Ser Met445 450 455Glu Asp Thr Glu Leu Thr Gly Gln Leu Lys Arg Leu Leu Glu Lys Lys
460 465 470Ser Cys Leu Ile Val Leu Asp Asp Phe Ser Asp Thr Ser Glu Trp Asp475 480 485 490Gln Ile Lys Pro Thr Leu Phe Pro Leu Leu Glu Lys Thr Ser Arg Ile495 500 505Ile Val Thr Thr Arg Lys Glu Asn Ile Ala Asn His Cys Ser Gly Lys510 515 520Asn Gly Asn Val His Asn Leu Lys Val Leu Lys His Asn Asp Ala Leu525 530 535Cys Leu Leu Ser Glu Lys Val Phe Glu Glu Ala Thr Tyr Leu Asp Asp540 545 550Gln Asn Asn Pro Glu Leu Val Lys Glu Ala Lys Gln Ile Leu Lys Lys555 560 565 570Cys Asp Gly Leu Pro Leu Ala Ile Val Val Ile Gly Gly Phe Leu Ala575 580 585Asn Arg Pro Lys Thr Pro Glu Glu Trp Arg Lys Leu Asn Glu Asn Ile590 595 600Asn Ala Glu Leu Glu Met Asn Pro Glu Leu Gly Met Ile Arg Thr Val605 610 615Leu Glu Lys Ser Tyr Asp Gly Leu Pro Tyr His Leu Lys Ser Cys Phe620 625 630Leu Tyr Leu Ser Ile Phe Pro Glu Asp Gln Ile Ile Ser Arg Arg Arg635 640 645 650Leu Val His Arg Trp Ala Ala Glu Gly Tyr Ser Thr Ala Ala His Gly655 660 665Lys Ser Ala Ile Glu Ile Ala Asn Gly Tyr Phe Met Glu Leu Lys Asn670 675 680Arg Ser Met Ile Leu Pro Phe Gln Gln Ser Gly Ser Ser Arg Lys Ser685 690 695Ile Asp Ser Cys Lys Val His Asp Leu Met Arg Asp Ile Ala Ile Ser700 705 710Lys Ser Thr Glu Glu Asn Leu Val Phe Arg Val Glu Glu Gly Cys Ser715 720 725 730Ala Tyr Ile His Gly Ala Ile Arg His Leu Ala Ile Ser Ser Asn Trp735 740 745Lys Gly Asp Lys Ser Glu Phe Glu Gly Ile Val Asp Leu Ser Arg Ile750 755 760Arg Ser Leu Ser Leu Phe Gly Asp Trp Lys Pro Phe Phe Val Tyr Gly765 770 775Lys Met Arg Phe Ile Arg Val Leu Asp Phe Glu Gly Thr Arg Gly Leu780 785 790Glu Tyr His His Leu Asp Gln Ile Trp Lys Leu Asn His Leu Lys Phe795 800 805 810Leu Ser Leu Arg Gly Cys Tyr Arg Ile Asp Leu Leu Pro Asp Leu Leu815 820 825Gly Asn Leu Arg Gln Leu Gln Met Leu Asp Ile Arg Gly Thr Tyr Val830 835 840Lys Ala Leu Pro Lys Thr Ile Ile Lys Leu Gln Lys Leu Gln Tyr Ile845 850 855His Ala Gly Arg Lys Thr Asp Tyr Val Trp Glu Glu Lys His Ser Leu860 865 870Met Gln Arg Cys Arg Lys Val Gly Cys Ile Cys Ala Thr Cys Cys Leu875 880 885 890Pro Leu Leu Cys Glu Met Tyr Gly Pro Leu His Lys Ala Leu Ala Arg
895 900 905Arg Asp Ala Trp Thr Phe Ala Cys Cys Val Lys Phe Pro Ser Ile Met910 915 920Thr Gly Val His Glu Glu Glu Gly Ala Met Val Pro Ser Gly Ile Arg925 930 935Lys Leu Lys Asp Leu His Thr Leu Arg Asn Ile Asn Val Gly Arg Gly940 945 950Asn Ala Ile Leu Arg Asp Ile Gly Met Leu Thr Gly Leu His Lys Leu955 960 965 970Gly Val Ala Gly Ile Asn Lys Lys Asn Gly Arg Ala Phe Arg Leu Ala975 980 985Ile Ser Asn Leu Asn Lys Leu Glu Ser Leu Ser Val Ser Ser Ala Gly990 995 1000Met Pro Gly Leu Cys Gly Cys Leu Asp Asp Ile Ser Ser Pro Pro Glu100510101015Asn Leu Gln Ser Leu Lys Leu Tyr Gly Ser Leu Lys Thr Leu Pro Glu102010251030Trp Ile Lys Glu Leu Gln His Leu Val Lys Leu Lys Leu Val Ser Thr1035 104010451050Arg Leu Leu Glu His Asp Val Ala Met Glu Phe Leu Gly Glu Leu Pro105510601065Lys Val Glu Ile Leu Val Ile Ser Pro Phe Lys Ser Glu Glu Ile His107010751080Phe Lys Pro Pro Gln Thr Gly Thr Ala Phe Val Ser Leu Arg Val Leu108510901095Lys Leu Ala Gly Leu Trp Gly Ile Lys Ser Val Lys Phe Glu Glu Gly110011051110Thr Met Pro Lys Leu Glu Arg Leu Gln Val Gln Gly Arg Ile Glu Asn1115 112011251130Glu Ile Gly Phe Ser Gly Leu Glu Phe Leu Gln Asn Ile Asn Glu Val113511401145Gln Leu Ser Val Trp Phe Pro Thr Asp His Asp Arg Ile Arg Ala Ala115011551160Arg Ala Ala Gly Ala Asp Tyr Glu Thr Ala Trp Glu Glu Glu Val Gln116511701175Glu Ala Arg Arg Lys Gly Gly Glu Leu Lys Arg Lys Ile Arg Glu Gln118011851190Leu Ala Arg Asn Pro Asn Gln Pro Ile Ile Thr1195 12001205(2)SEQ ID NO2的資料(i)序列特徵(A)長度3925個鹼基對(B)類型核酸(C)鏈型雙鏈(D)拓撲結構線性(ii)分子類型cDNA到mRNA(ix)特徵(A)名稱/關鍵詞CDS(B)位置82..3696(C)鑑定方法EGCAAAATCTG CATTTGCTGA GGAGGTGGCC TTGCAGCTTG GTATCCAGAA AGACCACACA 60TTTGTTGCAG ATGAGCTTGA G ATG ATG AGG TCT TTC ATG ATG GAG GCG CAC 111Met Met Arg Ser Phe Met Met Glu Ala His1 5 10GAG GAG CAA GAT AAC AGC AAG GTG GTC AAG ACT TGG GTG AAG CAA GTC 159Glu Glu Gln Asp Asn Ser Lys Val Val Lys Thr Trp Val Lys Gln Val15 20 25CGT GAC ACT GCC TAT GAT GTT GAG GAC AGC CTC CAG GAT TTC GCT GTT 207Arg Asp Thr Ala Tyr Asp Val Glu Asp Ser Leu Gln Asp Phe Ala Val30 35 40CAT CTT AAG AGG CCA TCC TGG TGG CGA TTT CCT CGT ACG CTG CTC GAG 255His Leu Lys Arg Pro Ser Trp Trp Arg Phe Pro Arg Thr Leu Leu Glu45 50 55CGG CAC CGT GTG GCC AAG CAG ATG AAG GAG CTT AGG AAC AAG GTC GAG 303Arg His Arg Val Ala Lys Gln Met Lys Glu Leu Arg Asn Lys Val Glu60 65 70GAT GTC AGC CAG AGG AAT GTG CGG TAC CAC CTC ATC AAG GGC TCT GCC 351Asp Val Ser Gln Arg Asn Val Arg Tyr His Leu Ile Lys Gly Ser Ala75 80 85 90AAG GCC ACC ATC AAT TCC ACT GAG CAA TCT AGC GTT ATT GCT ACA GCC 399Lys Ala Thr Ile Asn Ser Thr Glu Gln Ser Ser Val Ile Ala Thr Ala95 100 105ATA TTC GGC ATT GAC GAT GCA AGG CGT GCC GCA AAG CAG GAC AAT CAG 447Ile Phe Gly Ile Asp Asp Ala Arg Arg Ala Ala Lys Gln Asp Asn Gln110 115 120AGA GTG GAT CTT GTC CAA CTA ATC AAC AGT GAG GAT CAG GAC CTA AAA 495Arg Val Asp Leu Val Gln Leu Ile Asn Ser Glu Asp Gln Asp Leu Lys125 130 135GTG ATC GCG GTC TGG GGA ACA AGT GGT GAT ATG GGC CAA ACA ACA ATA 543Val Ile Ala Val Trp Gly Thr Ser Gly Asp Met Gly Gln Thr Thr Ile140 145 150ATC AGG ATG GCT TAT GAG AAC CCA GAT GTC CAA ATC AGA TTC CCA TGC 591Ile Arg Met Ala Tyr Glu Asn Pro Asp Val Gln Ile Arg Phe Pro Cys155 160 165 170CGT GCA TGG GTA AGG GTG ATG CAT CCT TTC AGT CCA AGA GAC TTT GTC 639Arg Ala Trp Val Arg Val Met His Pro Phe Ser Pro Arg Asp Phe Val175 180 185CAG AGC TTG GTG AAT CAG CTT CAT GCA ACC CAA GGG GTT GAA GCT CTG 687Gln Ser Leu Val Asn Gln Leu His Ala Thr Gln Gly Val Glu Ala Leu190 195 200TTG GAG AAA GAG AAG ACA GAA CAA GAT TTA GCT AAG AAA TTC AAT GGA 735Leu Glu Lys Glu Lys Thr Glu Gln Asp Leu Ala Lys Lys Phe Asn Gly205 210 215TGT GTG AAT GAT AGG AAG TGT CTA ATT GTG CTT AAT GAC CTA TCC ACC 783Cys Val Asn Asp Arg Lys Cys Leu Ile Val Leu Asn Asp Leu Ser Thr220 225 230ATT GAA GAG TGG GAC CAG ATT AAG AAA TGC TTC CAA AAA TGC AGG AAA 831Ile Glu Glu Trp Asp Gln Ile Lys Lys Cys Phe Gln Lys Cys Arg Lys235 240 245 250GGA AGC CGA ATC ATA GTG TCA AGC ACT CAA GTT GAA GTT GCA AGC TTA 879Gly Ser Arg Ile Ile Val Ser Ser Thr Gln Val Glu Val Ala Ser Leu255 260 265TGT GCT GGG CAA GAA AGC CAA GCC TCA GAG CTA AAG CAA TTG TCT GCT 927Cys Ala Gly Gln Glu Ser Gln Ala Ser Glu Leu Lys Gln Leu Ser Ala270 275 280GAT CAG ACC CTT TAC GCA TTC TAC GAC AAG GGT TCC CAA ATT ATA GAG 975Asp Gln Thr Leu Tyr Ala Phe Tyr Asp Lys Gly Ser Gln Ile Ile Glu285 290 295GAT TCA GTG AAG CCA GTG TCT ATC TCG GAT GTG GCC ATC ACA AGT ACA 1023Asp Ser Val Lys Pro Val Ser Ile Ser Asp Val Ala Ile Thr Ser Thr300 305 310AAC AAT CAT ACA GTG GCC CAT GGT GAG ATT ATA GAT GAT CAA TCA ATG 1071Asn Asn His Thr Val Ala His Gly Glu Ile Ile Asp Asp Gln Ser Met315 320 325 330GAT GCT GAT GAG AAG AAG GTG GCT AGA AAG AGT CTT ACT CGC ATT AGG 1119Asp Ala Asp Glu Lys Lys Val Ala Arg Lys Ser Leu Thr Arg Ile Arg335 340 345ACA AGT GTT GGT GCT TCG GAG GAA TCA CAA CTT ATT GGG CGA GAG AAA 1167Thr Ser Val Gly Ala Ser Glu Glu Ser Gln Leu Ile Gly Arg Glu Lys350 355 360GAA ATA TCT GAA ATA ACA CAC TTA ATT TTA AAC AAT GAT AGC CAG CAG 1215Glu Ile Ser Glu Ile Thr His Leu Ile Leu Asn Asn Asp Ser Gln Gln365 370 375GTT CAG GTG ATC TCT GTG TGG GGA ATG GGT GGC CTT GGA AAA ACC ACC 1263Val Gln Val Ile Ser Val Trp Gly Met Gly Gly Leu Gly Lys Thr Thr380 385 390CTA GTA AGC GGT GTT TAT CAA AGC CCA AGG CTG AGT GAT AAG TTT GAC 1311Leu Val Ser Gly Val Tyr Gln Ser Pro Arg Leu Ser Asp Lys Phe Asp395 400 405 410AAG TAT GTT TTT GTC ACA ATC ATG CGT CCT TTC ATT CTT GTA GAG CTC 1359Lys Tyr Val Phe Val Thr Ile Met Arg Pro Phe Ile Leu Val Glu Leu415 420 425CTT AGG AGT TTG GCT GAG CAA CTA CAT AAA GGA TCT TCT AAG AAG GAA 1407Leu Arg Ser Leu Ala Glu Gln Leu His Lys Gly Ser Ser Lys Lys Glu430 435 440GAA CTG TTA GAA AAT AGA GTC AGC AGT AAG AAA TCA CTA GCA TCG ATG 1455Glu Leu Leu Glu Asn Arg Val Ser Ser Lys Lys Ser Leu Ala Ser Met445 450 455GAG GAT ACC GAG TTG ACT GGG CAG TTG AAA AGG CTT TTA GAA AAG AAA 1503Glu Asp Thr Glu Leu Thr Gly Gln Leu Lys Arg Leu Leu Glu Lys Lys460 465 470AGT TGC TTG ATT GTT CTA GAT GAT TTC TCA GAT ACC TCA GAA TGG GAC 1551Ser Cys Leu Ile Val Leu Asp Asp Phe Ser Asp Thr Ser Glu Trp Asp475 480 485 490CAG ATA AAA CCA ACG TTA TTC CCC CTG TTG GAA AAG ACA AGC CGA ATA 1599Gln Ile Lys Pro Thr Leu Phe Pro Leu Leu Glu Lys Thr Ser Arg Ile495 500 505ATT GTG ACT ACA AGA AAA GAG AAT ATT GCC AAC CAT TGC TCA GGG AAA 1647Ile Val Thr Thr Arg Lys Glu Asn Ile Ala Asn His Cys Ser Gly Lys510 515 520AAT GGA AAT GTG CAC AAC CTT AAA GTT CTT AAA CAT AAT GAT GCA TTG 1695Asn Gly Asn Val His Asn Leu Lys Val Leu Lys His Asn Asp Ala Leu525 530 535TGC CTC TTG AGT GAG AAG GTA TTT GAG GAG GCT ACA TAT TTG GAT GAT 1743Cys Leu Leu Ser Glu Lys Val Phe Glu Glu Ala Thr Tyr Leu Asp Asp540 545 550CAG AAC AAT CCA GAG TTG GTT AAA GAA GCA AAA CAA ATC CTA AAG AAG 1791Gln Asn Asn Pro Glu Leu Val Lys Glu Ala Lys Gln Ile Leu Lys Lys555 560 565 570TGC GAT GGA CTG CCC CTT GCA ATA GTT GTC ATA GGT GGA TTC TTG GCA 1839Cys Asp Gly Leu Pro Leu Ala Ile Val Val Ile Gly Gly Phe Leu Ala575 580 585AAC CGA CCA AAG ACC CCA GAA GAG TGG AGA AAA TTG AAC GAG AAT ATC 1887Asn Arg Pro Lys Thr Pro Glu Glu Trp Arg Lys Leu Asn Glu Asn Ile590 595 600AAT GCT GAG TTG GAA ATG AAT CCA GAG CTT GGA ATG ATA AGA ACC GTC 1935Asn Ala Glu Leu Glu Met Asn Pro Glu Leu Gly Met Ile Arg Thr Val605 610 615CTT GAA AAA AGC TAT GAT GGT TTA CCA TAC CAT CTC AAG TCA TGT TTT 1983Leu Glu Lys Ser Tyr Asp Gly Leu Pro Tyr His Leu Lys Ser Cys Phe620 625 630TTA TAT CTG TCC ATT TTC CCT GAA GAC CAG ATC ATT AGT CGA AGG CGT 2031Leu Tyr Leu Ser Ile Phe Pro Glu Asp Gln Ile Ile Ser Arg Arg Arg635 640 645 650TTG GTG CAT CGT TGG GCA GCA GAA GGT TAC TCA ACT GCA GCA CAT GGG 2079Leu Val His Arg Trp Ala Ala Glu Gly Tyr Ser Thr Ala Ala His Gly655 660 665AAA TCT GCC ATT GAA ATA GCT AAC GGC TAC TTC ATG GAA CTC AAG AAT 2127Lys Ser Ala Ile Glu Ile Ala Asn Gly Tyr Phe Met Glu Leu Lys Asn670 675 680AGA AGC ATG ATT TTA CCA TTC CAG CAA TCA GGT AGC AGC AGG AAA TCA 2175Arg Ser Met Ile Leu Pro Phe Gln Gln Ser Gly Ser Ser Arg Lys Ser685 690 695ATT GAC TCT TGC AAA GTC CAT GAT CTC ATG CGT GAC ATC GCC ATC TCA 2223Ile Asp Ser Cys Lys Val His Asp Leu Met Arg Asp Ile Ala Ile Ser700 705 710AAG TCA ACG GAG GAA AAC CTT GTT TTT AGG GTG GAG GAA GGC TGC AGC 2271Lys Ser Thr Glu Glu Asn Leu Val Phe Arg Val Glu Glu Gly Cys Ser715 720 725 730GCG TAC ATA CAT GGT GCA ATT CGT CAT CTT GCT ATA AGT AGC AAC TGG 2319Ala Tyr Ile His Gly Ala Ile Arg His Leu Ala Ile Ser Ser Asn Trp735 740 745AAG GGA GAT AAG AGT GAA TTC GAG GGC ATA GTG GAC CTG TCC CGA ATA 2367Lys Gly Asp Lys Ser Glu Phe Glu Gly Ile Val Asp Leu Ser Arg Ile750 755 760CGA TCG TTA TCT CTG TTT GGG GAT TGG AAG CCA TTT TTT GTT TAT GGC 2415Arg Ser Leu Ser Leu Phe Gly Asp Trp Lys Pro Phe Phe Val Tyr Gly765 770 775AAG ATG AGG TTT ATA CGA GTG CTT GAC TTT GAA GGG ACT AGA GGT CTA 2463Lys Met Arg Phe Ile Arg Val Leu Asp Phe Glu Gly Thr Arg Gly Leu780 785 790GAA TAT CAT CAC CTT GAT CAG ATT TGG AAG CTT AAT CAC CTA AAA TTC 2511Glu Tyr His His Leu Asp Gln Ile Trp Lys Leu Asn His Leu Lys Phe795 800 805 810CTT TCT CTA CGA GGA TGC TAT CGT ATT GAT CTA CTG CCA GAT TTA CTG 2559Leu Ser Leu Arg Gly Cys Tyr Arg Ile Asp Leu Leu Pro Asp Leu Leu815 820 825GGC AAC CTG AGG CAA CTC CAG ATG CTA GAC ATC AGA GGT ACA TAT GTA 2607Gly Asn Leu Arg Gln Leu Gln Met Leu Asp Ile Arg Gly Thr Tyr Val830 835 840AAG GCT TTG CCA AAA ACC ATC ATC AAG CTT CAG AAG CTA CAG TAC ATT 2655Lys Ala Leu Pro Lys Thr Ile Ile Lys Leu Gln Lys Leu Gln Tyr Ile845 850 855CAT GCT GGG CGC AAA ACA GAC TAT GTA TGG GAG GAA AAG CAT AGT TTA 2703His Ala Gly Arg Lys Thr Asp Tyr Val Trp Glu Glu Lys His Ser Leu860 865 870ATG CAG AGG TGT CGT AAG GTG GGA TGT ATA TGT GCA ACA TGT TGC CTC 2751Met Gln Arg Cys Arg Lys Val Gly Cys Ile Cys Ala Thr Cys Cys Leu875 880 885 890CCT CTT CTT TGC GAA ATG TAT GGC CCT CTC CAT AAG GCC CTA GCC CGG 2799Pro Leu Leu Cys Glu Met Tyr Gly Pro Leu His Lys Ala Leu Ala Arg895 900 905CGT GAT GCG TGG ACT TTC GCT TGC TGC GTG AAA TTC CCA TCT ATC ATG 2847Arg Asp Ala Trp Thr Phe Ala Cys Cys Val Lys Phe Pro Ser Ile Met910 915 920ACG GGA GTA CAT GAA GAG GAA GGC GCT ATG GTG CCA AGT GGG ATT AGA 2895Thr Gly Val His Glu Glu Glu Gly Ala Met Val Pro Ser Gly Ile Arg925 930 935AAA CTG AAA GAC TTG CAC ACA CTA AGG AAC ATA AAT GTC GGA AGG GGA 2943Lys Leu Lys Asp Leu His Thr Leu Arg Asn Ile Asn Val Gly Arg Gly940 945 950AAT GCC ATC CTA CGA GAT ATC GGA ATG CTC ACA GGA TTA CAC AAG TTA 2991Asn Ala Ile Leu Arg Asp Ile Gly Met Leu Thr Gly Leu His Lys Leu955 960 965 970GGA GTG GCT GGC ATC AAC AAG AAG AAT GGA CGA GCG TTT CGC TTG GCC 3039Gly Val Ala Gly Ile Asn Lys Lys Asn Gly Arg Ala Phe Arg Leu Ala975 980 985ATT TCC AAC CTC AAC AAG CTG GAA TCA CTG TCT GTG AGT TCA GCA GGG 3087Ile Ser Asn Leu Asn Lys Leu Glu Ser Leu Ser Val Ser Ser Ala Gly990 995 1000ATG CCG GGC TTG TGT GGT TGC TTG GAT GAT ATA TCC TCG CCT CCG GAA 3135Met Pro Gly Leu Cys Gly Cys Leu Asp Asp Ile Ser Ser Pro Pro Glu100510101015AAC CTA CAG AGC CTC AAG CTG TAC GGC AGT TTG AAA ACG TTG CCG GAA 3183Asn Leu Gln Ser Leu Lys Leu Tyr Gly Ser Leu Lys Thr Leu Pro Glu102010251030TGG ATC AAG GAG CTC CAG CAT CTC GTG AAG TTA AAA CTA GTG AGT ACT 3231Trp Ile Lys Glu Leu Gln His Leu Val Lys Leu Lys Leu Val Ser Thr1035 104010451050AGG CTA TTG GAG CAC GAC GTT GCT ATG GAA TTC CTT GGG GAA CTA CCG 3279Arg Leu Leu Glu His Asp Val Ala Met Glu Phe Leu Gly Glu Leu Pro105510601065AAG GTG GAA ATT CTA GTT ATT TCA CCG TTT AAG AGT GAA GAA ATT CAT 3327Lys Val Glu Ile Leu Val Ile Ser Pro Phe Lys Ser Glu Glu Ile His107010751080TTC AAG CCT CCG CAG ACT GGG ACT GCT TTT GTA AGC CTC AGG GTG CTC 3375Phe Lys Pro Pro Gln Thr Gly Thr Ala Phe Val Ser Leu Arg Val Leu108510901095AAG CTT GCA GGA TTA TGG GGC ATC AAA TCA GTG AAG TTT GAG GAA GGA 3423Lys Leu Ala Gly Leu Trp Gly Ile Lys Ser Val Lys Phe Glu Glu Gly110011051110ACA ATG CCC AAA CTT GAG AGG CTG CAG GTC CAA GGG CGA ATA GAA AAT 3471Thr Met Pro Lys Leu Glu Arg Leu Gln Val Gln Gly Arg Ile Glu Asn1115 112011251130GAA ATT GGC TTT TCT GGG TTA GAG TTT CTC CAA AAC ATC AAC GAA GTC 3519Glu Ile Gly Phe Ser Gly Leu Glu Phe Leu Gln Asn Ile Asn Glu Val113511401145CAG CTC AGT GTT TGG TTT CCC ACG GAT CAT GAT AGG ATA AGA GCC GCG 3567Gln Leu Ser Val Trp Phe Pro Thr Asp His Asp Arg Ile Arg Ala Ala115011551160CGC GCC GCG GGC GCT GAT TAT GAG ACT GCC TGG GAG GAA GAG GTA CAG3615Arg Ala Ala Gly Ala Asp Tyr Glu Thr Ala Trp Glu Glu Glu Val Gln116511701175GAA GCA AGG CGC AAG GGA GGT GAA CTG AAG AGG AAA ATC CGA GAA CAG3663Glu Ala Arg Arg Lys Gly Gly Glu Leu Lys Arg Lys Ile Arg Glu Gln118011851190CTT GCT CGG AAT CCA AAC CAA CCC ATC ATT ACC TGAGCTCCTT TGGAGTTACT 3716Leu Ala Arg Asn Pro Asn Gln Pro Ile Ile Thr1195 12001205TTGCCGTGCT CCATACTATC CTACAAGTGA GATCCTCTGC AGTACTGCATGCTCACTGAC 3776ATGTGGACCC GAGGGGCTGT GGGGCCCACA TGTCAGTGAG CAGTACTGTGCAGTACTGCA 3836GAGGACCTGC ATCCACTATC CTATATTATA ATGGATTGTA CTATCGATCCAACTATTCAG 3896ATTAACTCTA TACTAGTGAA CTTATTTTT3925(2)SEQ ID NO3的資料(i)序列特徵(A)長度10322個鹼基對(B)類型核酸(C)鏈型雙鏈(D)拓撲結構線性(ii)分子類型基因組DNA(ix)特徵(A)名稱/關鍵詞外顯子(B)位置3630..4586(C)鑑定方法E(ix)特徵(A)名稱/關鍵詞外顯子(B)位置5927..6682(C)鑑定方法E(ix)特徵(A)名稱/關鍵詞外顯子(B)位置6991..8973(C)鑑定方法E(xi)序列描述SEQ ID NO3CGGCCGCATA ATACGACTCA CTATAGGGAT CTCCTCTAGA GTTACTTTGC CGTGCTCCAT 60ACTATCCTAT TCTATATTGG ATTATACTAT CGATCCAACG ATTCAGATTA ACTCTATACT 120AGTGAAGTCT ACACTTATGG TATGGGTAAT ATACATATGT AGTATAGTAT AGCATAAGGG 180TATTTCATTT TGCAGGTTAG CCGTTTATCT GCTGGTGCTC CTCTTGCTGT AGTAGTGTTG 240TTGGTGTTGC TGCTGATGAC CTAAAATGCT TGCATGTTTC TATCATGTTC TCCATAATGT 300AGTATCATGT ACTCCATCTT CCTTGTTGGT TTTTGTCCAT AATCTCCACC TTGGCAGCTT 360GCATCATCTT ACTCTCGAGC TTGTCCACCT TGAGATTCAA CTCCTGGAAC GCGGCTCCCA 420GTTCATCCAC CCTCTTCTCC ACGGCAGGAA TCCGTGACTC CACCGTACGC TTGAGATCTT 480GGTACTCCGC CCTGGTGCGC TCATCAGCCT CAACTCGTTT CTTCTCATTC CCTTCCACAA 540GTTGCAGAAG GAGGTCCAAC TTCTTATCAG TCTCCATGGC CTCGGATCTG GATCAGGTAC 600CTACTGCTCT CGCTCCGAAT TCCGCGAACC TTAGGGGGCA AGTTTCCTTT TCGCGGTGCC 660GATCCGAAGA TCAGCTCCAA TCCACCCCAA GGAACAATTT CACCGCAGAA TCAAGAGAAT 720TTGAGAAGCA AGAGAGGCTC TGATACCAGA TTGTCAGGAT CTCAAGAAAT CAGCAAAGAA 780CAACAAGAAC ACACAAGGAT TCAGGCAACT AGTTTGGATT GATCTGCTCC AACCCAACAG 840GATTGAGCCT TCCGCCGCCA CCGCCACCGA GTTGCCAGTT CATAGTTGTC TTTCTCGAGT 900TCATCTTATT TATACAGTAG TATCTCCCTA CTCACACGAC ACACACAGTA GCCAGCTGTA 960CAACAGATAG CTGGGCTACG CAACCCACTC GGACCCATGG TAACGAGGAT TGGGCTTTGG 1020CCCTCTTGTG GGTCTTGCTC TTCCTGGAGT AGTAGTCTGT ATCTCCTCCT CCTGGACTTC 1080AGCTTCTGCT TCATCAGGTT CTCCTTCTTC AGGTTCCTTC TCTCCCTGTT CAGCTTCTGC 1140TTCATCAGGT TCTCCTTCTT CAGTACCCAT AGTGACAGGC AGGTTCCTGA CAAAATTCTG 1200CTCGTTTGCG ACCAATGGTA GTGATCATAG TTGCAACCAG GAGGGGGGGG GGGGAAATCG 1260CCGTCCCCTC CGCTCCTCTC CCGTCGTCCC CAACGCCTCG TTCGCGCATT TCGTTGAACA 1320CCATGACGGC GCCGAATTCG CAGTGTCCGC ACATCTCCTC CTCCCCCGTC CTCTCCAAAC 1380CCCAAACCCT ATCTCCACCC CCGAGGCAGG CGCCCCCATG CACTTGTAAG TCGATTGGAT 1440GTCCTGTCCC AGAAGACATA TCGAGCGAGG AGGCGGAGGG GGACGAAGGG AACATATCGA 1500GCGAGGAAGC GGAGGGTGGA TCGGCATCCC CCATTTCAAG GTACTATACT AGTCCATTAT 1560AGTAGTAGTG CTTTTGCATC TTAGAAAAAA AAATATGTTC ATTAGCCATT GAGAGCTTCT 1620GAAGTTGTTG ATTTTGTTCC AACCCCAACT GTGAGTTTCA GTTCAGGTCA TCCACTGATT 1680TTCACTATGC CAATTCTCTG AAACAACTTT ACCACTGTCA CATGAACACA CTGAAACAGT 1740TTGGTGTAGA CGTGTAGTGA AGAATGTAGC ATATATACCT TCACTTAATT TTTCTTGCAA 1800TTATTGGCCA TTACTAGTTA TGCGAGGTAG AAGTGTTCTA AGGTACTGTA TCATTTTTAT 1860GTACTAATTA ATTAAGTTTA ATAAAAACTT TTATTATCTA AAAATAAATG ACTATTACTA 1920GCTCGGTACT CCCTTTATTT TATATTATAA GACGTTTTGA TTTTTTTATA TACAACTTTC 1980TTTAAGTTTG ATTATACTTA TAAAAAATTA GCAAACATAT ATATTTTTTT TACATTAATA 2040GTGCAAGTGA GCACGCTTAA ATGCATTGTA CTTCCTTCGT AAAAAAACAT CAAACTTTTA 2100CGGACGAATA TGGATAAATG CATATCTAAA TTCATCCTCA ATAATTGATT CTTTTTGGAG 2160GAGTACAATT GGTTGGTGCG CTTTGTCCTT GGACCCTACA ATAATGATGA TTGTTTCTTT 2220AATCTATTGA CCTTGACTTA CCACATGGGC TATGTTTATC CCTTCCTGAA TCCTGAGCAC 2280TGACTACCGA GGCACCGAGT GTGAGCGGCA ACGGCGGTCA GGGAGCAGGC GTGGCTCGTC 2340GGCGAGCGGC TACGGGCAAC GGCGCCTTGG CGTCAGGCAT CCGCCGTCAC TCACCTCAAG 2400CTTGCGGGCT CTGCGACCAC CCTCTCATAG TCATAGGCCA CAGAAGGTGT AGTAGTACTT 2460CATACATTTC GAGCAGTTTC TTTCAGATTG TTTGTTTTTG AGCTTCTAAT TTTGGGATGC 2520ATTAGATAGT GATGAAAGCC TGAATTATTG GAATTTTGGT GTTGGTACTC ACACTCTCAC 2580AGTCAGAACA TACTCCTATA TATTTTGCAG CACATTTGCC TTGTGCGTGC TGTTCGTCTG 2640TTCCACTCGT GAACATCAGA CGCGAAGATT ATAGATTCAC CCCTGTTCAC AGATTCAGGT 2700ACTGCCAATT GCCTGGATGA ACACCAGTCC ATTTGCTCTC TTTCGCCTTA CAATTTTTCT 2760CTGCATTGTA CTAGCAGCCG TAGCTCGAAA GCCTCGAATA TGATTCCTTT TCAAGATTTT 2820ATATTTATGG AATATAATTC ACTTTTAAGA TGCCTTGATG GTGAAATAGT AGACATGTGA 2880GACTCCAAAT CTCGTCCTAA AAGAGCATGG AGGTAAAAAA AGAAAAAGGT AGACATCGCT 2940ATTGTAGACA TGGAGAGCTG GAATACGATT ACTTTCAAGA TATTATATTC AATGAGCATT 3000CATTCTTACA CATATGCCAC AAAGGTAAAA AAAAACAGAG AAAGAGAGAG AGAGGGGAAA 3060GAAGCCAAGT TCTTTCTTCT ACTATCATTT AGGTTGAGTT CGTTTGTTAA GGTTCCCAAC 3120CTACGATTCC TCGTTTCCCG CGTGCACGAT TCCCAAACTA CTAAATGGTA TGCTTTTTAA 3180AATATTTCGT AGAAAAATTG CTTTAAAAAA TCATATTAAT TTATTTTTTA AGTTGTTTAG 3240CTAATACTCA ATTAATCATG CATTAATTTG CCGCTCCGTT TTAGTGGAAG TCATCTGAAA 3300GGATCAAAGG AAGCAACACC AAGTCCTTAT TTCGACTCCG ACTCTCTCAC TCTCGCCATT 3360TATTCTTTTC TTTCTGTTAT TTTAAAAGTT GCTACTTTAG CTTCAGCCAC GTGAATTCTT 3420GATATTTCAT TATTTTTCTC ATCAAACAAT AGCATCTTCT TCTGGAAATC GAATTCAGGG 3480CTTATATGTT GCTTATTCTG ATATATAGGT CTGTCACGAG GCGTATGATC ATCAACTCTG 3540CCACAAAATC CATTCAAAAA TAGAACAGAG CAATGGAGGC GACGGCGCTG AGTGTGGGCA 3600AATCCGTGCT GAATGGAGCG CTTGGCTACG CAAAATCTGC ATTTGCTGAG GAGGTGGCCT 3660TGCAGCTTGG TATCCAGAAA GACCACACAT TTGTTGCAGA TGAGCTTGAG ATG ATG3716Met Met1AGG TCT TTC ATG ATG GAG GCG CAC GAG GAG CAA GAT AAC AGC AAG GTG 3764Arg Ser Phe Met Met Glu Ala His Glu Glu Gln Asp Asn Ser Lys Val5 10 15GTC AAG ACT TGG GTG AAG CAA GTC CGT GAC ACT GCC TAT GAT GTT GAG3812Val Lys Thr Trp Val Lys Gln Val Arg Asp Thr Ala Tyr Asp Val Glu20 25 30GAC AGC CTC CAG GAT TTC GCT GTT CAT CTT AAG AGG CCA TCC TGG TGG3860Asp Ser Leu Gln Asp Phe Ala Val His Leu Lys Arg Pro Ser Trp Trp35 40 45 50CGA TTT CCT CGT ACG CTG CTC GAG CGG CAC CGT GTG GCC AAG CAG ATG3908Arg Phe Pro Arg Thr Leu Leu Glu Arg His Arg Val Ala Lys Gln Met55 60 65AAG GAG CTT AGG AAC AAG GTC GAG GAT GTC AGC CAG AGG AAT GTG CGG3956Lys Glu Leu Arg Asn Lys Val Glu Asp Val Ser Gln Arg Asn Val Arg70 75 80TAC CAC CTC ATC AAG GGC TCT GCC AAG GCC ACC ATC AAT TCC ACT GAG4004Tyr His Leu Ile Lys Gly Ser Ala Lys Ala Thr Ile Asn Ser Thr Glu85 90 95CAA TCT AGC GTT ATT GCT ACA GCC ATA TTC GGC ATT GAC GAT GCA AGG4052Gln Ser Ser Val Ile Ala Thr Ala Ile Phe Gly Ile Asp Asp Ala Arg100 105 110CGT GCC GCA AAG CAG GAC AAT CAG AGA GTG GAT CTT GTC CAA CTA ATC4100Arg Ala Ala Lys Gln Asp Asn Gln Arg Val Asp Leu Val Gln Leu Ile115 120 125 130AAC AGT GAG GAT CAG GAC CTA AAA GTG ATC GCG GTC TGG GGA ACA AGT4148Asn Ser Glu Asp Gln Asp Leu Lys Val Ile Ala Val Trp Gly Thr Ser135 140 145GGT GAT ATG GGC CAA ACA ACA ATA ATC AGG ATG GCT TAT GAG AAC CCA4196Gly Asp Met Gly Gln Thr Thr Ile Ile Arg Met Ala Tyr Glu Asn Pro150 155 160GAT GTC CAA ATC AGA TTC CCA TGC CGT GCA TGG GTA AGG GTG ATG CAT4244Asp Val Gln Ile Arg Phe Pro Cys Arg Ala Trp Val Arg Val Met His165 170 175CCT TTC AGT CCA AGA GAC TTT GTC CAG AGC TTG GTG AAT CAG CTT CAT 4292Pro Phe Ser Pro Arg Asp Phe Val Gln Ser Leu Val Asn Gln Leu His180 185 190GCA ACC CAA GGG GTT GAA GCT CTG TTG GAG AAA GAG AAG ACA GAA CAA 4340Ala Thr Gln Gly Val Glu Ala Leu Leu Glu Lys Glu Lys Thr Glu Gln195 200 205 210GAT TTA GCT AAG AAA TTC AAT GGA TGT GTG AAT GAT AGG AAG TGT CTA 4388Asp Leu Ala Lys Lys Phe Asn Gly Cys Val Asn Asp Arg Lys Cys Leu215 220 225ATT GTG CTT AAT GAC CTA TCC ACC ATT GAA GAG TGG GAC CAG ATT AAG 4436Ile Val Leu Asn Asp Leu Ser Thr Ile Glu Glu Trp Asp Gln Ile Lys230 235 240AAA TGC TTC CAA AAA TGC AGG AAA GGA AGC CGA ATC ATA GTG TCA AGC 4484Lys Cys Phe Gln Lys Cys Arg Lys Gly Ser Arg Ile Ile Val Ser Ser245 250 255ACT CAA GTT GAA GTT GCA AGC TTA TGT GCT GGG CAA GAA AGC CAA GCC 4532Thr Gln Val Glu Val Ala Ser Leu Cys Ala Gly Gln Glu Ser Gln Ala260 265 270TCA GAG CTA AAG CAA TTG TCT GCT GAT CAG ACC CTT TAC GCA TTC TAC 4580Ser Glu Leu Lys Gln Leu Ser Ala Asp Gln Thr Leu Tyr Ala Phe Tyr275 280 285 290GAC AAG GTAATATACT TGCTCTTCAA GCATACCTCT CGATATCATT TTTAATTCAG 4636Asp LysTTATGCCTTT AGTAATTTCT AATTCAATTG TGTATAGGCT AGTTGAAGTG CGTGGGAGTT 4696ACCATTCCAT TAGAAACACA TGACCTAATG CAACTAACAA GTGCTCCTCC TGTTCTCTCT 4756CATTTGCCTT TTGGGAATGC ATGCACTCAA CATTTTAAGA TTACAGCCAA AATATATGTA 4816TTTGGATTTG TCAAAACAAA GATGTATGCT AGAAAAAGAA ATGGTCTAAT ACAGGTTTAC 4876AAATAAGACA ACGATGCAAA AAGGGCAACT AAAAACATAT TGATTCCCTC ATCTGCCACT 4936GCAATTGCCT TAAATTCTAG TCCATTCTAC TATCTCCGTT TCATATTATA AGTCACTCTA 4996GTTTTTTTCC AGTCAAACTT CTTTAGTTTG ACCAAGTTTA TACAAAAATT TAGCAACATA 5056TCCAACACGA AATTAGTTTC ATTAAATGTA GCATTGAATA TATTTTGATA GTATGTTTGT 5116TTTGTGTTGA AAATGCTGCT ATATTTTTTA AAAAAACTTG GTCAAACCTA AACAAGTTTG 5176ACTAGGAGAA AAGTCGAAAC GACTTATAAT ATGAAATAGA GGGAGAATGT TCGAAGTTTG 5236GCTAACGGTC AATGCTAGTG CTTTAAGTGG GTAAGCCGCA AATCCAATTA TAGGCCAAAA 5296TACATGGGTT TGTGGCTTAT TTTGGCTATA AGTGGGTTTC GCGGGTTAGC CACTTACACC 5356CCTAGTCAAT GCTAATGAAA GTAGAAGTGA TGCTATTCAA GGAAAATGTA TTGGATACCG 5416AGATTGCCTT GAATAAAGAA TAAAATTGAG GTAGTAGATT GGATAATAGA TTGACCCACA 5476AAATTGTACA AGTATGTAAT GTAGCACAAG TCCTCTTTGC ACAATTAAAA TTTTGAAGCT 5536CCTATTTCAC AAATAATTTT GATATGGATT AATTGATTTC ATATCCAATT CGCACAGTTT 5596ATTGAATTTG GAGATTTATT TCCTCTATAT GTGAGAGATG ATTGTAAAAT GGGCAAATCT 5656AGCAAATGCA TCCTCTCATC CTTTGGATTA AATGTAGTGT ACTTATCCCA TTATTTTAAA 5716GTTAAATTAA TACATATTTT ATTGAACAGT CAGATATACG TTTTTCAAAA TAGGATCCAA 5776AACTAAGGTT TATACTAGAC TGCAAATTAA TGAAAGGAAT TATCATTATT GTTTTGTATA 5836CTTTCATGAC CGAAAACAAG GCTAAACACT ATCCATGTAT GAAAATTTAA GGCTAAAAGT 5896TGTTCTTAAT CATTGCTCCC TTTTGTTTAG GGT TCC CAA ATT ATA GAG GAT TCA5950Gly Ser Gln Ile Ile Glu Asp Ser295 300GTG AAG CCA GTG TCT ATC TCG GAT GTG GCC ATC ACA AGT ACA AAC AAT 5998Val Lys Pro Val Ser Ile Ser Asp Val Ala Ile Thr Ser Thr Asn Asn305 310 315CAT ACA GTG GCC CAT GGT GAG ATT ATA GAT GAT CAA TCA ATG GAT GCT 6046His Thr Val Ala His Gly Glu Ile Ile Asp Asp Gln Ser Met Asp Ala320 325 330GAT GAG AAG AAG GTG GCT AGA AAG AGT CTT ACT CGC ATT AGG ACA AGT 6094Asp Glu Lys Lys Val Ala Arg Lys Ser Leu Thr Arg Ile Arg Thr Ser335 340 345GTT GGT GCT TCG GAG GAA TCA CAA CTT ATT GGG CGA GAG AAA GAA ATA 6142Val Gly Ala Ser Glu Glu Ser Gln Leu Ile Gly Arg Glu Lys Glu Ile350 355 360TCT GAA ATA ACA CAC TTA ATT TTA AAC AAT GAT AGC CAG CAG GTT CAG 6190Ser Glu Ile Thr His Leu Ile Leu Asn Asn Asp Ser Gln Gln Val Gln365 370 375 380GTG ATC TCT GTG TGG GGA ATG GGT GGC CTT GGA AAA ACC ACC CTA GTA 6238Val Ile Ser Val Trp Gly Met Gly Gly Leu Gly Lys Thr Thr Leu Val385 390 395AGC GGT GTT TAT CAA AGC CCA AGG CTG AGT GAT AAG TTT GAC AAG TAT 6286Ser Gly Val Tyr Gln Ser Pro Arg Leu Ser Asp Lys Phe Asp Lys Tyr400 405 410GTT TTT GTC ACA ATC ATG CGT CCT TTC ATT CTT GTA GAG CTC CTT AGG 6334Val Phe Val Thr Ile Met Arg Pro Phe Ile Leu Val Glu Leu Leu Arg415 420 425AGT TTG GCT GAG CAA CTA CAT AAA GGA TCT TCT AAG AAG GAA GAA CTG 6382Ser Leu Ala Glu Gln Leu His Lys Gly Ser Ser Lys Lys Glu Glu Leu430 435 440TTA GAA AAT AGA GTC AGC AGT AAG AAA TCA CTA GCA TCG ATG GAG GAT 6430Leu Glu Asn Arg Val Ser Ser Lys Lys Ser Leu Ala Ser Met Glu Asp445 450 455 460ACC GAG TTG ACT GGG CAG TTG AAA AGG CTT TTA GAA AAG AAA AGT TGC 6478Thr Glu Leu Thr Gly Gln Leu Lys Arg Leu Leu Glu Lys Lys Ser Cys465 470 475TTG ATT GTT CTA GAT GAT TTC TCA GAT ACC TCA GAA TGG GAC CAG ATA 6526Leu Ile Val Leu Asp Asp Phe Ser Asp Thr Ser Glu Trp Asp Gln Ile480 485 490AAA CCA ACG TTA TTC CCC CTG TTG GAA AAG ACA AGC CGA ATA ATT GTG 6574Lys Pro Thr Leu Phe Pro Leu Leu Glu Lys Thr Ser Arg Ile Ile Val495 500 505ACT ACA AGA AAA GAG AAT ATT GCC AAC CAT TGC TCA GGG AAA AAT GGA 6622Thr Thr Arg Lys Glu Asn Ile Ala Asn His Cys Ser Gly Lys Asn Gly510 515 520AAT GTG CAC AAC CTT AAA GTT CTT AAA CAT AAT GAT GCA TTG TGC CTC 6670Asn Val His Asn Leu Lys Val Leu Lys His Asn Asp Ala Leu Cys Leu525 530 535 540TTG AGT GAG AAG GTAATATAAG TGTGCTCCAT TTTTCTTGGT TTGATATTCT 6722Leu Ser Glu LysTTTAATCATT TGAGTTATCC AATCAAGATG ATATTTGTGC ATGCAGAAAT AGCATATACT 6782AGATTCATAT ACAACTTAAT CTGTTCTCAC AACAATAGCA ATGCAGTTCC TAAAATGACC 6842TGCATTGGAT GGACGTTAGA TGTGACTTTG TTTTTGTATG TAATGGTGGC CTTCATTCCT 6902TAGTTTTAAT AGTAAAGACG TATTTCTAAA TTTAATTTTT TTTGTTTTAC TTTAGAGCAC 6962AATAAAGCTT AAATTGTATC AATGTCAG GTA TTT GAG GAG GCT ACA TAT TTG 7014Val Phe Glu Glu Ala Thr Tyr Leu545 550GAT GAT CAG AAC AAT CCA GAG TTG GTT AAA GAA GCA AAA CAA ATC CTA 7062Asp Asp Gln Asn Asn Pro Glu Leu Val Lys Glu Ala Lys Gln Ile Leu555 560 565AAG AAG TGC GAT GGA CTG CCC CTT GCA ATA GTT GTC ATA GGT GGA TTC 7110Lys Lys Cys Asp Gly Leu Pro Leu Ala Ile Val Val Ile Gly Gly Phe570 575 580TTG GCA AAC CGA CCA AAG ACC CCA GAA GAG TGG AGA AAA TTG AAC GAG 7158Leu Ala Asn Arg Pro Lys Thr Pro Glu Glu Trp Arg Lys Leu Asn Glu585 590 595 600AAT ATC AAT GCT GAG TTG GAA ATG AAT CCA GAG CTT GGA ATG ATA AGA 7206Asn Ile Asn Ala Glu Leu Glu Met Asn Pro Glu Leu Gly Met Ile Arg605 610 615ACC GTC CTT GAA AAA AGC TAT GAT GGT TTA CCA TAC CAT CTC AAG TCA 7254Thr Val Leu Glu Lys Ser Tyr Asp Gly Leu Pro Tyr His Leu Lys Ser620 625 630TGT TTT TTA TAT CTG TCC ATT TTC CCT GAA GAC CAG ATC ATT AGT CGA 7302Cys Phe Leu Tyr Leu Ser Ile Phe Pro Glu Asp Gln Ile Ile Ser Arg635 640 645AGG CGT TTG GTG CAT CGT TGG GCA GCA GAA GGT TAC TCA ACT GCA GCA 7350Arg Arg Leu Val His Arg Trp Ala Ala Glu Gly Tyr Ser Thr Ala Ala650 655 660CAT GGG AAA TCT GCC ATT GAA ATA GCT AAC GGC TAC TTC ATG GAA CTC 7398His Gly Lys Ser Ala Ile Glu Ile Ala Asn Gly Tyr Phe Met Glu Leu665 670 675 680AAG AAT AGA AGC ATG ATT TTA CCA TTC CAG CAA TCA GGT AGC AGC AGG 7446Lys Asn Arg Ser Met Ile Leu Pro Phe Gln Gln Ser Gly Ser Ser Arg685 690 695AAA TCA ATT GAC TCT TGC AAA GTC CAT GAT CTC ATG CGT GAC ATC GCC 7494Lys Ser Ile Asp Ser Cys Lys Val His Asp Leu Met Arg Asp Ile Ala700 705 710ATC TCA AAG TCA ACG GAG GAA AAC CTT GTT TTT AGG GTG GAG GAA GGC 7542Ile Ser Lys Ser Thr Glu Glu Asn Leu Val Phe Arg Val Glu Glu Gly715 720 725TGC AGC GCG TAC ATA CAT GGT GCA ATT CGT CAT CTT GCT ATA AGT AGC 7590Cys Ser Ala Tyr Ile His Gly Ala Ile Arg His Leu Ala Ile Ser Ser730 735 740AAC TGG AAG GGA GAT AAG AGT GAA TTC GAG GGC ATA GTG GAC CTG TCC 7638Asn Trp Lys Gly Asp Lys Ser Glu Phe Glu Gly Ile Val Asp Leu Ser745 750 755 760CGA ATA CGA TCG TTA TCT CTG TTT GGG GAT TGG AAG CCA TTT TTT GTT 7686Arg Ile Arg Ser Leu Ser Leu Phe Gly Asp Trp Lys Pro Phe Phe Val765 770 775TAT GGC AAG ATG AGG TTT ATA CGA GTG CTT GAC TTT GAA GGG ACT AGA 7734Tyr Gly Lys Met Arg Phe Ile Arg Val Leu Asp Phe Glu Gly Thr Arg780 785 790GGT CTA GAA TAT CAT CAC CTT GAT CAG ATT TGG AAG CTT AAT CAC CTA 7782Gly Leu Glu Tyr His His Leu Asp Gln Ile Trp Lys Leu Asn His Leu795 800 805AAA TTC CTT TCT CTA CGA GGA TGC TAT CGT ATT GAT CTA CTG CCA GAT 7830Lys Phe Leu Ser Leu Arg Gly Cys Tyr Arg Ile Asp Leu Leu Pro Asp810 815 820TTA CTG GGC AAC CTG AGG CAA CTC CAG ATG CTA GAC ATC AGA GGT ACA 7878Leu Leu Gly Asn Leu Arg Gln Leu Gln Met Leu Asp Ile Arg Gly Thr825 830 835 840TAT GTA AAG GCT TTG CCA AAA ACC ATC ATC AAG CTT CAG AAG CTA CAG 7926Tyr Val Lys Ala Leu Pro Lys Thr Ile Ile Lys Leu Gln Lys Leu Gln845 850 855TAC ATT CAT GCT GGG CGC AAA ACA GAC TAT GTA TGG GAG GAA AAG CAT 7974Tyr Ile His Ala Gly Arg Lys Thr Asp Tyr Val Trp Glu Glu Lys His860 865 870AGT TTA ATG CAG AGG TGT CGT AAG GTG GGA TGT ATA TGT GCA ACA TGT 8022Ser Leu Met Gln Arg Cys Arg Lys Val Gly Cys Ile Cys Ala Thr Cys875 880 885TGC CTC CCT CTT CTT TGC GAA ATG TAT GGC CCT CTC CAT AAG GCC CTA 8070Cys Leu Pro Leu Leu Cys Glu Met Tyr Gly Pro Leu His Lys Ala Leu890 895 900GCC CGG CGT GAT GCG TGG ACT TTC GCT TGC TGC GTG AAA TTC CCA TCT 8118Ala Arg Arg Asp Ala Trp Thr Phe Ala Cys Cys Val Lys Phe Pro Ser905 910 915 920ATC ATG ACG GGA GTA CAT GAA GAG GAA GGC GCT ATG GTG CCA AGT GGG 8166Ile Met Thr Gly Val His Glu Glu Glu Gly Ala Met Val Pro Ser Gly925 930 935ATT AGA AAA CTG AAA GAC TTG CAC ACA CTA AGG AAC ATA AAT GTC GGA 8214Ile Arg Lys Leu Lys Asp Leu His Thr Leu Arg Asn Ile Asn Val Gly940 945 950AGG GGA AAT GCC ATC CTA CGA GAT ATC GGA ATG CTC ACA GGA TTA CAC 8262Arg Gly Asn Ala Ile Leu Arg Asp Ile Gly Met Leu Thr Gly Leu His955 960 965AAG TTA GGA GTG GCT GGC ATC AAC AAG AAG AAT GGA CGA GCG TTT CGC 8310Lys Leu Gly Val Ala Gly Ile Asn Lys Lys Asn Gly Arg Ala Phe Arg970 975 980TTG GCC ATT TCC AAC CTC AAC AAG CTG GAA TCA CTG TCT GTG AGT TCA 8358Leu Ala Ile Ser Asn Leu Asn Lys Leu Glu Ser Leu Ser Val Ser Ser985 990 9951000GCA GGG ATG CCG GGC TTG TGT GGT TGC TTG GAT GAT ATA TCC TCG CCT 8406Ala Gly Met Pro Gly Leu Cys Gly Cys Leu Asp Asp Ile Ser Ser Pro100510101015CCG GAA AAC CTA CAG AGC CTC AAG CTG TAC GGC AGT TTG AAA ACG TTG 8454Pro Glu Asn Leu Gln Ser Leu Lys Leu Tyr Gly Ser Leu Lys Thr Leu102010251030CCG GAA TGG ATC AAG GAG CTC CAG CAT CTC GTG AAG TTA AAA CTA GTG 8502Pro Glu Trp Ile Lys Glu Leu Gln His Leu Val Lys Leu Lys Leu Val103510401045AGT ACT AGG CTA TTG GAG CAC GAC GTT GCT ATG GAA TTC CTT GGG GAA 8550Ser Thr Arg Leu Leu Glu His Asp Val Ala Met Glu Phe Leu Gly Glu105010551060CTA CCG AAG GTG GAA ATT CTA GTT ATT TCA CCG TTT AAG AGT GAA GAA 8598Leu Pro Lys Val Glu Ile Leu Val Ile Ser Pro Phe Lys Ser Glu Glu1065 107010751080ATT CAT TTC AAG CCT CCG CAG ACT GGG ACT GCT TTT GTA AGC CTC AGG 8646Ile His Phe Lys Pro Pro Gln Thr Gly Thr Ala Phe Val Ser Leu Arg108510901095GTG CTC AAG CTT GCA GGA TTA TGG GGC ATC AAA TCA GTG AAG TTT GAG 8694Val Leu Lys Leu Ala Gly Leu Trp Gly Ile Lys Ser Val Lys Phe Glu110011051110GAA GGA ACA ATG CCC AAA CTT GAG AGG CTG CAG GTC CAA GGG CGA ATA 8742Glu Gly Thr Met Pro Lys Leu Glu Arg Leu Gln Val Gln Gly Arg Ile111511201125GAA AAT GAA ATT GGC TTT TCT GGG TTA GAG TTT CTC CAA AAC ATC AAC 8790Glu Asn Glu Ile Gly Phe Ser Gly Leu Glu Phe Leu Gln Asn Ile Asn113011351140GAA GTC CAG CTC AGT GTT TGG TTT CCC ACG GAT CAT GAT AGG ATA AGA 8838Glu Val Gln Leu Ser Val Trp Phe Pro Thr Asp His Asp Arg Ile Arg1145 115011551160GCC GCG CGC GCC GCG GGC GCT GAT TAT GAG ACT GCC TGG GAG GAA GAG 8886Ala Ala Arg Ala Ala Gly Ala Asp Tyr Glu Thr Ala Trp Glu Glu Glu116511701175GTA CAG GAA GCA AGG CGC AAG GGA GGT GAA CTG AAG AGG AAA ATC CGA 8934Val Gln Glu Ala Arg Arg Lys Gly Gly Glu Leu Lys Arg Lys Ile Arg118011851190GAA CAG CTT GCT CGG AAT CCA AAC CAA CCC ATC ATT ACC TGAGCTCCTT 8983Glu Gln Leu Ala Arg Asn Pro Asn Gln Pro Ile Ile Thr119512001205TGGAGTTACT TTGCCGTGCT CCATACTATC CTACAAGTGA GATCCTCTGC AGTACTGCAT 9043GCTCACTGAC ATGTGGACCC GAGGGGCTGT GGGGCCCACA TGTCAGTGAG CAGTACTGTG 9103CAGTACTGCA GAGGACCTGC ATCCACTATC CTATATTATA ATGGATTGTA CTATCGATCC 9163AACTATTCAG ATTAACTCTA TACTAGTGAA CTTATTTTTT TTTGCCGGGC CGGCAAATAG 9223CTGGTCGATG TATATTAAGA ATAAGAAAGG GAATGTACAA GATAGCGCGG TGCGTCAATG 9283CACCACCATT ACAGACGTAA AAGGAAAGCT AAAATCTCAC AGAATGAGTT GCTACAGAGT 9343GACACATGGG GCTAACAAGA CCTGCAGCTA TCCAAGTCTC CCATTCATCC CCCATGGCAG 9403AACAGAACTG GGGAACCGTT GCCGCGATCC CTTCAAACAC CCTTGCGTTT CGCTCTTTCG 9463AAATCAACCA GGTTACAAGG ATCACCCTTG CATCGAACGT TTTGCGGTCA ACCTTAGCAA 9523CAGATTTCCG GGCTGCAAGC CACCAATCAG CAAAATCAGC CGACGATGAG GAGCACGAAA 9583GGACCAGGCG TGTGCGCACC TGACCTCAAA TCTCCTGGGT GTAAGAGCAG CCCACGAAGA 9643TGTGCTGGCA GGTTTCCCCG TCATTGGAGC AGAAATAGCA CACCGGAGCA AGCTTCCATC 9703TGTGACGTTG TAGATTGTTG GCAGTGAGGC AAGCATTGCG CTCGGCGAGA AACATAAAGA 9763ACTTACATCT CGCCGGGGCA AGAGACTTCC AAATAATGGT ATACATATGT AGTATATAGT 9823ATAGTATAGT ATAGTATAAG GGTATTCATT TTGCAGGTTA GCGGTTATCT GCTGCTGTTC 9883CTCCTGCTGC GGCGTGCTGG AGTAGTGTTG TTGGTGGTGG TGCTGATGAC CTAAAATGCT 9943TGCTTGTTTC TATCAAGTTC TCCAGAATGT AGTATGTACT GCATCTTGTT GATTTTTGTC 10003CATAAACGGA TTGCATTATC TGTATATGAC CCAATCAACA ATAAACGGTG TTGCATTTTG 10063TTCCTAAAAG CTCTTAGAGT CTGACCAGTT ATCTCTGTAC GCATCTTCAT GCTGTTCTTT 10123GGGCACTGGT CATGGTTAAA TCACAGTTCA CCGAAACTTA TTTTCTGTAG ACTTATTCTG 10183AAATACTGAG AAATTGAAAT GTAGTAACTA TTGTCTGTAG ACTGCTTTCT CGTTTTTCTT 10243TTGCGGTCGC CATCTCCAGT CAGTATCTAC AGAAGAAGAG CCAATGCAGC CTATTGTCCT 10303TTTTTTGCCG GGTCGGCCG 10322(2)SEQ ID NO4的資料(i)序列特徵(A)長度20個鹼基對(B)類型核酸(C)鏈型單鏈(D)拓撲結構線性(ii)分子類型其它核酸,合成DNA(ix)序列描述SEQ ID NO4AGGGAAAAAT GGAAATGTGC(2)SEQ ID NO5的資料(i)序列特徵(A)長度20個鹼基對(B)類型核酸(C)鏈型單鏈(D)拓撲結構線性(ii)分子類型其它核酸,合成DNA(ix)序列描述SEQ ID NO5AGTAACCTTC TGCTGCCCAA(2)SEQ ID NO6的資料(i)序列特徵(A)長度20個鹼基對(B)類型核酸(C)鏈型單鏈(D)拓撲結構線性(ii)分子類型其它核酸,合成DNA(ix)序列描述SEQ ID NO6TTACCATCCC AGCAATCAGC(2)SEQ ID NO7的資料(i)序列特徵(A)長度20個鹼基對(B)類型核酸
(C)鏈型單鏈(D)拓撲結構線性(ii)分子類型其它核酸,合成DNA(ix)序列描述SEQ ID NO7AGACACCCTG CCACACAACA
權利要求
1.賦予植物抗稻瘟病抗性的蛋白質,其中所述蛋白質包括SEQ IDNO1的胺基酸序列,或其一個或多個胺基酸被取代、刪除和/或添加得到的經修飾序列。
2.賦予植物抗稻瘟病抗性的蛋白質,其中所述蛋白質由可與包含SEQID NO2和/或NO3核苷酸序列的DNA雜交的DNA編碼。
3.編碼權利要求1或2的蛋白質的DNA。
4.含有權利要求3的DNA的載體。
5.攜有權利要求4的載體的宿主細胞。
6.權利要求5的宿主細胞,其中所述宿主細胞為植物細胞。
7.製備權利要求1或2的蛋白質的方法,其中所述方法包括培養權利要求5的宿主細胞。
8.含有權利要求6的宿主細胞的轉化植物。
9.權利要求8的植物,其中所述植物為禾本科。
10.權利要求8之任一植物,其中所述植物為禾本科稻屬。
11.權利要求8、9和10之任一項的植物,其中所述植物表現出抗稻瘟病抗性。
12.與權利要求1或2的蛋白質結合的抗體。
13.包含至少15個核苷酸的DNA,其中所述DNA與權利要求3的DNA特異性雜交。
全文摘要
本發明提供了一種稻瘟病抗性基因(Pi-d),其功能等同基因,以及由上述基因編碼的蛋白質。該基因用於製備稻瘟病抗性植物,並賦予植物對廣譜的稻瘟病真菌的抗性,因此,其有利於控制病害並增加作物產量。
文檔編號G01N33/577GK1247229SQ9911100
公開日2000年3月15日 申請日期1999年6月12日 優先權日1998年6月12日
發明者矢野昌裕, 巖本政雄, 片寄裕一, 佐佐木卓治, 王子軒, 山內歌子, 石丸理佐 申請人:農林水產省農業生物資源研究所所長代表的日本國

同类文章

一種新型多功能組合攝影箱的製作方法

一種新型多功能組合攝影箱的製作方法【專利摘要】本實用新型公開了一種新型多功能組合攝影箱,包括敞開式箱體和前攝影蓋,在箱體頂部設有移動式光源盒,在箱體底部設有LED脫影板,LED脫影板放置在底板上;移動式光源盒包括上蓋,上蓋內設有光源,上蓋部設有磨沙透光片,磨沙透光片將光源封閉在上蓋內;所述LED脫影

壓縮模式圖樣重疊檢測方法與裝置與流程

本發明涉及通信領域,特別涉及一種壓縮模式圖樣重疊檢測方法與裝置。背景技術:在寬帶碼分多址(WCDMA,WidebandCodeDivisionMultipleAccess)系統頻分復用(FDD,FrequencyDivisionDuplex)模式下,為了進行異頻硬切換、FDD到時分復用(TDD,Ti

個性化檯曆的製作方法

專利名稱::個性化檯曆的製作方法技術領域::本實用新型涉及一種檯曆,尤其涉及一種既顯示月曆、又能插入照片的個性化檯曆,屬於生活文化藝術用品領域。背景技術::公知的立式檯曆每頁皆由月曆和畫面兩部分構成,這兩部分都是事先印刷好,固定而不能更換的。畫面或為風景,或為模特、明星。功能單一局限性較大。特別是畫

一種實現縮放的視頻解碼方法

專利名稱:一種實現縮放的視頻解碼方法技術領域:本發明涉及視頻信號處理領域,特別是一種實現縮放的視頻解碼方法。背景技術: Mpeg標準是由運動圖像專家組(Moving Picture Expert Group,MPEG)開發的用於視頻和音頻壓縮的一系列演進的標準。按照Mpeg標準,視頻圖像壓縮編碼後包

基於加熱模壓的纖維增強PBT複合材料成型工藝的製作方法

本發明涉及一種基於加熱模壓的纖維增強pbt複合材料成型工藝。背景技術:熱塑性複合材料與傳統熱固性複合材料相比其具有較好的韌性和抗衝擊性能,此外其還具有可回收利用等優點。熱塑性塑料在液態時流動能力差,使得其與纖維結合浸潤困難。環狀對苯二甲酸丁二醇酯(cbt)是一種環狀預聚物,該材料力學性能差不適合做纖

一種pe滾塑儲槽的製作方法

專利名稱:一種pe滾塑儲槽的製作方法技術領域:一種PE滾塑儲槽一、 技術領域 本實用新型涉及一種PE滾塑儲槽,主要用於化工、染料、醫藥、農藥、冶金、稀土、機械、電子、電力、環保、紡織、釀造、釀造、食品、給水、排水等行業儲存液體使用。二、 背景技術 目前,化工液體耐腐蝕貯運設備,普遍使用傳統的玻璃鋼容

釘的製作方法

專利名稱:釘的製作方法技術領域:本實用新型涉及一種釘,尤其涉及一種可提供方便拔除的鐵(鋼)釘。背景技術:考慮到廢木材回收後再加工利用作業的方便性與安全性,根據環保規定,廢木材的回收是必須將釘於廢木材上的鐵(鋼)釘拔除。如圖1、圖2所示,目前用以釘入木材的鐵(鋼)釘10主要是在一釘體11的一端形成一尖

直流氧噴裝置的製作方法

專利名稱:直流氧噴裝置的製作方法技術領域:本實用新型涉及ー種醫療器械,具體地說是ー種直流氧噴裝置。背景技術:臨床上的放療過程極易造成患者的局部皮膚損傷和炎症,被稱為「放射性皮炎」。目前對於放射性皮炎的主要治療措施是塗抹藥膏,而放射性皮炎患者多伴有局部疼痛,對於止痛,多是通過ロ服或靜脈注射進行止痛治療

新型熱網閥門操作手輪的製作方法

專利名稱:新型熱網閥門操作手輪的製作方法技術領域:新型熱網閥門操作手輪技術領域:本實用新型涉及一種新型熱網閥門操作手輪,屬於機械領域。背景技術::閥門作為流體控制裝置應用廣泛,手輪傳動的閥門使用比例佔90%以上。國家標準中提及手輪所起作用為傳動功能,不作為閥門的運輸、起吊裝置,不承受軸向力。現有閥門

用來自動讀取管狀容器所載識別碼的裝置的製作方法

專利名稱:用來自動讀取管狀容器所載識別碼的裝置的製作方法背景技術:1-本發明所屬領域本發明涉及一種用來自動讀取管狀容器所載識別碼的裝置,其中的管狀容器被放在循環於配送鏈上的文檔匣或託架裝置中。本發明特別適用於,然而並非僅僅專用於,對引入自動分析系統的血液樣本試管之類的自動識別。本發明還涉及專為實現讀