脯氨醯-4-羥化酶的α2亞單位,編碼此亞單位的核酸序列及其生產方法
2023-09-19 15:06:20
專利名稱:脯氨醯-4-羥化酶的α2亞單位,編碼此亞單位的核酸序列及其生產方法
亞單位的核酸序列及其生產方法1.導言本發明涉及鑑定和表徵新的脯氨醯-4-羥化酶α亞單位及其變體,編碼新的脯氨醯-4-羥化酶α2亞單位的多核苷酸序列,以及使用和製備這種新的多核苷酸和多肽的方法。本發明還涉及重組生產有活性的(1)脯氨醯-4-羥化酶或其變體,和(2)膠原,所述方法包括使用本發明的新的人脯氨醯-4-羥化酶α亞單位。
本發明更具體地涉及編碼新的脯氨醯-4-羥化酶α亞單位同工型(被稱為「α2亞單位」)及其衍生物的多核苷酸,生產這種同工型或相關衍生物的方法,以及這些蛋白質和多核苷酸在生產重組膠原中的用途。2.背景有關膠原的一般性資料膠原原纖維、蛋白聚糖聚集體和糖蛋白是軟骨胞外基質關鍵的組分,它們共同抵抗壓縮和連接過程中產生的張力和切力,Heinegard和Oldberg(1989)FASEB J.3:2042-2051;Mayne和Brewton,軟骨降解基礎和臨床方面(Woessner,J.F.和Howell,D.S.編)Marcel Dekker公司,紐約,p81-108(1993)。軟骨基質基因或編碼影響所述多種基質組分的生物合成,裝配或它們之間的相互作用的酶的基因中的突變可能是軟骨基質降解和正常軟骨功能喪失的原因所在。
脯氨醯-4-羥化酶對膠原產生的作用脯氨醯-4-羥化酶對所有膠原的合成起著關鍵性的作用,具體地說,酶通過將-Xaa-Pro-Bly-序列中的脯氨酸殘基羥化,催化膠原和相關蛋白質中4-羥脯氨酸的形成,這些4-羥脯氨酸殘基對於新合成的膠原多肽鏈摺疊成三螺旋分子是必需的。
脊椎動物的脯氨醯-4-羥化酶是α2β2四聚體,其中α亞單位負責催化位點的大部分,例見Kivirikko等(1989)FASEB J.3:1609-1617;Kivirikko等(1990)Ann.N.Y.Acad.Sci.580,132-142;Kivirikko等(1992)蛋白質的翻譯後修飾,Harding編,J.J. Crabbe,M.J.C.(CRC,Boca Raton,FL),p1-51,已從多種來源克隆出β亞單位(文獻同上;也見Noiva和Lennatz,(1992)生物與化學雜誌,267:6447-49;Freedman等(1994)Trends Biochem.Sci.19:331-336),並發現該亞單位是很不尋常的多功能多肽,它與下列蛋白質功能相同,即酶蛋白質二硫化物異構酶(Pihlajaniemi等(1987)EMBO J.6:643-649;Kojvu等(1987)生物與化學雜誌,262:6447-49),細胞甲狀腺激素結合蛋白(Cheng等(1987)生物與化學雜誌,262:11221-27),微粒體三醯甘油轉移蛋白較小的亞單位(Wetterau等(1990)生物與化學雜誌,265:9800-07)和獨特地結合多種肽的內質網魯米那多肽(Freedman,文獻同上;Noiva等(1991),生物與化學雜誌,266:19645-649;Noiva等(1993),生物與化學雜誌,268:19210-217)。
對於催化作用至關重要的α亞單位被稱為α1亞單位,已從人(Helaakoski等(1989)Proc.Natl.Acad.Sci.(USA)86:4392-96),雞(Bassuk等(1989)Proc.Natl.Acad.Sci.(USA)86:7382-886)和Caenorhabditis elegans(Veijola等(1994)生物與化學雜誌,269:26746-753)中克隆出該亞單位,其RNA轉錄物顯示出經受可變剪接,所述剪接涉及由兩個連串的同源的71-bp外顯子編碼的序列(Helaakoski,文獻同上;Helaakoski等(1994)生物與化學雜誌,269:27847-854)。第二個α亞單位被稱為α2亞單位,先前已從小鼠中得到該亞單位,Helaakoski等(1995)Proc.Natl.Acad.Sci.(USA)92:4427-4431。3.發明概要本發明涉及人脯氨醯-4-羥化酶α亞單位同工型的克隆和鑑定,本發明更具體地涉及被稱為α2亞單位的人脯氨醯-4-羥化酶α亞單位的亞單位同工型,以及編碼它們的多核苷酸序列。本文也描述了生產脯氨醯-4-羥化酶α2亞單位,脯氨醯-4-羥化酶和膠原的方法,其中所述脯氨醯-4-羥化酶由本發明的α2亞單位組成,所述膠原被這種脯氨醯-4-羥化酶加工成適當的形式。根據本發明,可使用編碼所要求的脯氨醯-4-羥化酶α2亞單位胺基酸序列的任何核苷酸序列來產生指導人脯氨醯-4-羥化酶之表達的重組分子。
本發明進一步涉及脯氨醯-4-羥化酶α2亞單位的編碼序列在產生可用於轉化適當宿主細胞的表達載體中的用途。然後誘導本發明的宿主細胞以表達編碼序列,從而產生脯氨醯-4-羥化酶α2亞單位,或更通常地,同時也產生脯氨醯-4-羥化酶B亞單位。4.詳細描述本發明涉及人脯氨醯-4-羥化酶α2亞單位,和編碼這些脯氨醯-4-羥化酶α2亞單位及其衍生物的核酸序列。根據本發明,可使用編碼所要求的人脯氨醯-4-羥化酶α2亞單位胺基酸序列的任何核苷酸序列來產生指導脯氨醯-4-羥化酶之表達的重組分子。本發明範圍內還包括使用和製備這些脯氨醯-4-羥化酶α2亞單位的方法。a.定義術語「脯氨醯-4-羥化酶α2亞單位」指的是由單個基因編碼的人脯氨醯-4-羥化酶α亞單位的同工型及其衍生物,包括缺失衍生物,保守的取代等等。
「有活性的人脯氨醯-4-羥化酶」指的是由脯氨醯-4-羥化酶α2β2四聚體組成的蛋白質複合體,該複合體可以重組產生。
本文所用的術語「嚴緊條件」指的是以下雜交條件(1)洗滌時使用低離子強度和高溫,例如0.015M NaCl/0.0015M檸檬酸鈉/0.1%SDS,50℃;(2)雜交過程中使用如甲醯胺的變性劑,例如含0.1%牛血清白蛋白的50%(v/v)甲醯胺/0.1%Ficoll/0.1%聚乙烯吡咯烷酮/含750mM NaCl,75mM檸檬酸鈉的50mM磷酸鈉緩衝液,pH6.5,42℃;或(3)42℃下使用50%甲醯胺,5×SSC(0.75M NaCl,0.075M檸檬酸鈉),5×Denhardt’s溶液,經超聲處理的鮭精DNA(50g/ml),0.1%SDS和10%葡聚糖硫酸酯,並於42℃用0.2×SSC和0.1%SDS洗滌。
對脯氨醯-4-羥化酶使用「純化的」這一術語表示所述分子在基本上不含其它生物大分子,如多核苷酸,蛋白質等的情況下存在。優選本文所用的術語「純化的」表示存在的所述生物大分子佔重量至少95%,更優選佔重量至少99.8%(但水,緩衝液,和其它小分子,尤其是分子量小於1000道爾頓的分子可以存在)。
本文所用術語「分離的」不僅指的同蛋白質來源中存在的其它蛋白質分離的蛋白質分子,也指同其它蛋白質分離的蛋白質分子,優選指的是其溶液中僅存在溶劑,緩衝液,離子或相同溶液中正常存在的其它組分(如果有的話)的蛋白質。術語「分離的」和「純化的」不包含其天然來源中存在的蛋白質。b.圖的簡述
圖1列出了小鼠脯氨醯-4-羥化酶α(2)亞單位的核苷酸(SEQ IDNO:1)和推定的胺基酸序列(SEQ ID NO:2)。
圖2A,2B,2C,2D和2E列出了人脯氨醯-4-羥化酶α(2)亞單位的衍生自cDNA克隆的核苷酸(SEQ ID NO:3)和推定的胺基酸序列(SEQ IDNO:4)。
圖2A特別地列出了第1-378位,包括第1和378位核苷酸的同一性(SEQ ID NO:5),並鑑定了外顯子2,3和4(用箭頭表示)的參數。
圖2B特別地列出了第379-864位,包括第379和864位核苷酸的同一性(SEQ ID NO:6),並鑑定了外顯子5和6(用箭頭表示)的參數。
圖2C特別地列出了第865-1350位,包括第865和1350位核苷酸的同一性(SEQ ID N0:7),並鑑定了外顯子7,8,9,10和11(用箭頭表示)的參數。
圖2D特別地列出了第1351-1890位,包括第1351和1890位核苷酸的同一性(SEQ ID NO:8),並鑑定了外顯子12,13,14,15和16(用箭頭表示)的參數。
圖2E特別地列出了第1891-2207位,包括第1891和2207位核苷酸的同一性(SEQ ID NO:9)。
圖3列出了外顯子2(圖2中鑑定的)和側翼內含子序列的核苷酸(SEQ ID NO:10)和推定的胺基酸序列(SEQ ID NO:11)。
圖4列出了外顯子3(圖2中鑑定的)和側翼內含子序列的核苷酸(SEQ ID NO:12)和推定的胺基酸序列(SEQ ID NO:13)。
圖5列出了外顯子4(圖2中鑑定的)和側翼內含子序列的核苷酸(SEQ ID NO:14)和推定的胺基酸序列(SEQ ID NO:15)。
圖6列出了外顯子5(圖2中鑑定的)和側翼內含子序列的核苷酸(SEQ ID NO:16)和推定的胺基酸序列(SEQ ID NO:17)。
圖7列出了外顯子6(圖2中鑑定的)和側翼內含子序列的核苷酸(SEQ ID NO:18)和推定的胺基酸序列(SEQ ID NO:19)。
圖8A和8B列出了外顯子7(圖2中鑑定的)和側翼內含子序列的核苷酸(SEQ ID NO:20)和推定的胺基酸序列(SEQ ID NO:21)。
圖8A特別地列出了第1-480位,包括第1和480位的核苷酸的同一性(SEQ ID NO:22)。
圖8B列出了第481位至外顯子3』末端的核苷酸的同一性(SEQ IDNO:23)。
圖9A,9B,9C和9D列出了外顯子8(圖2中鑑定的)和側翼內含子序列的核苷酸(SEQ ID NO:24)和推定的胺基酸序列(SEQ ID NO:25)。
圖9A特別地列出了第1-480位,包括第1和480位的核苷酸的同一性(SEQ ID NO:26)。
圖9B列出了第481-1140位,包括第481和1140位的核苷酸的同一性(SEQ ID NO:27)。
圖9C列出了第1141-1800位,包括第1141和1800位的核苷酸的同一性(SEQ ID NO:28)。
圖9D列出了第1801位至內含子3』末端的核苷酸的同一性(SEQ IDNO:29)。c.本發明脯氨醯-4-羥化酶α2亞單位的表達(1)編碼序列根據本發明,可使用編碼人脯氨醯-4-羥化酶α亞單位同工型或其功能等價物的多核苷酸序列產生可指導人脯氨醯-4-羥化酶α2亞單位或其衍生物,和含有脯氨醯-4-羥化酶α2亞單位之脯氨醯-4-羥化酶或其功能等價物在適當的宿主細胞中表達的重組DNA分子。這種脯氨醯-4-羥化酶α2亞單位的序列,以及能與這種多核苷酸或它們的互補鏈的至少一部分選擇性雜交的其它多核苷酸也可用於核酸雜交試驗,Southern和Northern印跡分析等。
由於遺傳密碼固有的簡併性,在本發明的實際操作中也可以使用編碼基本上相同或功能上等價的胺基酸序列的其它核酸序列以克隆和表達脯氨醯-4-羥化酶蛋白質的α2亞單位。這種核酸序列包括在嚴緊條件下可與適當的脯氨醯-4-羥化酶α2亞單位序列雜交的那些核酸序列。
本發明可以使用的經改變的核酸序列包括缺失,增加或取代不同的核苷酸殘基所致的序列,所述序列編碼相同的或功能上等價的基因產物。核酸產物自身在脯氨醯-4-羥化酶α2亞單位序列內可含有胺基酸殘基的缺失,增加或取代,這可導致沉默的變化,從而產生功能上等價的α亞單位。基於所涉及的殘基在極性,電荷,溶解性,疏水性,親水性,和/或兩親性方面的相似性可完成這種胺基酸的取代。例如,帶負電荷的胺基酸包括天冬氨酸和穀氨酸;帶正電荷的胺基酸包括賴氨酸和精氨酸;帶有具類似親水性值的不帶電極性頭基團的胺基酸包括下列亮氨酸,異亮氨酸,纈氨酸;甘氨酸,丙氨酸;天冬醯胺,穀氨醯胺;絲氨酸,蘇氨酸;苯丙氨酸,酪氨酸。
本發明的核酸序列可經遺傳工程改造以為多種目的改變脯氨醯-4-羥化酶α2亞單位的編碼序列,所述目的包括但不限於修飾基因產物的加工和表達的改變。例如,可選擇的分泌信號可取代天然的人分泌信號和/或使用本領域眾所周知的技術,如定點誘變導入突變以插入新的限制性位點,改變糖基化模式,磷酸化等。
另外,當在非人細胞中表達時,可修飾編碼本發明脯氨醯-4-羥化酶的多核苷酸以較好地符合特殊宿主生物體的密碼子選擇。
在本發明的另一個實施方案中,使用本領域熟知的化學方法可以完整地或部分地合成本發明脯氨醯-4-羥化酶α2亞單位的編碼序列,例見Caruthers等,Nuc.Acids Res.Symp.Ser.7:215-233(1980);Crea和Horn,核酸研究,9(10):2331(1980);Matteucci和Caruthers,Tetrahedron Letters21:719(1980);以及Chow和Kempe,核酸研究,9(12):2807-2817(1981)。或者,使用化學方法合成至少一部分所需的α2亞單位胺基酸序列也可產生蛋白質自身,例如,通過固相技術,從樹脂上裂解,並通過製備型高效液相層析純化可合成肽(例見Creighton,蛋白質結構和分子理論,W.H.Freeman和Co.,紐約,p50-60(1983))。通過胺基酸分析或測序(例如Edman降解法;例見Creighton,蛋白質結構和分子理論,W.H.Freeman和Co.,紐約,p34-49(1983))可進一步證實合成肽的組成。
為了表達本發明的脯氨醯-4-羥化酶α2亞單位,可將編碼脯氨醯-4-羥化酶α2亞單位或其功能等價物的核苷酸序列插入適當的表達載體,即含有轉錄和翻譯插入的編碼序列所必需的元件的載體。(2)表達系統可使用本領域技術人員熟知的方法構建含有脯氨醯-4-羥化酶之脯氨醯-4-羥化酶α2亞單位編碼序列和適當的轉錄/翻譯控制信號的表達載體。這些方法包括體外重組DNA技術,合成技術和體內重組,例見Maniatis等,分子克隆,實驗室手冊,冷泉港實驗室,紐約(1989)和Ausubel等,分子生物學最新操作指南,Greene PublishingAssociates and Wiley Intersci ence,紐約(1989)中描述的技術。
可利用多種宿主-表達載體系統來表達脯氨醯-4-羥化酶α2亞單位的編碼序列,所述系統包括但不限於被含有脯氨醯-4-羥化酶α2亞單位編碼序列的重組噬菌體DNA,質粒DNA,或粘粒DNA表達載體轉化的微生物,如細菌;被含有脯氨醯-4-羥化酶α2亞單位編碼序列的重組酵母表達載體轉化的酵母;被含有脯氨醯-4-羥化酶α2亞單位編碼序列的重組病毒表達載體(如杆狀病毒)感染的昆蟲細胞系統;被含有脯氨醯-4-羥化酶α2亞單位編碼序列的重組病毒表達載體(如花椰菜花葉病毒,CaMV;菸草花葉病毒,TMV)感染或重組質粒表達載體(如Ti質粒)轉化的植物細胞系統;或被適當載體,優選賽姆利基森林病毒感染的動物細胞系統。
另外,可在轉基因的非人動物中表達本發明的脯氨醯-4-羥化酶α2亞單位,其中可從轉基因動物的乳汁中回收所需的酶產物。這些系統的表達元件在其強度和特異性方面有所不同。根據所利用的宿主/載體系統,在表達載體中可使用多種適當的轉錄和翻譯元件中的任何一種,包括組成型和誘導型啟動子,例如,當在細菌系統中克隆時,可使用誘導型啟動子,如噬菌體λ的pL,plac,ptrp,ptac(ptrp-lac雜合啟動子)等;當在昆蟲細胞系統中克隆時,可使用如杆狀病毒多角體啟動子的啟動子;當在植物細胞系統中克隆時,可使用衍生自植物細胞基因組的啟動子(如熱激蛋白啟動子;核酮糖二磷酸羧化酶-加氧酶小亞單位的啟動子;葉綠素a/b結合蛋白的啟動子)或得自植物病毒的啟動子(如CaMV的35S RNA啟動子;TMV的外被蛋白啟動子);當在哺乳動物細胞系統中克隆時,可使用衍生自哺乳動物細胞基因組的啟動子(如金屬硫蛋白啟動子)或得自哺乳動物病毒的啟動子(如腺病毒晚期啟動子;痘苗病毒7.5K啟動子);當產生含有多拷貝脯氨醯-4-羥化酶α2亞單位DNA的細胞系時,基於SV40-,BPV-和EBV-的載體可與適當的選擇性標記一起使用。
在細菌系統中,根據所表達的脯氨醯-4-羥化酶α2亞單位的用途,可有利地選擇大量表達載體。例如,當欲產生大量本發明的多肽時,需要的是可指導易於純化的蛋白質產物高水平表達的載體。這種載體包括但不限於大腸桿菌表達載體pUR278(Ruther等,EMBO J.2:1791(1983)),其中多肽編碼序列符合讀框地與lacZ編碼區連接到載體中以產生雜合的AS-lacZ蛋白;pIN載體(Inouye Inouye,核酸研究,13:3101-3109(1985);Van Heeke Schuster,生物與化學雜誌,264:5503-5509(1989));等等。也可使用pGEX載體將外源多肽表達為含穀胱甘肽S-轉移酶(GST)的蛋白質。一般而言,這種蛋白質是可溶性的,通過吸附到穀胱甘肽-瓊脂糖珠上,然後在游離的穀胱甘肽存在下洗脫可從裂解的細胞中容易地純化該蛋白質。pGEX載體被設計成包括凝血酶或Xa因子蛋白酶裂解位點以使所需的克隆多肽可從GST組成成分中釋放。
優選的表達系統是酵母表達系統,在酵母中,可使用大量含有組成型或誘導型啟動子的載體,有關評述見分子生物學最新操作指南,第2卷,Ausubel等編,Greene Publish.Assoc. WileyInterscience,第13章,1988;Grant等,酵母的表達和分泌載體,酶學方法,Wu Grossman編,學術出版社,紐約,153:516-544(1987);Glover,DNA克隆,第Ⅱ卷,IRL出版社,華盛頓,第3章,1986;和Bitter,在酵母中表達異源基因,酶學方法,Berger Kimmel編,學術出版社,紐約,152:673-684(1987);和糖酵母的分子生物學,Strathern等,冷泉港出版社,第Ⅰ和Ⅱ卷,1982。
用於克隆和表達本發明蛋白質的特別優選的系統使用了畢赤氏酵母(Pichia)宿主細胞。非糖酵母的種,如巴斯德畢赤氏酵母(Pichiapastoris)放大步驟中大量生產重組蛋白質似乎特別有利。另外,可從Invitrogen公司(San Diego,CA)購置畢赤氏酵母表達試劑盒。
在如巴斯德畢赤氏酵母的甲基營養型酵母中有很多甲醇反應基因,其表達由甲醇反應調控區(也稱啟動子)調控。任何這種甲醇反應啟動子都適用於本發明的操作,具體的調控區的例子包括巴斯德畢赤氏酵母AOX1的伯醇氧化酶基因啟動子,巴斯德畢赤氏酵母AOX2的仲醇氧化酶基因啟動子,巴斯德畢赤氏酵母二羥丙酮合酶基因(DAS)的啟動子,巴斯德畢赤氏酵母P40基因的啟動子,巴斯德畢赤氏酵母過氧化氫酶基因的啟動子等等。
由嚴密調控的AOX1基因的啟動子可得到在巴斯德畢赤氏酵母中的典型表達,例見Ellis等,分子細胞生物學,5:1111(1985)和美國專利4,855,231。在培養物中加入甲醇之後,可誘導該啟動子產生高水平的重組蛋白質,通過隨後對相同細胞進行操作,可使本文所述的本發明的脯氨醯-4-羥化酶α2亞單位的基因得到表達,表達的條件應使重組的膠原蛋白能被本發明的脯氨醯-4-羥化酶充分地羥化,因此所述膠原蛋白可摺疊成穩定的螺旋,而該螺旋正是形成原纖維時膠原正常的生物學功能所必需的。
另一種特別優選的酵母表達系統利用了甲基營養型酵母多形漢遜氏酵母(Hansenula polymorpha)。在甲醇上生長可誘導產生甲醇代謝主要的酶,即MOX(甲醇氧化酶),DAS(二羥丙酮合酶)和FMHD(甲酸脫氫酶)。這些酶組成了多達30-40%的總細胞蛋白質。編碼MOX,DAS和FMDH產生的基因由很強的啟動子控制,所述啟動子可由在甲醇上生長來誘導,並可由在葡萄糖上生長來阻抑。在H.polymorpha中可使用任何或所有這三個啟動子以高水平表達異源核酸序列。編碼本發明脯氨醯-4-羥化酶α2亞單位的核酸序列被克隆到受可誘導的H.polymorpha啟動子控制的表達載體中。如果需要分泌產物,則可以將編碼負責在酵母中分泌的信號序列,如釀酒酵母前原-交配因子α1的多核苷酸符合讀框地與本發明的脯氨醯-4-羥化酶α2亞單位的編碼序列融合。優選表達載體含有營養缺陷型的標記基因,如URA3或LEU2,可使用該標記基因與營養缺陷型宿主的缺陷互補。
然後使用本領域技術人員熟知的技術用表達載體轉化H.polymorpha,H.polymorpha轉化的一個有趣而有用的特徵是高達100拷貝的表達載體能自發地整合到基因組中。在大多數情況下,整合的DNA形成多聚體,該多聚體表現出頭-至-尾的排列。甚至在非選擇性的條件下,幾個重組菌株中整合的外源DNA也顯示出穩定的有絲分裂。這一高拷貝整合的現象進一步增加了系統的高生產率潛力。
在使用植物表達載體的情況下,編碼本發明α2亞單位的序列的表達可由大量啟動子中的任何一種來驅動,例如,可使用病毒啟動子,如CaMV的35S RNA和19S RNA啟動子(Brisson等,自然,310:511-514(1984)),或TMV的外被蛋白啟動子(Takamatsu等,EMBO J,6:307-311(1987));或者,可使用植物啟動子,如核酮糖二磷酸羧化酶-加氧酶小亞單位的啟動子(Coruzzi等,EMBO.J,3:1671-1680(1984);Broglie等,科學,224:838-843(1984));或熱激蛋白啟動子,如大豆hsp17.5-E或hsp17.3-B(Gurley等,分子細胞生物學,6:559-565(1986))。使用Ti質粒,Ri質粒,植物病毒載體,直接DNA轉化,微量注射,電穿孔等技術可將這些構建體導入植物細胞。有關這些技術的評述可參見例如Weissbach Weissbach,植物分子生物學方法,學術出版社,紐約,第Ⅷ部分,p421-463(1988);和Grierson Corey,植物分子生物學,第2版,Blackie,倫敦,第7-9章(1988)。
可用於表達本發明的脯氨醯-4-羥化酶α2亞單位的另一種表達系統是昆蟲系統,在一個這種系統中,將苜蓿銀紋夜蛾核型多角體病毒(AcNPV)用作表達外源基因的載體,病毒在草地夜蛾細胞中生長。可將本發明脯氨醯-4-羥化酶α2亞單位的編碼序列克隆到病毒的非-必需區(如多角體基因),並置於AcNPV啟動子(如多角體啟動子)的控制之下。脯氨醯-4-羥化酶α2亞單位編碼序列成功的插入會導致多角體基因的失活,並產生無外被的重組病毒(缺乏由多角體基因編碼的蛋白質外被的病毒)。然後用這些重組病毒感染其中表達了插入基因的草地夜蛾細胞(例見Smith等,病毒學雜誌,46:584(1983);Smith,美國專利4,215,051)。
在哺乳動物宿主細胞中,可利用基於大量病毒的表達系統。在將腺病毒用作表達載體的情況下,將本發明脯氨醯-4-羥化酶α2亞單位的編碼序列與腺病毒轉錄/翻譯調控複合體,如晚期啟動子和三聯前導序列連接,然後通過體外或體內重組將此基因插入腺病毒基因組中。病毒基因組非-必需區(如E1區或E3區)中的插入可產生存活的,能在被感染的宿主中表達多肽的重組病毒(例見Logan Shenk,Proc.Natl.Acad.Sci.(USA)81:3655-3659(1984))。或者,可使用痘苗病毒7.5K的啟動子(例見Mackett等,Proc.Natl.Acad.Sci.(USA)79:7415-7419(1982);Mackett等,病毒學雜誌,49:857-864(1984);Panieali等,Proc.Natl.Acad.Sci.(USA)79:4927-4931(1982))。
也可能需要特定的起始信號來有效地翻譯插入的脯氨醯-4-羥化酶編碼序列,這些信號包括ATG起始密碼子和鄰近的序列。在包括其自身的起始密碼子和鄰近序列的整個多肽基因被插入適當的表達載體的情況下,不需要加入額外的翻譯調控信號,然而,在僅插入一部分編碼序列的情況下,必需提供包括ATG起始密碼子的外源翻譯調控信號。另外,起始密碼子必需與脯氨醯-4-羥化酶α2亞單位編碼序列的讀框協調以確保能翻譯全部的插入物。這些外源的翻譯調控信號和起始密碼子可以有多種來源,既可以是天然的,也可以是合成的。通過加入適當的轉錄增強子元件,轉錄終止子等可提高表達的效率(見Bittner等,酶學方法,153:516-544(1987)).
用於重組產生本發明的脯氨醯-4-羥化酶α2亞單位的一個優選表達系統是轉基因的非-人動物,其中可從轉基因動物的乳汁中回收所需多肽。通過將編碼本發明α2亞單位的DNA序列與啟動子和其它所需的或任選的能在乳腺中實現表達的調控序列有效連接,即可構建這種系統。同樣地,利用美國專利申請流水號08/037,728中特別描述的在產生靶乳汁蛋白的乳腺細胞中有效的適當的表達系統,可在靶細胞中同時產生所需的或任選的翻譯後的酶。
為了在乳汁中表達,優選所選的啟動子得自豐富的乳汁-特異性蛋白質中的一個,如αS1-酪蛋白,或β-乳球蛋白。例如,αS1-酪蛋白的5』和3』調控序列已被成功用於表達人乳鐵蛋白(lactoferrin)cDNA,類似地,β-乳球蛋白的啟動子已在綿羊產奶細胞中實現了人抗胰蛋白酶基因片段的表達,Wright等,生物技術,9:830-833(1991)。在轉基因山羊中,乳清酸啟動子已被用於表達人組織纖溶酶原激活物,導致人組織纖溶酶原激活物分泌到轉基因動物的乳汁中,Ebert等,生物技術,9:835-838(1991)。使用這種表達系統,可得到將本發明多肽分泌到乳汁中的動物。使用本領域技術人員熟知的方法,可將編碼所需脯氨醯-4-羥化酶鏈的基因與在選定動物種類的乳腺細胞中起作用的適當調控序列簡單地連接,類似地構建編碼脯氨醯-4-羥化酶α2亞單位之基因的表達系統。
優選將本發明的脯氨醯-4-羥化酶表達為分泌的蛋白質,當用於表達蛋白質的經改造的細胞為非人宿主細胞時,用能更有效地被宿主細胞的分泌靶向機制識別的其它分泌信號肽取代人脯氨醯-4-羥化酶蛋白質的分泌信號肽經常是有利的。適當的分泌信號序列對於使哺乳動物基因得到最佳的真菌表達尤其重要,例如,在甲基營養型酵母中,可在編碼序列的氨基末端插入編碼框內釀酒酵母α-交配因子前-原序列的DNA序列。αMF前-原序列是αMF前體分子中所含的前導序列,包括蛋白酶解加工和分泌所必需的lys-arg編碼序列(例見Brake等,Proc.Natl.Acad.Sci.USA,81:4642(1984))。
也優選由宿主細胞將本發明的脯氨醯-4-羥化酶α2亞單位與脯氨醯-4-羥化酶β亞單位和/或膠原共同表達,例見PCT申請PCT/US92/09061(W093/07889)以形成α2β2脯氨醯-4-羥化酶四聚體,此酶可催化被表達的膠原中4-羥脯氨酸的形成。
或者,可選擇以所需的特定方式調節插入序列的表達,或修飾和加工基因產物的宿主細胞株。對蛋白質產物的這種修飾(如糖基化)和加工(如裂解)對於蛋白質的功能可能是至關重要的。不同的宿主細胞在蛋白質的翻譯後加工和修飾方面具有特徵性的和特殊的機制。可選擇適當的細胞系或宿主系統以確保被表達的外源蛋白質的正確修飾和加工。為此,可使用真核宿主細胞,它具有適當加工基因產物之初級轉錄物,使基因產物糖基化和磷酸化的細胞機制。這種哺乳動物宿主細胞包括但不限於CHO,VERO,BHK,HeLa,COS,MDCK,293,WI38等。另外,可改造宿主細胞以使之表達多種能確保膠原分子適當加工的酶,例如,脯氨醯-4-羥化酶的基因(即編碼脯氨醯-4-羥化酶α亞單位的基因和編碼脯氨醯-4-羥化酶B亞單位的基因)可與膠原基因一起在宿主細胞中共同表達。
為了長期,大量地產生重組蛋白質,優選穩定的表達,例如,可改造能穩定表達本發明脯氨醯-4-羥化酶α2亞單位的細胞系。與其使用含有病毒複製起點的表達載體,不如用編碼α2亞單位的DNA轉化宿主細胞,所述DNA受適當的表達調控元件(如啟動子,增強子,序列,轉錄終止子,聚腺苷酸化位點等)和選擇性標記控制。導入外源DNA之後,可使經改造的細胞在加富的培養基上生長1-2天,然後轉移到選擇性培養基上,重組質粒中的選擇性標記賦予細胞對選擇物的抗性,使細胞將質粒穩定地整合到其染色體中,並生長以形成轉化灶,該轉化灶反過來可被克隆和擴展為細胞系。使用此方法改造表達所需脯氨醯-4-羥化酶α2亞單位的細胞系較為有利。
可使用大量選擇系統,包括但不限於在tk-,hgprt-或aprt-細胞中分別使用單純皰疹病毒胸苷激酶(Wigler等,細胞,11:223(1977)),次黃嘌呤鳥嘌呤磷酸核糖轉移酶(Szybalska Szybalski,Proc.Natl.Acad.Sci.USA 48:2026(1962)),腺嘌呤磷酸核糖轉移酶(Lowy等,細胞,22:817(1980))基因。另外,抗代謝物抗性也可用作下列選擇的基礎,即賦予氨甲碟呤抗性的dhfr(Wigler等,Proc.Natl.Acad.Sci.USA77:3567(1980);O』Hare等,Proc.Natl.Acad.Sci.USA78:1527(1981));賦予黴酚酸抗性的gpt(Mulligan Berg,Proc.Natl.Acad.Sci.USA78:2072(1981));賦予氨基糖苷G-418抗性的neo(Colberre-Garapin等,分子生物學雜誌,150:1(1981));和賦予潮黴素抗性的hygro(Santerre等,基因,30:147(1984))。最近,又描述了其它的可選擇基因,即能使細胞利用吲哚以替代利用色氨酸的trpB;使細胞利用組氨醇(histinol)以替代利用組氨酸的hisD(Hartman Mulligan,Proc.Natl.Acad.Sci.USA85:8047(1988));和賦予對鳥氨酸脫羧酶抑制劑2-(二氟甲基)-DL-鳥氨酸,DFMO抗性的ODC(鳥氨酸脫羧酶)(McConlogue L,分子生物學最新通訊,冷泉港實驗室編,1987)。d.鑑定表達本發明α2亞單位蛋白質的轉染子或轉化體並純化表達的蛋白質至少可通過四種一般性方法鑑定含有編碼序列並表達生物活性基因產物的宿主細胞;(a)DNA-DNA或DNA-RNA雜交;(b)「標記」基因功能的存在與否;(c)評估由宿主細胞中α2亞單位mRNA轉錄物的表達測定的轉錄水平;和(d)檢測由免疫測定法或其生物活性測定的基因產物。
在第一種方法中,通過DNA-DNA或DNA-RNA雜交可檢測插入表達載體中的編碼酶的序列的存在,所述雜交分別使用了含有與脯氨醯-4-羥化酶α2亞單位編碼序列同源的核苷酸序列,或其部分或其衍生物的探針。
在第二種方法中,可根據某些「標記」基因功能(如胸苷激酶活性,抗生素抗性,氨甲碟呤抗性,轉化表型,杆狀病毒包含體形成等)的存在與否鑑定和選擇重組表達載體/宿主系統,例如,如果將α2亞單位編碼序列插入載體的標記基因序列內,通過標記基因功能的缺乏可鑑定含有脯氨醯-4-羥化酶α2亞單位編碼序列的重組細胞。或者,將標記基因置於與α2亞單位序列串聯的位置處,所述標記基因受用於控制α2亞單位編碼序列之表達的啟動子或與之不同的啟動子的控制。對誘導或選擇作出反應的標記基因表達顯示出α2亞單位編碼序列的表達。
在第三種方法中,通過雜交試驗可評估α2亞單位編碼區的轉錄活性,例如,可分離RNA並通過Northern印跡分析之,所述Northern印跡使用的探針同源於α2亞單位編碼序列或其特定的部分。或者,可提取宿主細胞總核酸並檢測與這種探針的雜交情況。
在第四種方法中,可通過免疫學方法,例如通過Western印跡,如放射性免疫沉澱,酶聯免疫測定等的免疫測定法來評估酶產物的表達。
通過例如層析法將分泌到培養基中的本發明的經表達的酶純化至均質,在一個實施方案中,通過大小排阻層析純化重組的脯氨醯-4-羥化酶蛋白質α2亞單位,然而,也可使用本領域已知的其它純化技術,包括離子交換層析和反相層析。5.實施例參考下列實施例將會進一步理解本發明,下列實施例僅是本發明的例子而已。實施例1分離小鼠eDNA克隆使用MacNeil等,1993,免疫學雜誌,151:6913-23中所述的編碼胸腺共有抗原1的cDNA為探針,從λgt10(Clontech)中的BALB/c小鼠腦cDNA文庫中得到被稱為BT14.1的小鼠α2亞單位克隆。BT14.1克隆與人和雞的脯氨醯-4-羥化酶α亞單位具有高度的同源性,然而cDNA克隆BT14.1不含編碼多肽N-末端區的序列,因此將它用作探針以篩選小鼠腦和骨骼肌的cDNA文庫。
在600,000個重組體中,得到4個陽性克隆,發現其中的2個即M1和M4是相同的,而M2具有缺失,M3含有兩個不相關的插入物。使用克隆M1篩選λgt10(Clontech)中的1.6×106個小鼠骨骼肌cDNA文庫的噬菌斑,得到1個陽性克隆M6,進一步地鑑定此克隆,發現它包含於BT14.1中,M1和BT14.1的5』端位於相同的內部EcoRI位點(圖1所示序列的第220位核苷酸),通過使用M1篩選小鼠骨骼肌cDNA文庫以分離末端的5』克隆,得到1個陽性克隆M6,如下文實施例2中所述,所述cDNA克隆被認為組合起來覆蓋了小鼠α2亞單位的整個編碼區。
然後通過用α1亞單位的人cDNA克隆PA-49(描述於Helaakoski等,1989,Proc.Natl.Acad.Sci.USA,86:4392-96)篩選3T3成纖維細胞λgtll cDNA文庫(Clontech)以分離小鼠α1亞單位的cDNA克隆,在600,000個噬菌斑中得到8個陽性克隆。
在這些克隆中,分離出3個,即MA3,MA4和MA7並測序。這3個克隆的核苷酸序列和推定的胺基酸序列顯示出與人和雞的脯氨醯-4-羥化酶α亞單位具有顯著的相似性。發現這3個克隆中的2個,即MA3和MA4代表含有可變剪接的外顯子10序列之人mRNA的小鼠類似物,而MA7含有外顯子9序列。cDNA克隆不含mRNA的5』末端。將cDNA衍生的胺基酸序列與人和雞的α1亞單位的相比較,結果表明cDNA克隆覆蓋了整個被加工的多肽,但未覆蓋5』非翻譯區或對應於信號肽N-末端那一半的序列,見GenBank資料庫,登記號為U16162。實施例2核苷酸測序,序列分析和Northern印跡分析通過Sanger等,1977,Proc.Natl.Acad.Sci.USA74:5463-67中所述的雙脫氧核苷酸鏈終止法,用T7DNA聚合酶(Pharmacia)測定實施例1中所述克隆的核苷酸序列。使用在Applied Biosystems DNA合成儀中合成的載體-特異性或序列-特異性引物(Oulu大學生物化學系),使用DNASIS和PROSIS版本6.00的序列分析軟體(Pharmacia),ANTHEPROT(公開於Deleage等,1988,ComputAppl.Biosci,4:351-356),威斯康星遺傳學計算機小組程序包版本8(1994-9)和BOXSHADE(Kay Hofmann,生物信息學小組,Institut Suisse de RecherchesExperimentales sur le Cancer Lausanne,Switzerland)來編輯序列數據。
cDNA克隆覆蓋了相應mRNA的2168個核苷酸並編碼537-aa的多肽(圖1)。推定的信號肽存在於推定多肽的N末端,根據vonHejne(1),核酸研究,14:4683-90的計算參數來看,成熟α2亞單位的第一個胺基酸最可能是色氨酸,這意味著信號序列的大小為19aa,經加工的α2亞單位的大小為518aa。經加工的多肽的分子量為59,000,cDNA克隆分別覆蓋了5』和3』非翻譯序列150bp和407bp(圖1)。3』非翻譯序列含有規範的聚腺苷酸化信號,在距其12個核苷酸的下遊處具有15個核苷酸長的poly(A)尾。
小鼠α2和小鼠α1多肽的大小類似,α2為518個胺基酸,α1為517個胺基酸,由此假定α2多肽以色氨酸殘基開始,α1多肽與人αl多肽一樣以組氨酸殘基開始。經加工的人α1亞單位含有517個胺基酸,雞α1亞單位含有516個胺基酸(Bassuk等,文獻同上),而經加工的C.elegans α亞單位較長,含有542個胺基酸(Veijola等,文獻同上),所述差異主要是由多肽C末端存在的32個胺基酸的突出引起的(圖2)。
小鼠α2和α1亞單位含有兩個潛在的天冬醯胺連接的寡糖的附著位點;α2亞單位-Asn-Leu-Ser-和-Asn-Glu-Thr-序列的位置示於圖1。人,小鼠和雞α1亞單位和C.elegans α亞單位中存在的5個半胱氨酸殘基的位置在α2亞單位中都是保守的,但後者在α1亞單位的第4和第5個半胱氨酸之間含有另一個半胱氨酸,有趣的是在小鼠α1和C.elegans α亞單位中它所在的位點處胺基酸保守的一段序列也被中斷。
小鼠α2和α1亞單位之間全部胺基酸序列的同一性和相似性分別為63%和83%,小鼠α2和C.elegans α亞單位之間的相應值分別為41%和67%,這與小鼠α1和C.elegans α亞單位之間的相應值43%和67%幾乎相同。然而,同一性並未平均分布,在C-末端區域內同一性最高,據信該區域代表α1亞單位中對催化至關重要的部分(文獻同上;Myllyla等,(1992),生物化學雜誌,286:923-927)。小鼠α1亞單位中可能涉及脯氨醯-4-羥化酶(26)之Fe2+結合位點的第412和483位的兩個組氨酸殘基都是保守的,都位於保守的C-末端區域內。
在廠商說明書中建議的嚴緊條件下,使分離自多種小鼠組織、每份樣品含有2μg poly(A)』RNA的小鼠多組織Northern印跡(Clontech)雜交,所用的探針是32P標記的cDNA克隆BT14.1或MA7。
兩種類型α亞單位的mRNA的表達模式非常相似,在心臟,肺和腦中雜交信號的強度最高,α2亞單位mRNA的大小為2.4kb。小鼠α1亞單位至少在心臟,腦和肺中具有兩個mRNA轉錄物較強的信號在3.4kb處,較弱的信號在4.3kb處。實施例3細胞培養和重組杆狀病毒的產生由於起初不知道α2多肽是否代表脯氨醯-4-羥化酶的α亞單位,脯氨醯-3-羥化酶的亞單位,或一些其它的2-氧化戊二酸雙加氧酶,所以在昆蟲細胞中表達重組多肽以闡明其功能。具體地說,於27℃,在添加有10%胎牛血清(GIBCO)的TNM-FH培養基(Sigma)中培養Spodopiera frugiperda Sf9昆蟲細胞。為了構建α(11)亞單位cDNA以用於表達,用BamHⅠ和EcoRⅠ限制性酶消化克隆BT14.1,得到包含bp592-2168的片段。由M6λDNA擴增5』片段,所用引物是cDNA特異性的含有人工NotⅠ位點的M3PH(5』-AAGTTGCGGCCGCGAGCATCAGCAAGGTACTGC-3』)(SEQ ID NO:30)和含有天然BamHⅠ位點的M65』PCR(5』-TGTCCGGATCCAGTTTGTACGTGTC-3』)(SEQ IDNO:31)。在Taq聚合酶(Promega)供應商推薦的條件下進行PCR,按下述將反應循環27次94℃變性1分鐘,66℃退火1分鐘,和72℃延伸3分鐘。用NotⅠ和BamHⅠ限制性酶消化產物得到由bp120延伸至591的片段,然後將兩個NotⅠ-BamHⅠ和BamHⅠ-EcoRⅠ片段克隆到pBluescript載體(Stratagene)中,用NotⅠ和EcoRⅤ消化構建體,將所得片段連接到杆狀病毒轉移載體pVL1392的NotⅠ-SmaⅠ位點,其中所述載體是根據Luckow和Summers,1989,病毒學,170:31-39所述的方法得到的。使用BaclulGold轉染試劑盒(PharMingen)將pⅥ構建體與經修飾的苜蓿銀紋夜蛾核型多角體病毒的DNA共轉染至Sf9昆蟲細胞中。4天後收集所得的病毒庫,擴增並進行噬斑純化。通過Malitschek和Schartl(1991)生物技術,11:177-178中所述的基於PCR的方法檢查重組病毒。實施例4重組蛋白質的表達和分析產生編碼小鼠α2亞單位的重組杆狀病毒,並用此病毒感染含有或不含人PDI/β亞單位的S.frugiperda昆蟲細胞,其中以5為感染複數來感染昆蟲細胞。為了產生酶四聚體,以1∶1或2∶1的比率使用人α59 1(Vuori等,文獻同上)或小鼠α2病毒與PDI/β病毒(見上文)。感染72小時後收穫細胞,在0.01MTris,pH7.8/0.1M NaCl/0.1M甘氨酸/10μM二硫蘇糖醇/0.1%Triton X-100中勻漿並離心。通過SDS/8%PAGE或未變性的7.5%PAGE分析所得的上清液並測定酶活性。將細胞沉澱進一步溶解於1%SDS中,通過對脯氨醯-4-羥化酶α1亞單位而言為還原性的SDS-PAGE分析可溶於0.1%Triton X-100和可溶於1%SDS的蛋白質(Veijola等,文獻同上;Vuori等,文獻同上;John等,1993,EMBO J,12:1587-95)。多肽形成不溶性的聚集體,從細胞勻漿物中有效提取重組的小鼠α2亞單位需要使用1%SDS。實施例5酶活性的測定通過Kivirriko和Myllyla(1982),酶學方法,82:245-304中所述的基於2-氧化H14C-戊二酸的方法測定脯氨醯-4-羥化酶的活性。通過Myllyla等,1977,歐洲生物化學雜誌,80:349-357中所述的在固定濃度的第二種底物存在的情況下,改變一種底物的濃度而使其它底物的濃度保持不變以測定Km值。
用基於2-氧化[114C]-戊二酸羥化偶聯的脫羧作用(Kivirriko和Myllyla,文獻同上)的試驗分析含有小鼠-人Ⅱ型或人Ⅰ型酶之細胞勻漿物的0.1%Triton X-100提取物,這兩者的活性非常類似。
為了顯示小鼠/人2型酶的活性為脯氨醯-4-羥化酶的活性,反應後測定(Pro-Pro-Gly)10底物中4-羥脯氨酸的量。所得數值表明2型和1型酶的表現非常相似,2型酶的活性實際上就是脯氨醯-4-羥化酶的活性。如表Ⅰ所示,對兩種酶而言,Fe2+,2-氧化戊二酸和抗壞血酸的Km值和吡啶-2,4-二羧酸(為2-氧化戊二酸的競爭性抑制劑)的Ki值非常相似。
表Ⅰ輔底物和肽底物的Km值和人1型和小鼠/人2型脯氨醯-4-羥化酶四聚體的某些抑制劑的Ki值
*值測定為IC50-。
值得注意的是,2型酶僅被很高濃度的聚(L-脯氨酸)抑制的值差別很大,這是因為聚(L-脯氨酸)是所有被研究的脊椎動物來源的1型脯氨醯-4-羥化酶的研究得較為透徹的,有效的競爭性抑制劑,且因為聚(L-脯氨酸)是被研究的所有植物脯氨醯-4-羥化酶的有效多肽底物。這種發現是意料之外的,因此顯著的差別似乎存在於多種脯氨醯-4-羥化酶的肽結合位點的結構中,但目前在此方面沒有詳細的資料報導。實施例6在昆蟲細胞中表達小鼠α2亞單位和有活性的小鼠α2PDI/β酶四聚體用編碼兩個多肽的兩個重組病毒共同感染昆蟲細胞以研究小鼠α2亞單位和人PDI/β亞單位之間是否可以結合。如在非變性條件下進行的PAGE所示,形成了雜合蛋白,此蛋白質可溶於含有0.1%TritonX-100的緩衝液中。在相同條件下,單獨表達的小鼠α2亞單位未給出任何可提取的重組蛋白質,可稱之為1型四聚體,這表明雜合蛋白可能是α22β2四聚體,可稱之為2型四聚體。發現α2和α1亞單位與PDI/β亞單位連接成四聚體的方式沒有什麼差別。為了顯示所形成的雜合蛋白含有人PDI/β亞單位,可進行Western印跡。當小鼠α2亞單位與人PDI/β亞單位共同表達時,蛋白質複合體含有PDI/β亞單位。實施例7人α2亞單位基因的分離和測序用含有32P-標記的切口平移的PCR片段的探針篩選人肺成纖維細胞基因組文庫(克隆至λFIX載體(Stratagene))和人染色體5文庫(克隆至λ載體卡隆40(ATCC)),所述PCR片段對應於以前鑑定的人脯氨醯-4-羥化酶α亞單位cDNA序列。
鑑定得自人肺成纖維細胞文庫和人染色體5文庫的陽性克隆,分離之並通過Southern印跡分析。將適當的片段亞克隆至pSP72載體(Promega)中以供進一步分析。
從人肺成纖維細胞基因組文庫中得到5個陽性克隆,稱為GL-2,GL-5,GL-20,GL-141和GL-142,這些克隆中的兩個GL-2和GL-141是相同的。未得到對應於編碼脯氨醯-4~羥化酶α2亞單位之基因的5』和3』末端的克隆。
用兩個獨立的探針將人染色體5文庫篩選2次,第一個探針對應於以前鑑定的脯氨醯-4-羥化酶α2亞單位cDNA序列的5』末端,第二個探針對應於相同cDNA序列的3』末端。得到幾個陽性克隆,包括GL-3,GL-4,GL-9,GL-11,GL-11B和GL-156。GL-3,GL-4,GL-9和GL-11B對應於蛋白質的5』末端,GL~11A和GL-156對應於蛋白質的3』末端,並且發現克隆GL-11A和GL-156相同。
對應於基因的衍生序列的大小超過30kb,並由15個外顯子組成。只編碼蛋白質序列的外顯子大小為54-240個鹼基對不等,內含子為241-至少3200個鹼基對不等(見圖2-9)。
與α1亞單位的基因序列相比,α2亞單位僅有1個外顯子對應於α1亞單位基因的兩個相互排斥剪接的外顯子(α1亞單位基因的外顯子9)。
推定的胺基酸序列與已知的α(1)亞單位63%同源。實施例8在昆蟲細胞中表達人脯氨醯-4-羥化酶α2亞單位使用實施例3,4和6中的方法,表達並分析脯氨醯-4-羥化酶α2亞單位同工型。在昆蟲細胞中的表達資料表明α2亞單位同工型與人β亞單位形成了有活性的2型脯氨醯-4-羥化酶α2β2四聚體。
除了本文所示和所述的以外,參照上文的描述,對本發明的多種修飾對於本領域技術人員而言是顯而易見的。這種修飾意欲包括在所附權利要求書的範圍中。應理解給出的所有核苷酸鹼基對的大小都是大致的數目,目的是為了描述本發明。
本文提及的所有參考文獻都全文列入本文作為參考。
序列表(1)一般資料(ⅰ)申請人Kevirikko,KariPihlajaniemi,Taina A.(ⅱ)發明題目脯氨醯-4-羥化酶的α2亞單位,編碼此亞單位的核酸序列及其生產方法(ⅲ)序列數31(ⅳ)通訊地址(A)收件人Pennie Edmonds(B)街道1155Avenue of the Americas(C)城市紐約(D)州紐約(E)國家美國(F)郵政編碼10036(ⅴ)計算機可讀形式(A)介質類型軟盤(B)計算機IBM PC兼容機(C)作業系統PC-DOS/MS-DOS(D)軟體PatentIn Release#1.0,Version#1.30(ⅵ)本申請資料(A)申請號美國指定(B)申請日1996-3-28(C)分類號(ⅷ)代理人/代理資料(A)姓名Halluin,Albert P.
(B)登記號25,227
(C)資料/文檔號8389-041(ⅸ)通訊資料(A)電話415-854-3660(B)傳真415-854-3694(C)電傳66141PENNIE(2)SEQ ID NO:1的資料(ⅰ)序列特徵(A)長度2168個鹼基對(B)類型核酸(C)鏈型未知(D)拓撲結構未知(ⅱ)分子類型cDNA(ⅸ)特徵(A)名稱/關鍵詞CDS(B)位置151…1761(ⅹⅰ)序列描述SEQ ID NO:1:GCAGTTTCAG AGACCGGTGG CGATTGGCTG ACTGATTCAA CAAATAGAGC ATTCTCTGTG60CCTGGAGACT TTCAAGGACT GAGGCAGGCA GAAGGGAAGA CTCAGAAAGT TCAGGTCCAG 120AGCATCAGCA AGGTACTGCC CTTTCCAGTT ATG AAG CTC CAG GTG TTG GTG TTG174Met Lys Leu Gln Val Leu Val Leu1 5GTG TTG CTG ATG TCC TGG TTC GGT GTC CTG AGC TGG GTG CAG GCA GAA 222Val Leu Leu Met Ser Trp Phe Gly Val Leu Ser Trp Val Gln Ala Glu10 15 20TTC TTC ACC TCC ATT GGG CAC ATG ACC GAT CTG ATT TAC GCA GAG AAG 270Phe Phe Thr Ser Ile Gly His Met Thr Asp Leu Ile Tyr Ala Glu Lys25 30 35 40GAC CTG GTA CAG TCT CTG AAG GAG TAC ATC CTT GTG GAG GAA GCC AAG 318Asp Leu Val Gln Ser Leu Lys Glu Tyr Ile Leu Val Glu Glu Ala Lys45 50 55CTC GCC AAG ATT AAG AGC TGG GCC AGC AAG ATG GAA GCC CTG ACC AGC 366Leu Ala Lys Ile Lys Ser Trp Ala Ser Lys Met Glu Ala Leu Thr Ser60 65 70AGA TCA GCT GCC GAC CCC GAG GGC TAC CTG GCT CAT CCT GTG AAT GCC 414Arg Ser Ala Ala Asp Pro Glu Gly Tyr Leu Ala His Pro Val Asn Ala75 80 85TAC AAG CTG GTG AAG CGG TTG AAC ACA GAC TGG CCT GCA CTG GGG GAC 462Tyr Lys Leu Val Lys Arg Leu Asn Thr Asp Trp Pro Ala Leu Gly Asp90 95 100CTT GTC CTT CAG GAT GCT TCG GCA GGT TTT GTC GCT AAC CTC TCA GTT 510Leu Val Leu Gln Asp Ala Ser Ala Gly Phe Val Ala Asn Leu Ser Val105 110 115 120CAG CGG CAA TTC TTC CCC ACT GAT GAG GAC GAG TCT GGA GCT GCC AGA 558Gln Arg Gln Phe Phe Pro Thr Asp Glu Asp Glu Ser Gly Ala Ala Arg125 130 135GCC CTG ATG AGA CTT CAG GAC ACG TAC AAA CTG GAT CCG GAC ACG ATT 606Ala Leu Met Arg Leu Gln Asp Thr Tyr Lys Leu Asp Pro Asp Thr Ile140 145 150TCC AGA GGG GAA CTT CCA GGC ACA AAG TAC CAG GCC ATG CTG AGT GTG 654Ser Arg Gly Glu Leu Pro Gly Thr Lys Tyr Gln Ala Met Leu Ser Val155 160 165GAC GAC TGC TTT GGG CTG GGC CGC TCA GCT TAC AAT GAA GGA GAC TAT 702Asp Asp Cys Phe Gly Leu Gly Arg Ser Ala Tyr Asn Glu Gly Asp Tyr170 175 180TAC CAT ACT GTG CTG TGG ATG GAG CAG GTA CTG AAG CAG CTC GAT GCT 750Tyr His Thr Val Leu Trp Met Glu Gln Val Leu Lys Gln Leu Asp Ala185 190 195 200GGG GAG GAG GCC ACT GTT ACC AAG TCC CTG GTG CTG GAC TAC CTG AGC 798Gly Glu Glu Ala Thr Val Thr Lys Ser Leu Val Leu Asp Tyr Leu Ser205 210 215TAT GCT GTC TTC CAA CTG GGT GAC CTG CAC CGT GCT GTG GAA CTC ACC 846Tyr Ala Val Phe Gln Leu Gly Asp Leu His Arg Ala Val Glu Leu Thr220 225 230CGC CGC CTG CTC TCT CTT GAC CCA AGC CAC GAA CGA GCT GGA GGG AAT 894TAC AAC CTT CTT CGC AGT GGG GAA GGT GAT TAT CGG ACG AGA CAT GCA1662Tyr Asn Leu Leu Arg Ser Gly Glu Gly Asp Tyr Arg Thr Arg His Ala490 495 500GCC TGC CCT GTG CTT GTG GGC TGC AAG TGG GTC TCC AAC AAG TGG TTC1710Ala Cys Pro Val Leu Val Gly Cys Lys Trp Val Ser Asn Lys Trp Phe505 510 515520CAT GAG CGA GGA CAG GAG TTC TTA AGA CCT TGT GGA ACA ACG GAA GTT1758His Glu Arg Gly Gln Glu Phe Leu Arg Pro Cys Gly Thr Thr Glu Val525 530 535GAT TGACGTCCTT TTCTCTCCGC TCCTCCCTGG CCCATAGTCC AAATCATCTT 1811AspCAAGTTCAAC ATGACAGCTT CCTTTTTTAT GTCCCAGCTC CTGTCAGGCA GGTCATTGGA 1871GGAGCCAGTG TTTGACTGAA TTGAGAGAGT ATATCCTGAG CCTAGTCCTG GGTGACCTGG 1931GCCCCAGACT CTGACCAGCT TACACCTGCC CTGGCTCTGG GGGTGTCTTG GCATGGCTGC 1991GGTAGAGCCA GACTATAGCA CCCGGCACGG TCGCTTTGTA CCTCAGATAT TTCAGGTAGA 2051AGATGTCTCA GTGAAACCAA AGTTCTGATG CTGTTTACAT GTGTGTTTTT ATCACATTTC 2111TATTTGTTGT GGCTTTAACC AAAAAATAAA AATGTTCCTG CCAAAAAAAA AAAAAAA 2168(2)SEQ ID NO:2的資料(ⅰ)序列特徵(A)長度537個胺基酸(B)類型胺基酸(D)拓撲結構線性(ⅱ)分子類型蛋白質(ⅹⅰ)序列描述SEQ ID NO:2:Met Lys Leu Gln Val Leu Val Leu Val Leu Leu Met Ser Trp Phe Gly1 5 10 15Val Leu Ser Trp Val Gln Ala Glu Phe Phe Thr Ser Ile Gly His Met20 25 30Thr Asp Leu Ile Tyr Ala Glu Lys Asp Leu Val Gln Ser Leu Lys Glu35 40 45Tyr Ile Leu Val Glu Glu Ala Lys Leu Ala Lys Ile Lys Ser Trp Ala50 55 60Ser Lys Met Glu Ala Leu Thr Ser Arg Ser Ala Ala ASp Pro Glu Gly65 70 75 80Tyr Leu Ala His Pro Val Asn Ala Tyr Lys Leu Val Lys Arg Leu Asn85 90 95Thr Asp Trp Pro Ala Leu Gly Asp Leu Val Leu Gln Asp Ala Ser Ala100 105 110Gly Phe Val Ala Asn Leu Ser Val Gln Arg Gln Phe Phe Pro Thr Asp115 120 125Glu Asp Glu Ser Gly Ala Ala Arg Ala Leu Met Arg Leu Gln Asp Thr130 135 140Tyr Lys Leu Asp Pro Asp Thr Ile Ser Arg Gly Glu Leu Pro Gly Thr145 150 155 160Lys Tyr Gln Ala Met Leu Ser Val Asp Asp Cys Phe Gly Leu Gly Arg165 170 175Ser Ala Tyr Asn Glu Gly Asp Tyr Tyr His Thr Val Leu Trp Met Glu180 185 190Gln Val Leu Lys Gln Leu Asp Ala Gly Glu Glu Ala Thr Val Thr Lys195 200 205Ser Leu Val Leu Asp Tyr Leu Ser Tyr Ala Val Phe Gln Leu Gly Asp210 215220Leu His Arg Ala Val Glu Leu Thr Arg Arg Leu Leu Ser Leu Asp Pro225 230 235 240Ser His Glu Arg Ala Gly Gly Asn Leu Arg Tyr Phe Glu Arg Leu Leu245 250 255Glu Glu Glu Arg Gly Lys Ser Leu Ser Ash Gln Thr Asp Ala Gly Leu260 265 270Ala Thr Gln Glu Asn Leu Tyr Glu Arg Pro Thr Asp Tyr Leu Pro Glu275 280 285Arg Asp Val Tyr Glu Ser Leu Cys Arg Gly Glu Gly Val Lys Leu Thr290 295 300Pro Arg Arg Gln Lys Lys Leu Phe Cys Arg Tyr His His Gly Asn Arg305 310 315 320Val Pro Gln Leu Leu Ile Ala Pro Phe Lys Glu Glu Asp Glu Trp Asp325 330 335Ser Pro His Ile Val Arg Tyr Tyr Asp Val Met Ser Asp Glu Glu Ile340 345 350Glu Arg Ila Lys Glu Ile Ala Lys Pro Lys Leu Ala Arg Ala Thr Val355 360 365Arg Asp Pro Lys Thr Gly Val Leu Thr Val Ala Ser Tyr Arg Val Ser370 375380Lys Ser Ser Trp Leu Glu Glu Asp Asp Asp Pro Val Val Ala Arg Val385 390 395 400Asn Arg Arg Met Gln His Ile Thr Gly Leu Thr Val Lys Thr Ala Glu405 410 415Leu Leu Gln Val Ala Asn Tyr Gly Met Gly Gly Gln Tyr Glu Pro His420 425 430Phe Asp Phe Ser Arg Ser Asp Asp Glu Asp Ala Phe Lys Arg Leu Gly435 440 445Thr Gly Asn Arg Val Ala Thr Phe Leu Asn Tyr Met Ser Asp Val Glu450 455 460Ala Gly Gly Ala Thr Val Phe Pro Asp Leu Gly Ala Ala Ile Trp Pro465 470 475 480Lys Lys Gly Thr Ala Val Phe Trp Tyr Asn Leu Leu Arg Ser Gly Glu485 490 495Gly Asp Tyr Arg Thr Arg His Ala Ala Cys Pro Val Leu Val Gly Cys500 505 510Lys Trp Val Ser Asn Lys Trp Phe His Glu Arg Gly Gln Glu Phe Leu515 520 525Arg Pro Cys Gly Thr Thr Glu Val Asp530 535(2)SEQ ID NO:3的資料(ⅰ)序列特徵(A)長度2207個鹼基對(B)類型核酸(C)鏈型未知(D)拓撲結構未知(ⅱ)分子類型cDNA(ⅸ)特徵(A)名稱/關鍵詞CDS(B)位置1…2205(ⅹⅰ)序列描述SEQID NO:3:GGG GAA GGA ACA CTG TAG GGG ATA GCT GTC CAC GGA CGC TGT CTA CAA48Gly Glu Gly Thr Leu * Gly Ile Ala Val His Gly Arg Cys Leu Gln540 545 550GAC CCT GGA GTG AGA TAA CGT GCC TGG TAC TGT GCC CTG CAT GTG TAA96Asp Pro Gly Val Arg * Arg Ala Trp Tyr Cys Ala Leu His Val *555 560 565GAT GCC CAG TTG ACC TTC GCA GCA GCA GCC TGG ATC AGG CAC TTC CTG 144Asp Ala Gln Leu Thr Phe Ala Ala Gly Ala Trp Ile Arg His Phe Leu570 575 580 585CCT CAG GTA TTG CTG GAC AGC CCA GAC ACT TCC CTC TGT GAC CAT GAA 192Pro Gln Val Leu Leu Asp Ser Pro Asp Thr Ser Leu Cys Asp His Glu590 595 600ACT CTG GGT GTC TGC ATT GCT GAT GGC CTG GTT TGG TGT CCT GAG CTG 240Thr Leu Gly Val Cys Ile Ala Asp Gly Leu Val Trp Cys Pro Glu Leu605 610 615TGT GCA GGC CGA ATT CTT CAC CTC TAT TGG GCA CAT GAC TGA CCT GAT 288Cys Ala Gly Arg Ile Leu His Leu Tyr Trp Ala His Asp * Pro Asp620 625 630TTA TGC AGA GAA AGA GCT GGT GCA GTC TCT GAA AGA GTA CAT CCT TGT 336Leu Cys Arg Glu Arg Ala Gly Ala Val Ser Glu Arg Val His Pro Cys635 640 645GGA GGA AGC CAA GCT TTC CAA GAT TAA GAG CTG GGC CAA CAA AAT GGA 384Gly Gly Ser Gln Ala Phe Gln Asp * Glu Leu Gly Gln Gln Asn Gly650 655 660 665AGC CTT GAC TAG CAA GTC AGC TGC TGA TGC TGA GGG CTA CCT GGC TCA432Ser Leu Asp * Gln Val Ser Cys * Cys * Gly Leu Pro Gly Ser670 675 680CCC TGT GAA TGC CTA CAA ACT GGT GAA GCG GCT AAA CAC AGA CTG GCC480Pro Cys Glu Cys Leu Gln Thr Gly Glu Ala Ala Lys His Arg Leu Ala685 690 695TGC GCT GGA GGA CCT TGT CCT GCA GGA CTC AGC TGC AGG TTT TAT CGC528Cys Ala Gly Gly Pro Cys Pro Ala Gly Leu 5er Cys Arg Phe Tyr Arg700 705 710CAA CCT CTC TGT GCA GCG GCA GTT CTT CCC CAC TGA TGA GGA CGA GAT576Gln Pro Leu Cys Ala Ala Ala Val Leu Pro His * * Gly Arg Asp715 720 725AGG AGC TGC CAA AGC CCT GAT GAG ACT TCA GGA CAC ATA CAG GCT GGA624Arg Ser Cys Gln Ser Pro Asp Glu Thr Ser Gly His Ile Gln Ala Gly730 735 740 745CCC AGG CAC AAT TTC CAG AGG GGA ACT TCC AGG AAC CAA GTA CCA GGC672Pro Arg His Asn Phe Gln Arg Gly Thr Ser Arg Asn Gln Val Pro Gly750 755 760AAT GCT GAG TGT GGA TGA CTG CTT TGG GAT GGG CCG CTC GGC CTA CAA720Asn Ala Glu Cys Gly * Leu Leu Trp Asp Gly Pro Leu Gly Leu Gln765 770775TGA AGG GGA CTA TTA TCA TAC GGT GTT GTG GAT GGA GCA GGT GCT AAA768* Arg Gly Leu Leu Ser Tyr Gly Val Val Asp Gly Ala Gly Ala Lys780 785 790GCA GCT TGA TGC CGG GGA GGA GGC CAC CAC AAC CAA GTC ACA GGT GCT816Ala Ala * Cys Arg Gly Gly Gly His His Asn Gln Val Thr Gly Ala795 800 805GGA CTA CCT ACG CTA TGC TGT CTT CCA GTT GGG TGA TCT GCA CCG TGC864Gly Leu Pro Thr Leu Cys Cys Leu Pro Val Gly * Ser Ala Pro Cys810 815 820 825CCT GGA GCT CAC CCG CCG CCT GCT CTC CCT TGA CCC AAG CCA CGA ACG912Pro Gly Ala His Pro Pro Pro Ala Leu Pro * Pro Lys Pro Arg Thr830 835 840AGC TGG AGG GAA TCT GCG GTA CTT TGA GCA GTT ATT GGA GGA AGA GAG960Ser Trp Arg Glu Ser Ala Val Leu * Ala Val Ile Gly Gly Arg Glu845 850 855AGA AAA AAC GTT AAC AAA TCA GAC AGA AGC TGA GCT AGC AAC CCC AGA 1008Arg Lys Asn Val Asn Lys Ser Asp Arg Ser * Ala Ser Asn Pro Arg860 865 870AGG CAT CTA TGA GAG GCC TGT GGA CTA CCT GCC TGA GAG GGA TGT TTA 1056Arg His Leu * Glu Ala Cys Gly Leu Pro Ala * Glu Gly Cys Leu875 880 885CGA GAG CCT CTG TCG TGG GGA GGG TGT CAA ACC TCG CAA GCA TAG ACA 1104Arg Glu Pro Leu Ser Trp Gly Gly Cys Gln Thr Ser Gln Ala * Thr890 895 900 905GAA GAG GCT TTT CTG TAG GTA CCA CCA TGG CAA CAG GGC CCC ACA GCT1152Glu Glu Ala Phe Leu * Val Pro Pro Trp Gln Gln Gly Pro Thr Ala910 915 920GCT CAT TGC CCC CTT CAA AGA GGA GGA CGA GTG GGA CAG CCC GCA CAT1200Ala His Cys Pro Leu Gln Arg Gly Gly Arg Val Gly Gln Pro Ala His925 930 935CGT CAG GTA CTA CGA TGT CAT GTC TGA TCA GGA AAT CGA GAG GAT CAA1248Arg Gln Val Leu Arg Cys His Val * * Gly Asn Arg Glu Asp Gln940 945 950GGA GAT CGC AAA ACC TAA ACT TGC ACG AGC CAC CGT TCG TGA TCC CAA1296Gly Asp Arg Lys Thr * Thr Cys Thr Ser His Arg Ser * Ser Gln955 960 965GAG AGG AGT CCT CAC TGT CGC CAG CTA CCG GGT TTC CAA AAG CTC CTG1344Glu Arg Ser Pro His Cys Arg Gln Leu Pro Gly Phe Gln Lys Leu Leu970 975 980 985GCT AGA GGA AGA TGA TGA CCC TGT TGT GGC CCG AGT AAA TCG TCG GAT1392Ala Arg Gly Arg * * Pro Cys Cys Gly Pro Ser Lys Ser Ser Asp990 995 1000GCA GCA TAT CAC AGG GTT AAC AGT AAA GAC TGC AGA ATT GTT ACA GGT1440Ala Ala Tyr His Arg Val Asn Ser Lys Asp Cys Arg Ile Val Thr Gly100510101015TGC AAA TTA TGG AGT GGG AGG ACA GTA TGA ACC GCA CTT CGA CTT CTC1488Cys Lys Leu Trp Ser Gly Arg Thr Val * Thr Ala Leu Arg Leu Leu102010251030TAG GAA TGA TGA GCG AGA TAC TTT CAA GCA TTT AGG GAC GGG CAA TCG1536* Glu * * Ala Arg Tyr Phe Gln Ala Phe Arg Asp Gly Glu Ser103510401045TGT GGC TAC TTT CTT AAA CTA CAT GAG TGA TGT AGA AGC TGG TGG TGC1584Cys Gly Tyr Phe Leu Lys Leu His Glu * Cys Arg Ser Trp Trp Cys1050105510601065CAC CGT CTT CCC TGA TCT GGG GGC TCC AAT TTG GCC TAA GAA GGG TAC1632His Arg Leu Pro * Ser Gly Gly Cys Asn Leu Ala * Glu Gly Tyr107010751080AGC TGT GTT CTG GTA CAA CCT CTT GCG GAG CGG GGA AGG TGA CTA CCG1680Ser Cys Val Leu Va1 Gln Pro Leu Ala Glu Arg Gly Arg * Leu Pro108510901095AAC AAG ACA TGC TGC CTG CCC TGT GCT TGT GGG CTG CAA GTG GGT CTC1728Asn Lys Thr Cys Cys Leu Pro Cys Ala Cys Gly Leu Gln Val Gly Leu110011051110CAA TAA GTG GTT CCA TGA ACG AGG ACA GGA GTT CTT GAG ACC TTG TGG1776Gln * Val Val Pro * Thr Arg Thr Gly Val Leu Glu Thr Leu Trp111511201125ATC AAC AGA AGT TGA CTG ACA TCC TTT TCT GTC CTT CCC CTT CCT GGT1824Ile Asn Arg Ser * Leu Thr Ser Phe Ser Val Leu Pro Leu Pro Gly1130113511401145CCT TCA GCC CAT GTC AAC GTG ACA GAC ACC TTT GTA TGT TCC TTT GTA1872Pro Ser Ala His Val Asn Val Thr Asp Thr Phe Val Cys Sar Phe Val115011551160TGT TCC TAT CAG GCT GAT TTT TGG AGA AAT GAA TGT TTG TCT GGA GCA1920Cys Ser Tyr Gln Ala Asp Phe Trp Arg Asn Glu Cys Leu Ser Gly Ala116511701175GAG GGA GAC CAT ACT AGG GCG ACT CCT GTG TGA CTG AAG TCC CAG CCC1968Glu Gly Asp His Thr Arg Ala Thr Pro Val * Leu Lys Ser Gln Pro118011851190TTC CAT TCA GCC TGT GCC ATC CCT GGC CCC AAG GCT AGG ATC AAA GTG2016Phe His Ser Ala Cys Ala Ile Pro Gly Pro Lys Ala Arg Ile Lys Val119512001205GCT GCA GCA GAG TTA GCT TGC TAG CGC CTA GCA AGG TGC CTT TGT ACC2064Ala Ala Ala Glu Leu Ala Cys * Arg Leu Ala Arg Cys Leu Cys Thr1210121512201225TCA GGT GTT TTA GGT GTG AGA TGT TTC AGT GAA CCA AAG TTC TGA TAC2112Ser Gly Val Leu Gly Val Arg Cys Phe Ser Glu Pro Lys Phe * Tyr123012351240CTT GTT TAC ATG TTT GTT TTT ATG GCA TTT CTA TCT ATT GTG GCT TTA2160Leu Val Tyr Met Phe Val Phe Met Ala Phe Leu Ser Ile Val Ala Leu124512501255CCA AAA AAT AAA ATG TCC CTA CCA GAA GCC GTT AAA AAA AAA AAA2205Pro Lys Asn Lys Met Ser Leu Pro Glu Ala Val Lys Lys Lys Lys126012651270AA 2207(2)SEQ ID NO:4的資料(ⅰ)序列特徵(A)長度735個胺基酸(B)類型胺基酸(D)拓撲結構線性(ⅱ)分子類型蛋白質(ⅹⅰ)序列描述SEQ ID NO:4:Gly Glu Gly Thr Leu * Gly Ile Ala Val His Gly Arg Cys Leu Gln1 5 10 15Asp Pro Gly Val Arg * Arg Ala Trp Tyr Cys Ala Leu His Val *20 25 30Asp Ala Gln Leu Thr Phe Ala Ala Gly Ala Trp Ile Arg His Phe Leu35 40 45Pro Gln Val Leu Leu Asp Ser Pro Asp Thr Ser Leu Cys Asp His Glu50 55 60Thr Leu Gly Val Cys Ile Ala Asp Gly Leu Val Trp Cys Pro Glu Leu65 70 75 80Cys Ala Gly Arg Ile Leu His Leu Tyr Trp Ala His Asp * Pro Asp85 90 95Leu Cys Arg Glu Arg Ala Gly Ala Val Ser Glu Arg Val His Pro Cys100 105 110Gly Gly Ser Gln Ala Phe Gln Asp * Glu Leu Gly Gln Gln Asn Gly115 120 125Ser Leu Asp * Gln Val Ser Cys * Cys * Gly Leu Pro Gly Ser130 135 140Pro Cys Glu Cys Leu Gln Thr Gly Glu Ala Ala Lys His Arg Leu Ala145 150 155 160Cys Ala Gly Gly Pro Cys Pro Ala Gly Leu Ser Cys Arg Phe Tyr Arg165 170 175Gln Pro Leu Cys Ala Ala Ala Val Leu Pro His * * Gly Arg Asp180 185 190Arg Ser Cys Gln Ser Pro Asp Glu Thr Ser Gly His Ile Gln Ala Gly195 200 205Pro Arg His Asn Phe Gln Arg Gly Thr Ser Arg Asn Gln Val Pro Gly210 215 220Asn Ala Glu Cys Gly * Leu Leu Trp Asp Gly Pro Leu Gly Leu Gln225 230 235 240* Arg Gly Leu Leu Ser Tyr Gly Val Val Asp Gly Ala Gly Ala Lys245 250 255Ala Ala * Cys Arg Gly Gly Gly His His Asn Gln Val Thr Gly Ala260 265 270Gly Leu Pro Thr Leu Cys Cys Leu Pro Val Gly * Ser Ala Pro Cys275 280 285Pro Gly Ala His Pro Pro Pro Ala Leu Pro * Pro Lys Pro Arg Thr290 295 300Ser Trp Arg Glu Ser Ala Val Leu * Ala Val Ile Gly Gly Arg Glu305 310 315 320Arg Lys Asn Val Asn Lys Ser Asp Arg Ser * Ala Ser Asn Pro Arg325 330 335Arg His Leu * Glu Ala Cys Gly Leu Pro Ala * Glu Gly Cys Leu340 345 350Arg Glu Pro Leu Ser Trp Gly Gly Cys Gln Thr Ser Gln Ala * Thr355 360 365Glu Glu Ala Phe Leu * Val Pro Pro Trp Gln Gln Gly Pro Thr Ala370 375 380Ala His Cys Pro Leu Gln Arg Gly Gly Arg Val Gly Gln Pro Ala His385 390 395 400Arg Gln Val Leu Arg Cys His Val * * Gly Asn Arg Glu Asp Gln405 410 415Gly Asp Arg Lys Thr * Thr Cys Thr Ser His Arg Ser * Ser Gln420 425 430Glu Arg Ser Pro His Cys Arg Gln Leu Pro Gly Phe Gln Lys Leu Leu435 440 445Ala Arg Gly Arg * * Pro Cys Cys Gly Pro Ser Lys Ser Ser Asp450 455 460Ala Ala Tyr His Arg Val Asn Ser Lys Asp Cys Arg Ile Val Thr Gly465 470 475480Cys Lys Leu Trp Ser G1y Arg Thr Val * Thr Ala Leu Arg Leu Leu485 490 495* Glu * * Ala Arg Tyr Phe Gln Ala Phe Arg Asp Gly Glu Ser500 505 510Cys Gly Tyr Phe Leu Lys Leu His Glu * Cys Arg Ser Trp Trp Cys515 520 525His Arg Leu Pro * Ser Gly Gly Cys Asn Leu Ala * Glu Gly Tyr530 535 540Ser Cys Val Leu Val Gln Pro Leu Ala Glu Arg Gly Arg * Leu Pro545 550 555 560Asn Lys Thr Cys Cys Leu Pro Cys Ala Cys Gly Leu Gln Val Gly Leu565 570 575Gln * Val Val Pro * Thr Arg Thr Gly Val Leu Glu Thr Leu Trp580 585 590Ile Asn Arg Ser * Leu Thr Ser Phe Ser Val Leu Pro Leu Pro Gly595 600 605Pro Ser Ala His Val Asn Val Thr Asp Thr Phe Val Cys Ser Phe Val610 615 620Cys Ser Tyr Gln Ala Asp Phe Trp Arg Asn Glu Cys Leu Ser Gly Ala625 630 635 640Glu Gly Asp His Thr Arg Ala Thr Pro Val * Leu Lys Ser Gln Pro645 650 655Phe His Ser Ala Cys Ala Ile Pro Gly Pro Lys Ala Arg Ile Lys Val660 665 670Ala Ala Ala Glu Leu Ala Cys * Arg Leu Ala Arg Cys Leu Cys Thr675 680 685Ser Gly Val Leu Gly Val Arg Cys Phe Ser Glu Pro Lys Phe * Tyr690 695 700Leu Val Tyr Met Phe Val Phe Met Ala Phe Leu Ser Ile Val Ala Leu705 710 715 720Pro Lys Asn Lys Met Ser Leu Pro Glu Ala Val Lys Lys Lys Lys725 730 735(2)SEQ ID NO:5的資料(ⅰ)序列特徵(A)長度378個鹼基對(B)類型核酸(C)鏈型未知(D)拓撲結構未知(ⅱ)分子類型cDNA(ⅹⅰ)序列描述SEQ ID NO:5:GGGGAAGGAA CACTGTAGGG GATAGCTGTC CACGGACGCT GTCTACAAGA CCCTGGAGTG 60AGATAACGTG CCTGGTACTG TGCCCTGCAT GTGTAAGATG CCCAGTTGAC CTTCGCAGCA120GGAGCCTGGA TCAGGCACTT CCTGCCTCAG GTATTGCTGG ACAGCCCAGA CACTTCCCTC180TGTGACCATG AAACTCTGGG TGTCTGCATT GCTGATGGCC TGGTTTGGTG TCCTGAGCTG240TGTGCAGGCC GAATTCTTCA CCTCTATTGG GCACATGACT GACCTGATTT ATGCAGAGAA300AGAGCTGGTG CAGTCTCTGA AAGAGTACAT CCTTGTGGAG GAAGCCAAGC TTTCCAAGAT360TAAGAGCTGG GCCAACAA 378(2)SEQ ID NO:6的資料(ⅰ)序列特徵(A)長度486個鹼基對(B)類型核酸(C)鏈型未知(D)拓撲結構未知(ⅱ)分子類型cDNA(ⅹⅰ)序列描述SEQ ID NO:6:AATGGAAGCC TTGACTAGCA AGTCAGCTGC TGATGCTGAG GGCTACCTGG CTCACCCTGT60GAATGCCTAC AAACTGGTGA AGCGGCTAAA CACAGACTGG CCTGCGCTGG AGGACCTTGT 120CCTGCAGGAC TCAGCTGCAG GTTTTATCGC CAACCTCTCT GTGCAGCGGC AGTTCTTCCC 180CACTGATGAG GACGAGATAG GAGCTGCCAA AGCCCTGATG AGACTTCAGG ACACATACAG 240GCTGGACCCA GGCACAATTT CCAGAGGGGA ACTTCCAGGA ACCAAGTACC AGGCAATGCT 300GAGTGTGGAT GACTGCTTTG GGATGGGCCG CTCGGCCTAC AATGAAGGGG ACTATTATCA 360TACGGTGTTG TGGATGGAGC AGGTGCTAAA GCAGCTTGAT GCCGGGGAGG AGGCCACCAC 420AACCAAGTCA CAGGTGCTGG ACTACCTACG CTATGCTGTC TTCCAGTTGG GTGATCTGCA 480CCGTGC 486(2)SEQ ID NO:7的資料(ⅰ)序列特徵(A)長度486個鹼基對(B)類型核酸(C)鏈型未知(D)拓撲結構未知(ⅱ)分子類型cDNA(ⅹⅰ)序列描述SEQ ID NO:7:CCTGGAGCTC ACCCGCCGCC TGCTCTCCCT TGACCCAAGC CACGAACGAG CTGGAGGGAA 60TCTGCGGTAC TTTGAGCAGT TATTGGAGGA AGAGAGAGAA AAAACGTTAA CAAATCAGAC120AGAAGCTGAG CTAGCAACCC CAGAAGGCAT CTATGAGAGG CCTGTGGACT ACCTGCCTGA180GAGGGATGTT TACGAGAGCC TCTGTCGTGG GGAGGGTGTC AAACCTCGCA AGCATAGACA240GAAGAGGCTT TTCTGTAGGT ACCACCATGG CAACAGGGCC CCACAGCTGC TCATTGCCCC300CTTCAAAGAG GAGGACGAGT GGGACAGCCC GCACATCGTC AGGTACTACG ATGTCATGTC360TGATGAGGAA ATCGAGAGGA TCAAGGAGAT CGCAAAACCT AAACTTGCAC GAGCCACCGT420TCGTGATCCC AAGAGAGGAG TCCTCACTGT CGCCAGCTAC CGGGTTTCCA AAAGCTCCTG480GCTAGA 486(2)SEQ ID NO:8的資料(ⅰ)序列特徵(A)長度540個鹼基對(B)類型核酸
(C)鏈型未知(D)拓撲結構未知(ⅱ)分子類型cDNA(ⅹⅰ)序列描述SEQ ID NO:8:GGAAGATGAT GACCCTGTTG TGGCCCGAGT AAATCGTCGG ATGCAGCATA TCACAGGGTT 60AACAGTAAAG ACTGCAGAAT TGTTACAGGT TGCAAATTAT GGAGTGGGAG GACAGTATGA 120ACCGCACTTC GACTTCTCTA GGAATGATGA GCGAGATACT TTCAAGCATT TAGGGACGGG 180GAATCGTGTG GCTACTTTCT TAAACTACAT GAGTGATGTA GAAGCTGGTG GTGCCACCGT 240CTTCCCTGAT CTGGGGGCTG CAATTTGGCC TAAGAAGGGT ACAGCTGTGT TCTGGTACAA 300CCTCTTGCGG AGCGGGGAAG GTGACTACCG AACAAGACAT GCTGCCTGCC CTGTGCTTGT 360GGGCTGCAAG TGGGTCTCCA ATAAGTGGTT CCATGAACGA GGACAGGAGT TCTTGAGACC 420TTGTGGATCA ACAGAAGTTG ACTGACATCC TTTTCTGTCC TTCCCCTTCC TGGTCCTTCA 480GCCCATGTCA ACGTGACAGA CACCTTTGTA TGTTCCTTTG TATGTTCCTA TCAGGCTGAT 540(2)SEQ ID NO:9的資料(ⅰ)序列特徵(A)長度317個鹼基對(B)類型核酸(C)鏈型未知(D)拓撲結構未知(ⅱ)分子類型cDNA(ⅹⅰ)序列描述SEQID NO:9:TTTTGGAGAA ATGAATGTTT GTCTGGAGCA GAGGGAGACC ATACTAGGGC GACTCCTGTG 60TGACTGAAGT CCCAGCCCTT CCATTCAGCC TGTGCCATCC CTGGCCCCAA GGCTAGGATC 120AAAGTGGCTG CAGCAGAGTT AGCTTGCTAG CGCCTAGCAA GGTGCCTTTG TACCTCAGGT 180GTTTTAGGTG TGAGATGTTT CAGTGAACCA AAGTTCTGAT ACCTTGTTTA CATGTTTGTT 240TTTATGGCAT TTCTATCTAT TGTGGCTTTA CCAAAAAATA AAATGTCCCT ACCAGAAGCC 300GTTAAAAAAA AAAAAAA317(2)SEQ ID NO:10的資料(ⅰ)序列特徵(A)長度375個鹼基對(B)類型核酸(C)鏈型未知(D)拓撲結構未知(ⅱ)分子類型cDNA(ⅸ)特徵(A)名稱/關鍵詞CDS(B)位置1..375(ⅹⅰ)序列描述SEQ ID NO:10:GGG GAA GGA ACA CTG TAG GGG ATA GCT GTC CAC GGA CGC TGT CTA CAA 48Gly Glu Gly Thr Leu * Gly Ile Ala Val His Gly Arg Cys Leu Gln740 745 750GAC CCT GGA GTG AGA TAA CGT GCC TGG TAC TGT GCC CTG CAT GTG TAA 96Asp Pro Gly Val Arg * Arg Ala Trp Tyr Cys Ala Leu His Val *755 760 765GAT GCC CAG TTG ACC TTC GCA GCA GGA GCC TGG ATC AGG CAC TTC CTG144Asp Ala Gln Leu Thr Phe Ala Ala Gly Ala Trp Ile Arg His Phe Leu770 775 780CCT CAG GTA TTG CTG GAC AGC CCA GAC ACT TCC CTC TGT GAC CAT GAA192Pro Gln Val Leu Leu Asp Ser Pro Asp Thr Ser Leu Cys Asp His Glu785 790 795ACT CTG GGT GTC TGC ATT GCT GAT GGC CTG GTT TGG TGT CCT GAG CTG240Thr Leu Gly Val Cys Ile Ala Asp Gly Leu Val Trp Cys Pro Glu Leu800 805 810 815TGT GCA GGC CGA ATT CTT CAC CTC TAT TGG TAC GTG CCA ACA GGA CTG288Cys Ala Gly Arg Ile Leu His Leu Tyr Trp Tyr Val Pro Thr Gly Leu820 825 830TCG TCT CCC TGA CAC CTT GGC TCA CAT GCC ACG GAT GTC TCT GGC TGC336Ser Ser Pro * His Leu Gly Ser His Ala Thr Asp Val Ser Gly Cys835 840 845AGC TGT TCT CAT TTA GAG TGG GAT AGC CTT AAC ATA CGG375Ser Cys Ser His Leu Glu Trp Asp Ser Leu Asn Ile Arg850 855 860(2)SEQ ID NO:11的資料(ⅰ)序列特徵(A)長度125個胺基酸(B)類型胺基酸(D)拓撲結構線性(ⅱ)分子類型蛋白質(ⅹⅰ)序列描述SEQ ID NO:11:Gly Glu Gly Thr Leu * Gly Ile Ala Val His Gly Arg Cys Leu Gln1 5 10 15Asp Pro Gly Val Arg * Arg Ala Trp Tyr Cys Ala Leu His Val *20 25 30Asp Ala Gln Leu Thr Phe Ala Ala Gly Ala Trp Ile Arg His Phe Leu35 40 45Pro Gln Val Leu Leu Asp Ser Pro Asp Thr Ser Leu Cys Asp His Glu50 55 60Thr Leu Gly Val Cys Ile Ala Asp Gly Leu Val Trp Cys Pro Glu Leu65 70 75 80Cys Ala Gly Arg Ile Leu His Leu Tyr Trp Tyr Val Pro Thr Gly Leu85 90 95Ser Ser Pro * His Leu Gly Ser His Ala Thr Asp Val Ser Gly Cys100 105 110Ser Cys Ser His Leu Glu Trp Asp Ser Leu Asn Ile Arg115 120 125(2)SEQ ID NO:12的資料(ⅰ)序列特徵(A)長度200個鹼基對(B)類型核酸(C)鏈型未知(D)拓撲結構未知(ⅱ)分子類型cDNA(ⅸ)特徵(A)名稱/關鍵詞CDS(B)位置1..198(ⅹⅰ)序列描述SEQ ID NO:12:GGC ACA TGA CTG ACC TGA TTT ATG CAG AGA AAG AGC TGG TGC AGT CTC 48Gly Thr * Leu Thr * Phe Met Gln Arg Lys Ser Trp Cys Ser Leu130 135 140TGA AAG AGT ACA TCC TTG TGG AGG AAG CCA AGC TTT CCA AGA TTA AGA 96* Lys Ser Thr Ser Leu Trp Arg Lys Pro Ser Phe pro Arg Leu Arg145 150 155GGT GTC CTA AGT CCC CAT ACC ATC CTT AGT TGG CCT TCC TTC CCT TCT144Gly Val Leu Ser Pro His Thr Ile Leu Ser Trp Pro Ser Phe Pro Ser160 165 170GCC CTC AAG GAA CAA GGA AGC CAT CAG GGT GCC TAT AAC ATT AAA CCT192Ala Leu Lys Glu Gln Gly Ser His Gln Gly Ala Tyr Asn Ile Lys Pro175 180 185TTG AGA GG 200Leu Arg190(2)SEQ ID NO:13的資料(ⅰ)序列特徵(A)長度66個胺基酸(B)類型胺基酸(D)拓撲結構線性(ⅱ)分子類型蛋白質(ⅹⅰ)序列描述SEQ ID NO:13:Gly Thr * Leu Thr * Phe Met Gln Arg Lys Ser Trp Cys Ser Leu1 5 10 15* Lys Ser Thr Ser Leu Trp Arg Lys Pro Ser Phe Pro Arg Leu Arg20 25 30Gly Val Leu Ser Pro His Thr Ile Leu Ser Trp Pro Ser Phe Pro Ser35 40 45Ala Leu Lys Glu Gln Gly Ser His Gln Gly Ala Tyr Asn Ile Lys Pro50 55 60Leu Arg65(2)SEQ ID NO:14的資料(ⅰ)序列特徵(A)長度330個鹼基對(B)類型核酸(C)鏈型未知(D)拓撲結構未知(ⅱ)分子類型cDNA(ⅸ)特徵(A)名稱/關鍵詞CDS(B)位置1..330(ⅹⅰ)序列描述SEQ ID NO:14:GGG AAT TCT CAC TAG AAA ATT GTC ACA GGT CAA GAC CTA TGT GGG TGG 48Gly Asn Ser His * Lys Ile Val Thr Gly Gln Asp Leu Cys Gly Trp70 75 80ACG CAT TAG TCT TCC TTT TCC TCT GGT TCC ACA GCT GGG CCA ACA AAA 96Thr His * Ser Ser Phe Ser Ser Gly Ser Thr Ala Gly Pro Thr Lys85 90 95TGG AAG CCT TGA CTA GCA AGT CAG CTG CTG ATG CTG AGG GCT ACC TGG 144Trp Lys Pro * Leu Ala Ser Gln Leu Leu Met Leu Arg Ala Thr Trp100 105 110CTC ACC CTG TGA ATG CCT ACA AAC TGG TGA AGC GGC TAA ACA CAG ACT 192Leu Thr Leu * Met Pro Thr Asn Trp * Ser Gly * Thr Gln Thr115 120 125 130GGC CTG CGC TGG AGG ACC TTG TCC TGC AGG ACT CAG CTG CAG GTG AGG 240Gly Leu Arg Trp Arg Thr Leu Ser Cys Arg Thr Gln Leu Gln Val Arg135 140 145GAC GGT GAC GAG GTG CTT GAG TGA GCC CAT ATG TTT GTG TGC TCA TGC 288Asp Gly Asp Glu Val Leu Glu * Ala His Met Phe Val Cys Ser Cys150 155 160CTG GGT TGT TGT GTC TGA GCC TGT CTT GGG TCT GGG TGT TGG 330Leu Gly Cys Cys Val * Ala Cys Leu Gly Ser Gly Cys Trp165 170175(2)SEQ ID NO:15的資料(ⅰ)序列特徵(A)長度110個胺基酸
(B)類型胺基酸(D)拓撲結構線性(ⅱ)分子類型蛋白質(ⅹⅰ)序列描述SEQ ID NO:15:Gly Asn Ser His * Lys Ile Val Thr Gly Gln Asp Leu Cys Gly Trp1 5 10 15Thr His * Ser Ser Phe Ser Ser Gly Ser Thr Ala Gly Pro Thr Lys20 25 30Trp Lys Pro * Leu Ala Ser Gln Leu Leu Met Leu Arg Ala Thr Trp35 40 45Leu Thr Leu * Met Pro Thr Asn Trp * Ser Gly * Thr Gln Thr50 55 60Gly Leu Arg Trp Arg Thr Leu Ser Cys Arg Thr Gln Leu Gln Val Arg65 70 75 80Asp Gly Asp Glu Val Leu Glu * Ala His Met Phe Val Cys Ser Cys85 90 95Leu Gly Cys Cys Val * Ala Cys Leu Gly Ser Gly Cys Trp100 105 110(2)SEQ ID NO:16的資料(ⅰ)序列特徵(A)長度369個鹼基對(B)類型核酸(C)鏈型未知(D)拓撲結構未知(ⅱ)分子類型cDNA(ⅸ)特徵(A)名稱/關鍵詞CDS(B)位置1..369(ⅹⅰ)序列描述SEQ ID NO:16:GAG ACC CTC TTT GTG GCT GCC TCT CTG GGT CCC AAG TGG AAT TCT GCC 48Glu Thr Leu Phe Va1 Ala Ala Ser Leu Gly Pro Lys Trp Asn Ser Ala115 120 125CCT GGA TCA AGG GTA ATC TCT TGT TCT GAC TCT TCA TTT GGA AGG TTT 96Pro Gly Ser Arg Va1 Ile Ser Cys Ser Asp Ser Ser Phe Gly Arg Phe130 135 140TAT CGC CAA CCT CTC TGT GCA GCG GCA GTT CTT CCC CAC TGA TGA GGA144Tyr Arg Gln Pro Leu Cys Ala Ala Ala Val Leu Pro His * * Gly145 150 155CGA GAT AGG AGC TGC CAA AGC CCT GAT GAG ACT TCA GGA CAC ATA CAG192Arg Asp Arg Ser Cys Gln Ser Pro Asp Glu Thr Ser Gly His Ile Gln160 165 170GCT GGA CCC AGG CAC AAT TTC CAG AGG GGA ACT TCC AGG TAA CTC ACC240Ala Gly Pro Arg His Asn Phe Gln Arg Gly Thr Ser Arg * Leu Thr175 180 185190ACT CCA GGC GTT GCT GTC CCG CAT GTG TCT CTT TAG TGG CGG GAC AGG288Thr Pro Gly Val Ala Val Pro His Val Ser Leu * Trp Arg Asp Arg195 200 205TTG GAG CCA CCA CCA ACT TGT GGC CTT TAA CCT CGG GTG CAC CTC TCT336Leu Glu Pro Pro Pro Thr Cys Gly Leu * Pro Arg Val His Leu Ser210 215 220CTT GGC ACA CCA GTT GTG CTG GAC TCC TCT CCA369Leu Gly Thr Pro Val Val Leu Asp Ser Ser Pro225 230(2)SEQ ID NO:17的資料(ⅰ)序列特徵(A)長度123個胺基酸(B)類型胺基酸(D)拓撲結構線性(ⅱ)分子類型蛋白質(ⅹⅰ)序列描述SEQ ID NO:17:Glu Thr Leu Phe Val Ala Ala Ser Leu Gly Pro Lys Trp Asn Ser Ala1 5 10 15Pro Gly Ser Arg Val Ile Ser Cys Ser Asp Ser Ser Phe Gly Arg Phe20 25 30Tyr Arg Gln Pro Leu Cys Ala Ala Ala Val Leu Pro His * * Gly35 40 45Arg Asp Arg Ser Cys Gln Ser Pro Asp Glu Thr Ser Gly His Ile Gln50 55 60Ala Gly Pro Arg His Asn Phe Gln Arg Gly Thr Ser Arg * Leu Thr65 70 75 80Thr Pro Gly Val Ala Val Pro His Val Ser Leu * Trp Arg Asp Arg85 90 95Leu Glu Pro Pro Pro Thr Cys Gly Leu * Pro Arg Val His Leu Ser100 105 110Leu Gly Thr Pro Val Val Leu Asp Ser Ser Pro115 120(2)SEQ ID NO:18的資料(ⅰ)序列特徵(A)長度309個鹼基對(B)類型核酸(C)鏈型未知(D)拓撲結構未知(ⅱ)分子類型cDNA(ⅸ)特徵(A)名稱/關鍵詞CDS(B)位置1..309(ⅹⅰ)序列描述SEQ ID NO:18:GAA CCA AGT ACC AGG CAA TGC TGA GTG TGG ATG ACT GCT TTG GGA TGG 48Glu Pro Ser Thr Arg Gln Cys * Val Trp Met Thr Ala Leu Gly Trp125 130 135GCC GCT CGG CCT ACA ATG AAG GGG ACT ATT ATC ATA CGG TGT TGT GGA 96Ala Ala Arg Pro Thr Met Lys Gly Thr Ile Ile Ile Arg Cys Cys Gly140 145 150 155TGG AGC AGG TGC TAA AGC AGC TTG ATG CCG GGG AGG AGG CCA CCA CAA 144Trp Ser Arg Cys * Ser Ser Leu Met Pro Gly Arg Arg Pro Pro Gln160 165 170CCA AGT CAC AGG TGC TGG ACT ACC TAC GCT ATG CTG TCT TCC AGT TGG 192Pro Ser His Arg Cys Trp Thr Thr Tyr Ala Met Leu Ser Ser Ser Trp175 180 185GTG ATC TGC ACC GTG CCC TGG AGC TCA CCC GCC GCC TGC TCT CCC TTG 240Val Ile Cys Thr Val Pro Trp Ser Ser Pro Ala Ala Cys Ser Pro Leu190 195 200GTA AGG AGA TTC TAG GGG AAG GTA AGA TGG GAA TGG AGA GTG GCA GAG 288Val Arg Arg Phe * Gly Lys Val Arg Trp Glu Trp Arg Val Ala Glu205 210 215GAA CTG CAC TGT GCC TGG CAC 309Glu Leu His Cys Ala Trp His220 225(2)SEQ ID NO:19的資料(ⅰ)序列特徵
(A)長度103個胺基酸(B)類型胺基酸(D)拓撲結構線性(ⅱ)分子類型蛋白質(ⅹⅰ)序列描述SEQ ID NO:19:Glu Pro ser Thr Arg Gln Cys * Val Trp Met Thr Ala Leu Gly Trp1 5 10 15Ala Ala Arg Pro Thr Met Lys Gly Thr Ile Ile Ile Arg Cys Cys Gly20 25 30Trp Ser Arg Cys * Ser Ser Leu Met Pro Gly Arg Arg Pro Pro Gln35 40 45Pro Ser His Arg Cys Trp Thr Thr Tyr Ala Met Leu Ser Ser Ser Trp50 55 60Val Ile Cys Thr Val Pro Trp Ser Ser Pro Ala Ala Cys Ser Pro Leu65 70 75 80Val Arg Arg Phe * Gly Lys Val Arg Trp Glu Trp Arg Val Ala Glu85 90 95Glu Leu His Cys Ala Trp His100(2)SEQ ID NO:20的資料(ⅰ)序列特徵(A)長度509個鹼基對(B)類型核酸(C)鏈型未知(D)拓撲結構未知(ⅱ)分子類型cDNA(ⅸ)特徵(A)名稱/關鍵詞CDS(B)位置1..507(ⅹⅰ)序列描述SEQ ID NO:20:TTA GAT GCT GTG AAG GAT GAT GCA CGC ATG CAG GTG AGC TGC TGG GAG 48Leu Asp Ala Val Lys Asp Asp Ala Arg Met Gln Val Ser Cys Trp Glu105 110 115AGA AAC CCT TAC TAC TCT GGT TAG ATG CTG TGA AGG ATG AAT GCA GCA 96Arg Asn Pro Tyr Tyr Ser Gly * Met Leu * AGG Met Asn Ala Ala120 125 130 135TGC AGG TGA GCT GCT CCC AGA GAA ACC CTT ACA GAT AAT TTC TCT AAA 144Cys Arg * Ala Ala Pro Arg Glu Thr Leu Thr Asp Asn Phe Ser Lys140 145 150TGA CCT AAC AGA TGT TTG TGG TTT CCT TTT CCT TCT CAT TCC TTG CAT 192* Pro Asn Arg Cys Leu Trp Phe Pro Phe Pro Ser His Ser Leu His155 160 165TTT CTG ACC CAA GCC ACG AAC GAG CTG GAG GGA ATC TGC GGT ACT TTG 240Phe Leu Thr Gln Ala Thr Asn Glu Leu Glu Gly Ile Cys Gly Thr Leu170 175 180AGC AGT TAT TGG AGG AAG AGA GAG AAA AAA CGT TAA CAA ATC AGA CAG 288Ser Ser Tyr Trp Arg Lys Arg Glu Lys Lys Arg * Gln Ile Arg Gln185 190 195AAG CTG AGC TAG CAA CCC CAG AAG GCA TCT ATG AGA GGC CTG TGG ACT 336Lys Leu Ser * Gln Pro Gln Lys Ala Ser Met Arg Gly Leu Trp Thr200 205 210 215ACC TGC CTG AGA GGG ATG TTT ACG AGA GCC TCT GTC GTG GGG AGG GTG 384Thr Cys Leu Arg Gly Met Phe Thr Arg Ala Ser Val Val Gly Arg Val220 225 230TCA AAC TGG TGA GAT GTG TGA GGG GGC TAG GGT GCC AAA GCT GTG GAC 432Ser Asn Trp * Asp Val * Gly Gly * Gly Ala Lys Ala Val Asp235 240 245CTG GAC TCT GGC CTC TGG GCA GGC AGA TTT GGG GAA GGT GTT CTT TAT 480Leu Asp Ser Gly Leu Trp Ala Gly Arg Phe Gly Glu Gly Val Leu Tyr250 255 260TCT GAG GTA CTT TTC ACG TTT CCC GTT TT 509Ser Glu Val Leu Phe Thr Phe Pro Val265 270(2)SEQ ID NO:21的資料(ⅰ)序列特徵(A)長度169個胺基酸(B)類型胺基酸(D)拓撲結構線性(ⅱ)分子類型蛋白質(ⅹⅰ)序列描述SEQ ID NO:21:Leu Asp Ala Val Lys Asp Asp Ala Arg Met Gln Val Ser Cys Trp Glu1 5 10 15Arg Asn Pro Tyr Tyr Ser Gly * Met Leu * Arg Met Asn Ala Ala20 25 30Cys Arg * Ala Ala Pro Arg Glu Thr Leu Thr Asp Asn Phe Ser Lys35 40 45* Pro Asn Arg Cys Leu Trp Phe Pro Phe Pro Ser His Ser Leu His50 55 60Phe Leu Thr Gln Ala Thr Asn Glu Leu Glu Gly Ile Cys Gly Thr Leu65 70 75 80Ser Ser Tyr Trp Arg Lys Arg Glu Lys Lys Arg * Gln Ile Arg Gln85 90 95Lys Leu Ser * Gln Pro Gln Lys Ala Ser Met Arg Gly Leu Trp Thr
100 105 110Thr Cys Leu Arg Gly Met Phe Thr Arg Ala Ser Val Val Gly Arg Val115 120 125Ser Asn Trp * Asp Val * Gly Gly * Gly Ala Lys Ala Val Asp130 135 140Leu Asp Ser Gly Leu Trp Ala Gly Arg Phe Gly Glu Gly Val Leu Tyr145 150 155 160Ser Glu Val Leu Phe Thr Phe Pro Val165(2)SEQ ID NO:22的資料(ⅰ)序列特徵(A)長度480個鹼基對(B)類型核酸(C)鏈型未知(D)拓撲結構未知(ⅱ)分子類型cDNA(ⅹⅰ)序列描述SEQ ID NO:22:TTAGATGCTG TGAAGGATGA TGCACGCATG CAGGTGAGCT GCTGGGAGAG AAACCCTTAC 60TACTCTGGTT AGATGCTGTG AAGGATGAAT GCAGCATGCA GGTGAGCTGC TCCCAGAGAA120ACCCTTACAG ATAATTTCTC TAAATGACCT AACAGATGTT TGTGGTTTCC TTTTCCTTCT180CATTCCTTGC ATTTTCTGAC CCAAGCCACG AACGAGCTGG AGGGAATCTG CGGTACTTTG240AGCAGTTATT GGAGGAAGAG AGAGAAAAAA CGTTAACAAA TCAGACAGAA GCTGAGCTAG300CAACCCCAGA AGGCATCTAT GAGAGGCCTG TGGACTACCT GCCTGAGAGG GATGTTTACG360AGAGCCTCTG TCGTGGGGAG GGTGTCAAAC TGGTGAGATG TGTGAGGGGG CTAGGGTGCC420AAAGCTGTGG ACCTGGACTC TGGCCTCTGG GCAGGCAGAT TTGGGGAAGG TGTTCTTTAT480(2)SEQ ID NO:23的資料(ⅰ)序列特徵(A)長度29個鹼基對(B)類型核酸(C)鏈型未知(D)拓撲結構未知(ⅱ)分子類型cDNA(ⅹⅰ)序列描述SEQ ID NO:23:TCTGAGGTAC TTTTCACGTT TCCCGTTTT 29(2)SEQ ID NO:24的資料(ⅰ)序列特徵(A)長度2121個鹼基對(B)類型核酸(C)鏈型未知(D)拓撲結構未知(ⅱ)分子類型cDNA(ⅸ)特徵(A)名稱/關鍵詞CDS(B)位置1..2121(ⅹⅰ)序列描述SEQ ID NO:24:TGG CCA TGA GGT GAG TCC AGT GTC TGC AGA CAG CCA GAC TGG GAC CGA 48Trp Pro * Gly Glu Ser Ser Val Cys Arg Gln Pro Asp Trp Asp Arg170 175 180 185GGA TTA GGA CTC ACT CAG CTC AGG GCC TGT TAC TCT GTG CTT TCC AGA 96Gly Leu Gly Leu Thr Gln Leu Arg Ala Cys Tyr Ser Val Leu Ser Arg190 195 200CAC CCC GTA GAC AGA AGA GGC TTT TCT GTA GGT ACC ACC ATG GCA ACA 144His Pro Val Asp Arg Arg Gly Phe Ser Val Gly Thr Thr Met Ala Thr205 210 215GGG CCC CAC AGC TGC TCA TTG CCC CCT TCA AAG AGG AGG ACG AGT GGG 192Gly Pro His Ser Cys Ser Leu Pro Pro Ser Lys Arg Arg Thr Ser Gly220 225 230ACA GCC CGC ACA TCG TCA GGT ACT ACG ATG TCA TGT CTG ATG AGG AAA 240Thr Ala Arg Thr Ser Ser Gly Thr Thr Met Ser Cys Leu Met Arg Lys235 240 245TCG AGA GGA TCA AGG AGA TCG CAA AAC CTA AAG TAG GTG TAC AGT GAG 288Ser Arg Gly Ser Arg Arg Ser Gln Asn Leu Lys * Val Tyr Ser Glu250 255 260 265GCC TTC TCG GGT CAC TGA AGG GGG AAG GTC TTT TTC TCA TCC CCT AGC 336Ala Phe Ser Gly His * Arg Gly Lys Val Phe Phe Ser Ser Pro Ser270 275 280ACT ATG GGT GGT TAG AGT TTG CCC ATC CTA GCC ACC CTT TAT CCA TAT 384Thr Met Gly Gly * Ser Leu Pro Ile Leu Ala Thr Leu Tyr Pro Tyr285 290 295CTA GCA TAG GGC CTA CCT GGA GGG ATA CAG AGA TGC TTC AGA CTC AGC 432Leu Ala * Gly Leu Pro Gly Gly Ile Gln Arg Cys Phe Arg Leu Ser300 305 310CTG ACC TTG TGA GGT TCA TGT GCC AGT GGA AGG AAG GAA CAG GGT AAC 480Leu Thr Leu * Gly Ser Cys Ala Ser Gly Arg Lys Glu Gln Gly Asn315 320 325CAA TGT GGA CAG CCA AGT GCT ATC ATA CAA GGT CAC GTC CTG GGA ACA 528Gln Cys Gly Gln Pro Ser Ala Ile Ile Gln Gly His Val Leu Gly Thr330 335 340 345GGG CTG GGA ACA GGG CAG GTC TAC ACT GGT GTG TCA GTT CAC CTG GTT 576Gly Leu Gly Thr Gly Gln Val Tyr Thr Gly Val Ser Val His Leu Val350 355 360GGG AGA CTG GTG CGT GGG TGA GTT TTT TGG AAA TGT TCC ATA GGA TGC 624Gly Arg Leu Val Arg Gly * Val Phe Trp Lys Cys Ser Ile Gly Cys365 370 375TAT GAA GCT GGG TCC TGT GGA GCT CCT GAG TAG GAC TGT AAA TGA GGT 672Tyr Glu Ala Gly Ser Cys Gly Ala Pro Glu * Asp Cys Lys * Gly380 385 390GAA TGA CTT AGA GGA GAA TGT ATA TCT TTT ATA ATA TTT GGG TCT CTC 720Glu * Leu Arg Gly Glu Cys Ile Ser Phe Ile Ila Phe Gly Ser Leu395 400 405ATC CAA GGG CAT GAC AGG TCT CTC CAT ATC TTT TTA AGT TTT CTT CAT 768Ile Gln Gly His Asp Arg Ser Leu His Ile Phe Leu Ser Phe Leu His410 415 420 425ATA AGC CTT GAA CAT GTC TTA AGT TTA TTC CTT GGT ACT TTC TTT GTT 816Ile Ser Leu Glu His Val Leu Ser Leu Phe Leu Gly Thr Phe Phe Val430 435 440ACT GTT AAT TTA CTT TAT TTC TTC ATT ATT ATT TTA ACT GGT TAC ATT 864Thr Val Asn Leu Leu Tyr Phe Phe Ile Ile Ile Leu Thr Gly Tyr Ile445 450 455ATT TAT TAG TTT ACT ATT ATA TGC CAA ACT ATT GAT TTT ACA AAT ACA 912Ile Tyr * Phe Thr Ile Ile Cys Gln Thr Ile Asp Phe Thr Ash Thr460 465 470TTT CAT AGT AAG AGC TAA TGT TTA CTG AAT TCT TAA CTG TGG CAG GAA 960Phe His Ser Lys Ser * Cys Leu Leu Asn Ser * Leu Trp Gln Glu475 480 485ACT TCT AAG TGC TTA AGA TAT ATA TTA AGT GTT ATG TCA CAG TTA TGA1008Thr Ser Lys Cys Leu Thr Tyr Ile Leu Ser Val Met Ser Gln Leu *490 495 500 505ACA GCT GCT CAG AAT GAT GTC ACT GTC TCT GTT TTA CCT ATG AAA AAG 1056Thr Ala Ala Gln Asn Asp Val Thr Val Ser Val Leu Pro Met Lys Lys510 515 520CAA ACT CAT ACA GAT TGC AGC TAG TGG TTG AAT TTA CTT ATT TGT TTT 1104Gln Thr His Thr Asp Cys Ser * Trp Leu Asn Leu Leu Ile Cys Phe525 530 535TTG GTT TTA CGT GAT TTC TCT TTG GTT GGG TGG ATA GCA TTA ACA CCT 1152Leu Val Leu Arg Asp Phe Ser Leu Val Gly Trp Ile Ala Leu Thr Pro540 545 550GGA AAT AAG GAA AAT TTT ATT TTC TCC TGA TAC TTG TAG TTC CTT TGT 1200Gly Asn Lys Glu Asn Phe Ile Phe Ser * Tyr Leu * Phe Leu Cys555 560 565TTT TAT AAC CTT ATT GAA TTG CCC AGA ACT TCT AGA GCA TAA TTA CGT 1248Phe Tyr Asn Leu Ile Glu Leu Pro Arg Thr Ser Arg Ala * Leu Arg570 575 580 585AGA ATA GGC ATC CTT GTC TCA TTC CTG AAT TTC CTG GGA AAT TCC TAT 1296Arg Ile Gly Ile Leu Val Ser Phe Leu Asn Phe Leu Gly Asn Ser Tyr590 595 600GGT ATT TAC TGC TAA GAA TGC AGT TGG CTG TTG GTT TTG TAT ATA TGC 1344Gly Ile Tyr Cys * Glu Cys Ser Trp Leu Leu Val Leu Tyr Ile Cys605 610 615CAA AAT TAT TCT TCT GTT TCT AGT TCA TAA AAG ATT TGT TCC CCA TTT 1392Gln Asn Tyr Ser Ser Val Ser Ser Ser * Lys Ile Cys Ser Pro Phe620 625 630GAC ATC TTT CAA AGA GAC CTA TTT GCT GCC ATA TCC CAT CAC TGA TGA 1440Asp Ile Phe Gln Arg Asp Leu Phe Ala Ala Ile Ser His His * *635 640 645TTG GGA GGG AGG ATT TAG CTC GAT TCT CTA TGC TCT GCT CCT AAT AGA 1488Leu Gly Gly Arg Ile * Leu Asp Ser Leu Cys Ser Ala Pro Asn Arg650 655 660 665ATT GTA GGG GCC GAG GTG ACC AGG AGG CCC GAC ACT CAT GGA GAG ACC 1536Ile Val Gly Ala Glu Val Thr Arg Arg Pro Asp Thr His Gly Glu Thr670 675 680TGA AAT AGG TTC CTA TCC TGG CCC CTG GAC CTC ATC TTG GAA CAG CTT 1584* Asn Arg Phe Leu Ser Trp Pro Leu Asp Leu Ile Leu Glu Gln Leu685 690 698TGG CTT GAG GTA CTA GGA CAT CTA GGG CTT TGA GTC AGT GGT TGG CAT 1632Trp Leu Glu Val Leu Gly His Leu Gly Leu * Val Ser Gly Trp His700 705 710CAT CGA TGT GGC TGA GGA AGG GGG CTA GCC AGA TAT ATG GAG AAT GGG 1680His Arg Cys Gly * Gly Arg Gly Leu Ala Arg Tyr Met Glu Asn Gly715 720 725GAC TAG GAC TCC CCT TTC TAC TCA GCT CCA GAG TCC TCC AGG AAA GAA 1728Asp * Asp Ser Pro Phe Tyr Ser Ala Pro Glu Ser Ser Arg Lys Glu730 735 740 745AAC TAC TTT GTT GGT TGT GCC AGG TTT CCT GAG AGA TTC CTT ACC CGT 1776Asn Tyr Phe Val Gly Cys Ala Arg Phe Pro Glu Arg Phe Leu Thr Arg750 755 760TCT TTC AGT TCC AGA CAC TGA GAA CAT TTC TCT GTG CAT GTG TGC ATA 1824Ser Phe Ser Ser Arg His * Glu His Phe Ser Val His Val Cys Ile765 770 775TGT GTA CAC ATG TGT GTG GCT GGC CAC AGG GTA GTG TTA GGA AAA GAT 1872Cys Val His Met Cys Val Ala Gly His Arg Val Val Leu Gly Lys Asp780 785 790ATA TTT GAA TAG AAG CCA TGC AAA GAG CCA AAC AAG GTT GGC AAA CAT 1920Ile Phe Glu * Lys Pro Cys Lys Glu Pro Asn Lys Val Gly Lys His795 800 805GTT TGG CTC TTA ACA TGG CTT CTA TTC AAA GAT AAG CTG ACC CCT CCT 1968Val Trp Leu Leu Thr Trp Leu Leu Phe Lys Asp Lys Leu Thr Pro Pro810 815 820 825TTC CGG AGA CTG TGA GGG ACA GAT GCT ATT CTG GCT TTC AAG TAG AGC 2016Phe Arg Arg Leu * Gly Thr Asp Ala Ile Leu Ala Phe Lys * Ser830 835 840CAA TGA GCT TAA CTT GGC CTG TGG GGA ATG CCT GGC AGC TGT CTG TGG 2064Gln * Ala * Leu Gly Leu Trp Gly Met Pro Gly Ser Cys Leu Trp845 850855GGG CTC TTG GCC TGC TTT CAA AAT AGC CCT GTC GTT AAA ATG GGA CAG 2112Gly Leu Leu Ala Cys Phe Gln Asn Ser Pro Val Val Lys Met Gly Gln860 865 870CAT CAG TGC 2121His Gln Cys875(2)SEQ ID NO:25的資料(ⅰ)序列特徵(A)長度707個胺基酸(B)類型胺基酸(D)拓撲結構線性(ⅱ)分子類型蛋白質(ⅹⅰ)序列描述SEQ ID NO:25:Trp Pro * Gly Glu Ser Ser Val Cys Arg Gln Pro Asp Trp Asp Arg1 5 10 15Gly Leu Gly Leu Thr Gln Leu Arg Ala Cys Tyr Ser Val Leu Ser Arg20 25 30His Pro Val Asp Arg Arg Gly Phe Ser Val Gly Thr Thr Met Ala Thr35 40 45Gly Pro His Ser Cys Ser Leu Pro Pro Ser Lys Arg Arg Thr Ser Gly50 55 60Thr Ala Arg Thr Ser Ser Gly Thr Thr Met Ser Cys Leu Met Arg Lys65 70 75 80Ser Arg Gly Ser Arg Arg Ser Gln Asn Leu Lys * Val Tyr Ser Glu85 90 95Ala Phe Ser Gly His * Arg Gly Lys Val Phe Phe Ser Ser Pro Ser100 105 110Thr Met Gly Gly * Ser Leu Pro Ile Leu Ala Thr Leu Tyr Pro Tyr115 120 125Leu Ala * Gly Leu Pro Gly Gly Ile Gln Arg Cys Phe Arg Leu Ser150 135 140Leu Thr Leu * Gly Ser Cys Ala Ser Gly Arg Lys Glu Gln Gly Asn145 150 155 160Gln Cys Gly Gln Pro Ser Ala Ile Ile Gln Gly His Val Leu Gly Thr165 170 175Gly Leu Gly Thr Gly Gln Val Tyr Thr Gly Val Ser Val His Leu Val180 185 190Gly Arg Leu Val Arg Gly * Val Phe Trp Lys Cys Ser Ile Gly Cys195 200 205Tyr Glu Ala Gly Ser Cys Gly Ala Pro Glu * Asp Cys Lys * Gly210 215 220Glu * Leu Arg Gly Glu Cys Ile Ser Phe Ile Ile Phe Gly Ser Leu225 230 235 240Ile Gln Gly His Asp Arg Ser Leu His Ile Phe Leu Ser Phe Leu His245 250 255Ile Ser Leu Glu His Val Leu Ser Leu Phe Leu Gly Thr phe Phe Val260 265 270Thr Val Asn Leu Leu Tyr Phe Phe Ile Ile Ile Leu Thr Gly Tyr Ile275 280 285Ile Tyr * Phe Thr Ile Ile Cys Gln Thr Ile Asp Phe Thr Asn Thr290 295 300Phe His Ser Lys Ser * Cys Leu Leu Asn Ser * Leu Trp Gln Glu305 310 315 320Thr Ser Lys Cys Leu Thr Tyr Ile Leu Ser Val Met Ser Gln Leu *325 330 335Thr Ala Ala Gln Ash Asp Val Thr Val Ser Val Leu Pro Met Lys Lys340 345 350Gln Thr His Thr Asp Cys Ser * Trp Leu Asn Leu Leu Ile Cys Phe355 360 365Leu Val Leu Arg Asp Phe Ser Leu Val Gly Trp Ile Ala Leu Thr Pro370 375 380Gly Asn Lys Glu Asn Phe Ile Phe Ser * Tyr Leu * Phe Leu Cys385 390 395400Phe Tyr Asn Leu Ile Glu Leu Pro Arg Thr Ser Arg Ala * Leu Arg405 410 415Arg Ile Gly Ile Leu Val Ser Phe Leu Asn Phe Leu Gly Asn Ser Tyr420 425 430Gly Ile Tyr Cys * Glu Cys Ser Trp Leu Leu Val Leu Tyr Ile Cys435 440 445Gln Asn Tyr Ser Ser Val Ser Ser Ser * Lys Ile Cys Ser Pro Phe450 455 460Asp Ile Phe Gln Arg Asp Leu Phe Ala Ala Ile Ser His His * *465 470 475 480Leu Gly Gly Arg Ile * Leu Asp Ser Leu Cys Ser Ala Pro Asn Arg485 490 495Ile Val Gly Ala Glu Val Thr Arg Arg Pro Asp Thr His Gly Glu Thr500 505 510* Asn Arg Phe Leu Ser Trp Pro Leu Asp Leu Ile Leu Glu Gln Leu515 520 525Trp Leu Glu Val Leu Gly His Leu Gly Leu * Val Ser Gly Trp His530 535 540His Arg Cys Gly * Gly Arg Gly Leu Ala Arg Tyr Met Glu Asn Gly545550 555 560Asp * Asp Ser Pro Phe Tyr Ser Ala Pro Glu Ser Ser Arg Lys Glu
565 570 575Asn Tyr Phe Val Gly Cys Ala Arg Phe Pro Glu Arg Phe Leu Thr Arg580 585 590Ser Phe Ser Ser Arg His * Glu His Phe Ser Val His Val Cys Ile595 600 605Cys Val His Met Cys Val Ala Gly His Arg Val Val Leu Gly Lys Asp610 615 620Ile Phe Glu * Lys Pro Cys Lys Glu Pro Asn Lys Val Gly Lys His625 630 635 640Val Trp Leu Leu Thr Trp Leu Leu Phe Lys Asp Lys Leu Thr Pro Pro645 650 655Phe Arg Arg Leu * Gly Thr Asp Ala Ile Leu Ala Phe Lys * Ser660 665 670Gln * Ala * Leu Gly Leu Trp Gly Met Pro Gly Ser Cys Leu Trp675 680 685Gly Leu Leu Ala Cys Phe Gln Asn Ser Pro Val Val Lys Met Gly Gln690 695 700His Gln Cys705(2)SEQ ID NO:26的資料(ⅰ)序列特徵(A)長度478個鹼基對(B)類型核酸(C)鏈型未知(D)拓撲結構未知(ⅱ)分子類型cDNA(ⅹⅰ)序列描述SEQ ID NO:26:TGGCCATGAG GTGAGTCCAG TGTCTGCAGA CAGCCAGACT GGGACCGAGG ATTAGGACTC 60ACTCAGCTCA GGGCCTGTTA CTCTGTGCTT TCCAGACACC CCGTAGACAG AAGAGGCTTT 120TCTGTAGGTA CCACCATGGC AACAGGGCCC CACAGCTGCT CATTGCCCCC TTCAAAGAGG 180AGGACGAGTG GGACAGCCCG CACATCGTCA GGTACTACGA TGTCATGTCT GATGAGGAAA 240TCGAGAGGAT CAAGGAGATC GCAAAACCTA AAGTAGGTGT ACAGTGAGGC CTTCTCGGGT 300CACTGAAGGG GGAAGGTCTT TTTCTCATCC CCTAGCACTA TGGGTGGTTA GAGTTTGCCC 360ATCCTAGCCA CCCTTTATCC ATATCTAGCA TAGGGCCTAC CTGGAGGGAT ACAGAGATGC 420TTCAGACTCA GCCTGACCTT GTGAGGTTCA TGTGCCAGTG GAAGGAAGGA ACAGGGTA 478(2)SEQ ID NO:27的資料(ⅰ)序列特徵(A)長度660個鹼基對(B)類型核酸(C)鏈型未知(D)拓撲結構未知(ⅱ)分子類型cDNA(ⅹⅰ)序列描述SEQ ID NO:27:ACCAATGTGG ACAGCCAAGT GCTATCATAC AAGGTCACGT CCTGGGAACA GGGCTGGGAA 60CAGGGCAGGT CTACACTGGT GTGTCAGTTC ACCTGGTTGG GAGACTGGTG CGTGGGTGAG 120TTTTTTGGAA ATGTTCCATA GGATGCTATG AAGCTGGGTC CTGTGGAGCT CCTGAGTAGG 180ACTGTAAATG AGGTGAATGA CTTAGAGGAG AATGTATATC TTTTATAATA TTTGGGTCTC 240TCATCCAAGG GCATGACAGG TCTCTCCATA TCTTTTTAAG TTTTCTTCAT ATAAGCCTTG 300AACATGTCTT AAGTTTATTC CTTGGTACTT TCTTTGTTAC TGTTAATTTA CTTTATTTCT 360TCATTATTAT TTTAACTGGT TACATTATTT ATTAGTTTAC TATTATATGC CAAACTATTG 420ATTTTACAAA TACATTTCAT AGTAAGAGCT AATGTTTACT GAATTCTTAA CTGTGGCAGG 480AAACTTCTAA GTGCTTAACA TATATATTAA GTGTTATGTC ACAGTTATGA ACAGCTGCTC 540AGAATGATGT CACTGTCTCT GTTTTACCTA TGAAAAAGCA AACTCATACA GATTGCAGCT 600AGTGGTTGAA TTTACTTATT TGTTTTTTGG TTTTACGTGA TTTCTCTTTG GTTGGGTGGA 660(2)SEQ ID NO:28的資料(ⅰ)序列特徵(A)長度660個鹼基對(B)類型核酸(C)鏈型未知(D)拓撲結構未知(ⅱ)分子類型cDNA(ⅹⅰ)序列描述SEQ ID NO:28:TAGCATTAAC ACCTGGAAAT AAGGAAAATT TTATTTTCTC CTGATACTTG TAGTTCCTTT 60GTTTTTATAA CCTTATTGAA TTGCCCAGAA CTTCTAGAGC ATAATTACGT AGAATAGGCA120TCCTTGTCTC ATTCCTGAAT TTCCTGGGAA ATTCCTATGG TATTTACTGC TAAGAATGCA180GTTGGCTGTT GGTTTTGTAT ATATGCCAAA ATTATTCTTC TGTTTCTAGT TCATAAAAGA240TTTGTTCCCC ATTTGACATC TTTCAAAGAG ACCTATTTGC TGCCATATCC CATCACTGAT300GATTGGGAGG GAGGATTTAG CTCGATTCTC TATGCTCTGC TCCTAATAGA ATTGTAGGGG360CCGAGGTGAC CAGGAGGCCC GACACTCATG GAGAGACCTG AAATAGGTTC CTATCCTGGC420CCCTGGACCT CATCTTGGAA CAGCTTTGGC TTGAGGTACT AGGACATCTA GGGCTTTGAG480TCAGTGGTTG GCATCATCGA TGTGGCTGAG GAAGGGGGCT AGCCAGATAT ATGGAGAATG540GGGACTAGGA CTCCCCTTTC TACTCAGCTC CAGAGTCCTC CAGGAAAGAA AACTACTTTG600TTGGTTGTGC CAGGTTTCCT GAGAGATTCC TTACCCGTTC TTTCAGTTCC AGACACTGAG660(2)SEQ ID NO:29的資料(ⅰ)序列特徵(A)長度323個鹼基對(B)類型核酸(C)鏈型未知(D)拓撲結構未知(ⅱ)分子類型cDNA(ⅹⅰ)序列描述SEQ ID NO:29:AACATTTCTC TGTGCATGTG TGCATATGTG TACACATGTG TGTGGCTGGC CACAGGGTAG 60TGTTAGGAAA AGATATATTT GAATAGAAGC CATGCAAAGA GCCAAACAAG GTTGGCAAAC120ATGTTTGGCT CTTAACATGG CTTCTATTCA AAGATAAGCT GACCCCTCCT TTCCGGAGAC180TGTGAGGGAC AGATGCTATT CTGGCTTTCA AGTAGAGCCA ATGAGCTTAA CTTGGCCTGT240GGGGAATGCC TGGCAGCTGT CTGTGGGGGC TCTTGGCCTG CTTTCAAAAT AGCCCTGTCG300TTAAAATGGG ACAGCATCAG TGC323(2)SEQ ID NO:30的資料(ⅰ)序列特徵(A)長度33個鹼基對(B)類型核酸(C)鏈型未知(D)拓撲結構未知(ⅱ)分子類型DNA(ⅹⅰ)序列描述SEQ ID NO:30:AAGTTGCGGC CGCGAGCATC AGCAAGGTAC TGC 33(2)SEQ ID NO:31的資料(ⅰ)序列特徵(A)長度25個鹼基對(B)類型核酸
(C)鏈型未知(D)拓撲結構未知(ⅱ)分子類型DNA(ⅹⅰ)序列描述SEQ ID NO:31:TGTCCGGATC CAGTTTGTAC GTGTC 2權利要求
1.含有人脯氨醯-4-羥化酶α亞單位同工型的多肽。
2.權利要求1的多肽,其中脯氨醯-4-羥化酶α亞單位是α2亞單位。
3.權利要求2的多肽,其中所述多肽的胺基酸序列含有(a)SEQ ID NO:3的胺基酸序列;(b)編碼SEQ ID NO:3胺基酸序列之片段的胺基酸序列;(c)編碼SEQ ID NO:3胺基酸序列之衍生物的胺基酸序列。
4.含有編碼人脯氨醯-4-羥化酶α2亞單位之核苷酸序列的核苷酸序列。
5.權利要求4的核苷酸序列,其中所述核苷酸序列包括(a)SEQ ID NO:3的核苷酸序列;(b)在嚴緊條件下能與SEQ ID NO:3的序列雜交的核苷酸序列;(c)與(a)或(b)的核苷酸序列簡併的核苷酸序列。
6.含有權利要求4的核苷酸序列的表達載體。
7.權利要求6的表達載體,其中所述載體進一步含有編碼脯氨醯-4-羥化酶β亞單位的核苷酸序列。
8.用含有權利要求4的核苷酸序列的表達載體感染,轉化或轉染的宿主細胞。
9.權利要求8的宿主細胞,其中所述宿主細胞被含有編碼脯氨醯-4-羥化酶β亞單位的核苷酸序列的表達載體進一步地感染,轉化或轉染。
10.權利要求8的宿主細胞,其中所述宿主細胞被含有一種或多種編碼膠原的核苷酸序列的表達載體進一步地感染,轉化或轉染。
11.權利要求8的宿主細胞,其中所述宿主細胞選自昆蟲細胞,酵母,細菌細胞,植物細胞或哺乳動物細胞。
12.生產脯氨醯-4-羥化酶α2亞單位的方法,包括(a)培養被含有編碼脯氨醯-4-羥化酶α2亞單位之核苷酸序列的表達載體感染,轉化或轉染的宿主細胞;和(b)分離脯氨醯-4-羥化酶α2亞單位。
13.生產脯氨醯-4-羥化酶的方法,包括(a)在可形成α2β2四聚體的條件下培養被(ⅰ)含有編碼脯氨醯-4-羥化酶α2亞單位之核苷酸序列的表達載體;和(ⅱ)含有編碼脯氨醯-4-羥化酶β亞單位之核苷酸序列的表達載體感染,轉化或轉染的宿主細胞;和(b)分離所述的α2β2四聚體。
全文摘要
本發明涉及新的脯氨醯-4-羥化酶α亞單位同工型,編碼這些新蛋白質的多核苷酸序列,和製備這些蛋白質的方法。
文檔編號C12N1/19GK1221456SQ97195301
公開日1999年6月30日 申請日期1997年3月18日 優先權日1996年4月10日
發明者K·I·基維裡科, T·A·皮拉雅尼米, T·I·黑拉科斯基, P·P·安努內, R·K·尼斯, M·K·諾克萊內 申請人:菲布洛根有限公司