一種多肽——胚胎發育蛋白65和編碼這種多肽的多核苷酸的製作方法
2023-07-04 20:09:56 6
專利名稱:一種多肽——胚胎發育蛋白65和編碼這種多肽的多核苷酸的製作方法
技術領域:
本發明屬於生物技術領域,具體地說,本發明描述了一種多肽——胚胎發育蛋白65,以及編碼此多肽的多核苷酸序列。本發明還涉及此多核苷酸和多肽的製備方法和應用。
背景技術:
Huntingtin相互作用蛋白(Huntingtin interacting protein,HIP)是一類與胚胎發育蛋白相互作用的蛋白。胚胎發育蛋白的異常表達可引起亨廷頓氏病(Huntington’s disease,HD)。胚胎發育蛋白含有一多聚穀氨醯氨區域,一富集脯氨酸區域,3-4個HEAT重複(Cell,81,811-823,1995),Huntingtin只通過其N端富集脯氨酸片段與各類蛋白(HYPs,HIPs)結合,但其鄰近的多聚穀氨醯氨片段越長其結合能力越強(Human Molecular Genetics,1998,Vol.7,No.91463-1474)。研究發現,HD的病理發生與發展是由於與HuntingtinN端富集脯氨酸區域相互作用的蛋白(HIP)所觸發(Human MolecularGenetics,1998,Vol.7,No.9 1463-1474)。
HIP中有一類為Huntingtin酵母配偶體(HYPs),HYPs中代表性的結構為WW功能域。WW功能域約有35個胺基酸殘基組成,由於含有兩個非常保守的色氨酸殘基和一個脯氨酸殘基,故命名為WW功能域(WW domain/WWP domain)。(Biochem.biophys.res.commun.,2051021-1205;Trends Biochem.Sci.19531-533(1994))。WW功能域兩側大多富含組氨酸或半胱酸殘基,如營養不良蛋白(Dystrophin),這結構暗示其有結合金屬離子的功能。(NatureGenetics3,283-291)。而WW domain本身在四個保守的芳香族胺基酸殘基的包圍中具有beta摺疊結構。疏水核心和大量帶電荷殘基都表明此功能域是蛋白和蛋白相互作用的功能域。雖然WW domain存在於功能不同的蛋白中,但都參與細胞的信號傳遞和調節作用。
WW功能域蛋白家族大多與富含脯氨酸的結構域的因子如Huntingtin相互作用,傳遞信號。(Proc.Natl.Acad.Sci.USA927819-7823(1995)。如FBP-11,YAP65中的WW domain分別與各自配體的PPLP motif,PY motif結合。(J.Biol.Chem.,272,17070-17077(1997),(EMBO J.,16,2376-2383(1997))。少數WW domain依賴磷酸化途徑,mitoticprolyl異構酶Pin1,泛素結合酶Nedd4中的WW domain與磷蛋白結合。已確證,與磷酸絲氨酸或磷酸蘇氨酸結合是Pin1與其底物在體外發揮其生理效應所必須的。(Science,1999 Feb 26,283(5406)1325-1328)。
胚胎發育蛋白是胚胎發育,神經形成所必須的蛋白。(Cell,81,811-823,1995),(Nature Genet.,17,404-410)。其突變體多聚穀氨醯胺的延長造成神經系統疾病Huntington’s disease(HD)。(Cell,72,971-983,1993)。
目前已知HIPs有參與蛋白拼接功能的HYPA(鼠FBP11同源蛋白)(EMBO.J.,15,1045-1054,1996),參與蛋白代謝的HYPG(HIP2),參與特定膜的功能的HIP1(酵母細胞骨架蛋白S1a2p同源蛋白),以及功能不特定的HYPB,HYPC,HYPD等,這些蛋白中,HYPA,HYPB,HYPC屬於WW domain蛋白家族。HYPA存在細胞質和細胞核中。Northern blot探得三種蛋白mRNA在成人和胚胎腦中較為豐富,這暗示含WW domain的HIPs與Huntingtin作用後在體內發揮不同的生理功能,從而調節神經系統的生長,發育。(Human MolecularGenetics,1998,Vol.7,No.9 1463-1474)。
本發明的人的多肽基因與人的Huntingtin相互作用蛋白家族中的WW domain家族基因在蛋白水平上有90%的同源性,(同源蛋白號AF049103,同源蛋白Huntingtin相互作用蛋白,本蛋白588aa,64.7KD),其結構域相似於Huntingtin相互作用蛋白家族中的WW domain家族的特徵性結構域---WW功能域約有35個胺基酸殘基組成,由於含有兩個非常保守的色氨酸殘基和一個脯氨酸殘基,WW功能域兩側大多富含組氨酸或半胱酸殘基,而WW domain本身在四個保守的芳香族胺基酸殘基的包圍中具有beta摺疊結構。疏水核心和大量帶電荷殘基都表明此功能域是蛋白和蛋白相互作用的功能域。基於以上各點,故認為本發明的新基因為一編碼人Huntingtin相互作用蛋白家族中的WW domain家族的基因,命名為人Huntingtin相互作用蛋白65。並以此推斷其結構域與Huntingtin相互作用蛋白家族中的WW domain家族結構域相似,具有相似的生物學功能。
編碼人Huntingtin相互作用蛋白65的多聚核苷酸,及其所編碼的人Huntingtin相互作用蛋白65的發現為研究細胞在正常及病理條件下的分化、增殖的生理生化過程提供了一種方法,也為診斷、治療與細胞分化增殖紊亂而造成的疾病包括癌症提供了一種新途徑。
由於如上所述胚胎發育蛋白65蛋白在調節細胞分裂和胚胎發育等機體重要功能中起重要作用,而且相信這些調節過程中涉及大量的蛋白,因而本領域中一直需要鑑定更多參與這些過程的胚胎發育蛋白65蛋白,特別是鑑定這種蛋白的胺基酸序列。新胚胎發育蛋白65蛋白編碼基因的分離也為研究確定該蛋白在健康和疾病狀態下的作用提供了基礎。這種蛋白可能構成開發疾病診斷和/或治療藥的基礎,因此分離其編碼DNA是非常重要的。
發明內容
本發明的一個目的是提供分離的新的多肽——胚胎發育蛋白65以及其片段、類似物和衍生物。
本發明的另一個目的是提供編碼該多肽的多核苷酸。
本發明的另一個目的是提供含有編碼胚胎發育蛋白65的多核苷酸的重組載體。
本發明的另一個目的是提供含有編碼胚胎發育蛋白65的多核苷酸的基因工程化宿主細胞。
本發明的另一個目的是提供生產胚胎發育蛋白65的方法。
本發明的另一個目的是提供針對本發明的多肽——胚胎發育蛋白65的抗體。
本發明的另一個目的是提供了針對本發明多肽——胚胎發育蛋白65的模擬化合物、拮抗劑、激動劑、抑制劑。
本發明的另一個目的是提供診斷治療與胚胎發育蛋白65異常相關的疾病的方法。
本發明涉及一種分離的多肽,該多肽是人源的,它包含具有2102胺基酸序列的多肽、或其保守性變體、生物活性片段或衍生物。較佳地,該多肽是具有2102胺基酸序列的多肽。
本發明還涉及一種分離的多核苷酸,它包含選自下組的一種核苷酸序列或其變體(a)編碼具有2102胺基酸序列的多肽的多核苷酸;(b)與多核苷酸(a)互補的多核苷酸;(c)與(a)或(b)的多核苷酸序列具有至少91%相同性的多核苷酸。
更佳地,該多核苷酸的序列是選自下組的一種(a)具有2101中85-1851位的序列;和(b)具有2101中1-2510位的序列。
本發明另外涉及一種含有本發明多核苷酸的載體,特別是表達載體;一種用該載體遺傳工程化的宿主細胞,包括轉化、轉導或轉染的宿主細胞;一種包括培養所述宿主細胞和回收表達產物的製備本發明多肽的方法。
本發明還涉及一種能與本發明多肽特異性結合的抗體。
本發明還涉及一種篩選的模擬、激活、拮抗或抑制胚胎發育蛋白65蛋白活性的化合物的方法,其包括利用本發明的多肽。本發明還涉及用該方法獲得的化合物。
本發明還涉及一種體外檢測與胚胎發育蛋白65蛋白異常表達相關的疾病或疾病易感性的方法,包括檢測生物樣品中所述多肽或其編碼多核苷酸序列中的突變,或者檢測生物樣品中本發明多肽的量或生物活性。
本發明也涉及一種藥物組合物,它含有本發明多肽或其模擬物、激活劑、拮抗劑或抑制劑以及藥學上可接受的載體。
本發明還涉及本發明的多肽和/或多核苷酸在製備用於治療癌症、發育性疾病或免疫性疾病或其它由於胚胎發育蛋白65表達異常所引起疾病的藥物的用途。
本發明的其它方面由於本文的技術的公開,對本領域的技術人員而言是顯而易見的。
本說明書和權利要求書中使用的下列術語除非特別說明具有如下的含義「核酸序列」是指寡核苷酸、核苷酸或多核苷酸及其片段或部分,也可以指基因組或合成的DNA或RNA,它們可以是單鏈或雙鏈的,代表有義鏈或反義鏈。類似地,術語「胺基酸序列」是指寡肽、肽、多肽或蛋白質序列及其片段或部分。當本發明中的「胺基酸序列」涉及一種天然存在的蛋白質分子的胺基酸序列時,這種「多肽」或「蛋白質」不意味著將胺基酸序列限制為與所述蛋白質分子相關的完整的天然胺基酸。
蛋白質或多核苷酸「變體」是指一種具有一個或多個胺基酸或核苷酸改變的胺基酸序列或編碼它的多核苷酸序列。所述改變可包括胺基酸序列或核苷酸序列中胺基酸或核苷酸的缺失、插入或替換。變體可具有「保守性」改變,其中替換的胺基酸具有與原胺基酸相類似的結構或化學性質,如用亮氨酸替換異亮氨酸。變體也可具有非保守性改變,如用色氨酸替換甘氨酸。
「缺失」是指在胺基酸序列或核苷酸序列中一個或多個胺基酸或核苷酸的缺失。
「插入」或「添加」是指在胺基酸序列或核苷酸序列中的改變導致與天然存在的分子相比,一個或多個胺基酸或核苷酸的增加。「替換」是指由不同的胺基酸或核苷酸替換一個或多個胺基酸或核苷酸。
「生物活性」是指具有天然分子的結構、調控或生物化學功能的蛋白質。類似地,術語「免疫學活性」是指天然的、重組的或合成蛋白質及其片段在合適的動物或細胞中誘導特定免疫反應以及與特異性抗體結合的能力。
「激動劑」是指當與胚胎發育蛋白65結合時,一種可引起該蛋白質改變從而調節該蛋白質活性的分子。激動劑可以包括蛋白質、核酸、碳水化合物或任何其它可結合胚胎發育蛋白65的分子。
「拮抗劑」或「抑制物」是指當與胚胎發育蛋白65結合時,一種可封閉或調節胚胎發育蛋白65的生物學活性或免疫學活性的分子。拮抗劑和抑制物可以包括蛋白質、核酸、碳水化合物或任何其它可結合胚胎發育蛋白65的分子。
「調節」是指胚胎發育蛋白65的功能發生改變,包括蛋白質活性的升高或降低、結合特性的改變及胚胎發育蛋白65的任何其它生物學性質、功能或免疫性質的改變。
″基本上純″是指基本上不含天然與其相關的其它蛋白、脂類、糖類或其它物質。本領域的技術人員能用標準的蛋白質純化技術純化胚胎發育蛋白65。基本上純的胚胎發育蛋白65在非還原性聚丙烯醯胺凝膠上能產生單一的主帶。胚胎發育蛋白65多肽的純度可用胺基酸序列分析。
「互補的」或「互補」是指在允許的鹽濃度和溫度條件下通過鹼基配對的多核苷酸天然結合。例如,序列「C-T-G-A」可與互補的序列「G-A-C-T」結合。兩個單鏈分子之間的互補可以是部分的或全部的。核酸鏈之間的互補程度對於核酸鏈之間雜交的效率及強度有明顯影響。
「同源性」是指互補的程度,可以是部分同源或完全同源。「部分同源」是指一種部分互補的序列,其至少可部分抑制完全互補的序列與靶核酸的雜交。這種雜交的抑制可通過在嚴格性程度降低的條件下進行雜交(Southern印跡或Northern印跡等)來檢測。基本上同源的序列或雜交探針可競爭和抑制完全同源的序列與靶序列在的嚴格性程度降低的條件下的結合。這並不意味嚴格性程度降低的條件允許非特異性結合,因為嚴格性程度降低的條件要求兩條序列相互的結合為特異性或選擇性相互作用。
「相同性百分率」是指在兩種或多種胺基酸或核酸序列比較中序列相同或相似的百分率。可用電子方法測定相同性百分率,如通過MEGALIGN程序(Lasergenesoftware package,DNASTAR,Inc.,Madison Wis.)。MEGALIGN程序可根據不同的方法如Cluster法比較兩種或多種序列(Higgins,D.G.和P.M.Sharp(1988)Gene 73237-244)。Cluster法通過檢查所有配對之間的距離將各組序列排列成簇。然後將各簇以成對或成組分配。兩個胺基酸序列如序列A和序列B之間的相同性百分率通過下式計算
序列A與序列B之間匹配的殘基個數×100序列A的殘基數—序列A中間隔殘基數—序列B中間隔殘基數也可以通過Cluster法或用本領域周知的方法如Jotun Hein測定核酸序列之間的相同性百分率(HeinJ.,(1990)Methods in emzumology 183625-645)。
「相似性」是指胺基酸序列之間排列對比時相應位置胺基酸殘基的相同或保守性取代的程度。用於保守性取代的胺基酸例如,帶負電荷的胺基酸可包括天冬氨酸和穀氨酸;帶正電荷的胺基酸可包括賴氨酸和精氨酸;具有不帶電荷的頭部基團有相似親水性的胺基酸可包括亮氨酸、異亮氨酸和纈氨酸;甘氨酸和丙氨酸;天冬醯胺和穀氨醯胺;絲氨酸和蘇氨酸;苯丙氨酸和酪氨酸。
「反義」是指與特定的DNA或RNA序列互補的核苷酸序列。「反義鏈」是指與「有義鏈」互補的核酸鏈。
「衍生物」是指HFP或編碼其的核酸的化學修飾物。這種化學修飾物可以是用烷基、醯基或氨基替換氫原子。核酸衍生物可編碼保留天然分子的主要生物學特性的多肽。
「抗體」是指完整的抗體分子及其片段,如Fa、F(ab』)2及Fv,其能特異性結合胚胎發育蛋白65的抗原決定簇。
「人源化抗體」是指非抗原結合區域的胺基酸序列被替換變得與人抗體更為相似,但仍保留原始結合活性的抗體。
「分離的」一詞指將物質從它原來的環境(例如,若是自然產生的就指其天然環境)之中移出。比如說,一個自然產生的多核苷酸或多肽存在於活動物中就是沒有被分離出來,但同樣的多核苷酸或多肽同一些或全部在自然系統中與之共存的物質分開就是分離的。這樣的多核苷酸可能是某一載體的一部分,也可能這樣的多核苷酸或多肽是某一組合物的一部分。既然載體或組合物不是它天然環境的成分,它們仍然是分離的。
如本發明所用,「分離的」是指物質從其原始環境中分離出來(如果是天然的物質,原始環境即是天然環境)。如活體細胞內的天然狀態下的多聚核苷酸和多肽是沒有分離純化的,但同樣的多聚核苷酸或多肽如從天然狀態中同存在的其他物質中分開,則為分離純化的。
如本文所用,「分離的胚胎發育蛋白65」是指胚胎發育蛋白65基本上不含天然與其相關的其它蛋白、脂類、糖類或其它物質。本領域的技術人員能用標準的蛋白質純化技術純化胚胎發育蛋白65。基本上純的多肽在非還原聚丙烯醯胺凝膠上能產生單一的主帶。胚胎發育蛋白65多肽的純度能用胺基酸序列分析。
本發明提供了一種多肽——胚胎發育蛋白65,其基本上是由2102所示的胺基酸序列組成的。本發明的多肽可以是重組多肽、天然多肽、合成多肽,優選重組多肽。本發明的多肽可以是天然純化的產物,或是化學合成的產物,或使用重組技術從原核或真核宿主(例如,細菌、酵母、高等植物、昆蟲和哺乳動物細胞)中產生。根據重組生產方案所用的宿主,本發明的多肽可以是糖基化的,或可以是非糖基化的。本發明的多肽還可包括或不包括起始的甲硫氨酸殘基。
本發明還包括胚胎發育蛋白65的片段、衍生物和類似物。如本發明所用,術語「片段」、「衍生物」和「類似物」是指基本上保持本發明的胚胎發育蛋白65相同的生物學功能或活性的多肽。本發明多肽的片段、衍生物或類似物可以是(I)這樣一種,其中一個或多個胺基酸殘基被保守或非保守胺基酸殘基(優選的是保守胺基酸殘基)取代,並且取代的胺基酸可以是也可以不是由遺傳密碼子編碼的;或者(II)這樣一種,其中一個或多個胺基酸殘基上的某個基團被其它基團取代包含取代基;或者(III)這樣一種,其中成熟多肽與另一種化合物(比如延長多肽半衰期的化合物,例如聚乙二醇)融合;或者(IV)這樣一種,其中附加的胺基酸序列融合進成熟多肽而形成的多肽序列(如前導序列或分泌序列或用來純化此多肽的序列或蛋白原序列)通過本文的闡述,這樣的片段、衍生物和類似物被認為在本領域技術人員的知識範圍之內。
本發明提供了分離的核酸(多核苷酸),基本由編碼具有2102胺基酸序列的多肽的多核苷酸組成。本發明的多核苷酸序列包括2101的核苷酸序列。本發明的多核苷酸是從人胎腦組織的cDNA文庫中發現的。它包含的多核苷酸序列全長為2510個鹼基,其開放讀框(85-1851)編碼了588個胺基酸。根據胺基酸序列同源比較發現,此多肽與Huntingtin相互作用蛋白有90%的同源性,可推斷出該胚胎發育蛋白65具有Huntingtin相互作用蛋白相似的結構和功能。
本發明的多核苷酸可以是DNA形式或是RNA形式。DNA形式包括cDNA、基因組DNA或人工合成的DNA。DNA可以是單鏈的或是雙鏈的。DNA可以是編碼鏈或非編碼鏈。編碼成熟多肽的編碼區序列可以與2101所示的編碼區序列相同或者是簡併的變異體。如本發明所用,「簡併的變異體」在本發明中是指編碼具有2102的蛋白質或多肽,但與2101所示的編碼區序列有差別的核酸序列。
編碼2102的成熟多肽的多核苷酸包括只有成熟多肽的編碼序列;成熟多肽的編碼序列和各種附加編碼序列;成熟多肽的編碼序列(和任選的附加編碼序列)以及非編碼序列。
術語「編碼多肽的多核苷酸」是指包括編碼此多肽的多核苷酸和包括附加編碼和/或非編碼序列的多核苷酸。
本發明還涉及上述描述多核苷酸的變異體,其編碼與本發明有相同的胺基酸序列的多肽或多肽的片斷、類似物和衍生物。此多核苷酸的變異體可以是天然發生的等位變異體或非天然發生的變異體。這些核苷酸變異體包括取代變異體、缺失變異體和插入變異體。如本領域所知的,等位變異體是一個多核苷酸的替換形式,它可能是一個或多個核苷酸的取代、缺失或插入,但不會從實質上改變其編碼的多肽的功能。
本發明還涉及與以上所描述的序列雜交的多核苷酸(兩個序列之間具有至少50%,優選具有70%的相同性)。本發明特別涉及在嚴格條件下與本發明所述多核苷酸可雜交的多核苷酸。在本發明中,「嚴格條件」是指(1)在較低離子強度和較高溫度下的雜交和洗脫,如0.2×SSC,0.1%SDS,60℃;或(2)雜交時加用變性劑,如50%(v/v)甲醯胺,0.1%小牛血清/0.1%Ficoll,42℃等;或(3)僅在兩條序列之間的相同性至少在95%以上,更好是97%以上時才發生雜交。並且,可雜交的多核苷酸編碼的多肽與2102所示的成熟多肽有相同的生物學功能和活性。
本發明還涉及與以上所描述的序列雜交的核酸片段。如本發明所用,」核酸片段」的長度至少含10個核苷酸,較好是至少20-30個核苷酸,更好是至少50-60個核苷酸,最好是至少100個核苷酸以上。核酸片段也可用於核酸的擴增技術(如PCR)以確定和/或分離編碼胚胎發育蛋白65的多核苷酸。
本發明中的多肽和多核苷酸優選以分離的形式提供,更佳地被純化至均質。
本發明的編碼胚胎發育蛋白65的特異的多核苷酸序列能用多種方法獲得。例如,用本領域熟知的雜交技術分離多核苷酸。這些技術包括但不局限於1)用探針與基因組或cDNA文庫雜交以檢出同源的多核苷酸序列,和2)表達文庫的抗體篩選以檢出具有共同結構特徵的克隆的多核苷酸片段。
本發明的DNA片段序列也能用下列方法獲得1)從基因組DNA分離雙鏈DNA序列;2)化學合成DNA序列以獲得所述多肽的雙鏈DNA。
上述提到的方法中,分離基因組DNA最不常用。DNA序列的直接化學合成是經常選用的方法。更經常選用的方法是cDNA序列的分離。分離感興趣的cDNA的標準方法是從高表達該基因的供體細胞分離mRNA並進行逆轉錄,形成質粒或噬菌體cDNA文庫。提取mRNA的方法已有多種成熟的技術,試劑盒也可從商業途徑獲得(Qiagene)。而構建cDNA文庫也是通常的方法(Sambrook,et al.,MolecularCloning,A Laboratory Manual,Cold Spring Harbor Laboratory.New York,1989)。還可得到商業供應的cDNA文庫,如Clontech公司的不同cDNA文庫。當結合使用聚合酶反應技術時,即使極少的表達產物也能克隆。
可用常規方法從這些cDNA文庫中篩選本發明的基因。這些方法包括(但不限於)(1)DNA-DNA或DNA-RNA雜交;(2)標誌基因功能的出現或喪失;(3)測定胚胎發育蛋白65的轉錄本的水平;(4)通過免疫學技術或測定生物學活性,來檢測基因表達的蛋白產物。上述方法可單用,也可多種方法聯合應用。
在第(1)種方法中,雜交所用的探針是與本發明的多核苷酸的任何一部分同源,其長度至少10個核苷酸,較好是至少30個核苷酸,更好是至少50個核苷酸,最好是至少100個核苷酸。此外,探針的長度通常在2000個核苷酸之內,較佳的為1000個核苷酸之內。此處所用的探針通常是在本發明的基因序列信息的基礎上化學合成的DNA序列。本發明的基因本身或者片段當然可以用作探針。DNA探針的標記可用放射性同位素,螢光素或酶(如鹼性磷酸酶)等。
在第(4)種方法中,檢測胚胎發育蛋白65基因表達的蛋白產物可用免疫學技術如Western印跡法,放射免疫沉澱法,酶聯免疫吸附法(ELISA)等。
應用PCR技術擴增DNA/RNA的方法(Saiki,et al.Science1985;2301350-1354)被優選用於獲得本發明的基因。特別是很難從文庫中得到全長的cDNA時,可優選使用RACE法(RACE-cDNA末端快速擴增法),用於PCR的引物可根據本文所公開的本發明的多核苷酸序列信息適當地選擇,並可用常規方法合成。可用常規方法如通過凝膠電泳分離和純化擴增的DNA/RNA片段。
如上所述得到的本發明的基因,或者各種DNA片段等的多核苷酸序列可用常規方法如雙脫氧鏈終止法(Sanger et al.PNAS,1977,745463-5467)測定。這類多核苷酸序列測定也可用商業測序試劑盒等。為了獲得全長的cDNA序列,測序需反覆進行。有時需要測定多個克隆的cDNA序列,才能拼接成全長的cDNA序列。
本發明也涉及包含本發明的多核苷酸的載體,以及用本發明的載體或直接用胚胎發育蛋白65編碼序列經基因工程產生的宿主細胞,以及經重組技術產生本發明所述多肽的方法。
本發明中,編碼胚胎發育蛋白65的多核苷酸序列可插入到載體中,以構成含有本發明所述多核苷酸的重組載體。術語「載體」指本領域熟知的細菌質粒、噬菌體、酵母質粒、植物細胞病毒、哺乳動物細胞病毒如腺病毒、逆轉錄病毒或其它載體。在本發明中適用的載體包括但不限於在細菌中表達的基於T7啟動子的表達載體(Rosenberg,et al.Gene,1987,56125);在哺乳動物細胞中表達的pMSXND表達載體(Lee and Nathans,J Bio Chem.2633521,1988)和在昆蟲細胞中表達的來源於杆狀病毒的載體。總之,只要能在宿主體內複製和穩定,任何質粒和載體都可以用於構建重組表達載體。表達載體的一個重要特徵是通常含有複製起始點、啟動子、標記基因和翻譯調控元件。
本領域的技術人員熟知的方法能用於構建含編碼胚胎發育蛋白65的DNA序列和合適的轉錄/翻譯調控元件的表達載體。這些方法包括體外重組DNA技術、DNA合成技術、體內重組技術等(Sambroook,et al.Molecular Cloning,a LaboratoryManual,cold Spring Harbor Laboratory.New York,1989)。所述的DNA序列可有效連接到表達載體中的適當啟動子上,以指導mRNA合成。這些啟動子的代表性例子有大腸桿菌的lac或trp啟動子;λ噬菌體的PL啟動子;真核啟動子包括CMV立即早期啟動子、HSV胸苷激酶啟動子、早期和晚期SV40啟動子、反轉錄病毒的LTRs和其它一些已知的可控制基因在原核細胞或真核細胞或其病毒中表達的啟動子。表達載體還包括翻譯起始用的核糖體結合位點和轉錄終止子等。在載體中插入增強子序列將會使其在高等真核細胞中的轉錄得到增強。增強子是DNA表達的順式作用因子,通常大約有10到300個鹼基對,作用於啟動子以增強基因的轉錄。可舉的例子包括在複製起始點晚期一側的100到270個鹼基對的SV40增強子、在複製起始點晚期一側的多瘤增強子以及腺病毒增強子等。
此外,表達載體優選地包含一個或多個選擇性標記基因,以提供用於選擇轉化的宿主細胞的表型性狀,如真核細胞培養用的二氫葉酸還原酶、新黴素抗性以及綠色螢光蛋白(GFP),或用於大腸桿菌的四環素或氨苄青黴素抗性等。
本領域一般技術人員都清楚如何選擇適當的載體/轉錄調控元件(如啟動子、增強子等)和選擇性標記基因。
本發明中,編碼胚胎發育蛋白65的多核苷酸或含有該多核苷酸的重組載體可轉化或轉導入宿主細胞,以構成含有該多核苷酸或重組載體的基因工程化宿主細胞。術語「宿主細胞」指原核細胞,如細菌細胞;或是低等真核細胞,如酵母細胞;或是高等真核細胞,如哺乳動物細胞。代表性例子有大腸桿菌,鏈黴菌屬;細菌細胞如鼠傷寒沙門氏菌;真菌細胞如酵母;植物細胞;昆蟲細胞如果蠅S2或Sf9;動物細胞如CHO、COS或Bowes黑素瘤細胞等。
用本發明所述的DNA序列或含有所述DNA序列的重組載體轉化宿主細胞可用本領域技術人員熟知的常規技術進行。當宿主為原核生物如大腸桿菌時,能吸收DNA的感受態細胞可在指數生長期後收穫,用CaCl2法處理,所用的步驟在本領域眾所周知。可供選擇的是用MgCl2。如果需要,轉化也可用電穿孔的方法進行。當宿主是真核生物,可選用如下的DNA轉染方法磷酸鈣共沉澱法,或者常規機械方法如顯微注射、電穿孔、脂質體包裝等。
通過常規的重組DNA技術,利用本發明的多核苷酸序列可用來表達或生產重組的胚胎發育蛋白65(Science,1984;2241431)。一般來說有以下步驟(1).用本發明的編碼人胚胎發育蛋白65的多核苷酸(或變異體),或用含有該多核苷酸的重組表達載體轉化或轉導合適的宿主細胞;(2).在合適的培養基中培養宿主細胞;(3).從培養基或細胞中分離、純化蛋白質。
在步驟(2)中,根據所用的宿主細胞,培養中所用的培養基可選自各種常規培養基。在適於宿主細胞生長的條件下進行培養。當宿主細胞生長到適當的細胞密度後,用合適的方法(如溫度轉換或化學誘導)誘導選擇的啟動子,將細胞再培養一段時間。
在步驟(3)中,重組多肽可包被於細胞內、或在細胞膜上表達、或分泌到細胞外。如果需要,可利用其物理的、化學的和其它特性通過各種分離方法分離和純化重組的蛋白。這些方法是本領域技術人員所熟知的。這些方法包括但並不限於常規的復性處理、蛋白沉澱劑處理(鹽析方法)、離心、滲透破菌、超聲波處理、超離心、分子篩層析(凝膠過濾)、吸附層析、離子交換層析、高效液相層析(HPLC)和其它各種液相層析技術及這些方法的結合。
本發明的多肽以及該多肽的拮抗劑、激動劑和抑制劑可直接用於疾病治療,例如,可治療惡性腫瘤、腎上腺缺乏症、皮膚病、各類炎症、HIV感染和免疫性疾病等。
Huntingtin相互作用蛋白(HIP)是一類與胚胎發育蛋白相互作用的蛋白。胚胎發育蛋白的異常表達可引起亨廷頓氏病(Huntington’s disease,HD)。HD的病理發生與發展是由於與HuntingtinN端富集脯氨酸區域相互作用的蛋白HIP所觸發(Human Molecular Genetics,1998,Vol.7,No.9 1463-1474)。並且胚胎發育蛋白是胚胎發育,神經形成所必須的蛋白(Cell,81,811-823,1995)。其突變體多聚穀氨醯胺的延長造成神經系統疾病HD(Cell,72,971-983,1993)。
由此可見,本發明的人Huntingtin相互作用蛋白65的表達異常將產生各種疾病尤其是神經系統疾病、胚胎發育紊亂性疾病,這些疾病包括但不限於神經系統退行性疾病亨廷頓氏病、帕金森氏病,舞蹈症,老年痴呆症,抑鬱症,健忘症,癲癇症,偏頭痛、痴呆症,多發性硬化症神經肌肉疾病重症肌無力,脊肌萎縮症,肌假性肥大,Duchenne肌營養不良、強直性肌營養不良、肌緊張症,遲緩運動障礙,肌張力障礙神經皮膚綜合症神經纖維瘤病,結節性硬化症、腦三叉神經血管瘤病、共濟失調毛細血管擴張症精神性疾病精神分裂症,抑鬱症,偏執狂,焦慮症,強迫症,恐懼症,神經衰落腦血管病短暫性腦缺血發作、腦梗塞、腦出血、蛛網膜下腔出血脊髓疾病急性脊髓炎、脊髓壓迫症周圍神經疾病三叉神經痛、面神經麻痺、延髓麻痺、坐骨神經痛、格林-巴利綜合症神經系統腫瘤星形細胞瘤、室管膜瘤、髓母細胞瘤、腦膜瘤、膠質細胞瘤、聽神經瘤、血管源性腫瘤、腦垂體腺瘤、顱咽管瘤胚胎發育紊亂性疾病這些疾病包括但不限於先天性流產、顱腦裂、腦膨出、孔腦畸形、Down綜合症、先天性腦積水、脊柱骨骺發育不良症、生殖腺發育不全、先天性腎上腺增生、尿道上裂、隱、Conradi綜合症、先天性青光眼或白內障、視網膜發育異常、先天性視神經萎縮、先天性感覺神經性聽覺損失、裂手裂腳症、畸胎、Williams綜合症、Alagille綜合症、貝魏二氏綜合症目前已知HIPs有參與蛋白拼接功能的HYPA(鼠FBP11同源蛋白)(EMBO.J.,15,1045-1054,1996),參與蛋白代謝的HYPG(HIP2),參與特定膜的功能的HIP1(酵母細胞骨架蛋白S1a2p同源蛋白),以及功能不特定的HYPB,HYPC,HYPD等,這些蛋白中,HYPA,HYPB,HYPC屬於WW domain蛋白家族。HYPA存在細胞質和細胞核中。HYPA,HYPB,HYPC三種蛋白mRNA在成人和胚胎腦中較為豐富。
故推測,本發明的人Huntingtin相互作用蛋白65的表達異常還將產生許多疾病,這些疾病包括但不限於某些代謝紊亂性疾病、腫瘤、遺傳性疾病、神經系統疾病、血液病及免疫系統疾病等。
本發明也提供了篩選化合物以鑑定提高(激動劑)或阻遏(拮抗劑)胚胎發育蛋白65的藥劑的方法。激動劑提高胚胎發育蛋白65刺激細胞增殖等生物功能,而拮抗劑阻止和治療與細胞過度增殖有關的紊亂如各種癌症。例如,能在藥物的存在下,將哺乳動物細胞或表達胚胎發育蛋白65的膜製劑與標記的胚胎發育蛋白65一起培養。然後測定藥物提高或阻遏此相互作用的能力。
胚胎發育蛋白65的拮抗劑包括篩選出的抗體、化合物、受體缺失物和類似物等。胚胎發育蛋白65的拮抗劑可以與胚胎發育蛋白65結合併消除其功能,或是抑制該多肽的產生,或是與該多肽的活性位點結合使該多肽不能發揮生物學功能。
在篩選作為拮抗劑的化合物時,可以將胚胎發育蛋白65加入生物分析測定中,通過測定化合物對胚胎發育蛋白65和其受體之間相互作用的影響來確定化合物是否是拮抗劑。用上述篩選化合物的同樣方法,可以篩選出起拮抗劑作用的受體缺失物和類似物。能與胚胎發育蛋白65結合的多肽分子可通過篩選由各種可能組合的胺基酸結合於固相物組成的隨機多肽庫而獲得。篩選時,一般應對胚胎發育蛋白65分子進行標記。
本發明提供了用多肽,及其片段、衍生物、類似物或它們的細胞作為抗原以生產抗體的方法。這些抗體可以是多克隆抗體或單克隆抗體。本發明還提供了針對胚胎發育蛋白65抗原決定簇的抗體。這些抗體包括(但不限於)多克隆抗體、單克隆抗體、嵌合抗體、單鏈抗體、Fab片段和Fab表達文庫產生的片段。
多克隆抗體的生產可用胚胎發育蛋白65直接注射免疫動物(如家兔,小鼠,大鼠等)的方法得到,多種佐劑可用於增強免疫反應,包括但不限於弗氏佐劑等。製備胚胎發育蛋白65的單克隆抗體的技術包括但不限於雜交瘤技術(Kohler andMilstein.Nature,1975,256495-497),三瘤技術,人B-細胞雜交瘤技術,EBV-雜交瘤技術等。將人恆定區和非人源的可變區結合的嵌合抗體可用已有的技術生產(Morrison et al,PNAS,1985,816851)。而已有的生產單鏈抗體的技術(U.S.Pat No.4946778)也可用於生產抗胚胎發育蛋白65的單鏈抗體。
抗胚胎發育蛋白65的抗體可用於免疫組織化學技術中,檢測活檢標本中的胚胎發育蛋白65。
與胚胎發育蛋白65結合的單克隆抗體也可用放射性同位素標記,注入體內可跟蹤其位置和分布。這种放射性標記的抗體可作為一種非創傷性診斷方法用於腫瘤細胞的定位和判斷是否有轉移。
抗體還可用於設計針對體內某一特殊部位的免疫毒素。如胚胎發育蛋白65高親和性的單克隆抗體可與細菌或植物毒素(如白喉毒素,蓖麻蛋白,紅豆鹼等)共價結合。一種通常的方法是用巰基交聯劑如SPDP,攻擊抗體的氨基,通過二硫鍵的交換,將毒素結合於抗體上,這種雜交抗體可用於殺滅胚胎發育蛋白65陽性的細胞。
本發明中的抗體可用於治療或預防與胚胎發育蛋白65相關的疾病。給予適當劑量的抗體可以刺激或阻斷胚胎發育蛋白65的產生或活性。
本發明還涉及定量和定位檢測胚胎發育蛋白65水平的診斷試驗方法。這些試驗是本領域所熟知的,且包括FISH測定和放射免疫測定。試驗中所檢測的胚胎發育蛋白65水平,可以用作解釋胚胎發育蛋白65在各種疾病中的重要性和用於診斷胚胎發育蛋白65起作用的疾病。
本發明的多肽還可用作肽譜分析,例如,多肽可用物理的、化學或酶進行特異性切割,並進行一維或二維或三維的凝膠電泳分析,更好的是進行質譜分析。
編碼胚胎發育蛋白65的多核苷酸也可用於多種治療目的。基因治療技術可用於治療由於胚胎發育蛋白65的無表達或異常/無活性表達所致的細胞增殖、發育或代謝異常。重組的基因治療載體(如病毒載體)可設計用於表達變異的胚胎發育蛋白65,以抑制內源性的胚胎發育蛋白65活性。例如,一種變異的胚胎發育蛋白65可以是縮短的、缺失了信號傳導功能域的胚胎發育蛋白65,雖可與下遊的底物結合,但缺乏信號傳導活性。因此重組的基因治療載體可用於治療胚胎發育蛋白65表達或活性異常所致的疾病。來源於病毒的表達載體如逆轉錄病毒、腺病毒、腺病毒相關病毒、單純皰疹病毒、細小病毒等可用於將編碼胚胎發育蛋白65的多核苷酸轉移至細胞內。構建攜帶編碼胚胎發育蛋白65的多核苷酸的重組病毒載體的方法可見於已有文獻(Sambrook,et al.)。另外重組編碼胚胎發育蛋白65的多核苷酸可包裝到脂質體中轉移至細胞內。
多核苷酸導入組織或細胞內的方法包括將多核苷酸直接注入到體內組織中;或在體外通過載體(如病毒、噬菌體或質粒等)先將多核苷酸導入細胞中,再將細胞移植到體內等。
抑制胚胎發育蛋白65mRNA的寡核苷酸(包括反義RNA和DNA)以及核酶也在本發明的範圍之內。核酶是一種能特異性分解特定RNA的酶樣RNA分子,其作用機制是核酶分子與互補的靶RNA特異性雜交後進行核酸內切作用。反義的RNA和DNA及核酶可用已有的任何RNA或DNA合成技術獲得,如固相磷酸醯胺化學合成法合成寡核苷酸的技術已廣泛應用。反義RNA分子可通過編碼該RNA的DNA序列在體外或體內轉錄獲得。這種DNA序列已整合到載體的RNA聚合酶啟動子的下遊。為了增加核酸分子的穩定性,可用多種方法對其進行修飾,如增加兩側的序列長度,核糖核苷之間的連接應用磷酸硫酯鍵或肽鍵而非磷酸二酯鍵。
編碼胚胎發育蛋白65的多核苷酸可用於與胚胎發育蛋白65的相關疾病的診斷。編碼胚胎發育蛋白65的多核苷酸可用於檢測胚胎發育蛋白65的表達與否或在疾病狀態下胚胎發育蛋白65的異常表達。如編碼胚胎發育蛋白65的DNA序列可用於對活檢標本進行雜交以判斷胚胎發育蛋白65的表達狀況。雜交技術包括Southern印跡法,Northern印跡法、原位雜交等。這些技術方法都是公開的成熟技術,相關的試劑盒都可從商業途徑得到。本發明的多核苷酸的一部分或全部可作為探針固定在微陣列(Microarray)或DNA晶片(又稱為「基因晶片」)上,用於分析組織中基因的差異表達分析和基因診斷。用胚胎發育蛋白65特異的引物進行RNA-聚合酶鏈反應(RT-PCR)體外擴增也可檢測胚胎發育蛋白65的轉錄產物。
檢測胚胎發育蛋白65基因的突變也可用於診斷胚胎發育蛋白65相關的疾病。胚胎發育蛋白65突變的形式包括與正常野生型胚胎發育蛋白65DNA序列相比的點突變、易位、缺失、重組和其它任何異常等。可用已有的技術如Southern印跡法、DNA序列分析、PCR和原位雜交檢測突變。另外,突變有可能影響蛋白的表達,因此用Northern印跡法、Western印跡法可間接判斷基因有無突變。
本發明的序列對染色體鑑定也是有價值的。該序列會特異性地針對某條人染色體具體位置且並可以與其雜交。目前,需要鑑定染色體上的各基因的具體位點。現在,只有很少的基於實際序列數據(重複多態性)的染色體標記物可用於標記染色體位置。根據本發明,為了將這些序列與疾病相關基因相關聯,其重要的第一步就是將這些DNA序列定位於染色體上。
簡而言之,根據cDNA製備PCR引物(優選15-35bp),可以將序列定位於染色體上。然後,將這些引物用於PCR篩選含各條人染色體的體細胞雜合細胞。只有那些含有相應於引物的人基因的雜合細胞會產生擴增的片段。
體細胞雜合細胞的PCR定位法,是將DNA定位到具體染色體的快捷方法。使用本發明的寡核苷酸引物,通過類似方法,可利用一組來自特定染色體的片段或大量基因組克隆而實現亞定位。可用於染色體定位的其它類似策略包括原位雜交、用標記的流式分選的染色體預篩選和雜交預選,從而構建染色體特異的cDNA庫。
將cDNA克隆與中期染色體進行螢光原位雜交(FISH),可以在一個步驟中精確地進行染色體定位。此技術的綜述,參見Verma等,Human Chromosomesa Manualof Basic Techniques,Pergamon Press,New York(1988)。
一旦序列被定位到準確的染色體位置,此序列在染色體上的物理位置就可以與基因圖數據相關聯。這些數據可見於例如,V.Mckusick,Mendelian Inheritancein Man(可通過與Johns Hopkins University Welch Medical Library聯機獲得)。然後可通過連鎖分析,確定基因與業已定位到染色體區域上的疾病之間的關係。
接著,需要測定患病和未患病個體間的cDNA或基因組序列差異。如果在一些或所有的患病個體中觀察到某突變,而該突變在任何正常個體中未觀察到,則該突變可能是疾病的病因。比較患病和未患病個體,通常涉及首先尋找染色體中結構的變化,如從染色體水平可見的或用基於cDNA序列的PCR可檢測的缺失或易位。根據目前的物理作圖和基因定位技術的分辨能力,被精確定位至與疾病有關的染色體區域的cDNA,可以是50至500個潛在致病基因間之一種(假定1兆鹼基作圖分辨能力和每20kb對應於一個基因)。
可以將本發明的多肽、多核苷酸及其模擬物、激動劑、拮抗劑和抑制劑與合適的藥物載體組合後使用。這些載體可以是水、葡萄糖、乙醇、鹽類、緩衝液、甘油以及它們的組合。組合物包含安全有效量的多肽或拮抗劑以及不影響藥物效果的載體和賦形劑。這些組合物可以作為藥物用於疾病治療。
本發明還提供含有一種或多種容器的藥盒或試劑盒,容器中裝有一種或多種本發明的藥用組合物成分。與這些容器一起,可以有由製造、使用或銷售藥品或生物製品的政府管理機構所給出的指示性提示,該提示反映出生產、使用或銷售的政府管理機構許可其在人體上施用。此外,本發明的多肽可以與其它的治療化合物結合使用。
藥物組合物可以以方便的方式給藥,如通過局部、靜脈內、腹膜內、肌內、皮下、鼻內或皮內的給藥途徑。胚胎發育蛋白65以有效地治療和/或預防具體的適應症的量來給藥。施用於患者的胚胎發育蛋白65的量和劑量範圍將取決於許多因素,如給藥方式、待治療者的健康條件和診斷醫生的判斷。
下列附圖用於說明本發明的具體實施方案,而不用於限定由權利要求書所界定的本發明範圍。
圖1是本發明胚胎發育蛋白65和Huntingtin相互作用蛋白的胺基酸序列同源性比較圖。上方序列是胚胎發育蛋白65,下方序列是Huntingtin相互作用蛋白。相同胺基酸在兩個序列間用單字符胺基酸表示,相似胺基酸用「+」表示。
圖2為分離的胚胎發育蛋白65的聚丙烯醯胺凝膠電泳圖(SDS-PAGE)。65kDa為蛋白質的分子量。箭頭所指為分離出的蛋白條帶。
具體實施例方式
下面結合具體實施例,進一步闡述本發明。應理解,這些實施例僅用於說明本發明而不用於限制本發明的範圍。下列實施例中未註明具體條件的實驗方法,通常按照常規條件如Sambrook等人,分子克隆實驗室手冊(New YorkCold SpringHarbor Laboratory Press,1989)中所述的條件,或按照製造廠商所建議的條件。實施例1胚胎發育蛋白65的克隆用異硫氰酸胍/酚/氯仿一步法提取人胎腦總RNA。用Quik mRNA Isolation Kit(Qiegene公司產品)從總RNA中分離poly(A)mRNA。2ug poly(A)mRNA經逆轉錄形成cDNA。用Smart cDNA克隆試劑盒(購自Clontech)將cDNA片段定向插入到pBSK(+)載體(Clontech公司產品)的多克隆位點上,轉化DH5α,細菌形成cDNA文庫。用Dyeterminate cycle reaction sequencing kit(Perkin-Elmer公司產品)和ABI 377自動測序儀(Perkin-Elmer公司)測定所有克隆的5′和3′末端的序列。將測定的cDNA序列與已有的公共DNA序列資料庫(Genebank)進行比較,結果發現其中一個克隆0952E07的cDNA序列為新的DNA。通過合成一系列引物對該克隆所含的插入cDNA片段進行雙向測定。結果表明,0952E07克隆所含的全長cDNA為2510bp(如2101所示),從第85bp至1851bp有一個1767bp的開放閱讀框架(ORF),編碼一個新的蛋白質(如2102所示)。我們將此克隆命名為pBS-0952E07,編碼的蛋白質命名為胚胎發育蛋白65。
實施例2cDNA克隆的同源檢索將本發明的胚胎發育蛋白65的序列及其編碼的蛋白序列,用Blast程序(Basiclocal Alignment search tool)[Altschul,SF et al.J.Mol.Biol.1990;215403-10],在Genbank、Swissport等資料庫進行同源檢索。與本發明的胚胎發育蛋白65同源性最高的基因是一種已知的Huntingtin相互作用蛋白,其編碼的蛋白在Genbank的準入號為AF049103。蛋白質同源結果示於圖1,兩者高度同源,其相同性為90%;相似性為92%。實施例3用RT-PCR方法克隆編碼胚胎發育蛋白65的基因用胎腦細胞總RNA為模板,以oligo-dT為引物進行逆轉錄反應合成cDNA,用Qiagene的試劑盒純化後,用下列引物進行PCR擴增Primer15』-GAATGGACCCCAGGGCGATTTGGG-3』 (2103)Primer25』-AGTTCTTTAATTGATTTTATTTTTTT-3』(2104)Primer1為位於2101的5』端的第1bp開始的正向序列;Primer2為2101的中的3』端反向序列。
擴增反應的條件在50μl的反應體積中含有50mmol/L KCl,10mmol/LTris-Cl,(pH8.5),1.5mmol/L MgCl2,200μmol/L dNTP,10pmol引物,1U的Taq DNA聚合酶(Clontech公司產品)。在PE9600型DNA熱循環儀(Perkin-Elmer公司)上按下列條件反應25個周期94℃ 30sec;55℃ 30sec;72℃ 2min。在RT-PCR時同時設β-actin為陽性對照和模板空白為陰性對照。擴增產物用QIAGEN公司的試劑盒純化,用TA克隆試劑盒連接到pCR載體上(Invitrogen公司產品)。DNA序列分析結果表明PCR產物的DNA序列與2101所示的1-2510bp完全相同。實施例4Northern印跡法分析胚胎發育蛋白65基因的表達用一步法提取總RNA[Anal.Biochem 1987,162,156-159]。該法包括酸性硫氰酸胍苯酚-氯仿抽提。即用4M異硫氰酸胍-25mM檸檬酸鈉,0.2M乙酸鈉(pH4.0)對組織進行勻漿,加入1倍體積的苯酚和1/5體積的氯仿-異戊醇(49∶1),混合後離心。吸出水相層,加入異丙醇(0.8體積)並將混合物離心得到RNA沉澱。將得到的RNA沉澱用70%乙醇洗滌,乾燥並溶於水中。用20μg RNA,在含20mM 3-(N-嗎啉代)丙磺酸(pH7.0)-5mM乙酸鈉-1mM EDTA-2.2M甲醛的1.2%瓊脂糖凝膠上進行電泳。然後轉移至硝酸纖維素膜上。用α-32P dATP通過隨機引物法製備32P-標記的DNA探針。所用的DNA探針為圖1所示的PCR擴增的胚胎發育蛋白65編碼區序列(85bp至1851bp)。將32P-標記的探針(約2×106cpm/ml)與轉移了RNA的硝酸纖維素膜在一溶液中於42℃雜交過夜,該溶液包含50%甲醯胺-25mM KH2PO4(pH7.4)-5×SSC-5×Denhardt’s溶液和200μg/ml鮭精DNA。雜交之後,將濾膜在1×SSC-0.1%SDS中於55℃洗30min。然後,用PhosphorImager進行分析和定量。實施例5重組胚胎發育蛋白65的體外表達、分離和純化根據2101和圖1所示的編碼區序列,設計出一對特異性擴增引物,序列如下Primer35』-CCCCATATGATGGCCCTGAAGAATGATGAGATAA-3』(2105)Primer45』-CATGGATCCTCACTCTAATTCAGTGTCCTCTTTG-3』(2106)此兩段引物的5』端分別含有NdeI和BamHI酶切位點,其後分別為目的基因5』端和3』端的編碼序列,NdeI和BamHI酶切位點相應於表達載體質粒pET-28b(+)(Novagen公司產品,Cat.No.69865.3)上的選擇性內切酶位點。以含有全長目的基因的pBS-0952E07質粒為模板,進行PCR反應。PCR反應條件為總體積50μl中含pBS-0952E07質粒10pg、引物Primer-3和Primer-4分別為10pmol、Advantage polymerase Mix(Clontech公司產品)1μl。循環參數94℃20s,60℃ 30s,68℃ 2min,共25個循環。用NdeI和BamHI分別對擴增產物和質粒pET-28(+)進行雙酶切,分別回收大片段,並用T4連接酶連接。連接產物轉化用氯化鈣法大腸杆細菌DH5α,在含卡那黴素(終濃度30μg/ml)的LB平板培養過夜後,用菌落PCR方法篩選陽性克隆,並進行測序。挑選序列正確的陽性克隆(pET-0952E07)用氯化鈣法將重組質粒轉化大腸桿菌BL21(DE3)plySs(Novagen公司產品)。在含卡那黴素(終濃度30μg/ml)的LB液體培養基中,宿主菌BL21(pET-0952E07)在37℃培養至對數生長期,加入IPTG至終濃度1mmol/L,繼續培養5小時。離心收集菌體,經超聲波破菌,離心收集上清,用能與6個組氨酸(6His-Tag)結合的親和層析柱His.Bind Quick Cartridge(Novagen公司產品)進行層析,得到了純化的目的蛋白胚胎發育蛋白65。經SDS-PAGE電泳,在65kDa處得到一單一的條帶(圖2)。將該條帶轉移至PVDF膜上用Edams水解法進行N-端胺基酸序列分析,結果N-端15個胺基酸與2102所示的N-端15個胺基酸殘基完全相同。實施例6抗胚胎發育蛋白65抗體的產生用多肽合成儀(PE公司產品)合成下述胚胎發育蛋白65特異性的多肽NH2-Met-Ala-Leu-Lys-Asn-Asp-Glu-Ile-Ile-Asp-Ala-Thr-Gln-Lys-Gly-COOH。將該多肽分別與血藍蛋白和牛血清白蛋白耦合形成複合,方法參見Avrameas,et al.Immunochemistry,1969;643。用4mg上述血藍蛋白多肽複合物加上完全弗氏佐劑免疫家兔,15天後再用血藍蛋白多肽複合物加不完全弗氏佐劑加強免疫一次。採用經15μg/ml牛血清白蛋白多肽複合物包被的滴定板做ELISA測定兔血清中抗體的滴度。用蛋白A-Sepharose從抗體陽性的家兔血清中分離總IgG。將多肽結合於溴化氰活化的Sepharose4B柱上,用親和層析法從總IgG中分離抗多肽抗體。免疫沉澱法證明純化的抗體可特異性地與胚胎發育蛋白65結合。
序列表110 上海博德基因開發有限公司120 一種多肽--胚胎發育蛋白65和編碼這種多肽的多核苷酸130 0952e07160 6170 PatentIn version 3.1210 1211 1860212 DNA213 Homo sapiens220221 CDS222 (85)..(1851)223400 1gaatggaccc cagggcgatt tgggtaccgg gccccccctc gagtgaagga gtatgcacga 60aacaaaaaca tccattacta tttc atg gcc ctg aag aat gat gag ata ata 111Met Ala Leu Lys Asn Asp Glu Ile Ile15gat gcc act caa aaa gga aat tgc tct cgt ttc atg aat cac agc tgt159Asp Ala Thr Gln Lys Gly Asn Cys Ser Arg Phe Met Asn His Ser Cys10 15 20 25gaa cca aat tgt gaa acc caa aaa tgg act gtg aac gga caa ctg agg 207Glu Pro Asn Cys Glu Thr Gln Lys Trp Thr Val Asn Gly Gln Leu Arg30 35 40gtt ggg ttt ttt acc acc aaa ctg gtt cct tca ggc tca gag tta acg 255Val Gly Phe Phe Thr Thr Lys Leu Val Pro Ser Gly Ser Glu Leu Thr45 50 55ttt gac tat cag ttc cag aga tat gga aaa gaa gcc cag aaa tgt ttc 303Phe Asp Tyr Gln Phe Gln Arg Tyr Gly Lys Glu Ala Gln Lys Cys Phe60 65 70tgc gga tca gcc aat tgc cgg ggt tac ctg gga gga gaa aac aga gtc 351Cys Gly Ser Ala Asn Cys Arg Gly Tyr Leu Gly Gly Glu Asn Arg Val75 80 85agc atc aga gca gca gga ggg aaa atg aag aag gaa cga tct cgt aag 399Ser Ile Arg Ala Ala Gly Gly Lys Met Lys Lys Glu Arg Ser Arg Lys90 95 100 105aag gat tca gtg gat gga gag cta gaa gct ctg atg gaa aat ggt gag 447Lys Asp Ser Val Asp Gly Glu Leu Glu Ala Leu Met Glu Asn Gly Glu110 115 120ggt ctc tct gat aaa aac cag gtg ctc agc tta tcc cgg cta atg gtt 495Gly Leu Ser Asp Lys Asn Gln Val Leu Ser Leu Ser Arg Leu Met Val125 130 135aga att gaa act ttg gag cag aaa ctt acc tgt ctg gaa ctc ata cag 543Arg Ile Glu Thr Leu Glu Gln Lys Leu Thr Cys Leu Glu Leu Ile Gln140 145 150aac aca cac tca cag tcc tgc ctg aag tcc ttt ctg gaa cgt cat ggg 591Asn Thr His Ser Gln Ser Cys Leu Lys Ser Phe Leu Glu Arg His Gly155 160 165ctg tct ttg ttg tgg atc tgg atg gca gag cta ggt gac ggc cgg gaa 639Leu Ser Leu Leu Trp Ile Trp Met Ala Glu Leu Gly Asp Gly Arg Glu170 175 180 185agt aac cag aag ctt cag gaa gag att ata aag act ttg gaa cac ttg 687Ser Asn Gln Lys Leu Gln Glu Glu Ile Ile Lys Thr Leu Glu His Leu190 195 200ccc att cct act aaa aat atg ttg gag gaa agc aaa gta ctt cca att 735Pro Ile Pro Thr Lys Asn Met Leu Glu Glu Ser Lys Val Leu Pro Ile205 210 215att caa cgc tgg tct cag act aag act gct gtc cct ccg ttg agt gaa 783Ile Gln Arg Trp Ser Gln Thr Lys Thr Ala Val Pro Pro Leu Ser Glu220 225 230gga gat ggg tat tct agt gag aat aca tcg cgt gct cat aca cca ctc 831Gly Asp Gly Tyr Ser Ser Glu Asn Thr Ser Arg Ala His Thr Pro Leu235 240 245aac aca cct gat cct tcc acc aag ctg agc aca gaa gct gac aca gac 879Asn Thr Pro Asp Pro Ser Thr Lys Leu Ser Thr Glu Ala Asp Thr Asp250 255 260 265act ccc aag aaa cta atg ttt cgc aga ctg aaa att ata agt gaa aat 927Thr Pro Lys Lys Leu Met Phe Arg Arg Leu Lys Ile Ile Ser Glu Asn270 275 280agc atg gac agt gca atc tct gat gca acc agt gag cta gaa ggc aag 975Ser Met Asp Ser Ala Ile Ser Asp Ala Thr Ser Glu Leu Glu Gly Lys285 290 295gat ggc aaa gag gat ctt gat caa tta gaa aat gtc cct gta gag gaa 1023Asp Gly Lys Glu Asp Leu Asp Gln Leu Glu Asn Val Pro Val Glu Glu300 305 310gag gaa gaa ttg cag tca caa cag cta ctc cca caa cag ctg cct gaa 1071Glu Glu Glu Leu Gln Ser Gln Gln Leu Leu Pro Gln Gln Leu Pro Glu315 320 325tgc aaa gtt gat agt gaa acc aac ata gaa gct agt aag cta cct aca 1119Cys Lys Val Asp Ser Glu Thr Asn Ile Glu Ala Ser Lys Leu Pro Thr330 335 340 345tct gaa cca gaa gct gac gct gaa ata gag ccc aaa gag agc aac ggc 1167Ser Glu Pro Glu Ala Asp Ala Glu Ile Glu Pro Lys Glu Ser Asn Gly350 355 360aca aaa cta gaa gaa cct att aat gaa gaa aca cca tcc caa gat gaa 1215Thr Lys Leu Glu Glu Pro Ile Asn Glu Glu Thr Pro Ser Gln Asp Glu365 370 375gag gag ggt gtg tct gat gtg gag agt gaa agg agc caa gaa cag cca 1263Glu Glu Gly Val Ser Asp Val Glu Ser Glu Arg Ser Gln Glu Gln Pro380 385 390gat aaa aca gtg gat ata agt gat ttg gcc acc aaa ctc ctg gac agt 1311Asp Lys Thr Val Asp Ile Ser Asp Leu Ala Thr Lys Leu Leu Asp Ser395 400 405tgg aaa gac cta aag gag gta tat cga att cca aag aaa agt caa act 1359Trp Lys Asp Leu Lys Glu Val Tyr Arg Ile Pro Lys Lys Ser Gln Thr410 415 420 425gaa aag gaa aac aca aca act gaa cga gga agg gat gct gtt ggc ttc 1407Glu Lys Glu Asn Thr Thr Thr Glu Arg Gly Arg Asp Ala Val Gly Phe430 435 440aga gat caa aca cct gcc ccg aag act cct aat agg tca aga gag aga 1455Arg Asp Gln Thr Pro Ala Pro Lys Thr Pro Asn Arg Ser Arg Glu Arg445 450 455gac cca gac aag caa act caa aat aaa gag aaa agg aaa cga aga agc 1503Asp Pro Asp Lys Gln Thr Gln Asn Lys Glu Lys Arg Lys Arg Arg Ser460 465 470tcc ctc tca cca ccc tct tct gcc tat gag cgg gga aca aaa agg cca 1551Ser Leu Ser Pro Pro Ser Ser Ala Tyr Glu Arg Gly Thr Lys Arg Pro475 480 485gat gac aga tat gat aca cca act tct aaa aag aaa gta cga att aaa 1599Asp Asp Arg Tyr Asp Thr Pro Thr Ser Lys Lys Lys Val Arg Ile Lys490 495 500 505gac cgc aat aaa ctt tct aca gag gaa cgc cgg aag ttg ttt gag caa 1647Asp Arg Asn Lys Leu Ser Thr Glu Glu Arg Arg Lys Leu Phe Glu Gln510 515 520gag gtg gct caa cgg gag gct cag aaa cat ctg gct cgc aag ctg act 1695Glu Val Ala Gln Arg Glu Ala Gln Lys His Leu Ala Arg Lys Leu Thr525 530 535cac ggt gtt atg aat aag gag ctg aag tac tgt aag aat cct gag gac 1743His Gly Val Met Asn Lys Glu Leu Lys Tyr Cys Lys Asn Pro Glu Asp540 545 550ctg gag tgc aat gag aat gtg aaa cac aaa acc aag gag tac att aag 1791Leu Glu Cys Asn Glu Asn Val Lys His Lys Thr Lys Glu Tyr Ile Lys555 560 565aag tac atg cag aag ttt ggg gct gtt tac aaa ccc aaa gag gac act 1839Lys Tyr Met Gln Lys Phe Gly Ala Val Tyr Lys Pro Lys Glu Asp Thr570 575 580 585gaattagag tga ctgttgggc1860Glu Leu Glu210 2211 588212 PRT213 Homo sapiens400 2Met Ala Leu Lys Asn Asp Glu Ile Ile Asp Ala Thr Gln Lys Gly Asn15 10 15Cys Ser Arg Phe Met Asn His Ser Cys Glu Pro Asn Cys Glu Thr Gln20 25 30Lys Trp Thr Val Asn Gly Gln Leu Arg Val Gly Phe Phe Thr Thr Lys35 40 45Leu Val Pro Ser Gly Ser Glu Leu Thr Phe Asp Tyr Gln Phe Gln Arg50 55 60Tyr Gly Lys Glu Ala Gln Lys Cys Phe Cys Gly Ser Ala Asn Cys Arg65 70 75 80Gly Tyr Leu Gly Gly Glu Asn Arg Val Ser Ile Arg Ala Ala Gly Gly85 90 95Lys Met Lys Lys Glu Arg Ser Arg Lys Lys Asp Ser Val Asp Gly Glu100 105 110Leu Glu Ala Leu Met Glu Asn Gly Glu Gly Leu Ser Asp Lys Asn Gln115 120 125Val Leu Ser Leu Ser Arg Leu Met Val Arg Ile Glu Thr Leu Glu Gln130 135 140Lys Leu Thr Cys Leu Glu Leu Ile Gln Asn Thr His Ser Gln Ser Cys145 150 155 160Leu Lys Ser Phe Leu Glu Arg His Gly Leu Ser Leu Leu Trp Ile Trp165 170 175Met Ala Glu Leu Gly Asp Gly Arg Glu Ser Asn Gln Lys Leu Gln Glu180 185 190Glu Ile Ile Lys Thr Leu Glu His Leu Pro Ile Pro Thr Lys Asn Met195 200 205Leu Glu Glu Ser Lys Val Leu Pro Ile Ile Gln Arg Trp Ser Gln Thr
210 215 220Lys Thr Ala Val Pro Pro Leu Ser Glu Gly Asp Gly Tyr Ser Ser Glu225 230 235 240Asn Thr Ser Arg Ala His Thr Pro Leu Asn Thr Pro Asp Pro Ser Thr245 250 255Lys Leu Ser Thr Glu Ala Asp Thr Asp Thr Pro Lys Lys Leu Met Phe260 265 270Arg Arg Leu Lys Ile Ile Ser Glu Asn Ser Met Asp Ser Ala Ile Ser275 280 285Asp Ala Thr Ser Glu Leu Glu Gly Lys Asp Gly Lys Glu Asp Leu Asp290 295 300Gln Leu Glu Asn Val Pro Val Glu Glu Glu Glu Glu Leu Gln Ser Gln305 310 315 320Gln Leu Leu Pro Gln Gln Leu Pro Glu Cys Lys Val Asp Ser Glu Thr325 330 335Asn Ile Glu Ala Ser Lys Leu Pro Thr Ser Glu Pro Glu Ala Asp Ala340 345 350Glu Ile Glu Pro Lys Glu Ser Asn Gly Thr Lys Leu Glu Glu Pro Ile355 360 365Asn Glu Glu Thr Pro Ser Gln Asp Glu Glu Glu Gly Val Ser Asp Val370 375 380Glu Ser Glu Arg Ser Gln Glu Gln Pro Asp Lys Thr Val Asp Ile Ser385 390 395 400Asp Leu Ala Thr Lys Leu Leu Asp Ser Trp Lys Asp Leu Lys Glu Val405 410 415Tyr Arg Ile Pro Lys Lys Ser Gln Thr Glu Lys Glu Asn Thr Thr Thr420 425 430Glu Arg Gly Arg Asp Ala Val Gly Phe Arg Asp Gln Thr Pro Ala Pro435 440 445Lys Thr Pro Asn Arg Ser Arg Glu Arg Asp Pro Asp Lys Gln Thr Gln450 455 460Asn Lys Glu Lys Arg Lys Arg Arg Ser Ser Leu Ser Pro Pro Ser Ser465 470 475 480Ala Tyr Glu Arg Gly Thr Lys Arg Pro Asp Asp Arg Tyr Asp Thr Pro485 490 495Thr Ser Lys Lys Lys Val Arg Ile Lys Asp Arg Asn Lys Leu Ser Thr500 505 510Glu Glu Arg Arg Lys Leu Phe Glu Gln Glu Val Ala Gln Arg Glu Ala515 520 525Gln Lys His Leu Ala Arg Lys Leu Thr His Gly Val Met Asn Lys Glu530 535 540Leu Lys Tyr Cys Lys Asn Pro Glu Asp Leu Glu Cys Asn Glu Asn Val545 550 555 560Lys His Lys Thr Lys Glu Tyr Ile Lys Lys Tyr Met Gln Lys Phe Gly565 570 575Ala Val Tyr Lys Pro Lys Glu Asp Thr Glu Leu Glu580 585210 3211 24212 DNA213 Homo sapiens400 3gaatggaccccagggcgatttggg24210 4211 26212 DNA213 Homo sapiens400 4agttctttaattgattttattttttt26210 5211 34212 DNA213 Homo sapiens400 5ccccatatga tggccctgaa gaatgatgagataa34210 6211 34212 DNA213 Homo sapiens400 6catggatcct cactctaatt cagtgtcctc tttg3權利要求
1.一種分離的多肽-胚胎發育蛋白65,其特徵在於它包含有2102所示的胺基酸序列的多肽、或其多肽的活性片段、類似物或衍生物。
2.如權利要求1所述的多肽,其特徵在於所述多肽、類似物或衍生物的胺基酸序列具有與2102所示的胺基酸序列至少95%的相同性。
3.如權利要求2所述的多肽,其特徵在於它包含具有2102所示的胺基酸序列的多肽。
4.一種分離的多核苷酸,其特徵在於所述多核苷酸包含選自下組中的一種(a)編碼具有2102所示胺基酸序列的多肽或其片段、類似物、衍生物的多核苷酸;(b)與多核苷酸(a)互補的多核苷酸;或(c)與(a)或(b)有至少91%相同性的多核苷酸。
5.如權利要求4所述的多核苷酸,其特徵在於所述多核苷酸包含編碼具有2102所示胺基酸序列的多核苷酸。
6.如權利要求4所述的多核苷酸,其特徵在於所述多核苷酸的序列包含有2101中85-1851位的序列或2101中1-2510位的序列。
7.一種含有外源多核苷酸的重組載體,其特徵在於它是由權利要求4-6中的任一權利要求所述多核苷酸與質粒、病毒或運載體表達載體構建而成的重組載體。
8.一種含有外源多核苷酸的遺傳工程化宿主細胞,其特徵在於它是選自於下列一種宿主細胞(a)用權利要求7所述的重組載體轉化或轉導的宿主細胞;或(b)用權利要求4-6中的任一權利要求所述多核苷酸轉化或轉導的宿主細胞。
9.一種具有胚胎發育蛋白65活性的多肽的製備方法,其特徵在於所述方法包括(a)在表達胚胎發育蛋白65條件下,培養權利要求8所述的工程化宿主細胞;(b)從培養物中分離出具有胚胎發育蛋白6 5活性的多肽。
10.一種能與多肽結合的抗體,其特徵在於所述抗體是能與胚胎發育蛋白65特異性結合的抗體。
11.一類模擬或調節多肽活性或表達的化合物,其特徵在於它們是模擬、促進、拮抗或抑制胚胎發育蛋白65的活性的化合物。
12.如權利要求11所述的化合物,其特徵在於它是2101所示的多核苷酸序列或其片段的反義序列。
13.一種權利要求11所述化合物的應用,其特徵在於所述化合物用於調節胚胎發育蛋白65在體內、體外活性的方法。
14.一種檢測與權利要求1-3中的任一權利要求所述多肽相關的疾病或疾病易感性的方法,其特徵在於其包括檢測所述多肽的表達量,或者檢測所述多肽的活性,或者檢測多核苷酸中引起所述多肽表達量或活性異常的核苷酸變異。
15.如權利要求1-3中的任一權利要求所述多肽的應用,其特徵在於它應用於篩選胚胎發育蛋白65的模擬物、激動劑,拮抗劑或抑制劑;或者用於肽指紋圖譜鑑定。
16.如權利要求4-6中的任一權利要求所述的核酸分子的應用,其特徵在於它作為引物用於核酸擴增反應,或者作為探針用於雜交反應,或者用於製造基因晶片或微陣列。
17.如權利要求1-6及11中的任一權利要求所述的多肽、多核苷酸或化合物的應用,其特徵在於用所述多肽、多核苷酸或其模擬物、激動劑、拮抗劑或抑制劑以安全有效劑量與藥學上可接受的載體組成作為診斷或治療與胚胎發育蛋白65異常相關的疾病的藥物組合物。
18.權利要求1-6及11中的任一權利要求所述的多肽、多核苷酸或化合物的應用,其特徵在於用所述多肽、多核苷酸或化合物製備用於治療如惡性腫瘤,血液病,HIV感染和免疫性疾病和各類炎症的藥物。
全文摘要
本發明公開了一種多肽—胚胎發育蛋白65,編碼此多肽的多核苷酸和經DNA重組技術產生這種多肽的方法。本發明還公開了此多肽用於治療多種疾病的方法,如惡性腫瘤,血液病,HIV感染和免疫性疾病和各類炎症等。本發明還公開了抗此多肽的拮抗劑及其治療作用。本發明還公開了編碼這種新的胚胎發育蛋白65的多核苷酸的用途。
文檔編號C12N15/113GK1485335SQ0213721
公開日2004年3月31日 申請日期2002年9月27日 優先權日2002年9月27日
發明者毛裕民, 謝毅 申請人:上海博德基因開發有限公司