用於產生和傳遞蛋白的IFN-α2基因編碼區上遊的基因組序列的製作方法
2023-07-15 23:05:16 1
專利名稱:用於產生和傳遞蛋白的IFN-α2基因編碼區上遊的基因組序列的製作方法
技術領域:
本發明涉及基因組DNA。
背景技術:
目前用治療蛋白治療疾病的方法包括給予在體外生產的蛋白和基因治療。體外生產蛋白一般包括將編碼目的蛋白的外源DNA引入到合適的宿主細胞中培養。在另一方面,基因療法包括給予患者包含目的治療蛋白編碼序列的細胞、質粒或病毒。
也可以用基因導向技術,以所需的方式通過改變某些治療蛋白的內源基因的表達來生產所述治療蛋白。參閱例如美國專利第5,641,670、5,733,761和5,272,071號,美國專利申請序號08/406,030,WO 91/06666、WO 91/06667和WO 90/11354,所有這些都通過引用整體結合到本文中。
發明概述本發明是基於對5′至人幹擾素-α2(「IFNA2」)基因的編碼序列的基因組DNA的鑑定和測序。此DNA例如可以用於DNA構建物,當將該構建物通過同源重組整合到哺乳動物細胞的基因組時,所述構建物改變(例如增加)內源IFNA2基因在該細胞中的表達。「內源IFNA2基因」意指編碼IFNA2的基因組(即染色體)基因。所述構建物包含導向序列和轉錄調節序列,所述導向序列包括或來自於最近公開的5′非編碼序列。所述轉錄調節序列最好在序列上與內源IFNA2基因的轉錄調節序列不同。所述導向序列引導所述調節序列整合到內源IFNA2編碼序列的上遊區中,以使該調節序列操作性連接至所述內源編碼序列。所述「操作性連接的」是指所述調節序列可以控制內源IFNA2編碼序列的表達。所述構建物還可以包含易於選擇已穩定整合所述構建物的細胞的選擇性標記基因和/或另一個連接至啟動子的編碼序列。
在一個實施方案中,所述DNA構建物包括(a)導向序列,(b)調節序列,(c)外顯子,(d)剪接供體位點,(e)內含子,和(f)剪接受體位點,其中所述導向序列引導其本身和元件(b)-(f)整合,以使元件(b)-(f)處於所述內源基因之中或其上遊。然後所述調節序列控制生產轉錄物,所述轉錄物不僅包括元件(c)-(f),而且包括所述內源IFNA2編碼序列。最好使所述內含子和所述剪接受體位點位於所述構建物剪接供體位點的下遊。
所述導向序列與發生同源重組的基因組中預先選擇的靶位點同源。它包含SEQ ID NO:12的至少20(例如至少30、50、100或1000)個連續的核苷酸;並可以包含例如SEQ ID NO:7的至少20(例如至少30、50或100)個連續的核苷酸、SEQ ID NO:8的至少20(例如至少30或50)個連續的核苷酸或SEQ ID NO:13的至少20(例如至少30、50、100或1000)個連續的核苷酸。另外,所述導向序列可以包含SEQID NO:16的至少20(例如至少30、50或100)個連續的核苷酸、SEQID NO:17的至少20個連續的核苷酸、SEQ ID NO:18的至少20(例如至少30或50)個連續的核苷酸或SEQ ID NO:19的至少20(例如至少30、50、100或1000)個連續的核苷酸。SEQ ID NO:7相當於SEQ IDNO:12的核苷酸1至278;SEQ ID NO:8相當於SEQ ID NO:12的核苷酸3492至3564;而SEQ ID NO:13相當於SEQ ID NO:12的核苷酸279至3491。所述「同源」是指所述導向序列與其基因組靶位點相同或足夠相似,以使所述導向序列和靶位點可以在人細胞中進行同源重組。只要同源重組可以以有效頻率發生,那麼小部分的鹼基對錯配可以接受。為了易於同源重組,所述導向序列最好為至少約20(例如至少50、100、250、400或1000)個鹼基對(「bp」)長。所述導向序列也可以包括SEQ ID NO:12所包含區以外的基因組序列,只要其包括此區中的至少20個核苷酸。例如,可以由位於SEQ ID NO:8和IFNA2基因的內源轉錄起始序列之間的序列產生另外的導向序列。
由於存在於IFNA2基因的基因座上的多態性,在任何給定的哺乳動物物種中任何給定的基因組靶位點的核苷酸組分都可以發生微小改變。對應於SEQ ID NO:7、8、12、13、16、17、18和19的這種多態變體(尤其是人多態變體)的導向序列屬於本發明的範圍。
在同源重組時,將所述構建物的調節序列整合到細胞染色體中IFNA2基因的編碼序列上遊的預先選定的區。產生的包含得自所述構建物的調節序列的新轉錄單位改變了靶IFNA2基因的表達。如此產生的IFNA2蛋白在序列上與未改變的內源基因編碼的IFNA2蛋白可以相同,或者由於同源重組引入的變化,與野生型IFNA2蛋白相比可以包含胺基酸殘基的添加、置換或減少。
改變基因表達包括使在所獲得的細胞中通常沉默(即基本不表達)的基因活化(或引起表達),增加或減少基因的表達水平,並改變基因的調節模式,使得該模式不同於在所獲得的細胞中的模式。「所獲得的細胞」意指在同源重組前的細胞。
使用本發明的DNA構建物改變內源IFNA2基因在哺乳動物細胞中表達的方法也屬於本發明的範圍。該方法包括以下步驟(ⅰ)將所述DNA構建物引入到哺乳動物細胞中;(ⅱ)將所述細胞保持在允許所述構建物和與所述導向序列同源的基因組靶位點之間發生同源重組的條件下,以產生同源重組細胞;和(ⅲ)將所述同源重組細胞保持在允許IFNA2編碼序列於得自所述構建物的調節序列控制下表達的條件下。至少部分所述基因組靶位點是5′至內源IFNA2基因的編碼序列。即所述基因組靶位點可以包含編碼序列以及5′非編碼序列。
本發明的特徵還在於轉染或感染的細胞,在所述細胞中所述構建物與在一個或兩個內源IFNA2基因的等位基因中的內源ATG起始密碼子上遊的基因組DNA進行同源重組。這種轉染或感染的細胞也稱為同源重組細胞,具有改變的IFNA2表達模式。這些細胞特別用於體外生產IFNA2和通過基因治療傳遞IFNA2。製備和使用這種細胞的方法也包含在本發明中。所述細胞可以是脊椎動物源,諸如哺乳動物(例如人、非人類的靈長類、母牛、豬、馬、山羊、綿羊、貓、狗、兔、小鼠、豚鼠、倉鼠或大鼠)源。
本發明還涉及體外或體內將上述構建物經同源重組引入到宿主細胞的基因組中產生哺乳動物IFNA2蛋白的方法。然後將所述同源重組細胞保持在使所述IFNA2蛋白轉錄、翻譯和可選地分泌的條件下。
本發明的特徵還在於分離的核酸,所述核酸包含SEQ ID NO:12或其互補物的至少20(例如至少30、50、100、200或1000)個連續核苷酸的序列,或包含與SEQ ID NO:12相同、除外不妨礙與所述導向序列同源重組的多態改變或其它微小改變(例如少於序列的5%)的序列。例如,所述分離的DNA可以包含SEQ ID NO:7或其互補物的至少20(例如至少30、50或100)個連續的核苷酸、SEQ ID NO:8或其互補物的至少20(例如至少30或50)個連續的核苷酸、SEQ IDNO:13或其互補物的至少20(例如至少30、50、100或1000)個連續的核苷酸、SEQ ID NO:16或其互補物的至少20(例如至少30、50或100)個連續的核苷酸、SEQ ID NO:17或其互補物的至少20個連續的核苷酸、SEQ ID NO:18或其互補物的至少20(例如至少30或50)個連續的核苷酸或SEQ ID NO:19或其互補物的至少20(例如至少30、50、100或1000)個連續的核苷酸。
在一個實施方案中,本發明的分離的核酸包括SEQ ID NO:12的連續100個鹼基對的區段。例如所述分離的DNA可以包含SEQ IDNO:12或其互補物的核苷酸1-100、101-200、201-300、301-400、401-500、501-600、601-700、701-800、801-900、901-1000、1001-1100、1101-1200、1201-1300、1301-1400、1401-1500、1501-1600、1601-1700、1701-1800、1801-1900、1901-2000、2001-2100、2101-2200、2201-2300、2301-2400、2401-2500、2501-2600、2601-2700、2701-2800、2801-2900、2901-3000、3001-3100、3101-3100、3101-3200、3201-3300、3301-3400、3401-3500或3465-3564。SEQ ID NO:12或其互補物的這些區段也用作本發明構建物中的導向序列。
在所述分離的DNA中,得自SEQ ID NO:12的序列沒有連接至編碼完整IFNA2的序列,或至少沒有以和在任何野生型基因組中出現的構型相同的構型(即被相同的非編碼序列分隔)連接。因此本文使用的術語「分離的DNA」不表示染色體或大段的基因組DNA(這可能摻入到粘粒或酵母人工染色體中),它不僅包括部分或全部SEQ IDNO:12,而且包括完整的IFNA2編碼序列和所有的位於IFNA2編碼序列和存在於細胞基因組中對應於SEQ ID NO:12的序列之間的序列。它確實包括但不限於,(ⅰ)摻入到質粒或病毒中的DNA;或(ⅱ)作為不依賴於其它序列的單獨分子存在的DNA,例如通過聚合酶鏈式反應(「PCR」)或限制性內切核酸酶處理產生的片段。所述分離的DNA最好不包含編碼完整IFNA2前體(即IFNA2以內源分泌信號肽互補結束)的序列。
本發明還包括包含一種鏈的分離的DNA,所述鏈包含至少100(例如至少200、400或1000)個核苷酸長並在或中等嚴格或高度嚴格條件下與SEQ ID NO:7、8、12、13、16、17、18和/或19或SEQID NO:7、8、12、13、16、17、18和/或19的互補物雜交的序列。該序列沒有連接至IFNA2編碼序列,或至少沒有以和在任何野生型基因組中出現的構型相同的構型連接。所述中等嚴格條件意指在Church緩衝液(7%SDS、0.5%NaHPO4、1M EDTA、1%牛血清白蛋白)中於50℃雜交並於50℃用2×SSC清洗。高度嚴格條件定義為在50%甲醯胺存在下於42℃雜交;用包含1%SDS的2×SSC於65℃第一次清洗;接著用0.1×SSC於65℃第二次清洗。
本發明還包括包含一種鏈的分離的DNA,所述鏈包含(1)至少50(例如至少70或100)個核苷酸長並(2)與SEQ ID NO:12的片段或全部或與所述片段的互補物具有至少80%(例如至少85%、90%、95%或98%)序列同一性的序列。該序列例如可以包括SEQ ID NO:7、8、13、16、17、18或19的部分或全部。所述序列沒有連接至完整IFNA2編碼序列,或至少沒有以和在任何野生型基因組中出現的構型相同的構型連接。
在個別多肽或核酸分子被認為與參照多肽或核酸分子具有明確百分率的同一性或保守性的情況下,通過Myers和Miller,CABIOS(1989)的算法確定同一性或保守性的百分率,所述算法具體為ALIGN程序(2.0版)或其等效程序中,需要時使用12的隙寬補償參數和4的缺口補償參數。其它所有參數都設定為它們的默認狀態。ALIGN的使用權很容易獲得。參見例如國際網際網路http:∥www2.igh.cnrs.fr/bi/align-guess.cgi。
本發明的特徵還在於通過提供其內源IFNA2基因已如本文所述活化的細胞,並將該細胞植入動物(例如哺乳動物如人、非人類的靈長類、母牛、豬、馬、山羊、綿羊、貓、狗、兔、小鼠、豚鼠、倉鼠或大鼠)中,所述細胞在所述動物中分泌IFNA2,從而將IFNA2傳遞給所述動物的方法。本發明還包括通過提供其內源IFNA2基因已如本文所述活化的細胞,並在允許該細胞表達和分泌IFNA2的條件下體外培養該細胞,從而產生IFNA2的方法。
本發明進一步包括與質粒pA2HB(下文描述)的部分HindⅢ-BamHⅠ插入片段(例如至少約20、50、100、400或1000bp長)具有至少80%(例如至少85%、90%或95%)序列同一性,或在高度或中等嚴格條件下與其雜交的分離的DNA。該部分插入片段的3′末端位於包括於所述質粒插入片段的IFNA2編碼序列的ATG翻譯起始密碼子上遊的至少511bp。
本發明的分離的DNA例如可以用作用於(當與合適的下遊引物共同使用時)獲得內源IFNA2基因的調節區和/或全編碼序列的上遊PCR引物源,或用作指示在人染色體製備物中染色體9存在的雜交探針。它也可以如下所述用於改變內源IFNA2基因在脊椎動物細胞中表達的方法。
除非另有定義,否則本文使用的所有科技術語都具有和本發明所屬領域的一般技術人員的通常理解相同的含義。以下描述了典型方法和材料,但是與本文描述的方法和材料相似或等同的方法和材料也可以用來實施和檢驗本發明。所有出版物、專利申請、專利和本文提及的其它參考文獻都通過引用整體結合到本文中。在有衝突的情況下,以本說明書包括定義為準。所述材料、方法和實施例僅起說明作用,並無限制意圖。
由以下的詳述和權利要求將明顯看出本發明的其它特徵和優勢。
附圖簡述
圖1顯示人IFNA2編碼序列和某些側翼5′和3′非編碼序列(GenBank HUMIFNAA)的公開序列(SEQ ID NO:1)。箭頭代表PCR引物IFN1、IFN2、IFN6和IFN7的序列。
圖2是一幅示意圖,顯示包括在質粒pA2HB的插入片段中的人IFNA2基因組區。
圖3表示人IFNA2基因的編碼序列的上遊區的核苷酸序列(SEQID NO:7)。以前不曾報導過此核苷酸序列。
圖4表示人IFNA2編碼序列和某些側翼5′和3′非編碼序列的序列(SEQ ID NO:9)。下劃線序列(SEQ ID NO:8)以前沒有報導過。也顯示了由此基因編碼的多肽序列(SEQ ID NO:2)。「成熟」表示成熟多肽的N末端。
圖5是一幅顯示本發明構建物的示意圖。該構建物包含第一個導向序列(1);可擴增的標記基因(AM);選擇性標記基因(SM);調節序列;加帽位點;外顯子;剪接供體位點(SD);內含子;剪接受體位點(SA);和第二個導向序列(2)。黑框表示編碼DNA,而點框表示已轉錄但未翻譯的序列。
圖6表示5′至人IFNA2編碼序列的基因組序列(SEQ ID NO:11),並包括某些編碼序列。下劃線序列以前報導過,但其餘部分(-4074至-511;SEQ ID NO:12)是新的。框架序列是SEQ ID NO:13。5′至SEQID NO:13的序列是SEQ ID NO:7。在所述框架區域和所述下劃線序列之間的序列是SEQ ID NO:8。核苷酸-4074至-3270是SEQ ID NO:16。核苷酸-3267至-3239是SEQ ID NO:17。核苷酸-3241至-3137是SEQID NO:18。核苷酸-3139至-511是SEQID NO:19。
圖7表示用於本發明構建物的第一個導向序列(SEQ ID NO:14)。
圖8表示用於本發明構建物的第二個導向序列(SEQ ID NO:15)。
發明詳述本發明基於對人IFNA2基因的編碼序列的上遊序列的核苷酸組成的研究。
幹擾素-α由具有14個基因的複合基因家族構成,所述基因群集在染色體9的短臂上。包括IFNA2基因的這些基因中沒有一個具有內含子。幹擾素-α由巨噬細胞、T細胞和B細胞以及各種各樣的其它許多細胞產生。幹擾素-α具有顯著的抗病毒作用,並已經顯示對治療乳頭瘤病毒、B型肝炎和C型肝炎病毒、牛痘、單純皰疹病毒、水痘樣帶狀皰疹病毒(herpes zoster varicellosus virus)和鼻病毒的感染有效。
人IFNA2基因編碼包含23個胺基酸的信號肽的188個胺基酸的前體蛋白(SEQ ID NO:2)。人IFNA2基因的基因組圖譜示於圖1。該圖譜的構建基於1733個鹼基對(「bp」)的公開序列(HUMIFNAA,GenBank保藏號J00207和V00544;SEQ ID NO:1),所述公開序列始於相對於翻譯起始位點的-510位(除非另有說明,否則本文指出的所有位置均為相對於翻譯起始位點),並終止於+1,223位。加帽位點位於-67位。IFNA2基因的5′特異性序列以及它們在改變內源IFNA2基因表達中的用途為獲得包含IFNA2基因上遊序列的基因組DNA,用由PCR產生的332bp的探針篩選在λEMBL3(Clontech目錄# HL1006d)中的人淋巴細胞基因組文庫。此探針對應於在位置-263和+69之間的基因組區,並使用稱為IFN7和IFN6的寡核苷酸引物由人基因組DNA擴增,IFN7和IFN6都利用IFNA2基因組DNA序列(圖1)設計。引物IFN7的5′末端對應於位置-263,其序列為5′-AGTTTCTAAAAAGGCTCTGGGGTA-3′(SEQ ID NO:3)。引物IFN6的5′末端對應於位置+69,其序列為5′-GCCCACAGAGCAGCTTGAC-3′(SEQ ID NO:4)。
用放射性標記的332bp的探針篩選大約一百萬個重組噬菌體。由原篩選板分離60個陽性噬菌斑。由30個這些噬菌斑中分離λ噬菌體DNA,並使用寡核苷酸引物IFN1和IFN2進行PCR分析。IFN1和IFN2都得自IFNA2基因的3′非翻譯區;它們的序列可以在WWW站點「http:∥www.ncbi.nlm.nih.gov/dbSTS,」使用識別碼「NCBIID:42433」獲得。引物IFN1的5′末端對應於位置+639,其序列為5′-AAAGACTCATGTTTCTGCTATGACC-3′(SEQ ID NO:5)。引物IFN2的5′末端對應於位置+853,其序列為5′-GGTGCACATGACATAATATGAACA-3′(SEQ ID NO:6)。在30個噬菌體樣本中,兩個產生預期的215bp的PCR產物。兩個噬菌體噬菌斑中的一個通過另外兩輪雜交篩選進一步純化,產生噬菌體克隆4-4-1。
將來自噬菌體4-4-1的8.3kb的HindⅢ-BamHⅠ片段亞克隆到pBluescriptⅡSK+(Stratagene,La Jolla,CA)中,以產生pA2HB,它包含IFNA2基因的未轉錄上遊序列的約4.3kb、蛋白編碼區(1.1kb)以及下遊序列的約2.8kb。8.3kb的HindⅢ-BamHⅠ片段的限制圖譜示於圖2。
利用Sanger法對pA2HB質粒測序。以下列出了其5′末端位於5′末端的HindⅢ位點的278bp的序列(也參閱圖3)
AAGCTTTTATAGGTGTAAATTTTCCACTTAGTACTGCTTTTGTAATGTTGTCTTTTTATTTTCATTTATCTCAAGATGTTTTCTAATTTCTCTTGACTTCCTTCTTAAATTCTTACCTCATGTAGACATACATTTTTGGCCCTATGCATTGGGATGCAAAACCAGACTAATTTACTTTGTACAAAAAGAAAAATGAGAAAGAAATATATTTGGTCTTGTGAGCACTATATGGAAATACTTTATATTCCATTTGTTTCATCATATTCATATATCCCTTT(SEQ ID NO:7)所述HindⅢ位點位於位置-4,073。也鑑定了以前未公開的在位置-583和-511之間的序列,示於以下並在圖4中用下劃線表示。
CATTGGATACTCCATCACCTGCTGTGATATTATGAATGTCTGCCTATATAAATATTCACTATTCCATAACACA(SEQ IDNO:8)也鑑定了在對應於SEQ ID NO:7和8的區之間的序列(SEQ IDNO:13)。
在位置-4,074和-511之間的基因組序列(SEQ ID NO:12)是在圖6中沒有下劃線的序列。SEQ ID NO:7和8分別對應於SEQ ID NO:12的核苷酸1-278和核苷酸3492-3564。
為改變內源IFNA2基因的表達,將包含SEQ ID NO:12的核苷酸279-3311的DNA片段克隆到質粒中,以產生導向構建物pGA402。SEQ ID NO:12的核苷酸279-3311稱為SEQ ID NO:14。將該片段插入到CMV啟動子和新黴素抗性基因的上遊,並在圖5中示意標出。關於圖5中的第二個導向序列,將包含示於圖1的IFNA2基因序列的核苷酸-68至69的DNA片段克隆到CMV啟動子和新黴素抗性基因的下遊。IFNA2基因的核苷酸-68至69稱為SEQ ID NO:15。將pGA402質粒引入到幾乎不表達或不表達IFNA2基因的人成纖維細胞中,以使其可與內源IFNA2基因同源重組。在引入質粒後篩選抗G418的細胞,以鑑別IFNA2基因表達增加的細胞,這應可預計在pGA402和基因組DNA之間的同源重組事件是否發生在內源IFNA2基因附近。一般方法學改變內源IFNA2表達使用上述IFNA2上遊序列,採用如在美國專利第5,641,670號中一般描述的方法,可以改變內源人IFNA2基因的表達。在圖5中顯示了一個策略。在此策略中,設計的導向構建物包括與所述基因上遊的第一個靶位點同源的第一個導向序列、可擴增的標記基因、選擇性標記基因、調節區、加帽位點、外顯子、剪接供體位點、內含子、剪接受體位點以及與所述第一個靶位點下遊的第二個靶位點同源並終止於IFNA2編碼序列之中或上遊的第二個導向序列。按照此策略,為了避免在轉錄序列中的不需要的ATG起始密碼子,所述第二個靶位點的5′末端最好小於正常IFNA2翻譯起始位點上遊的107bp。由同源重組基因座產生的轉錄物包括由所述構建物產生的外顯子、由所述構建物產生的剪接供體位點、由所述構建物產生的內含子、由所述構建物產生的剪接受體位點、在任何這些元件之間的任何序列以及從所述構建物產生的剪接受體位點經整個內源編碼序列至IFNA2基因的轉錄終止位點的序列。剪接此轉錄物將產生可以翻譯產生人IFNA2前體的mRNA,它根據由所述構建物產生的外顯子的特徵,或者具有正常IFNA2分泌信號序列,或者具有基因工程分泌信號序列。外源內含子的大小和由此外源調節區相對於所述基因編碼區的位置可以改變,以使所述調節區的功能最佳。
在任何活化策略中,所述第一個和第二個靶位點互相之間不需要緊接乃至相近。當它們互相之間不緊接時,IFNA2基因的正常上遊區的一部分和/或所述編碼區的一部分在同源重組時應缺失。
可以通過同源重組,將易於改變內源IFNA2表達的突變引入到染色體DNA中。例如,可能需要清除正確的ATG起始密碼子上遊和在同源重組基因座中所述外源調節區和所述內源IFNA2編碼區之間的虛假的和不需要的ATG起始密碼子。為了這樣做,可以使用具有與跨過了不需要的ATG起始密碼子的基因組位點同源的導向序列的導向構建物。此導向序列包含對應於目的突變的核苷酸,例如包含代替了ATG的ATT。所述導向構建物可選地包括一個或多個易於選擇同源重組細胞的選擇性標記。然後可以使用本發明的表達改變方法,將所述外源調節區引入到同源重組細胞上遊的改變位點中。
另一方面,可以將所述外源調節區和目的序列突變在一步中引入到基因組DNA中。在此實施方案中使用的DNA構建物可以包含所述外源調節區和包含對應於目的突變的核苷酸的導向序列。也可以將兩個單獨的構建物共轉染或共感染到靶細胞中,其中一個構建物包含所述調節區,而另一個構建物包含對應於目的突變的核苷酸。
如果需要,可以例如在不需要的ATG起始密碼子和正確的ATG起始密碼子之間的位點,以相似的方式,將哺乳動物剪接受體位點引入到所述基因組DNA中。用於此目的的DNA構建物包含導向序列,該序列與正確的IFNA2起始密碼子的上遊基因組位點同源,並鄰近對應於目的剪接受體位點的同源序列或嵌入其中。然後用包含外源調節區和在其3′末端具有未配對的剪接供體位點的外顯子的第二個構建物,與引導所述第二個構建物至插入的剪接受體位點的上遊基因組區的導向序列一起,轉染或感染包含正確重組的IFNA2基因座的細胞。在外源調節區控制下產生的初級轉錄物包括外源外顯子、外源剪接供體位點、外源剪接受體位點、在這些元件之間的任何序列,以及在外源剪接受體位點和內源IFNA2基因的轉錄終止位點之間的序列。在剪接時,所述轉錄物的剪接供體位點被剪接至剪接受體位點,並將除去可能包含不需要的AUG起始密碼子的間插內含子RNA。從而避免任何與在轉錄起始位點和IFNA2編碼序列之間具有不需要的AUG翻譯起始密碼子的轉錄物相關的問題。當然,可以在一步中引入所述調節區、外顯子、剪接供體位點和剪接受體位點來代替。在此實施方案中使用的DNA構建物包含調節區、外顯子、剪接供體位點、內含子、剪接受體位點、與在正確的IFNA2起始密碼子和不需要的ATG密碼子之間的基因組位點同源的導向序列,以及可選地包括一個或多個選擇性標記。另一方面,可以使用兩個單獨的導向構建物,其中一個包含所述調節區、所述外顯子和所述剪接供體位點,而另一個包含所述剪接受體位點。可以將這兩個構建物在一步中引入到靶細胞中。DNA構建物本發明的DNA構建物至少包括導向序列和調節序列。它還可以包括外顯子;或外顯子和剪接供體位點;或外顯子、剪接供體位點、內含子和剪接受體位點。在所述構建物中,如果所述外顯子存在,則在所述調節序列的3′,而如果所述剪接供體位點存在,則在所述外顯子的3′端。如果存在所述內含子和所述剪接受體位點,則在所述剪接供體位點的3′。另外,在所述構建物中可以有多個外顯子和內含子(以及合適的剪接供體和受體位點)。在所述構建物中的DNA被認為是外源,因為該DNA不是宿主細胞基因組的原始部分。外源DNA可以具有與在通過病毒載體轉染或感染之前的細胞中存在的部分內源基因組DNA相同或不同的序列。本文使用的「轉染」是指通過非病毒(例如化學或物理)方法,諸如磷酸鈣或氯化鈣共沉澱、DEAE-葡聚糖介導的轉染、脂質轉染、電穿孔、微注射、微粒轟擊或biolistic介導的吸收,將質粒引入到細胞中。「感染」是指通過病毒感染將病毒載體引入到細胞中。在下文詳細描述了包括於本發明的DNA構建物中的各種元件。
所述DNA構建物還可以包括順式作用或反式作用病毒序列(例如包裝信號),從而能夠將所述構建物經病毒載體感染傳遞到細胞的核中。必要時,所述DNA構建物可以由病毒生活周期的各步(諸如在逆轉錄病毒中整合酶介導的整合或附加體維持)中脫離出來。通過病毒序列的合適的缺失或突變,諸如在逆轉錄病毒載體中整合酶編碼區的缺失,可以實現脫離。關於所述構建物的其它細節和病毒載體的用途見於Robbins等人,Pharmacol.Ther.80:35-47,1998;和Gunzburg等人,Mol.Med.Today 1:410-417,1995,通過引用結合到本文中。導向序列導向序列使得目的序列同源重組到在宿主基因組中選定位點。導向序列與其各自在宿主基因組中的靶位點同源(即能夠與其同源重組)。
環狀DNA構建物可以使用一個導向序列,或兩個或兩個以上單獨的導向序列。線性DNA構建物可以包含兩個或兩個以上單獨的導向序列。與已知的導向序列同源的靶位點可以位於IFNA2基因的編碼區內、位於所述編碼區的上遊並緊接所述編碼區或位於所述編碼區的上遊並距所述編碼區有一段距離。
在所述構建物中的兩個導向序列的第一個(或者如果在該構建物中只有一個導向序列,則是完整導向序列)得自新近公開的IFNA2編碼序列的上遊基因組區。此導向序列例如包含SEQ ID NO:12的一部分(例如20或更多個連續的核苷酸)、SEQ ID NO:7、8或13的一部分。
在所述構建物中的兩個導向序列的第二個可以引導所述編碼序列的上遊基因組區或引導所述編碼序列自身的部分或全部。作為實例,第二個導向序列可以在其3′末端含有與IFNA2編碼序列的最初幾個密碼子相同的「外源」編碼區。在同源重組時,所述外源編碼區與內源IFNA2編碼序列的目標部分重組。如果需要,所述外源編碼區可以編碼異源胺基酸序列,只要所述外源編碼區與它替代的內源編碼區保持足夠的同源性,以能夠同源重組。
所述導向序列另外可以包括得自以前公開的IFNA2基因區的序列,包括本文描述的那些區,以及在構建物上未特徵鑑定但本領域技術人員可以作出圖譜的上遊更遠的區。
可以利用基因組片段與包含全部或部分SEQ ID NO:12的探針雜交的能力鑑定用作導向序列的所述基因組片段。所述探針可使用得自SEQ ID NO:12的引物經PCR產生。調節序列所述DNA構建物的調節序列可以包含一個或多個啟動子(例如組成型啟動子、組織特異性啟動子或誘導型啟動子)、增強子、支架結構連接區或基質附著部位、負調節元件、轉錄因子結合部位,或這些元件的組合。
所述調節序列可以得自真核生物(例如哺乳動物)或病毒基因組。有用的調節序列包括但不限於調節SV40早期或晚期基因、巨細胞病毒基因和腺病毒主要晚期基因表達的那些調節序列。它們還包括得自編碼小鼠金屬硫蛋白-Ⅰ、延伸因子-1α、膠原蛋白(例如膠原蛋白Ⅰα1、膠原蛋白Ⅰα2和膠原蛋白Ⅳ)、肌動蛋白(例如γ-肌動蛋白)、免疫球蛋白、HMG-輔酶A還原酶、甘油醛磷酸脫氫酶、3-磷酸甘油酸激酶、膠原酶、溶基質素、纖連蛋白、波形蛋白、纖溶酶原激活物抑制劑Ⅰ、胸腺素β4、組織金屬蛋白酶抑制劑、核糖體蛋白、主要組織相溶性複合體分子和人淋巴細胞抗原的基因的調節區。
所述調節序列最好包含轉錄因子結合部位,諸如TATA框、CCAAT框、AP1、Sp1或NF-κB結合部位。標記基因如果需要,所述構建物可以包括編碼目的多肽、操作性連接至其自身啟動子的序列。其實例應為選擇性標記基因,它可用來易化對導向事件的鑑別。也可以包括可擴增的標記基因,它用來易化對具有共擴增的側翼DNA序列的細胞的選擇。可以通過在選擇表達可擴增基因的介質存在下培養,鑑別包含擴增拷貝的可擴增標記基因的細胞。活化的內源IFNA2基因將同擴增的選擇性標記基因串聯擴增。包含多拷貝活化內源基因的細胞可以產生很高水平的IFNA2,並因此用於體外產生蛋白和基因治療。
選擇性標記基因和可擴增的標記基因互相之間不必處於緊接狀態。可擴增的標記基因和選擇性標記基因可以是相同的基因。一個或兩個所述標記基因可以位於所述DNA構建物的內含子中。在美國專利第5,641,670中描述了合適的可擴增的標記基因和選擇性標記基因。剪接供體位點和剪接受體位點所述DNA構建物可以進一步包含外顯子、在所述外顯子的3′末端的剪接供體位點、內含子和剪接受體位點。
剪接供體位點是一種序列,它控制將RNA轉錄物的一個外顯子剪接至該轉錄物的另一個外顯子的剪接受體位點,從而除去在所述兩個位點之間的內含子。通常,第一個外顯子位於第二個外顯子的5′,而位於第一個外顯子的3′末端的所述剪接供體位點與位於第二個外顯子5′側的剪接受體位點匹配。剪接供體位點具有表徵為(A/C)AGGURAGU(其中R表示嘌呤核苷酸)的共有序列,GU必須在第4和第5位(Jackson,Nucleic Acids Research 19:3715-3798,1991)。所述剪接供體共有位點的前三個鹼基是所述外顯子的後三個鹼基即它們未被剪除。剪接供體位點的功能定義為其對在mRNA剪接途徑中合適反應的影響能力。
在本發明構建物中的剪接受體位點與剪接供體位點一起,控制將一個外顯子剪接至另一個外顯子。剪接受體位點具有表徵為(Y)10NYAG(SEQ ID NO:10)的序列,其中Y表示任何嘧啶,而N表示任何核苷酸(Jackson,Nucleic Acids Research 19:3715-3798,1991)。加帽位點所述DNA構建物可以可選地包含加帽位點。加帽位點是與所述調節區有關並由其使用的特異性轉錄起始位點。此加帽位點在所述構建物中位於相對於所述調節序列的位置,以便同源重組後,所述調節序列控制在所述加帽位點開始合成轉錄物。另一方面,在所述構建物中不包括加帽位點,轉錄裝置將由於缺乏合適的位點而定位於用作加帽位點的靶基因中。另外的DNA元件所述構建物可以另外包含影響通過同源重組產生的RNA或蛋白的構建物或穩定性的序列。所述DNA構建物可選地可以包括細菌複製起點和細菌抗生素抗性標記或其它的選擇性標記,便於它們在細菌或任何其它合適的克隆/宿主系統中大規模繁殖質粒。
所述DNA構建物的所有上述元件互相之間都可操作性連接或以功能方式排列。即在所述構建物和靶基因組DNA之間同源重組時,所述調節序列可以操縱初級RNA轉錄物的生產,所述初級RNA轉錄物起始於加帽位點(可選地包括在所述構建物中),並包括位於所述加帽位點和內源IFNA2基因轉錄終止位點之間的序列。根據所述加帽位點的位置,該序列的部分可以包括IFNA2基因內源調節區以及鄰近該區的通常未被轉錄的序列。如果在所述構建物中存在外顯子、剪接供體位點和剪接受體位點,則所述初級轉錄物也包括所述外顯子、所述兩個剪接位點和在這兩個位點之間的所述內含子。
在所述DNA構建物中元件的順序可以改變。當所述構建物是環狀質粒或病毒載體時,在產生的結構中元件的相對順序例如可以是導向序列、質粒DNA(包含在微生物和其它適合的宿主中用於選擇和/或複製導向質粒的序列)、選擇性標記、調節序列、外顯子、剪接供體位點、內含子和剪接受體位點。
當所述構建物為線性時,該順序例如可以是第一個導向序列、選擇性標記基因、調節序列、外顯子、剪接供體位點、內含子、剪接受體位點和第二個導向序列;或為另一種順序第一個導向序列、調節序列、外顯子、剪接供體位點、內含子、剪接受體位點、選擇性標記基因、可選的內部核糖體進入位點和第二個導向序列。
另一方面,所述順序可以是第一個導向序列、第一個選擇性標記基因、調節序列、外顯子、剪接供體位點、內含子、剪接受體位點、第二個導向序列和第二個選擇性標記基因;或為第一個導向序列、調節序列、外顯子、剪接供體位點、內含子、剪接受體位點、第一個選擇性標記基因、第二個導向序列和第二個選擇性標記基因。在位於所述第一個選擇性標記側翼的導向序列和在宿主基因組中的同源序列之間的重組導致對所述第一個選擇性標記的目的整合,而所述第二個選擇性標記未被整合。目的轉染或感染的細胞是那些用第一個選擇性標記而不是第二個選擇性標記穩定轉染或感染的細胞。可以通過在包含選擇表達第一個標記的介質和選擇抗第二個標記的另一種介質的培養基中生長,選擇這樣的細胞。預計已通過非同源重組機制不正確整合導向構建物的轉染或感染的細胞應表達所述第二個標記基因,從而在所選擇培養基中被殺死。
有時在所述構建物中包括正選擇性標記,以便於選擇包含擴增拷貝的該標記的細胞。在此實施方案中,構建物元件的順序例如可以是第一個導向序列、可擴增的正選擇性標記、第二個選擇性標記(可選)、調節序列、外顯子、剪接供體位點、內含子、剪接受體位點和第二個導向DNA序列。
所述構建物的各種元件可以由天然來源(例如基因組DNA)獲得,或者可以使用基因工程技術或合成方法產生。所述構建物的調節區、加帽位點、剪接供體位點、內含子、剪接受體位點可以作為完整單元由例如人延伸因子-1α(GenBank序列HUMEF1A)基因或巨細胞病毒(GenBank序列HEHCMVP1)立即早期區中分離。這些元件還可以由單獨的基因分離。轉染或感染和同源重組可以將本發明的DNA構建物作為單個DNA構建物或作為單獨的DNA序列加入到轉染或感染細胞的染色體或核DNA中,引入到諸如初級細胞、次級細胞或無限增殖化細胞的細胞中。所述「轉染細胞」是指通過非使用病毒載體的方法將DNA或RNA分子引入到其中(或其祖細胞中)的細胞。所述「感染細胞」是指使用病毒載體將DNA或RNA分子引入到其中(或其祖細胞中)的細胞。已知用作載體的病毒包括腺病毒、腺伴隨病毒、皰疹病毒、腮腺炎病毒、脊髓灰質炎病毒、慢病毒、逆轉錄病毒、Sindbis病毒和諸如金絲雀痘病毒的牛痘病毒。所述DNA可以作為線性、雙鏈(在一個或兩個末端具有或不具有單鏈區)、單鏈或環狀分子引入。當將所述構建物以兩個獨立的DNA片段引入到宿主細胞中時,所述兩個片段在一個片段的3′末端和在另一個片段的5′末端具有DNA序列同源性(重疊),同時一個片段具有第一個導向序列,而另一個片段具有第二個導向序列。當引入到細胞中時,所述兩個片段可以進行同源重組,以形成具有第一個和第二個導向序列的單個分子,該分子位於在原來兩個片段之間的重疊區側翼。於是產物分子的形式適於和細胞靶位點同源重組。可以使用多於兩個的片段,設計它們中的每一個,以使它們互相之間進行同源重組,最終形成適於同如上所述的細胞靶位點同源重組的產物。
本發明的DNA構建物如果自身不含有選擇性標記,則其可與包含這種標記的另一個構建物共轉染或共感染。可以用限制酶在一個或多個位點切割導向質粒,以在轉染或感染前產生線性或有間隙的分子。產生的游離DNA末端增加了目的同源重組事件的發生頻率。此外,可以用外切核酸酶處理所述游離的DNA末端,以產生突出的5′或3′單鏈DNA末端(例如至少30個核苷酸長,最好100-1000個核苷酸長),增加目的同源重組事件的發生頻率。在此實施方案中,在所述導向序列和基因組靶之間的同源重組將產生兩個拷貝所述導向序列,位於包含在引入的質粒中的元件側翼。
可以通過各種物理或化學方法,包括電穿孔、微注射、微粒轟擊、磷酸鈣沉澱、脂質體傳遞或聚凝胺(Polybrene)或DEAE葡聚糖介導的轉染,(最好在體外)將所述DNA構建物轉染到細胞中。
如本領域所述,將轉染或感染的細胞保持在允許同源重組的條件下(參閱例如Capecchi,Science 24:1288-1292,1989)。當將所述同源重組細胞保持在足以允許所述DNA轉錄的條件下時,由所述DNA構建物引入的調節區將改變IFNA2基因的轉錄。
可以通過表型篩選或通過用針對IFNA2的酶聯免疫吸附測定(ELISA)分析培養上清液,鑑定同源重組細胞(即已進行目的同源重組的細胞)。可由Biosource International(Camarillo,CA)獲得檢測IFNA2的市售ELISA試劑盒。還可以通過DNA和RNA印跡分析或通過聚合酶鏈式反應(PCR)篩選,鑑定同源重組細胞。
本文使用的術語「初級細胞」包括(ⅰ)存在於分離自脊椎動物組織源的細胞懸浮液中的細胞(在它們貼壁之前,即粘附到在諸如碟或燒瓶中的組織培養支持底物之前),(ⅱ)存在於得自組織的外植塊中的細胞,(ⅲ)第一次貼壁培養的細胞,和(ⅳ)由這些貼壁培養細胞產生細胞懸浮液。初級細胞也可以是在人或動物中天然產生的細胞。
次級細胞是在隨後的所有步驟培養的細胞。即從培養支持底物除去第一次貼壁培養的初級細胞並再次平板培養(傳代細胞),本文將它們稱為次級細胞,包括在隨後傳代中的所有細胞。次級細胞株包括已經傳代一次或幾次的次級細胞。通常次級細胞在培養中具有有限數目的平均群體倍增,並具有接觸抑制、貼壁依賴性生長的特性(貼壁依賴性不適用於在懸浮培養中繁殖的細胞)。初級和次級細胞不是無限增殖的。
無限增殖化細胞是在培養中具有明顯地非限制性生命期的細胞系(與細胞株相反,所述定義「株」專用於初級和次級細胞)。
選擇性用於轉染或感染的細胞可以分為四種類型或四類(ⅰ)獲得的產生或包含不超過痕量的IFNA2蛋白的細胞,(ⅱ)產生或包含蛋白的細胞,但蛋白量不同於所需的量(諸如其量低於所獲得的細胞類型生理正常的水平),(ⅲ)在所獲得的細胞類型以生理正常的水平產生所述蛋白的細胞,但其含量或產量可增大或增強,和(ⅳ)需要改變其中的編碼所述蛋白的基因的調節或誘導形式的細胞。
通過本發明方法轉染或感染的初級、次級和無限增殖化細胞可以由各種組織獲得並包括可以在培養中保持的所有合適的細胞類型。例如,合適的初級和次級細胞包括成纖維細胞、角質形成細胞、上皮細胞(例如乳房上皮細胞、腸上皮細胞)、內皮細胞、神經膠質細胞、神經細胞、血液的組成成分(例如淋巴細胞、骨髓細胞)、肌細胞和這些體細胞類型的前體。當要在基因治療中使用所述同源重組細胞時,最好由要給予轉染或感染初級或次級細胞的個體獲得初級細胞。然而,可以由上述物種的供體(即不是受體的個體)獲得初級細胞。
用於蛋白產生或基因治療的無限增殖化人細胞系的實例包括但不限於,2780AD卵巢癌細胞(Van der Blick等,Cancer Res.,48:5927-5932,1988)、A549(美國典型培養物保藏中心(「ATCC」)CCL185)、BeWo(ATCC CCL 98)、Bowes黑素瘤細胞(ATCC CRL9607)、CCRF-CEM(ATCC CCL 119)、CCRF-HSB-2(ATCC CCL120.1)、COLO201(ATCC CCL 224)、COLO205(ATCC CCL 222)、COLO320DM(ATCC CCL 220)、COLO 320HSR(ATCC CCL 220.1)、Daudi細胞(ATCC CCL 213)、Detroit 562(ATCC CCL 138)、HeLa細胞及HeLa細胞衍生物(ATCC CCL 2、2.1和2.2)、HCT116(ATCCCCL 247)、HL-60細胞(ATCC CCL 240)、HT1080細胞(ATCC CCL121)、IMR-32(ATCC CCL 127)、Jurkat細胞(ATCC TIB 152)、K-562白血病細胞(ATCC CCL 243)、KB癌細胞(ATCC CCL 17)、KG-1(ATCC CCL 246)、KG-1a(ATCC CCL 246.1)、LS123(ATCC CCL255)、LS174T(ATCC CCL CL-188)、LS180(ATCC CCL CL-187)、MCF-1乳癌細胞(ATCC BTH 22)、MOLT-4細胞(ATCC CRL 1582)、Namalwa細胞(ATCC CRL 1432)、NCI-H498(ATCC CCL 254)、NCI-H508(ATCC CCL 253)、NCI-H548(ATCC CCL 249)、NCI-H716(ATCC CCL 251)、NCI-H747(ATCC CCL 252)、NCI-H1688(ATCC CCL 257)、NCI-H2126(ATCC CCL 256)、Raji細胞(ATCC CCL 86)、RD(ATCC CCL 136)、RPMI 2650(ATCC CCL30)、RPMI 8226細胞(ATCC CCL 155)、SNU-C2A(ATCC CCL250.1)、SNU-C2B(ATCC CCL 250)、SW-13(ATCC CCL 105)、SW48(ATCC CCL 231)、SW403(ATCC CCL 230)、SW480(ATCCCCL 227)、SW620(ATCC CCL 227)、SW837(ATCC CCL 235)、SW948(ATCC CCL 237)、SW1116(ATCC CCL 233)、SW1417(ATCCCCL 238)、SW1463(ATCC CCL 234)、T84(ATCC CCL 248)、U-937細胞(ATCC CRL 1593)、WiDr(ATCC CCL 218)和WI-38VA13亞系2R4細胞(ATCC CCL 75.1)以及通過融合人細胞和其它物種的細胞產生的異種雜交瘤細胞。可以使用次級人成纖維細胞株,諸如WI-38(ATCC CCL 75)和MRC-5(ATCC CCL 171)。此外,初級、次級或無限增殖化人細胞,以及來自其它物種的初級、次級或無限增殖化細胞,可以用於體外產生蛋白或基因治療。表達IFNA-2的細胞本發明的同源重組細胞在所需的水平上表達IFNA2,並用於體外產生IFNA2和基因治療。產生蛋白按照本發明的同源重組細胞可以用於體外生產IFNA2。所述細胞保持在本領域描述的導致表達蛋白的條件下。可以由細胞裂解物或細胞上清液中純化所述IFNA2蛋白。可以通過本領域已知的常規藥物途徑(例如口服、靜脈內、肌內、鼻內、肺、跨黏膜、皮內、直腸、鞘內、經皮膚、皮下、腹膜內或病灶內),將包含所述IFNA2蛋白的藥用組合物傳遞給人或動物。口服給予可能需要採取保護蛋白以免在胃腸道降解的措施例如包囊在聚合的微囊中。基因治療本發明的同源重組細胞用作同源重組細胞系群、同源重組初級或次級細胞群、同源重組克隆細胞株或細胞系、同源重組異源細胞株或細胞系以及細胞混合物,在該混合物中至少存在一種代表前述四類同源重組細胞之一的細胞。這些細胞可在傳遞體系中用於治療(ⅰ)由諸如乳頭瘤病毒、B型肝炎和C型肝炎病毒、牛痘、單純皰疹病毒、水痘樣帶狀皰疹病毒和鼻病毒的病毒引起的感染,和(ⅱ)任何其它可用IFNA2治療的病症。
將同源重組初級細胞、克隆細胞株或異源細胞株以足夠的量通過合適的途徑,給予需要治療或預防異常或不良症狀的個體,以表達或產生在生理學相關水平上有效的蛋白或外源DNA。生理學相關水平接近體內通常產生所述產物的水平或為導致異常或不良症狀改善的水平。如果所述細胞與具有免疫能力的受體同源,則所述細胞可以靜脈內、動脈內、皮下、腹膜內、網膜內、腎下囊(subrenal capsularly)、鞘內、顱內或肌內給予或植入。
如果所述細胞不同源而所述受體具有免疫能力,則可以將要給予的所述同源重組細胞封入一個或多個半透性屏障裝置中。所述裝置的滲透性特性使得在將所述細胞植入到受治療者中時防止其離開所述裝置,但治療性蛋白可以自由透過,並可以離開所述屏障裝置進入植入體附近的局部區域或進入體循環。參見例如美國專利第5,641,670、5,470,731、5,620,883、5,487,737號和1999年4月16日提交的標題為「治療性蛋白的傳遞」的共有美國專利申請(發明人Justin C,Lamsa和Douglas A.Treco),所有這些文獻都通過引用結合到本文中。所述屏障裝置可以在任何合適的位置植入例如腹膜內、鞘內、皮下、肌內、腎囊內或網膜內。
屏障裝置特別有用,使得可以植入同源重組無限增殖化細胞、來自其它物種的同源重組細胞(同源重組異種細胞)或來自非組織相容性匹配供體的細胞(同源重組同種異體細胞)治療患者。所述裝置將細胞保留在體內的固定位置,同時保護所述細胞免受宿主免疫系統的排斥。當治療方案由於任一原因要停止時,屏障裝置還通過使所述細胞立即去除,提供方便的短期(即瞬時)治療。在沒有用於短期基因治療的屏障裝置的情況下,也可以使用轉染或感染的異種細胞和同種異體細胞。在此情況下,將在體內傳遞由所述細胞產生的IFNA2,直至宿主的免疫系統排斥所述細胞為止。
為此目的可以使用許多合成、半合成或天然的濾膜,包括但不限於纖維素、乙酸纖維素、硝化纖維、聚碸、聚偏二氟乙烯、聚氯乙烯聚合物和聚氯乙烯衍生物的聚合物。可以使用屏障裝置,以使得來自其它物種的初級、次級或無限增殖化細胞用於對人的基因治療。
用於本發明的基因治療的另一類裝置是其中嵌入所述細胞的可植入的膠原基質。在WO 97/15195中描述了這種可以包含將所述細胞附著於微珠上的裝置,該文獻通過引用結合到本文中。所述裝置可以如上所述植入。
給予劑量或植入需要的細胞的數量取決於幾種因素,包括所述蛋白的表達水平、宿主動物的大小和狀態以及與植入方法相關的限制。通常在成年人或其它類似大小的動物中植入的細胞的數量在1×104至5×1010的範圍內,最好為1×108至1×109。如果需要,它們可以在患者的多個部位同時或者在幾個月或幾年的時間內植入。所述劑量可以根據需要重複。保藏根據國際承認用於專利程序的微生物保存布達佩斯條約的條款,質粒pA2HB於1998年5月12日保藏在美國典型培養物保藏中心(ATCC),Rockville,MD,美國。獲得的保藏號為209872。
申請人的代理機構Transkaryotic Therapies,Inc.表示ATCC是提供永久保藏的保藏單位,並且如果專利獲得批准,則公眾立即可以由該單位獲得保藏物。一旦批准了專利,則所有關於公眾獲得如此保藏的物質的限制都不可挽回地被取消。在專利未決期間,專利局局長根據37 CFR 1.14和35 U.S.C.§122的授權確定的人將可獲得所述物質。對保藏物質的保藏必須非常注意,以在提供保藏物質樣品的最近要求之後至少5年,並在任何情況下,在保藏日後至少30年或在專利實施期內(無論哪個時間都更長)保持其存活並不受汙染。申請人的代理機構承認他們的責任是,如果要求提供樣品時由於所述保藏物的情況保藏機構不能提供樣品,則更換所述保藏物。
其它實施方案應當理解,雖然已經描述了本發明及其詳述,但先前的描述意在說明,並不限制由所附權利要求書的範圍確立的本發明的範圍。
其它方面、優勢和修改在以下權利要求書的範圍內。
序列表110Transkaryotic Therapies Inc.120用於產生和傳遞蛋白的基因組序列13007236/018WO1150US 60/086,5551511998年5月21日150US 60/084,6481511998年5月7日16019170FastSEQ for Windows,版本3.021012111733212DNA213Homo sapiens4001gcgcctctta tgtacccaca aaaatctatt ttcaaaaaag ttgctctaag aatatagtta 60tcaagttaag taaaatgtca atagcctttt aatttaattt ttaattgttt tatcattctt 120tgcaataata aaacattaac tttatacttt ttaatttaat gtatagaata gagatataca 180taggatatgt aaatagatac acagtgtata tgtgattaaa atataatggg agattcaatc 240agaaaaaagt ttctaaaaag gctctggggt aaaagaggaa ggaaacaata atgaaaaaaa 300tgtggtgaga aaaacagctg aaaacccatg taaagagtgt ataaagaaag caaaaagaga 360agtagaaagt aacacagggg catttggaaa atgtaaacga gtatgttccc tatttaaggc 420taggcacaaa gcaaggtctt cagagaacct ggagcctaag gtttaggctc acccatttca 480accagtctag cagcatctgc aacatetaca atggccttga cctttgcttt actggtggcc 540ctcctggtgc tcagctgcaa gtcaagctgc tctgtgggct gtgatctgcc tcaaacccac 600agcctgggta gcaggaggac cttgatgctc ctggcacaga tgaggagaat ctctcttttc 660tcctgcttga aggacagaca tgactttgga tttccccagg aggagtttgg caaccagttc 720caaaaggctg aaaccatccc tgtcctccat gagatgatcc agcagatctt caatctcttc 780agcacaaagg actcatctgc tgcttgggat gagaccctcc tagacaaatt ctacactgaa 840ctctaccagc agctgaatga cctggaagcc tgtgtgatac agggggtggg ggtgacagag 900actcccctga tgaaggagga ctccattctg gctgtgagga aatacttcca aagaatcact 960ctctatctga aagagaagaa atacagccct tgtgcctggg aggttgtcag agcagaaatc 1020atgagatctt tttctttgtc aacaaacttg caagaaagtt taagaagtaa ggaatgaaaa 1080ctggttcaac atggaaatga ttttcattga ttcgtatgcc agctcacctt tttatgatct 1140gccatttcaa agactcatgt ttctgctatg accatgacac gatttaaatc ttttcaaatg 1200tttttaggag tattaatcaa cattgtattc agctcttaag gcactagtcc cttacagagg 1260accatgctga ctgatccatt atctatttaa atatttttaa aatattattt atttaactat 1320ttataaaaca acttattttt gttcatatta tgtcatgtgc acctttgcac agtggttaat 1380gtaataaaat gtgttctttg tatttggtaa atttattttg tgttgttcat tgaacttttg 1440ctatggaact tttgtacttg tttattcttt aaaatgaaat tccaagccta attgtgcaac 1500ctgattacag aataactggt acacttcatt tgtccatcaa tattatattc aagatataag 1560taaaaataaa ctttctgtaa accaagttgt atgttgtact caagataaca gggtgaacct 1620aacaaataca attctgctct cttgtgtatt tgatttttgt atgaaaaaaa ctaaaaatgg 1680taatcatact taattatcag ttatggtaaa tggtatgaag agaagaagga acg17332102211188212蛋白213Homo sapiens4002Met Ala Leu Thr Phe Ala Leu Leu Val Ala Leu Leu Val Leu Ser Cys1 5 10 15Lys Ser Ser Cys Ser Val Gly Cys Asp Leu Pro Gln Thr His Ser Leu20 25 30Gly Ser Arg Arg Thr Leu Met Leu Leu Ala Gln Met Arg Arg Ile Ser35 40 45Leu Phe Ser Cys Leu Lys Asp Arg His Asp Phe Gly Phe Pro Gln Glu50 55 60Glu Phe Gly Asn Gln Phe Gln Lys Ala Glu Thr Ile Pro Val Leu His65 70 75 80Glu Met Ile Gln Gln Ile Phe Asn Leu Phe Ser Thr Lys Asp Ser Ser85 90 95Ala Ala Trp Asp Glu Thr Leu Leu Asp Lys Phe Tyr Thr Glu Leu Tyr100 105 110Gln Gln Leu Asn Asp Leu Glu Ala Cys Val Ile Gln Gly Val Gly Val115 120 125Thr Glu Thr Pro Leu Met Lys Glu Asp Ser Ile Leu Ala Val Arg Lys130 135 140Tyr Phe Gln Arg Ile Thr Leu Tyr Leu Lys Glu Lys Lys Tyr Ser Pro145 150 155 160Cys Ala Trp Glu Val Val Arg Ala Glu Ile Met Arg Ser Phe Ser Leu165 170 l75Ser Thr Asn Leu Gln Glu Ser Leu Arg Ser Lys Glu180 185210 3211 24212 DNA213 Homo sapiens4003agtttctaaa aaggctctgg ggta24210 4211 19212 DNA213 Homo sapiens400 4gcccacagag cagcttgac 19210 5211 25212 DNA213 Homo sapiens400 5aaagactcat gtttctgcta tgacc 25210 6211 24212 DNA213 Homo sapiens400 6ggtgcacatg acataatatg aaca24210 7211 278212 DNA213 Homo sapiens400 7aagcttttat aggtgtaaat tttccactta gtactgcttt tgtaatgttg tctttttatt 60ttcatttatc tcaagatgtt ttctaatttc tcttgacttc cttcttaaat tcttacctca 120tgtagacata catttttggc cctatgcatt gggatgcaaa accagactaa tttactttgt 180acaaaaagaa aaatgagaaa gaaatatatt tggtcttgtg agcactatat ggaaatactt 240tatattccat ttgtttcatc atattcatat atcccttt 278210 8211 73212 DNA213 Homo sapiens400 8cattggatac tccatcacct gctgtgatat tatgaatgtc tgcctatata aatattcact 60attccataac aca 73210 9211 1806212 DNA213 Homo sapiens400 9cattggatac tccatcacct gctgtgatat tatgaatgtc tgcctatata aatattcact 60attccataac acagcgcctc ttatgtaccc acaaaaatct attttcaaaa aagttgctct 120aagaatatag ttatcaagtt aagtaaaatg tcaatagcct tttaatttaa tttttaattg 180ttttatcatt ctttgcaata ataaaacatt aactttatac tttttaattt aatgtataga 240atagagatat acataggata tgtaaataga tacacagtgt atatgtgatt aaaatataat 300gggagattca atcagaaaaa agtttctaaa aaggctctgg ggtaaaagag gaaggaaaca 360ataatgaaaa aaatgtggtg agaaaaacag ctgaaaaccc atgtaaagag tgtataaaga 420aagcaaaaag agaagtagaa agtaacacag gggcatttgg aaaatgtaaa cgagtatgtt 480ccctatttaa ggctaggcac aaagcaaggt cttcagagaa cctggagcct aaggtttagg 540ctcacccatt tcaaccagtc tagcagcatc tgcaacatct acaatggcct tgacctttgc 600tttactggtg gccctcctgg tgctcagctg caagtcaagc tgctctgtgg gctgtgatct 660gcctcaaacc cacagcctgg gtagcaggag gaccttgatg ctcctggcac agatgaggag 720aatctctctt ttctcctgct tgaaggacag acatgacttt ggatttcccc aggaggagtt 780tggcaaccag ttccaaaagg ctgaaaccat ccctgtcctc catgagatga tccagcagat 840cttcaatctc ttcagcacaa aggactcatc tgctgcttgg gatgagaccc tcctagacaa 900attctacact gaactctacc agcagctgaa tgacctggaa gcctgtgtga tacagggggt 960gggggtgaca gagactcccc tgatgaagga ggactccatt ctggctgtga ggaaatactt 1020ccaaagaatc actctctatc tgaaagagaa gaaatacagc ccttgtgcct gggaggttgt 1080cagagcagaa atcatgagat ctttttcttt gtcaacaaac ttgcaagaaa gtttaagaag 1140taaggaatga aaactggttc aacatggaaa tgattttcat tgattcgtat gccagctcac 1200ctttttatga tctgccattt caaagactca tgtttctgct atgaccatga cacgatttaa 1260atcttttcaa atgtttttag gagtattaat caacattgta ttcagctctt aaggcactag 1320tcccttacag aggaccatgc tgactgatcc attatctatt taaatatttt taaaatatta 1380tttatttaac tatttataaa acaacttatt tttgttcata ttatgtcatg tgcacctttg 1440cacagtggtt aatgtaataa aatgtgttct ttgtatttgg taaatttatt ttgtgttgtt 1500cattgaactt ttgctatgga acttttgtac ttgtttattc tttaaaatga aattccaagc 1560ctaattgtgc aacctgatta cagaataact ggtacacttc atttgtccat caatattata 1620ttcaagatat aagtaaaaat aaactttctg taaaccaagt tgtatgttgt actcaagata 1680acagggtgaa cctaacaaat acaattctgc tctcttgtgt atttgatttt tgtatgaaaa 1740aaactaaaaa tggtaatcat acttaattat cagttatggt aaatggtatg aagagaagaa 1800ggaacg1806210 10211 4090212 DNA213 Homo sapiens400 10aagcttttat aggtgtaaat tttccactta gtactgcttt tgtaatgttg tctttttatt 60ttcatttatc tcaagatgtt ttctaatttc tcttgacttc cttcttaaat tcttacctca 120tgtagacata catttttggc cctatgcatt gggatgcaaa accagactaa tttactttgt 180acaaaaagaa aaatgagaaa gaaatatatt tggtcttgtg agcactatat ggaaatactt 240tatattccat ttgtttcatc atattcatat atccctttac taacataaag ctgaaggtga 300ataaaaaaat cagggttagc caaacaaatt ttcatggtca aataccacat aaaaagtaaa 360tatacttaag ttcccagcaa aatctgaatt gaacgtagac aaaatgctca tttctcagtg 420tttgacagac ttaacagttt gagccaataa aaatgtactg actagataaa ctactaaaag 480ttgttaattt ttgcaatgta tatttctgaa aagaaagttt atctattata gaaattcctg 540tgcccattta agaactttga gcattttaat tgtttaataa tatagtttaa ttgcatcatg 600aaaataatca ataatacaat ttatttggtt tatttaaaaa aactgattct ttctgctctc 660tctatatata gactgatttt atactaatgt tgcctaaaga tcaccaaatt gtttgaagcc 720taggtttctg agggatggaa aatgatgtca caactattta cagttcacac acacattctg 780gggatttaat acatccttta caagtgcagg aaaggtggaa gattgatgat ttgggggaat 840tagagctacc acaccccaga gggtggtatg gtatgttgtc tgttgtgagc tgtgtgaatc 900agagagtttg atttagacat atatttagaa agaggaaaga tgaaccaatc aaaaataata 960actataatga cttttcaaga tatagacaat acagttaaga tataaatgga aacaaaaaaa 1020gttaaaagtg gggagatgaa gtctgatttt ttggtttttt tttttttttg cttttttgtt 1080tgtttatgta atcagtgtta ccagtttaaa ataatgggtt ataagacact atatgcaagc 1140ctcatggtaa cctccaatct aaaacataca acaaatacac acaaaataaa aaggagaaat 1200taaaacacac caccagagaa aatcacctac attaaaagaa agacaaatag gaagaaaata 1260agaaagagaa ggccatcaaa taatcagaaa atgaataaca aaatgacagg aataagtcct 1120cataaataat aacattgaat gtaaatggac taagctctcc aatgaaagac agggagtggc 1380tgaatgtatt ttaaaaaaaa tattacaccg agctgtgcgt ggtgtctcac acctataatc 1440ccagcatttt gggagactga gccgggtgga tcacttgagc ccaggagttc gagaccagcc 1500tggccaacat ggcaaaaccc tgtctctact aaaaatacaa aaaattagct gaacatggtg 1560gcacatgcct gtggttccag ctactagaga ggctgaggca gaagaattgc ttgaacttgg 1620gaggtggagg ttgcagtgag ctaagattga tggagccact gcaccccagc ctaggtgaca 1680gaataagact ctgcctcaaa aaaaaaaagc aaaacaaaac aaaacaaaaa acccttagac 1740ccaatgattc attgcctaca agaagtatgc ttcaccttta aagacacata tagactgaag 1800gtaaagggat ggaaaaatat tctatgccta tggaaacaaa caaaaagaag cagaagctac 1860atttatatca gacaaaatag actgcaagac aaaaactatg aaaagagaga aagaaggtca 1920ttatatagtg ataaaggggt ccatttagca agagcattta acaattctaa atatatattc 1980acccaatact ggagtactca ggtatataaa gcaaatatta ttagagccaa agagagagat 2040agacagaccc ccatacaata ataactggag acttcaacac cccactttca gcattggaca 2100gatcatccag acagaaaatt aacaaacatc aaatttcatc tgcaccatag gtcaaatgga 2160cctagtagat atttacagaa catttgatcc aacagctgta gaatacacat tcttctcctc 2220agcacatgga taattctcaa ggatatacca aatgctaggt cacaaaacaa atcttaaaat 2280ttagaaaaaa agtgaaataa tatcaaacgt tttctctcac cacagactaa gaaaaaaaga 2340agtcccaaat aaatacaatc tgagataaaa aaggagacga gacaaccaat accacaaaaa 2400attaaaggat cattagaaga tactatgaaa ctatatgcta ataaattgga aaacctgaac 2460aaaatagata attcctagaa acatacaaca tactggtctg ttcaggtttt gtattttttc 2520atagtaccat gaagaaatac aagaattgtt tctagaacca ttcttgtatt tcttcatggt 2580ttttgtattt cttcatggaa ccatgaagaa atacaaaatg tgaacaggcc aataacaagt 2640aatgagacag aagccatact aaaaagtatc ccagaaaaga actcaggatc tgatggcttc 2700actgatgaat tttgccaaat atttaaaaaa ctaataccaa tccaactcaa attattaaaa 2760aaatagaggt ggacagaatc tttccaaatg tattctatga ggccagtgtt ttttctgatt 2820gaatctccca ttatatttta atcacatata aaaccagaga aagacacatt aaaaagaaag 2880aaaactgtag gccaatatct ctgatgaaca ttgatgcaga aatcctcaac aacaaattag 2940caaactgaat tcaagaacac attaaaacaa tcattcatca tgaccaagtg gaatttgtcc 3000tagagattca agtgtggtta ggtatgtgca gatcaatggg tttaatgttg tccaatgaac 3060ataatgtcct ccagctccat ccatgttctt gcaaatgaca ggatctcatt cttttttatg 3120gctaagtagt actccattgt gtataagtgc catattttct ttatccattc atctgttaga 3180cacctaagtt gcttccaaat cttagctatt gtgaatagtg ctgcaataaa catgggagtg 3240taaatatttt gttgacatac tgatttcatt tcctttggat aaatacccag tagtgggatt 3300gctggatcat atgggggaaa atggagatgg ctaacgggct caaaaatata gttagaaaaa 3360atgaatatga tttagtattc gatagcacaa taggatgact actgttaatg ataatttatt 3420atatattata aaataactaa aatagtataa atgggatgta tgtagcagag agaaatgata 3480aatgtttgaa gcattggata ctccatcacc tgctgtgata ttatgaatgt ctgcctatat 3540aaatattcac tattccataa cacagcgcct cttatgtacc cacaaaaatc tattttcaaa 3600aaagttgctc taagaatata gttatcaagt taagtaaaat gtcaatagcc ttttaattta 3660atttttaatt gttttatcat tctttgcaat aataaaacat taactttata ctttttaatt 3720taatgtatag aatagagata tacataggat atgtaaatag atacacagtg tatatgtgat 3780taaaatataa tgggagattc aatcagaaaa aagtttctaa aaaggctctg gggtaaaaga 3840ggaaggaaac aataatgaaa aaaatgtggt gagaaaaaca gctgaaaacc catgtaaaga 3900gtgtataaag aaagcaaaaa gagaagtaga aagtaacaca ggggcatttg gaaaatgtaa 3960acgagtatgt tccctattta aggctaggca caaagcaagg tcttcagaga acctggagcc 4020taaggtttag gctcacccat ttcaaccagt ctagcagcat ctgcaacatc tacaatggcc 4080ttgacctttg4090210 11211 3564212 DNA213 Homo sapiens400 11aagcttttat aggtgtaaat tttccactta gtactgcttt tgtaatgttg tctttttatt 60ttcatttatc tcaagatgtt ttctaatttc tcttgacttc cttcttaaat tcttacctca 120tgtagacata catttttggc cctatgcatt gggatgcaaa accagactaa tttactttgt 180acaaaaagaa aaatgagaaa gaaatatatt tggtcttgtg agcactatat ggaaatactt 240tatattccat ttgtttcatc atattcatat atccctttac taacataaag ctgaaggtga 300ataaaaaaat cagggttagc caaacaaatt ttcatggtca aataccacat aaaaagtaaa 360tatacttaag ttcccagcaa aatctgaatt gaacgtagac aaaatgctca tttctcagtg 420tttgacagac ttaacagttt gagccaataa aaatgtactg actagataaa ctactaaaag 480ttgttaattt ttgcaatgta tatttctgaa aagaaagttt atctattata gaaattcctg 540tgcccattta agaactttga gcattttaat tgtttaataa tatagtttaa ttgcatcatg 600aaaataatca ataatacaat ttatttggtt tatttaaaaa aactgattct ttctgctctc 660tctatatata gactgatttt atactaatgt tgcctaaaga tcaccaaatt gtttgaagcc 720taggtttctg agggatggaa aatgatgtca caactattta cagttcacac acacattctg 780gggatttaat acatccttta caagtgcagg aaaggtggaa gattgatgat ttgggggaat 840tagagctacc acaccccaga gggtggtatg gtatgttgtc tgttgtgagc tgtgtgaatc 900agagagtttg atttagacat atatttagaa agaggaaaga tgaaccaatc aaaaataata 960actataatga cttttcaaga tatagacaat acagttaaga tataaatgga aacaaaaaaa1020gttaaaagtg gggagatgaa gtctgatttt ttggtttttt tttttttttg cttttttgtt1080tgtttatgta atcagtgtta ccagtttaaa ataatgggtt ataagacact atatgcaagc1140ctcatggtaa cctccaatct aaaacataca acaaatacac acaaaataaa aaggagaaat1200taaaacacac caccagagaa aatcacctac attaaaagaa agacaaatag gaagaaaata1260agaaagagaa ggccatcaaa taatcagaaa atgaataaca aaatgacagg aataagtcct1320cataaataat aacattgaat gtaaatggac taagctctcc aatgaaagac agggagtggc1380tgaatgtatt ttaaaaaaaa tattacaccg agctgtgcgt ggtgtctcac acctataatc1440ccagcatttt gggagactga gccgggtgga tcacttgagc ccaggagttc gagaccagcc1500tggccaacat ggcaaaaccc tgtctctact aaaaatacaa aaaattagct gaacatggtg1560gcacatgcct gtggttccag ctactagaga ggctgaggca gaagaattgc ttgaacttgg1620gaggtggagg ttgcagtgag ctaagattga tggagccact gcaccccagc ctaggtgaca1680gaataagact ctgcctcaaa aaaaaaaagc aaaacaaaac aaaacaaaaa acccttagac1740ccaatgattc attgcctaca agaagtatgc ttcaccttta aagacacata tagactgaag1800gtaaagggat ggaaaaatat tctatgccta tggaaacaaa caaaaagaag cagaagctac1860atttatatca gacaaaatag actgcaagac aaaaactatg aaaagagaga aagaaggtca1920ttatatagtg ataaaggggt ccatttagca agagcattta acaattctaa atatatattc1980acccaatact ggagtactca ggtatataaa gcaaatatta ttagagccaa agagagagat2040agacagaccc ccatacaata ataactggag acttcaacac cccactttca gcattggaca2100gatcatcaag acagaaaatt aacaaacatc aaatttcatc tgcaccatag gtcaaatgga2160cctagtagat atttacagaa catttgatcc aacagctgta gaatacacat tcttctcctc2220agcacatgga taattctcaa ggatatacca aatgctaggt cacaaaacaa atcttaaaat2280ttagaaaaaa agtgaaataa tatcaaacgt tttctctcac cacagactaa gaaaaaaaga2340agtcccaaat aaatacaatc tgagataaaa aaggagacga gacaaccaat accacaaaaa2400attaaaggat cattagaaga tactatgaaa ctatatgcta ataaattgga aaacctgaac2460aaaatagata attcctagaa acatacaaca tactggtctg ttcaggtttt gtattttttc2520atagtaccat gaagaaatac aagaattgtt tctagaacca ttcttgtatt tcttcatggt2580ttttgtattt cttcatggaa ccatgaagaa atacaaaatg tgaacaggcc aataacaagt2640aatgagacag aagccatact aaaaagtatc ccagaaaaga actcaggatc tgatggcttc2700actgatgaat tttgccaaat atttaaaaaa ctaataccaa tccaactcaa attattaaaa2760aaatagaggt ggacagaatc tttccaaatg tattctatga ggccagtgtt ttttctgatt2820gaatctccca ttatatttta atcacatata aaaccagaga aagacacatt aaaaagaaag2880aaaactgtag gccaatatct ctgatgaaca ttgatgcaga aatcctcaac aacaaattag2940caaactgaat tcaagaacac attaaaacaa tcattcatca tgaccaagtg gaatttgtcc3000tagagattca agtgtggtta ggtatgtgca gatcaatggg tttaatgttg tccaatgaac3060ataatgtcct ccagctccat ccatgttctt gcaaatgaca ggatctcatt cttttttatg3120gctaagtagt actccattgt gtataagtgc catattttct ttatccattc atctgttaga3180cacctaagtt gcttccaaat cttagctatt gtgaatagtg ctgcaataaa catgggagtg3240taaatatttt gttgacatac tgatttcatt tcctttggat aaatacccag tagtgggatt3300gctggatcat atgggggaaa atggagatgg ctaacgggct caaaaatata gttagaaaaa3360atgaatatga tttagtattc gatagcacaa taggatgact actgttaatg ataatttatt3420atatattata aaataactaa aatagtataa atgggatgta tgtagcagag agaaatgata3480aatgtttgaa gcattggata ctccatcacc tgctgtgata ttatgaatgt ctgcctatat3540aaatattcac tattccataa caca 3564210 12211 3213212 DNA213 Homo sapiens400 12actaacataa agctgaaggt gaataaaaaa atcagggtta gccaaacaaa ttttcatggt 60caaataccac ataaaaagta aatatactta agttcccagc aaaatctgaa ttgaacgtag 120acaaaatgct catttctcag tgtttgacag acttaacagt ttgagccaat aaaaatgtac 180tgactagata aactactaaa agttgttaat ttttgcaatg tatatttctg aaaagaaagt 240ttatctatta tagaaattcc tgtgcccatt taagaacttt gagcatttta attgtttaat 300aatatagttt aattgcatca tgaaaataat caataataca atttatttgg tttatttaaa 360aaaactgatt ctttctgctc tctctataca tagactgatt ttatactaat gttgcctaaa 420gatcaccaaa ttgtttgaag cctaggtttc tgagggatgg aaaatgatgt cacaactatt 480tacagttcac acacacattc tggggattta atacatcctt tacaagtgca ggaaaggtgg 540aagattgatg atttggggga attagagcta ccacacccca gagggtggta tggtatgttg 600tctgttgtga gctgtgtgaa tcagagagtt tgatttagac atatatttag aaagaggaaa 660gatgaaccaa tcaaaaataa taactataat gacttttcaa gatatagaca atacagttaa 720gatataaatg gaaacaaaaa aagttaaaag tggggagatg aagtctgatt ttttggtttt 780tttttttttt tgcttttttg tttgtttatg taatcagtgt taccagttta aaataatggg 840ttataagaca ctatatgcaa gcctcatggt aacctccaat ctaaaacata caacaaatac 900acacaaaata aaaaggagaa attaaaacac accaccagag aaaatcacct acattaaaag 960aaagacaaat aggaagaaaa taagaaagag aaggccatca aataatcaga aaatgaataa1020caaaatgaca ggaataagtc ctcataaata ataacattga atgtaaatgg actaagctct1080ccaatgaaag acagggagtg gctgaatgta ttttaaaaaa aatattacac cgagctgtgc1140gtggtgtctc acacctataa tcccagcatt ttgggagact gagccgggtg gatcacttga1200gcccaggagt tcgagaccag cctggccaac atggcaaaac cctgtctcta ctaaaaatac1260aaaaaattag ctgaacatgg tggcacatgc ctgtggttcc agctactaga gaggctgagg1320cagaagaatt gcttgaactt gggaggtgga ggttgcagtg agctaagatt gatggagcca1380ctgcacccca gcctaggtga cagaataaga ctctgcctca aaaaaaaaaa gcaaaacaaa1440acaaaacaaa aaacccttag acccaatgat tcattgccta caagaagtat gcttcacctt1500taaagacaca tatagactga aggtaaaggg atggaaaaat attctatgcc tatggaaaca1560aacaaaaaga agcagaagct acatttatat cagacaaaat agactgcaag acaaaaacta1620tgaaaagaga gaaagaaggt cattatatag tgataaaggg gtccatttag caagagcatt1680taacaattct aaatatatat tcacccaata ctggagtact caggtatata aagcaaatat1740tattagagcc aaagagagag atagacagac ccccatacaa taataactgg agacttcaac1800accccacttt cagcattgga cagatcatcc agacagaaaa ttaacaaaca tcaaatttca1860tctgcaccat aggtcaaatg gacctagtag atatttacag aacatttgat ccaacagctg1920tagaatacac attcttctcc tcagcacatg gataattctc aaggatatac caaatgctag1980gtcacaaaac aaatcttaaa atttagaaaa aaagtgaaat aatatcaaac gttttctctc2040accacagact aagaaaaaaa gaagtcccaa ataaatacaa tctgagataa aaaaggagac2100gagacaacca ataccacaaa aaattaaagg atcattagaa gatactatga aactatatgc2160taataaattg gaaaacctga acaaaataga taattcctag aaacatacaa catactggtc2220tgttcaggtt ttgtattttt tcatagtacc atgaagaaat acaagaattg tttctagaac2280cattcttgta tttcttcatg gtttttgtat ttcttcatgg aaccatgaag aaatacaaaa2340tgtgaacagg ccaataacaa gtaatgagac agaagccata ctaaaaagta tcccagaaaa2400gaactcagga tctgatggct tcactgatga attttgccaa atatttaaaa aactaatacc2460aatccaactc aaattattaa aaaaatagag gtggacagaa tctttccaaa tgtattctat2520gaggccagtg ttttttctga ttgaatctcc cattatattt taatcacata taaaaccaga2580gaaagacaca ttaaaaagaa agaaaactgt aggccaatat ctctgatgaa cattgatgca2640gaaatcctca acaacaaatt agcaaactga attcaagaac acattaaaac aatcattcat2700catgaccaag tggaatttgt cctagagatt caagtgtggt taggtatgtg cagatcaatg2760ggtttaatgt tgtccaatga acataatgtc ctccagctcc atccatgttc ttgcaaatga2820caggatctca ttctttttta tggctaagta gtactccatt gtgtataagt gccatatttt2880ctttatccat tcatctgtta gacacctaag ttgcttccaa atcttagcta ttgtgaatag2940tgctgcaata aacatgggag tgtaaatatt ttgttgacat actgatttca tttcctttgg3000ataaataccc agtagtggga ttgctggatc atatggggga aaatggagat ggctaacggg3060ctcaaaaata tagttagaaa aaatgaatat gatttagtat tcgatagcac aataggatga3120ctactgttaa tgataattta ttatatatta taaaataact aaaatagtat aaatgggatg3180tatgtagcag agagaaatga taaatgtttg aag 3213210 13211 3033212 DNA213 Homo sapiens400 13actaacataa agctgaaggt gaataaaaaa atcagggtta gccaaacaaa ttttcatggt 60caaataccac ataaaaagta aatatactta agttcccagc aaaatctgaa ttgaacgtag 120acaaaatgct catttctcag tgtttgacag acttaacagt ttgagccaat aaaaatgtac 180tgactagata aactactaaa agttgttaat ttttgcaatg tatatttctg aaaagaaagt 240ttatctatta tagaaattcc tgtgcccatt taagaacttt gagcatttta attgtttaat 300aatatagttt aattgcatca tgaaaataat caataataca atttatttgg tttatttaaa 360aaaactgatt ctttctgctc tctctatata tagactgatt ttatactaat gttgcctaaa 420gatcaccaaa ttgtttgaag cctaggtttc tgagggatgg aaaatgatgt cacaactatt 480tacagttcac acacacattc tggggattta atacatcctt tacaagtgca ggaaaggtgg 540aagattgatg atttggggga attagagcta ccacacccca gagggtggta tggtatgttg 600tctgttgtga gctgtgtgaa tcagagagtt tgatttagac atatatttag aaagaggaaa 660gatgaaccaa tcaaaaataa taactataat gacttttcaa gatatagaca atacagttaa 720gatataaatg gaaacaaaaa aagttaaaag tggggagatg aagtctgatt ttttggtttt 780tttttttttt tgcttttttg tttgtttatg taatcagtgt taccagttta aaataatggg 840ttataagaca ctatatgcaa gcctcatggt aacctccaat ctaaaacata caacaaatac 900acacaaaata aaaaggagaa attaaaacac accaccagag aaaatcacct acattaaaag 960aaagacaaat aggaagaaaa taagaaaga9 aaggccatca aataatcaga aaatgaataa1020caaaatgaca ggaataagtc ctcataaata ataacattga atgtaaatgg actaagctct1080ccaatgaaag acagggagtg gctgaatgta ttttaaaaaa aatattacac cgagctgtgc1140gtggtgtctc acacctataa tcccagcatt ttgggagact gagccgggtg gatcacttga1200gcccaggagt tcgagaccag cctggccaac atggcaaaac cctgtctcta ctaaaaatac1260aaaaaattag ctgaacatgg tggcacatgc ctgtggttcc agctactaga gaggctgagg1320cagaagaatt gcttgaactt gggaggtgga ggttgcagtg agctaagatt gatggagcca1380ctgcacccca gcctaggtga cagaataaga ctctgcctca aaaaaaaaaa gcaaaacaaa1440acaaaacaaa aaacccttag acccaatgat tcattgccta caagaagtat gcttcacctt1500taaagacaca tatagactga aggtaaaggg atggaaaaat attctatgcc tatggaaaca1560aacaaaaaga agcagaagct acatttatat cagacaaaat agactgcaag acaaaaacta1620tgaaaagaga gaaagaaggt cattatatag tgataaaggg gtccatttag caagagcatt1680taacaattct aaatatatat tcacccaata ctggagtact caggtatata aagcaaatat1740tattagagcc aaagagagag atagacagac ccccatacaa taataactgg agacttcaac1800accccacttt cagcattgga cagatcatcc agacagaaaa ttaacaaaca tcaaatttca1860tctgcaccat aggtcaaatg gacctagtag atatttacag aacatttgat ccaacagctg1920tagaatacac attcttctcc tcagcacatg gataattctc aaggatatac caaatgctag1980gtcacaaaac aaatcttaaa atttagaaaa aaagtgaaat aatatcaaac gttttctctc2040accacagact aagaaaaaaa gaagtcccaa ataaatacaa tctgagataa aaaaggagac2100gagacaacca ataccacaaa aaattaaagg atcattagaa gatactatga aactatatgc2160taataaattg gaaaacctga acaaaataga taattcctag aaacatacaa catactggtc2220tgttcaggtt ttgtattttt tcatagtacc atgaagaaat acaagaattg tttctagaac2280cattcttgta tttcttcatg gtttttgtat ttcttcatgg aaccatgaag aaatacaaaa2340tgtgaacagg ccaataacaa gtaatgagac agaagccata ctaaaaagta tcccagaaaa2400gaactcagga tctgatggct tcactgatga attttgccaa atatttaaaa aactaatacc2460aatccaactc aaattattaa aaaaatagag gtggacagaa tctttccaaa tgtattctat2520gaggccagtg ttttttctga ttgaatctcc cattatattt taatcacata taaaaccaga2580gaaagacaca ttaaaaagaa agaaaactgt aggccaatat ctctgatgaa cattgatgca2640gaaatcctca acaacaaatt agcaaactga attcaagaac acattaaaac aatcattcat2700catgaccaag tggaatttgt cctagagatt caagtgtggt taggtatgtg cagatcaatg2760ggtttaatgt tgtccaatga acataatgtc ctccagctcc atccatgttc ttgcaaatga2820caggatctca ttctttttta tggctaagta gtactccatt gtgtataagt gccatatttt2880ctttatccat tcatctgtta gacacctaag ttgcttccaa atcttagcta ttgtgaatag2940tgctgcaata aacatgggag tgtaaatatt ttgttgacat actgatttca tttcctttgg3000ataaataccc agtagtggga ttgctggatc ata 3033210 14211 137212 DNA213 Homo sapiens400 14gagaacctgg agcctaaggt ttaggctcac ccatttcaac cagtctagca gcatctgcaa 60catctacaat ggccttgacc tttgctttac tggtggccct cctggtgctc agctgcaagt 120caagctgctc tgtgggc 137210 15211 805212 DNA213 Homo sapiens400 15aagcttttat aggtgtaaat tttccactta gtactgcttt tgtaatgttg tctttttatt 60ttcatttatc tcaagatgtt ttctaatttc tcttgacttc cttcttaaat tcttacctca 120tgtagacata catttttggc cctatgcatt gggatgcaaa accagactaa tttactttgt 180acaaaaagaa aaatgagaaa gaaatatatt tggtcttgtg agcactatat ggaaatactt 240tatattccat ttgtttcatc atattcatat atccctttac taacataaag ctgaaggtga 300ataaaaaaat cagggttagc caaacaaatt ttcatggtca aataccacat aaaaagtaaa 360tatacttaag tccccagcaa aatctgaatt gaacgtagac aaaatgctca tttctcagtg 420tttgacagac ttaacagttt gagccaataa aaatgtactg actagataaa ctactaaaag 480ttgttaattt ttgcaatgta tatttctgaa aagaaagttt atctattata gaaattcctg 540tgcccattta agaactttga gcattttaat tgtttaataa tatagtttaa ttgcatcatg 600aaaataatca ataatacaat ttatttggtt tatttaaaaa aactgattct ttctgctctc 660tctatatata gactgatttt atactaatgt tgcctaaaga tcaccaaatt gtttgaagcc 720taggtttctg agggatggaa aatgatgtca caactattta cagttcacac acacattctg 780gggatttaat acatccttta caagt 805210 16211 29212 DNA213 Homo sapiens400 16aggaaaggtg gaagattgat gatttgggg 29210 17211 105212 DNA213 Homo sapiens400 17ggggaattag agctaccaca ccccagaggg tggtatggta tgttgtctgt tgtgagctgt 60gtgaatcaga gagtttgatt tagacatata tttagaaaga ggaaa 105210 18211 2629212 DNA213 Homo sapiens400 18aaagatgaac caatcaaaaa taataactat aatgactttt caagatatag acaatacagt 60taagatataa atggaaacaa aaaaagttaa aagtggggag atgaagtctg attttttggt 120tttttttttt ttttgctttt ttgtttgttt atgtaatcag tgttaccagt ttaaaataat 180gggttataag acactatatg caagcctcat ggtaacctcc aatctaaaac atacaacaaa 240tacacacaaa ataaaaagga gaaattaaaa cacaccacca gagaaaatca cctacattaa 300aagaaagaca aataggaaga aaataagaaa gagaaggcca tcaaataatc agaaaatgaa 360taacaaaatg acaggaataa gtcctcataa ataataacat tgaatgtaaa tggactaagc 420tctccaatga aagacaggga gtggctgaat gtattttaaa aaaaatatta caccgagctg 480tgcgtggtgt ctcacaccta taatcccagc attttgggag actgagccgg gtggatcact 540tgagcccagg agttcgagac cagcctggcc aacatggcaa aaccctgtct ctactaaaaa 600tacaaaaaat tagctgaaca tggtggcaca tgcctgtggt tccagctact agagaggctg 660aggcagaaga attgcttgaa cttgggaggt ggaggttgca gtgagctaag attgatggag 720ccactgcacc ccagcctagg tgacagaata agactctgcc tcaaaaaaaa aaagcaaaac 780aaaacaaaac aaaaaaccct tagacccaat gattcattgc ctacaagaag tatgcttcac 840ctttaaagac acatatagac tgaaggtaaa gggatggaaa aatattctat gcctatggaa 900acaaacaaaa agaagcagaa gctacattta tatcagacaa aatagactgc aagacaaaaa 960ctatgaaaag agagaaagaa ggtcattata tagtgataaa ggggtccatt tagcaagagc1020atttaacaat tctaaatata tattcaccca atactggagt actcaggtat ataaagcaaa1080tattattaga gccaaagaga gagatagaca gacccccata caataataac tggagacttc1140aacaccccac tttcagcatt ggacagatca tccagacaga aaattaacaa acatcaaatt1200tcatctgcac cataggtcaa atggacctag tagatattta cagaacattt gatccaacag1260ctgtagaata cacattcttc tcctcagcac atggataatt ctcaaggata taccaaatgc1320taggtcacaa aacaaatctt aaaatttaga aaaaaagtga aataatatca aacgttttct1380ctcaccacag actaagaaaa aaagaagtcc caaataaata caatctgaga taaaaaagga1440gacgagacaa ccaataccac aaaaaattaa aggatcatta gaagatacta tgaaactata1500tgctaataaa ttggaaaacc tgaacaaaat agataattcc tagaaacata caacatactg1560gtctgttcag gttttgtatt ttttcatagt accatgaaga aatacaagaa ttgtttctag1620aaccattctt gtatttcttc atggtttttg tatttcttca tggaaccatg aagaaataca1680aaatgtgaac aggccaataa caagtaatga gacagaagcc atactaaaaa gtatcccaga1740aaagaactca ggatctgatg gcttcactga tgaattttgc caaatattta aaaaactaat1800accaatccaa ctcaaattat taaaaaaata gaggtggaca gaatctttcc aaatgtattc1860tatgaggcca gtgttttttc tgattgaatc tcccattata ttttaatcac atataaaacc1920agagaaagac acattaaaaa gaaagaaaac tgtaggccaa tatctctgat gaacattgat1980gcagaaatcc tcaacaacaa attagcaaac tgaattcaag aacacattaa aacaatcatt2040catcatgacc aagtggaatt tgtcctagag attcaagtgt ggttaggtat gtgcagatca2100atgggtttaa tgttgtccaa tgaacataat gtcctccagc tccatccatg ttcttgcaaa2160tgacaggatc tcattctttt ttatggctaa gtagtactcc attgtgtata agtgccatat2220tttctttatc cattcatctg ttagacacct aagttgcttc caaatcttag ctattgtgaa2280tagtgctgca ataaacatgg gagtgtaaat attttgttga catactgatt tcatttcctt2340tggataaata cccagtagtg ggattgctgg atcatatggg ggaaaatgga gatggctaac2400gggctcaaaa atatagttag aaaaaatgaa tatgatttag tattcgatag cacaatagga2460tgactactgt taatgataat ttattatata ttataaaata actaaaatag tataaatggg2520atgtatgtag cagagagaaa tgataaatgt ttgaagcatt ggatactcca tcacctgctg2580tgatattatg aatgtctgcc tatataaata ttcactattc cataacaca2629210 19211 14212 DNA213 Homo sapiens220221 misc_特徵222 (1)…(14)223 n=A,T,C或G400 19yyyyyyyyyy nyag 1權利要求
1.一種DNA構建物,該DNA構建物當通過同源重組整合到哺乳動物細胞基因組中時,在該細胞中改變內源IFNA2基因的表達,該構建物包含(ⅰ)包含SEQ ID NO:12的至少20個連續核苷酸的導向序列,和(ⅱ)轉錄調節序列。
2.權利要求1的DNA構建物,其中所述構建物還包含外顯子、剪接供體位點、內含子和剪接受體位點。
3.權利要求1的DNA構建物,其中所述構建物還包含選擇性標記基因。
4.權利要求1的DNA構建物,其中所述導向序列包含SEQ IDNO:12的至少50個連續核苷酸。
5.一種DNA構建物,該DNA構建物當通過同源重組整合到哺乳動物細胞基因組中時,在該細胞中改變內源IFNA2基因的表達,該構建物包含(ⅰ)包含SEQ ID NO:7的至少20個連續核苷酸的導向序列,和(ⅱ)轉錄調節序列。
6.權利要求5的DNA構建物,其中所述構建物還包含外顯子、剪接供體位點、內含子和剪接受體位點。
7.一種DNA構建物,該DNA構建物當通過同源重組整合到哺乳動物細胞基因組中時,在該細胞中改變內源IFNA2基因的表達,該構建物包含(ⅰ)包含SEQ ID NO:8的至少20個連續核苷酸的導向序列,和(ⅱ)轉錄調節序列。
8.權利要求7的DNA構建物,其中所述構建物還包含外顯子、剪接供體位點、內含子和剪接受體位點。
9.包含SEQ ID NO:12或其互補物的至少20個連續核苷酸的分離的核酸,其中所述分離的核酸不編碼全長幹擾素-α2。
10.權利要求9的分離的核酸,其中所述分離的核酸包含SEQ IDNO:12或其互補物的至少50個連續的核苷酸。
11.權利要求9的分離的核酸,其中所述分離的核酸包含SEQID NO:12或其互補物的至少100個連續的核苷酸。
12.權利要求9的分離的核酸,其中所述分離的核酸包含SEQID NO:12或其互補物的至少200個連續的核苷酸。
13.權利要求9的分離的核酸,其中所述分離的核酸包含SEQID NO:7或其互補物。
14.權利要求9的分離的核酸,其中所述分離的核酸包含SEQID NO:8或其互補物。
15.權利要求9的分離的核酸,其中所述分離的核酸包含SEQID NO:12或其互補物。
16.權利要求9的分離的核酸,其中所述分離的核酸包含SEQID NO:7或其互補物的至少20個連續的核苷酸。
17.權利要求9的分離的核酸,其中所述分離的核酸包含SEQID NO:8或其互補物的至少20個連續的核苷酸。
18.一種分離的核酸,它包含含有核苷酸序列的鏈,所述核苷酸序列(ⅰ)為至少100個核苷酸長並(ⅱ)在高度嚴格條件下與SEQ IDNO:12或SEQ ID NO:12的互補物雜交。
19.權利要求18的分離的核酸,其中所述核苷酸序列為至少200個核苷酸長。
20.權利要求18的分離的核酸,其中所述核苷酸序列為至少400個核苷酸長。
21.權利要求18的分離的核酸,其中所述核苷酸序列為至少1000個核苷酸長。
22.包含含有核苷酸序列的鏈的分離的核酸,所述核苷酸序列(ⅰ)為至少100個核苷酸長並(ⅱ)在高度嚴格條件下與SEQ ID NO:7或SEQID NO:7的互補物雜交。
23.包含含有核苷酸序列的鏈的分離的核酸,所述核苷酸序列(ⅰ)為至少50個核苷酸長並(ⅱ)在高度嚴格條件下與SEQ ID NO:8或SEQID NO:8的互補物雜交。
24.包含含有核苷酸序列的鏈的分離的核酸,所述核苷酸序列(ⅰ)為至少50個核苷酸長並(ⅱ)和與其具有同樣長度的SEQ ID NO:12的核苷酸序列片段具有至少80%的序列同一性。
25.權利要求24的分離的核酸,其中所述核苷酸序列為至少100個核苷酸長。
26.權利要求24的分離的核酸,其中所述片段為SEQ ID NO:7的部分或全部。
27.權利要求24的分離的核酸,其中所述片段為SEQ ID NO:8的部分或全部。
28.用權利要求1的DNA構建物穩定轉染的同源重組哺乳動物細胞,所述DNA構建物與內源IFNA2編碼序列的ATG起始密碼子上遊的基因組DNA進行同源重組。
29.用權利要求2的DNA構建物穩定轉染的同源重組哺乳動物細胞,所述DNA構建物與內源IFNA2編碼序列的ATG起始密碼子上遊的基因組DNA進行同源重組。
30.用權利要求3的DNA構建物穩定轉染的同源重組細胞,所述DNA構建物與內源IFNA2編碼序列的ATG起始密碼子上遊的基因組DNA進行同源重組。
31.用權利要求4的DNA構建物穩定轉染的同源重組細胞,所述DNA構建物與內源IFNA2編碼序列的ATG起始密碼子上遊的基因組DNA進行同源重組。
32.改變內源IFNA2基因在哺乳動物細胞中表達的方法,該方法包括將權利要求1的DNA構建物引入到所述細胞中,並將所述細胞保持在允許所述構建物和內源IFNA2基因的編碼序列的5′靶位點之間發生同源重組的條件下。
33.將IFNA2傳遞給動物的方法,包括提供權利要求28的細胞;並將該細胞植入到所述動物中,其中所述細胞分泌IFNA2。
34.將IFNA2傳遞給動物的方法,包括提供權利要求29的細胞;並將該細胞植入到所述動物中,其中所述細胞分泌IFNA2。
35.將IFNA2傳遞給動物的方法,包括提供權利要求30的細胞;並將該細胞植入到所述動物中,其中所述細胞分泌IFNA2。
36.將IFNA2傳遞給動物的方法,包括提供權利要求31的細胞;並將該細胞植入到所述動物中,其中所述細胞分泌IFNA2。
37.產生IFNA2的方法,包括提供權利要求28的細胞,並在使所述細胞表達和分泌IFNA2的條件下體外培養所述細胞。
38.產生IFNA2的方法,包括提供權利要求29的細胞,並在使所述細胞表達和分泌IFNA2的條件下體外培養所述細胞。
39.產生IFNA2的方法,包括提供權利要求30的細胞,並在使所述細胞表達和分泌IFNA2的條件下體外培養所述細胞。
40.產生IFNA2的方法,包括提供權利要求31的細胞,並在使所述細胞表達和分泌IFNA2的條件下體外培養所述細胞。
41.當通過同源重組整合到哺乳動物細胞的基因組中時,在該細胞中改變內源IFNA2基因表達的DNA構建物,該構建物包含(ⅰ)含有SEQ ID NO:16、17、18和19中的一個或多個的至少20個連續核苷酸的導向序列,和(ⅱ)轉錄調節序列。
42.包含SEQ ID NO:16、17、18和19中的一個或多個的至少20個連續核苷酸、或包含SEQ ID NO:16、17、18和19中的一個或多個的互補物中的至少20個連續核苷酸的分離的核酸,其中所述分離的核酸不編碼全長幹擾素-α2。
43.用權利要求39的DNA構建物穩定轉染的同源重組哺乳動物細胞,所述DNA構建物與內源IFNA2編碼序列的ATG起始密碼子上遊的基因組DNA進行同源重組。
44.改變內源IFNA2基因在哺乳動物細胞中表達的方法,該方法包括將權利要求39的DNA構建物引入到所述細胞中,並將所述細胞保持在允許所述構建物和所述內源IFNA2基因的編碼序列的5′靶位點之間發生同源重組的條件下。
45.將IFNA2傳遞給動物的方法,包括提供權利要求41的細胞;並將該細胞植入到所述動物中,其中所述細胞分泌IFNA2。
46.產生IFA2的方法,包括提供權利要求41的細胞,並在使所述細胞表達和分泌IFNA2的條件下體外培養所述細胞。
全文摘要
在嚴格條件下與IFNA2基因的編碼區上遊的限定的基因組區雜交、或與其具有至少80%序列同一性的分離的核酸分子,以及包含為同源重組的導向序列的所述DNA分子的DNA構建物。
文檔編號C12R1/91GK1309710SQ99808195
公開日2001年8月22日 申請日期1999年5月5日 優先權日1998年5月7日
發明者D·A·特雷科, M·W·赫爾特萊恩, R·F·塞爾登 申請人:變更染色體醫療公司