新四季網

使用基因表達特徵監控疾病狀態和治療的方法

2023-06-01 16:52:46 2

專利名稱:使用基因表達特徵監控疾病狀態和治療的方法
按照35 U.S.C.§119(e)的規定,本申請要求1998年6月19日提交的美國臨時專利申請第60/090,004號的優先權,該文整體結合在此作為參考。
1、發明領域本發明的領域涉及確定或監控受試者(優選人類患者)的疾病狀態的發展進程或治療方案的效力的方法。具體地說,本發明涉及在蛋白質功能或活性發生變化之前不時監控疾病狀態或治療的方法。
2、背景在過去的十年裡,已有幾項技術使得有可能監控任何一個時刻細胞內大量轉錄物的表達水平(參見,例如Schena等,1995年,「對具有互補DNA微陣列的基因表達模式的定量監控」,《科學》270:467-470;Lockhart等,1996年,「通過與高密度寡核苷酸陣列雜交來監控表達」,《自然生物技術》14:1675-1680;Blanchard等,1996年,「定序成陣列探測基因組的秘密」,《自然生物技術學》14,1649;1996年,1996年10月29日頒發給Ashby等的、題目為「藥物篩選方法」的美國專利5,569,588)。在完全基因組已知的生物體中,有可能分析細胞內所有基因的轉錄物。對其他生物體(諸如人)的基因組的認識正逐漸增加,對他們有可能同時監控細胞內的大量基因。
轉錄物陣列技術的早期應用已涉及對在各種疾病狀態中被正調節或負調節的基因的鑑別。轉錄物陣列的其他用途包括分析信號途徑的成員,以及鑑別各種藥物的目標。但是,以前沒有認識到轉錄物陣列有可能用於監控疾病狀態或對其的治療作用的水平。特別是沒有認識到疾病狀態和/或治療可能通過使用轉錄物陣列來檢測蛋白質活性因來自疾病狀態和/或治療的幹擾而出現的初期小變化導致的代償性變化來監控。
不過,對於疾病狀態來說,對因疾病狀態的作用或因治療方案(諸如給藥方案)而導致的生物途徑中的初期變化的鑑別是一個具有重大商業和人類重要性的問題。需要作出的大多數決定是進行有效的臨床試驗和依據監控身體內細胞中的變化的各項測定對患者的健康作出適當的處置。例如,當醫師要確定患者的器官功能,諸如腎、肝或心臟等功能是否發生了變化時,他們要依賴於監控酶功能的變化,酶功能的變化可提示與各種疾病過程有關的細胞變化。
因此,作出正確的治療決定的能力依賴於具有能對患者是否已受到疾病或治療的影響而使生理發生變化進行監控的敏感監控器的能力。其中一些需要涉及以下特定的蛋白質活性水平。例如甲胎蛋白(AFP)或鹼性磷酸酶(ALP)的水平常用於監控肝損傷(參見,例如Izumi,R等,1992年,《外科腫瘤學雜誌》49:151-155)。免疫抑制劑環孢菌素A和mycophalote mofetil的作用也已分別使用對目標酶鈣調磷酸酶和肌苷一磷酸的活性測定來監控(參見Yatscoff,R.W.等,1996年,《移植學會會報》28:3013-3015)。其他例子涉及監控凝固途徑已缺損的患者的蛋白質功能。
因此,能通過監控蛋白質的功能來監控受試者體內的變化的力量是本領域中眾所周知的,並且這類技術無論是在對動物試驗中藥物作用的檢測中還是在對藥物和疾病對人的作用的檢測中都很普及。但是,一個顯著的益處應是能監控與疾病狀態或治療的水平有關的並且先於可檢測的實際蛋白質功能或活性變化的細胞中的早期變化。例如,這類技術將允許對疾病狀態的水平作出較早的診斷或預測或判定。具體地說,這類技術的存在將允許在可觀察到受試者的疾病狀態的症狀之前對其疾病狀態的水平作出判定(例如疾病進展的階段或水平)。於是就可能作出更早、更有效的治療。監控由治療產生的細胞中的這些早期變化的能力同樣是非常有益的,因為這樣就可能對治療方案進行監控並容易地進行改進,以獲得最大效力。
本文中討論或引用的參考文獻將不被解釋為是本發明的現有技術。
3、發明概述本發明提供了監控受試者的疾病或疾病狀態的方法。本發明的方法包括將通過測量受試者的細胞內的RNA或蛋白質豐度或活性而得到的「診斷特徵」與通過測量疾病水平不同(即所監控的疾病或疾病狀態的發展水平不同)的類似受試者的細胞內的RNA或蛋白質豐度或活性而得到的「內插幹擾應答特徵」進行比較。
本發明還提供了監控對受試者的治療功效或治療應答的方法。這些方法包括將通過測量經歷了特定治療的受試者的細胞中的基因或蛋白質豐度而得到的診斷特徵與通過測量對已知治療功效或應答水平有反應的類似受試者的細胞中的RNA或蛋白質豐度或活性而得到的內插幹擾應答特徵進行比較。
本發明還提供了用於按照上述方法分析疾病狀態的水平和或治療功效的計算機系統。
本發明的方法至少部分基於有關作為疾病狀態的結果而出現的、或者作為導致其他基因的轉錄和活性的性能變化的治療的結果而出現的對細胞的各種組分的幹擾的發現,諸如對蛋白質功能或活性的幹擾,上面所說的這些性能變化可用於定義與特定疾病狀態或治療的進展有關的特定變化的「特徵」。即使與疾病狀態有關的蛋白質的功能或活性水平沒有實際破壞,這一點也適用。因此,本發明的方法不同也不依賴於監控蛋白質的功能。另外,本發明的方法可用於同時監控數種疾病和/或治療。
更詳細地說,首先,本發明提供了確定或監控受試者的一種或多種疾病狀態的水平(即一種或多種疾病狀態的進展)的方法,是通過(ⅰ)通過測量已知可能具有某種疾病狀態的受試者的細胞中的細胞組分的豐度而得到診斷特徵;(ⅱ)首先通過測量在每種疾病狀態的多種水平下在類似受試者的細胞中存在的細胞組分的豐度而得到應答特徵,其次插入由此得到的應答特徵,從而獲得所監控的每種疾病狀態的內插幹擾應答特徵;(ⅲ)根據一些客觀測量,確定每種疾病狀態的內插幹擾應答特徵中,診斷特徵與確定的內插應答特徵的組合之間相似性最大的。於是,利用與由此確定的疾病狀態的內插幹擾應答特徵相關的疾病水平來指示特定疾病狀態的水平。
其次,本發明提供了確定或監控對受試者的一種或多種治療的作用的方法,是通過(ⅰ)通過測量經受一種或多種治療的受試者的細胞中各細胞組分的豐度而得到診斷特徵,(ⅱ)首先通過測量在每種治療作用的多種水平下在類似受試者的細胞中存在的細胞組分的豐度而得到應答特徵,其次插入由此得到的應答特徵,從而獲得所監控的每種治療的內插幹擾應答特徵;(ⅲ)根據一些客觀測量,確定每種治療的內插幹擾應答特徵中,診斷特徵與確定的內插應答特徵的組合之間相似性最大的。於是,利用與由此確定的治療的內插幹擾應答特徵相關的作用水平來指示特定治療的作用。在這種實施方案的不同方面,本發明的方法可用於監控治療的有益作用或不利作用。例如,該方法可用於監控治療(例如,一種或多種藥物或化學治療)的毒性作用。
本發明還提供了用於分析受試者的一種或多種疾病狀態的水平和/或對受試者的一種或多種治療的作用的計算機系統。該計算機系統包括信息處理器,和與所述處理器連接的編碼一個或多個程序的存儲器。存儲器中編碼的這些程序讓處理器執行上述方法的各個步驟,其中診斷特徵和幹擾應答特徵隨著輸入而被計算機系統接收。
在另一個實施方案中,本發明還提供了用於確定疾病狀態水平或治療作用水平的工具包。在另一個實施方案中,本發明提供了包含可以在本發明的上述任何一個實施方案中使用的、關於一種或多種疾病或治療的應答特徵數據(即應答特徵)的資料庫。
在上述實施方案的各個方面中,診斷特徵可以通過測量基因表達、蛋白質豐度、蛋白質活性或這些量度的組合來確定。在上述實施方案的優選方面,確定的每種疾病狀態或治療的內插應答特徵是將診斷特徵和所評估的所有疾病狀態或治療的確定內插應答特徵的組合之間的差值的目標函數最小的內插應答特徵。
4、附圖的簡要描述

圖1舉例說明了基因表達對酵母菌-釀酒酵母中的SUN2基因的兩個(二倍體)拷貝之一的缺失的應答;缺失突變體中的mRNA表達水平與野生型菌株中的表達水平的比值的log10繪製在縱軸上,與轉錄物的分子豐度大概成比例的雜交強度繪製在橫軸上;將在5次重複實驗中mRNA表達一致升高或降低的那些基因標記出來,並用誤差線作標誌,指示五次重複測量的標準偏差。
圖2說明了大約6000個測量的酵母基因中,對甲氨蝶呤藥物接觸具有最大表達比值變化的30個酵母基因的應答曲線;甲氨蝶呤接觸濃度是3、6、25、50、100和200μM;100μM滴定導致了50%生長缺陷;在適宜橫坐標的-0.5處應答已調整至0。
圖3說明了希爾函數與圖2中說明的基因YOL031C的應答的擬合。
圖4說明了本發明的計算機系統的示範實施方式。
5、發明詳述這部分是對本發明及其應用的詳細說明。這種說明是通過對本發明通用方法的更多細節和特性的幾個範例性描述完成的。這些實施例是非限制性的,對於本領域技術人員來說顯而易見的那些相關變化也要包括在所附的權利要求書中。以下這些實施例是對伴隨通用方法的數據採集步驟的實施方案的說明。
5.1.介紹本發明包括監控受試者的一種或多種疾病狀態的水平和/或對受試者的一種或多種治療的效力的方法。合適的受試者包括細胞,特別是真核細胞,或者更優選是生物體或動物,特別是哺乳動物。具體地說,我們常常希望監控充當人類類似疾病或治療的模型的實驗室動物(諸如小鼠)的疾病狀態和/或治療情況。另一方面,本發明的方法可以用於獸醫目的,即,用於監控動物(諸如狗、貓、馬、小雞、母牛等)的疾病狀態和/或治療情況。在一個特別優選的實施方案中,本發明的受試者是病人。
方法包括將用於說明要確定的疾病狀態的水平(例如階段或進展)或對其的治療效力的水平的細胞的生物學狀態的量度與響應已知的疾病狀態水平或已知的治療效力水平而產生的細胞生物學狀態的變化的量度進行比較。
這部分首先介紹了某些概念,包括生物學狀態和疾病狀態的概念。接著是對本發明方法的簡要和非限制性的概述。接下來的部分則更詳細地介紹了本發明的方法。
儘管為了簡單起見,本說明書經常提到單細胞(例如,「從單基因被幹擾的細胞分離的RNA」),但本領域技術人員將理解,本發明的任何一個特定步驟多半是使用大量基因類似細胞,例如來自培養細胞系的細胞進行的。這些類似細胞在本文中叫做「細胞型」。這些細胞既可以來自天然的單細胞生物體,也可以來自多細胞高級生物體(例如人細胞系)。
具體地說,5.1部分描述了本發明的某些初步概念。5.2部分概括描述了本發明的方法。5.3部分描述了本發明方法的優選分析實施方案。5.4部分描述了測量細胞組分的方法。
生物學狀態本發明的方法包括測量和觀察細胞的生物學狀態的方法。本文中所用的「細胞的生物學狀態」的意思是指細胞組分集合的狀態,他們足以描繪用於預期目的的細胞的特性,諸如描繪藥物的作用情況。對這些組分的狀態進行的測量和/或觀察可以是針對它們的豐度(即,在細胞中的量或濃度),或者它們的活性,或者它們的修飾狀態(例如磷酸化),或者與藥物作用的特徵有關的其他量度。在不同的實施方案中,本發明包括對不同的細胞組分集合進行這類的測量和/或觀察。這些不同的細胞組分集合在本文中也叫做細胞的生物學狀態情況。
在本發明中測量的一種有用的細胞生物學狀態情況是其轉錄狀態。細胞的轉錄狀態包括在給出的一組條件下,細胞中的組分RNA種類、尤其是mRNAs的同一性和豐度。優選地,測量細胞中的所有組分RNA種類的主要部分,但至少要測量足夠的部分以便描繪所研究的藥物作用的特徵。轉錄狀態是目前在本發明中測量的生物學狀態的優選情況。它可方便地通過例如藉助現有的幾種基因表達技術中的任何一種測量cDNA豐度來確定。
在本發明中測量的另一種有用的細胞生物學狀態情況是其翻譯狀態。細胞的翻譯狀態包括在給出的一組條件下,細胞中的組分蛋白質種類的同一性和豐度。優選地,測量細胞中的所有組分蛋白質種類的主要部分,但至少要測量足夠的部分以便描繪所研究的藥物作用的特徵。正如本領域技術人員已知的那樣,轉錄狀態常常是翻譯狀態的典型。
其他細胞生物學狀態情況在本發明中也是有用的。例如,本文中使用的術語「細胞的活性狀態」包括在給出的一組條件下,細胞中的組分蛋白質種類(以及可選的催化活性核酸物質)的活性。正如本領域技術人員已知的那樣,翻譯狀態常常是活性狀態的典型。
適當時,本發明也適合細胞生物學狀態的「混合」情況,其中將不同細胞生物學狀態情況的量度結合起來。例如,在一種混合情況中,某些RNA種類和某些蛋白質種類的豐度與某些其他蛋白質種類的活性的量度結合。另外,從下文中將領會到,本發明也適合可測量的其他細胞生物學狀態情況。
無論在本發明的特定實施方案中測量和/或觀察的細胞生物學狀態情況是什麼,生物系統中的幹擾都將影響許多組分。具體地說,作為細胞中已知將存在的調節、體內穩態和補償網絡和系統的結果,即使細胞中只有一個單獨的組分遭到直接破壞,沒有直接影響任何其他組分,這種情況也將惡化並經常導致不可預測的間接影響。
在本文中用一種單個的假想蛋白質-蛋白質P的抑制作為例子。儘管只有蛋白質P的活性被直接破壞,但受蛋白質P抑制或刺激的其他細胞組分,或者為了補償蛋白質P活性的損失而升高或減少的其他細胞組分也將受到影響。再其他的細胞組分將受到次級組分的濃度或活性變化的影響,等等。其他細胞組分的這些變化可用於定義與所給細胞組分的破壞有關的特定細胞組分變化的「特徵」。
本發明中優選測量細胞的轉錄狀態,這不僅是因為它相對容易測量,而且是因為雖然所研究的蛋白質可能不直接調製轉錄,但細胞中蛋白質活性即使有輕微的破壞也幾乎總是通過直接或間接的作用導致轉錄狀態發生可測量的變化。蛋白質活性水平的破壞改變細胞轉錄狀態的原因是由於先前提到的反饋系統或網絡以補償方式對感染、基因修飾、環境變化、藥物給藥等作出反應,這主要是通過改變基因表達或轉錄的模式而作出的。作為內部補償的結果,對生物系統的許多幹擾儘管只對該系統的外部行為具有減弱了的作用,但仍然能深刻影響細胞中單獨要素(例如基因表達)的內部應答。
疾病狀態根據本發明,疾病狀態指的是任何異常的細胞生物學狀態。因此,疾病狀態的出現可以通過用於確定細胞的生物學狀態的相同生物組分集合來識別。一般說來,疾病狀態對生物系統是有害的。
疾病狀態尤其可能是環境病原體導致的結果,例如病毒感染(例如AIDS,B型肝炎,C型肝炎,流感,麻疹等),細菌感染,寄生蟲感染,真菌感染或由其他一些生物體引起的感染。疾病狀態也可能是其他一些環境因素(諸如化學毒素或化學致癌物)導致的結果。在本文中,疾病狀態還包括遺傳疾病,其中一個或多個基因拷貝改變或破裂了,由此影響了其生物功能。範例性的遺傳疾病包括但不限於多囊腎病,家族性Ⅰ型多發性內分泌腺瘤形成,多發性神經纖維瘤,家族黑蒙性白痴,杭廷頓氏舞蹈病,鐮狀細胞性貧血,地中海貧血和唐氏症候群,以及其他遺傳疾病(參見,例如《遺傳病的代謝和分子基礎》第7版,McGraw-Hill有限公司,紐約)。
其他範例性的疾病包括但不限於癌症,高血壓,早老性痴呆,神經變性疾病,和神經精神病如雙極情感性精神病或妄想性精神分裂症。範例性的癌症類型包括但不限於下表Ⅰ中列出的那些。在一個具體的實施方案中,要確定其水平或進展、或要按照本發明監控對其的治療的疾病是遺傳疾病。因此,在一個具體的實施方案中,疾病是與基因突變,例如易位、缺失或點突變(例如費城染色體)有關的癌症。表Ⅰ惡性腫瘤及相關疾病白血病急性白血病急性淋巴細胞性白血病急性骨髓性粒細胞性白血病原始粒細胞性白血病前髓細胞性白血病粒-單核細胞型白血病單核細胞性白血病紅白血病慢性白血病慢性骨髓性(粒細胞性)白血病慢性淋巴細胞性白血病真性紅細胞增多淋巴瘤何杰金氏病非何杰金氏病多發性骨髓瘤瓦爾登斯特倫氏巨球蛋白血症重鏈病固體腫瘤肉瘤和癌纖維肉瘤粘液肉瘤脂肉瘤軟骨肉瘤骨原性肉瘤脊索瘤血管肉瘤內皮肉瘤淋巴管肉瘤淋巴管內皮肉瘤滑膜瘤間皮瘤尤因氏瘤平滑肌肉瘤橫紋肌肉瘤結腸癌胰腺癌乳腺癌卵巢癌前列腺癌鱗狀上皮細胞癌基底細胞癌腺癌汗腺癌皮脂腺癌乳頭狀癌乳頭狀腺癌囊腺癌髓樣癌支氣管癌腎細胞癌肝細胞瘤膽管癌絨膜癌精原細胞瘤胚胎性癌維耳姆斯氏瘤宮頸癌子宮癌睪丸瘤肺癌小細胞肺癌膀胱癌上皮癌神經膠質瘤星形細胞瘤成神經管細胞瘤顱咽管瘤室管膜瘤松果體瘤成血管細胞瘤聽神經瘤少突神經膠質瘤腦膜瘤黑素瘤成神經細胞瘤成視網膜細胞瘤事實上,關於本發明,任何與疾病或機能紊亂有關的生物學狀態都認為是疾病狀態。本發明中所用的「疾病或疾病狀態的『水平』」是反映疾病或疾病狀態的進展或狀態的任意量度。一般而言,疾病或疾病狀態將通過多個水平或階段向前發展,其中疾病的影響逐漸變得嚴重。
因此,本文中所用的「治療或治療方案」指的是為了減少或消除疾病的症狀而採取的治療方案。治療方案一般將包括例如一種或多種藥物的規定劑量。
理想地,治療作用對生物系統將是有益的,這種治療將降低疾病狀態的水平。但是,在許多情況下,治療作用對生物系統將是不利的。例如,許多治療方法,諸如用藥或化學治療,具有毒副作用。在這類情況下,對副作用進行監控是重要的,以便在副作用變得太嚴重之前通過例如減少劑量或完全終止治療來調節治療方案。
一般說來,疾病或疾病狀態將對生物系統的組分有特別的影響,即「幹擾」。這些作用可因此與疾病狀態的水平關聯起來。具體地說,至少在包含低水平幹擾的低水平疾病狀態下,單個疾病一般將通過可與特定疾病或疾病狀態獨立關聯的、不同的、獨立的幹擾來介導它們的作用。同樣,藥物或可在治療中使用的其他試劑將各自對生物系統的狀態產生獨特的幹擾,這些幹擾可以與特定治療效力的水平關聯起來。
在另一個實施方案中,本發明的方法也可用於診斷或甄別疾病狀態的出現。
5.2.從表達特徵監控疾病狀態和治療這部分首先介紹了本發明方法的概況,其次進一步舉例說明了這些方法的主要內容。
本發明方法的概述本發明的方法可確定受試者的一種或多種疾病狀態的水平(例如階段或進展),更具體地說,可檢測受試者的與一種或多種疾病狀態相關的生物學狀態的變化。本發明的方法也可用於監控經歷一種或多種治療的受試者的一種或多種疾病狀態。因此,本發明也提供了用於確定或監控對受試者的一種或多種治療的效力(即,確定治療作用的水平)的方法。在一個具體的實施方案中,本發明的方法可以用於評定臨床試驗中的治療效力,例如,在這類臨床試驗中作為成功或失敗的早期替代標誌。
本文中所用的「表達特徵」包括指示細胞生物學狀態情況的多種細胞組分的量度。這類量度可包括例如RNA或蛋白質豐度或活性水平。
受試者的細胞的生物學狀態情況,例如轉錄狀態,翻譯狀態或活性狀態,如5.4部分中所述進行測量。這些量度的匯總,可選地用圖表示,在本文中叫做「診斷特徵」。測量對已知的相關疾病狀態有反應,或者如果是在監控治療效力,則是對已知的相關治療作用有反應的一個或多個類似受試者的與在診斷特徵中測得的那些類似的細胞生物學狀態情況,例如轉錄狀態。這些量度的匯總,可選地用圖表示,在本文中叫做「應答特徵」或「幹擾應答特徵」。將應答特徵插入在所測量的蛋白質活性範圍內的所有蛋白質活性水平的預計應答特徵中。在要監控治療效力的情況下,應答特徵可以與有益作用、不利作用如毒性作用、或與有益作用和不利作用二者關聯起來。
更普遍而言,本發明的方法允許某人監控個體受試者的多種疾病狀態或治療情況;例如對具有數種基因突變(每種各自與一種特定疾病有關)的受試者,或者對同時經歷數種治療方案的受試者(例如,服用數種藥物的病人,每種藥物都有不同的作用)。因此,可以分開得到每種疾病或治療的應答特徵。
將診斷特徵中的細胞組分與在內插幹擾應答特徵中發生改變的細胞組分進行比較,目的是找出疾病狀態或治療作用的水平,它們的幹擾特徵與整個或實質整個診斷特徵相一致。如果正在監控多種疾病狀態或治療,則將診斷特徵與單個的每種疾病或治療的幹擾應答特徵的一些組合進行比較。當發現在應答曲線中發生改變的大多數細胞組分在這兩種特徵中具有實質相同的值時,基本上所有診斷特徵與應答特徵相一致。優選地,在應答曲線中發生改變的細胞組分中至少有75%可以匹配上,更優選至少有90%可以如此匹配上。當這兩組數據在考慮了實驗誤差後很可能是相同的,此時細胞組分在這兩種特徵中具有實質相同的值。
在一個優選的實施方案中,診斷特徵與應答曲線的對比利用下列方法進行將測得的診斷特徵與針對一些幹擾水平(即針對一些疾病或治療效力的水平)而確定的幹擾應答特徵之間的差異的客觀量度最小。通過在將這種差異最小的幹擾值下從幹擾曲線中提取出幹擾應答特徵而將該客觀量度最小。
客觀量度的最小化可以利用標準數值分析技術進行。參見,例如Press等,1996年,Numerical Recipes in C,第2版,劍橋大學出版社,Ch.10.;Branch等,1996年,Matlab優化工具箱使用者指南,Mathworks(Natick,MA)。
對本發明方法的說明以下段落藉助於非限制性的實施例,根據圖1和圖2總體說明了本發明的幾種方法。在真核細胞中,有成百上千個互相連接的信號途徑。出於這個原因,細胞內蛋白質功能的紊亂對其他蛋白質和通過一級、二級、有時是三級途徑相連的其他基因的轉錄會產生很多影響。各種蛋白質功能之間的這種多方面的相互聯繫意味著任何一種蛋白質的改變都很可能導致大量其他蛋白質的補償性變化。具體地說,即使細胞中只有一個蛋白質出現部分破壞,諸如因接觸藥物或因調製基因拷貝數的疾病狀態(例如基因突變)的影響,都會導致其他很多基因轉錄中的特徵補償性變化,轉錄物的這些變化可以用於定義與功能的破壞(即特定疾病狀態或治療)有關的特定轉錄物變化的「特徵」,即使是在蛋白質活性的變化尚不可檢測出來的階段。
圖1說明了在其中SUN2基因的兩個(即二倍體)拷貝之一失去功能的酵母菌釀酒酵母的缺失突變體中測量的診斷特徵的例子。該圖說明了這種酵母菌的基因組中大約6000個基因的mRNA表達水平。具體而言,將缺失突變體中的mRNA表達水平與野生型菌株中的表達水平的比值的log10繪製在縱軸上,與分子豐度約略成比例的雜交強度繪製在橫軸上。如5.4部分中所述,這些基因表達水平的測量用基因轉錄陣列進行。將在重複實驗被一致正向調節或反向調節的基因標記出來,並用誤差線作標誌。這些誤差線指示了從5個微陣列得到的對每種基因轉錄物進行的五次重複測量的標準偏差。
儘管不知道SUN2基因產物將是轉錄因子,但有15種基因響應這種雜合缺失而被正向或反向調節了2倍以上。下面的表Ⅱ中顯示了對於表達的變化達到2倍以上的那些基因來說,造成這種mRNA表達變化的因子的log10。這些變化中有許多明顯大於標準偏差。對SUN2基因自身的轉錄水平的測量顯示,其mRNA表達水平因基因拷貝數從2降至1而降低到小於原來的二分之一。因此,蛋白質活性水平幾乎已確定地降低到小於原來的二分之一。然而,在其他基因的表達特徵中有不同的應答。
表Ⅱ
事實上,在有可能通過監控蛋白質功能來檢測變化之前很久就可監控這些補償性變化。因此,通過測量在不同生物學狀態水平,具體地說,在不同疾病狀態水平或在不同治療效力水平下的基因表達,就有可能在蛋白質功能出現可檢測的變化之前很久構造出能顯示特定疾病或治療的作用的應答曲線。當細胞的生物學狀態遭到破壞或部分破壞時所導致的對細胞中基因的正向調節和反向調節表示了細胞為維持體內穩態而發生的補償性變化。當轉錄中的這些補償性變化發生在細胞顯示出任何可識別的生理變化之前時,這些表達特徵是細胞生物學狀態的非常敏感的指徵。當該靈敏度用於診斷疾病狀態的出現時它具有有效值,在監控對具有疾病狀態的受試者的治療效力中它也具有有效值。
圖2說明了在二氫葉酸還原酶的離散蛋白質活性水平下測量的幹擾應答特徵的例子。具體地說,該圖說明了在酵母菌釀酒酵母的基因組中的大約6000個基因中,響應藥物甲氨蝶呤(已知其主要是通過破壞二氫葉酸還原酶的活性發揮作用)的六個不同滴定試驗而產生最大表達變化的30個基因的mRNA表達水平。如5.4部分中所述,這些基因表達水平的測量用基因轉錄陣列進行。圖2中的幹擾應答特徵可以按照下面的5.3部分中公開的方法插入,以形成任何活性水平的二氫葉酸還原酶的幹擾應答特徵,並由此與藥物甲氨蝶呤的效力關聯起來。
幹擾應答特徵,如圖2中顯示的那些,可以例如通過測量患有相同疾病的一個或多個類似受試者的細胞組分來產生和測量。然後,通過按照傳統方法監控疾病狀態,這些幹擾應答特徵將與類似受試者的疾病狀態的「水平」相連繫,例如,與疾病狀態的進展相連繫。
同樣,用於監控治療效力的幹擾應答特徵可以通過測量經受相同治療的一個或多個類似受試者的細胞組分來產生和測量。通過使用傳統方法(例如蛋白質功能測定法)監控對類似受試者的治療效力而使幹擾應答特徵與治療效力發生連繫。
因此在這類系統中採用用於得到必需的基因表達應答曲線和蛋白質活性數據的被動方法。用於得到基因表達應答曲線和蛋白質活性數據的被動方法包括,例如,從已經受了不同劑量的藥物治療安排的個體採集組織或血液樣品,也可使用伴有已知的有關至少一種中級水平的疾病狀態的雜合突變的個體。
在某些實施方案中,獲得其幹擾特徵的「類似受試者」可以與正對其疾病狀態或治療作用進行監控的受試者是同一個體(即,同一生物體或病人)。例如,幹擾應答特徵可以從剛好在某一點具有疾病狀態的個體得到,然後用於監控剛好在其他某點時該疾病狀態的復發。
在其他一些實施方案中,最好監控多種治療對受試者的作用,例如包含藥物A、B和C的方案。在這類實施方案中,可以首先通過監控單獨的藥物A對同一受試者的作用並使該作用與對來自該受試者的細胞的細胞組分測量發生連繫而得到藥物A的幹擾應答特徵。同樣,接下來可以用相同的方法得到單獨的藥物B和單獨的藥物C的幹擾應答特徵。然後這些幹擾應答特徵可以用於監控這些治療的組合(在該實例中是藥物A、B和C的組合)對這個受試者的累積作用。
在另一些實施方案中,得到一種或多種疾病狀態和/或一種或多種藥物療法的幹擾應答特徵並校準成一種或多種臨床作用。可例舉的臨床作用包括但不限於血壓、體溫、血糖或尿糖水平、膽固醇水平(包括,例如HDL和LDL水平)、病毒負荷水平、血液的血細胞比容水平、白細胞數、腫瘤大小等。事實上,可以在臨床環境中容易地得到的病人的任何生化和/或生理狀態量度都是臨床作用的量度。
在這類實施方案中,病人的一種或多種疾病狀態的水平可以通過監控該病人的診斷特徵並將其與被校準成一種或多種疾病狀態的幹擾應答特徵的一種或多種臨床作用進行比較來確定和/或監控。同樣,對病人的一種或多種藥物療法可以通過監控經受該種藥物療法(或該幾種藥物療法)的病人的診斷特徵並將其與被校準成一種或多種藥物療法的幹擾應答特徵的一種或多種臨床作用進行比較來監控。然後,通過調節該種藥物療法(或該幾種藥物療法),直到病人的診斷特徵與針對所需臨床作用而得到的特徵相一致,就可容易地使病人達到期望的臨床作用。
儘管本發明說明書的大部分涉及基因表達數據的測量和建模,但本發明同樣適合於其他細胞生物學狀態情況的測量,如蛋白質豐度或活性的測量。用於直接測量蛋白質活性的方法是本領域技術人員眾所周知的。例如,這類方法包括倚賴於具有對蛋白質的抗體配體的方法,諸如蛋白質印跡法(參見,例如Burnette,1981年,《美國分析生物化學》112:195-203)。這類方法還包括酶活性測定法,它們可用於大多數已進行了充分研究的蛋白質藥物目標,包括但不限於HMG CoA還原酶(Thorsness等,1989年,《分子與細胞生物學》9:5702-5712),和鈣調磷酸酶(Cyert等,1992年,《分子與細胞生物學》12:3460-3469)。Deshaies等在1988年的《自然》332:800-805中給出了一個通過關閉可控啟動子來關閉一項特定基因功能,並經蛋白質印跡法使這與蛋白質耗竭發生連繫的例子。
圖2中的幹擾應答曲線說明了這類曲線的普遍預期形狀。這種預期形狀包括一個低幹擾控制參數的閾值下區域,在這個區域內細胞組分實際上對幹擾沒有反應。在這個閾值下區域之後,幹擾(即疾病或治療)開始升效,細胞組分的特徵值被擾亂。被擾亂的數值的曲線通常最好朝向飽和時的漸近水平單調上升或下降,超過漸近水平後就不再觀察到進一步的改變。應答曲線在這個飽和區內終止。
事實上,在有些情形下,可能和預期的是更複雜的非單調應答曲線形狀。例如,在幹擾具有毒性作用的情況下,如毒性可能使細胞組分的上升豐度開始下降,並且可能使下降豐度開始下降得更快。另外,生物系統中已知將存在的非線性和反饋機理也可導致非單調的多相應答。這種應答可能隨著幹擾幅度的升高或接觸藥物而先升高然後下降。例如,幹擾可通過具有不同閾值且具有相反作用的兩個途徑作用於某些細胞組分,從而產生先升高後降低(或先降低後升高)的應答。
本發明的方法根據單調應答曲線(諸如圖2中說明的那些)進行了說明和初步描述。本發明的方法主要適用於對生物系統的低水平的幹擾,例如在疾病的早期發生的。這些幹擾一般將足夠低,以避免達到可觀察到毒性作用和/或非線性和反饋作用的水平。然而,正如對本領域技術人員來說顯而易見的那樣,本文中描述的方法也適用於非單調應答曲線。
5.3.分析實施方案本發明方法的分析實施方案包括用於通過一些客觀功能來評估在特定水平的疾病狀態下、或在特定水平的治療效力下,診斷特徵與應答特徵之間的差值的實施方式。本發明的方法包括確定在與特定疾病狀態或治療作用相關的多種水平下的、該特定疾病狀態或治療的典型幹擾應答特徵數據。然後將診斷特徵數據與應答特徵數據進行對比,由此確定疾病狀態的水平和/或治療作用的水平。
在本發明的其他一些實施方式中,某些步驟可以省略或按照不同於上面所述的順序進行。例如,在某些實施方式中,某種疾病和/或治療、或者數種(最好是相關的)疾病和/或治療的幹擾應答特徵數據已經得到了,對每項分析來說,就不必再單獨進行獲得這些數據的步驟。
5.3.1.表達特徵的表示本發明方法優選通過測量幹擾應答特徵開始。在許多情況下,將已經測得了特定疾病狀態和/或治療的幹擾應答特徵。在其他情況下,這種應答數據必須在進行本發明的後續步驟之前測得。測量對類似受試者進行,即,對於本領域技術人員來說在要確定的疾病狀態或治療效力的水平方面足夠相似的受試者,以期望表達特徵將足夠相似以提供有用的幹擾應答特徵。在一個優選的實施方案中,類似受試者是顯示疾病狀態的同一物種中的一個受試者,並且可以可選地為同一性別和/或近似年齡。
如上所述,幹擾特徵包括細胞組分的相關特性的相對變化的量度,這些變化與特定疾病狀態的多個已知水平(例如進展的階段)和/或特定治療作用的已知水平相互連繫,例如,是通過疾病症狀的變化或疾病進展或嚴重性的已知標誌的變化觀察到的。這類疾病進展的標誌包括,例如甲胎蛋白,鹼性磷酸酶,鈣調磷酸酶,肌苷一磷酸,等等。
更具體地說,測量天然基因表達水平(即不存在疾病狀態或治療)與受幹擾的基因表達水平(即存在疾病狀態和/或治療)的比值(或這些比值的對數)。
在下文中,變量「p」一般是指幹擾水平,它們與特定疾病狀態或治療作用的水平相互連繫。變量「R」一般是指幹擾應答數據。更詳細地說,第一個幹擾水平稱之為「p1」。對第k個細胞組分的幹擾應答是Rk。因此,Rk(p1)是指第k個細胞組分在第一個幹擾水平下的應答。
類似地得到診斷特徵數據,如果尚未得到的話,必須將其測量出來。如上所述,數據通過測量所研究的細胞(即來自受試者的細胞)中的細胞組分的水平而得到。當獲得該數據時,疾病狀態或治療效力的實際水平通常是未知的。在下文中,變量「D」一般是指診斷特徵數據。更詳細地說,第k個細胞組分的診斷特徵是Dk。一般說來,Rk(p)和Dk的值是每個細胞組分的表達比值的log10。表達比值是受幹擾的系統中的水平與天然系統中的水平之間的比值。
一般而言,獲得診斷特徵數據時的實際水平將與實際獲得幹擾應答特徵時的任何一種幹擾水平不一致。因此,必需插入幹擾應答數據,以得到需要的值。這種插值法優選通過樣條擬合或通過模型擬合來完成。插值法及任何所需參數的選擇在步驟303中完成。
在樣條擬合中,幹擾應答數據通過將適宜的樣條插值函數S乘以測得的數據值得到的乘積求和而插入,如下列等式所示Rk(u)=∑S(u-p1)Rk(p1)(1)1變量「u」是指要評估幹擾應答數據時的疾病或治療效力的任意水平。一般說來,S可以是在響應函數中預期具有結構的寬度特性的有限載體的任何平滑的、或者至少是分段連續的函數。範例性的寬度可以選擇為是被插入的應答函數從其漸近值的10%升高至90%的過程經過的距離。例舉的S函數包括線性和高斯插值。
在模型擬合中,幹擾應答通過利用單一參數函數逼近每種應答而插入。適宜用於逼近轉錄狀態數據的一個範例性的模型擬合函數是希爾函數,它具有可調節的參數a、u0和n。H(u)=a(u/u0)n1+(u/u0)n---(2)]]>對於幹擾應答的每種細胞組分來說,都要獨立地選擇這些可調節的參數。優選地,對可調節參數進行選擇,使得對於每種細胞組分來說,來自Rk(p1)的位距H(p1)的平方和最小。這種優選參數調節法在本領域中被認為是H對Rk的最小二乘方擬合。其他可能的模型函數是基於多項式擬合,例如通過各種已知種類的多項式。
具有希爾函數的模型擬合根據圖2和3來加以說明。如上所述,圖2說明了受到甲氨蝶呤幹擾並藉助測量來識別的例子。該圖說明了在酵母菌釀酒酵母的基因組中的大約6000個基因中,響應6個不同的甲氨蝶呤給藥水平而產生最大表達變化的30個基因的RNA表達水平。圖3說明了希爾函數對這些基因表達水平之一的幹擾應答的擬合。具體地說,酵母基因YOL031C通過具有參數n=2、a=-0.61和log10(u0)=1.26(這些參數是利用先前描述的最小二乘方法選定的)的希爾函數擬合。
既然所有這30種基因都具有單調性良好的最大應答,即,沒有一個應答隨著給藥的增加而從其最大幅度顯著下降(或從其最小幅度顯著升高),所以希爾函數是適宜的模型擬合函數。對於非單調行為它也許不適合。
得到了幹擾應答對任何水平的幹擾的表示為p的插值後,可以將診斷表達特徵D與幹擾應答曲線R(p)進行對比,以找到對所有可k(Dk-Rk(p))2}---(3)]]>{p}能的p值的最佳擬合。按照一種優選的方法,對所有可能p值的最佳擬合從相關最小二乘方近似問題的最小化來確定。
在等式3中,內插應答特徵和診斷特徵的差值的絕對平方對曲線中的所有細胞組分(用下標k表示)求和。診斷特徵關於應答曲線的最佳擬合從相對蛋白質活性水平p的該總和的最小化來確定。最小二乘方等式3的最小化使用可用的許多數值法中的任何一種進行。參見,例如Press等,1996年,umerical Reccipes in C,第2版,劍橋大學出版社,Chs.10,14;Branch等,1996年,Matlab優化工具箱使用者指南,Mathworks(Natick,MA)。
一般,從實驗到名義上的重複實驗在應答的漸近值上會有一些差異。在重複實驗中個體細胞組分具有類似的相對應答幅度,但在一個實驗中所有應答可能有規則地更大或更小。這可能引起在等式3中確定的p值產生或高或低的偏差。能防止這些系統幅度偏差值偏置導出的p值的另一種擬合方法是將應答特徵和診斷特徵之間的相關性最大化。該方法與最小二乘方法在數學上密切相關。按照該方法,蛋白質活性水平p從解等式4來確定。max{kRk(p)Dk[(kRk2(p))(kDk2)]1/2}---(4)]]>{p}等式4可以利用在最小二乘方法中描述的方法求解。對本領域技術人員來說不言而喻的是,上述擬合方法相當於將等式4的負值最小化。
在某些情況下,等式4將具有非常淺的、因此是非常不確定的最大位置。具體而言,在許多情況下,應答特徵R(p)在不同的p下看上去將非常相似,只是隨著p的升高整體按比例地縮放。在這些情況下,對所有可能的p值的最佳擬合優選利用等式3中的最小二乘方法來確定。在不同細胞組分的相對應答幅度隨著疾病狀態或治療作用的水平的改變而顯著變化的情況下,例如,在產生與圖2中描述的那些類似的應答曲線的情況下,對所有可能的p值的最佳擬合優選通過最大化等式4來確定。
在某些實施方案中,本發明的方法可以用於同時監控多種疾病狀態的水平,或用於同時監控多種治療的效力。在這類實施方案中,分開確定有關第ⅰ種疾病狀態或治療的第k個細胞組分在第1個幹擾水平下的幹擾應答Ri,k(pi,1)。如上所述插入每種疾病的應答特徵,以生成有關每種疾病狀態或治療的內插應答特徵Ri,k(pi)。然後可以將診斷表達特徵D與每種疾病狀態或治療的幹擾應答曲線Ri(pi)的組合進行對比,以找出對所有可能的{pi}值的最佳擬合。在一個特別優選的實施方案中,治療的作用和/或疾病的水平足夠低,沒有觀察到上面所討論的非線性或反饋作用。在這樣的實施方案中,幹擾應答特徵可以簡單地比作每種疾病的幹擾應答曲線的總和,即,比作∑Ri(pi)。因此,在通過最小化最小二乘方問題來確定最佳擬合的實施方案中,最佳擬合是對等式5的解答。min{k(Dk-iRi,k(pi))2}---(5)]]>{pi}5.3.2.評定統計學顯著性提取出了與診斷特徵最佳擬合的幹擾應答特徵之後,最好(儘管是可選的)在某些實施方案中對相應的擬合賦予統計學顯著性。
應答特徵對診斷特徵的擬合的統計學顯著性通過將從等式3或5的解答確定的最小殘餘的值與殘餘的預期概率分布進行對比來確定。就這種分布而言的最小殘餘越不可能,相應的擬合就越具顯著性。在使用相關最大化方法的情況下,同樣的方法可以用於等式4中的最大值。具體地說,可以找到最大值的預期分布(如下文所述),並且從這個分布確定實際得到的最大值的顯著性。
殘餘的預期概率分布可以利用本領域中已知的任何一種方法來估計。一般來說,這個分布是基於某種有關輸入概率分布的事先假定而分析估定的。由於在這種情況下進行這樣的分析估定是困難的,因此最好通過在Fisher所描述的方法基礎上建模來估計殘餘分布。參見,例如Conover,第2版,1980年,應用非參數統計學,John Wiley。該方法通過獲得輸入數據的排列或隨機子集而提供了一個經驗殘餘分布。詳細地說,在這裡,輸入可以關於在診斷特徵中測量的細胞組分而重新排列。
Dk-Dn(k)Ri,k(Pi,l)-Ri,n(k)(Pi,1)(6)
按照優選的方法,通過用隨機的輸入數據重複求解等式5(或等式4)並累加這些殘餘而形成經驗殘餘分布,就可構造出殘餘分布。因此,構造的經驗殘餘分布來自與真實數據具有相同總體統計學特徵的隨機數據。詳細地說,首先,將診斷特徵數據或應答特徵數據(但不是二者都)相對於細胞組分指數而隨機化。這種隨機性轉化由以下轉化表示。
在等式6中,∏表示對每個特徵獨立地選定的幹擾。診斷特徵或每個應答特徵(但不是二者都)按照等式6隨機化。因此,隨機化的表達曲線數據通過獨立地排列量度點而從測量數據得到。其次,等式5(或等式4)利用選定的數值近似技術求解,並保存所得到的殘餘的值。重複這些步驟以充分隨機化,從而構造充分顯著的預期殘餘概率分布。為了得到99%或更好的置信水平(即P值小於0.01),需要100次以上的隨機化。
已構造了經驗殘餘分布後,將實際確定的殘餘與構造的分布進行對比,並考慮該分布確定其概率。這個概率是指定給提取出的應答特徵對診斷特徵的擬合的顯著性。換句話說,細胞組分的組合對診斷特徵的任何擬合的統計學顯著性在優選的實施方案中通過小概率值給出,隨機數據通過假定水平的疾病狀態或治療作用比實際數據擬合得更好。
在其中擬合至少具有醫學中常用的95%標準概率閾值的情況下,相應的疾病或治療效力水平可認為具有足夠的統計學顯著性。在其他情況下,不可能達到可接受的顯著性閾值。如果是這樣,那麼在某些實施方案中,有利的是選擇新的幹擾特徵數據,以找出以選定的顯著性閾值與診斷特徵相擬合的應答特徵。
例如,在本發明的其中的方法用於診斷或監控具有特定疾病或疾病狀態的個體的實施方案中,幹擾應答特徵數據常常由來自因特定疾病狀態或其水平而具有已知幹擾的個體的表達特徵數據組成。在這類實施方案中,最好將統計學顯著性指定到已知幹擾的幹擾應答特徵對特性未經過描繪的個體的診斷特徵的擬合。在其中擬合至少具有醫學中常用的95%標準概率閾值的情況下,該個體就可診斷為患有相應的疾病。另一方面,如果擬合不具有至少95%的顯著性,可以將統計學顯著性指定到一種或多種其他幹擾應答特徵對診斷特徵的擬合,其中使用從具有其他不同的已知疾病狀態或其水平的個體得到的幹擾應答特徵,直到確定出確實具有至少95%顯著性的幹擾應答特徵。
5.3.3.實施系統和方法在前面的各個部分中描述的分析方法可優選利用下列計算機系統並按照以下程序和方法實施。圖4說明了適於實施本發明的分析方法的範例性計算機系統。計算機系統401舉例說明為包括內部組件並與外部組件連接。該計算機系統的內部組件包括與主存儲器403互連的處理器402。例如,計算機系統401可以是200 Mhz或更大時鐘頻率的英特爾奔騰處理器並具有32MB或更大的主存。
外部組件包括大容量存儲器404。該大容量存儲器可以是一個或多個硬碟(它們一般與處理器和內存包裝在一起)。這些硬碟的存儲容量一般為1GB或更大。其他外部組件包括用戶界面設備405,可以是監視器和鍵盤;以及定點設備406,可以是「滑鼠」;或其他圖形輸入裝置(沒有圖示)。一般而言,計算機系統401也可以與網絡連接器407連接,該網絡連接器407可以是與其他局部計算機系統、遠程計算機系統、或廣域通訊網絡如網際網路連接的乙太網的一部分。這種網絡連接可以使計算機系統401與其他計算機系統共享數據和處理任務。
在該系統的運行過程中加載到內存中的是幾個軟體,它們在本領域中是標準的,而對本發明又是特別的。這些軟體共同使計算機系統按照本發明的方法工作。這些軟體一般存儲在大容量存儲器404中。軟體410代表作業系統,它可以管理計算機系統401及其網絡互連。例如,該作業系統可以是微軟視窗軟體Microsoft WindowsTM系列的,諸如Windows 95、Windows 98或Windows NT。軟體411代表方便地存在於該系統上的通用語言和函數,以幫助程序執行本發明的特定方法。可用於將本發明的分析方法編寫成程序的語言包括C和C++語言,或者不是優選的JAVA語言。最優選的是,本發明的方法用允許等式的符號輸入項和處理的高級說明包括要使用的算法的數學軟體包編程,由此使用戶不必在程序上編排單個等式或算法。這類軟體包包括Mathworks公司(Natick,MA)的Matlab,Wolfram Research公司(Champaign,Illinois)的Mathematica,或Math Soft公司(Seattle,Washington)的S-Plus。因此,軟體412代表用程序語言或符號軟體包編程的本發明的分析方法。在一個優選的實施方案中,計算機系統還包含有關特定疾病或治療的幹擾應答特徵的資料庫413。更優選的是,資料庫413包含數種疾病和/或治療的幹擾應答特徵。
在一個範例性的執行過程中,為了實施本發明的方法,用戶首先將診斷特徵數據加載到計算機系統401中。這些數據可由用戶從監視器和鍵盤405直接輸入,或者從通過網絡連接器407相連的其他計算機系統輸入,或者在可移動的存儲媒體如CD-ROM或軟盤上(沒有圖示)。接著,用戶啟動執行表達特徵分析軟體412,該軟體執行確定診斷特徵與從某些水平的疾病狀態或治療作用的幹擾應答特徵數據確定的應答特徵之間的差異的客觀函數並將其最小化等步驟。在一個不太優選的實施方案中,用戶加載幹擾應答特徵數據,插入應答特徵數據的步驟利用分析軟體412進行。
本發明還提供了按照本發明的方法用於疾病狀態和/或治療的幹擾應答特徵的資料庫。本發明的資料庫包括有關疾病或治療的幹擾應答特徵,優選有關數種不同的疾病和/或治療,以便同一資料庫可以用於監控數種不同的疾病和/或治療。優選的是,這樣的資料庫將是可以加載到計算機系統中的電子形式的,諸如圖4中示例並在上文中描述的一個。這些電子形式包括加載到用於執行本發明方法的計算機系統的主存403中的、或者在通過網絡連接器407相連的其他計算機的主存中的、或者在大容量存儲媒體404上的、或者在可移動的存儲媒體諸如CD-ROM或軟盤上的資料庫。
在一個優選的實施方案中,本發明的分析方法可以利用用於確定細胞中特定蛋白質的活性水平的工具包來實施。這類工具包含有陣列或微陣列,諸如在下面的5.4.1部分中描述的那些。包括在這類工具包中的微陣列包含一個固相,例如一個表面,一些探針雜交或束縛在該固相的已知位置上。優選的是,這些探針由已知不同序列的核酸組成,每個核酸都能與RNA種類雜交或與從此衍生的cDNA種類雜交。具體地說,本發明的工具包中包含的探針是能與衍生自RNA種類的的核酸序列特異性雜交的核酸,所述RNA種類已知能響應與將要利用該工具包監控的特定疾病或治療有關的幹擾而增加或減少。本發明的工具包中包含的探針優選基本上排除了與不響應與將要利用該工具包確定的疾病狀態或治療作用的特定水平有關的幹擾而增加或減少的RNA種類雜交的那些核酸。
在優選的實施方案中,本發明的工具包還包括幹擾應答特徵的資料庫,諸如在本部分的前面描述的那些資料庫。
在另一個優選的實施方案中,本發明的工具包還包括能加載到計算機系統的存儲器中的表達特徵分析軟體,諸如在本部分的前面描述的和在圖4中示例的軟體。本發明的工具包中包含的表達特徵分析軟體本質上與上述表達特徵分析軟體412相同。這類軟體能執行本發明的分析步驟。優選地,該軟體讓計算機系統的處理器執行下列步驟(a)接收受試者的細胞的診斷特徵,(b)接收與特定疾病狀態或治療作用的水平相關的幹擾應答特徵,和(c)確定在所述診斷特徵和已確定的內插幹擾應答特徵之間具有最大相似性的內插應答特徵。
用於實施本發明的分析方法的其他系統和方法對本領域技術人員來說將是顯而易見的,它們也將包括在所附的權利要求書的範圍內。具體而言,所附的權利要求書想要包括用於實施本發明方法的、對本領域技術人員來說顯而易見的其他程序結構。
5.4.測量方法通過測量因細胞的生物學狀態的幹擾、例如因疾病或治療而改變的細胞組分,就可得到用於本發明的診斷和幹擾應答特徵。這些細胞特性可以是任何一種細胞生物學狀態情況。它們可以是轉錄狀態,其中測量RNA的豐度;翻譯狀態,其中測量蛋白質的豐度;活性狀態,其中測量蛋白質的活性。細胞特性也可以是混合情況,例如,其中測量一種或多種蛋白質的活性以及細胞組分的RNA豐度(基因表達)。這部分描述了用於測量受到被破壞或被擾亂的生物學狀態的影響的細胞組分的範例性方法。本發明也適合這類測量的其他方法。
本發明的基於測量細胞的轉錄狀態的實施方案是優選的。轉錄狀態可以利用對在下文中描述的核酸或核酸模擬探針的陣列的雜交技術來測量,或者利用在接下去的部分中描述的其他基因表達技術來測量。無論怎樣測量,結果都是應答數據,包括表示RNA豐度比例的數值,它們通常反映了DNA表達比例(在RNA降解速率沒有差別的條件下)。5.4.1.部分中描述了這類測量方法。
在本發明的各種可供選擇的實施方案中,可以測量除了轉錄狀態以外的其他生物學狀態,諸如翻譯狀態、活性狀態或混合情況。5.4.2.部分詳細描述了這類測量方法。
5.4.1.轉錄狀態的測量優選地,轉錄狀態的測量通過對轉錄物陣列的雜交進行,在本部分對此作了說明。在本部分的後面描述了轉錄狀態測量的某些其他方法。
轉錄物陣列概述在優選的實施方案中,本發明使用「轉錄物陣列」(本文中也叫做「微陣列」)。轉錄物陣列可以用於分析細胞中的轉錄狀態,尤其是用於測量接觸了所研究的逐級治療水平(諸如所研究的逐級藥物水平)或接觸了所研究的逐級疾病狀態水平的細胞的轉錄狀態。
在一個實施方案中,轉錄物陣列是通過將表示細胞中存在的mRNA轉錄物的可檢測標記的多核苷酸(例如螢光標記的從總細胞mRNA合成的cDNA)與一個微陣列雜交而產生的。微陣列是具有細胞或生物體的基因組中的許多基因(優選大多數或幾乎所有基因)的產物的結合(例如雜交)部位的有序陣列的表面。微陣列可以用多種方法構造,下面將描述其中的幾種。無論是如何產生的,微陣列都具有某些共同特性陣列是可再生的,從而允許有要產生的給定陣列的多個拷貝並可容易地互相對比。微陣列優選較小,通常小於5cm2,並且它們由在結合(例如核酸雜交)條件下穩定的原料製成。微陣列中的給定結合部位或唯一的成套結合部位將特異性地結合細胞中單基因的產物。儘管每個特異性mRNA可能有不止一個物理結合部位(下文中稱作「部位」),但為了清楚起見,下面的討論將假定只有單一部位。
應當理解,當與細胞的RNA互補的cDNA形成並在合適的雜交條件下與微陣列雜交時,在對應於任何特定基因的陣列中對部位的雜交水平將反映從該基因轉錄的mRNA的細胞中的流行情況。例如,當與總細胞mRNA互補的可檢測標記的(例如用螢光團標記的)cDNA與微陣列雜交時,對應於細胞中未轉錄的、基因產物的陣列上的部位(即,能特異性結合基因產物的部位)將具有很小的信號或者沒有信號(例如螢光信號),編碼mRNA的基因是流行的,將具有相對強的信號。
在優選的實施方案中,來自兩個不同細胞的cDNA與微陣列的結合部位雜交。在監控治療效力(例如對藥物的反應)的情況下,一個細胞接受治療,相同類型的另一個細胞則不接受治療。在監控疾病狀態的情況下,一個細胞顯現出特定水平的疾病狀態,而相同類型的另一個細胞不顯現疾病狀態(或其水平)。來自這兩個細胞型中每一個的cDNA進行不同的標記,以便可將它們區別開。在一個實施方案中,例如,來自用藥物處理過(或接觸了途徑幹擾)的細胞的cDNA使用螢光素標記的dNTP合成,而來自未接觸藥物的第二個細胞的cDNA使用羅丹明標記的dNTP合成。當這兩種cDNA混合併與微陣列雜交時,針對該陣列上的每個部位確定來自每組cDNA的信號的相對強度,以及所檢測的特定mRNA的豐度的任何相對差異。
在上述實例中,當螢光團被激發時,來自接受了治療(或病態)的細胞的cDNA將發綠色螢光,來自未經處理的細胞的cDNA將發紅色螢光。結果,當治療對細胞中的特定mRNA的相對豐度沒有直接或間接的作用時,mRNA在這兩種細胞中將同等流行,隨著逆轉錄,紅色標記和綠色標記的cDNA將同等流行。當與微陣列雜交時,對該RNA種類的結合部位將發射兩種螢光團的波長特徵(組合後呈現棕色)。與此相反,當接受治療的細胞用能直接或間接增加細胞中mRNA的流行的治療處理時,綠色與紅色螢光的比例將增大。當治療降低mRNA的流行時,該比例也將降低。
使用雙色螢光標記和檢測方案來定義基因表達的變動已有過記載,例如在Shena等,1995年,「用互補DNA微陣列定量監控基因表達模式」,《科學》270:467-470中,該文在所有場合都整個結合在此作為參考。使用用兩種不同螢光團標記的cDNA的優點在於可以對兩個細胞狀態中對應於每個排列好的基因的mRNA水平進行直接和內部控制的對比,並且因實驗條件(例如雜交條件)之間的較小差異而引起的變化將不會影響隨後的分析。但是,應當認識到,也有可能使用來自單細胞的cDNA,並比較例如接受了治療或病態的細胞中和未經治療或未患病的細胞中的特定mRNA的絕對數量。
微陣列的製備微陣列是本領域中已知的,由可以特異性雜交或束縛在已知位置上的、序列與基因產物對應的探針(例如cDNA、mRNA、cRNA、多肽及其片段)構成的表面組成。在一個實施方案中,微陣列是其中每個位置表示一個離散的由基因編碼的產物(例如蛋白質或RNA)的結合部位的陣列(即,基質),並且其中存在針對生物體基因組中的大多數或幾乎所有基因的產物的結合部位。在一個優選的實施方案中,「結合部位」(下文中稱作「部位」)是核酸或核酸類似物,特定的關連cDNA可以特異性與其雜交。結合部位的核酸或類似物可以是,例如合成低聚物、全長cDNA、小於全長的cDNA、或基因片段。
儘管在一個優選的實施方案中,微陣列含有目標生物體的基因組中的所有或幾乎所有基因產物的結合部位,但這種廣泛性並不是必需的。通常微陣列將含有對應於基因組中至少約50%的基因的結合部位,經常是至少約75%,更經常是至少約85%,甚至是約90%以上,最經常是至少約99%。優選地,微陣列含有與所研究的藥物的作用有關的或者存在於所研究的生物途徑中的基因的結合部位。「基因」被識別為最好至少50、75或99個胺基酸的可讀框(ORF),在生物體中(例如,如果是單細胞)或者在多細胞生物體的一些細胞中,信使RNA從其轉錄。基因組中基因的數目可以從被生物體表達的mRNA的數目來估計,或者通過從基因組的特性已知部分進行外推來估計。當所研究的生物體的基因組的序列已確定時,可以確定ORF的數目,並通過分析DNA序列辨別mRNA編碼區。例如,釀酒酵母基因組的序列已完全確定,據報導具有大約6275個長於99個胺基酸的可讀框(ORF)。對這些ORF的分析表明,有5885個ORF很可能說明蛋白質產物(Goffeau等,1996年,「有6000個基因的生命」,《科學》274:546-567,該文在所有場合都整個結合在此作為參考)。與此相對,估計人類基因組含有大約105個基因。
製備用於微陣列的核酸如上所述,特定關連cDNA與之特異性雜交的「結合部位」通常是附著在該結合部位上的核酸或核酸類似物。在一個實施方案中,微陣列的結合部位是與生物體基因組中的至少一部分基因各自相對應的NDA多核苷酸。這些DNA可以通過例如對來自基因組DNA、cDNA(例如通過RT-PCR)或克隆序列的基因節段的聚合酶鏈式反應(PCR)擴增得到。PCR引物是在基因或cDNA的已知序列的基礎上選定的,它們可導致唯一片段(即,與該微陣列上的任何其他片段不共有10個以上連續相同序列的鹼基的片段)的擴增。電腦程式可用於設計具有所需特異性和最佳擴增性能的引物。參見,例如Oligo 5.0版(National Biosciences)。在結合部位與極長基因對應的情況下,有時希望擴增接近基因3』端的節段,以便當寡脫氧胸苷酸引物cDNA探針與微陣列雜交時,小於全長的探針將能有效地結合。微陣列上的每個基因片段的長度一般在約50bp和約2000bp之間,更常在約100bp和約1000bp之間,通常在約300bp和約800bp之間。PCR方法是眾所周知的,例如,在Innies等1990年編寫的《PCR方案方法和應用指南》(Academic Press公司,San Diego,CA)中作了描述,該書在所有場合都整個結合在此作為參考。顯然,計算機控制的機器人系統可以用於分離和擴增核酸。
生成用於微陣列的核酸的另一種方法是通過例如使用N-膦酸鹽或亞磷醯胺化學合成合成的多核苷酸或寡核苷酸(Froehler等,1986年,《核酸研究》14:5399-5407;McBride等,1983年,《四面體快報》24:245-248)。合成序列的長度在約15至約500個鹼基之間,更常在約20至約50個鹼基之間。在有些實施方案中,合成核酸包括非天然鹼基,例如肌苷。如上所述,核酸類似物可以用作雜交用的結合部位。適宜的核酸類似物的實例是肽核酸(參見,例如Egholm等,1993年,「PNA遵從Watson-Crick氫結合規則與互補寡核苷酸雜交」,《自然》365:566-568;同時還參見美國專利5,539,083)。
在另一個實施方案中,結合(雜交)部位用基因的質粒或噬菌體克隆、cDNA(例如已表達序列標誌)或從此插入的片段製成(Nguyen等,1995年,「利用陣列的cDNA克隆的定量雜交測定的鼠胸腺中的差別基因表達」,《基因組》29:207-209)。在又一個實施方案中,結合部位的多核苷酸是RNA。
將核酸附著到固體表面核酸或類似物附著到固相支持體上,固相支持體可以用玻璃、塑料(例如聚丙烯、尼龍)、聚丙烯醯胺、硝基纖維素或其他材料製成。將核酸附著到表面上的優選方法是通過在玻璃板上印製,如Schena等概括描述的那樣(1995年,「用互補DNA微陣列定量監控基因表達模式」,《科學》270:467-470)。該方法尤其可用於製備cDNA的微陣列。同時還參見DeRisi等,1996年,「在人類癌症中使用cDNA微陣列分析基因表達模式」,《天然基因組》14:457-460;Shalon等,1996年,「用於使用雙色螢光探針雜交來分析複合DNA樣品的DNA微陣列系統」,《基因組研究》6:639-645;以及Schena等,1995年,「平行人類基因組分析;1000個基因的基於微陣列的表達」,《美國國家科學院院報》93:10539-11286。上面所提到的每篇文章在所有場合都整個結合在此作為參考。
製備微陣列的第二種優選方法是通過製備高密度的寡核苷酸陣列。用於使用原位合成用的照相平版印刷技術在表面上的規定位置生產含有與確定序列互補的上千個寡核苷酸的陣列的技術是已知的(參見,Fodor等,1991年,「光指導的空間可尋址平行化學合成」,《科學》251:763-773;Pease等,1994年,「用於DNA序列快速分析的光指導的寡核苷酸陣列」,《美國國家科學院院報》91:5022-5026;Lockhart等,1996年,「通過與高密度寡核苷酸陣列雜交來監控表達」,《自然生物技術》14:1675;美國專利5,578,832;5,556,752;和5,510,270,上述每篇文章在所有場合都整個結合在此作為參考),或者使用用於確定寡核苷酸的快速合成和沉積的其他方法在表面上的規定位置生產上述陣列(Blanchard等,1996年,「高密度寡核苷酸陣列」,《生物傳感器與生物電子學》11:687-90)。當使用這些方法時,已知序列的寡核苷酸(例如20聚物)在表面諸如衍生載玻片上直接合成。通常,產生的陣列是冗長的,每個RNA伴有數個寡核苷酸分子。可以選擇寡核苷酸探針來檢測其他已剪接的mRNA。製備微陣列的另一個優選方法是利用噴墨印刷法直接在固相上合成寡核苷酸,例如在Blanchard於1998年1月16日提出的、題為「使用溶劑微液滴的化學合成」的未決美國專利申請09/008,120中描述的,該文整個結合在此作為參考。
也可以使用其他方法來製備微陣列,例如通過掩蔽(Maskos和Southern,1992年,《核酸研究》20:1679-1684)。儘管原則上可以使用任何類型的陣列,例如,尼龍雜交膜上的斑點印跡(參見Sambrook等,《分子克隆-實驗室手冊》(第2版),第1-3卷,冷泉港實驗室,冷泉港,紐約,1989年,該書在所有場合都整個結合),但正如本領域技術人員將認識到的那樣,優選的是非常小的陣列,因為這樣雜交體積將更小。
生成標記探針製備全和聚腺苷酸化RNA的方法是眾所周知的,在Sambrook等的文章(來源同上)中作了全面描述。在一個實施方案中,使用硫氰酸胍裂解後進行CsCl離心而從本發明中所研究的不同類型的細胞中提取得到RNA(Chirgwin等,1979年,《生物化學》18:5294-5299)。聚腺苷酸化RNA通過用寡脫氧胸苷酸纖維素進行選擇而選出(參見Sambrook等,同上)。所研究的細胞包括野生型細胞、接觸藥物的野生型細胞、修飾細胞和接觸藥物的修飾細胞。
標記cDNA從mRNA通過寡脫氧胸苷酸引物或任意引物逆轉錄製備,這兩種方法都是本領域中眾所周知的(參見,例如Klug和Berger,1987年,《酶學方法學》152:316-325)。逆轉錄可以在與可檢測標記綴合的dNTP的存在下進行,首選螢光標記的dNTP。另一方面,分離的mRNA可以轉變為在標記dNTP的存在下通過雙鏈cDNA的體外轉錄而合成的標記反義RNA(Lockhart等,1996年,「通過與高密度寡核苷酸陣列的雜交監控表達」,《自然生物技術》14:1675,該文在所有場合都整個結合在此作為參考)。在另外的實施方案中,cDNA或RNA探針可以在沒有可檢測標記的條件下合成,並可以在隨後進行標記,例如通過摻入生物素化的dNTP或rNTP,或者使用一些類似的方式(例如,使生物素的補骨脂內酯衍生物與RNA光交聯),接著加入標記的鏈黴抗生物素蛋白(例如與藻紅蛋白綴合的鏈黴抗生物素蛋白)或等價物。
當使用螢光標記探針時,已知有許多適宜的螢光團,包括螢光素、麗絲胺、藻紅蛋白、羅丹明(Perkin Elmer Cetus)、Cy2、Cy3、Cy3.5、Cy5、Cy5.5、Cy7、F1uroX(Amersham)以及其他(參見,例如Kricka,1992年,《非同位素DNA探針技術》,Academic PressSan Diego,CA)。應當理解,選擇的螢光團對應具有不同的發射光譜,以便可以容易地將它們區分開。
在另一個實施方案中,使用螢光標記以外的標記。例如可以使用放射性標記或具有不同發射光譜的放射性標記對(參見Zhao等,1995年,「高密度cDNA濾膜分析一種新的大規模定量分析基因表達的方法」,《基因》156:207;Pietu等,1996年,「利用高密度cDNA陣列的定量雜交揭示的人類肌肉中優先表達的新的基因轉錄物」,《基因組研究》6:492)。然而,由於放射性顆粒的散射,以及由此導致的對廣泛分隔的結合部位的需求,令反射性同位素的使用成為不太優選的實施方式。
在一個實施方案中,標記cDNA用下述方法合成含有0.5mMdGTP、dATP和dCTP的混合物加上0.1mM dTTP加上螢光脫氧核苷酸(例如0.1mM羅丹明110 UTP(Perken Elmer Cetus)或0.1mM Cy3dUTP(Amersham))在42℃下用逆轉錄酶(例如SuperScriptTMⅡ,LTI公司)溫育60分鐘。
與微陣列雜交選擇適當的核酸雜交和洗滌條件,使得探針「特異性結合」或「特異性」雜交到特定陣列部位,即,探針雜交、二顯性組合或結合到具有互補核酸序列的序列陣列部位,而不雜交到具有非互補核酸序列的部位。如本文中所用,一個核苷酸序列被認為與另一個核苷酸序列互補時,如果較短的多核苷酸小於或等於25個鹼基,則使用標準鹼基對規則沒有出現錯配,或者如果較短的多核苷酸長於25個鹼基,則至多有5%的錯配。優選多核苷酸是完全互補的(沒有錯配)。通過進行包括陰性對照的雜交測定,我們可以輕易地證明特異性雜交條件導致特異性雜交(參見,例如Shalon等,同上;Chee等,同上)。
最佳雜交條件將取決於標記探針和固定化多核苷酸或寡核苷酸的長度(例如,寡聚物比多核苷酸多200個鹼基)和類型(例如RNA、DNA、PNA)。核酸的特異性(即,嚴格)雜交條件的一般參數描述在以下文章中Sambrook等,同上;和Ausubel等,1987年,《分子生物學中的流行規約》,Greene Publishing和Wiley-Interscience,紐約,該文在所有場合都整個結合在此。當使用Schena等的cDNA微陣列時,典型的雜交條件是在5×SSC加上0.2%SDS中在65℃下雜交4小時,接著在25℃下用低嚴格洗滌緩衝劑(1×SSC加上0.2%SDS)洗滌,再在25℃下用高嚴格洗滌緩衝劑(0.1×SSC加上0.2%SDS)洗滌10分鐘(Shena等,1996年,《美國國家科學院院報》93:10614)。下列文獻中也提供了有用的雜交條件,例如:Tijessen,1993年,與核酸探針雜交,Elsevier SciencePublishers B.V.和Kricka,1992年,非同位素DNA探針技術,Academic Press San Diego,CA。
信號檢測和數據分析當使用螢光標記探針時,轉錄陣列的每個部位的螢光發射都可以優選地利用掃描同焦雷射顯微鏡檢查來檢測。在一個實施方案中,使用適宜的激發線對所用的兩種螢光團分別進行掃描。另一方面,可以使用雷射,這可允許在對兩種螢光團具有特異性的波長下同時進行樣本照明,並可同時分析來自這兩種螢光團的發射光(參見Shalon等,1996年,用於使用雙色螢光探針雜交來分析複合DNA樣品的DNA微陣列系統,基因組研究6:639-645,該文在所有場合都整個結合作為參考)。在一個優選的實施方案中,用帶有計算機控制的X-Y鏡臺和顯微物鏡的雷射螢光掃描儀掃描陣列。這兩種螢光團的順序激發用多線路混合氣體雷射器完成,發射光利用波長分離並用兩個光電倍增管進行檢測。Schena等於1996年在《基因組研究》6:639-645中以及在本文中引用的其他參考文獻中都描述了螢光雷射掃描設備。另一方面,Ferguson等於1996年在《自然生物技術》14:1681-1684中描述的光導纖維束也可用於同時監控大量部位的mRNA豐度水平。
記錄信號,並且在優選的實施方案中,利用計算機進行分析,例如使用對數字板的12位模擬。在一個實施方案中,掃描的圖象使用圖形程序(例如,Hijaak Graphics Suite)去除斑點,然後使用圖象網格程序進行分析,形成在每個部位每種波長下平均雜交的電子數據表。如果需要,可以對兩種螢光劑的通道之間的「串擾」(或重疊)進行實驗校正。對於轉錄陣列上的任何一個特定雜交部位來說,可以計算出兩種螢光團的發射比。該比值與關連基因的絕對表達水平無關,但可用於表達受到給藥、基因缺失或任何其他測試因素的明顯調製的基因。
按照本發明的方法,兩種細胞或細胞系中的mRNA的相對豐度記錄為幹擾及其確定的數值(即,在所測試的兩種來源的mRNA中的豐度是不同的),或者記錄為未受幹擾(即,相對豐度是相同的)。如本文中所用,當兩種來源的RNA之間的差值至少為25%倍(來自一個來源的RNA在一個來源中比在另一個來源中多出25%)、更通常是約50%倍、甚至更經常達到約2倍(多出1倍)、3倍(多出2倍)或5倍(多出4倍)時,記錄為幹擾。現有的檢測方法可以可靠地檢測約3倍至約5倍範圍的差值,我們期望有更靈敏的方法研製出來。
優選地,除了鑑別幹擾是陽性還是陰性之外,最好能確定該幹擾的大小。如上所述,這可以通過計算用於不同標記的兩種螢光團的發射比來完成,或者利用對本領域技術人員來說顯而易見的類似方法完成。
應答特徵的測量在本發明的一個實施方案中,反映所研究的細胞的轉錄狀態的轉錄陣列通過使各自與所研究的不同細胞的mRNA相對應(即互補)的兩種不同標記探針的混合物與微陣列雜交而製得。按照本發明,這兩種細胞是同一類型的,即,是同一物種和菌株,但可能有少數(例如,1、2、3或5個,優選1個)部位的基因有所不同。另一方面,它們是同基因的,但它們的環境史有所不同(例如,接觸藥物對未接觸藥物)。
為了測量應答特徵,製備或長成具有所研究的逐級水平的疾病狀態或治療作用(即,「幹擾」)的細胞。用具有幹擾的細胞和不具有幹擾的細胞構造轉錄物陣列,對它們進行測量,以找出因疾病狀態的水平或治療作用的水平而發生修飾表達的mRNA以及修飾的程度。由此得到應答特徵。
逐級幹擾對照參數的水平的密度利用單個基因應答中的清晰度和結構來調整-應答的最陡峭部分越陡峭,適當解析該應答所需的水平就越密集。這種範例性的密度可由圖2的例子近似顯示。在此,在100倍濃度範圍內對甲氨蝶呤的6個應答剛好足夠解析基因表達應答。但是,要更精細地表示這個途徑,最好接觸更多種濃度。
此外,為了減少實驗誤差,最好在雙色差別雜交實驗中逆轉螢光標記,以減少單個基因或陣列斑點位置所特有的偏差。換句話說,最好首先測量來自所測量的兩種細胞的mRNA的具有一種標記(例如,用第一種螢光染料標記受幹擾細胞,用第二種螢光染料標記未受幹擾的細胞)的基因表達,然後測量來自具有逆轉標記(例如,用上述第二種螢光染料標記受幹擾細胞,用上述第一種螢光染料標記未受幹擾的細胞)的兩種細胞的基因表達。對接觸水平和幹擾對照參數水平的多重測量提供了另外的實驗誤差控制。只要採樣充分,當選擇用於插入應答數據的樣條函數S的寬度時,就可在應答函數中的誤差的平均值和結構損失之間進行權衡。
診斷特徵的測量對於希望分析一些疾病狀態或一些治療作用的水平的任何一種細胞型來說都可得到其診斷特徵。優選地,疾病狀態或治療必須是已得到了其應答特徵或者可以生成其應答特徵的疾病狀態或治療。希望得到其診斷特徵的細胞包括,例如懷疑具有與一種或多種基因突變有關的疾病狀態水平的病人的細胞,以及已接觸了藥物或多種藥物或其他治療的組合併顯示治療作用水平的病人的細胞。
為了測量懷疑具有特定水平的疾病狀態或治療作用的細胞的診斷特徵,用懷疑具有這類水平的細胞和相同細胞類型的野生型細胞(即,不具有疾病狀態和/或未接觸治療的細胞)來構造轉錄物陣列,對其進行測量,以找出因疾病狀態或治療作用的水平而具有改變過的表達的mRNA。由此得到診斷特徵。
為了測量例如接觸了藥物(或其他一些治療)的細胞的診斷特徵,使這些細胞或得到這些細胞的生物體/病人接觸一些所研究的藥物的水平,優選與藥物的臨床劑量相對應的水平,並對治療作用進行測量(例如,測量疾病標誌物或疾病症狀的量的變化)。當細胞在體外生長時,藥物通常加入到它們的營養培養基中。在酵母的情況下,最好在早期對數期收穫酵母,因為那時表達模式對收穫的時間相對不敏感。加入的藥物的量是取決於該藥物特定性能的逐級量,但在細胞培養物中,通常在約1ng/ml至100mg/ml之間。在有些情況下,藥物將溶解在溶劑如DMSO中。
用接觸治療或具有疾病狀態的細胞和未接觸治療和/或不具有疾病狀態(或疾病狀態的特定水平)的細胞構造轉錄物陣列,對其進行測量,以找出因疾病狀態或治療作用的水平而具有改變的表達的mRNA。由此得到應答特徵。
與應答特徵的測量類似,對於診斷特徵,最好也在雙色差別雜交的情況下用逆轉標記進行測量。
轉錄狀態的其他測量方法細胞的轉錄狀態可以利用本領域中已知的其他基因表達技術進行測量。有幾個這類技術生產用於電泳分析的有限複雜度的限制片段的集合體,諸如雙限制酶消化與定相引物結合的方法(參見,例如Zabeau等於1992年9月24日提出的歐洲專利0 534858 A1),或者選擇具有與確定mRNA末端最接近的部位的限制片段的方法(參見,例如Prashar等,1996年,《美國國家科學院院報》93:659-663)。其他方法用統計學方法抽取cDNA庫樣品,諸如通過對多個cDNA中的每一個中的足夠的鹼基(例如20-50個鹼基)測序以識別每個cDNA,或者通過對在與確定mRNA末端有關的已知位置上產生的短標誌(例如9-10個鹼基)進行測序(參見,例如Velculescu,1995年,《科學》270:484-487)。
5.4.2其他生物學狀態情況的測量在本發明的不同實施方案中,為了得到治療和疾病狀態應答情況,可以測量轉錄狀態以外的其他生物學狀態,諸如翻譯狀態,活性狀態,或混合情況。該部分中描述了這些實施方案的細節。
基於翻譯狀態測量的實施方案翻譯狀態的測量可以按照幾種方法來進行。例如,對蛋白質的整個基因組監控(即,「蛋白組」,Goffeau等,同上)可以通過構造微陣列來進行,在該微陣列中,結合部位包含固定化的、優選單克隆的、對由該細胞基因組編碼的多種蛋白質具有特異性的抗體。優選地,抗體針對編碼蛋白質的主要部分而存在,或者至少針對與所研究的疾病狀態或治療效果的作用有關的那些蛋白質。製備單克隆抗體的方法是眾所周知的(參見,例如Harlow和Lane,1988年,《抗體實驗室手冊》,冷泉港,紐約,該文在所有場合都整個結合在此)。在優選的實施方案中,單克隆抗體針對基於細胞的基因組序列而設計的合成肽片段來培養。形成了這樣的抗體陣列後,來自細胞的蛋白質與該陣列接觸,並用本領域中已知的測定法測定它們的結合情況。
另一方面,蛋白質可以利用雙向凝膠電泳系統分離。雙向凝膠電泳是本領域中眾所周知的,一般涉及沿著第一方向等電聚焦,然後沿著第二方向進行SDS-PAGE電泳。參見,例如Hames等,1990年,《蛋白質的凝膠電泳實用研究》,IRL Press,紐約;Shevchenko等,1996年,《美國國家科學院院報》93:1440-1445;Sagliocco等,1996年,《酵母》12:1519-1533;Lander,1996年,《科學》274:536-539。所得電泳圖譜可以利用許多技術進行分析,包括質譜技術、實用多克隆和單克隆抗體的蛋白質印跡和免疫印跡分析、以及內部和N-端微量測序。使用這些技術,有可能識別在給定生理條件下產生的所有蛋白質的主要部分,包括在接觸藥物的細胞(例如酵母)中產生的,或者在受到例如特異性基因的缺失或過度表達修飾的細胞中產生的。
6.引用的參考文獻本文中引用的所有參考文獻在所有場合都整個結合在此作為參考,其結合程度就好象每一個單獨的出版物或專利或專利申請都明確而各自指出在所有場合整個結合作為參考那樣。
在不背離本發明實質和範圍的條件下可以對本發明進行許多修飾和改進,這對本領域技術人員來說是顯而易見的。本文中描述的具體實施方案僅經由實施例給出,而本發明將只限於所附的權利要求書的範圍,以及該權利要求書給出的等價物的全面範圍。
權利要求
1.確定受試者的一種或多種疾病狀態的水平的方法,所述方法包括對於所述每種疾病狀態,從與所述每種疾病狀態的水平有關的內插幹擾應答特徵中確定在診斷特徵與所述一個確定的內插應答特徵或其組合之間相似性最大的內插應答特徵,所述診斷特徵已利用包括測量所述受試者的一個或多個細胞中的第一多數細胞組分的方法得到,並且其中所述內插應答特徵是以下方法的結果,該方法包括(ⅰ)對每種所述疾病狀態提供一個或多個類似受試者的一個或多個細胞的應答特徵,其中所述應答特徵通過測量在所述每種疾病狀態的多種水平下所述一個或多個類似受試者的所述細胞中的第二多數細胞組分而得到,和(ⅱ)插入所述應答特徵,使得可以提取出所述每種疾病狀態的各個水平下的應答特徵,其中與每個確定的內插應答特徵相關的每種疾病狀態的水平指示所述疾病狀態的所述水平。
2.權利要求1的方法,其中確定單一疾病狀態的水平。
3.權利要求1的方法,其中通過將內插應答特徵校準為一種或多種臨床作用而使內插幹擾應答特徵與每種所述疾病狀態的水平相關連。
4.權利要求1的方法,其中一種或多種所述疾病狀態與基因突變有關。
5.權利要求4的方法,其中所述基因突變是在編碼區。
6.權利要求4的方法,其中所述基因突變是雜合突變。
7.確定對於具有疾病狀態的受試者的一種或多種治療的作用的水平的方法,所述方法包括對於所述每種治療,從與所述每種治療的作用的水平有關的內插幹擾應答特徵中確定在診斷特徵與所述一個確定的內插應答特徵或其組合之間相似性最大的內插應答特徵,所述診斷特徵已利用包括測量所述受試者的一個或多個細胞中的第一多數細胞組分的方法得到,並且其中所述內插應答特徵是以下方法的結果,該方法包括(ⅰ)對每種所述治療提供一個或多個類似受試者的一個或多個細胞的應答特徵,其中所述應答特徵通過測量在所述每種治療的作用的多種水平下所述一個或多個類似受試者的所述細胞中的第二多數細胞組分而得到,和(ⅱ)插入所述應答特徵,使得可以提取出所述每種治療的各個水平下的應答特徵,其中與每個確定的內插應答特徵相關的每種治療的作用的水平指示所述治療的作用的所述水平。
8.權利要求7的方法,其中確定單一治療的作用的水平。
9.權利要求7的方法,其中通過將內插應答特徵校準為一種或多種臨床作用而使內插幹擾應答特徵與每種所述治療的作用的水平相關連。
10.權利要求9的方法,其中調節一種或多種藥物治療,直到診斷特徵與在一種或多種臨床作用的所需水平下在校準幹擾應答特徵中得到的特徵一致。
11.權利要求7的方法,其中一種或多種所述治療包括用藥物治療。
12.權利要求11的方法,其中所述藥物增加了蛋白質的活性。
13.權利要求11的方法,其中所述藥物降低了蛋白質的活性。
14.權利要求7的方法,其中所述一種或多種治療中至少有一種的所述作用是有益作用。
15.權利要求7的方法,其中所述一種或多種治療中至少有一種的所述作用是不利作用。
16.權利要求15的方法,其中所述不利作用是毒性作用。
17.權利要求1或7的方法,其中所述插入包括利用樣條函數的總和來逼近。
18.權利要求1或7的方法,其中所述插入包括利用希爾函數逼近。
19.權利要求1或7的方法,其中所述確定的內插應答特徵的所述組合是所述確定的內插應答特徵的總和。
20.權利要求1的方法,其中所述一種或多種疾病狀態的所述確定水平是使所述診斷特徵和從有關所述一種或多種疾病狀態的每種所述確定水平的所述幹擾應答曲線中提取出的幹擾應答特徵之間的差值的目標函數的值最小的水平。
21.權利要求7的方法,其中所述一種或多種治療的作用的所述確定水平是將所述診斷特徵和從有關所述一種或多種治療的每種所述確定水平的所述幹擾應答曲線中提取出的幹擾應答特徵之間的差值的目標函數的值最小的水平。
22.權利要求20或21的方法,其中所述目標函數包括診斷特徵和從所述幹擾應答曲線提取出的幹擾應答特徵的差值的平方和。
23.權利要求1或7的方法,其中所述受試者是哺乳動物。
24.權利要求23的方法,其中所述受試者是人。
25.權利要求1或7的方法,其中所述第一多數細胞組分和所述第二多數細胞組分包含所述細胞型中存在的大量RNA種類的豐度。
26.權利要求25的方法,其中所述第一多數和所述第二多數RNA種類的豐度利用包括使基因轉錄物陣列與來自所述細胞型的細胞的RNA或與從此衍生的cDNA接觸的方法進行測量,其中基因轉錄物陣列包括帶有附著核酸或核酸模擬物的表面,所述核酸或核酸模擬物能與所述多樣RNA種類或與從此衍生的cDNA雜交。
27.權利要求26的方法,其中所述第二多數RNA種類的豐度的所述測量利用下列方法進行,該方法包括使一種或多種基因轉錄物陣列(ⅰ)與來自所述受試者的所述細胞的RNA接觸,或與從此衍生的cDNA接觸,和(ⅱ)與來自不具有疾病或未經受治療的第二受試者的第二細胞的RNA接觸,或與從此衍生的cDNA接觸。
28.權利要求25的方法,其中所述第一多數RNA種類構成了已知在所述細胞中將響應與所述疾病狀態或所述治療有關的幹擾而增加或減少的大多數RNA種類。
29.權利要求26的方法,其中所述第一多數RNA種類構成了已知在所述細胞中將響應與所述疾病狀態或所述治療有關的幹擾而增加或減少的大多數RNA種類。
30.權利要求1或7的方法,其中所述細胞組分包括所述細胞型中存在的大量蛋白質種類的豐度。
31.權利要求30的方法,其中所述大量蛋白質種類的豐度利用包括使抗體陣列與來自所述細胞型的細胞的蛋白質接觸的方法進行測量,其中所述抗體陣列包括帶有附著抗體的表面,所述抗體能與所述多樣蛋白質種類結合。
32.權利要求27的方法,其中所述大量蛋白質種類的豐度利用包括使來自所述細胞型的細胞的蛋白質進行雙向電泳的方法測量。
33.權利要求1或7的方法,其中所述細胞組分包括所述細胞型中存在的大量蛋白質種類的活性。
34.用於確定受試者的一種或多種疾病狀態的水平的計算機系統,它包括處理器和與所述處理器連接的存儲器,所述存儲器編碼一個或多個程序,所述一個或多個程序使所述處理器執行一個方法,該方法包括對於所述每種疾病狀態,從與所述每種疾病狀態的水平有關的內插幹擾應答特徵中確定在診斷特徵與所述一個確定的內插應答特徵或其組合之間相似性最大的內插應答特徵,所述診斷特徵已利用包括測量所述受試者的一個或多個細胞中的第一多數細胞組分的方法得到,並且其中所述內插應答特徵是以下方法的結果,該方法包括(ⅰ)對每種所述疾病狀態提供一個或多個類似受試者的一個或多個細胞的應答特徵,其中所述應答特徵通過測量在所述每種疾病狀態的多種水平下所述一個或多個類似受試者的所述細胞中的第二多數細胞組分而得到,和(ⅱ)插入所述應答特徵,使得可以提取出所述每種疾病狀態的各個水平下的應答特徵,其中與每個確定的內插應答特徵相關的每種疾病狀態的水平指示所述疾病狀態的所述水平。
35.用於確定對受試者的一種或多種治療的作用的水平的計算機系統,它包括處理器和與所述處理器連接的存儲器,所述存儲器編碼一個或多個程序,所述一個或多個程序使所述處理器執行一個方法,該方法包括對於所述每種治療,從與所述每種治療的作用的水平有關的內插幹擾應答特徵中確定在診斷特徵與所述一個確定的內插應答特徵或其組合之間相似性最大的內插應答特徵,所述診斷特徵已利用包括測量所述受試者的一個或多個細胞中的第一多數細胞組分的方法得到,並且其中所述內插應答特徵是以下方法的結果,該方法包括(ⅰ)對每種所述治療提供一個或多個類似受試者的一個或多個細胞的應答特徵,其中所述應答特徵通過測量在所述每種治療的作用的多種水平下所述一個或多個類似受試者的所述細胞中的第二多數細胞組分而得到,和(ⅱ)插入所述應答特徵,使得可以提取出所述每種治療的各個水平下的應答特徵,其中與每個確定的內插應答特徵相關的每種治療的作用的水平指示所述治療的作用的所述水平。
36.權利要求34或35的計算機系統,其中所述確定所述內插應答特徵利用以下方法完成,該方法包括(a)確定所述診斷特徵和所述確定的內插應答特徵之間的差值的目標函數的值;和(b)將所述目標函數的所述確定值最小化。
37.權利要求34或35的計算機系統,其中所述診斷特徵和所述應答曲線可從所述內存中獲得。
38.權利要求37的計算機系統,其中所述程序使所述處理器執行所述插入應答特徵的步驟。
39.權利要求36的計算機系統,其中所述目標函數包括所述診斷特徵和所述確定的內插應答特徵的差值的平方和。
40.權利要求36的計算機系統,其中所述目標函數包括診斷特徵和從所述幹擾應答曲線提取出的所述確定的內插應答特徵的否定的相互關係。
41.權利要求36的計算機系統,其中所述最小化包括執行Levenberg-Marquandt法。
42.用於確定受試者的一種或多種疾病狀態的水平的工具包,它包含一個固相,該固相的表面上含有各自在所述固相上的已知位置的已知不同序列的大量核酸,每個核酸能與一種RNA或從此衍生的cDNA雜交,其中所述RNA種類已知將在所述疾病狀態的不同水平下增加或減少,所述大量基本上排除了能與不會如此增加或減少的RNA種類雜交的核酸。
43.用於確定對受試者的一種或多種治療的作用的水平的工具包,它包含一個固相,該固相的表面上含有各自在所述固相上的已知位置的已知不同序列的大量核酸,每個核酸能與一種RNA或從此衍生的cDNA雜交,其中所述RNA種類已知將在所述治療的所述作用的不同水平下增加或減少,所述大量基本上排除了能與不會如此增加或減少的RNA種類雜交的核酸。
44.用於確定受試者的一種或多種疾病狀態的水平的工具包,它包括(a)一個固相,該固相的表面上含有各自在所述固相上的已知位置的已知不同序列的大量核酸,每個核酸能與一種RNA或從此衍生的cDNA雜交,其中所述RNA種類已知將在所述疾病狀態的不同水平下增加或減少,和(b)與每種所述疾病狀態的水平相關的電子或書寫形式的應答特徵,其中所述應答特徵通過測量在每種所述疾病狀態的多種水平下一個或多個類似受試者的一個或多個細胞中的多數細胞組分而得到。
45.用於確定對受試者的一種或多種治療的作用的水平的工具包,它包括(a)一個固相,該固相的表面上含有各自在所述固相上的已知位置的已知不同序列的大量核酸,每個核酸能與一種RNA或從此衍生的cDNA雜交,其中所述RNA種類已知將在所述治療的作用的不同水平下增加或減少,和(b)與每種所述治療的作用的水平相關的電子或書寫形式的應答特徵,其中所述應答特徵通過測量在每種所述治療的作用的多種水平下一個或多個類似受試者的一個或多個細胞中的多數細胞組分而得到。
46.權利要求44或45的工具包,其中插入所述應答特徵。
47.權利要求44或45的工具包,其中所述幹擾應答曲線是電子形式的,且其中所述工具包還包括在計算機可讀媒體上的表達特徵分析軟體,所述軟體能在同樣具有處理器的計算機的存儲器中被編碼,所述編碼的軟體讓所述處理器執行下列方法,該方法包括(a)接收所述受試者的細胞的診斷特徵,所述診斷特徵已利用包括測量來自所述細胞的RNA種類或從此衍生的cDNA的豐度的方法得到;(b)接收所述應答特徵;和(c)確定每種所述疾病狀態或治療的在所述診斷特徵和所述確定的內插應答特徵的組合之間具有最大相似性時的應答特徵,其中與每種確定的應答特徵相關的水平指示所述疾病狀態或所述治療的所述作用的所述水平。
48.包含一種或多種疾病狀態或治療的應答特徵的資料庫,其中所述資料庫是電子形式的,其中所述應答特徵通過測量在每種所述疾病狀態或所述治療的作用的多種水平下一個或多個類似受試者的一個或多個細胞中的多數細胞組分而得到。
49.權利要求48的資料庫,其中插入所述應答特徵。
50.權利要求1的方法,其中的疾病是癌症、高血壓、神經變性疾病或神經精神病。
全文摘要
本發明提供了監控受試者的疾病狀態的方法,以及監控對具有一種或多種疾病狀態的受試者的治療作用水平的方法。這些方法涉及:(ⅰ)測量來自受試者的細胞中的細胞組分的豐度,以得到診斷特徵;(ⅱ)測量一個或多個類似受試者的細胞中的細胞組分的豐度,以得到與特定疾病或治療有關的幹擾應答特徵;(ⅲ)根據一些客觀測量確定與診斷特徵最一致的內插幹擾應答特徵。在其他方面,本發明還提供了能執行本發明方法的計算機系統,包含一種或多種疾病和/或治療的幹擾應答特徵的資料庫,以及用於按照本發明的方法確定疾病狀態和/或治療作用的水平的工具包。
文檔編號C07H21/04GK1313891SQ99809809
公開日2001年9月19日 申請日期1999年6月17日 優先權日1998年6月19日
發明者S·H·弗裡恩德, R·斯託頓 申請人:羅斯塔英法美蒂克斯公司

同类文章

一種新型多功能組合攝影箱的製作方法

一種新型多功能組合攝影箱的製作方法【專利摘要】本實用新型公開了一種新型多功能組合攝影箱,包括敞開式箱體和前攝影蓋,在箱體頂部設有移動式光源盒,在箱體底部設有LED脫影板,LED脫影板放置在底板上;移動式光源盒包括上蓋,上蓋內設有光源,上蓋部設有磨沙透光片,磨沙透光片將光源封閉在上蓋內;所述LED脫影

壓縮模式圖樣重疊檢測方法與裝置與流程

本發明涉及通信領域,特別涉及一種壓縮模式圖樣重疊檢測方法與裝置。背景技術:在寬帶碼分多址(WCDMA,WidebandCodeDivisionMultipleAccess)系統頻分復用(FDD,FrequencyDivisionDuplex)模式下,為了進行異頻硬切換、FDD到時分復用(TDD,Ti

個性化檯曆的製作方法

專利名稱::個性化檯曆的製作方法技術領域::本實用新型涉及一種檯曆,尤其涉及一種既顯示月曆、又能插入照片的個性化檯曆,屬於生活文化藝術用品領域。背景技術::公知的立式檯曆每頁皆由月曆和畫面兩部分構成,這兩部分都是事先印刷好,固定而不能更換的。畫面或為風景,或為模特、明星。功能單一局限性較大。特別是畫

一種實現縮放的視頻解碼方法

專利名稱:一種實現縮放的視頻解碼方法技術領域:本發明涉及視頻信號處理領域,特別是一種實現縮放的視頻解碼方法。背景技術: Mpeg標準是由運動圖像專家組(Moving Picture Expert Group,MPEG)開發的用於視頻和音頻壓縮的一系列演進的標準。按照Mpeg標準,視頻圖像壓縮編碼後包

基於加熱模壓的纖維增強PBT複合材料成型工藝的製作方法

本發明涉及一種基於加熱模壓的纖維增強pbt複合材料成型工藝。背景技術:熱塑性複合材料與傳統熱固性複合材料相比其具有較好的韌性和抗衝擊性能,此外其還具有可回收利用等優點。熱塑性塑料在液態時流動能力差,使得其與纖維結合浸潤困難。環狀對苯二甲酸丁二醇酯(cbt)是一種環狀預聚物,該材料力學性能差不適合做纖

一種pe滾塑儲槽的製作方法

專利名稱:一種pe滾塑儲槽的製作方法技術領域:一種PE滾塑儲槽一、 技術領域 本實用新型涉及一種PE滾塑儲槽,主要用於化工、染料、醫藥、農藥、冶金、稀土、機械、電子、電力、環保、紡織、釀造、釀造、食品、給水、排水等行業儲存液體使用。二、 背景技術 目前,化工液體耐腐蝕貯運設備,普遍使用傳統的玻璃鋼容

釘的製作方法

專利名稱:釘的製作方法技術領域:本實用新型涉及一種釘,尤其涉及一種可提供方便拔除的鐵(鋼)釘。背景技術:考慮到廢木材回收後再加工利用作業的方便性與安全性,根據環保規定,廢木材的回收是必須將釘於廢木材上的鐵(鋼)釘拔除。如圖1、圖2所示,目前用以釘入木材的鐵(鋼)釘10主要是在一釘體11的一端形成一尖

直流氧噴裝置的製作方法

專利名稱:直流氧噴裝置的製作方法技術領域:本實用新型涉及ー種醫療器械,具體地說是ー種直流氧噴裝置。背景技術:臨床上的放療過程極易造成患者的局部皮膚損傷和炎症,被稱為「放射性皮炎」。目前對於放射性皮炎的主要治療措施是塗抹藥膏,而放射性皮炎患者多伴有局部疼痛,對於止痛,多是通過ロ服或靜脈注射進行止痛治療

新型熱網閥門操作手輪的製作方法

專利名稱:新型熱網閥門操作手輪的製作方法技術領域:新型熱網閥門操作手輪技術領域:本實用新型涉及一種新型熱網閥門操作手輪,屬於機械領域。背景技術::閥門作為流體控制裝置應用廣泛,手輪傳動的閥門使用比例佔90%以上。國家標準中提及手輪所起作用為傳動功能,不作為閥門的運輸、起吊裝置,不承受軸向力。現有閥門

用來自動讀取管狀容器所載識別碼的裝置的製作方法

專利名稱:用來自動讀取管狀容器所載識別碼的裝置的製作方法背景技術:1-本發明所屬領域本發明涉及一種用來自動讀取管狀容器所載識別碼的裝置,其中的管狀容器被放在循環於配送鏈上的文檔匣或託架裝置中。本發明特別適用於,然而並非僅僅專用於,對引入自動分析系統的血液樣本試管之類的自動識別。本發明還涉及專為實現讀