新四季網

診斷和監測動脈粥樣硬化性心血管疾病的方法和組合物的製作方法

2023-07-14 08:07:26


專利名稱::診斷和監測動脈粥樣硬化性心血管疾病的方法和組合物的製作方法診斷和監測動脈粥樣硬化性心血管疾病的方法和組合物相關申請的交叉引用本申請要求2005年6月24日提交的美國臨時申請60/693,756的優先權,該份申請的內容出於所有目的全文納入本文作為參考。
背景技術:
:發明領域本申請涉及生物信息學和動脈粥樣硬化性疾病領域。具體地說,本發明涉及用於動脈粥樣硬化性疾病的診斷、監測和治療劑開發的方法和組合物。相關領域描述由於我們進行早期和準確診斷然後進行積極治療的能力有限,動脈粥樣硬化性心血管疾病(ASCVD)依舊是全球發病率和死亡率的主要原因。ASCVD患者代表了不均勻的一群個體,其所患疾病以不同的速度和截然不同的模式發展。雖然ASCVD患者明顯有適當的治療方法,但每年的復發率和死亡率依舊有2-4%。由於我們不能準確地鑑定可從積極風險降低(aggressiveriskreduction)中獲益的那些患者,初級預防(primaryprevention)的各種優點還未實現。雖然某些疾病標記已顯示能在群體水平預測治療的結果和反應,但它們不夠靈敏或特異,從而不足以臨床應用於個體患者。因此,超過半數的冠狀動脈疾病患者的首次臨床表現便是心肌梗塞或死亡。體檢和目前的診斷方法不能準確測定個體患ASCVD併發症的風險。己知的風險因素,例如高血壓、高脂血症、糖尿病、家族史和吸菸未能確立動脈粥樣硬化性疾病的診斷方法。依賴於解剖學數據(例如,冠狀動脈造影術、冠狀動脈鈣化度(coronarycalciumscore)、CT或MRI血管造影術)的診斷方法缺乏有關該疾病過程的生物學活性的信息,對未來心臟活動(cardiacevent)的預測不佳。功能性評估內皮功能可以是非特異性的並且與動脈粥樣硬化性疾病過程的存在無關,雖然一些數據證明這些測量值有預後價值。個體生物標記,例如脂質和炎性標記已顯示能預測ASCVD患者對治療的結果和反應,一些標記用作產生動脈粥樣硬化性疾病的重要風險因子。然而,迄今為止,沒有一種生物標記足夠特異從而足以臨床應用於診斷個體患者的ASCVD。動脈粥樣硬化性心血管疾病的複雜性質據信,動脈粥樣硬化通常是涉及多種生物學途徑的複雜疾病。動脈粥樣硬化性疾病過程的自然變遷史以及對風險因素的反應不同和個體的治療反應變化部分反映了遺傳背景和它們與導致該疾病發生和改變的環境因素之間錯綜複雜的相互作用中的差異。心血管系統本身的複雜性質也影響動脈粥樣硬化性疾病,在該系統中,解剖學、功能和生物學均在健康和疾病中發揮至關重要的作用。由於這種複雜性,一種標記或方法不可能產生足夠的信息而獲取該疾病過程的真實性質。單一生物標記方法炎症ASCVD的各階段均涉及炎症,據信炎症是動脈粥樣硬化的病理生理學基礎的主要部分,其提供該疾病過程的潛在標記。在許多流行病學研究中循環炎性生物標記升高已顯示能對心血管風險分層次並評估對治療的反應。目前,雖然炎症的通用標記可能用於對風險分層次,但它們不足以鑑定個體中是否存在CAD,因為許多標記缺乏特異性。出於相似的原因,炎症的通用標記,例如C-反應性蛋白(CRP)和紅細胞沉降率(ESR)早已不用作其它炎性疾病,例如狼瘡和類風溼性關節炎的特異性診斷標記,雖然它們依舊是臨床實踐中對風險分層次和(評估)治療反應的重要標記。個體對環境風險因素的反應不均勻也可能誘導ASCVD標記濃度高度變化。在這點上,一種炎性蛋白所攜帶的生物學信息不足以全面代表血管炎性狀態,從而不能準確鑑定是否存在疾病或其嚴重程度。動脈粥樣硬化的病理生理學基礎動脈粥樣硬化斑塊由累積的胞內和胞外脂質、平滑肌細胞、結締組織和葡萄糖胺聚糖構成。動脈粥樣硬化最早的可檢測損傷是由充滿脂質的泡沫細胞構成的脂肪紋,這些細胞是作為單核細胞從循環(系統)遷移入內膜的內皮下層中的巨噬細胞,脂肪紋隨後演化成由圍繞以結締組織的內膜平滑肌細胞和胞內及胞外脂質構成的纖維斑塊。已有人提出了相關的假設來解釋動脈粥樣硬化的發病機理。脂質假說假定血7槳LDL水平升高會導致LDL透入動脈壁中,造成脂質累積在平滑肌細胞和巨噬細胞中。LDL對生長因子起反應還會促進平滑肌細胞增生以及遷移入內膜下和內膜區域中。在此環境中,LDL得到修飾或氧化,從而更能造成動脈粥樣硬化。修飾或氧化的LDL對單核細胞有趨化性,促使它們遷移入內膜,早期出現在脂肪紋中和轉化為巨噬細胞並駐留在內膜下隔室中。巨噬細胞表面的清道夫受體促進氧化的LDL進入這些細胞,將它們轉化成充滿脂質的巨噬細胞和泡沫細胞。氧化的LDL還對內皮細胞有毒性,可導致它們功能障礙或因更嚴重的損傷而喪失。慢性內皮損傷假說假定各種機理造成的內皮損傷導致內皮喪失,血小板附著到內皮下膜、血小板凝集、單核細胞和T-細胞淋巴細胞的趨化作用並釋放血小板衍生和單核細胞衍生的生長因子,這些生長因子能誘導平滑肌細胞從介質遷移入內膜中並在其中複製、合成結締組織和蛋白聚糖進而形成纖維斑塊。其它細胞,例如巨噬細胞、內皮細胞、動脈平滑肌細胞也產生能促進平滑肌(細胞)增生並胞外基質產生的生長因子。內皮功能障礙包括提高了內皮對脂蛋白和其它血漿成分的滲透性,附著分子的表達和生長因子的加工從而導致單核細胞、巨噬細胞和T淋巴細胞附著增加。這些細胞可經內皮遷移並將自己定位於內皮下層中。泡沫細胞也釋放生長因子和細胞因子,從而能促進平滑肌細胞遷移和刺激血管內膜(neointimal)增殖,基序、、繼續累積脂質並支持內皮細胞功能障礙。臨床和實驗室研究顯示炎症在粥樣斑的產生、發展和不穩定中起主要作用。"自身免疫"假說假定炎性免疫學過程是動脈粥樣硬化的最早階段的特徵,其由抵禦內源性抗原的體液和細胞免疫反應來啟動。人Hsp60表達本身是由幾種應激因素啟動的對損傷的反應,所述應激因素已知是動脈粥樣硬化的風險因素,例如高血壓。氧化的LDL是動脈粥樣硬化自身抗原的另一候選對象。已在動脈粥樣硬化患者中檢測到oxLDL的抗體,動脈粥樣硬化損傷中也發現了它們。從人動脈粥樣硬化損傷處分離的T淋巴細胞已顯示對oxLDL有反應,其是細胞免疫應答中的主要自身抗原。所提出的與動脈粥樣硬化有關的第三種自身抗原是2-糖蛋白1(2GPI),其是用作體外抗凝劑的一種糖蛋白。動脈粥樣硬化斑塊中發現了2GPI,在易患動脈粥樣硬化的轉基因小鼠中用2GPI高度免疫或轉移2GPI-反應性T細胞增強了脂肪紋形成。感染可通過誘導炎症和自身免疫力而導致動脈粥樣硬化產生。許多研究證明了傳染性因子,病毒(巨細胞病毒、單純皰疹病毒、腸病毒、A肝病毒)和細菌(肺炎衣原體(C.p"ewwom力e)、幽門螺桿菌(//.j^/on')、牙周病原體)在動脈粥樣硬化中的作用。近年來,已有人提出了新的"病原體負荷"假說,提示多種傳染性因子可導致了動脈粥樣硬化,感染所致的心血管疾病風險與個體所接觸的病原體數量有關。對於一種微生物,肺炎衣原體可能與動脈粥樣硬化最相關。這些假說關係密切,不是相互排斥的。修飾的LDL對培養的內皮細胞具有細胞毒性,可誘導內皮損傷,吸引單核細胞和巨噬細胞並刺激平滑肌生長。修飾的LDL還能抑制巨噬細胞活動性,從而使得巨噬細胞一旦在內皮下間隙中轉化成泡沫細胞,即被截留。此外,再生的內皮細胞(損傷後)功能受損,其從血漿攝取LDL增加。動脈粥樣硬化的特徵在於除非臨界狹窄、血栓形成、動脈瘤或栓塞接連發生否則不為人知。首先,症狀和體徵反映出受影響的組織的血流量不能隨需求而增加,例如心絞痛發作、間歇性跛行。症狀和體徵通常隨著粥樣斑緩慢侵入血管腔而逐漸發展。然而,當主要的動脈被急性阻塞時,症狀和體徵可能是驚人的。如上所述,目前,因為缺乏合適的診斷方法,超過半數的冠狀動脈疾病患者的首次臨床表現便是心肌梗塞或死亡。預防和治療的進一步發展取決於開發出將焦點集中在血管壁初級炎性過程上的方案,該過程在動脈粥樣硬化性疾病的病因學中是基礎性的。沒有能準確報導血管壁疾病活性和/或程度的良好替代標記便不可能開發出能完全確定風險、監測風險的作用向原發病緩解降低或開發靶向血管壁的新型治療劑的方法。一種有前途的方法是鑑定能反映血管炎症程度和特徵的循環蛋白。已鑑定到許多免疫調製蛋白作為替代標記具有一定價值,但這些生物標記尚未顯示添加了足夠的信息從而能應用於臨床。這是因為^未能同時顧及所檢測的多種標記的數據,^未能將單個標記數據與調節循環蛋白水平並混淆信息模式的臨床數據整合,遺傳變異促進了編碼這些標記的基因表達水平並混淆了豐度測定,和W缺乏在ASCVD中激活的特異性免疫途徑的有關信息,而這些信息能用於更好地選擇生物標記。最後,現有技術未能提供可利用一組循環蛋白的檢測值的有效診斷或預測方法。未滿足的臨床與科學需求因此,將鑑定患血管炎症和動脈粥樣硬化性心血管疾病個體的改進工具用於臨床醫學和生物醫學研究的需求未獲滿足。目前,雖然對動脈粥樣硬化的機制和情況的了解在增加,但我們用於鑑定高風險患者並預測預防方案效力的方法依舊不夠。因此,需要新方法來更好地診斷風險患者;鑑定動脈粥樣硬化性疾病患者可啟動急需的治療從而能改善臨床結果。發明概述本發明提供檢測循環蛋白表達來診斷、監測動脈粥樣硬化病症並開發相關治療劑的方法,所述動脈粥樣硬化病症包括但不限於會導致心絞痛、不穩定心絞痛、急性冠狀動脈症候群、心肌梗塞和心力衰竭的病症。具體地說,本發明鑑定和描述了在動脈粥樣硬化患者中表達有差異的循環蛋白,所述蛋白包括但不限於循環炎性標記。本文鑑定的循環炎性標記包括MCP-1、MCP-2、MCP-3、MCP-4、嗜酸細胞活化趨化因子、IP-IO、M-CSF、IL-3、TNFa、Ang-2、IL-5、IL-7和IGF-1。檢測本文所鑑定蛋白質的循環水平可將患者分類為屬於各種動脈粥樣硬化情況,包括動脈粥樣硬化性疾病、無疾病、心肌梗塞、穩定的心絞痛、接受藥物治療、未治療等,所述蛋白質是因動脈粥樣硬化過程而在血管壁中特異性產生的。還可用這種分類預測心血管活動和對治療的反應;並用於預測和評估心血管疾病的併發症。在本發明的一個實施方式中,對於表明動脈粥樣硬化各階段及其臨床後遺症的各種情況,評估一組蛋白質的表達情況(expressionprome)。這樣一組蛋白質所提供的鑑別水平是用單個標記做不到的。在一個實施方式中,通過檢測蛋白質濃度或含量來測定表達分布。分析方法可包括但不限於利用數據集形成預測模型,將測試樣品數據輸入這種模型根據動脈粥樣硬化分類來分類樣品,其中所述分類選自動脈粥樣硬化性疾病分類、健康分類、血管炎症分類、用藥分類、不用藥分類和冠狀動脈鈣化度分類,以及根據該方法的輸出來分類樣品。在一些實施方式中,利用這種預測模型通過獲得哺乳動物對象樣品相關數據集來分類該樣品,其中所述數據集包括至少3種、至少4種或至少5種選自以下的蛋白質標記MCP1;MCP2;MCP3;MCP4;嗜酸細胞活化趨化因子;IP10;MCSF;IL3;TNFa;Ang2;IL5;IL7;IGF1;IL10;INFy;VEGF;MIPla;RANTES;IL6;IL8;ICAM;TIMP1;CCL19;TCA4/6kine/CCL21;CSF3;TRANCE;IL2;IL4;IL13;Illb;MCP5;CCL9;CXCL1/GR01;GROa;IL12;和痩蛋白(leptin)。數據任選包括臨床指徵(clinicalindicia)的概況;其它蛋白質表達情況;代謝指標;遺傳信息等。本發明的預測模型利用由本文所述一組或多組標記獲得的定量數據。在一些實施方式中,預測模型能提供一定水平的分類準確率;即該模型滿足了所需的質量閾值(qualitythreshold)。有意義的質量閾值可提供滿足給定閾值的AUC或準確率,這些術語(AUC;準確率)中的一種或兩種在本文中可稱為質量指標(qualitymetric)。預測模型可提供一種質量指標,例如分類的準確率或AUC為至少約0.7,至少約0.8、至少約0.9或更高。用這種模型可以正確選擇參數,從而能在靈敏度和選擇性之間提供所需平衡。在其它實施方式中,循環蛋白分析被用於篩選生物學活性物質的動脈粥樣硬化治療效力的方法。在這種方法中,將動脈粥樣硬化相關細胞,例如血管壁細胞等在培養物中或在體內與候選物質接觸,並測定這種接觸對一種或多種標記,例如一組標記表達的作用。在另一實施方式中,分析上述循環蛋白的差異表達被用於患者用在遵循一定治療方案的方法中。當患者曾接受了某種治療,在單個時間點或一段時期內測定一種或多種標記(例如一組標記)的表達,所述治療包括藥物、多種藥物、非藥理學幹預以及它們的組合等。在另一方法中,採用3種或更多本文鑑定的動脈粥樣硬化相關蛋白的相對量來診斷或監測個體的動脈粥樣硬化。本文鑑定的蛋白組還可包括其它臨床指徵;其它蛋白質表達情況;代謝指標;遺傳信息等。在另一實施方式中,本發明包括通過以下步驟分類哺乳動物對象樣品的方法獲得樣品相關數據集,其中所述數據集包括至少3種、或至少4種、或至少5種、或至少6種、或至少7種、或至少8種、或至少9種或9種以上選自以下的蛋白質標記的定量數據MCP1、MCP2、MCP3、MCP4、嗜酸細胞活化趨化因子、IP-IO、M-CSF、IL-3、TNFa、Ang-2、IL-5、IL-7和IGF-1;將數據輸入利用數據分類樣品的分析方法,其中所述分類選自動脈粥樣硬化性疾病分類、健康分類、血管炎症分類、藥物接觸分類、未接觸藥物分類和冠狀動脈鈣化度分類;和根據該方法的輸出來分類樣品。在另一實施方式中,本發明包括通過以下步驟分類哺乳動物對象樣品的方法:獲得樣品相關數據集,其中所述數據集包括至少3種、或至少4種、或至少5種、或至少6種蛋白質標記的定量數據,各標記顯示了循環蛋白質濃度與動脈粥樣硬化血管組織RNA濃度之間的相互關係;將數據輸入利用數據分類樣品的分析方法,其中所述分類選自動脈粥樣硬化性疾病分類、健康分類、血管炎症分類、藥物接觸分類、未接觸藥物分類和冠狀動脈鈣化度分類;和根據該方法的輸出來分類樣品。附圖簡述圖1.餵食高脂飲食的載脂蛋白(apo)E-缺陷型小鼠中隨動脈粥樣硬化進展的時間依賴性血清炎性蛋白表達。熱圖(heatmap)是血清濃度水平的圖形化顯示,其中,x-軸是各血清樣品,y-軸是蛋白質標記。數值表示餵食高脂飲食的apoE-缺陷型小鼠在基線(TOO;"=5)和10(丁10;w=5)、16(T16;w=4)、24(T24;w=5)及40周(T40;"=5)時的血清蛋白表達水平。請注意,對於16周時間點,數值獲自另一獨立數據集。圖2.apoE-缺陷型小鼠和對照小鼠的循環炎性蛋白表達水平。熱圖是標準化表達數值表的圖形化顯示。數值表示餵食高脂飲食的apoE-小鼠平行組在基線(TOO)0=9)和40周(T40)時(n=9),以及餵食高脂飲食的C57B1/6(11=5)和C3H/HeJ(n二3)小鼠在基線和40周時(n值分別為5,5)的循環蛋白平均表達水平(log2)。餵食高脂飲食的apoE-缺陷型小鼠的炎性標記水平最高,而C3H/HeJ小鼠的水平最低,儘管它也餵食高脂飲食。採用N-向ANOVA鑑定各種情況下的統計學顯著差異。在最右邊一列中,報導的p-值未考慮飲食、品系和時間之間可能的相互作用。下文討論了這些因素的影響和它們彼此的相互作用。圖3.小鼠動脈粥樣硬化分類血清炎性標記的蛋白質組學籤名(proteomicsignaturepattern)。A鑑定動脈粥樣硬化分類蛋白質亞組。採用各種分類算法,包括微陣列預測分析(PAM)、遞歸特徵排除(recursivefeatureelimination)(RFE)、支持向量機(supportvectormachine)(SVM)禾卩ANOVA,根據準確區分4種不同動脈粥樣硬化性疾病階段(基線時和10、24及40周時餵食高脂飲食的apoE-缺陷型小鼠)小鼠的能力對一亞組的標記進行排名。這些標記中的部分用所有分類算法進行了排名。&小鼠動脈粥樣硬化性疾病的分類準確率(混淆矩陣(confusionmatrix))。為測定小鼠分類蛋白質預測疾病嚴重程度的準確率,我們使用以前鑑定的優選蛋白質標記(Cc121、Ccl9、Csf3、Tnfsfll、Vegfa、Cclll、Ccl2)。用SVM算法交叉驗證根據疾病階段分組的小鼠實驗。用1,000-步7V-倍交叉驗證方法測定分類準確率,25。/。的實驗用作測試組(testgroup),其餘的用作訓練組(traininggroup)。結果以表格形式表示,混淆矩陣如"方法"部分所述。標記"真"表示"的確患病",而"預測的"表示"預計患病"。C:一獨立數據集的分類。採用SVM算法,我們能將獨立數據集("測試")歸入最接近原實驗組("己知的")的時間點組別。已知實驗包括獲得蛋白分類符(classifier)組的原始分析中的4個時間點。獨立實驗組獲自未包括在原始組中的16-周時間點。熱圖中顯示了一對多比較(one-vs-allcomparison)所得各實驗的SVM評分(親和度)。16-周時的蛋白質分布情況與原始數據集中10-周時是更相關。圖4.優選分類符標記的血清水平和血管基因表達之間的相關性。A:為研究這些血清標記中一個亞組的疾病相關基因表達,我們研究了它們在血清來源小鼠主動脈中的基因時序表達(temporalexpression)。採用定量實時RT-PCR(qRT-PCR),我們能使這些標記的時間依賴性血清蛋白質水平與它們的血管壁基因表達相關。測定了血清蛋白質水平的loglO-標準化平均表達比與主動脈基因表達值的loglO-標準化平均表達比的皮爾遜相關性(Pearsoncorrelation)。將各時間點的蛋白質微陣列除以apoE缺陷型小鼠的基線水平得到蛋白質水平平均比(n:4-9)。將各時間點的重複qRT-PCR反應結果除以apoE-缺陷型小鼠的基線值得到基因表達水平的平均比。請注意,對於16-周時間點,數值獲自另一獨立數據集。B:皮爾遜相關性數值的相關性矩陣總結表,比較了血清蛋白質水平的標準化平均比值、血管基因表達的標準化平均比值和餵食高脂飲食時間(loglO-餵食周數)。顯著性水平為0.05(雙側檢驗(2-tailed))。圖5.對象的臨床特徵。名義變量(Nominalvariable)(*)以計數(%)表示,連續變量(continuousvariables)(卞)以中值(四分位數間距((interquartilesrange))表示。$通過皮爾遜卡方或曼-惠特尼U檢驗進行適當比較。基於10000次抽樣比較,採用蒙特卡洛方法計算顯著性。BP(血壓);FH(家族史);ACEI(血管緊張素轉換酶抑制劑);BB((3阻斷劑);CCB(鈣通道阻斷劑);AB(ct阻斷劑);ASA(乙13醯水楊酸);BMI(體重指數);DBP(舒張壓);SBP(收縮壓);HR(心率);CRP(C-反應性蛋白)。圖6.就臨床特徵進行調整前後,冠狀動脈疾病患者和健康對照的血清趨化因子分布。所示數據為幾何平均數(95。/。CI)。通過GLM多變量分析進行調節,通過t-檢驗比較調整後平均數。*模型1,就年齡和腰圍進行調整;t模型2,如同模型l進行調整,並就治療(ACE抑制劑、他汀類藥物和阿司匹林)調整。圖7.臨床變量和病例比對照的兩維層次聚類法(hierarchicalclustering)。圖8.主成分分析證明趨化因子、胰島素耐受性情況和一個其它臨床變量(例如高血壓和高脂血症)亞組可以解釋在對象中觀察到的差異中的60-70%,其中炎症標記是主要因素。圖9.該表格顯示了用於測定排名變量的最佳數量從而能以最低誤差率將實驗分類成正確組的支持向量機(SVM)和遞歸特徵排除(RFE)。通過1000次重複交叉驗證計算最佳誤差率或分類誤差,其中25%的實驗用作測試組,其餘實驗用作訓練組。圖10.ROC曲線。圖11.該表格顯示了預測冠狀動脈疾病的對數回歸模型(LogisticRegressionmodel)。模型l)逐步前向選擇(Stepwiseforwardselection),缺失數值不估算;2)逐步前向選擇,採用條件均值(conditionalmeans)進行缺失數據估算;3)臨床變量和趨化因子評分的逐步前向選擇。獨立變量年齡、性別、舒張壓(DBP)、收縮壓(SBP)、心率、血漿胰島素、C-反應性蛋白和趨化因子(模型1和2:嗜酸細胞活化趨化因子、IP-IO、MCP-1、MCP-2、MCP-3、MCP-4和MIP-la;模型3:趨化因子評分)。圖12.—系列0)八模型的預期八1;(:數值和8.£.,標記數如圖所示依次增多。圖13.—系列對數回歸模型的預期AUC數值和S.E.,標記數如圖所示依次增多。圖14.LDA模型預測,MCP-1標記不在可用預測標記組之列。該新模型用Ang-2、IGF-1和M-CSF作為另一種標記組合來超越AUC>0.75的閾值。圖15a.採用赤池信息量基準(AkaikeInformationCriterion)(AIC)選擇對數回歸模型的標記。圖151^.—系列對數回歸模型的預期八1;(:數值和8衛.,標記數如圖所示依次增多(=在標記選擇過程中採用aic標準從完整模型中依次除去標記數的倒序)。圖16.包括臨床變量和生物學標記的對數回歸模型。圖17.包括臨床可變變量和生物學標記的對數回歸模型。包括"P阻斷劑"(DC512)和"他汀類藥物"(DC3005)及MCP-4的模型產生的AUC預計值超過0.85。圖18.以下三組的第一辨別變量(discriminantvariate)值分布的箱線圖(boxplot):"未治療的"、"ACE或他汀類藥物"和"ACE和他汀類藥物"。發明詳述定義除非另有表述,權利要求書和說明書中使用的術語如下所述。術語"改善"指疾病狀態,例如動脈粥樣硬化性疾病狀態的治療中獲得的任何有益的治療結果,包括預防、嚴重程度或進展的減緩、緩解或治癒。本文所用的術語"哺乳動物"包括人和非人,包括但不限於人、非人靈長類、狗、貓、鼠、牛、馬和豬。述及兩條或多條核酸或多肽序列時的術語"相同性"百分比指當比較和排列對比兩條或多條序列或子序列的最大一致性時,利用一種下述序列比較算法(例如,BLASTP和BLASTN或技術人員可用的其它算法)或通過目測檢測到有一定百分比的核苷酸或胺基酸殘基相同。取決於具體應用,"相同性"百分比可以涉及進行比較的序列區域,例如功能性結構域,或者涉及待比較的兩條序列的全長。為了進行序列比較,通常將一條序列用作供測試序列與之相比的參比序列。當使用序列比較算法時,將測試序列和參比序列輸入計算機,根據需要設定子序列的坐標,並設定序列算法程序參數。序列比較算法於是根據所設定的程序參數計算一條或多條測試序列相對於參比序列的序列相同性百分比。可通過以下方法對要比較的序列進行最佳比對排列,例如Smith和Waterman的局部同源算法(Adv.Appl.Math.2:482(1981))、Needleman和Wunsch的同源比對算法(J.Mol.Biol.48:443(1970))、Pearson和Lipman的相似度檢索法(Proc.Nat'l.Acad.Sci.USA85:2444(1988))、計算機執行這些算法(威斯康星遺傳學軟體包的GAP、BESTFIT、FASTA和TFASTA,遺傳學計算機組(GeneticsComputerGroup),575ScienceDr.,麥迪遜,威斯康星州)或目測(通常參見Ausubel,FM等,CurrentProtocolsinMolecularBiology(《最新分子生物學方法》),4,約翰威立父子公司(JohnWiley&Sons,Inc.),布魯克林,紐約,A.1E.1-A.1F.11,1996-2004)。適合於測定序列相同性百分比和序列相似性百分比的算法的一個實例是Altschul等(J.Mol.Biol.215:403-410(1990))所述的BLAST算法。執行BLAST分析的軟體可從生物技術信息國家中心(NationalCenterforBiotechnologyInformation)公開獲f尋(www.ncbi.nlm.nih.gov/)。術語"足量"表示足以產生所需作用的用量,例如足以改變蛋白質表達特徵的用量。術語"治療有效量"是能有效緩解疾病症狀的用量。治療有效量可以是"預防有效量",因為預防可視為治療。TP:真陽性TN:真陰性FP:假陽性FN:假陰性N:陰性樣品總數P:陽性樣品總數A:樣品總數_準確率=(TP+TN)/A平均CV誤差=平均分類誤差誤差=1-平均準確率靈敏度=TP/P=TP/(TP+FN)特異性=TN/N=TN/(TN+FP)本申請所用的縮寫包括以下CAD=冠狀動脈疾病;MIPla=MIPla;LDA=線性辨別分析;MI=心肌梗塞;ASCVD=動脈粥樣硬化性心血管疾病。必須注意,除非文中另有明確表述,說明書和隨附的權利要求書中所用的單數形式"一"、"一個"和"該"包括複數含意。在本文中,動脈粥樣硬化(也稱為動脈硬化、動脈粥樣化血管疾病、動脈阻塞性疾病)指特徵在於血管壁上有斑塊累積及血管炎症的心血管疾病。所述斑塊由胞內和胞外脂質、平滑肌細胞、結締組織、炎性細胞和葡萄糖胺聚糖累計而成。炎症與脂質累積常在血管壁中聯合發生,血管炎症是動脈粥樣硬化性疾病過程的標誌。心肌梗塞是通常由流向心肌部分的冠狀動脈血液突然減少導致的缺血性心肌壞死。在絕大多數急性MI患者中,急性血栓(常與斑塊破裂有關)阻塞了向受損區域供血的動脈。斑塊破裂通常發生在以前被富集於炎性細胞中的動脈粥樣硬化斑塊所部分阻塞之處。據估計,動脈粥樣硬化斑塊中內皮機能障礙和血管炎症所誘導的血小板功能改變導致血栓形成。心肌梗塞可分類成ST升高和非ST升高型MI(也稱為不穩定心絞痛)。兩種心肌梗塞形式中均有心肌壞死。ST升高型心肌梗塞中有透壁心肌損傷,從而導致心電圖上ST升高。在非ST升高型心肌梗塞中,損傷在心內膜下,不引起心電圖上ST段升高。心肌梗塞(ST升高型和非ST升高型)代表了一種不穩定的動脈粥樣硬化性心血管疾病。急性冠狀動脈症候群包括各種形式的不穩定冠狀動脈疾病。心絞痛指向心血流不足導致的胸部疼痛或不適。心絞痛可視為動脈粥樣硬化性心血管疾病的症狀之一。心絞痛可分類為穩定型,其遵循一種規律的慢性症狀模式,與不穩定動脈粥樣硬化性心血管疾病不同。穩定型動脈粥樣硬化性心血管疾病的病理生理學基礎也是複雜的,但在生物學上區別於不穩定型。穩定心絞痛一般不是心肌壞死。心力衰竭可能是心肌梗塞導致的心肌機能障礙所致。目前方法的幾個特徵值得注意。動脈粥樣硬化和相關的病症是通過評估是否存在一種或一組蛋白質標記的血檢來診斷的。所述標記包括MCP-1、MCP-2、MCP-3、MCP-4、嗜酸細胞活化趨化因子、IP-IO、M-CSF、IL國3、TNFa、Ang-2、IL-5、IL-7和IGF-1。已知,這些標記在動脈粥樣硬化過程中在血管壁中特異性產生。在一些實施方式中,這種預測模型利用從循環標記獲得的定量數據,所述標記包括MCP1;MCP2;MCP3;MCP4;嗜酸細胞活化趨化因子;IP10;MCSF;IL3;TNFa;Ang2;IL5;IL7;IGF1;IL10;INFy;VEGF;MIPla;RANTES;IL6;IL8;ICAM;TIMP1;CCL19;TCA4/6kine/CCL21;CSF3;TRANCE;IL2;IL4;IL13;Illb;MCP5;CCL9;CXCL1/GR01;GROa;IL12;和痩蛋白。有用的其它循環標記包括sVCAM;sICAM-l;E-選擇蛋白;P-選擇蛋白;白介素-6,白介素-18;肌酸激酶;LDL,oxLDL,LDL粒度,脂蛋白(a);肌鈣蛋白I,肌鈣蛋白T;LPLA2;CRP;HDL,甘油三酯,胰島素,BNP(腦鈉尿肽),神經趨化蛋白(fractalkine),骨橋蛋白,骨保護素,制瘤素-M,髓過氧化物酶,ADMA,PAI-1(纖溶酶原激活物抑制劑),SAA(循環澱粉樣蛋白A),t-PA(組織型纖維蛋白溶酶原激活劑),sCD40配體,血纖蛋白原,高半胱氨酸,D-二聚體,白細胞計數;還可包括本文所述的各種其它標記,包括指徵,代謝指標,遺傳信息和其它循環標記。在本發明的某些實施方式中,由患者樣品獲取分類數據集,其中該數據集包括選自以下的至少三種蛋白質標記的定量數據MCP-1、MCP-2、MCP-3、MCP-4、嗜酸細胞活化趨化因子、IP-IO、M-CSF、IL-3、TNFa、Ang-2、IL-5、IL-7和IGF-l。所述至少三種蛋白質標記可包括選自以下的標記組(markerset):MCP-l、IGF國1、TNFa;MCP-1、IGF墨1、M-CSF;ANG-2、IGF-1、M-CSF;和MCP-4,IGF-1,M-CSF。當數據集包括至少四種蛋白質標記的定量數據時,所述至少四種蛋白質標記可選自下組MCP-1,MCP-2,MCP-3,MCP-4,嗜酸細胞活化趨化因子,IP-IO,M-CSF,IL-3,TNFa,Ang-2,IL-5,IL-7和IGF-1;MCP-1,IGF-1,TNFa,IL-5;MCP陽1,IGF-1,M-CSF,MCP匿2;ANG隱2,IGF-1,M-CSF,IL-5;MCP-1,IGF-1,TNFa,MCP-2;和MCP-4,IGF-1,M墨CSF,IL-5。當數據集包括至少五種標記的定量數據時,所述至少五種標記可包括選自以下的標記組MCP-1,MCP-2,MCP-3,MCP-4,嗜酸細胞活化趨化因子,IP-IO,M-CSF,IL-3,TNFa,Ang-2,IL-5,IL誦7和IGF-1;MCP-1,IGF-1,TNFa,IL-5,M陽CSF;MCP陽1,IGF隱l,M-CSF,MCP隱2,IP-10;ANG隱2,IGF匿1,M-CSF,IL-5,TNFa;MCP-1,IGF扁1,TNFa,MCP-2,IP-10;MCP-4,IGF-1,M-CSF,IL隱5,TNFa;和MCP-4,IGF-1,M-CSF,IL-5,MCP-2。在本發明的另一實施方式中,至少兩種、至少三種、至少四種、至少五種或更多種標記選自M-CSF、嗜酸細胞活化趨化因子、IP-IO、MCP-1、MCP-2、MCP-3、MCP-4、IL-3、IL-5、IL-7、IL-8、MIPla、TNFa和RANTES。鑑定動脈粥樣硬化相關循環蛋白能提供診斷和預後方法,所述方法能通過檢測所鑑定循環蛋白的水平變化來檢測病症(例如冠狀動脈疾病、動脈粥樣硬化等)的發生,特別是這種病症表明有心肌梗塞、心力衰竭等傾向時;或評估個體這種疾病18的易發性。這些方法還包括篩選治療劑和方法的效力;給疾病分階段和分類;等等。可採用早期檢測來測定進程性疾病的發生,從而能用合適的預防性或保護性手段加以幹預。感興趣的循環蛋白包括表1所列的那些tableseeoriginaldocumentpage20imageseeoriginaldocumentpage21formulaseeoriginaldocumentpage22tableseeoriginaldocumentpage23tableseeoriginaldocumentpage24formulaseeoriginaldocumentpage25CCL3||SCYA3||CCL3||MIP1A||LD78-all巨噬細胞炎性蛋白l-all小的可誘導細胞因子A3H趨化因子(C-C基序)配體3II趨化因子,CC基序,配體3||趨化因子(C-C基序)配體36348畫_002983(SE^IDNO:182)CX756573,M27281,M32977,S85192,X62568AC069363,D90144,M23178,X04018,AF043339,BC071834,D00044,D63785,M23452,M25315,X03754,CR591007畫—011337(SEQIDNO:183)AL596122,M73061,X53372,AF065939,AF065940,AF065941,AF065942,AF065943,AK150590,AK150634,AK150698,AK151581,AK152648,AK153155,AK155058,J04491,M23447,X12531,AA895994NP一002974,Pl6"l47,Q14745(SEQIDNOS184-186)NP_035467,P10855'Q5Q麗0(SEQ1DNOS187-189)CCL5||TCP228||SCYA5||CCL5||T細胞特異性RANTESIIT細胞特異性蛋白p228H小的可誘導細胞因子A5卩趨化因子(C-C基序)配體5||趨化因子,CC基序,配體5||活化後調節的,通常是T細胞表達的,估計是分泌的II趨化因子(C-C基序)配體56352麗—002985(SEQIDNO:190)AB023652,AB023653,AB023654,AC015849,AF088219,DQO17060,AF043341,AF266753,BC008600,BG272739'M21121,BM917378雨—013653(SEQIDNO:191)AB051897,AL596122,,298,X70675,AF065944,AF065945,AF065946,AF065947,AF128187,AK003101,AK158074,AY722103,BC033508,CT0腿5,M77747,S37648,AI020884NP一002976,P13501,Q9UBL2(SEQIDNOS192-194)NP_038681,P30882,Q5XZF2(SEQIDNOS195-197)IL6HIL6IIIFNB2IIHSFIIBSF2II幹擾素,P-2H雜交瘤生長因子卄B-細胞分化因子IIB-細胞剌激因子2H白介素6(幹擾素,P2川BMI增加中的HGF血清IL6水平,修飾物||白介素6(幹擾素,P2)3569雨—000600(SEQIDNO:198)AC073072,AF372214,CH236948,X04402,Y00081,BC015511,BTO19748,BTO19749,NM一031168(SE^IDNO:199)AC112933,M20572,M24221,M36996,X51457,AK089780,AK150440,NP—000591,P0f231,Q75MH2,Q8N6X1(SEQIDNOS200-203)NP—112445,f08505(SEQIDNOS204-205)tableseeoriginaldocumentpage27TIMP1HTIMP1IIHCIIIEPAII膠原酵抑制劑,人IITIMP金屬肽酶抑制劑lll金屬肽酶1的組織抑制劑(紅系增能活性,膠原酶抑制劑川CCL19||CCL19||ELC||MIP3B||SCYA19IIEBIl-配體趨化因子IIEXODUS3||巨噬細胞炎性蛋白3-則趨化因子,CC基序,配體19||趨化因子(C-C基序)配體19||小的可誘導細胞因子亞族A,成員19||CCL21||SCYA21||CCL21||SLC||EXODUS2||二級淋巴組織趨化因子ll趨化因子,CC基TIMP金屬肽酶抑制劑17076畫一003254(SE^IDNO:222)趨化因子(C-C基序)配體196363謹—006274(SEQIDNO:235)趨化因子(C-C基序)配6366函002989(SEQIDNO:AK152527,AK152530'AK152556,AK156417,AK168275,AK171502,AK171520,AK172321,BC008626,CTO10246,CT010302,X16624,X52264,X54331AY932824,畫011593AL671885,NP003245;NP03572D11139,L47361,(SE^IDNO:M21162,Q5§JP21,3,&2032,Z84466,223)M28308,Q5H9A7,Q60734AK074854,M28309,Q6FGX5,(SEQIDBC000866,M28310,2,NOSBC007097,M28311,P01033;232-234)BQ181804,M28312,X69413Q14252;BU857950,AY622853,(J9UCU1CR407638,BC008I07,(SEQIDNOSCR541982,BC034260,224-231)CR590572,BC051260,CR593351,M17243,CR602090,V00755,X04684M12670,M59906,S68252,X02598,X03124,A10416AJ223410,觀一0U888AF307988,NP006265,NP036018AL162231,AF308159,Q6rBD6,,071)460,AB000887,(SE(JIDNO:AL772334,Q99731Q548P0BC027968,236)AF059208,CR456868,AK144337,(SEQIDNOS(SEQIDCR623730,U77180,AK156269,237-239)NOSU88321,BM720436BC025130,240-242)BC051472,BE864988AF030572,NM—023052NP002980,NP—075539AJ005654,00^585,AL162231,(SEQIDNO:Q5VZ73,(SEQIDformulaseeoriginaldocumentpage29胞刺激因子1||白介素43565應一000589'薩—172348(SE^IDNOS288-289)IL13HIL13II白介素13||白介素133596蘭—002188(SE^IDNO:300)BC066254,X01663,X01664,,Q9C001BC066255,X01665,X52618,(SEQIDNOSBC066256,AF065914,275-285)BC066257,AF065915,BC070338,AF065916,DQ231169,AF352786,S77834,S77835,AF538059,S82692,U25676,AF542383,V00564,X01586,AF542384,A14844AF542385,AY147902,K02292,U41494,U41504,U41505,U41506,X01772,X66058,X73040AC004039,麗021283AC005742,NP758858,NP06725AF395008,(SE^IDNO:AL596095,P05112,8,f07750,AF465829,290)AL645741,Q5FC01,Q5SV00M23442,X06750,U07869,X05064,Q6麗P0,(SEQIDAB102862,X05252,X05253,Q6NZ77,NOSAF043336,AB174765,Q9UPB9297-299)BC066277,AF352783,(SEQIDNOSBC066278,BC027514,29卜296)BC067514,M13238,BC067515,M25892,X03532BC070123,M13982,X81851AC004039,畫008355AC005742,NP002179,NP03238AF172149,(SE^IDNO:AL645741,P352251,#"20109,AF172150,301)L13028,M23504,Q4VB50Q5SUZ9AF193838,,Q4VB51(SEQIDAF193839,,Q4VB52NOSAF193840,,Q4VB53308-310)AF377331,(SEQDNOSAF416600,302-307)AY008331,AY008332,L13029,L42079,L42080,U10307,U31120,AF043334,BC096138,gob80030864.1敦滔*被25/74mtableseeoriginaldocumentpage31tableseeoriginaldocumentpage32formulaseeoriginaldocumentpage33除了本申請中以名稱、登錄號或序列指定的具體生物標記外,本發明還考慮採用與所例舉序列有至少卯%或至少95%或至少97%相同且目前知導的或將被發現可用於本發明方法的生物標記變體。這些變體可代表多態性、間接變體、突變等。本發明的診斷方法可用各種技術和試劑。在本發明的一個實施方式中,可檢驗血液樣品或衍生自血液的樣品,例如血檢、循環(蛋白)等中是否存在多肽。通常抽取血液樣品,然後檢驗衍生產物,例如血檢或血清。可利用特異性結合成分檢測這些多肽。將抗體用於這一目的尤其值得關注。這種試驗可採用多種形式,包括抗體陣列;ELISA和RIA;在懸液和/或溶液中進行標記抗體的結合然後通過流式細胞術、質譜法等進行檢測等等。檢測可利用一種或一組抗體,優選陣列形式的一組抗體。表達籤名(expressionsignature)通常聯用檢測方法與結果分析來測定是否存在與疾病籤名統計學意義上顯著的匹配。在另一實施方式中,採用體內成像來檢測心臟組織中是否存在動脈粥樣硬化相關蛋白。這些方法可採用,例如這些蛋白質的經標記的特異性抗體或配體。在這些實施方式中,將多肽特異性的以可測方式標記的抗體、配體等物質給予個體(例如,通過注射),採用標準成像技術(包括但不限於磁共振成象、計算機化斷層顯像掃描等)來定位被標記的細胞。檢測可採用一種成像試劑或多種成像試劑的混合物。在另一實施方式中,分析血管(優選受動脈粥樣硬化影響的一條或多條血管)組織的mRNA樣品中的動脈粥樣硬化指示性遺傳學籤名(geneticsignature)。所提供的循環蛋白表達模式表現了動脈粥樣硬化中的炎性籤名的特徵,並進一步將特定的免疫相關路徑與糖尿病和藥物療法關聯起來。雖然目前的數據顯示它們在動脈粥樣硬化的炎症反應中具有顯著的作用,但將血管壁中的免疫路徑與疾病的一些關鍵方面關聯起來的直接數據依然很少,所述關鍵方面包括風險因素影響初級炎性反應(primaryinflammatoryprocess)的機制和調節例如高血壓和高脂血症等風險因素的藥物如何特異性地影響了炎症的機制。本發明鑑定了可用於診斷和分類動脈粥樣硬化性心血管疾病的炎症生物標記的表達分布情況。在診斷患者動脈粥樣硬化和相關病症的方法中,獲取本文提供的生物標記在血液、血清等中的表達模式,將其與對照值比較來確診。本發明分析還可包括源於臨床變量的輸入值。例如,可將患者的血源樣品例如血液、血漿、血清等加給一種或一組特異性結合試劑來確定是否存在要找的標記。該項分析一般包括至少一種本文所述的標記,例如M-CSF、嗜酸細胞活化趨化因子、IP-IO、MCP-1、MCP-2、MCP-3、MCP-4、IL-3、IL-5、IL陽7、IL-8、MIPla、TNFa、Ang國2、IGF陽1和RANTES,通常是至少兩種標記,更常見是至少三種標記,還可包括4、5、6、7種或最多所有的標記。優選的標記組包括以下標記中的至少3種MCP-1、MCP-2、MCP-3、MCP-4、嗜酸細胞活化趨化因子、IP-IO、M-CSF、IL-3、TNFa、Ang-2、IL-5、IL-7和IGF-1,可以包括4、5、6、7、8、9、10、11、12種或所有標記o該項分析還可包括可能存在於血清或組織樣品中的其它蛋白質的表達信息。採用適用於具體標記的方法來獲得定量信息。標記包括但不限於SVCAM;SICAM-1;E-選擇蛋白;P-選擇蛋白;白介素-6,白介素-18;肌酸激酶;LDL,oxLDL,LDL粒度,月旨蛋白(a);肌,丐蛋白I,肌銬蛋白T;LPLA2;CRP;Ccl9;Ccl2;Ccl21;Ccll9;IL-5;Tnfsf11;Vegfa;Cxcll;瘦蛋白,HDL,甘油三酯,胰島素,BNP(腦鈉尿肽(brainnatureticpeptide)),神經趨化蛋白,骨橋蛋白,骨保護素,制瘤素-M,髓過氧化物酶,ADMA,PAI-1(纖溶酶原激活物抑制劑),SAA(血清澱粉樣蛋白A),t-PA(組織型纖維蛋白溶酶原激活劑),sCD40配體,血纖蛋白原,高半胱氨酸,D-二聚體,白細胞計數等。其它變量包括臨床指徵,通常是對這些臨床指徵進行評估後將所得數據與循環標記分析組合用於某算法。這些臨床標記包括但不限於性別;年齡;葡萄糖;胰島素;體重指數(BMI);心率;腰圍;舒張壓;收縮壓;血脂障礙;吸菸否;等等。其它變量包括用外周血測定的基因表達指標、代謝指標和遺傳學信息本發明方法可用於取定動脈粥樣硬化的階段、動脈粥樣硬化預後、評估動脈粥樣硬化的進展程度、監測治療反應等。鑑於本文所述,本領域普通技術人員不難理解如何用本發明實現這些應用。例如,可如下確定動脈粥樣硬化階段一組數據集與從階段已知的疾病樣品所獲得的一份或多份數據集作比較;或者,構建能預測階段的模型,然後將某數據集輸入該模型以獲得預測的階段。可採用類似方法來提供動脈粥樣硬化的預後。可通過觀察預測模型例如上述模型所得的一種或多種預測值的隨時間變化來監測進展。可採用本發明方法並確定已知疾病患者的一種或多種分類結果是否接近或落入常規分類來測定治療反應。採用上述方法,如本領域所知,定量測定某測試樣品中的標記。然後將如此35獲得的定量數據應用於分析性分類方法。在這種方法中,根據某算法處理原始數據,其中該算法已用訓練組的數據預先確定,參照本文實施例所述。一種算法可用本文提供的訓練組的數據,或用本文提供的指導來產生處理另一不同數據組的算法。分析性分類方法可採用各種統計學分析方法來處理定量數據並提供樣品的分類信息。有用方法的實例包括線性辨別分析、遞歸特徵排除、微陣列預測分析、對數回歸、CART算法、FlexTree算法、LART算法、隨機森林算法(randomforestalgorithm)、MART算法、機械學習算法(machinelearningalgorithm);等等。採用這些方法中的任一種,用動脈粥樣硬化數據集建立預測模型。在建立這種模型的過程中,將包含對照和患病樣品的數據集用作訓練組。訓練組包所有感興趣標記的數據。本文提供了感興趣標記的預測模型的實例,例如參見實施例6-10。本文所示的預測模型利用了多項蛋白質水平測定的結果,提供能以所需準確率將個體分類為屬於特定狀態的算法,其中狀態可以是動脈粥樣硬化或非動脈粥樣硬化。感興趣的分類包括但不限於將樣品指定為一種或多種動脈粥樣硬化性疾病狀態i)動脈粥樣硬化狀態與非動脈粥樣硬化狀態,ii)MI狀態與心絞痛狀態,iii)低鈣狀態與高鈣狀態。可根據預測模型法作出分類,所述方法設定一閾值,據此閾值確定某樣品屬於某給定類別的概率。該概率優選至少50%、或至少60%或至少70%或至少80%或更高。還可通過確定獲得的數據集與參比數據集相比是否有統計學顯著的差異來作出分類。如果存在所述差異,則認定獲得數據集的來源樣品不屬於參比數據集代表的類別。相反,如果在統計學上這樣的比較與參比數據集的差異不明顯,則將獲得數據集的來源樣品歸入參比數據集代表的類別。可根據某模型提供某具體數值或數值範圍的AUC或準確率等質量指標準確率的能力來評估其預測能力。在一些實施方式中,所需的質量閾值是分類某樣品的準確率如下所示的預測模型至少約0.7、至少約0.75、至少約0.8、至少約0.85、至少約0.9、至少約0.95或更高。作為另一指標,所需的質量閾值可以指分類某樣品的AUC(曲線下面積)如下所示的預測模型至少約0.7、至少約0.75、至少約0.8、至少約0.85、至少約0.9、至少約0.95或更高。本領域已知可以"調諧"預測模型的相對靈敏度和特異性以提高選擇性指標或靈敏度指標,這項指標具有反比關係。可根據所進行的測試的具體要求調節上述模型的限度來提供選定的靈敏度或特異性水平。靈敏度或/和特異性可以至少約0.7、至少約0.75、至少約0.8、至少約0.85、至少約0.9或更高。可通過檢測各標記的數值來初步分析原始數據,通常按一式三份或多次一式三份進行。可以處理數據,例如可利用標準曲線轉換原始數據,一式三份檢測值的平均值可用於計算各患者的平均值和標準偏差。可先轉換這些數值,再用於模型中,例如log-轉換,Box-Cox轉換(參見Box和Cox,(1964)J.RoyalStat.Soc.,B系列,26:211-246)等。然後將數據輸入按照狀態分類樣品的預測模型。可將得到的信息傳遞給患者或專業醫護人員。為建立動脈粥樣硬化狀態的預測模型,在訓練組中使用包括已知對照樣品和對應於感興趣的動脈粥樣硬化分類的樣品的強大數據集。採用普遍認可的標準選擇取樣規模。如上所述,可採用不同的統計學方法獲得高度準確的預測模型。實施例5、ll和12給出了這種分析的實例。在一個實施方式中,基於預測模型進行層次聚類法,其中,將皮爾遜相關性用作聚類指標。一種方法是將患者動脈粥樣硬化數據集視作"有監督的學習(supervisedlearning)"中的"學習樣品"。CART是一項醫藥學應用標準(Singer(1999)RecursivePartitioningintheHealthSciences,其if普林格公司(Springer)),該方法可通過以下步驟改進將任一項定性特徵轉換成定量特徵;根據所得顯著性水平對這些特徵進行分選,通過樣品再用法(samplereusemethod)來評估霍特林T2統計量(Hotelling'sT2statistic);並適當地應用拉索法(lassomethod)。預測問題轉換成了仍與預測相關聯的回歸問題,實際上通過在對回歸質量的評估中適當運用Gini分類標準。該方法產生了稱為FlexTree的方法(Huang(2004)PNAS101:10529-10534)。用於模擬和用於SNP和其它形式的數據時,FlexTree效果良好。已開發了自動執行FlexTree的軟體。或者可用LARTree或LART。幸運的是,近年來已開發出了稱為LARTree(或簡單LART)的方法(Turnbull(2005)ClassificationTreeswithSubsetAnalysisSelectionbytheLasso,史丹福大學)。拉索該名稱反映其為二叉樹(binarytree),如CART和FlexTree中那樣;拉索法(Lasso),如前所述;通過Efron等所謂的的LARS((2004)AnnalsofStatistics32:407-451)執行拉索法。也可參見Huang等,(2004)Tree-structuredsupervisedlearningandthegeneticsofhypertension.ProcNatlAcadSciUSA.101(29):10529陽34。可用的其它分析方法包括邏輯回歸(logicregression)。一種邏輯回歸方法見Ruczinski(2003)JournalofComputationalandGraphicalStatistics12:475-512。邏輯回歸與CART的相似之處在於其分類符(classifier)可以展示為二叉樹。其不同之處在於各節點(node)具有關於特徵的布爾語句(Booleanstatement),該語句比CART產生的簡單"和"語句更全面。另一種方法是最近收縮形心(nearestshrunkencentroid)的方法(Tibshirani(2002)PNAS99:6567-72)。該技術是k-均值樣(k-means-like)的,但優點在於通過收縮聚類中心,可以自動選擇特徵(如拉索方法一樣)從而能將注意力集中於能提供信息的少量特徵。該方法可作為PAM軟體購得,使用廣泛。其它兩組算法是隨機森林算法(Breiman(2001)MachineLearning45:5-32)和MART算法(Hastie(2001)TheElementsofStatisticalLearning,斯普林格公司)。這兩種方法早己是"委員會方法(committeemethod)"。因此,它們包括對結果進行"表決"的預測符。為提供顯著性定級,可以測定錯誤發現率(falsediscoveryrate)(FDR)。首先,產生不相似度數值的一組零分布(nulldistribution)。在一個實施方式中,對觀察到的分布的數值進行排序,獲得了幾乎零概率(outofchance)的相關係數分布序列,從而能產生相應的相關係數的零分布(參見,納入本文作為參考的Tusher等,(2001)PNAS98,5116-21)。通過以下步驟獲得零分布組對每一種測得分布的數值進行排序;計算所有分布的成對相關係數(pair-wisecorrelationcoefficients);計算該排序的相關係數的概率密度函數;重複該過程N次,其中N是較大的數值,通常是300。利用該N種分布可以計算出相關係數值相關值(平均值、中值等),這些相關係數的數值大於由給定顯著性水平實測相似度數值分布所得的(相似度)數值。FDR是預計假顯著相關的數量(根據隨機數據集中大於該選定皮爾遜相關係數的相關數來估算)與經驗數據(顯著相關)中大於該選定皮爾遜相關係數的相關的數之比。該限界相關值可應用於不同實驗分布數據之間的相關性。利用上述分布,可選擇顯著性的置信水平。可用該置信水平確定高於隨機結果的相關係數最低值。採用該方法可獲得正相關、負相關或這二者的閾值。利用所得閾值,用戶可過濾成對的相關係數的觀測值,排除未超過閾值的那些。此外,還可估算某給定閾值的假陽性率。對於各種"隨機相關"分布,可以確定有多少觀測值落在閾值範圍外。該方法提供了一個數值序列。該序列的平均值和標準偏差顯示潛在假陽性的平均數及其標準偏差。在另一分析方法中,分別將橫斷分析(cross-sectionalanalysis)中選擇的變量用作預測符。鑑於具體的ASCVD結果,患者觀察期的隨機長度,蛋白質組學特徵和其它特徵的選擇,分析存活率的參數方法可能優於廣泛應用的半-參數Cox模型。存活率的威布爾參數擬合可以使風險率(hazardrate)單調升高、降低或維持恆定,還具有發現比風險比表示(hazardsrepresentation)(與Cox模型一樣)和加速失效時間表示(failure-timerepresentation)。採用該模型可實現在建立回歸係數的近最大似然度估算函數(estimator)時用到的所有統計學標準工具的功能。此外,還可利用Cox模型,主要是由於拉索方法將共變量(covariate)數量降低至了可操控的規模,這將顯著簡化分析,使得對存活率的完全非參數評估方法成為可能。這些統計學工具適用於所有格式的蛋白質組學數據。本發明提供了一組易於測定並具有高信息含量的生物標記、臨床和遺傳學數據,所述信息是檢測臨床上顯著的動脈粥樣硬化性冠狀動脈血管疾病個體。而且,本發明的算法還提供了關於未來心血管疾病風險的信息。在預測模型的建立中,可能需要選擇一標記亞組,即至少3種、至少4種、至少5種、至少6種直至整組標記。通常,根據定量樣品分析所需來選擇標記亞組,例如考慮試劑的可得性,定量測定的方便性等,但同時仍應確保不失為高度準確的預測模型。選擇大量高信息含量標記來構建分類模型需要確定性能指標(performancemetdc)和用戶-定義閾值,用這些指標和閾值來建立能根據該指標提供有用預測信息的模型。例如,性能指標可以是預測的靈敏度和/或特異性、AUC以及預測模型的總準確率。如實施例5、11和12所述,訓練模型中可採用多種方法。選擇標記亞組可以是為了進行標記亞組的前向選擇或反向選擇。可不使用全部標記而選擇標記的數量來優化模型性。確定最佳標記數的一種方法是選擇能產生具有所需預測能力(例如,AUC>0.75,或相當的靈敏度/特異性指標)的模型的標記數,所需預測能力與各種39組合和各種數量經給定算法所得該指標的最髙值相差小於一個標準偏差。試劑和試劑盒本發明還提供了用於實施一種或多種上述方法的試劑及包含所述實際的試劑盒。所述試劑及其試劑盒可以多種多樣。有用的試劑包括專門為用於產生動脈粥樣硬化病症相關循環蛋白標記的上述表達分布所用的試劑。這種試劑的一種類型是能結合感興趣標記組的抗體陣列或試劑盒。本領域已知多種不同的陣列形式,這些陣列具有多種不同的探針結構、基板組成和連接技術。代表性陣列或試劑盒包含用於定量測定選自以下的至少2種、至少3種、至少4種、至少5種或更多種標記的試劑或由這些試劑構成M-CSF、嗜酸細胞活化趨化因子、IP-IO、MCP-1、MCP-2、MCP-3、MCP-4、IL-3、IL-5、IL-7、IL-8、MIPla、TNFa禾卩RANTES。在其它實施方式中,代表性陣列或試劑盒包含用於定量測定選自以下的至少3種蛋白質標記的試劑或由這些試劑構成MCP-1、MCP-2、MCP-3、MCP-4、嗜酸細胞活化趨化因子、IP-IO、M-CSF、IL-3、TNFa、Ang-2、IL-5、IL-7和IGF-1。所述至少3種蛋白質標記可包含選自以下的標記組或由其構成MCP-1、IGF-1、TNFa;MCP-1、IGF-1、M-CSF;ANG-2、IGF隱1、M-CSF;和MCP-4、IGF-1、M-CSF。在其它實施方式中,代表性陣列或試劑盒包含用於定量測定選自以下的至少4種蛋白質標記的試劑或由這些試劑構成MCP-1、MCP-2、MCP-3、MCP-4、嗜酸細胞活化趨化因子、IP-IO、M-CSF、IL-3、TNFa、Ang-2、IL-5、IL國7和IGF-1。所述至少4種蛋白質標記可包含以下標記(組)或由其構成MCP-1、MCP-2、MCP-3、MCP-4、嗜酸細胞活化趨化因子、IP-IO、M-CSF、IL-3、TNFa、Ang-2、IL誦5、IL-7和IGF-1;MCP-1、IGF-1、TNFa、IL-5;MCP-1、IGF國1、M-CSF、MCP-2;ANG陽2、IGF-1、M國CSF、IL-5;MCP-1、IGF-1、TNFa、MCP曙2;禾口MCP-4、IGF-1、M-CSF、IL隱5。在其它實施方式中,代表性陣列或試劑盒包含用於定量測定選自以下的至少5種蛋白質標記的試劑或由這些試劑構成MCP-1、MCP-2、MCP-3、MCP-4、嗜酸細胞活化趨化因子、IP-IO、M-CSF、IL-3、TNFa、Ang-2、IL-5、IL-7和IGF-1。所述至少5種標記可包含選自以下的標記組或由其構成MCP-1、MCP-2、MCP-3、MCP-4、嗜酸細胞活化趨化因子、IP-IO、M-CSF、IL-3、TNFa、Ang-2、IL陽5、IL-7和IGF隱1;MCP-1、IGF-1、TNFa、IL陽5、M-CSF;MCP-1、IGF-1、M-CSF、MCP-2、IP-10;ANG陽2、IGF-1、M-CSF、IL-5、TNFa;MCP-1、IGF-1、TNFa、MCP-2、IP陽10;MCP-4、IGF-1、M陽CSF、IL-5、TNFa;和MCP-4、IGF-1、M-CSF、IL-5、MCP-2。這些試劑盒還可裝有用於統計學分析一種或多種表型的軟體包,還可裝有用於計算分類概率的參比資料庫。試劑盒可裝有用於各種方法的組份,例如抽取和處理血液樣品的裝置,二期抗體(secondstageantibody)、ELISA試劑、試管、離心柱(spincolumn)等。除了以上組分,所述試劑盒還可裝有實施所述方法的使用說明書。所述試劑盒中的這些使用說明書可採取多種形式,一個試劑盒中可裝有一份或多份使用說明書。這些使用說明書可採取的一種形式是試劑盒包裝上或包裝內附件上的印刷在合適介質或底材上的信息,如印刷了信息的一張或多張紙。另一種方式是記錄了信息的計算機可讀介質,例如軟盤、CD等。還有另一種方式是網址,可經網際網路遠程獲得信息。試劑盒中裝有任何適宜的工具。實施例以下是實施本發明的具體實施方式的實施例。提供這些實施例只是說明性目的,不是打算以任何方式性質本發明的範圍。已努力確保所用數值(例如,用量、溫度等)的準確率,但當然應考慮到有一些實驗誤差及偏差。實施例l:動物模型中動脈粥樣硬化的血清標記由小鼠蛋白質陣列獲得的血清生物標記數據由於已知多條生物學途徑參與人和小鼠血管組織內的轉錄,設計了一項概念驗證研究(proofofconceptstudy)來檢驗多分析物方法是否能提高動脈粥樣硬化進程中各種階段之間的區分32。該項研究證明定量測定多種疾病相關的生物標記能提供靈敏度和特異性更高的方法來評定小鼠的動脈粥樣硬化性疾病,並看望用於人類。該項研究中鑑定的優選血清蛋白質分類符代表了不同的動脈粥樣硬化相關生物學過程,包括巨噬細胞趨化反應(chemoattraction)(Cc19、Ccl2)、T-細胞趨化因子活性(Ccl21和Ccl19)、先天免疫力(IL-5)、血管鈣化(Tnfsfll)、血管生成41(Vegfa)和高脂誘導的炎症(Cxcll、瘦蛋白)。從這些標記的同步檢測值獲得的籤名提高了正確確定小鼠動脈粥樣硬化性疾病進程階段所需的特異性。如以下實施例3和4所述,在前瞻性人隊列研究中(cohortstudy)進一步驗證了該方法的可靠性。為鑑定能與疾病進程和血管壁中基因表達都關聯的血清蛋白表達模式,我們利用了縱斷面實驗設計(longitudinalexperimentaldesign)和小鼠遺傳學模型加飲食的組合,這些組合產生了不同程度的動脈粥樣硬化。此處,我們利用蛋白質陣列來鑑定小鼠血清中表達水平不同的一組炎性生物標記,所述水平與疾病程度相關。還通過定量實時逆轉錄酶聚合酶鏈式反應(RTPCR)評估這些標記中一亞組的血管壁基因表達。採用分類算法鑑定一組最靈敏的鑑別符(discriminator),我們能證明血管衍生炎性生物標記的獨特籤名能準確預測小鼠動脈粥樣硬化性疾病的不同嚴重程度。方法實驗沒#、欲桌逾獰#/7激吝iA^.所有實驗得到了斯坦福動物研究委員會(StanfordCommitteeonAnimalResearch)的批准。以前己描述了總體實驗設計(45)。3周齡的雌性叩oE敲除(C57BL/6L4poe加7[/"c)、C57B1/6J和C3H/HeJ小鼠購自傑克遜實驗室公司(JacksonLaboratory)(巴港,緬因州)。4周齡時,這些小鼠有些繼續餵食常規食物,有些餵食包含21%無水乳脂和0.15%膽固醇(Dyets號101511;戴茨公司(Dyets),伯利恆,賓夕法尼亞州)的高脂飲食,最長40周。如前所述,在每個時間點通過眶後法收集5-9隻同隊列高脂飲食apoE-缺陷型小鼠的血清。為建立飲食和遺傳差異的對照,也在基線和40周時收集餵食常規食物的叩oE敲除小鼠(C57BL/6J-^oe加/f/"c)以及分別餵食常規食物和高脂飲食的野生型C57Bl/6J和C3H/HeJ小鼠的血清。如前所述(45),在各條件(品系-飲食組合)的各時間點收集15隻小鼠(3組,每組5隻)的主動脈來分離RNA,與血清收集時間表平行。如前所述採用改進的兩步純化方法(45,47)分離總RNA。過去曾定量測定(測定整個主動脈中損傷區域的百分比)過該隊列小鼠的主動脈動脈粥樣硬化斑塊,並己記載在現有文獻中(45)。為了分類,還採用了高脂飲食2周、apoE-缺陷型、16-周齡的另一獨立小鼠隊列(4組,每組3-4隻)的血清和主動脈。按照現有技術(45-47,49)合併RNA和血清樣品來進行微陣列雜交。所有樣品加工和蛋白質雜交均同時進行以消除任何潛在的技術變差。歪/^^主激芯^V雜3^浙J^^^^^按照生產商的使用說明書,使用扎奧米克斯1200試驗工作站(Zyomyx1200Assaystation)(扎奧米克斯公司(Zyomyx))將血清樣品與扎奧米克斯鼠科細胞因子生物晶片(ZyomyxMurineCytokineBioChips)(扎奧米克斯公司,海達德,加利福尼亞州)雜交。為準確測定測試血清中的蛋白質水平,製作各分析物的9-點校驗曲線(各校驗曲線請參見附錄S4;可通過屍/z"/o/og/cfl/GeMom/a(生理學基因組學)網址獲得)。l使用扎奧米克斯100螢光掃描儀(Zyomyx100fluorescencescanner)掃描蛋白質生物晶片,使用GenPixPro和ZyomyxZDR4001版軟體進行微陣列的網格定位。測定晶片內變率(所有陰性對照特徵的標準偏差與那些特徵平均強度的比值)和晶片間變率(平均標準偏差與平均中值強度的比值M乍為為質量控制指標。根據分析物,蛋白質陣列提供的對照差率範圍是3%至約15%,靈敏度為l-l,000pg/ml(參見,各分析物的校驗曲線附錄,可從http:〃physiolgenomics.physiology.org/cgi/content/full/00240.2005/DC1獲得)(11)。不在校驗曲線的線性部分的數值標記為缺失數值。然後將數值形式的原始數據輸入專用於微陣列數據分析的奧雷克爾關係型資料庫(Oraclerelationaldatabase)(CoBi)(基因數據公司(GeneData))。利用熱圖構建軟體(HeatM叩Buildersoftware)(7)製作熱圖。詳細的補充方法可從http:〃physiolgenomics.physiology.org/cgi/謹tent/ful畫240.2005/DCl獲得。歪^^:遂雍#"茲^7^_^^^>已有關於蛋白質選擇和分類算法的記載(45)。簡言之,在有監督的分析(supervisedanalyses)中,,我們使用5.0版的表達者(Expressionist)軟體(基因數據公司),該軟體採用多種分類算法,根據各基因區分高脂飲食apoE-小鼠的0、10、24和40周時間點的能力對基因進行排名。這些算法包括方差分析(ANOVA)、支持向量機(SVM)(4)和遞歸特徵排除(RFE)(16),該算法是SVM權重的遞歸算法,其中,反覆進行基因排名並且每次除去固定比例的最低分者(35)。我們還使用已知的微陣列預測分析(PAM)作為附加分類算法(48)。然後,用各方法確定能以最低誤差率將各實驗正確歸類的最佳數量的排名基因用它們。通過交叉驗證計算最佳誤差率或分類誤差,其中,25%的實驗用作測試組,其餘的用作訓練組。這一過程對ANOVA、SVM和RFE算法重複1,000次。對於SVM和RFE,我們的分析採用線性核模型(linearkernel);非線性高斯核模型(Gaussiankernel)得到類似的結果。然後,將這一最小分類符基因亞組用於另一獨立數據集的交叉驗證和分類。詳細的方法見http:〃physiolgenomics.physiology.org/cgi/content/fu11/00240.2005/DC1。資/A激立遊J^^^桌遊^"義驗^^7分橋.為測定用先前鑑定的蛋白質小亞組進行分類的準確率,我們利用SVM算法(線性核模型)和交叉驗證產生混淆矩陣,重複地將實驗分為75%的訓練組、25%的測試組。結果以表格形式表示。如前所述,我們還利用SVM算法對獨立的實驗組進行了分類(45,50)。在此項分析中,我們將apoE-缺陷型小鼠的4個時間點的數據作為訓練組,獨立的實驗組作為測試組。以熱圖方式圖示各實驗根據一對多比較的SVM輸出值(參見圖3),該值是上述4種SVM分類符各自的標準化邊際值(normalizedmarginvalue)。SVM輸出值使得我們能看出新實驗是如何根據四種SVM超平面分類的。詳細方法可從http:〃physiolgenomics.physiology.org/cgi/content/full/00240.2005/DC1獲f尋。^^^^^r-屍0.用於Taqman分析的10個基因的引物和探針購自請求式應用生物系統試驗公司(AppliedBiosystemsAssays-on-Demand)(表2)。表2tableseeoriginaldocumentpage44Mu—IL-6Mm004461卯一mlMu_T^ANCEHs.3337918600Mm00441908_mlM;—MCP-5定製設計按照現有技術(45-47),使用從三組主動脈(每組5根)獲得的代表性RNA樣品一式三份進行反應。結果欽溶星W、^動嚴蕭存硬眾過薦^蚤A廣表這遊好,樣式.我們己報導(45)了該隊列apoE-缺陷型小鼠中動脈粥樣硬化的損傷程度。鑑於apoE缺陷型小鼠主動脈以及主動脈瓣膜中廣泛存在的動脈粥樣硬化損傷,這些研究中未檢查其它血管床。為鑑定與動脈粥樣硬化損傷程度相關的血清標記,我們使用蛋白質微陣列在疾病發展時程中同時測定了高脂飲食apoE-缺陷型小鼠30個炎性標記的血清水平。我們將餵食常規食物的apoE-缺陷型小鼠以及野生型C57Bl/6JandC3H/HeJ小鼠的兩個時間點的數據作為對照。所檢測的30種標記中有8種未顯示明顯的血清表達水平。該隊列小鼠中,22個標記顯示獨特的時間相關表達模式,其中一些與前述主動脈中動脈粥樣硬化程度密切相關(圖1)(45)。這些標記包括各種趨化因子(Ccl2、Ccl9、Cclll、Cell9、Ccl21、Cxcll和Cxcl2)和幾種細胞因子f112、114、115、116、1110和U12)以及其它炎性蛋白(Csfl、Csf2、Csf3、Ifng、Tnfsfll)和Vegfa。與作為對照的野生型C57B1/6J和C3H/HeJ小鼠相比,這些標記中的絕大多數在apoE-缺陷型小鼠中表達較高(圖2)。如前所述,在相似的條件下,對照小鼠不發生組織學意義上明顯的動脈粥樣硬化損傷(47);因此,很容易將疾病相關變化與諸如高脂飲食和衰老等其它因素相區開來。/i^f汰會^7:^老分志遊^^"特,絲歪/^^;^^.為說明高脂飲食、衰老和遺傳背景所致的非動脈粥樣硬化依賴性血清蛋白質水平變化,我們使用了許多對照,其中包括熟知的具有不同患動脈粥樣硬化傾向的兩種小鼠品系,使用了兩種不同的飲食和縱斷面實驗設計。己知這些對照小鼠不發生動脈粥樣硬化損傷,因此,它們是用來說明這些獨立變量以及這些變量之間可能的相互作用的合適對照。結果,我們鑑定到了apoE-缺陷型小鼠中可能與各變量有關的差異表達的蛋白質並區分出了與血管疾病過程專性相關的那些蛋白質。簡單ANOVA顯示,不同飲食-品系-時間組合之間,至少12種標記表達有差別(圖2)。為說明這三種獨立變量之間可能的相互作用,我們採用三向ANOVA。三種獨立的變量有三種一級相互作用(時間-品系、時間-飲食、品系-飲食)和一種二級相互作用(時間-品系-飲食)。在說明所有這三種因素之間相互作用的過程中,我們鑑定了5種差異表達的蛋白質(3-向ANOVA,屍<0.05),包括Ccl9、Ccl21、Cclll、Csfl和1112b。在較晚的時間點,許多炎性標記的血清水平升高,表示高脂飲食還在C57B1/6野生型小鼠中激發了炎性應答(圖2)。在另一方面,C3H/HeJ小鼠的炎性標記水平最低,即使餵食高脂飲食亦是如此。該發現與我們過去的研究結果一致,在過去的研究中我們比較了C3H/HeJ小鼠與C57B1/6J小鼠的主動脈血管壁基因表達。當時研究的結論是,C57B1/6J小鼠在動脈粥樣硬化過程中表達炎性標記的遺傳傾向性較高。鑑定^嚴虛獰W遊好/^錄^絲歪A廣表這籤名.人類癌症的分類方法就腫瘤的臨床特徵提供了大量信息,包括轉移的傾向性、藥物反應和長期預後(13、23、33、43)。對動脈粥樣硬化來說,分類算法的臨床用途在於預測未來事件。在以前的研究中,我們應用分類算法確定了一組基因,這些基因在血管壁中的表達能準確區分小鼠和人動脈粥樣硬化血管組織中疾病的嚴重程度(45)。在本次研究中,我們採用相似的方法來鑑定血清蛋白最小亞組,用該組蛋白按照準確己知的小鼠動脈粥樣硬化四階段將各蛋白質組學實驗準確分類(圖3)。在此,我們採用幾種熟知的分類算法來鑑定最能區分不同疾病狀態小鼠的變量。這些算法包括RFE、SVM和ANOVA。我們還用PAM作為附加分類算法。這些算法根據蛋白質在高脂飲食apoE-小鼠中區分O、10、24和40周時間點的能力對這些蛋白質進行排名。我們的結果顯示,大多數算法鑑定了一個蛋白質小亞組(Cc121、Ccl9、Csf3、Tnfsfll、Vegfa、Cclll、Ccl2)(圖3A)。該組標記籤名的預測能力優於任何單一標記,因為單一標記都不能準確區分不同的疾病狀態(分析未顯示)。為確定這些蛋白質的血清水平按照不同疾病狀態對小鼠進行分類的效用,我們採用SVM算法(線性核模型)通過交叉驗證(反覆的將按75%訓練組和25%測試組分組)產生了一個混淆矩陣。該算法顯示,這些血清蛋白質表達的籤名能以高達100%的準確準確率區分患病和未患病的小鼠組(圖3B),並且還能高準確準確率(79.6-100%)地將疾病中期的小鼠與其它階段的區分開來(圖35)。教J^^"^^遊^"義驗^^/7i^^.—組分類符蛋白質具有效用的重要證明是它們能對來自獨立實驗的數據進行準確分類。為驗證分類符蛋白質的效用,我們研究了它們將準確獨立的一組16周齡apoE-缺陷型小鼠準確分類的能力。採用SVM算法,我們能將準確平行進行的各實驗準確地歸入正確的疾病進展階段(圖3C)。據該獨立組小鼠的蛋白質表達與原實驗組(IO周齡)的蛋白質表達模式之間的最高相關性所示,這些分類符蛋白質將使得驗證數據集與訓練組中最接近的時間點準確匹配。必需指出的是,在該分析中,訓練組("已知")中不包括獨立數據集("測試")。生欽標記i清歪^^水乎與逾,壁基齒表達7大乎賴關.據估計,循環蛋白水平與血管壁中的分子事件和表達水平相關的那些生物標記可提供最多的血管疾病相關信息。為査明這些相關性並從生物標記數據獲得與動脈粥樣硬化的病理生理學有關的信息,我們研究了高信息含量生物標記編碼基因的血管壁基因表達模式。採用定量實時RT-PCR,我們能確立數種標記的血清蛋白水平與它們的血管RNA表達之間的關聯。在被研究的標記中,Ccl21(r=0.91)、Ccl2(r=0.97)、Ccl19(r=0.80)和Cclll(r=0.67)顯示基因表達的時間相關行增加與血清水平之間高度相關(圖4)。這些數據雖然還包括這些標記在其它組織中的表達,但它們提示表達與血管壁動脈粥樣硬化特別相關。通過比較血清蛋白質水平、血管基因表達和高脂飲食時間(loglO(餵食周數))的標準化平均比值來測定皮爾遜相關值。如果動脈粥樣硬化血管壁中的mRNA表達與所編碼蛋白質的血清水平之間的相關係數(r)是至少0.6、至少0.7、至少0.8、至少0.9或更高,則將這種相關性視作顯著。討論明顯需要改進的工具來診斷和治療臨床前動脈粥樣硬化。雖然目前對動脈粥樣硬化的機制和情況的了解越來越多,但我們鑑定髙風險患者和預測冠狀動脈疾病預防手段效力的方法依然不夠。由於缺乏動脈粥樣硬化性疾病的高靈敏性、高特異性生物標記,半數以上此類患者的首次臨床表現便是心肌梗塞或死亡(19,20)。曾就動脈粥樣硬化研究了小鼠和人的幾種炎性標記,結果支持動脈粥樣硬化的炎性假說(38)。然而,各項研究僅關注少數幾個單用標記上,一些研究沒有進行縱斷面實驗,只有少數研究證明在血管水平上與基因表達直接相關(25,29,34)。雖然目前已提出用通用炎症標記劃分患者動脈粥樣硬化疾病風險級別,但不曾用這些標記在無症狀患者中就確定準確疾病類別進行篩選,更重要的是未曾用於預測首次心血管病變。例如C-反應性蛋白(CRP)和血纖蛋白原等標記缺乏特異性的原因可能在於它們不是血管衍生蛋白,可作為各種器官中炎症的信號。還可能,由於高危人群之間的異質性,單獨一種標記提供的信息不足以準確預測疾病。出於相似的原因,這些通用炎症標記,例如CRP和沉降速率(ESR)早已不被用作其狼瘡(SLE)和類風溼性關節炎(RA)等它炎性疾病的特異性診斷標記。我們曾經採用本發明所用的實驗設計對小鼠主動脈組織RNA分布進行研究,證明可以鑑定到少量能夠按照疾病嚴重程度進行分類的基因(45)。顯然,由於不易對血管組織直接進行處理,鑑定血清中的蛋白質標記對於開發診斷人冠狀動脈疾病的診斷工具來說具有實際意義。在本文報導的工作中,我們研究了炎性血清生物標記豐度模式以及這些生物標記的亞組是否可用於就疾病進展對動物進行分類。在科學上,這兩類信息是互補的,明顯加強了對疾病詳細分子機制的理解,所述機制包括從基因轉錄到翻譯到胞內途逕到向血清中分泌遞質。如上所述,鑑定某給定疾病狀態的血清標記分布能開發可人用的非侵入性診斷方法。因為我們還具有基於微陣列的患病組織轉錄情況詳細全景(transcriptionallandscape),我們能用該圖估測導致炎性介質表達的途徑中的上遊組分,這是開發高度靶向性治療手段的第一步。實際上,然後可用血清試驗(例如本文所述)來檢驗這種治療手段的最終效果。我們用蛋白質微陣列同時(檢測)多種動脈粥樣硬化小鼠模型的血清蛋白質表達分布,所述模型具有不同的動脈粥樣硬化易感性和嚴重程度。用與分類癌症進程和類型所用相似的分類算法,我們能證實這些血管衍生生物標記的獨特籤名能準確預測不同程度的小鼠動脈粥樣硬化。在以前的研究中(45),我們的分析顯示16周時間點獲得的獨立數據集的微陣列基因表達分布與24周時間點的更相關,而在此次研究中,相近時間點的蛋白質分布與IO周時間點的更相關。基於該發現可能產生許有趣的假設。由於目前蛋白質微陣列中的探針數量有限,本發明研究中的蛋白質分類符不同於以前研究中鑑定的基因分類符。血清蛋白質表達的時間相關行增加還可能滯後於血管壁基因表達水平的變化。由於相同標記的血管基因表達和血清蛋白質水平之間可能因各種因素(例如轉錄後修飾和蛋白質穩定性)而不直接相關,這些數據的重要驗證是證明這些標記中亞組的疾病相關血管基因表達。我們證實這些標記的時間相關性血清水平與它們在血管壁中的基因表達相關。疾病進展與血管基因表達的時間依賴性關聯提示標記產生的主要部位是血管壁。然而,如以前的報導所述(22),血管可能不是炎性標記的唯一來源,其它組織,例如肌肉、脾臟、脂肪組織或肝臟可能也影響著這些標記的血清水平。在我們的研究中評估的一種標記是116,已知其產生於肌肉和肝臟以及血管壁。製得關注的是,116的血清豐度與疾病的時序性發展不相關,與血管壁中的基因表達只有微弱相關性。這些發現提示其它組織可能也影響著一些標記(例如116)的血清水平,但這些標記的水平與所研究的疾病狀態不相關,也無助於分類(對象)。一些全身性炎性標記的血清水平還可能應研究所用不同小鼠之間代謝參數差異而變得複雜。業已證明,高脂飲食激發在肝內炎性應答(22)。這些基因在整個高脂餵食期間維持高水平表達。為了設立關於這些全身性效應的對照,我們在動脈粥樣硬化早期和晚期都對高脂飲食的小鼠進行了比較,結果,血清脂質水平不變(14)而動脈粥樣硬化程度改變。因此,這些代謝參數與隨時間線性增加的標記血清水平之間相關性不佳。因此,血管衍生標記的時序性變化與動脈粥樣硬化的程度更相關,與脂質水平則不甚相關。本項研究所鑑定的這些標記有力地支持了動脈粥樣硬化的炎症性質,所鑑定的各標記能提供了了解疾病在小鼠中潛在機制的部分信息。這些標記包括巨噬細胞和T細胞重要特異性趨化因子。Ccl21(原來稱為Exodus-2/SLC/6Ckine/TCA4)是至今鑑定的最強T細胞趨化劑,其在T細胞附著和從血管向炎症組織部位轉移中發揮著重要作用(30)。在我們的實驗中,相關趨化因子Cxcll2和Ccll9也高水平表達,它們通過激活淋巴細胞功能相關的抗原-l(LFA-l)來介導T細胞與內皮強烈結合(6,15)。重要的是,據信,在正常免疫應答期間Ccl21不參與T細胞的效應細胞功能,但在T細胞介導的自身免疫疾病中,它被發現在內皮細胞中高水平地誘導性表達(8)。因此,疾病相關性高水平循環Ccl21這一新發現和以及高度相關的CCL21在患病血管壁中的表達提出了一個問題,即在小鼠中,自身免疫過程是否參與了動脈粥樣硬化的發展(44)。人疾病期間的Cc121水平尚有待測定。Ccll9[巨噬細胞炎性蛋白(MIP)-3b]與Ccl21的功能有些相似。其與相同的受體即Ccr7結合,是T細胞和B細胞的強效趨化劑。但與Ccl21不同,Ccl19似乎還採與正常的T細胞功能。其在動脈粥樣硬化性血管中的表達以及血清水平與主動脈基因表達之間的高度相關性均是新發現。Ccl2(Mcpl或JE)(3)和Cclll(嗜酸細胞活化趨化因子)(10,17)在動脈粥樣硬化中的作用已很清楚,這些證實了我們的發現。我們也記載了Cxcl2(MIP-2)和Cxcll(KC)的血清水平在動脈粥樣硬化小鼠的血清中均升高,與其它研究者所述的血清水平一致(29)。如其它研究者的研究所述(29),我們發現Cxll2(MIP-2)的可靠性較低。此外,鑑於血清水平與主動脈基因表達的相關性較低,大量的Cxcl2可能是有非血管性組織產生的,這證實了以前的結論(29)。然而,我們發現與Cxcl2血管基因表達的相關性仍優於例如116和Csf3等其它標記。儘管Cxcll(KC)的水平升高,我們發現該標記不是疾病的穩定預測符,這與近年來的研究一致(34)。近年來有報導將^g力描述成急性冠狀動脈症候群的獨立預測符(18,24)。我們的研究在至少三種所用算法中支持Vegfa是合理的分類符,從而證實其可應用於監測人類疾病。我們的另一非常值得關注的發現是Tnfsfll(TRANCE)在動脈粥樣硬化中的作用。Tnfsfl1是腫瘤壞死因子(TNF)細胞因子家族的一員,並且是骨保護素的配體,是破骨細胞分化和活化中起到關鍵因子。該蛋白質也稱為樹突狀細胞存活因子(dentriticcellsurvivorfactor),參與調節T細胞依賴性免疫應答。近年來,骨保護素被認為是進行性人動脈粥樣硬化和人心血管疾病的潛在風險因子(21,37)。據推測在動脈粥樣硬化中起作用的其它細胞因子包括1112b(25)和115(9)。雖然我們證明了它們的血清水平能預測疾病狀態,但我們未能證實1112b在動脈粥樣硬化損傷時的血管特異性表達。總之,我們鑑定的優選血清蛋白分類符涵概了多種動脈粥樣硬化生物學過程,包括巨噬細胞趨化反應(Ccl9,Ccl2)、T細胞趨化因子活性(Ccl21和Ccl19)、先天免疫性(115)、血管鈣化(Tnfsfll)、血管生成(Vegfa)和高脂誘導的炎症(Cxcll,可能還有瘦蛋白)。同時檢測這些標記獲得的籤名代表著不同的動脈粥樣硬化相關性生物學過程,有望滿足診斷動脈粥樣硬化性疾病的特異性要求。如實施例3-12所述,通過合適的前瞻性人試驗對該方法的進一步驗證獲得了用於動脈粥樣硬化和冠狀動脈疾病的改良篩選診斷工具。參考文獻1.Ffl"SooA:i^ca/]^ar26^3.貝塞斯達,馬裡蘭州國家心臟、肺和血液研究院(NationalHeart,Lung,andBloodInstitute),2003.2.MoA/ctt_yMoC/zaW6oo/t,2002.貝塞斯達,馬裡蘭州國家心臟、肺和血液研究院,2002.3.AielloRJ,Bou腦aPA,LindseyS,WengW,NatoliE,RollinsBJ和MilosPM.Monocytechemoattractantprotein-1acceleratesatherosclerosisinapolipoproteinE-deficientmice.^4Wer/osc/erJ7wowZ)Fasc19:1518—1525,1999.4.BurgesCJC.Atutorialonsupportvectormachinesforpatternrecognition.DfltoM/m'wg《"ow/ec/geZ)^cov2:121—167,1998.5.BursillCA,ChannonKM禾卩GreavesDR.Theroleofchemokinesinatherosclerosis:recentevidencefromexperimentalmodelsandpopulationgenetics.Cw/rC^/"丄&Wo/15:145-149,2004.6.CampbellJJ,HedrickJ,ZlotnikA,SianiMA,ThompsonDA禾卩ButcherEC.Chemokinesandthearrestoflymphocytesrollingunderflowconditions.5Wewce279:381—384,1998.7.ChenMM,AshleyEA,DengDX,TsalenkoA,DengA,TabibiazarR,Ben-DorA,FensterB,YangE,KingJY,FowlerM,RobbinsR,JohnsonFL,BmhnL,McDonaghT,DargieH,YakhiniZ,TsaoPS禾卩QuertermousT.Novelroleforthepotentendogenousinotropeapelininhumancardiacdysfunction.C7rcw/Wo"108:1432—1439,2003.8.ChristophersonKW二世,HoodAF,TraversJB,RamseyH禾口HromasRA.EndothelialinductionoftheT-cellchemokineCCL21inT-cellautoimmunediseases.B/oot/101:801—806,2003.9.DaughertyA,RateriDL禾卩KingVL.IL-5linksadaptiveandnaturalimmunityinreducingatheroscleroticdisease.■/C7//"veW114:317—319,2004.10.EconomouE,TousoulisD,KatiniotiA,StefanadisC,TrikasA,PitsavosC,TentolourisC,ToutouzaMG禾口ToutouzasP.Chemokinesinpatientswithischaemicheartdiseaseandtheeffectofcoronaryangioplasty,/"f/CaWo/80:55—60,2001.11.FeezorRJ,BakerHV,XiaoW,LeeWA,HuberTS,Mindri廳M,KimRA,Ruiz-TaylorL,MoldawerLL,DavisRW禾口SeegerJM.Genomicandproteomicdeterminantsofoutcomeinpatientsundergoingthoracoabdominalaorticaneurysmrepair.J"7mmwwo/172:7103—7109,2004.12.GlassCK禾口WitztumJL.Atherosclerosis.Theroadahead.CW/104:503—516,2001.13.GolubTR,SlonimDK,TamayoP,HuardC,GaasenbeekM,MesirovJP,CollerH,LohML,DowningJR,CaligiuriMA,BloomfieldCD和LanderES.Molecularclassificationofcancer:classdiscoveryandclasspredictionbygeneexpressionmonitoring.>SWece286:531—537,1999.14.GrimsditchDC,PenfoldS,LatchamJ,Vidgeon-HartM,GrootPH和BensonGM.C3HapoE(」」micehavelessatherosclerosisthanC57BLapoE(丄)micedespitehavingamoreatherogenicserumlipidprofile.A/zemyc/ems7'>y151:389—397,2000.15.G飄MD,TangemannK,TamC,CysterJG,RosenSD和WilliamsLT.AchemokineexpressedinlymphoidhighendothelialvenulespromotestheadhesionandchemotaxisofnaiveTlymphocytes./VocAto/^4cad95:258—263,1998.16.GuyonI,WestonJ,BarnhillS禾卩VapnikV.Geneselectionforcancerclassificationusingsupportvectormachines.Mac/'e46:389,2002.17.HaleyKJ,LillyCM,YangJH,FengY,KennedySP,TuriTG,ThompsonJF,SukhovaGH,LibbyP禾口LeeRT.OverexpressionofeotaxinandtheCCR3receptorinhumanatherosclerosis:usinggenomictechnologytoidentifyapotentialnovelpathwayofvascularinflammation.C7rcw/加'ow102:2185—2189,2000.18.HeeschenC,DimmelerS,HammCW,FichtlschererS,SimoonsML禾卩ZeiherAM.Pregnancy-associatedplasmaprotein-Alevelsinpatientswithacutecoronarysyndromes:comparisonwithmarkersofsystemicinflammation,plateletactivation,andmyocardialnecrosis.Co//CaWo/45:229—237,2005.19.KannelWB和McGeeDL.Epidemiologyofsuddendeath:insightsfromtheFraminghamStudy.CarWomscC7/"15:93—105,1985.20.KannelWB禾口SchatzkinA.Suddendeath:lessonsfromsubsetsinpopulationstudies.J"爿mCo//Cani/o/5:141B-149B,1985.21.KiechlS,SchettG,WenningG,RedlichK,OberhollenzerM,MayrA,SanterP,SmolenJ,PoeweW禾口WilleitJ.Osteoprotegerinisariskfactorforprogressiveatherosclerosisandcardiovasculardisease.C7rcw/a"ow109:2175—2180:2004.22.KimS,SohnI,AhnJI,LeeKH禾卩LeeYS.Hepaticgeneexpressionprofilesinalong-termhigh-fatdiet-inducedobesitymousemodel.340:99-109,2004.23.LapointeJ,LiC,HigginsJP,vandeRijnM,BairE,MontgomeryK,FerrariM,EgevadL,RayfordW,BergerheimU,EkmanP,DeMarzoAM,TibshiraniR,BotsteinD,BrownPO,BrooksJD禾卩PollackJR.Geneexpressionprofilingidentifiesclinicallyrelevantsubtypesofprostatecancer./VocTVaWJcad101:811—816,2004.24.LeeSH,WolfPL,EscuderoR,DeutschR,JamiesonSW禾卩ThistlethwaitePA.Earlyexpressionofangiogenesisfactorsinacutemyocardialischemiaandinfarction.TV五wg/JAfed342:626—633,2000.25.LeeTS,YenHC,PanCC和ChauLY.Theroleofinterleukin12inthedevelopmentofatherosclerosisinApoE-deficientmice.JWe".osc/er7T^om6Fasc腸/19:734—742,1999.26.LibbyP.Inflammationinatherosclerosis.TVaZwre420:868—874,2002.27.LucasAD禾卩GreavesDR.Atherosclerosis:roleofchemokinesandmacrophages.五x戸^vMo/Mey10:209—215,2000.33.PaikS,ShakS,TangG,KimC,BakerJ,CroninM,BaehnerFL,WalkerMG,WatsonD,ParkT,HillerW,FisherER,WickerhamDL,BryantJ禾口WolmarkN.Amultigeneassaytopredictrecurrenceoftamoxifen-treated,node-negativebreastcancer.A^"g7/她d351:2817—2826,2004.34.ParkinSL,PritchettJP,GrimsditchDC,BruckdorferKR,SahotaPK,LloydA,OverendP禾口BensonGM.CirculatinglevelsofthechemokinesJEandKCinfemaleC3Hapolipoprotein-E-deficientandC57BLapolipoprotein-E-deficientmiceaspotentialmarkersofatherosclerosisdevelopment.Soc7>g//Mec/340:115—126,1999.42.SaadeddinSM,HabbabMA禾卩FernsGA.Markersofinflammationandcoronaryarterydisease.MedSc/MomY8:RA5—RA12,2002.43.SorlieT,PerouCM,TibshiraniR,AasT,GeislerS,JohnsenH,HastieT,EisenMB,vandeRijnM,JeffreySS,ThorsenT,QuistH,MateseJC,BrownPO,BotsteinD,EysteinLonningP禾口Borresen-DaleAL.Geneexpressionpatternsofbreastcarcinomasdistinguishtumorsubclasseswithclinicalimplications.淑"cWS"',98:10869—10874,2001.44.StemmeS,FaberB,HolmJ,WiklundO,WitztumJL禾口HanssonGK.Tlymphocytesfromhumanatheroscleroticplaquesrecognizeoxidizedlowdensitylipoprotein.A^/JcfldSc/92:3893—3897,1995.45.TabibiazarR,WagnerRA,AshleyEA,KingJY,FerraraR,SpinJM,SananDA,NarasimhanB,TibshiraniR,TsaoPS,EfronB禾口QuertermousT.Signaturepatternsofgeneexpressioninmouseatherosclerosisandtheircorrelationtohumancoronarydisease.屍/2戶'o/Gewom/cs22:213—226,2005.46.TabibiazarR,WagnerRA,LiaoA禾口QuertermousT.Transcriptionalprofilingoftheheartrevealschamber-specificgeneexpressionpatterns.Cz>c93:1193-1201,2003.47.TabibiazarR,WagnerRA,SpinJM,AshleyEA,NarasimhanB,RubinEMEfronB,TsaoPS,TibshiraniR禾口QuertermousT.Mousestrain-specificdifferencesinvascularwallgeneexpressionandtheirrelationshiptovasculardisease.JWen'osc/er7T^om6Fasc25:302—308,2005.48.TibshiraniR,HastieT,NarasimhanB禾口ChuG.Diagnosisofmultiplecancertypesbyshrunkencentroidsofgeneexpression._/VaZ/JcadSc/99:6567-6572,2002.49.WagnerRA,TabibiazarR,PowersJ,BernsteinD禾口QuertermousT.Genome-wideexpressionprofilingofacardiacpressureoverloadmodelidentifiesmajormetabolicandsignalingpathwayresponses./Mo/Ce//CaWo/37:1159—1170,2004.50.YeangCH,RamaswamyS,TamayoP,MukherjeeS,RifkinRM,AngeloM,ReichM,LanderE,MesirovJ禾卩GolubT.Molecularclassificationofmultipletumortypes.腸/"/or顧"cs17,增幹'J1:S316-S322,2001.實施例2:蛋白質微陣列分析為評估不同趨化因子(嗜酸細胞活化趨化因子、IP-IO、MCP-1、MCP-2、MCP-3、MCP-4、IL-8、MIPla和RANTES)的抗體陣列的性能,我們用市售施萊歇爾和舒爾蛋白質微斑點陣列(FastQuant人趨化因子,S&S拜爾森斯公司(S&SBioscenceslnc.),基涅,新罕布夏州,美國)。該陣列平臺採與點樣在包被了3-D硝基纖維素表面的標準顯微鏡載玻片上的多種高特異單克隆性抗體。作為人循環(血)樣品,我們選擇了有病史、運動試驗確定陽性(positiveexercisetest)或接受過冠狀動脈導管術的一組11個已知嚴重冠狀動脈病例,和沒有病史及運動試驗或冠狀動脈造影呈陰性的9個對照。收集循環(血)樣品,冷凍保存於-80°C,融化後立即用在陣列上。各樣品在一式兩份的兩個陣列上溫育。用一次點樣(printmn)製備的總共8塊載玻片(每塊載玻片上8個陣列)對11份患者樣品和9份對照進行測評。該項研究中對各樣品進行的重複實驗顯示陣列之間的重現性良好。對於各抗體,將同一陣列上4重複特徵扣除了背景信號的信號中值與重複實驗中的各個中值作圖比較。重複實驗的檢測值之間相關係數大多為0.99,表明兩組陣列數據之間的一致性優良。在以下分析中,各分析物循環檢測值表示一種循環(血)樣品的四次檢測值的平均值,其中扣除了空白載玻片的相應平均檢測值,用差值的log(10)數值進行分析。將對照9份樣品組的蛋白質水平與病例組11份樣品的蛋白質水平作比較。對於每種蛋白質,採用高斯誤差評分法(Gaussianerrorscore)比較病例和對照組的蛋白質水平分布,並製作成熱圖,所述評分法檢測按照各組樣品數值擬合的正態分布交疊。高斯分布圖顯示了兩組中MMP-2/TIMP-2複合物的蛋白質水平實際分布。一種蛋白質檢測值不能明確分開這些組中的少量個體,高斯圖中明顯可見重疊的信號分布。雖然本項工作的目的不是鑑定分類算法,但通過將少量優選蛋白組合併用費希爾線性辨別分析來區分病例樣品和對照樣品是可能的。我們用標準ELISA夾心試驗,用與該陣列所用相同的捕捉抗體和檢測抗體驗證了該陣列所得的結果。雖然該陣列所用的抗體對是購買的並己由供應商驗證適用於ELISA,還是先檢查然後將用於陣列以確保它們符合靈敏度要求。採用ELISA方法分析病例和對照人循環樣品,將ELISA數據與陣列數據相比較。分析物之一循環瘦蛋白的比較數據顯示,無論以10倍還是20-倍樣品稀釋液進行ELISA,相關性良好。實施例3:用於準確預測和診斷人冠狀動脈疾病的循環炎性標記籤名人血清生物標記的前期試驗數據由於實施例1和2獲得的結果令人鼓舞,我們研究了是否可用蛋白質微陣列鑑定血清炎性蛋白質的籤名用作人類動脈粥樣硬化性疾病的高靈敏度、高特異性標記。為此,我們設計一項病例-對照嵌套研究(nestedcase-controlstudy),通過以檢測動脈粥樣硬化風險因素和遺傳決定因素為目的的大型臨床流行病學研究選擇了51位臨床明顯CAD患者和44位健康對照。用蛋白質微陣列對報名時收集的血清樣品進行多種炎性標記的同時檢測。有一個亞組的所測分析物在病例受試者中的濃度明顯較高。採用這些標記的血清表達分布的分類算法能準確相對於對照將CAD對象準確分級。此外,這些生物標記的獨特籤名明顯提高了CAD其它已知標記的預測能力。在該前期研究中,我們證明循環炎性標記的特徵模式能準確鑑定動脈粥樣硬化患者。引言動脈粥樣硬化性心血管疾病(ASCVD)是發達國家中發病率和死亡率的主要原因1>2。然而,由於缺乏準確的早期診斷標記,超過半數的冠狀動脈疾病(CAD)患者的首次臨床表現便是心肌梗塞或死亡3'41'2。炎症在ASCVD的所有階段均涉及,認為其是動脈粥樣硬化的病理生理學基礎,從而提供了該疾病過程的潛在標記5'6'在大型流行病學研究中,血清炎性生物標記升高已顯示能區分心血管風險的級別並評估治療反應89。雖然可能可用於風險定級,目前的炎性標記缺乏足夠的疾病特異性,因而不能用作CAD診斷的篩選工具。例如C-反應性蛋白(CRP)和血纖蛋白原等目前的標記缺乏準確性的原因可能在於它們既不是主要衍生自血管壁又不是主要由參與血管炎性過程的細胞產生的,並且可能作為許多不同器官和組織中的炎症信號。此外,還可能,因為高危人群的疾病表型異質性,單獨一種標記提供的信息不足以準確評估冠狀動脈循環系統中的血管損壞。出於相似的原因,這些通用炎症標記,例如CRP和紅細胞沉降率(ESR)早己不被用作例如狼瘡(SLE)和類風溼性關節炎(RA)等其它炎性疾病的特異性診斷標記,儘管它們依舊是臨床實踐中對風險定級和測評治療反應的工具。因此,亟需能更準確反映ASCVD活性並能用作鑑定患者的高度靈敏、高特異性試驗的生物標記。我們推測,循環炎性蛋白質的獨特籤名可更好地鑑定CAD。為解決該問題,我們設計了一次嵌套病例-對照研究(nestedcase-controlstudy),通過從ADVANCE研究(動脈粥樣硬化性疾病,血管功能和遺傳流行病學(AtheroscleroticDisease,F/lscularFuNction,&GenetiC五pidemiology))選擇51位最近發生過心肌梗塞(MI)的患者和44位健康對照,所述ADVANCE研究是關於動脈粥樣硬化遺傳易感性的群體研究。用商品化購得的蛋白質微陣列對報名時收集的血清樣品進行9種炎性標記的同時檢測。數據分析包括了大量臨床變量,例如病史、用藥情況、個人和家族史(一級親屬)以及血漿葡萄糖、胰島素和C-反應性蛋白(CRP)58水平。統計學算法鑑定到蛋白質生物標記籤名,當所述籤名與其它臨床變量聯用時能準確鑑別CAD患者和對照。方法逮者絲鋪微薪所有研究方案均經由學院評審委員會評審和批准。從ADVANCE研究隊列的兩個不同組別中隨機選擇患者,所述ADVANCE研究是斯坦福心血管部門(StanfordCardiovasculardivision)和北加利福尼亞凱撒永久醫療保健項目(NorthernCaliforniaKaiserPermanenteMedicalCareProgmm)研究部合作進行的一項更大規模的遺傳流行病學研究,其目的是調查心血管疾病的遺傳決定因素。舊金山海灣地區(SanFranciscoBayArea)的總共3666人參與了ADVANCE,根據性別和年齡對這些人進行分類以代表北加利福尼亞州人口狀況。所有可能參加試驗對象書面表示知情並同意參與,研究方案得到史丹福大學和凱撒研究部門的人類對象委員會(HumanSubjectsCommittees)的批准。ADVANCE研究隊列由特徵明確的臨床組別構成743位年輕、明顯健康的對照(組1);1023位年長的對照(組2);503位年輕的CAD病例(組3);926位年長的新近診斷CAD病例,病歷記載在報名時已發生過首次心肌梗塞(MI),首次心肌梗塞時間距離報名時間的中值是3.4個月(組4);和471位年長的穩定心絞痛首次發作病例(組5)。我們通過性別隨機取樣法從組2和組4中選擇了95例高加索受試者、44位MI病例和51位對照。大型ADVANCE研究資料庫包括例如病史、用藥情況、個人和家族史(一級親屬)以及血漿葡萄糖、胰島素和C-反應性蛋白(CRP)水平和脂質分布。只在組2中測得了脂質分布。病例受試者包括45-75歲老年男性和55-75歲女性,都是因急性MI首次發現CAD。鑑定這些受試者的標準是出院主診斷碼(primaryhospitaldischargediagnosiscode)為410.x,並且,住院期間或入院前72小時內心臟酶類升高(肌鈣蛋白I水平24.0ng/mL,或者,CK-MB25.6ng/ml與CK-MB%23.3ng/mL至少其一)。導引病變(indexevent)(中值為3.4個月)後7-20周採集血清。ADVANCE研究委員會審閱了臨床文件,確認了診斷結論。對照是不同性別的60-69歲老人,據其主要醫師報告並檢索凱撒永久資料庫(KaiserPermanenteDatabase)的結果,他們沒有任何ASCVD表現或其它重症疾病的臨床史。在報名參見ADVANCE後的首次尋訪時擦劑臨床數據和空腹血清樣品。用標準方法檢測葡萄糖和胰島素的血漿濃度。通過高靈敏度ELISA試驗測定CRP。節廣微A辨效微微湮為測定9種不同趨化因子(嗜酸細胞活化趨化因子、IP-IO、MCP-1、MCP-2、MCP-3、MCP-4、IL-8、MIPla和RANTES)的濃度,我們使用市售施萊歇爾和舒爾蛋白質微斑點陣列(FastQuant人趨化因子,S&S拜爾森斯公司,基涅,新罕布夏州,美國)。該陣列平臺採用點樣在包被了3-D硝基纖維素表面的標準顯微鏡載玻片上的多種高特異單克隆性抗體。這些標記的靈敏度和特異性以及與常規ELISA的相關性是已知的。己確定這些標記之間沒有交叉反應性。按照生產商的使用說明書使血漿樣品與蛋白質微陣列雜交,然後加入生物素化的第二抗體和Cy5-鏈黴親和素偶聯物。用AxonGenepix4000B微陣列掃描儀和特徵提取軟體(ArrayVisionFast8.0,S&S拜爾森斯公司)將掃描圖像轉化成數字強度,由此測得雜交後螢光強度。根據內標參比值由螢光強度值算得絕對濃度。根據具體分析物,快速定量(FastQuant)蛋白質陣列的對照變率為3%至約15%,靈敏度為1-10pg/ml。快速定量蛋白質陣列的準確率與具有相似線性範圍的相應ELISA相當1Q'U。目前研究的具體的其他方法和質量控制見發行人的在線網址(其他材料可參見Ardigo,Tabibiazar等,"SignaturePatternsofCirculatingBiomarkersAccuratelyPredictPresenceofCoronaryArteryDisease"),包括陣歹U重現性和標準曲線。隨後用局部視窗工作站(localWindowsworkstation)分析原始數值數據並其遷移到專用於微陣列數據分析的奧雷克爾關係型資料庫(Omclerelationaldatabase)。出於技術原因,RANTES和IL-8不包括在後續分析中。RANTES標準曲線不是S形,因此不具有計算濃度的線性部分。在病例和對照樣品中,大多數IL-8值在標準曲線界限之外。統^"學分橋用曼-惠特尼的U檢驗(連續變量)和卡方檢驗(名義變量採)測定兩組之間的臨床特徵差異。用蒙特卡洛方法計算顯著性水平。在對U檢驗和5C檢驗所示組件分布不均衡的臨床變量進行調整之前和之後進行通用線性模型(GLM)多變量分析來鑑定病例和對照之間的趨化因子差異。用接受器工作特性(ROC)曲線檢驗趨化因子的診斷性能。採用12對數回歸(LR)分析來驗證趨化因子數值是否可區分病例和對照。在雙變量分析中兩組之間差別顯著的年齡、性別和臨床變量也納入這些模型作為獨立變量。由於兩組之間在用藥(常規CAD處方藥,例如ACE-抑制劑和他汀類藥物)方面的差異會在模型中引入假的疾病預測符,我們決定從分析中排成關於藥物治療的所有信息。構建了三種LR模型應對以下問題獨立變量的數量相對升髙,存在缺失值(8位對象中約10個值)和趨化因子濃度之間的共線性。對變量(採納概率(entryprobability)為0.05;排除概率(removalprobability)為0.15)進行兩次前向逐步選擇不進行缺失數據估算和採用條件均值進行缺失數據估算。專用於解決共線性問題的第三LR模型包括連同臨床變量的趨化因子評分。評分計算包括在一個l-10級別標度(根據十分位數)上對各趨化因子濃度進行重新編碼,然後求得各測得趨化因子的平均級數。關於檢驗、模型構建和缺失數據估算的詳盡描述可在線查閱以作補充。採用基於視窗系統的SPSS統計學軟體(12.0版)(SPSS公司(SPSSInc.),芝加哥,伊利諾斯州)進行U和5C2檢驗、GLM、ROC禾QLR。為總覽數據結構,我們進行了兩維層次聚類法分析(2D-HC)。利用開源軟體Tmev,3.0版(TM4套件,遺傳學研究院(TheInstituteforGenomicResearch),羅克維爾,馬裡蘭州)"構建2D-HC。分析中用完全連鎖和皮爾遜相關性作為距離指標。為測定我們的數據中最大方差的方向,我們採用依據log2的主成分分析(PCA)。節織體敘嫉微吝誠..曾有關於蛋白質選擇和分類算法的記載(Tabibiazar2005PhysiolGenomics.2005年7月14日;22(2):213-26),納入作為參考)。簡言之,在有監督的分析中,我們用多種分類算法根據基因區分病例和對照的效用對其進行排名。該項分析所用的算法包括支持向量機(SVM)"和遞歸特徵排除(RFE)",RFE是SVM的遞歸算法,其中,反覆進行變量排名並且每次除去固定比例的最低分者16。用SVM-RFE確定能以最低誤差率將各實驗正確歸類的最佳數量的排名基因。通過1000次遞歸交叉驗證計算最佳出錯率或分類誤差,其中25%的實驗用作測試組,其餘的用作訓練組。作為SVM結果的內部驗證,我們還採用了以下監督分類算法分類和回歸樹(CART)、線性辨別分析(LDA)和對數回歸(見本章前述)。CART是一種採用一系列"如果-則(if-then)"二叉邏輯條件的的靈活的層次分類系統,該系統允許對結果的個性化(individualization)程度和分類誤差的比例成本(proportionalcost)進行設定。為獲得高準確率的分類,我們設定終端節點(terminalnode)僅包含純粹亞組或不超過5個對象。先驗信息(prioriinformation)包括兩種類別大小相等且分類誤差成本(misclassificationcost)相等。通過多次隨機置換10%的對象來交叉驗證結果。結果靡離床錄C如圖5所示,病例組和對照組在體現已確知為CAD風險因素的諸多重要特徵上有差異。病例對象的胰島素耐受表型更明顯,血漿胰島素濃度更高,BMI略高(雖然不明顯),腰圍更大和血脂異常比例更高。然而,在兩組之間的血液葡萄糖水平和糖尿病比例相僅。患者的血壓,不論是收縮壓還是舒張壓都明顯低於對照,儘管有更常見的高血壓病史。該事實至少可部分揭示為多用抗高血壓藥物(96.7%比之43.2%)和次級預防性處方藥例如ACE-抑制劑、卩阻斷劑、他汀類藥物和阿司匹林等所致。而且,雖然CAD患者的一級親屬中冠狀動脈疾病比例高於對照,但兩組間的糖尿病、血脂異常、高血壓和中風的家族史沒有明顯不同。有意思的是,雖然兩組在血管和代謝表型上有明顯差異,但CRP濃度沒有可檢測的差異。瘋靜詹麵飾記雖然兩組之間的CRP沒有差異,但多變量GLM風險顯示病例組的其它循環炎性標記高於對照(圖6),即使在就臨床變量和藥物治療進行調整後亦是如此。比較病例與對照的無監督數據分析鑑於CAD患者中炎性標記的水平升高,我們研究了利用這些信息通過無監督分析將患者準確分類的可行性。兩維層次聚類法表明CAD患者和對照患者傾向於形成大型同質集群,雖然有個別病例和對照維持在這些大型集群之外群體外(圖7)。對於被測變量,臨床參數集中為一組,趨化因子則形成另一組。有意思的是,CRP水平與代謝參數的關聯度高於趨化因子水平。主成分分析發現,在對象中觀察到差異有60-70%可解釋為趨化因子、胰島素耐受性和部分其它臨床變量(例如高血壓和高脂血症)所致,其中,炎症標記是主要因素(圖8)。^^眾茵f獰^"浙遊床變量遂/f瘋激浙應街汰吝遊分類為確定能準確區分病例對象和對照對象的最佳、最小變量組,我們採用了SVM分類算法(Tabibiazar2005PhysiolGenomics.2005年7月14日;22(2):213-26)。SVM鑑定了能高度準確區分不同程度對象的一組15個變量(分類誤差率<10%)(圖9)。除了已知的CAD風險因素外,檢測循環趨化因子明顯加強了疾病預測。為驗證我們的發現,我們採用了多種其它分類算法,結果,對於預測CAD:LR(80%靈敏度,88%特異性)、LDA(73%,94%)和CART(80%,88%)表現出了相當的高水平靈敏度和特異性。麗蕭標記改夢7T裙嚴/緣體遂療遊分類用ROC曲線進一步評估了單一變量和多個變量區分病例對象和對照對象的分類能力。在趨化因子中,MCP-4看來是最靈敏的,MCP-1是特異性最強的,二者均顯示良好的準確率(AUC分別是0.896和0.849)(圖10A)。應該注意的是,CRP似乎無助於在流行病學範疇以外鑑定疾病,而血管炎症的特異性標記則更準確。圖11顯示了三種對數回歸分析的結果,其中,趨化因子或者通過分步選擇(模型1和2)引入,或著作為組合分值(模型3)引入。在CAD患者中,三種模型中有兩種的總準確率超過90%,這支持了這一推測使用多種標記區分ASCVD患者能提供更多信息。LR模型的分類性能與最佳趨化因子,MCP-1和-4(的曲線)的比較是對該假設的進一步證明(圖IOB)。顯然,採用多標記算法明顯能更好地預計是否存在疾病。討論需要診斷和治療臨床前ASCVD的更好的工具。目前,雖然對動脈粥樣硬化的機制和情況的了解越來越多,但我們仍缺少用於鑑定高風險患者並預測預防方案之效果的方法。越來越多證據暗示血管炎症是動脈粥樣硬化各階段中主要的病理生理學過程5,並且,已就炎性標記用於診斷的可能性進行了數項研究17。雖然目前的炎症通用標記被認為可能可用於評定風險級別,它們不足以在普通人群中鑑定CAD18。這些標記缺乏特異性的原因可能在於它們不是血管衍生標記,並且可能是指示各種器官中的炎症的信號。個體對環境風險因素的反應不一致性也可能導致了ASCVD標記濃度的高度不同。在這點上,一種炎性蛋白所攜帶的生物學信息可能不足以全面表徵血管炎性狀態,因而可能無法準確鑑定是疾病的存在及程度。相比之下,採用多種炎性標記特徵的多維方法可提供動脈粥樣硬化相關血管炎症的病徵籤名。本發明的研究用實驗支持了這一假設並提示用多種炎性標記可有效鑑定患冠狀動脈心臟病的患者。由於血管炎症是動脈粥樣硬化的病理生理學基礎,動脈粥樣硬化血管中產生的趨化因子是CAD標記的主要候選者。趨化因子是白細胞和內皮細胞被活化時產生的一群可構成網絡架構的趨化蛋白質19。它們的主要作用是使白細胞在組織中累積並活化,它們與幾種細胞受體的相互作用參與形成炎性滲透的特異性2Q'21。趨化因子常成組存在,各組的組成不同,這種趨化因子組的生物學效應與單個因子的生物學效應可能極其不同,因此,測定細胞因子和趨化因子表達的總體模式比單一蛋白質試驗更可能獲得有意義的生物學信息。我們的數據清楚地顯示臨床CAD個體中數種趨化因子血漿濃度的調變不同於健康對照,即使在就己知臨床變量進行調整後亦是如此。因此,結合這些標記的多變量模型能準確區分這兩組的樣品。據假設,採用多種分析物的預測模型遠比採用一種炎性蛋白質的模型準確。這些結果得到了多種不同算法多變量統計學分析的驗證,不同算法的的結果高度一致。各模型的一致性以及不同試驗所得結果的重現性提示趨化因子特徵提供了血管疾病的強烈信號。儘管隊列的規模較小並且患者正接受所有可能的治療,但這些結果仍然具有非常顯著的意義。在我們的數據中,儘管血管和代謝表型明顯不同,但在病例和對照之間未觀察到CRP水平有明顯不同。這可能是因為樣品規模較小,並且,使用降CRP藥物(例如他汀類藥物和阿司匹林)較多的緣故。然而,雖然經治療,但有心肌梗塞病史的個體患冠狀動脈疾病的風險依舊高於沒有CAD病史的人22。而且,CRP的主要臨床用途被認為是在經典風險因素不確定時更準確地區分個體,但對該提法依然有爭議23。雖然治療期間CRP水平降低可用作治療反應指數89,但在我們的橫斷面研究中,CRP提供的信息不比其它臨床變量多。我們的研究存在一些局限性。病例對象的血清樣品是在急症之後(7周-20周,中值為3.4個月)採集的。雖然炎性標記通常會在4-8周內回復至基線水平,我們不能排除急症導致炎性標記水平改變的可能性。我們的研究設計也未確認蛋白質組學特徵用於區分病例和對照的的預後價值,雖然在我們所鑑定的蛋白質組學特徵可能的確具有預測原發(primary)或繼發(secondary)事件的預後價值。我們的生物標記組明顯不是完全清單。實際上,利用更多分析物的陣列有望提高診斷ASCVD的靈敏度和特異性。然而,本發明的初步研究證明了利用蛋白質微陣列同時監測多種生物標記的可行性。總之,我們己鑑定了循環血清炎性標記組,它們的獨特籤名能準確區分CAD患者和對照。後文實施例5報導了驗證該方法的大規模研究。參考文獻1.NHLBImorbidityandmortalitychartbook,2002.貝塞斯達,馬裡蘭州國家心臟、肺和血液研究院,2002年5約;2002.2.NHLBIfactbook,fiscalyear2003.貝塞斯達,馬裡蘭州國家心臟、月巿和血液研究院,2004年2月;2003:35-53.3.KannelWB,SchatzkinA.Suddendeath:lessonsfromsubsetsinpopulationstudies.JAmCollCardiol.1985年1月;5(6增刊):141B-149B.4.KannelWB,McGeeDL.Epidemiologyofsuddendeath:insightsfromtheFraminghamStudy.CardiovascClin.1985;15(3):93-105.5.RossR.Atherosclerosis—aninflammatorydisease.NEnglJMed.1999年1月14日;340(2):115-126.6.GlassCK,WitztumJL.Atherosclerosis,theroadahead.Cell.2001年2月23日;104(4):503-516.7.LibbyP.Inflammationinatherosclerosis.Nature.2002年12月19-26日;420(6917):868陽874.8.RifaiN,RidkerPM.Inflammatorymarkersandcoronaryheartdisease.CurrOpinLipidol.2002年8月;13(4):383-389.9.RidkerPM,CannonCP,MorrowD等,C-reactiveproteinlevelsandoutcomesafterstatintherapy.NEnglJMed.2005年1月6日;352(1):20-28.10.參見生產商的信息(Whatman;S&S公司(Schleicher&Schuell)).11.參見生產商的信息(Whatman;S&S公司).12.ZweigMH,CampbellG.Receiver-operatingcharacteristic(ROC)plots:afundamentalevaluationtoolinclinicalmedicine.ClinChem.1993年4月;39(4):561-577.13.SaeedAI,SharovV,WhiteJ等,TM4:afree,open-sourcesystemformicroarraydatamanagementandanalysis.Biotechniques.2003年2月;34(2):374-378.14.BurgesCJC.Atutorialonsupportvectormachinesforpatternrecognition.DataMiningandKnowledgeDiscovery.1998;2(2):121-167.15.GuyonI,WestonJ,BarnhillS等,Geneselectionforcancerclassificationusingsupportvectormachines.MachineLearning.2002;46(l/3):389.16.RamaswamyS,TamayoP,RifkinR等,Multiclasscancerdiagnosisusingtumorgeneexpressionsignatures.ProcNatlAcadSciUSA.2001年12月18日;98(26):15149-15154.17.RidkerPM,BrownNJ,VaughanDE等,Establishedandemergingplasmabiomarkersinthepredictionoffirstatherothromboticevents.Circulation.2004年1月29日;109(25增刊1):IV6-19.18.PearsonTA,MensahGA,AlexanderRW等,Markersofinflammationandcardiovasculardisease:applicationtoclinicalandpublichealthpractice:AstatementforhealthcareprofessionalsfromtheCentersforDiseaseControlandPreventionandtheAmericanHeartAssociation.Circulation.2003年1月28曰;107(3):499-511.19.CharoIF,TaubmanMB.Chemokinesinthepathogenesisofvasculardisease.CircRes.2004年10月29日;95(9):858扁866.20.SallustoF,MackayCR,LanzavecchiaA.SelectiveexpressionoftheeotaxinreceptorCCR3byhumanThelper2cells.Science.1997年9月26日;277(5334):2005-2007.21.LusterAD.Chemokines—chemotacticcytokinesthatmediateinflammation.NEnglJMed.1998年2月12日;338(7):436-445.22.ThirdReportoftheNationalCholesterolEducationProgram(NCEP)ExpertPanelonDetection,Evaluation,andTreatmentofHighBloodCholesterolinAdults66(AdultTreatmentPanelIII)finalreport.Circulation.2002年12月17日;106(25):3143-3421.23.LevinsonSS.Briefreviewandcriticalexaminationoftheuseofhs隱CRPforcardiacriskassessmentwiththeconclusionthatitisprematuretousethistest.ClinChimActa.2005年1月;356(1-2):1-8.24.TabibiazarR,WagnerRA,AshleyEA,KingJY,FerraraR,SpinJM,SananDA,NarasimhanB,TibshiraniR,TsaoPS,EfronB,QuertermousT.Signaturepatternsofgeneexpressioninmouseatherosclerosisandtheircorrelationtohumancoronarydisease.PhysiolGenomics.2005年7月14日;22(2):213-26。實施例4:用於準確分類冠狀動脈疾病的炎性標記的數據分析用購得的施萊歇爾和舒爾人趨化因子晶片進行研究。我們使用該陣列評估了選自雷諾茲中心(ReynoldsCenter)隊列的100份樣品中的循環趨化因子水平。所檢測的趨化因子是MCP-1、MCP-2、MCP-3、MCP-4、嗜酸細胞活化趨化因子、IL-8、RANTES、MIP-la和IP-10,雖然IL8和RANTES值落在線性範圍之外。通過對雷諾茲隊列中選定SNP的重新測序和基因分型對廣泛研究了編碼MCP-1、MCP-2、MCP-3、嗜酸細胞活化趨化因子、IL-8和RANTES的遺傳基因座。循環樣品來自有心肌梗塞病史的50位個體和50位年齡匹配的對照(參見前文隊列描述)。雖然對照在其它變量上不匹配,但性別和種族及其它變量的聯合分布是相似的。陣列與生產商提供的試劑雜交、清洗,並用艾克松(Axon)掃描儀掃描,用S&S公司專有軟體(陣列視TM夸特⑧(ArrayVisionTMQu肌t,進行特徵提取。用該陣列所包括的試劑產生標準曲線,測定各份循環樣品的濃度。分析採用新方法,但延用以下主張的基礎前提條件是臨床和基因分型數據的納入能增加生物標記數據的信息,用於就與疾病狀態/活性無關的個體間趨化因子水平差異進行標準化。通過測定具有這些匹配數據的趨化因子豐度、臨床數據和各SNP的基因分型信息進行分析。區分病例和對照以及發現能用於區分的那些變量是雙類別(two-class)"分類"的基本問題。雖然單個分類符可能也行,但在它們中進行"公投"(vote)通常更好。實際上,在分類符中進行"公投"的方法十分常見,其中兩種是"打包法(bagging)"和"補強法(boosting)"。我們在分析之初只用4種分類符,就每一個受試者在它們中進行簡單公投。採用交叉驗證的標準方法例如5-倍交叉驗證來評估預期性能。因此,將數據組隨機分成大小几乎相等的5個亞組。依次地,每一次驗證在80%的數據上展開(並進行次間公投),取20%的數據計算結果。然後計算五組結果的平均值。也可使用更完備的樣品再用方法來評估預期準確率。對99位對象的初步樣品進行了所述分析。變量包括嗜酸細胞活化趨化因子、IP-IO、MCP-1、MCP-2、MCP-4、MIPla、性別、年齡、葡萄糖、胰島素、CRP和脂肪(FAT)。測定變量FAT作為BMI和腰圍(WAIST)的首要組分,以線性方式造成後文兩預測符91%的差異。共有51例MI和48位對照。我們用經驗值(empiricalpriors)來預測雙類別問題的貝葉斯分類規則;這樣,它們幾乎是每類0.5。將分類誤差成本取作相等。(當然,對於雙類別問題,只有先驗概率乘積與分類誤差成本的比值才是重要的。在這裡,該比值約為1。)年齡為60歲-72歲,其中,下端的權重高於上端。平均值是64.7歲,第25、50和75區間百分位數分別是62、64、67;年齡的標準偏差是3.1。在以下實施例中,LDA指費希爾線性辨別分析。下文描述了稱為CART、FlexTree和LART的方法。對於LART技術,首先用簡單的拉索法減少預測符的數量。如何進行分類的詳見下文。FlexTree和LART中的一個重要細節是回歸係數的霍特林丁2分選量,這對於它們的預測能力很重要。由分類移交的權重用於LART加權拉索(方法)。表3.經5倍交叉驗證的性能tableseeoriginaldocumentpage68表4.所述方法鑑定的變量tableseeoriginaldocumentpage68進一步分析結合了所述預測符,還有前述99位對象的SNP基因型信息。分類誤差的5-倍交叉驗證百分比降低至10%,而靈敏度提高至85%,特異性提高至92%。在該項分析中,採用簡單的拉索法來縮小所包括的SNP數目。並且,用某基因內SNP信息的CART來估算所有缺失的SNP值。總之,這些分析強有力地明顯支持了本文所述的發明。儘管只評估了少量分析物和臨床變量,但通過多種方法獲得了相當好的分類結果。所有方法均對循環趨化因子檢測值進行了選擇,不同方法之間有重疊,其中,MIPloc、MCP-4和嗜酸細胞活化趨化因子在多種算法中非常突出。這些分析提示基因分型數據可能提供更多的有用信息。目前作為動脈粥樣硬化性疾病標準診斷方法的高靈敏度CRP在這些分析中沒有用處,這提示多種疾病相關炎性標記的水平可能提供明顯優於現有預測符的改進。我們通過聚類法(無監督的學習)總結了多項特徵和各參數的聯合分布。在我們的層次聚類法方法中(圖6),列是個體(變量),行是特徵。在該算法中,各列各行逐次類聚,目的是產生"相近"的特徵組和樣品組。看變量的類聚,非常有意思的是,趨化因子MCP-2、MIPl-a、MCP-1、IP-IO、嗜酸細胞活化趨化因子和MCP-4緊密群集在一起。空腹胰島素水平、FAT(BMI和腹圍的首要成分)和葡萄糖這些代謝變量也群集在一起,這符合考慮到這些變量在葡萄糖代謝和胰島素耐受中彼此關聯所做的預期。未發現性別和年齡接近任一上述集群,二者保持獨立。令人感興趣的是,hsCRP未與趨化因子類聚而與代謝變量類聚,表明hsCRP水平與血管炎症的關聯度不及多趨化因子籤名。如同期望,樣品集群在類別成員上是不一致的。這些分析表明,無監督的學習(聚類)不足以進行有監督的學習(分類)。根據迄今所得結果,如果要進行準確分類,必需有這樣的分類分案該分案不僅根據特徵而且根據結果(可預示純以特徵為依據對後續觀察結果所做的分類)進行組別分類。實施例5:1330位患者的大型臨床試驗準確預測和診斷動脈粥樣硬化性心血管疾病和血管炎症的循環生物標記的籤名驗證多標記特徵的大型臨床試驗的血清生物標記數據受到前期臨床試驗結果的鼓舞,我們檢驗了多標記特徵是否能在更大的試驗中得到驗證以及它們是否可用作人類動脈粥樣硬化性疾病的高度靈敏、高特異性標記。為此,我們採用包括400例臨床顯著ASCVD和930位對照的大型臨床流行病學研究。該項研究的目標是檢驗動脈粥樣硬化的風險因素和新的其它決定因素。用蛋白質微陣列將報名時收集的血清樣品用於同時檢測多種炎性標記。此處採用前期研究所用的精確法(exactmethod)(詳見前述實施例)。一亞組分析物的濃度病例中明顯較高。用這些標記的血清表達特徵,分類算法根據與對照的比較對CAD病例進行了準確的分級。此外,由生物標記形成的籤名明顯提高了其它已知CAD標記的預測能力。該較大試驗不僅驗證了我們先前的發現,還為使用多標記方法來準確預測和診斷動脈粥樣硬化性心血管疾病及其各種臨床後遺症提供了更多實例。預測動脈粥樣硬化性疾病選擇髙信息含量的標記選擇多個高信息含量標記來構建分類模型需要限定性能指標和用戶定義的閾值,從而能根據該指標構成具有實用預測能力的模型。後文中,我們將目標量值(targetquantity)定為"曲線下面積"(AUC),預測的靈敏度和/或特異性以及預測模型的總準確率。現在開始描述選擇構建預測模型的項數的一種方法。在該實施方式中,我們描述了在沒有任何臨床變量和/或調節因子存在下選擇標記的方法。該方法如下所述我們首先將我們的訓練數據隨機分成10組,各組包括"健康"或"患病"的對象,各自與它們在全體樣品中的數量成正比。各對象用其24種標記的檢測值和疾病狀態標籤(無標籤表示"健康",有標籤則為"患病")。我們選擇9組,就24種標記中的每一種(MCP-1、IGF隱1、TNFa、IL-5、M-CSF、MCP-2、IPIO、MCP隱4、IL-3、IFNy、Ang-2、IL-7、IL-IO、嗜酸細胞活化趨化因子、IL-2、IL-4、ICAM-1、IL-6、IL-12p40、MIPla、IL-5、MCP-3、IL13、ILlb)用給定的算法(例如線性辨別分析、二次方程辨別分析、對數回歸等)用9組的所有數據訓練模型(即,我們創建了一訓練亞組)。然後我們將該模型應用於沒有參加訓練的第10組,我們對檢測誤差"e"和或許多上述預測質量指標值(qualitymeasure)進行了估算。我們重複以上過程10次,每次隨機取樣9組來產生訓練樣本並用第10組來估算檢驗誤差"e"和預測質量指標值。然後,我們用這10份數據構成的樣本估算各質量指標值和/或誤差以及我們估算值方差的預期值。已知這些數值後,將能提高模型的平均預測能力的標記選作模型的第一項。我們可改用另一改善指標來替代預測質量指標平均值,例如,我們可改選預期質量指標值與其方差估算值的比值最高的項目。將第一項加入該模型後,我們對在當前選擇步驟中未被中選的其餘標記重複上述過程。這樣,在第二步驟中,我們對其餘標記重複上述計算。通過選擇最能提高我們的目標預測質量指標值的選項,或用當前模型預期值的某種組合減去新模型的值並就那些指標的誤差標準化,來選擇第二模型項。圖12顯示了將該方法應用於一組1300個對象的結果。我們選擇AUC>0.75為閾值作為我們的目標預測質量指標,我們用線性辨別分析模型選擇項目。使用以下標記MCP-1滿足質量閾值。圖13顯示了用對數回歸模型選擇項目的結果,其中,診斷樣品(discoverysample)和質量閾值不變。與之前的實施例比較發現,兩種模型只有頭兩項相同(MCP-1、IGF-1),第三項不同(TNFa比之M-CSF)。因此,我們可採用多種標記和多種預測模型的組合,這將超越我們的質量閾值。為證實我們能替換標記而仍然滿足某預測質量指標的要求,我們從用於選擇的可用標記組合中除去標記MCP-1並重複以上方法。圖14給出使用LDA模型和前述1300位對象所得的結果。新的一組兩種標記包括Ang-2、IGF-1,這兩種二標記能提供AUC〉0.75的模型。作為不同選擇標準的實例,我們提供了採用AIC標準在對數模型框架內獲得的結果。該標準通常用於選擇對數回歸模型的最佳項數。該標準平衡了因除去某項導致的誤差增加與自由度降低(失去了原由該相為模型提供的自由度)。減項過程通常始於完整模型,終止於某項的除去導致AIC值升高之時。圖15a示出了減項結果與AIC標準的函數關係(所示減項過程超過了最佳點)。圖15b顯示了一模型隨項數增加的AUC預測情況。按照從完整模型即包含所有24種標記的模型中減項(主要按AIC標準選擇項目)相反的順序在上述模型中加入項。後一方法(減項)利用至少一種標記(MCP-1)產生了一個預計AUC>0.75的對數回歸模型。可採用前向選擇(本實施例中的第一、第二和第三例)或反向選擇(本實施例中的第四例)或前向/反向選擇方案完成項目選擇。該方案能檢驗所有在前一步驟中從當前縮減模型中除去的項。相同的選擇方法可拓展為同時包括標記和臨床變量。後面的兩幅圖顯示了以下情況的結果對數回歸模型的候選變量在全部16種標記之外還包括"高脂血症"(DC912)和"索引日(indexday)之前的160天內使用過降脂藥物"(圖16)或"使用他汀類藥物"、"使用ACE阻斷劑"(圖17)。這些實施例表明,可用組中的臨床變量替換獲得AUC>0.75所需的至少3標記組中的標記。高脂血症(DC912)和MCP-4組合所獲得模型的AUC預期值約為0.85。採用上述方法,我們還能選定了無需使用所有標記來優化模型性的標記數目。確定最佳項數的一種方法是選擇能獲得具有如下所述平均預測能力(以AUC檢測,或相當的靈敏度/特異性指標)的模型的項數,所述平均預測能力與各種組合和各種數量的給定算法所得最高值相差不超過1個標準偏差。再看圖17,包括以下標記的對數回歸模型滿足了這些要求DC512、DC3005、MCP-4、IGF-1、M-CSF、IL-5、MCP-2、IP-IO。實施例6:ACE抑制劑反應預測模型採用實施例5所述的方法,我們用對數回歸或線性辨別分析建立了能根據ACE抑制劑實用情況分類樣品的模型。按照對象狀態(對照或病例)調整這些模型,因為標記的總水平取決於我們的試驗對象是否健康。這些模型可用於多種方法,例如篩選化合物來鑑定可用作ACE抑制劑或作用於會聚性途徑(convergentpathway)的其它物質以及監測ACE抑制劑的療效。在第一個實施例中,將所述化合物給予哺乳動物對象,採集所述對象的一份或多份樣品,獲得一份或多份樣品的數據集。這些數據集經ACE抑制劑反應預測模型處理,用所得結果來分類樣品。如果樣品分類為來自ACE抑制劑用藥者,則該化合物可能是推定ACE抑制劑。在第二個實施例中,獲得對象的一份或多份樣品,由那些樣品所得的數據集經ACE抑制劑反應預測模型處理。如果樣品分類為來自ACE抑制劑用藥者,則治療可能有效。如果隨時間多次取樣顯示從該模型獲得的預測符值有時間依賴性改變,則藥物治療的療效可能正在改變,預測符值趨近於用藥分類指標還是趨近於非用藥分類指標指示著療效改變的方向。示例性模型所用的蛋白質標記連同模型的性能特徵見下表5和6。表5.ACE抑制劑預測模型1對數回歸所用的變量分類誤AUC靈敏度特異性準確率差MCP-1、IGF-1、TNFa、MCP-2、0.3650.6880.6410.6320.635IPIO、IL-5、M-CSF、MCP隱4、MCP國3、IL-3、Ang-2、IL-7、嗜酸細胞活化趨化因子表6.ACE抑制劑預測模型2線性辨別分析所用的變量分類誤AUC靈敏度特異性準確率差MCP-l、IGF隱l、TNFa、MCP-2、0.3760.6890.6320.6200.624IPIO、IL-5、M-CSF、MCP-4、MCP國3、IL-3、Ang-2、IL國7、嗜酸細胞活化趨化因子實施例7:ACE抑制劑或他汀類藥物使用情況預測模型採用實施例5所述的方法,我們用對數回歸或線性辨別分析建立了能根據ACE抑制劑或他汀類藥物實用情況分類樣品的模型。按照對象狀態(對照或病例)調整這些模型,因為標記的總水平取決於我們的試驗對象是否健康。這些模型可用於多種方法,例如篩選化合物來鑑定可用作ACE抑制劑或他汀類藥物或作用於收縮途徑的其它物質以及監測ACE抑制劑或他汀類藥物的療效。在第一個實施例中,將所述化合物給予哺乳動物對象,採集所述對象的一份或多份樣品,獲得一份或多份樣品的數據集。這些數據集經ACE抑制劑或他汀類藥物使用情況預測模型處理,利用所得結果來分類樣品。如果樣品分類為來自ACE抑制劑或他汀類藥物用藥者,則化合物可能是推定的ACE抑制劑或他汀類藥物。在第二個實施例中,獲得對象的一份或多份樣品,由那些樣品所得的數據集經ACE抑制劑或他汀類藥物使用情況預測模型處理。如果樣品分類為來自ACE抑制劑或他汀類藥物用藥者,則治療可能有效。如果隨時間多次取樣顯示從該模型獲得的預測符值有時間依賴性改變,則藥物治療的療效可能正在改變,預測符值趨近於用藥分類指標還是趨近於非用藥分類指標指示著療效改變的方向。示例性模型所用的蛋白質標記連同模型的性能特徵見下表7和8。藥物應用反應的生物標記分布我們的研究表明,標記組可用於監測藥物對炎症水平的作用。檢查多個標記(IL-2、IL-5、IL-4)的數值分布,我們證明劑量作用是對照接受藥物治療數量的函數(即,無藥物治療比之一種藥物治療或兩種藥物)。作為該方案的一個實例,我們用3種藥物反應性標記作為一組(IL-2、IL-4和IL-5)。為產生單一組合評分(singlecombinedscore),我們建立了線性辨別分析模型,其中,反應變量取以下值"未治療的"、"ACE或他汀類藥物"、"ACE和他汀類藥物",並且,我們將第一辨別變量用作組合評分的替代品。圖18顯示了被認為"健康"("對照")的對象的結果,所示為三個"治療"組各自的箱線圖。各箱線圖的灰色部分從各類別的數值分布的第一分位數延伸到第三分位數。為有助於目測觀察類別之間中值水平的差異,在中值附近加了"凹口"。弓l線(whisker)的延伸長度為分位數間距(interquantiledistance)的1.5倍。該圖中未包括溢出值。組合評分明顯隨藥物數目增加而顯示下降趨勢。各組的凹口幾乎不重疊這一事實表明中值的差異非常顯著。生物標記組的表現優於單用一種生物標記。可採用霍特林f方法獲得多種標記的單一評分,由此進行相似的分析。此時,我們能根據霍特林公式估算未治療組數據的協方差矩陣,計算各對象的"距離"。這後一方法不僅可用於建立許多標記的"組合距離(combineddistance)"來監測藥物劑量效應,還可用於對劑量效應作推定性檢驗。(參見納入本文作為參考的Hotelling,H.(1947).MultivariateQualityControl.刊於C.Eisenhart,M.W.Hastay禾口W.A.WalHs編,rec/zm々weso/Sto"W/ca/v4wa/,/s.紐約麥克勞-希爾公司(McGraw-Hill.))。表7.ACE抑制劑或他汀類藥物預測模型1對數回歸tableseeoriginaldocumentpage74表8.ACE抑制劑或他汀類藥物預測模型2線性辨別分析tableseeoriginaldocumentpage74實施例8:冠狀動脈鈣化度預測模型採用實施例5所述的方法,我們用對數回歸或線性辨別分析建立了能根據預測的冠狀動脈鈣化度分類樣品的模型。示例性模型所用的蛋白質標記連同模型的性能特徵見下表9和10。表9.冠狀動脈鈣化度預測模型1對數回歸-萬用的變量分類誤AUC'靈敏度特異性準確率差MCP-l、IGF-l、TNFa、MCP陽2、0.4700.5360.5670.5000.530IPIO、IL-5、M-CSF、MCP-4、MCP-3、IL-3、Ang-2、IL-7、嗜酸細胞活化趨化因子表10.冠狀動脈鈣化度預測模型2線性辨別分析所用的變量分類誤差MCP匿l、IGF-l、TNFa、MCP-2、0.461IPIO、IL-5、M-CSF、MCP-4、MCP-3、IL匿3、Ang隱2、IL-7、嗜酸細胞活化趨化因子實施例9:穩定與不穩定動脈粥樣硬化性疾病預測模型採用實施例5所述的方法,我們用對數回歸或線性辨別分析建立能將樣品分類為穩定(即心絞痛)類或不穩定(即心肌梗塞)類的模型。示例性模型所用的蛋白質標記連同模型的性能特徵見下表11和12。表11.穩定與不穩定疾病預測模型1對數回歸所用的變量分類誤AUC靈敏度特異性準確率差MCP-l、IGF-l、TNFa、MCP匿2、0.4380.5660.5630.5620.562IPIO、IL-5、M-CSF、MCP-4、MCP-3、IL-3、Ang-2、IL-7、嗜酸細胞活化趨化因子AUC靈敏度特異性準確率0.5600.5780.5050.539表12.穩定與不穩定疾病預測模型2線性辨別分析所用的變量分類誤AUC靈敏度特異性準確率差MCP曙l、IGF-l、TNFa、MCP-2、0.4440.5770.5830.5290.556IPIO、IL-5、M-CSF、MCP-4、MCP-3、IL-3、Ang-2、IL-7、嗜酸細胞活化趨化因子實施例10:疾病與健康對照預測模型採用實施例5所述的方法,我們用對數回歸或線性辨別分析建立能將樣品分類為疾病(即心絞痛或心肌梗塞)類或健康對照類的模型。示例性模型所用的蛋白質標記連同模型的性能特徵見下表13和14。表13和14還表明模型的性能如何隨標記的組合被取代而改變。表13.疾病與對照預測模型1線性辨別分析所用的變量MCP-1、IGF-1、TNFa、MCP-2、IPIO、IL-5、M-CSF、MCP-4、MCP-3、IL-3、Ang-2、IL-7、嗜酸細胞活化趨化因子MCP-1、IGF-1、TNFaMCP-1、IGF-1、M-CSFAng-2、IGF-1、M-CSFMCP-4、IGF-1、M-CSFMCP-1、IGF-1、TNFa、IL-5MCP-1、IGF-1、M-CSF、MCP-2Ang-2、IGF-1、M-CSF、IL-5MCP-1、IGF-1、TNFa、MCP-2MCP-1、IGF-1、TNFa、IL-5、M-CSFMCP-1、IGF-1、IPIO、MCP-2、M-CSFAng-2、IGF-1、TNFa、IL-5、M-CSFMCP-1、IGF-1、TNFa、MCP-2、IP10MCP-4、IGF-1、M-CSF、TNFa、IL-5MCP-4、IGF-1、M-CSF、MCP-2、IL-5分類誤差0.1580.2450.2350.2580,2580.2250.2270.2390.2400.2130.1840.2160.2030.2210.246AUC0.9150.8270.8250.7980.7890.8500.8420.8160.8420.8670.8740,8550.8780.8550.807靈敏度0.8470.8040,7860.7180.7210.8170.8010.7540.7920.8370.8070.8070.7840.8120.736特異性0,8400.7330.7560.7530.7500,7570,7600.7640.7460.7650.8210.7740.8020.7650.761準確率0.8420,7550.7650.7420.7420.7750,7730.7610.7600.7870.8160.7840.7970.7790.754表14.疾病與對照預測模型2對數回歸分類誤所用的變量差AUC靈敏度特異性準確率MCP-1、IGF-1、TNFa、MCP-2、IPIO、IL-5、M-CSF、MCP-4、MCP-3、IL-3、Ang-2、IL-7、嗜酸細胞活化趨化因子0■1530,.9160,.8590.8410.847MCP-1、IGF-1、TNFa0.2370,.8350,.8040■7450.763MCP-1、IGF-1、M-CSF0.2390,.8310,.7890,.7490.761Ang-2、IGF-1、M-CSF0■2570,,7990,■7340.7470.743MCP-4、IGF-1、M-CSF0.2580,■7920,.7330,■7450.742MCP-1、IGF-1、TNFa、IL-50■2210,,8560,.8260,.7590■779MCP-1、IGF-1、M-CSF、MCP-20,.2360,,8450,.7940..7500.764Ang-2、IGF-1、M-CSF、IL-50,■2430.,8130,.7660,.7540,.757MCP-1、IGF-1、TNFa、MCP-20,■2350.,8490,■7840,.7570,.765MCP-1、IGF-1、TNFa、IL-5、M-CSF0,.2120.,8680.,8320,.7690,.788MCP-1、IGF-1、IPIO、MCP-2、M-CSF0,.1870.,8760.■8040,,8160.,813Ang-2、IGF-1、TNFa、IL-5、M-CSF0,.2200.,8550.,謝o:,7710.■780MCP-1、IGF-1、TNFa、MCP-2、IP100,.2020.,8810.,7940.■7990.,798MCP-4、IGF-1、M-CSF、TNFa、IL-50,,2230.,8570.,8070.,7640.,777MCP-4、IGF-1、M-CSF、MCP-2、IL-50.■2580.8100.,7340.,7460.,742實施例lh利用LDA模型的分類我們根據以下標記的數值將患者分為"對照"或"疾病"MCP-1、IGF-1和TNFa。兩類取相等的分類誤差成本。根據LDA方法,如果方程(l)的左側大於該方程的右側,則將上述標記的值為x的新對象分入"疾病"類,方程中a)指數2對應於"疾病"狀態b)指數1對應於"對照"狀態c)N是訓練組的總規模d)Nl、N2是訓練組中"對照"和"疾病"對象的數量e)2是用訓練組估算的協方差矩陣f)^,2are分別是"對照"和"疾病"樣品的均值向量。i:'±1一a",)>!/:2—》卩s、j+,og(:A'丄〃v.)k堪(ava')(i)為構建用於預測的LDA模型,我們使用包括上述3種標記值的訓練組,對象包括398位"對照"和398位"疾病"對象。標記值先轉換為loglO值,用所得數值估算方程1所需的各項。訓練組的協方差矩陣和均值向量等於協方差矩陣MCP-1IGF隱1TNFaMCP-10.1241550.0695870.06659IGF-10.0695871.3219710.664374TNFa0.066590.6643740.565535"對照"和"疾病"狀態的均值標記向量:對照1.8915522.8309810.781913疾病1.2239762.3246830.990313方程1所需的協方差矩陣的逆陣是VIV2V318.6075990.13735-1.1748720.137351.848967-2.188283-1.17487-2.188284.477304我們分類具有以下數值(經loglO轉換)的對象對象l:MCP隱1IGF隱1TNFa0.7169981.3161010.287882根據這些數值和方程1,方程的左側等於0.5291794,而方程的右側等於3.232524。根據左側小於右側的事實,該對象分類為"對照"。我們分類具有以下loglO轉換後標記數值的第二位對象對象2:MCP國1IGF-1TNFa1.9915091.11130310.536339根據這些數值和利用方程1,方程的左側等於4.461167,而方程的右側依舊是3.232524。根據該比較,該對象分類為"疾病"。本實施例和以下實施例參考納入本文作為參考的"TheelementsofStatisticalLearning.DataMining,InferenceandPrediction",Hastie,T.,Tibshirani,R.,Friedman,J.,SpringerSeriesinStatistics,2001)。實施例12:利用對數回歸模型分類我們根據以下標記的數值將患者分為"對照"或"疾病"MCP-l、IGF-1和M-CSF。兩類取相等的分類誤差成本。根據對數回歸方法,如果k類^疾病)與K類(]寸照)的後驗概率(posteriorprobability)比值的對數大於0,則將上述標記數值為x的新對象歸入疾病類,否則其歸為對照(方程2)。log!^^W;=A。丄化i為擬合對數回歸模型,我們使用的訓練組包括398位"對照"和398位"疾病"對象。各對象的三種標記的數值經先轉換為loglO值。對數回歸擬合提供了以下係數:b0blb2b3-4.950593.334-1.276751.279328分類了所述三種標記具有以下數值的新對象:MCP-1IGF-1M-CSF對象11.6799313.4937811.169145以下計算式b0+bl*、MCP-r+b2*、IGF-l、+b3求、M-CSF'等於-2.031。如上所述,該對象的線性預測符值小於O,分類為"對照"。根據以下數值分類另一位對象MCP國1IGF-1M-CSF對象22.1082521.71490.539566採用相同的係數和公式,線性預測符等於0.5799186,對象2分類為"疾病"。本說明書引用的各出版物出於所有目的全文納入本文作為參考。除了在本說明書全文中所列的那些出版物,以下出版物也出於所有目的全文納入本文作為參考TabibiazarR,WagnerRA,DengA,TsaoPS,QuertermousT.Proteomicprofilesofseruminflammatorymarkersaccuratelypredictatherosclerosisinmice.P/戸'o/2006年4月13日;25(2):194-202。79權利要求1.一種將獲自哺乳動物的樣品分類的方法,包括獲得與所述樣品相關的數據集,所述數據集包括至少三種選自下組蛋白質標記的定量數據MCP-1、MCP-2、MCP-3、MCP-4、嗜酸細胞活化趨化因子、IP-10、M-CSF、IL-3、TNFa、Ang-2、IL-5、IL-7和IGF-1;將所述數據輸入用所述數據分類所述樣品的分析方法,其中所述分類選自動脈粥樣硬化性心血管疾病分類、健康分類、用藥物接觸分類、不用藥分類;和根據所述方法的輸出值分類所述樣品。2.如權利要求l所述的方法,其特徵在於,所述分析方法使用預測模型。3.如權利要求l所述的方法,其特徵在於,所述分析方法包括比較所述獲得的數據集與參比數據集。4.如權利要求3所述的方法,其特徵在於,所述參比數據集包括獲自一位或多位健康對照的數據,或包括獲自一位或多位診斷患有動脈粥樣硬化性疾病的對象的數據。5.如權利要求3所述的方法,其特徵在於,還包括獲得所述獲得的數據集與所述參比數據集的相似度的統計學指標。6.如權利要求5所述的方法,其特徵在於,所述統計學指標通過將所述獲得的數據集的至少三個參數與所述參比數據集的相應參數比較得出。7.如權利要求l所述的方法,其特徵在於,所述至少三種蛋白質標記包括選自下組的標記組MCP-1,IGF-1,TNFa;MCP-l,IGF-1,M-CSF;ANG陽2,IGF-1,M-CSF;和MCP-4,IGF-1,M-CSF。8.如權利要求l所述的方法,其特徵在於,所述數據集包括至少四種選自下組的蛋白質標記的定量數據MCP-1、MCP-2、MCP-3、MCP-4、嗜酸細胞活化趨化因子、IP-IO、M-CSF、IL-3、TNFa、Ang-2、IL-5、IL-7和IGF-1。9.如權利要求8所述的方法,其特徵在於,所述至少四種蛋白質標記包括選自下組的標記組MCP-1,IGF-1,TNFa,IL-5;MCP-1,IGF-1,M-CSF,MCP-2;ANG-2,IGF-1,M-CSF,IL-5;MCP隱1,IGF-1,TNFa,MCP-2;和MCP-4,IGF-1,M國CSF,IL-5。10.如權利要求l所述的方法,其特徵在於,所述數據集包括至少五種選自下組的標記的定量數據MCP-1、MCP-2、MCP-3、MCP-4、嗜酸細胞活化趨化因子、IP-IO、M-CSF、IL-3、TNFa、Ang-2、IL-5、IL-7和IGF-1。11.如權利要求IO所述的方法,其特徵在於,所述至少五種蛋白質標記選自下組MCP-1、IGF國1、TNFa、IL-5、M-CSF;MCP-1、IGF國1、M-CSF、MCP-2、IP-10;ANG-2、IGF-1、M-CSF、IL-5、TNFa;MCP-1、IGF-1、TNFa、MCP-2、IP-10;MCP-4、IGF-1、M隱CSF、IL-5、TNFa;和MCP-4、IGF-1、M陽CSF、IL-5、MCP-2。12.—種分類獲自哺乳動物的樣品的方法,包括獲得與所述樣品相關的數據集,其中所述數據集包括至少3種選自下組的蛋白質標記的定量數據MCP1;MCP2;MCP3;MCP4;嗜酸細胞活化趨化因子;IP10;MCSF;IL3;TNFa;Ang2;IL5;IL7;IGF1;IL10;INFy;VEGF;MIPla;RANTES;IL6;IL8;ICAM;TIMP1;CCL19;TCA4/6kine/CCL21;CSF3;TRANCE;IL2;IL4;IL13;Illb;MCP5;CCL9;CXCL1/GR01;GROa;IL12;和瘦蛋白;將所述數據輸入用所述數據分類所述樣品的預測模型,其中所述分類選自動脈粥樣硬化性心血管疾病分類、健康分類、用藥分類、不用藥分類,其中所述預測模型的至少一項分類質量指標值為至少0.7;和根據所述預測模型的輸出值分類所述樣品。13.如權利要求12所述的方法,其特徵在於,所述預測模型的分類質量指標值為至少0.8。14.如權利要求13所述的方法,其特徵在於,所述預測模型的分類質量指標值為至少0.9。15.如權利要求12所述的方法,其特徵在於,所述質量指標選自AUC和準確率。16.如權利要求12所述的方法,其特徵在於,調整所述預測模型的限度使得靈敏度或特異性至少其一是至少0.7。17.如權利要求14所述的方法,其特徵在於,調整所述預測模型的限度使得靈敏度或特異性至少其一是至少0.7。18.如權利要求l所述的方法,其特徵在於,所述動脈粥樣硬化性疾病分類選自下組冠狀動脈疾病、心肌梗塞和心絞痛。19.如權利要求l所述的方法,其特徵在於,還包括使用所述分類進行動脈粥樣硬化診斷、確定動脈粥樣硬化階段、動脈粥樣硬化預後、血管炎症水平、評估動脈粥樣硬化發展程度、監測治療反應、預測冠狀動脈鈣化度、或區分動脈粥樣硬化性疾病的穩定和不穩定表現。20.如權利要求1所述的方法,其特徵在於,所述數據集還包括一種或多種臨床指標的數據。21.如權利要求20所述的方法,其特徵在於,所述一種或多種臨床指徵選自下組年齡、性別、LDL濃度、HDL濃度、甘油三酯濃度、血壓、體重指數、CRP濃度、冠狀動脈鈣化度、腰圍、吸菸情況、心血管疾病病史、心血管疾病家族史、心率、空腹胰島素濃度、空腹葡萄糖濃度、糖尿病狀態和使用高血壓藥物的情況。22.如權利要求1所述的方法,其特徵在於,所述樣品包括血液或血液衍生物。23.如權利要求l所述的方法,其特徵在於,所述分析方法包括採用線性辨別分析模型、支持向量機分類算法、遞歸特徵排除模型、微陣列模型預測分析、對數回歸模型、CART算法、FlexTree算法、LART算法、隨機森林算法、MART算法或機械學習算法。24.如權利要求23所述的方法,其特徵在於,所述方法包括利用線性辨別分析模型或對數回歸模型,所述模型包括提供高於0.75的質量指標的參數項。25.如權利要求l所述的方法,其特徵在於,還包括實現對在多個不同時刻獲得的對象的多份樣品的多種分類。26.—種將獲自哺乳動物的樣品分類的方法,包括獲得與所述樣品相關的數據集,其中所述數據集包括至少3種選自下組的蛋白質標記的定量數據,各標記顯示循環蛋白質濃度與動脈粥樣硬化性血管組織RNA濃度之間的關聯;將所述數據輸入用所述數據分類所述樣品的分析方法,其中所述分類選自動脈粥樣硬化性心血管疾病分類、健康分類、用藥分類、不用藥分類;和根據所述方法的輸出值分類所述樣品。27.如權利要求26所述的方法,其特徵在於,所述關聯的特徵在於皮爾遜相關係數至少是0.6。28.如權利要求27所述的方法,其特徵在於,所述至少三種蛋白質標記包括一種或多種選自下組的蛋白質標記MCP-1、CCL21、CCL19、CCL112、TNFSF11和CCXll。29.如權利要求26所述的方法,其特徵在於,所述哺乳動物是人。30.—種將獲自哺乳動物的樣品分類的方法,包括獲得與所述樣品相關的數據集,其中所述數據集包括至少3種選自下組的蛋白質標記的定量數據,各標記顯示循環蛋白質濃度與動脈粥樣硬化性血管組織RNA濃度之間的關聯;將所述數據輸入用所述數據分類所述樣品的預測模型,其中所述分類選自動脈粥樣硬化性心血管疾病分類、健康分類、用藥分類、不用藥分類,其中所述預測模型的至少一項分類質量指標值為至少0.7;和根據所述預測模型的輸出值分類所述樣品。31.如權利要求30所述的方法,其特徵在於,所述關聯的特徵在於皮爾遜相關係數至少是0.6。32.如權利要求31所述的方法,其特徵在於,所述至少三種蛋白質標記包括一種或多種選自下組的蛋白質標記MCP-1、CCL21、CCL19、CCL112、TNFSF11禾卩CCXll。33.如權利要求30所述的方法,其特徵在於,所述哺乳動物是人。全文摘要本發明鑑定了在動脈粥樣硬化中差異性表達的循環蛋白。這些蛋白質,特別是作為一組蛋白質的循環水平能將急性心肌梗塞患者與穩定的勞累性心絞痛患者及無動脈粥樣硬化性心血管病史者區分開來。這些蛋白水平還可預測心血管事件、測定治療效力、確定病程階段等。例如,這些標記蛋白可用作開發血管特異性藥物製劑所需的替代臨床表徵的生物標記。文檔編號G01N33/48GK101495862SQ200680030864公開日2009年7月29日申請日期2006年6月26日優先權日2005年6月24日發明者B·K·特爾布爾,E·海託普羅斯,P·S·曹,R·A·奧爾森,R·塔比比亞扎,T·科特莫斯申請人:利蘭·斯坦福青年大學託管委員會

同类文章

一種新型多功能組合攝影箱的製作方法

一種新型多功能組合攝影箱的製作方法【專利摘要】本實用新型公開了一種新型多功能組合攝影箱,包括敞開式箱體和前攝影蓋,在箱體頂部設有移動式光源盒,在箱體底部設有LED脫影板,LED脫影板放置在底板上;移動式光源盒包括上蓋,上蓋內設有光源,上蓋部設有磨沙透光片,磨沙透光片將光源封閉在上蓋內;所述LED脫影

壓縮模式圖樣重疊檢測方法與裝置與流程

本發明涉及通信領域,特別涉及一種壓縮模式圖樣重疊檢測方法與裝置。背景技術:在寬帶碼分多址(WCDMA,WidebandCodeDivisionMultipleAccess)系統頻分復用(FDD,FrequencyDivisionDuplex)模式下,為了進行異頻硬切換、FDD到時分復用(TDD,Ti

個性化檯曆的製作方法

專利名稱::個性化檯曆的製作方法技術領域::本實用新型涉及一種檯曆,尤其涉及一種既顯示月曆、又能插入照片的個性化檯曆,屬於生活文化藝術用品領域。背景技術::公知的立式檯曆每頁皆由月曆和畫面兩部分構成,這兩部分都是事先印刷好,固定而不能更換的。畫面或為風景,或為模特、明星。功能單一局限性較大。特別是畫

一種實現縮放的視頻解碼方法

專利名稱:一種實現縮放的視頻解碼方法技術領域:本發明涉及視頻信號處理領域,特別是一種實現縮放的視頻解碼方法。背景技術: Mpeg標準是由運動圖像專家組(Moving Picture Expert Group,MPEG)開發的用於視頻和音頻壓縮的一系列演進的標準。按照Mpeg標準,視頻圖像壓縮編碼後包

基於加熱模壓的纖維增強PBT複合材料成型工藝的製作方法

本發明涉及一種基於加熱模壓的纖維增強pbt複合材料成型工藝。背景技術:熱塑性複合材料與傳統熱固性複合材料相比其具有較好的韌性和抗衝擊性能,此外其還具有可回收利用等優點。熱塑性塑料在液態時流動能力差,使得其與纖維結合浸潤困難。環狀對苯二甲酸丁二醇酯(cbt)是一種環狀預聚物,該材料力學性能差不適合做纖

一種pe滾塑儲槽的製作方法

專利名稱:一種pe滾塑儲槽的製作方法技術領域:一種PE滾塑儲槽一、 技術領域 本實用新型涉及一種PE滾塑儲槽,主要用於化工、染料、醫藥、農藥、冶金、稀土、機械、電子、電力、環保、紡織、釀造、釀造、食品、給水、排水等行業儲存液體使用。二、 背景技術 目前,化工液體耐腐蝕貯運設備,普遍使用傳統的玻璃鋼容

釘的製作方法

專利名稱:釘的製作方法技術領域:本實用新型涉及一種釘,尤其涉及一種可提供方便拔除的鐵(鋼)釘。背景技術:考慮到廢木材回收後再加工利用作業的方便性與安全性,根據環保規定,廢木材的回收是必須將釘於廢木材上的鐵(鋼)釘拔除。如圖1、圖2所示,目前用以釘入木材的鐵(鋼)釘10主要是在一釘體11的一端形成一尖

直流氧噴裝置的製作方法

專利名稱:直流氧噴裝置的製作方法技術領域:本實用新型涉及ー種醫療器械,具體地說是ー種直流氧噴裝置。背景技術:臨床上的放療過程極易造成患者的局部皮膚損傷和炎症,被稱為「放射性皮炎」。目前對於放射性皮炎的主要治療措施是塗抹藥膏,而放射性皮炎患者多伴有局部疼痛,對於止痛,多是通過ロ服或靜脈注射進行止痛治療

新型熱網閥門操作手輪的製作方法

專利名稱:新型熱網閥門操作手輪的製作方法技術領域:新型熱網閥門操作手輪技術領域:本實用新型涉及一種新型熱網閥門操作手輪,屬於機械領域。背景技術::閥門作為流體控制裝置應用廣泛,手輪傳動的閥門使用比例佔90%以上。國家標準中提及手輪所起作用為傳動功能,不作為閥門的運輸、起吊裝置,不承受軸向力。現有閥門

用來自動讀取管狀容器所載識別碼的裝置的製作方法

專利名稱:用來自動讀取管狀容器所載識別碼的裝置的製作方法背景技術:1-本發明所屬領域本發明涉及一種用來自動讀取管狀容器所載識別碼的裝置,其中的管狀容器被放在循環於配送鏈上的文檔匣或託架裝置中。本發明特別適用於,然而並非僅僅專用於,對引入自動分析系統的血液樣本試管之類的自動識別。本發明還涉及專為實現讀