新四季網

乳腺癌標誌物的製作方法

2023-09-14 17:41:45 1


專利名稱::乳腺癌標誌物的製作方法乳腺癌標誌物相關申請的交叉參考本申請請求Cox等在2005年11月29日提交的USSN60〃40,971MARKERSFORBREASTCANCER的優先權和利益。本申請還請求Cox等在2006年3月10日提交的USSN60/781,483MARKERSFORBREASTCANCER的優先權和利益。將這些在先申請各自完整地引入本文作為參考。
背景技術:
:乳腺癌如其它常見的癌症一樣表現出家族性聚類(dustering)。大量流行病學調查已經證實,總體而言,該病在乳腺癌患者的一級親屬中普及約為2倍1。家族研究特別是雙生子研究提示如果不是所有該聚類,那麼也是大部分該聚類存在遺傳基礎2,3。例如,Peto和Mack"古計乳腺癌在患病女性的MZ雙生子中的風險約高於姊妹病例風險的4倍。已經鑑定了幾種乳腺癌易感性(susceptibility)基因,最重要的是5/C47和BiC42。在這些基因中的突變賦予了乳腺癌的高風險(截止到70歲分別為65%和45%的等級)4。基於群體的系列乳腺癌病例突變篩選已經證實僅約15%的乳腺癌家族風險度可以解釋為這些基因中的突變5,6。其它已知的乳腺癌易感性基因(r屍w、P7Eiv、^rM、affi《2)對家族性風險僅有較小的貢獻(因為惡病質突變是罕見的和/或僅賦予較小的風險)。因此,總體而言,估計已知的乳腺癌易感性基因佔家族性風險的不超過20%7。風險中的遺傳變異可能源自罕見的高度外顯性(penetrant)突變(諸如^C47和^C42中的那些)或源自賦予更為中度風險的變異。幾條證據強烈提示高度外顯性突變並非剩餘的家族性乳腺癌風險的主要提供者。首先,多個病例家族的突變篩選發現具有極為明顯家族史(例如4個或個以上患病親屬)的大部分病例在BiC47或S/C42中包含突變8。第二,儘管在過去的9年中進行了廣泛努力,但是遺傳連鎖研究尚未鑑定任何額外連鎖基因座9,1、第三,對較大系列的乳腺癌家族的分離分析已經發現,在調整5iC47和57C42後,無進一步重大顯性乳腺癌易感性等位基因的證據11,12。在最大規模的這類分析中,Antoniou等13發現乳腺癌的最經濟型(parsimonious)模型為多基因模型,它與大量小作用基因座的倍增聯合(alargenumberoflociofsmalleffectcombiningmultiplicatively)相當。儘管上述分析提示幾種較低外顯性乳腺癌易感性基因仍然有待檢測,但是這類基因的精確數目尚不了解。此外,在現有技術中,尚不清楚這類易感性等位基因在群體中是常見的還是罕見的。本申請集中於相對常見(頻率高於5%)的等位基因且本文基於全基因組對這類基因座進行鑑定。發明概述本發明包括與乳腺癌表型,諸如乳腺癌易感性相關的多態性基因座的鑑定。圖1和2提供了表型基因座的描述。圖l提供了優選的表型基因座的描述。因此,本發明提供了先前未知的各種多態性與乳腺癌易感性表型之間的相關性。因此,對這些多態性(或與之相關的基因座)的檢測提供了用於鑑定患者處於乳腺癌風險中的有力和精確的方法和系統。此外,對這些多態性的鑑定提供了鑑定乳腺癌調控劑的高通量系統和方法。因此,本發明在一個方面中提供了鑑定生物體或其衍生的生物學樣品的乳腺癌表型的方法。該方法包括檢測生物體或生物學樣品中的多態性或與之緊密連鎖的基因座,所述的多態性選自圖l的多態性,其中多態性與乳腺癌表型相關。這些方法進一步包括使所述多態性或基因座與所述表型建立相關性。生物體典型的是哺乳動物,優選人類患者,最典型的是女性患者(儘管男性也會發生乳腺癌,而且本文中所述的相關性也適用於男性患者)。類似的,生物學樣品典型的衍生自哺乳動物,例如人類患者,例如遵循適宜的知情同意實踐。所述方法可用於檢測取自人類患者的樣品中的乳腺癌標誌物,或者可用於檢測由其衍生的生物學樣品(例如細胞,包括原代的和培養的細胞)中的標誌物。可以通過任何可利用的方法檢測多態性,包括擴增、與探針或陣列雜交等。在一個具體的實施方案中,檢測包括擴增多態性、連鎖基因座或與之相關的序列(例如,側翼序列、轉錄序列等)並檢測所得擴增子。例如,在一個實施方案中,擴增包括a)混合擴增引物或擴增引物對與分離自生物體或生物學樣品的核酸^f莫板。所述的引物或引物對可以與鄰近或包含多態性或連鎖基因座的區互補或部分互補,並且能夠在核酸模板上由聚合酶啟動核酸聚合。所述的引物或引物對在包括聚合酶和模板核酸的DNA聚合反應中延伸而生成擴增子。在某些方面中,任選通過如下方法檢測擴增子,該方法包括使所述的擴增子與陣列雜交、用限制酶消化該擴增子或實時PCR分析。例如,可以任選通過雜交對擴增子進行完全或部分測序。一般而言,擴增可以包括使用分離自生物體或生物學樣品的核酸作為PCR、RT-PCR或LCR中的模板進行聚合酶鏈反應(PCR)、逆轉錄酶PCR(RT-PCR)或連接酶鏈反應(LCR)。可以用其它技術取代擴增,例如使用分支DNA(bDNA)探針。在典型的實施方案中,多態性或連鎖基因座可以包括SNP。等位基因的實例包括圖l和/或2中所述的那些。例如,相關多態性可以為圖l(最優選)或圖2的那些。優選的多態性包括選自SNP識別號碼所述的SNP組的SNP,所述的識別號碼選自SNPID2312116,SNPID1622530,SNPID3712013,SNPID1509710,SNPID843029,SNPID1990126,SNPID604819,SNPID3025734,SNPID1152499,SNPID4415909,SNPID1732681,SNPID4281579,SNPID4454457,SNPID2616199,SNPID1720694,SNPID4077723,SNPID3711990,SNPID3337858,SNPID4093095,SNPID4213825,SNPID3488617,SNPID3610210,SNPID3451239,SNPID1582533,SNPID3488150,SNPID2770052,SNPID4141351,SNPID1335030,SNPID2211665和SNPID4538418。這些識別號碼為PerlegenSNP識別號碼(PerlegenSciences,Inc.inMountainView,CA),其為^^眾可得到的並且可以在Perlegen(dot)com上查閱到大量相關信息,通過使用該公司在genome(dot)perlegen(dot)com/browser/index(dot)html可利用的基因組瀏覽器查閱。可以在SNPJD開始處添加通配符(例如,"*"符號)以便例如按照提供的完整說明書鑑定有關所有SNP等位基因的相關信息。該資料庫還與NCBI基因組資料庫連結,由此提供大量有關相關基因和多態性的額外信息。這些SNP包括與例如如下基因相關的SNP:FGFR2,A2BP1,TNRC9,H19,FSTL5,LSP1,LOC388927,UNQ9391,HCN1,LOC441192,TNRC9,NR3C2,KIAA0826,FLJ31033,AACS,FRMD4A和SEC31L2(另外,參見圖l)。因此,與這些基因相關的多態性也是可能與乳腺癌多態性相關的優選SNP。並且任選在某些實施方案中,該方法包括在一種以上這類基因中檢測多態性(例如,在某些便利性的應用中,可以同時對單一患者檢測幾種多態性以便更完整地確定或指定相關表型)。如此,本發明在一個方面中包括檢測多個所述基因中的多個多態性或連鎖基因座。該方法可以包括,例如,檢測下列每種的至少一個多態性SNPID2312116、SNPID1622530、SNPID3712013、SNPID15097IO和SNPID84302,和/或FGFR2、A2BP1、TNRC9、H19和FSTL5中的多態性。類似地,該方法可以包括檢測下列每種的至少一個多態性SNPID2312116,SNPID1622530,SNPID3712013,SNPBD1509710,SNPID843029,SNPID1990126,SNPID604819,SNPID3025734,SNPID1152499,SNPID4415909,SNPID1732681,SNPID4281579,SNPID4454457,SNPID2616199,SNPID1720694,SNPID4077723,SNPID3711990,SNPID3337858,SNPID4093095,SNPID4213825,SNPID3488617,SNPID3610210,SNPID3451239,SNPID1582533,SNPID3488150,SNPID2770052,SNPID4141351,SNPID1335030,SNPID2211665和SNPID4538418;或如下每種中的至少一個多態性FGFR2,A2BP1,TNRC9,H19,FSTL5,LSP1,LOC388927,UNQ9391,HCN1,LOC441192,TNRC9,NR3C2,KIAA0826,FLJ31033,AACS,FRMD4A和SEC31L2。一般而言,可以檢測本文圖中的這些或任何其它多態性/基因/基因座的任何組合,並且所有這類組合均任選為本發明的特徵,無論是否特別列出。本發明用於檢測本文多態性的探針或引物可以包括圖l和/或2多態性的核苷酸序列,其側翼序列或其互補核酸或其轉錄產物(例如,由基因組序列例如通過轉錄或剪接產生的nRNA或mRNA形式)。還可以4企測多肽序列,例如對任何由核酸指定等位基因形式轉錄的多肽序列檢測多態性。一般而言,與QTL相關的任何多態性可以用作QTL的標誌物。因此,與圖中指定多態性相關的標誌物可以用作指定多態性的代替(proxy)標誌物。一般而言,相關性越緊密,則作為QTL/多態性的標誌物越好。因此,期望連鎖基因座可以為距多態性約為5cM或以下(且任選lcM或以下)的緊密連鎖基因座。所述的方法任選包括通過參照查閱表使多態性或連鎖基因座與乳腺癌表型建立相關性,所述的查閱表包含多態性或連鎖基因座的等位基因與乳腺癌表型的相關性的信息。用於這種相關性的資料庫可以為啟發式的(heuristic),或者以其它方式能夠基於通過關聯標誌物-性狀信息獲得的信息改進相關性。相關的組合物為本發明的特徵,例如,包含多個標誌物探針或擴增引物的組合物,所述的標誌物探針或擴增引物檢測或擴增例如如本文所述與乳腺癌表型相關的多種多態性。引物/探針可以基於陣列或在溶液中游離。在另一個方面中,還提供了鑑定乳腺癌表型調控劑的方法。所述的方法包括使潛在的調控劑接觸基因或基因產物,例如,其中基因或基因產物包含本文所述的多態性(例如,在圖l和/或2中)或與之緊密連鎖。檢測潛在調控劑對基因或基因產物的作用,由此鑑定潛在的調控劑是否調控表型。基因或基因產物任選包括選自本文所列那些的多態性的特定等位基因,但還可以對其它等位基因測試調控劑以便鑑定特異性或非特異性調控等位基因的調控劑。可以測試的作用包括如下中的任意種(a)在有調控劑存在下基因或基因產物表達的升高或降低;(b)在有調控劑存在下基因產物活性的升高或降低;和(c)在有調控劑存在下基因或基因產物表達圖式的改變。治療乳腺癌表型的試劑盒可以包括所述方法鑑定的調控劑和用於對患者給藥以便治療所述表型的說明書。除上述方法外,用於實施所述方法的試劑盒和系統也為本發明的特徵。例如,用於鑑定生物體或其衍生的生物學樣品的乳腺癌表型的系統為本發明的一個特徵。該系統包括,例如,一組為檢測一種或多種多態性或連鎖基因座中的至少一種等位基因配置的標誌物探針或引物,例如,其中所述的多態性為本文所述,例如,在圖1或2中所述的任何多態性。該系統任選還包括檢物組產生的擴增子的一種或多種信號輸出,由此鑑定存在或不存在所述的等位基因。一般在該系統中包括使等位基因的存在或不存在與預測的表型建立相關性的系統指令(例如,在該系統計算機中包含的軟體)作為系統的組成部分。篩選調控劑的系統也為本發明的特徵。這些系統可以包括,例如,與本文多態性相關的基因或基因編碼的表達產物。這些系統一般包括檢測器,該檢測器測定在有調控劑存在下基因或基因產物表達的升高或降低;在有調控劑存在下基因產物活性的升高或降低;或在有調控劑存在下基因或基因產物表達圖式的改變。這些系統還可以包括用於混合和等分調控劑和/或基因或產物、混合它們、進行實驗室操作(例如純化,合成,細胞培養等)的流體操作部件。用於記錄調控劑作用且任選用於選擇調控劑的系統指令也為這些系統的任選特徵。用於進行本文任何方法的試劑盒為本發明的另一個特徵。這類試劑盒可以包括用於檢測本文的任何多態性的探針或擴增子、適當的包裝材料和用於實施所述方法的說明書。上述多態性和基因和相應標誌物探針、擴增子或引物可以以物理核酸或多肽的形式或系統說明書的形式具體配置在本文的任何系統中,所述的系統說明書包括有關核酸和多肽的序列信息。例如,該系統可以包括對應於本文所述基因或多態性的引物或擴增子或者擴增其一部分的引物或擴增子,所述的基因或多態性諸如SNPID2312116,SNPID1622530,SNPID3712013,SNPID1509710,SNPID843029,SNPID1990126,SNPID604819,SNPID3025734,SNPID1152499,SNPID4415909,SNPID1732681,SNPID4281579,SNPID4454457,SNPID2616199,SNPID1720694,SNPID4077723,SNPID3711990,SNPID3337858,SNPID4093095,SNPID4213825,SNPID3488617,SNPID3610210,SNPID3451239,SNPID1582533,SNPID3488150,SNPID2770052,SNPID4141351,SNPID1335030,SNPID2211665和SNPID4538418,和/或FGFR2,A2BP1,TNRC9,H19,FSTL5,LSPl,LOC388927,UNQ9391,HCN1,LOC441192,TNRC9,NR3C2,KIAA0826,FLJ31033,AACS,FRMD4A和SEC31L2。正如在上述方法中,標誌物探針或?I物組任選檢測多個所述基因或遺傳基因座中的多個多態性。因此,例如,標誌物探針或引物組檢測本文圖中的這些多態性或基因或任何其它多態性、基因或基因座每種中的至少一個多態性。任何這類探針或引物可以包括任何這類多態性或基因或其互補核酸或其轉錄產物的核苷酸序列(例如,由基因組序列,例如通過轉錄或剪接產生的nRNA或mRNA形式)。許多可選擇的變體為本發明的實施方案。例如,檢測器一般檢測一種或多種光發射,它表示存在或不存在所述的等位基因。說明書一般包含至少一種查閱表,它包括所述等位基因的存在或不存在與所述表型之間的相關性。系統任選包括測試樣品,例如,基因組DNA、擴增的基因組DNA、cDNA、擴增的cDNA、RNA或擴增的RNA。樣品可以來自或衍生自哺乳動物,諸如人類患者。所述方法、試劑盒和系統的所有特徵可以彼此結合使用。例如,用於檢測調控劑的系統可以用於實施調控劑檢測方法。用於鑑定乳腺癌表型與多態性之間相關性的系統可以用於實施本文的方法。試劑盒可以用於實施本文的方法。因此,系統、方法和試劑盒的所述特徵可以適用於本文的不同系統、方法和i式劑盒。附圖簡述圖l為優選多態性、基因和與乳腺癌相關的多態性的相關信息的表。圖2為優選多態性、基因和與乳腺癌相關的多態性的相關信息的表。定義應理解本發明並不限於特定的實施方案,其當然可以改變。還應理解本文所用術語的目的僅在於描述特定的實施方案,但並非旨在限制。除非上下文中另有明確的描述,否則作為本說明書和所附權利要求中所用的單數和單數形式的術語例如"一個/一種(a,an)"和"所述的(the)"任選包括複數指示物。因此,例如,提到"一種探針"任選包括多個探針分子;類似地,根據上下文的不同,應用的術語"一種核酸"作為實用物質任選包括該核酸分子的許多拷貝。對基因或蛋白質的字母命名根據上下文的不同可以指基因形式和/或蛋白質形式。本領域技術人員完全能夠通過參比本文的序列、已知的序列和遺傳密碼聯繫相關生物學分子的核酸和胺基酸形式。除非另作陳述,否則核酸從左到右以5'-3'方向書寫。本說明書中引述的數值範圍包括確定範圍的數值並且包括該定義範圍的每個整數或任何非整數的分數。除非另作陳述,否則本文所用的所有技術和科學術語具有與本發明所屬領域普通^L術人員通常理解相同的含義。儘管與本文所述那些類似或相當的任何方法和物質可以用於實施本發明的測試,但是優選的物質和方法如本文所述。在描述和請求保護本發明中,按照如下列出的定義使用下列術語。"表型"為在個體或群體中可觀察到的性狀或性狀集合。該性狀可以為定量的(數量性狀或QTL)或定性的。例如,對乳腺癌的易感性為可以按照本文的方法、組合物、試劑盒和系統監測的表型"乳腺癌易感性表型"為展示出個體對發生乳腺癌的惡病質(predisposition)的表型。展示出對乳腺癌的惡病質的表型可以例如表現出癌症在具有該表型的個體中發生的可能性高於在指定的一組環境條件(膳食、體力活動方案、地理位置等)下的相關一般群體中的成員。"多態性"為可變的基因座;即在群體內多態性處的核苷酸序列具有一種以上形式或等位基因。術語"等位基因"意指出現在特定基因座上或在其上編碼的兩種或多種不同核苦酸序列或由這類基因座編碼的兩種或多種不同多肽序列之一。例如,第一種等位基因可以出現在一條染色體上,而第二種等位基因出現在第二條同源染色體上,例如,正如對雜合個體的不同染色體或群體中的不同純合或雜合個體之間的不同染色體出現的。多態性的一個實例為"單核苷酸多態性"(SNP),其為在基因組中的單一核苷酸位置上的多態性(在特定位置上的核苷酸在個體或群體之間可變)。在等位基因與性狀連鎖且在等位基因的存在為性狀或性狀形式會在包含該等位基因的個體中出現的指示物時,該等位基因與該性狀"正,,相關。在等位基因與性狀連鎖且在等位基因的存在為性狀或性狀形式不會在包含該等位基因的個體中出現的指示物時,該等位基因與該性狀"負"相關。在標誌物多態性或等位基因可以在統計學上(正的或負的)與特定表型關聯時,該標誌物多態性或等位基因與該表型(乳腺癌易感性等)"關聯"或"相關"。即特定多態性與對照群體(例如,不具有乳腺癌的個體)相比更常見於病例群體(例如,乳腺癌患者)。通常將這種相關性推斷為實際上是致病原因,聯/相關性出現。"有利的等位基因"為與期望表型,例如乳腺癌抗性正相關的特定基因座上的等位基因,例如,與乳腺癌惡病質負相關的等位基因。連鎖標誌物的有利等位基因為與有利等位基因分離的標誌物等位基因。染色體區段的有利等位基因形式為如下染色體區段,它包括與不利表型正相關或與物理上位於染色體區段上的一個或多個遺傳基因座上的不利表型負相關的核苷酸序列。"不利的等位基因"為與期望表型負相關或與不利表型正相關,例如與乳腺癌易感性正相關的特定基因座上的等位基因。連鎖標誌物的不利等位基因為與不利等位基因分離的標誌物等位基因。染色體區段的不利等位基因形式為如下染色體片段,它包括與期望表型負相關或與物理上位於該染色體區段上的一個或多個遺傳基因座上的不利表型正相關的核苷酸序列。"等位基因頻率"意指等位基因存在於個體、品系或品系群體內基因座上的頻率(比例或百分比)。例如,就等位基因"A"而言,基因型"AA"、"Aa"或"aa"的二倍體個體具有的等位基因頻率分別為l.O、0.5或0.0。可以估計品系或群體(例如病例或對照)內的等位基因頻率,通過取來自該品系或群體的個體樣品的等位基因頻率的平均值來進行。類似地,可以通過取構成所述群體的品系的等位基因頻率的平均值來計算等位基因頻率。若個體在指定基因座上僅具有一種類型的等位基因(例如,二倍體個體在兩條同源染色體各自的基因座上具有相同的等位基因拷貝),則該個體為"純合"的。若一種以上的等位基因類型存在於指定基因座上(例如,具有兩種不同等位基因各自的一種拷貝的二倍體個體),則該個體為"雜合"的。術語"同質性"表示組中的成員在一個或多個特定基因座上具有相同基因型。相反,術語"異質性"用於表示組中的個體在一個或多個特定基因座上的基因型不同。"基因座"為染色體位置或區域。例如,多態基因座為多態核酸、性狀決定子、基因或標誌物定位的位置或區域。在另一個實例中,"基因的基因座"為可以發現特定基因的物種基因組中的特定染色體位置(區域)。類似地,術語"數量性狀基因座"或"QTL"意指具有至少兩種等位基因的基因座,所述的兩種等位基因在至少一種遺傳背景中例如在至少一種群體或子代中有差別地影響數量或連續表型性狀的表達或改變數量或連續表型性狀的變化形式。"標誌物","分子標誌物"或"標誌物核酸"意指在鑑定基因座或連鎖基因座時用作參比點的核苷酸序列或其編碼的產物(例如蛋白質)。標誌物可以衍生自基因組核苷酸序列或表達的核香酸序列(例如,衍生自RNA、nRNA、mRNA、cDNA等)或編碼的多肽。該術語還意指與標誌物序列互補或位於其側翼的核酸序列,諸如用作能夠擴增該標誌物序列的探針或引物對的核酸。"標誌物探針"為可以用於鑑定標誌物基因座的存在的核酸序列或分子,例如與標誌物基因座序列互補的核酸探針。若例如核酸按照沃森-克裡克鹼基配對原則在溶液中特異性雜交,則該核酸為"互補的"。"標誌物基因座"為可以用於示蹤第二種連鎖基因座的存在的基因座,例如,編碼或促成表型性狀的群體變異的連鎖或相關基因座。例如,標誌物基因座可以用於監測在基因座,諸如QTL上的等位基因的分離,這些等位基因在遺傳或物理上與標誌物基因座連鎖。因此,"標誌物等位基因",或者"標誌物基因座的等位基因",為在對該標誌物基因座而言多態性的群體中的標誌物基因座上發現的多個多態性核苷酸序列之一。本發明在一個方面中提供了與所關注的表型,例如乳腺癌易感性/抗性相關的標誌物基因座。預計鑑定的標誌物各自與促成相關表型的遺傳元件,例如QTL具有緊密的物理和遺傳鄰近性(導致物理和/或遺傳連鎖)。可以通過本領域完全確立的方法4企測群體成員之間對應於遺傳多態性的標誌物。這些方法包括,例如,基於PCR的序列特異性擴增法、檢測限制性片段長度多態性(RFLP)、檢測同工酶標誌物、檢測等位基因特異性雜交(ASH)、檢測單核苷酸延伸、檢測基因組的擴增可變序列、檢測自維持序列複製、檢測單一序列重複(SSR)、檢測單核苷酸多態性(SNP)或檢測擴增片段長度多態性(AFLP)。"遺傳圖"一般以圖或表形式描述指定物種中一條或多條染色體(或連鎖群)上的基因座中的遺傳連鎖(或關聯)相關性。"作圖"為通過使用遺傳標誌物、標誌物的群體分離和重組頻率的標準遺傳原理定義基因座連鎖相關性的過程。"圖定位"為遺傳圖上相對於連鎖遺傳標誌物的指定位置,其中可以在指定物種中發現特定標誌物。術語"染色體區段"指居留在單一染色體上的基因組DNA的連續的線性跨度。類似地,"單倍型"為在個體或群體的可遺傳物質中發現的一組遺傳基因座(該組可以為連續的或不連續的)。在本發明的上下文中,遺傳元件諸如本文的一種或多種等位基因和一種或多種連鎖標誌物等位基因可以位於染色體區段內,且因而是遺傳連鎖的,特定遺傳重組距離小於或等於20釐摩(cM)或20cM以下,例如15cM或15cM以下,通常為10cM或10cM以下,例如,約9、8、7、6、5、4、3、2、1、0.75、0.5、0.25或0.1CM或以下。即單一染色體區段內兩種緊密連鎖的遺傳元件在減數分裂過程中以小於或等於約20%、例如約19%、18%、17%、16%、15%、14%、13%、12%、11%、10%、9%、8%、7%、6%、5%、4%、3%、2%、1%、0.75%、0.5%、0.25%或0.1%或以下的頻率彼此重組。一旦例如通過比較病例和對照的基因座統計頻率鑑定出表型(例如,乳腺癌惡病質)與多態基因座之間的相關性/關聯性,則與相關基因座連鎖的任何多態性可以用作相關基因座的替代標誌物。"遺傳重組頻率"為兩個遺傳基因座之間重組事件的頻率。可以通過跟蹤減數分裂過程中標誌物和/或性狀的分離來觀察重組頻率。在本發明的上下文衡(linkagedis叫uilibrium)時,則該標誌物基因座與另一標誌物基因座或某些其它基因座(例如,乳腺癌易感性基因座)"有關聯"。這一情況在發現標誌物基因座和連鎖基因座一起在子代中比基因座隨機分離更頻繁時發生。類似地,標誌物基因座還可以與性狀相關,例如,若標誌物基因座與性狀連鎖不平衡中(例如,當發現標誌物在病例中比在對照群體中更常見時,可以檢測到這一結果),則可以說標誌物基因座與指定性狀(乳腺癌抗性或易感性)"相關"。術語"連鎖不平衡"意指遺傳基因座或性狀(或它們兩者)的非隨機分離。在每一情況中,連鎖不平衡意指相關基因座位於沿染色體長度的足夠物理接近內,使得它們以大於隨機的頻率彼此分離(就共分離性狀而言,性狀潛在的基因座彼此有足夠的接近性)。連鎖基因座共分離50%以上的機會,例如,約51%_約100%的機會。有利的是,兩個基因座彼此緊密鄰近定位,使得同源染色體對之間的重組以高頻率在減數分裂過程中在兩個基因座之間不發生,例如,使得緊密連鎖的基因座共分離至少約80°/。的機會,更優選至少約85%的機會,更優選至少90%的機會,例如,91%,92%,93%,94°/。,95%,96%,97%,98%,99%,99.5%,99.75%或99.90%或以上的機會。本申請中的術語"緊密連鎖"意指兩個連鎖的基因座(例如,SNP,諸如圖l或2中鑑定的(例如,通過比較病例和對照群體得出與乳腺癌表型相關)和第二種連鎖多態性)之間重組以等於或小於約20%的頻率發生。換言之,緊密(或"緊固")連鎖的基因座共分離至少80°/。的機會。標誌物基因座在它們與耙基因座(例如,乳腺癌的QTL,或單純的其它乳腺癌標誌物基因座)緊密連鎖時對本發明尤其有用。標誌物與靶基因座連鎖得越緊密,則該標誌物為靶基因座指示物越好。因此,在一個實施方案中,緊密連鎖的基因座,諸如標誌物基因座和第二種基因座展示出約20%或以下,例如,15%或以下,例如,10%或以下,優選約9%或以下,更優選約8%或以下,更優選約7Q/o或以下,更優選約6%或以下,更優選約5%或以下,更優選約4%或以下,更優選約3°/0或以下且更優選約2%或以下的基因座間重組頻率。在高度優選的實施方案中,相關基因座(例如,標誌物基因座和耙基因座,諸如QTL)展示出約l。/。或以下,例如,約0.75%或以下,更優選約0.5%或以下、或更優選約0.25%或以下、或更優選約0.1%或以下的重組頻率。還認為對於位於同一染色體上的兩個基因座並且在兩個基因座之間以小於約20%,例如15%,更優選10%(例如,約9%,8%,7%,6%,5%,4%,3%,2%,1%,0.75%,0.5%,0.250/o,0.10/0或以下)的頻率發生重組的這類距離上,兩個基因座為彼此"鄰近的"。當提到兩個連鎖遺傳元件,諸如促成性狀的遺傳元件和鄰近標誌物的相關性時,"偶聯"相連鎖表示位於性狀基因座上的"有利"等位基因以物理方式結合在與相應連鎖標誌物基因座的"有利"等位基因相同的染色體鏈上的狀態。在偶聯相中,兩種有利的等位基因一起通過遺傳該染色體鏈的子代遺傳。在"排斥"相連鎖中,在所關注的基因座(例如,乳腺癌易感性的QTL)上的"有利"等位基因以物理方式結合在與鄰近標誌物基因座上"不利"等位基因相同的染色體鏈上,並且兩個"有利"的等位基因不一起遺傳(即兩個基因座彼此"異相")。在有關核酸擴增的上下文中術語"擴增"為產生所選核酸(或其轉錄形式)的額外拷貝的任何過程。典型的擴增方法包括基於各種聚合酶的複製方法,包括聚合酶鏈反應(PCR)、連接酶介導的方法諸如連接酶鏈反應(LCR)和基於RNA聚合酶的擴增(例如,通過轉錄)法。"擴增子"為擴增得到的核酸,例如通過用任何可利用的擴增方法(例如,PCR、LCR、轉錄等)擴增模板核酸產生的核酸。"基因組核酸"為序列上對應於細胞中可遺傳核酸的核酸。常見的實例包括核基因組DNA及其擴增子。在某些情況中,基因組核酸不同於剪接RNA或相應cDNA,即剪接的RNA或cDNA例如被剪接機制加工以除去內含子。基因組核酸任選包含不轉錄(例如,染色體結構序列、啟動子區、增強子區等)和/或不翻譯的序列(例如內含子),而剪接的RNA/cDNA—般不具有內含子。"模板基因組核酸"為用作擴增反應(例如,基於聚合酶的擴增反應,諸如PCR;連接酶介導的擴增反應,諸如LCR;轉錄反應等)中的模板的基因組核酸。"外源性核酸"為對特定系統(例如,種質、細胞、個體等)而言在序列、基因組位置或它們兩者方面非天然的核酸。本文作為應用於多核香酸或多肽所用的術語"外源性"或"異源性"一般意指以人工方式提供給生物系統(例如,細胞、個體等)並且對特定生物學系統而言為非天然的分子。該術語可以表示該相關物資源自非天然存在來源的來源,或可以指具有部分非天然構造、遺傳位置或排列的分子。術語"導入"在指將異源性或外源性核酸轉移入細胞時意指使用任何方法將核酸摻入細胞。該術語涵蓋諸如"轉染"、"轉化"和"轉導"這類核酸導入方法。本文所用的術語"載體"用於指將核酸區段轉入細胞的多核苷酸或其它分子。術語"媒介(vehicle)"有時與"載體(vector)"可以互換使用。載體任選包含介導載體維持並且能夠實現指定應用的部分(例如,複製必需序列、傳遞藥物或抗生素抗性的基因、多克隆位點、能夠表達所克隆基因的可操作連接的啟動子/增強子元件等)。載體通常衍生自質粒、噬菌體、或植物或動物病毒。"克隆載體"或"穿梭載體"或"亞克隆載體"包含有利於亞克隆步驟的可操作連接的部分(例如,包含多個限制性內切核酸酶位點的多克隆位點)。本文所用的術語"表達載體"意指包含有利於特定宿主生物體中編碼序列表達的可操作連接的多核苷酸序列(例如,細菌表達載體或哺乳動物細胞表達載體)。有利於原核細胞中表達的多核苷酸序列一般包括,例如,啟動子、操縱基因(任選)和核糖體結合位點,通常還有其它序列。真核細胞可以使用啟動子、增強子、終止和聚腺苷酸化信號、和一般不同於原核細胞所用的其它序列。在一個任選的實施方案中,將對應於本文基因座的基因克隆入表達載體並且表達,其中將基因產物用於本文的方法和系統以便進行調控劑鑑定。若特定的核酸是使用指定的核酸序列構建的,或者特定的核酸是使用指定的核酸構建的,則該特定的核酸"衍生自"該指定的核酸。"基因"為基因組中一起編碼一種或多種表達分子,例如RNA或多肽的一種或多種核苷^列。基因可以包括轉錄成RNA、隨後可翻譯成多肽序列的編碼序列,並且可以包括有助於基因複製或表達的相關結構序列或調控序列。本發明中所關注的基因包括包含圖l和/或2的基因座或與之緊密連鎖的那些。"基因型"為一個或多個遺傳基因座上單個(單個成組)的遺傳組成。基因型由個體的一個或多個已知基因座的等位基因確定,一般為從其親代遺傳的等位基因的彙編。"單倍型"為個體在單一DNA鏈上的多個遺傳基因座的基因型。一般而言,由單倍型描述的遺傳基因座在物理和遺傳上連鎖,即在相同染色體鏈上。標誌物或探針"組"意指標誌物或探針的集合或組,或其衍生的數據,它們用於常用目的,例如鑑定具有特定表型(例如,乳腺癌抗性或易感性)的個儘管一組中的成員各自具有在特定目的方面的應用,但是選自該組和亞組(其包括某些,但並非所有的標誌物)的各個標誌物也有效地實現特定目的。"查閱表"為使一種數據形式與另一種數據形式或使一種或多種數據形式與該數據相關的預測結果建立相關性的表。例如,查閱表可以包括等位基因數據與包含一種或多種指定等位基因的個體有可能展示出的預測性狀之間的相關性。這些表可以並且一般為多維的,例如同時考慮多個等位基因,並且還任選考慮其它因素,諸如遺傳背景,例如在進行性狀預測時。"計算機可讀介質"為可通過使用可利用或定製界面的計算機讀取的信息儲存介質。實例包括內存(例如ROM或RAM、快閃記憶體等)、光存儲介質(例如,CD-ROM)、磁存儲介質(計算機硬驅、軟盤等)、穿孔卡片和可商購的許多其它介質。信息可以在所關注的系統與計算機之間傳輸,傳輸出入計算機或出入計算機可讀介質以儲存或讀取所存儲的信息。這種傳輸可以為電子傳輸,或可以通過其它可利用的方法,諸如IR連結、無線連接等進行。"系統指令"為可以由系統部分或完全執行的指令集。一般而言,該指令集作為系統軟體存在。"翻譯產物"為作為核酸翻譯結果產生的產物(一般為多肽)。"轉錄產物"為作為核酸(例如,DNA)轉錄結果產生的產物(例如,RNA,任選包括mRNA,或例如催化性或生物學活性RNA)。"陣列"為元件集合。該集合可以為空間排序的("樣式陣列")或混亂的("隨機樣式"陣列)。陣列可以形成或包含一種或多種功能性元件(例如,微陣列上的探針區)或它可以為非功能性的。本文所用的術語"SNP"或"單核苦酸多態性"意指個體之間的遺傳變異;例如,可變的生物體DNA中的單一含氮鹼基位置。本文所用的"SNPs"為SNP的複數。當然,當意指本文的DNA時,這類參比物可以包括DNA的衍生物,諸如擴增子、其RNA轉錄物等。發明詳述綜述本發明包括圖l和2的多態性(和包括多態性或與之鄰近的基因)與乳腺癌惡病質之間的新相關性。在這些基因或基因產物中及與之連鎖的某些等位基因可預測具有相關等位基因的個體發生乳腺癌的可能性。因此,通過任何可利用的方法檢測這些等位基因可以用於診斷目的,諸如對乳腺癌易感性的早期診斷、具有乳腺癌的患者的預後和有助於診斷,例如,當目前的標準不足以確定i貪斷時。圖1或2的多態性、基因或基因產物與乳腺癌表型相關的鑑定還提供了用於篩選乳腺癌病症的潛在調控劑的平臺。預計對應於圖l和2的多態性的任何基因或編碼蛋白質的活性的調控劑對乳腺癌有作用。因此,篩選方法、篩選系統等為本發明的特徵。通過這些篩選手段鑑定的調控劑也為本發明的特徵。例如包括鑑定相關等位基因的探針、包裝材料和使相關等位基因的檢測與乳腺癌建立相關性的說明書的乳腺癌診斷和治療試劑盒也為本發明的特徵。這些試劑盒還可以包括乳腺癌調控劑和/或關於使用常規方法治療患者的說明書。鑑定乳腺癌惡病質的方法正如所述的,本發明提供了圖1和2的某些基因或其它基因座與乳腺癌表型連鎖的發現。因此,通過^r測與相關表型正或負相關的標誌物(例如,圖l或2中的SNP與之緊密連鎖的基因座),可以確定個體或群體是否可能包含這些表型。這為鑑定處於乳腺癌風險中的患者提供了增強的早期檢測選擇,從而在某些情況中有可能例如通過採取早期預防行動(例如,任何現有的療法,包括預防性手術、膳食、鍛鍊、可利用的藥物等)預防癌症的實際發生。此外,各種本文標誌物的應用還為現存的鑑定患者是否患有特定形式乳腺癌的診斷技術增加了確定性。此外,是否存在該病的分子&出的知識也可有助於例如通過提供患者對乳腺癌常規療法有響應的可能性如何的指徵來確定患用於^r測相關等位基因的^r測方法可以包括任何可利用的方法,例如,擴增技術。例如,檢測可以包括擴增多態性或與之相關的序列並且檢測所得擴增子。例如,該方法可以包括混合擴增引物或擴增引物對與分離自生物體或生物學樣品(例如包含SNP或其它多態性)的核酸模板,其中所述的引物或引物對與基因或緊密連鎖的多態性的至少一部分或與之鄰近的序列互補或部分互補。引物一般能夠啟動聚合酶在核酸模板上的核酸聚合。所述的引物或引物對例如在包含聚合酶和模板核酸的DNA聚合反應(PCR、RT-PCR等)中延伸而生成擴增子。通過可利用的檢測方法,例如測序、使擴增子與陣列雜交(或使擴增子附著在陣列上並且使探針與之雜交)、用限制酶消化擴增子(例如,RFLP)、實時PCR分析、單核苷酸延伸、等位基因特異性雜交等來檢測擴增子。可以通過可鑑定等位基因與表型之間相關性的任何方法形成所檢測的多態性與性狀之間的相關性。最一般的情況是,這些方法包括參照包含多態性的等位基因與表型之間相關性的查閱表。該表可以包括多種等位基因-表型相關性的數據並且可以考慮到多種等位基因-表型相關性的疊加或其它高級作用,例如,通過使用統計學工具,諸如主要成分分析、啟發式算法等。在這些方法的內容中,下列討論首先集中在標誌物與等位基因如何連鎖和該現象如何應用於鑑定乳腺癌表型的方法的內容中,然後集中在標誌物檢測方法。下面的別的部分討論了數據分析。標誌物、連鎖和等位基因在傳統的連鎖(或關聯)分析中,無需染色體上基因的物理相關性的直接知識。孟德爾第一法則為成對特徵的因素是分離的,意味著二倍體性狀的等位基因分離成兩個配子且然後分離成不同的子代。經典的連鎖分析可以視為對不同性狀的共分離的相對頻率的統計學描述。連鎖分析為性狀如何基於它們一起分離的頻率一起分組的充分表徵的描述框架。即,如果兩個非等位基因的性狀以高於隨機的頻率一起遺傳,那麼就說它們是"連鎖的"。性狀一起遺傳的頻率為性狀如何緊密連鎖的主要度量,即以較高頻率一起遺傳的性狀比以較〗氐(但仍然高於隨機)頻率一起遺傳的性狀更緊密連鎖。性狀連鎖是因為性狀潛在的基因彼此接近地位於同一染色體上。基因所在的染色體上的間隔越大,則它們一起分離的可能性越低,因為同源染色體在減數分裂過程中重組。因此,基因所在的染色體上的間隔越大,則在減數分裂過程中有重組事件的可能性越大,所述的重組會導致兩種基因彼此分離而進入子代。連鎖(或關聯)的常見度量為性狀共分離的頻率。可以將此表述為共分離百分比(重組頻率),或同樣常用的以釐摩(cM)表示,它們實際上為重組頻率的倒數單位。cM以開拓性遺傳學家ThomasHuntMorgan命名並且為遺傳重組頻率的度量單位。l個cM等於因單代(singlegeneration)中的重組,一個遺傳基因座上的性狀與另一基因座上的性狀分離的機會為1%(這意味著這些性狀99。/o的機會一起分離)。因為染色體距離與性狀間重組事件頻率大致成正比,所以存在與重組頻率相關的近似物理距離。例如,在人體中,lcM平均與約1百萬個鹼基對(lMbp)相關。標誌物基因座自身為性狀並且可以按照標準連鎖分析,通過在分離過程中示蹤標誌物基因座來評價。因此,在本發明的上下文中,lcM等於因單代中的重組,標誌物基因座與另一基因座(可以為任何其它性狀,例如另一種標誌物基因座,或編碼乳腺癌QTL的另一種性狀基因座)分離的機會為l。/t)。本文的標誌物,例如,圖1和2中所列的那些,可以與乳腺癌相關。這意味著所述的標誌物包含乳腺癌的QTL或與之足夠鄰近,即它們自身可以用作性狀的預測物。這在疾病診斷方面極為有用。已經在病例(乳腺癌患者)與對照群體中將圖1和2的多態性鑑定為更普遍的。與所關注的性狀基因座連鎖的任何標誌物(例如,在目前情況中為乳腺癌的QTL或鑑定的連鎖標誌物基因座,例如,如在圖1和2中)可以用作該性狀的標誌物。因此,在圖1和2中注意到的外,與這些圖中詳細列舉的標誌物緊密連鎖的其它標誌物也可以有用地預測圖中所示的標誌物等位基因(和由此的相關表型性狀)的存在。在它們足夠鄰近指定基因座,使得它們展示出與指定基因座的低重組頻率時,這類連鎖的標誌物特別有用,。在本發明中,這類緊密連鎖的標誌物為本發明的特徵。緊密連鎖的基因座展示出與指定標誌物的重組頻率為約20。/。或以下(指定基因在指定標誌物的20cM內)。換言之,緊密連鎖的基因座至少80%的機會共分離。更優選重組頻率為10%或以下,例如,9%,8%,7%,6%,5%,4%,3%,2%,1%,0.5%,0.25%或0.1%或以下。在一種典型類型的實施方案中,緊密連鎖的基因座彼此在5cM或以下內。正如本領域技術人員認識到的,重組頻率(和作為結果的圖位置)可以根據所用圖(和圖上的標誌物)而改變。與圖1和2中鑑定的標誌物緊密連鎖的(例如,在約20cM內,更優選在約10cM內,更優選在5cM內)別的標誌物易於用於鑑定乳腺癌惡病質的QTL。在標誌物基因座與靶基因座(例如,乳腺癌表型的QTL,或可選擇地,自身與這類QTL連鎖的其它標誌物基因座)(所述標誌物基因座作為所述靶基因的標誌物)緊密連鎖時,該標誌物基因座尤其可用於本發明。標誌物與編碼或影響表型性狀的靶基因座連鎖得越緊密,則該標誌物作為靶基因座的指示物越好(因靶基因座與標誌物之間的交叉(cross-over)頻率下降)。因此,在一個實施方案中,緊密連鎖的基因座諸如標誌物基因座和第二種基因座(例如圖l和2的指定標誌物基因座和別的第二種基因座)展示出約20%或以下,例如15°/。或以下,優選10%或以下,更優選約9%或以下,更優選約8%或以下,更優選約7%或以下,更優選約6%或以下,更優選約5%或以下,更優選約4%非常優選的實施方案中,相關基因座(例如,標誌物基因座和靶基因座諸如QTL)展示出約lQ/。或以下,例如約0.75%或以下,更優選約0.5%或以下,或更優選約0.25%或0.1%或以下的重組頻率。因此,基因座相距約20cM,19cM,18cM,17cM,16cM,15cM,14cM,13cM,12cM,11cM,10cM,9cM,8cM,7cM,6cM,5cM,4cM,3cM,2cM,lcM,0.75cM,0.5cM,0.25cM,O或O.lcM以下。換言之,認為位於相同染色體上並且在兩個基因座之間的重組以4氐於20%(例如,約19%,18%,17%,16%,15%,14%,13%,12%,11%,10%,9%,8%,7%,6%,5%,4%,3%,2%,1%,0.75%,0.5%,0.25%,0.1%或以下)的頻率出現的這類距離上的兩個基因座彼此"鄰近"。在一個方面中,連鎖標誌物彼此在100kb內(在人體中對應於約0.1cM,這取決於局部重組率),例如,50kb,乃至20kb或以下。當涉及兩種遺傳元件,諸如促成乳腺癌的遺傳元件與鄰近標誌物之間的相關性時,"偶聯"相連鎖表示位於基因座上的"有利"等位基因以物理方式結合在與相應的連鎖標誌物基因座的"有利"等位基因相同的染色體鏈上的狀態。在偶聯相中,兩種有利的等位基因一起通過遺傳該染色體鏈的子代遺傳。在"排斥"相連鎖中,在所關注的基因座(例如,乳腺癌的QTL)上的"有利"等位基因以物理方式與位於鄰近標誌物基因座上的"不利"等位基因連鎖,並且兩個"有利"的等位基因不一起遺傳(即兩個基因座彼此"異相")。在示蹤基因組和相應表達的核酸和多肽中的SNP和其它多態性外,個體或群體之間的mRNA或蛋白質形式的圖1和2基因產物的表達水平差異也與乳腺癌相關。因此,本發明的標誌物可以包括如下的任意種,例如基因組基因座、轉錄的核酸、剪接的核酸、表達的蛋白質、轉錄的核酸的水平、剪接的核酸的水平和表達的蛋白質的水平。標誌物擴增策略用於擴增標誌物(例如,標誌物基因座)的擴增引物和用於檢測這類標誌物或對樣品在多種標誌物等位基因方面進行基因分型合適探針為本發明的特徵。在圖1和2中,提供了用於擴增的特定基因座及這類引物設計中已知的側翼序列。例如,用於遠程PCR的引物選擇描述在2002年1月9日提交的USSN10/042,406和2002年9月5日提交的USSN10/236,480中;就近程PCR而言,2003年l月14日提交的USSN10/341,832中提供了有關引物選擇的指導原則。此外,存在公眾可用於進行引物設計的程序,諸如"01igo"。使用這類可利用的引物選擇和設計軟體、圖l和2中提供的公眾可利用的人類基因組序列和多態性位置,本領域技術人員可以構建引物以便擴增本發明的SNP。此外,可以理解用於檢測包含SNP的核酸(例如,包含SNP的擴增子)的精確探針可以改變,例如,可以鑑定所檢測的標誌物擴增子區的任何揭:針可以與本發明結合使用。此外,檢測探針的構造當然可以改變。因此,本發明並不限於本文所述的序列。實際上,可以理解擴增並非標誌物檢測所要求的-例如,可以單純通過對基因組DNA樣品進行Southern印跡來直接檢測未擴增的基因組DNA。用於進行Southern印跡、標準擴增(PCR、LCR等)和許多其它核酸檢測方法的規程為充分確立的並且例如教導在下列文獻中Sambrook等,MolecularCloning-ALaboratoryManual(3rdEd.),Vol.1-3,ColdSpringHarborLaboratory,ColdSpringHarbor,NewYork,2000("Sambrook");CurrentProtocolsinMolecularBiology,RMAusubel等,eds.,CurrentProtocols,GreenePublishingAssociates,Inc.和JohnWiley&Sons,Inc.的合作項目,(增補至2002)rAusubel"))和PCRProtocolsAGuidetoMethodsandApplications(Innis等eds)AcademicPressInc.SanDiego,CA(1990)(Innis).在擴增/檢測方法中,例如,還可以通過進行檢測產物形成的實時擴增反應來省略單獨的檢測探針,其中在摻入產物時修飾相關擴增引物,將標記的核苷酸摻入擴增子,或監測與未擴增的前體相比擴增子的分子旋轉特性的改變(例如,通過螢光偏振)。一般而言,通過本領域中任何可利用的確立的方法檢測分子標誌物,包括,但不限於等位基因特異性雜交(ASH)、檢測單核苦酸延伸、陣列雜交(任選包括ASH)或其它檢測單核苷酸多態性(SNP)的方法、擴增片段長度多態性(AFLP)檢測、擴增可變序列檢測、隨機擴增多態性DNA(RAPD)檢測、限制性片段長度多態性(RFLP)檢測、自維持序列複製檢測、單一序列重複(SSR)檢測、單鏈構象多態性(SSCP)檢測、同工酶標誌物檢測、Northem分析(其中將表達水平用作標誌物)、mRNA或cDNA的定量擴增等。儘管圖中提供的例示性標誌物為SNP標誌物,但是上述任何標誌物類型均可以用於本發明的上下文中,以便鑑定與乳腺癌表型相關的連鎖基因座。用於標誌物檢測的例示技術本發明提供了包含乳腺癌表型的QTL或與之連鎖的分子標誌物。這些標誌物應用於疾病惡病質診斷、預後、治療等。並非意圖將本發明限於用於檢測這些標誌物的任何特定方法。可以通過大量本領域中充分確立的方法來4企測對應於群體成員之間的遺傳多態性的標誌物(例如,基於PCR的序列特異性擴增、限制性片段長度多態性(RFLP)、同工酶標誌物、Northern分析、等位基因特異性雜交(ASH)、基於陣列的雜交、擴增可變基因組序列、自維持序列複製、單一序列重複(SSR)、單核苷酸多態性(SNP)、隨機擴增的多態性DNA("RAPD")或擴增片段長度多態性(AFLP))。在另一個實施方案中,單純通過測定多態性標誌物區的核苷酸序列來確定分子標誌物的存在與否。任何這些方法均易於適合於高通量分析。用於;^測遺傳標誌物的某些技術利用探針核酸與對應於遺傳標誌物的核酸(例如,使用基因組DNA作為模板產生的擴增的核酸)的雜交。雜交方式,包括,但不限於溶液相、固相、混合相或原位雜交測定法,可用於等位基因4企測。應用於核酸雜交的廣泛指導原則見Tijssen(1993)LaboratoryTechniquesinBiochemistryandMolecularBiology-HybridizationwithNucleicAcidProbesElsevier,NewYork以及Sambrook,Berger和Ausubel。例如,包含限制性片段長度多態性(RFLP)的標誌物例如通過使一般為待檢測核酸的亞片段(或對應於亞片段的寡核苷酸)的探針與限制性消化基因組DNA雜交來檢測。選擇限制酶以便提供在不同個體或群體中有至少兩種可選擇的(或多態性)長度的限制片段。確定對標誌物各等位基因產生有用片段的一種或多種限制酶為本領域眾所周知的簡便規程。在根據長度在適當基質(例如,瓊脂糖或聚丙蜂醯胺)中分離並且轉至膜(例如,硝化纖維素、尼龍等)後,在導致探針與靶物平衡結合的條件下雜交標記的探針,隨後通過洗滌除去過量的探針。可以克隆和/或合成用於標誌物基因座的核酸探針。任何合適的標記物均可以與本發明的探針聯用。適用於核酸探針的可檢測標記物包括,例如,可通過分光光度法、放射性同位素、光化學、生物化學、免疫化學、電、光學或化學方式檢測的任何組合物。有用的標記物包括使用標記的鏈黴親合素綴合物染色的生物素、石茲珠、螢光染料、》丈射性標記物、酶、和比色標記物。其它標記物包括結合用萸光團、化學發光劑和酶標記的抗體的配體。探針還可以構成用於產生放射性標記的擴增子的放射性標記的PCR引物。用於標記核酸的標記策略和相應的檢測策略可以見例如Haugland(2003)HandbookofFluorescentProbesandResearchChemicalsNinthEdition,MolecularProbes,Inc.(EugeneOR)。有關標誌物;險測策略的其它細節可以在下文中找到。基於擴增的檢測方法PCR、RT-PCR和LCR特別廣泛地用作擴增所關注的核酸(例如,包含標誌物基因座的那些)的擴增和擴增-檢測方法,從而有利於檢測所關注的核酸。有關這些和其它擴增方法的詳細描述可以在任何多種標準教科書中找到,包括,例如,Sambrook,Ausubel和Berger。許多可利用的生物學教科書還擴展了有關PCR和相關擴增方法的討論。本領域技術人員可以理解基本上可以將任何RNA轉化成適合於限制性消化、PCim伸、和使用逆轉錄酶和聚合酶測序("逆轉錄-PCR或"RT-PCR")的雙鏈DNA。另外參見上述的Ausubel,Sambrook和Berger。這些方法還可以用於定量擴增mRNA或相應的cDNA,從而提供個體中對應於基因產物的mRNA表達水平的指示,所述的基因產物對應於圖1和2的基因或基因產物。個體、家族、品系和/或群體之間的這些基因的表達水平差異可以用作乳腺癌表型的標誌物。實時擴增/4企測方法在一個方面中,例如,使用分子信標或TaqManTM^:針對本文所述的擴增混合物進行實時PCR或LCR。分子信標(MB)為在適當雜交條件下自雜交而形成莖環結構的寡核苷酸或PNA。MB在寡核苷酸或PNA末端上具有標記物和猝滅劑;由此在允許分子內雜交的條件下,標記物一般被猝滅劑猝滅(或至少在其螢光方面發生改變)。在MB未展示出分子內雜交的條件下(例如在擴增過程中當結合靶核酸,例如擴增子區時),MB標記物未猝滅。有關製備和使用MB的標準方法的詳細描述在文獻中充分確立,並且MB可購自許多商品i式劑來源。另夕卜,參見例3。,Leone等(1995)"MolecularbeaconprobescombinedwithamplificationbyNASBAenablehomogenousreal-timedetectionofRNA."NucleicAcidsRes.26:2150-2155;Tyagi和Kramer(1996)"Molecularbeacons:probesthatfluoresceuponhybridization"NatureBiotechnology14:303-308;Blok和Kramer(1997)"Amplifiablehybridizationprobescontainingamolecularswitch"MolCellProbes11:187-194;Hsuih等(1997)"Novel,ligation-dependentPCRassayfordetectionofhepatitisCinserum"JClinMicrobiol34:501-507;Kostrikis等(1998)"Molecularbeacons:spectralgenotypingofhumanalleles"Science279:1228-1229;Sokol等(1998)"RealtimedetectionofDNA:RNAhybridizationinlivingcells"Proc.Natl.Acad.Sd.U.S.A.95:11538-11543;Tyagi等(1998)"Multicolormolecularbeaconsforallelediscrimination"NatureBiotechnology16:49-53;Bonnet等(1999)"ThermodynamicbasisofthechemicalspecificityofstructuredDNAprobes"Proc.Natl.Acad.Sd.U.S.A.96:6171-6176;Fang等(1999)"Designinganovelmolecularbeaconforsurface-immobilizedDNAhybridizationstudies"J.Am.Chem.Soc.121:2921-2922;Marras等(1999)"Multiplexdetectionofsingle-nucleotidevariationusingmolecularbeacons"Genet.Anal.Biomol.Eng.14:151-156;和Vet等(1999)"Multiplexdetectionoffourpathogenicretrovirusesusingmolecularbeacons"Proc.Natl.Acad.Sci.U.S.A.96:6394-6399。有關MB構建和應用的額外詳細描述可以在專利文獻中找到,例如,Tyagi等的USP5,925,517(1999年7月20日),標題為"Detectablylabeleddualconformationoligonucleotideprobes,assaysandkits";Tyagi等的USP6,150,097(2000年11月21日),標題為"Nucleicaciddetectionprobeshavingnon國FRETfluorescencequenchingandkitsandassaysincludingsuchprobes"和Tyagi等的USP6,037,130(2000年3月14日),標題為"Wavelength-shiftingprobesandprimersandtheiruseinassaysandkits"。還可以按照本發明使用通常稱作"TaqManTM"探針的雙重標記的焚光寡脫氧核普酸探針進行PCR檢測和定量。這些探針由使用兩種不同焚光染料標記的短(例如,20-25個鹼基)寡核苷酸組成。在每個探針的5'端上為報導染料,並且在每個探針的3'端上發現幹滅染料。寡核苷酸探針序列與存在於PCR擴增子中的內部耙序列互補。當該探針完整時,在兩個螢光團之間發生能量轉移並且由猝滅劑通過FRET猝滅來自報導分子的發射。在PCR的延伸期過程中,探針因用於反應的聚合酶的5'核酸酶活性而裂解,由此從寡核苷酸-猝滅劑中釋放報導分子並且產生報導分子發射強度的增加。因此,TaqManTM探針為具有標記物和猝滅劑的寡核苷酸,其中標記物在擴增過程中通過擴增所用聚合物的外切核酸酶作用而釋放。這在合成過程中提供了對擴增的實時測量。各種TaqManTM試劑為商購的,例如購自AppliedBiosystems(DivisionHeadquarters,FosterCity,CA)並且購自各種專業供應商,諸如BiosearchTechnologies(例如,黑洞猝滅劑探針)。有關雙重標記物探針策略的額外詳細描述可以在例如WO92/02638中找到。其它類似的方法包括,例如,4吏用例如U.S.6,174,670中所述的"LightCycler⑤"形式的兩個相鄰雜交探針之間的螢光共振能量轉移。基於陣列的標誌物檢測可以使用商購陣列,例如購自Affymetrix(SantaClara,CA)或其它製造商的陣列進行基於陣列的檢測。有關核酸陣列操作的綜述包括Sapolsky等(1999)"High-throughputpolymorphismscreeningandgenotypingwithhigh-densityoligonucleotidearrays"GeneticAnalysis:BiomolecularEngineering14:187-192;Lockhart(1998)"Mutantyeastondrugs"NatureMedicine4:1235-1236;FodorG997)"Genes,ChipsandtheHumanGenome"FASEBJournal11:A879;Fodor(1997)"MassivelyParallelGenomics."Science277:393-395;禾口Chee等(1996)"AccessingGeneticInformationwithHigh-DensityDNAArrays"Science274:610-614。基於陣列的檢測因基於陣列的檢測的固有高流通量性質而成為用於鑑定樣品中本發明標誌物的優選方法。各種探針陣列已經描述在文獻中並且可以用於本發明上下文中檢測可能與本文所述表型相關的標誌物。例如,DNA探針陣列晶片或較大的DNA探針陣列晶片(否則,可以通過打斷晶片而獲得各個體晶片)用於本發明的一個實施方案。DNA探針陣列晶片一般包含玻璃晶片,其上放置了高密度DNA探針(短DNA片段)陣列。這些晶片各自可以保持例如約6000萬個用於識別較長樣品DNA序列(例如,來自個體或群體,例如,包含所關注的標誌物)的DNA探針。用玻璃晶片上的DNA探針組識別樣品DNA通過DNA雜交進行。當DNA樣品與DNA探針陣列雜交時,樣品結合與樣品DNA序列互補的那些探針。通過評價個體樣品DNA與那些探針更穩固地雜交,有可能確定已知的核酸序列是否存在於樣品中,由此確定核酸中發現的標誌物是否存在。還可以使用這一手段通過控制雜交條件以允許區別單一核苷酸,例如,用於SNP鑑定和一種或多種SNP的樣品基因分型來進行ASH。陣列提供了一種同時(或串連)檢測多個多態性標誌物的便利性實施方案。例如,可以構建乳腺癌易感性檢測陣列,其中同時檢測任何或所有本文所述的多態性(或與之連鎖的多態性)以便指定乳腺癌易感性表型。當然,可以類似地使用任何檢測技術(PCR、LCR、實時PCR等),例如,使用多重擴增/檢測反應或單純通過運行幾個單獨的反應,例如,同時的或串連的。DNA探針陣列在獲得等位基因信息中的應用一般包括下列一般步驟設計和製備DNA探針陣列,製備樣品,使樣品DNA與陣列雜交,檢測雜交事件和數據分析以便測定序列。使用來自半導體生產的改良方法製備優選的晶片以便獲得成本效率和高質量並且可購自例如Affymetrix,Inc(SantaClam,California)。例如,可以通過光定向的化學合成方法製備#:針陣列,所述的光定向的於使用一系列光刻罩來限定晶片暴露點,隨後進行特定的化學合成步驟,所以該方法構建了高密度寡核苷酸陣列,在該陣列中每個探針位於預定的位置。可以在大玻璃晶片上同時合成多個探針陣列。這種平行方法提高了再現性並且有助於實現規^莫化經濟。一旦製成,DNA探針陣列就可以用於獲得有關所關註標志物的存在和/或表達水平的數據。可以通過標準生化方法用生物素和/或焚光報導基團標記DNA樣品。將標記的樣品與陣列一起孵育,並且使樣品的區段與陣列上的互補序列結合或雜交。可以洗滌和/或染色陣列以便產生雜交模式。然後掃描該陣列並且根據從螢光報導基團中發射的光檢測雜交模式。有關這些規程的額外詳細描述可以在下文的實施例中找到。因為已知陣列上每個探針的身份和位置,所以可以確定應用於陣列的樣品中的DNA序列的性質。當這些陣列用於基因分型實驗時,它們可以稱作基因分型陣列。如上所述,可以檢測例如圖l和/或圖2中本文所述的任何或所有多態性的基因型,例如以便指定乳腺癌惡病質表型。將待分析的核酸樣品分離,擴增且一般用生物素和/或螢光報導基團標記。然後使用流控技術站和分子雜交儀將標記的核酸樣品與陣列一起孵育。可以根據檢測方法的需要對陣列進行洗塗和/或染色或復染。在雜交、洗滌和染色後,將陣列插入檢測雜交模式的掃描儀。將雜交數據採集為發射自螢光報導基團的光,所述的螢光報導基團已經摻入現在與探針陣列結合的標記核酸。最明顯地與標記核酸匹配的探針產生強於具有錯配的那些的信號。由於已知陣列上每個探針的序列和位置,所以可以根據互補性鑑定應用於探針陣列的核酸的身份。在一個實施方案中,可以差別標記兩種DNA樣品並且使其與單組設計的基因分型陣列雜交。在這種方式中,可以從相同的物理陣列中獲得兩組數據。可以使用的標記物包括,但不限於cychrome、螢光素或生物素(隨後在雜交後用藻紅蛋白-鏈黴親合素染色)。雙色標記描述在美國專利No,6,342,355中,將該文獻完整地引入本文作為參考。可以掃描每個陣列,使得同時檢測來自兩種標記物的信號或將它們掃描兩次以便分別檢測每個信號。對測試標誌物存在的各個體用掃描儀採集所有標誌物的強度數據。測得的強度為指示存在於指定個體的樣品中特定標誌物的量的度量(存在於個體中的等位基因的表達水平和/或拷貝數,取決於是分析基因組核酸還是表達的核酸)。這可以用於確定個體在左關注的標誌物方面是純合型的還是雜合型的。處理強度數據以便提供有關各種強度的相應標誌物信息。有關擴增的可變序列、SSR、AFLP、ASH、SNP和同工酶標誌物的別的細節擴增的可變序列意指在同一物種成員之間表現出高度核酸殘基變異性的基因組的擴增序列。所有生物體均具有可變基因組序列且每種生物體(除克隆,例如克隆的細胞外)均具有不同組的可變序列。一旦鑑定,則特定可變序列的存在可以用於預測表型性狀。優選的,來自基因組的DNA用作使用位於DNA可變序列側翼的引物擴增的模板。擴增可變序列且然後測序。可選擇地,自維持序列複製可以用於鑑定遺傳標誌物。自維持序列複製意指使用靶核酸序列進行核酸擴增的方法,所述的靶核酸序列在體外基本上等溫條件下通過使用三種涉及逆轉錄病毒複製的酶活性呈指數複製(1)逆轉錄酶,(2)RNA酶H和(3)DNA-依賴性RNA聚合酶(Guatelli等(1990)ProcNatlAcadSciUSA87:1874)。通過模擬經cDNA中間體的RNA複製的逆轉錄病毒策略,該反應累積了原始靶標的cDNA和RNA拷貝。擴增片段長度多態性(AFLP)也可以用作遺傳標誌物(Vos等(1995)NuclAcidsRes23:4407)。術語"擴增片段長度多態性"意指在用限制性內切核酸酶切割之前或之後擴增的所選限制性片段。擴增步驟容許易於檢測特定限制片段。AFLP容許檢測大量的多態性標誌物並且已經用於遺傳作圖(Becker等(1995)MolGenGenet249:65;和Meksem等(1995)MolGenGenet249:74)。等位基因特異性雜交(ASH)可以用於鑑定本發明的遺傳標誌物。ASH技術基於短的單鏈寡核苷酸探針與完全互補單鏈靶核酸的穩定退火。可以用附著於探針的同位素或非同位素標記物進行;險測。就每種多態性而言,設計兩種或多種不同的ASH4笨針,它們具有相同的DNA^列,但不包括多態性核苷酸上的序列。每個探針具有與一種等位基因序列確切的同源性,使得該探針系列可以區分所有已知的可選等位基因序列。每種探針與靶DNA雜交。使用適當的探針設計'和雜交條件,探針與靶DNA之間的單鹼基錯配會防止雜交。按照這種方式,僅可選探針之一與對等位基因而言純合或均質的靶樣品雜交。對兩種等位基因而言雜合或異質的樣品與兩種可選探針均雜交。ASH標誌物用作顯性標誌物,其中根據僅有一種探針雜交或不雜交確定僅一種等位基因的存在與否。可以根據無雜交推斷可選的等位基因。ASH探針和耙分子任選為RNA或DNA;靶分子為超過與探針互補序列的任何核苷酸長度;設計所述探針以便與DNA靶標的任一鏈雜交;探針的大小範圍與各種嚴格雜交條件一致等。PCR容許在相對小體積中由低濃度的核酸擴增ASH的靶序列。否則,用限制性內切核酸酶消化來自基因組DNA的靶序列並且通過凝膠電泳進行大小分離。雜交一般如美國專利5,468,613中所述與結合至膜表面的靶序列進行,ASH探針序列可以與膜結合。在一個實施方案中,一般如下獲得ASH數據,即使用PCR由基因組DNA擴增核酸片段(擴增子),按照斑點印跡形式將該擴增子耙DNA轉至膜上,使標記的寡核苷酸探針與擴增子靶標雜交,並且通過^L射自顯影術觀察雜交斑點單核苷酸多態性(SNP)為由基於單核苷酸區分的共有序列組成的標誌物。一般而言,通過包含SNP的擴增子在例如丙烯醯胺凝膠上的差別遷移模式來檢測這一差別。然而,可選的檢測方式,諸如雜交,例如,ASH或RFLP分析或基於陣列的檢測也是合適的。例如,可以將同工酶標誌物用作遺傳標誌物,以便示蹤與本文所述標誌物連鎖的同工酶標誌物。同工酶為彼此在其胺基酸和由此的其核酸序列方面不同的酶的多種形式。某些同工酶為包含略微不同亞基的多聚體酶。其它同工酶為多聚體的或單體的,但已經在胺基酸序列的不同位點上從酶原中裂解。可以在蛋白質水平上表徵和分析同工酶,或者,可以確定在核酸水平上不同的同工酶。在這類情況中,本文所述任何基於核酸的方法可用於分析同工酶標誌物。有關核酸擴增的別的細節正如注意到的,核酸擴增技術,諸如PCR和LCR為本領域眾所周知的並且可以應用於本發明,以便擴增和/或檢測所關注的核酸,諸如包含標誌物基因座的核酸。在上述參考文獻例如I皿is,Sambrook,Ausubel和Berger中可以找到足以指導本領域技術人員通過這類體外方法的技術的實例,包括聚合酶鏈反應(PCR)、連接酶鏈反應(LCR)、QP-複製酶擴增和其它RNA聚合酶介導的技術(例如NASBA)。額外的詳細描述在如下文獻中找到Mullis等(1987)美國專利No.4,683,202;Arnheim&Levinson(1990年10月1日)C&EN36-47;TheJournalOfNIHResearch(1991)3,81-94:Kwoh等(1989)Proc.Natl.Acad.Sci.USA86,1173;Guatelli等(1990)Proc.Natl.Acad.Sci.USA87,1874;Lomell等(1989)J.Clin.Chem35,1826;Landegren等(1988)Science241,1077-1080;VanBrunt(1990)Biotechnology8,291-294;Wu和Wallace(1989)Gene4,560;Barringer等(1990)Gene89,117和Sooknanan和Malek(1995)Biotechnology13:563-564。Cheng等(1994)Nature369:684及其中的參考文獻中進一步概括了通過PCR擴增大核酸的改進方法,其中生成達40kb的PCR擴增子,它可用於與本文多態性(圖1和/或2)連鎖的基因的定位克隆的情況中。例如,在下列文獻中^C露了遠程PCR方法2002年1月9日提交的美國專利申請No,10/042,406,標題為"AlgorithmsforSelectionofPrimerPairs";2002年9月9日提交的美國專利申請No.10/236,480,標題為"MethodsforAmplificationofNucleicAcids";和2004年5月25日授權的美國專利No.6,740,510,標題為"MethodsforAmplificationofNucleicAcids"。USSN10/341,832描述。蛋白質表達產物的檢測蛋白質,諸如圖l和/或2中注意到的基因編碼的那些由核酸,包括包含與本文關注的表型相關的標誌物的那些編碼。關於分子生物學的基本範例的說明,包括DNA表達(轉錄和/或翻譯)成RNA,進而成蛋白質,參見Alberts等(2002)MolecularBiologyoftheCell,4thEditionTavlor和Francis,Inc.,ISBN:0815332181("Alberts")和Lodish等(1999)MolecularCellBiology,4thEditionWHFreeman&Co,ISBN:071673706X("Lodish")。因此,例如,可以通過檢測個體或群體之間的不同蛋白質同種型或通過4企測這類所關注的蛋白質(例如,圖l和/或2的基因產物)的差別存在、不存在或表達水平,將對應於圖1和/或2中的基因的蛋白質作為標誌物來檢測。已知各種蛋白質檢測方法並且可以用於區分標誌物。除上文的各種參考文獻外,各種蛋白質操作和檢測方法也為本領域中公知的,包括,例如,下列文獻中所述的那些R.Scopes,ProteinPurification,Springer-Verlag,N.Y.(1982);Deutscher,MethodsinEnzymologyVol.182;GuidetoProteinPurification,AcademicPress,Inc.N.Y.(1990);Sandana(1997)BioseparationofProteins,AcademicPress,Inc.;Bollag等(1996)ProteinMethods,2thEditionWiley-Liss,NY;Walker(1996)TheProteinProtocolsHandbookHumanaPress,NJ;Harris和Angal(1990)ProteinPurificationApplications:APracticalApproachIRLPress,Oxford,Oxford,England;Harris和AngalProteinPurificationMethods:APracticalApproachIRLPress,Oxford,Oxford,England;Scopes(1993)ProteinPurification:PrinciplesandPractice3EditionSpringerVerlag,NY;Janson和Ryden(1998)ProteinPurification:Principles,HighResolutionMethodsandApplications,SecondEditionWiley-VCH,NY;和Walker(1998)ProteinProtocolsonCD-ROMHumanaPress,NJ;和其中引述的參考文獻。有關蛋白質純化和4企測方法的額外詳細描述可以在SatinderAhujaed.,HandbookofBioseparations,AcademicPress(2000)中找到。描述了同時檢測許多蛋白質的"蛋白質組"檢測方法。它們可以包括各種多維電泳方法(例如,2-d凝膠電泳)、基於質譜的方法(例如,SELDI、MALDI、電噴射等)或表面等離振子共振法。例如,在MALDI中,通常將樣品與適當的基質混合,置於探針表面上,並通過雷射解吸/電離檢驗。MALDI的技術為本領域眾所周知的。例如,參見美國專利5,045,694(Beavis等),美國專利5,202,561(Gleissmann等)和美國專利6,111,251(Hillenkamp)。類似地,就SELDI而言,使第一個等分試樣接觸固相支持體結合的(例如,基質結合的)吸附劑。基質一般為可以使用氣相離子分光光度計以可查詢的關係定位的探針(例如,生物晶片)。SELDI也為眾所周知的技術並且已經應用於診斷蛋白質組學。例如,參見Issaq等(2003)"SELDI畫TOFMSforDiagnosticProteomics"AnalyticalChemistry75:149A-155A。一般而言,上述方法可以用於檢測蛋白質的不同形式(等位基因)和/或可以用於檢測個體、家族、品系、群體等之間的蛋白質的不同表達水平(可能是因為等位基因差異)。即使所編碼的差異表達的蛋白質自身相同,但是受環境因素控制的(whencontrolledforenvironmentfactors)表達7K平的差異可以指示位於所關注基因的QTL上的不同等位基因。例如,如果在非編碼區,例如諸如控制基因表達的啟動子或增強子這類區中存在基因的多種等位基因形式,那麼上述情況發生。因此,可以將4全測差異表達水平用作4企測等位基因差異的方法。在本發明的其它方面中,包含與乳腺癌表型相關的核酸的、與該核酸連鎖不平衡的、或在該核酸控制下的基因可以表現出差異等位基因表達。本文所用的"差異等位基因表達"意指存在於細胞中的單一基因的多個等位基因的等位基因表達上的定性和定量差別。照此,展示出差異等位基因表達的基因可以具有與相同細胞/組織中第二種等位基因相比以不同時間或水平表達的一種等位基因。例如,儘管兩者均為相同基因的等位基因並且存在於相同細胞/組織中,但是與乳腺癌表型相關的等位基因可以以高於或低於與乳腺癌表型無關的等位基因的水平得到表達。差異等位基因表達和分析方法詳細披露在2003年5月13日提交的美國專利申請號10/438,184和2004年5月12日提交的美國專利申請號10/845,316中,二者標題均為"Allele-specificexpressionpattems"。與乳腺癌表型相關的一種或多種核酸或其片段、衍生物、多態性、變體或互補物的差異等位基因表達模式的檢測對於乳腺癌易感性/抗性是預後性的和診斷性的;同樣,檢測與乳腺癌表型相關的一種或多種核酸或其片段、衍生物、多態性、變體或互補物的差異等位基因表達模式對於乳腺癌和乳腺癌治療效果是預後性的和診斷性的。有關適合於篩選的標誌物類型的別的細節為與本文的表型的相關性篩選的生物學標誌物可以為可以通過篩選檢測的任何那些類型的標誌物,例如,遺傳標誌物,諸如遺傳基因座的等位基因變體(例如,像在SNP中)、表達標誌物(例如,mRNA和/或蛋白質的存在或其數量)、諸如此類。在本發明方法中待擴增、轉錄、翻譯和/或檢測的所關注的核酸基本上可以為任何核酸,不過,衍生自人體來源的核酸尤其與檢測涉及疾病診斷和臨床應用的標誌物相關。可得到許多核酸和胺基酸(核酸序列可以通過逆翻譯由其推導)的序列,包括圖l和/或2的基因/蛋白質。已知核酸的公用序列全集包括GenBank⑧EMBL、DDBJ和NCBI。其它全集易於通過搜索網際網路鑑定。待擴增、轉錄、翻譯和/或^r測的核酸可以為RNA(例如,其中擴增包括RT國PCR或LCR、Van-GelderEberwine反應或Ribo-SPIA)或DNA(例如,擴增的DNA、cDNA或基因組DNA)乃至任何其類似物(例如,用於4企測合成的核酸或其類似物,例如,其中所關注的樣品包括人工核酸或用於衍生或合成人工物來檢測,例如,突變、多態性、單核香酸多態性(SNP)、等位基因、同種型、RNA或蛋白質的表達等。可以檢測序列、表達水平或基因拷貝數的變異作為可能與乳腺癌表型相關的標誌物來檢測。例如,本發明的方法可用於對衍生自患者的樣品篩選所關注的標誌物核酸,例如,所述的樣品來自患者的體液(血液、唾液、尿液等)、活檢、組織、和/或廢物。因此,可通過本發明的方法對組織活檢、糞便、痰、唾液、血液、淋巴、淚液、汗液、尿液、陰道分泌物、射精的流體等容易的篩選核酸,因為所關注的任何組織基本上均包含適當的核酸。這些樣品一般在知情許可後通過標準醫學實驗室方法取自患者。在擴增和/或;險測包含標誌物的核酸前,任選通過任何可利用的方法從樣品中純化核酸,所述的方法例如在如下文獻中教導的Berger和Kimmel,GuidetoMolecularCloningTechniques,MethodsinEnzymologvvolume152AcademicPress,Inc.,SanDiego,CA(Berger);Sambrook等,MolecularCloning-ALaboratoryManual(3rdEd.),Vol.1-3,ColdSpringHarborLaboratory,ColdSpringHarbor,NewYork,2001("Sambrook");和/或CurrentProtocolsinMolecularBiology,F.M.Ausubel等,eds.,CurrentProtocols,GreenePublishingAssociates,Inc.與JohnWiley&Sons,Inc.的合作項目(增補至2002)("Ausubel"))。在商業上還可以利用多種試劑盒從細胞或其它樣品中純化核酸(例如,參見EasyPrepTM、FlexiPrep,均來自PharmaciaBiotech;StrataClean,來自Stratagene;和QIAprepTM,來自Qiagen)。可選擇地,例如,可以在等分和/或稀釋後使樣品單純的直接進行擴增或檢測。標誌物的實例可以包括多態性、單核苷酸多態性、樣品中一種或多種核酸的存在、樣品中一種或多種核酸的缺失、一種或多種基因組DNA序列的存在、一種或多種基因組DNA序列的缺失、一種或多種mRNA的存在、一種或多種mRNA的缺失、一種或多種mRNA的表達水平、一種或多種蛋白質的存在、一種或多種蛋白質的表達水平、和/或衍生自任何上述的數據或其組合。基本上可以使用可利用的方法,例如使用提供高密度、高通量標誌物作圖的陣列技術檢測任何數目的標誌物。因此,可以在第一種和/或第二種群體中同時或以連續方式(或其組合)對至少約10、100、1,000、10,000乃至100,000或以上個遺傳標誌物測試與相關表型的相關性。例如,可能還想測試標誌物的組合,以便鑑定群體中與表型相關的遺傳組合或表達模式的組合。正如注意到的,待4企測的生物學標誌物可以為任何可4企測的生物學成分。通常檢測的標誌物包括遺傳標誌物(例如,存在於基因組DNA中的DNA序列標誌物或其表達產物)和表達標誌物(可以反映出遺傳編碼因素、環境因素或它們兩者)。如果標誌物為表達標誌物,那麼方法可以包括測定第一種個體或群體的第一種表達語(例如,一種或多種表達的標誌物,例如一組表達的標誌物)並且比較第一種表達i普與第二種個體或群體的第二種表達語。在該實例中,使表達標誌物與特定表型建立相關性可以包括使第一種或第二種表達譜與所關注的表型建立相關性。探針/引物合成方法一般而言,用於製備寡核苷酸,包括探針、引物、分子信標、PNA、LNA(鎖定核酸)等的合適方法為眾所周知的。例如,可以如Needham-VanDevanter等(1984)NucleicAcidsRes.12:6159-6168所述,使用商購的自動化合成儀,按照Beaucage和Caruthers(1981)TetrahedronLetts.,22(20):1859-1862中所述的固相亞磷醯胺(phosphoramidtie)三酯方法,以化學方式合成寡核苷酸。還可以由本領域技術人員知道的各種商業來源定購寡核苷酸,包括修飾的寡核苷酸。存在許多寡核苷酸合成服務的商業供應商且由此這是一項廣泛可取得的技術。可以從各種商業來源定購任何核酸,諸如TheMidlandCertifiedReagentCompany([email protected])、TheGreatAmericanGeneCompany(www.genco.com)、ExpressGenInc.(www.expressgen.com)、OperonTechnologiesInc.(Alameda,CA)等。類似地,可以從任何各種來源,諸如PeptidoGenic([email protected])、HTIBio-products,Inc.(htibio.com)、BMABiomedicalsLtd(U.K.)、Bio畫Synthesis,Inc.等定購PNA。計算機(lnSilico)標誌物檢測在某些實施方案中,計算機(insilico)方法可以用於檢測所關注的標誌物基因座。例如,可以將包含所關注的標誌物基因座的核酸序列儲存在計算機中。可以使用由例如,諸如BLAST這類易於得到的程序乃至簡單的文字處理器提供的適當核酸搜索算法來鑑定所需標誌物基因座序列或其同系物。已經對完整人類基因組進行了測序且由此可將序列信息用於鑑定標誌物區、側翼核酸等。用於標誌物檢測的擴增引物在某些優選的實施方案中,使用合適的基於PCR的檢測方法檢測本發明的分子標誌物,其中PCR擴增子的大小或序列指示所述標誌物(例如,特定的標誌物等位基因)的存在與否。在這些類型的方法中,PCR引物與位於多態標誌物區側翼的保守區雜交。可以使用任何合適的方法設計用於本發明的合適的引物。並非意圖將本發明限於任何特定的引物或引物對。例如,可以使用任何合適的軟體程序,諸如LASERGENE⑧,例如考慮到公眾可利用的序列信息來設計引物。本文鑑定的多態性的側翼序列為公眾可得到的;因此,可以基於充分理解的鹼基配對原則構建合適的擴增引物。正如上述已經進行了討論,例如可以通過雜交、陣列雜交、PCR、實時PCR、LCR等進行任何擴增子的序列。在某些實施方案中,可以通過任何合適的手段(例如,使用非放射性焚光標籤)放射性標記或標記本發明的引物,以便能夠在不添加任何額外的標記步驟或顯現步驟的擴增反應後使不同大小的擴增子快速顯現。在某些實施方案中,不標記引物並且在其大小解析後,例如在瓊脂糖或丙烯醯胺凝膠電泳後使擴增子顯現。在某些實施方案中,在大小解析後對PCR擴增子進行溴化乙錠染色能夠使不同大小的擴增子顯現。並非意圖將本發明的引物限於產生任何特定大小的擴增子。例如,用於擴增本文的標誌物基因座和等位基因的引物並不限於擴增相關基因座的完整區或其任何子區。該引物可以產生任何適當長度的擴增子用於檢測。在某些實施方案中,標誌物擴增產生了至少20個核苷酸長度,或可選擇地,至少50個核苷酸長度,或可選擇地,至少100個核苦酸長度,或可選擇地,至少200個核苷酸長度的擴增子。可以使用本文披露的各種技術檢測任何大小的擴增子。可以通過常規方法,諸如電泳檢測鹼基組成或大小的差別。用於定位克隆的標誌物的^r測在某些實施方案中,核酸探針用於檢測包含標誌物序列的核酸。例如,除測定乳腺癌表型中的作用外,這類探針還可以用於定位克隆以便分離與標誌物核苷酸序列連接的核苷酸序列。並非意圖將本發明的核酸探針限於任何特定的大小。在某些實施方案中,核酸探針至少為20個核苷酸長度,或可選擇地,至少50個核苷酸長度,或可選擇地,至少100個核苷酸長度,或可選擇地,至少200個核苷酸長度。例如,根據待;險測的標記物的不同,使用放射自顯影術、螢光照相術或其它類似檢測技術檢測雜交的探針。特異性雜交方案的實例為本領域中廣泛可利用的,例如參見Berger,Sambrook和Ausubel,均在本文中。轉基因細胞的產生本發明還提供了用依照本發明鑑定的QTL所對應的核酸轉化的細胞。例如,這類核酸包括編碼對應於乳腺癌表型的QTL或與乳腺癌表型的QTL連鎖的基因的cDNA、ORF、基因、和/或染色體間隔(例如,基因組片段)。另夕卜,本發明提供了影響乳腺癌表型的多肽的生產方法。例如,它可用於影響乳腺癌和產生轉基因細胞。這些細胞提供了具有影響相關表型的確定基因的商業上有用的細胞系,由此提供了篩選表型的潛在調控劑的平臺以及針對所關注基因各自作用機理的基礎研究。此外,基因療法可以用於將期望基因導入其可以用作預防處於風險中的個體發生這類病症的預防措施。描述用於克隆和操作核酸和生產所編碼的多肽的分子生物學技術的一般教科書包括Berger和Kimmel,GuidetoMolecularCloningTechniques,MethodsinEnzymologvvolume152AcademicPress,Inc.,SanDiego,CA(Berger);Sambrook等,MolecularCloning畫ALaboratoryManual(3rdEd.),Vol.1-3,ColdSpringHarborLaboratory,ColdSpringHarbor,NewYork,2001r'Sambrook")和CurrentProtocolsinMolecularBiology,F.M.Ausubel等,eds.,CurrentProtocols,GreenePublishingAssociates,Inc.與JohnWiley&Sons,Inc.的合作項目(增補至2004或以後)("Ausubel"))。這些教科書描述了誘變,載體,啟動子和許多其它與例如產生包含所關注的核酸的克隆相關的主題的應用,例如,基因、標誌物基因座、標誌物探針、與標誌物基因座分離的QTL等。宿主細胞用本發明載體(例如,載體,諸如包含衍生自QTL或與之相關的基因或ORF的表達載體)遺傳改造(例如,轉導、轉染、轉化的等),所述本發明的載體可以為,例如克隆栽體、穿梭栽體或表達載體。這類載體為,例如質粒、噬菌粒、農桿菌(agrobacterium)、病毒、棵多核苷酸(線性或環狀)、或偶聯多核苷酸的形式。可以將載體導入細菌,尤其是為了增殖和擴增的目的。有關核酸導入方法的額外詳細描述可以在下文的Sambrook,Berger和Ausubel中找到。將本發明的核酸導入宿主細胞的方法對本發明而言並不關鍵,並且並非意圖將本發明限於任何將外源性遺傳物質導入宿主細胞的特定方法。因此,可以使用任何合適的方法並且應用於本發明,例如,包括,但不限於本文提供的方法,這些方法提供了將核酸有效導入細胞或原生質體。可以在根據諸如,例如活化啟動子或選擇轉化體這類活動的需要而改良的常規營養培養基中培養改造後的宿主細胞。除全部在下文中的Sambrook,Berger和Ausubel夕卜,Atlas和Parks(eds)TheHandbookofMicrobiologicalMedia"993)CRCPress,BocaRaton,FL和可得到的商業文獻,諸如LifeScienceResearchCellCultureCatalogue(2004)Sigma-Aldrich,Inc(StLouis,MO)("Sigma-LSRCCC")提供了額外的詳細描述。使標誌物與表型建立相關性本發明的一個方面在於描述圖l和/或2中注意到的多態性與乳腺癌表型之間的相關性。對這些相關性的理解可以用於本發明,以-使建立有關一組確定個體或樣品所具有的多態性的信息與他們有可能展示的表型之間的相關性。此外,考慮了一種或多種不同基因中的等位基因組合的高級相關性也可以用於評價與表型的相關性。可以通過任何方法建立這些相關性,所述的方法可以鑑定等位基因與表型或等位基因組合與表型組合之間的相關性。例如,圖l和/或2中的基因或基因座中的等位基因可以與一種或多種乳腺癌表型相關。最一般的情況是,這些方法包括參照查閱表,該表包含多態性的等位基因與表型之間的相關性。該表可以包括多個等位基因-表型相關性的數據並且例如,通過使用統計學工具,諸如主要成分分析、啟發算法等考慮到了多個等位基因-表型相關性的疊加或其它高級作用。標誌物與表型的相關性任選包括對相關性進行一種或多種統計學檢驗。許多統計學檢驗為已知的且大部分為計算機執行的以便於分析。測定表型性以應用於本發明。關於該主題的介紹,參見Hartl(1981)APrimerofPopulationG6n6ticsWashingtonUniversity,SaintLouisSinauerAssociates,Inc.Sunderland,MAISBN:0-087893-271-2。各種適當的統計學模型描述在Lynch和Walsh(1998)GeneticsandAnalysisofQuantitativeTraits,SinauerAssociates,Inc.SunderlandMAISBN0-87893-48l國2。例如,這些模型可以提供基因型與表型值之間的相關性,表徵基因座對表型的影響,分類環境與基因型之間的相關性,測定基因的顯性或外顯率,測定母體和其它後生效應,測定分析中的主要成分(通過主要成分分析或"PCA")等。這些教科書中引述的參考文獻提供了有關使標誌物與表型建立相關性的統計學模型的大量額外詳細描述。除用於測定相關性的標準統計學方法外,通過模式識別和訓練,諸如使關性。這在鑑定多個等位基因與多個表型之間的高級相關性時特別有用。為了解釋,可以將神經網絡法與遺傳算法型編程結合應用於啟發式開發結構-功能數據空間模型,該模型測定遺傳信息與表型結果之間的相關性。例如,NNUGA(NeuralNetworkUsingGeneticAlgorithms)為可利用的程序(例如,在環球網cs.bgu.ac.il/omri/NNUGA上,它結合了神經網絡和遺傳算法。例如,可以在KevinGurney,AnIntroductiontoNeuralNetworks,UCLPress(1999)和環球網shef.ac.uk/psychology/gurney/notes/index.html上找到有關神經網絡的介紹。額外有用的神經網絡的參考書包括上述有關遺傳算法的那些,並且侈JJ(口有Bishop,NeuralNetworksforPatternRecognition,OxfordUniversityPress(1995)和Ripley等,PatternRecognitionandNeuralNetworks,CambridgeUniversityPress(1995)。顯示例示性數據集,包括某些統計學分析的兩個表如圖l和/或2中所示。可用於理解利用和建立相關性的數據分析應用、分析的主要成分、神經網絡建模等的額外參考書包括,例如,Hinchliffe,ModelingMolecularStructures,JohnWileyandSons(1996);Gibas和Jambeck,BioinformaticsComputerSkills,O'Reilly(2001);Pevzner,ComputationalMolecularBiologyandAlgorithmicApproach,TheMITPress(2000);Durbin等,BiologicalSequenceAnalysis:ProbabilisticModelsofProteinsandNucleicacids,CambridgeUniversityPress(1998);和Rashidi和Buehler,BioinformaticBasics:ApplicationsinBiologicalScienceandMedicine.CRCPressLLC(2000)。在任何情況下,任何統計學檢驗基本上均可以通過標準編程法或使用任何各種"架外"軟體包應用於計算機執行的模型,所述的"架外"軟體包執行這類統計學分析,包括,例如,上述那些和商購的那些,例如,來自PartekIncorporated(St.Peters,Missouri;www.partek.com),例戈口,其提供用於才莫式識別的軟體(例如,提供PartekPro2000PatternRecognitionSoftware),它可以應用於遺傳算法以便進行多變量數據分析、交互式顯現、可變選擇、神經網絡和統計學建模等。例如,可以通過主要成分分析(PCA)作圖的散點圖和雙點圖(biplot)、多維標定(Multi-DimensionalScaling,MDS)、多維標定(MDS)作圖的散點圖、星狀圖等分析相關性。用於進行相關性分析的可利用的軟體包括SAS、R和MathLab。標誌物無論是多態性還是表達模式均可以用於任何不同的遺傳分析。例如,一旦鑑定出標誌物,正如本例中的那樣,就可以將它們用於相關研究的許多不同測定法。例如,可以為查詢這些標誌物而設計微陣列的探針。其它例示性測定法包括,例如,Taqman測定法和上文所述的分子信標測定法以及常規的PCR和/或測序技術。有關相關性研究的額外詳細描述可以在如下文獻中找到2002年3月26日提交的10/106,097,標題為"MethodsforGenomicAnalysis";2002年1月7日提交的10/042,819,標題為"GeneticAnalysisSystemsandMethods";2002年10月31日提交的10/286,417,標題為"MethodsforGenomeAnalysis";2004年1月30曰提交的10〃68,788,標題為"ApparatusandMethodsforAnalyzingandCharacterizingNucleicAcidsSequences";2003年5月28日提交的10/447,685,標題為"LiverRelatedDiseaseCompositionsandMethods";2004年IO月20日提交的10/970,761,才示題為"ImprovedAnalysisMethodsandApparatusforIndividualGenotyping"(用於個體基因分型的方法);2004年9月30日提交的10/956,224,標題為"MethodsforGeneticAnalysis"。在某些實施方案中,標誌物數據用於進行相關性研究以便顯示標誌物與表型之間的相關性。這可以通過測定具有所關注表型的個體(即,展示出所基因頻率或其它;爭徵(表達水平等)與對照組個體中等位基因頻率或其它:徵中於基因組的特定區(例如,所關注的單倍型段)。在一個實施方案中,對與圖l和/或2中基因或基因座連鎖的標誌物評價與一種或多種特定乳腺癌惡病質表型的相關性。除本文披露的本發明方法的其它實施方案外,所述的方法還能夠"切開"表型。即特定的表型可以(並且一般確實)由兩種或多種不同遺傳鹼基產生。例如,在一種個體中的易感性表型可能是圖1和/或2中的基因中的"缺陷"(或單純是特定等位基因-在易感性表型方面的"缺陷"是語境依賴性的,例如,表型在指定環境中是個體需要的還是不需要的)的結果,而在不同個體中相同的基礎表型可能是圖l和/或2中多個基因中的多個"缺陷"的結果。如此,掃描多個標誌物(例如,作為在基因組或單倍型段掃描中)能夠切開類似(或分級的(graduated))表型的不同遺傳鹼基。如上述段落中所述,進行相關性研究的一種方法在於比較具有所關注表型的個體("病例組")中的等位基因頻率(或表達水平)與對照組個體中的等位基因頻率。在一種方法中,信息SNP用於進行SNP單倍型模式比較("信息SNP"為遺傳SNP標誌物,諸如基因組或單倍型段中趨向於區分一種SNP、基因組或單倍型模式與其它SNP、基因組或單倍型模式的SNP或SNP子集(一種以上))。使用信息SNP的方法具有勝過本領域中知道的其它全基因組掃描或基因分型方法的優點,以便代替讀取每一個體基因組的所有30億個鹼基-或乃至讀取可能發現的3-4百萬個常見SNP-僅來自樣品群的信息SNP需要檢測。讀取這些特定信息SNP提供了足夠的信息以便能夠如上所述從特定實驗群體中提取統計學上精確的相關性數據。如此,在測定遺傳相關性的一種方法的實施方案中,對未展示出表型的對照群體的基因組測定信息SNP的等位基因頻率。還對確實展示出表型的群體的基因組測定了信息SNP的等位基因頻率。比較信息SNP等位基因頻率。例如,可以通過測定每一群體中各信息SNP位置上的等位基因頻率(群體中特定等位基因的實例數除以等位基因總數)並且比較這些等位基因頻率進行等位基因頻率比較。選擇展示出對照與病例群體/組中的等位基因出現頻率之間差異的信息SNP用於分析。一旦選擇了信息SNP,就鑑定包含信息SNP的SNP單倍型段,繼而鑑定與表型相關的所關注的基因組區。例如,可以通過本領域中公知的遺傳或任何生物學方法分析基因組區,以便用作藥物研發靶標或診斷標誌物。用於鑑定乳腺癌表型的系統執行上述相關性建立的系統也為本發明的特徵。一般而言,該系統包括使等位基因的存在與否(例如,無論是直接檢測的還是通過表達水平檢測的)與預測表型建立相關性的系統指令。該系統指令可以比較有關等位基因序列或表達水平的檢測信息與包括等位基因與相關表型之間相關性的資料庫。如上所述,該資料庫可以為多維的,由此包括等位基因組合與相關表型之間的高級相關性。可以將這些相關性儲存在任何數目的查閱表中,例如,採用電子數據表形式(例如,Excel電子數據表)或資料庫,諸如Access,SQLTM、Oracle,ParadoxTM或類似資料庫。該系統包括用於例如通過自動化或用戶界面輸入有關等位基因檢測信息的樣品特異性信息並且用於比較該信息與查閱表的條款。任選該系統指令還可以包括接受與任何檢測的等位基因信息相關的診斷信息,例如,具有相關等位基因的受試者具有特定表型的診斷的軟體。該軟體本質上可以為啟發式的,使用這類輸入的相關性來改善查閱表的準確性和/或由該系統解讀查閱表。各種這類方法,包括神經網絡、馬爾可夫建模和其它統計學分析如上所述。本發明提供了用於檢測一種或多種可檢測遺傳標誌物的數據採集模塊(例如,包含一種或多種生物分子探針的一種或多種陣列、檢測器、流體處理器等)。這類數據採集模塊的生物分子探針可以包括適合於檢測生物學標誌物,例如寡核苷酸^:針、蛋白質、適體、抗體等的任意種。它們可以包括樣品處理器(例如,流體處理器)、機器人、微流體系統、核酸或蛋白質純化模塊、陣列(例如,核酸陣列)、檢測器、熱循環儀或其組合,例如,用於獲取樣品、稀釋或等分樣品、純化標誌物材料(例如,核酸或蛋白質)、擴增標誌物核酸、檢測擴增的標誌物核酸等。例如,可以併入所述系統的自動化裝置用於評價各種生物現象,包括,例如基因應答所選刺激物的表達水平(Service(1998)"MicrochipsArraysPutDNAontheSpot"Science282:396-399)、高通量DNA基因分型(Zhang等(1999)"AutomatedandIntegratedSystemforHigh-ThroughputDNAGenotypingDirectlyfromBlood"Anal.Chem.71:1138-1145)等。類似地,還可利用進行混合實驗、DNA擴增、DNA測序等的集成系統。例如,參見Service(1998)"ComingSoon:thePocketDNASequencer"Science282:399-401。例如,各種自動化系統部件可購自CaliperTechnologies(Hopkinton,MA),其寸吏用各種Zymate系統,它們一般包括,例如機器人和流體處理模塊。類似地,用於各種實驗室系統,例如,用於微量滴定託盤操作的常用ORCA⑧機器人也可商購,例如,購自BeckmanCoulter,Inc.(Fullerton,CA)。類似地,可以用作本發明系統部件的商購微流體系統包括來自Agilenttechnologies和CaliperTechnologies的那些。此外,專利和技術文獻包括微流體系統的大量實例,包括可以直接與微孔板相連以進行自動化流體操作的那些。4壬《可各種液體處理和/或陣列結構可以用於本文的系統。一種用於本文系統的常用形式是微量滴定板,其中陣列或液體處理器包括微量滴定託盤。這類託盤為商購的並且可以按照各種孔大小和每個託盤的孔數目定購,以及各種功能化表面,用於測定法或陣列成分的結合。常用的託盤包括普遍的96孔板,還有常用的384和1536孔板。可以在這類託盤上處理樣品,其中所有處理步驟在所述託盤上進行。還可以在微流體設備或微量滴定和微流體設備的組合中處理樣品。除液相陣列外,還可以將成分儲存在固相陣列中或在固相陣列上進行分析。這些陣列以空間可及的模式(例如,行和列柵格)將物質固定在固相基質,諸如膜(例如尼龍或硝化纖維素)、聚合物或陶瓷表面、玻璃或改性二氧化矽表面、金屬表面等上。例如,可以通過雜交、通過局部再水化(例如使用移液管或其它流體處理部件)和流體轉移、或通過刮取陣列或切下陣列上所關注的位置評價成分。所述的系統還可以包括使用本文所述的任何方法檢測等位基因信息的檢測儀器。例如,可以將為檢測實時PCR產物配置的檢測器(例如,光學4企測器,諸如焚光檢測器)或陣列讀取器併入該系統。例如,可以為檢測來自包含所關注的等位基因的雜交或擴增反應的光發射配置檢測器,其中所述的光發射指示所述等位基因的存在與否。任選提供檢測器與包含上述系統指令的計算機之間的可操作連接,從而能夠向計算機自動輸入檢測到的等位基因特異性信息,例如,計算機可以儲存資料庫信息和/或執行系統指令以便比較檢測到的等位基因特異性信息與查閱表。還可以將用於產生由檢測器檢測的信息的探針與任何其它硬體或軟體一起併入系統,以便使用該探針檢測擴增子。它們可以包括熱循環儀部件(例如,用於進行所述探針檢測的等位基因的PCR或LCR擴增)、探針在其上排成陣列和/或雜交的陣列等。用於處理樣品的上述流體處理部件可以用於移動樣品材料(例如,待檢測的模板核酸和/或蛋白質)、引物、探針、擴增子等從而彼此接觸。例如,該系統可以包括一組為檢測一種或多種與表型相關的基因或連鎖基因座中的至少一種等位基因而配置的標誌物探針或引物,其中所述的基因編碼圖l和/或2中的多態性。配置檢測器組件是為了檢測從該組標誌物探針或引物輸出的一種或多種信號或由該組標誌物探針或引物產生的擴增子,由此鑑定等位基因的存在與否。所分析的樣品任選為系統的組成部分或可以考慮與其分開。樣品任選包括,例如,如本文所述的基因組DNA、擴增的基因組DNA、cDNA、擴增的cDNA、RNA、擴增的RNA、蛋白質等。在一個方面中,樣品衍生自哺乳動物,諸如人類患者。任選提供用於與用戶形成界面的系統部件。例如,該系統可以包括顯示計算機執行的系統指令的輸出的用戶可視顯示器、用於輸入用戶命令和激活該系統的用戶輸入裝置(例如,鍵盤或點擊裝置,諸如滑鼠)等。一般而言,所關注的系統包括計算機,其中各種計算機執行的系統指令在計算機軟體中具體實施,例如,儲存在計算機可讀介質上的。諸如文字處理軟體(例如MicrosoftWordTM或CorelWordPerfectTM)和資料庫軟體(例如電子數據表軟體,諸如MicrosoftExcel、CorelQuattroProTM或資料庫程序,諸如MicrosoftAccess或Sequel,Oracle、ParadoxTM)可以通過輸入對應於本文等位基因或等位基因與表型之間相關性的字符串而適合於本發明。例如,系統可以包括具有適當字符串信息的壽欠件,例如,它與用戶界面(例如,在標準才喿作系統,諸如Windows、Macintosh或LINUX系統中,為GUI)聯合以處理字符串。還可以將專用的序列對比程序,諸如BLAST併入本發明的系統以便對核酸或蛋白質(或相應的字符串)進行序列對比,例如,用於鑑定多個等位基因並且建立相關性。正如注意到的,系統可以包括具有適當資料庫和本發明等位基因序列或相關性的計算機。用於對序列以及輸入軟體系統的、包含任何本文序列的數據集進行序列對比的軟體可以為本發明的特徵。計算機可以為,例如,PC(基於lntelx86或奔騰晶片兼容DOSTM、OS2、INDOWSTM、WINDOWSNTTM、WINDOWS95、WINDOWS98、WINDOWS2000、WINDOWSME或LINUX的機器,MACINTOSH,PowerPC或基於UNIX的(例如,SUNtm工作站或基於LINUX的機器)或其它商購的本領域技術人員公知的常用計算機。用於輸入並且對比或以其它方式操作序列的軟體可得到,例如,BLASTP和BLASTN,或易於由本領域技術人員使用標準程式語言,諸如Visualbasic、Fortran,Basic、Java等構建。鑑定調控劑的方法除提供用於鑑定乳腺癌惡病質等的各種診斷和預後標誌物外,本發明還提供了鑑定乳腺癌表型調控劑的方法。在這些方法中,使潛在的調控劑接觸對應於圖l和/或2中的基因座的相關蛋白質或接觸編碼這類蛋白質的核酸。檢測潛在調控劑對基因或基因產物的作用,由此鑑定潛在調控劑是否調控表型潛在的分子基礎。此外,所述的方法可以包括,例如,將一種或多種推定的調控劑施用於展示出相關表型的個體並且測定該推定的調控劑是否例如在臨床試驗或治療環境中調控個體中的表型。這繼而測定了推定的調控劑是否在臨床上有用。調控劑接觸的基因或基因產物可以包括本文所述的任何等位基因形式。與不良表型正相關的等位基因形式,無論是基因還是蛋白質,為調控劑篩選的優選耙標。可以篩選的所關注的作用包括(a)在有調控劑存在下圖l和/或2中基因或基因產物的表達升高或降^f氐;(b)表達時間或位置的改變;或(c)在有調控劑存在下對應於圖l和/或2中基因座的蛋白質定位的改變。調控劑篩選的精確形式當然根據檢測的作用和可利用的設備的不同而改變。Northem分析、定量RT-PCR和/或基於陣列的檢測形式可以用於區分上述基因的表達水平。還可以使用可利用的方法,諸如Western印跡、ELISA分析、抗體雜交、BIAcore等檢測蛋白質表達水平。任何這些方法均可以用於區分因潛在調控劑導致的表達水平的改變。因此,可以對潛在調控劑篩選活性或表達。例如,可以使潛在調控劑(小分子、有機分子、無機分子、蛋白質、激素、轉錄因子等)接觸包含所關注的等位基因的細胞,並且可以在施用潛在表達調控劑之前和之後,例如,通過Northem分析或定量(任選實時)RT-PCR檢測對對應於圖l和/或2中基因座的基因或蛋白質活性或表達(或它們兩者)的作用。類似地,可以使不同基因的啟動子區(例如,一般是轉錄起始位點區中的序列,例如,在起始位點的5kb內,例如,1kb或以下,例如,在起始位點的500bp或250bp或100bp內)與報導構建體(CAT、P-半乳糖苷酶、螢光素酶或任何其它可利用的報導分子)偶聯並且可以類似地測試潛在調控劑的表達活性調控。在任一情況中,按照高通量方式,例如,使用自動化流體處理和/或檢測系統按照順序或平行方式進行測定。類似地,可以使用本文的任何活性檢測方法通過使潛在調控劑接觸合適的細胞測試活性調控劑,不管檢測的活性是否為活性調控、表達調控或它們兩者的結果。用於檢測調控劑活性檢測的生物傳感器也為本發明的特徵。它們包括包含對應於圖l和/或2的基因座的基因或基因產物的裝置或系統,其與讀出器偶聯,所述的讀出器測量或展示所述基因或產物的一種或多種活性。如此,可以通過可操作地偶聯適當的測定部件與讀出器將任何上述測定部件配置為生物傳感器。該讀出器可以為光學的(例如,檢測細胞標誌物或細胞存活)、電的(例如,與FET、BIAcore或任何各種其它部件偶聯)、光鐠的等,並且可以任選包括用戶可視的顯示器(例如,CRT或光學觀測站)。該生物傳感器可以與機器人或其它自動化裝置偶聯,例如,微流體系統,其使推定的調控劑直接與本發明的蛋白質接觸,例如,用於對推定的調控劑活性進行自動化高通量分析。可以適用於本發明的生物傳感器的各種自動化系統為商購的。例如,可以製造自動化系統以便評價各種生物現象,包括,例如,基因應答所選刺激物的表達水平(Service(1998)"MicrochipsArraysPutDNAontheSpot"Science282:396-399)。實驗室系統還可以進行例如重複流體處理操作(例如移液),以便將材料轉移至或轉移出包含陣列的試劑儲存系統,諸如微量滴定託盤或其它晶片託盤,它們用作各種自動化實驗室方法的基礎容器部件。類似地,所述的系統操作例如微量滴定託盤並且控制各種環境條件,諸如溫度、對光或空氣的暴露等。許多這類自動化系統為商購的並且在本文中描述,包括上述那些。它們包括各種Zymate系統、ORCA⑧機器人、微流體裝置等。例如,CaliperTechnologies,MountainView,CA的LabMicrofluidic裝置⑧高通量篩選系統(HTS)可以適用於本發明以便篩選調控劑活性。一般而言,用於檢測蛋白質表達水平和活性的方法和傳感器為可得到的,包括在上述各種參考文獻中教導的那些,包括R.Scopes,ProteinPurification,Springer-Verlag,N.Y.(1982);Deutscher,MethodsinEnzvmologyVol.182:GuidetoProteinPurification,AcademicPress,Inc.N.Y(1990);Sandana(1997)BioseparationofProteins,AcademicPress,Inc.;Bollag等(1996)ProteinMethods,2thEdition,Wiley-Liss,NY;Walker(1996)TheProteinProtocolsHandbook,HumanaPress,NJ;Harris和Angal(1990)ProteinPurificationApplications:APracticalApproach,IRLPress,Oxford,Oxford,England;Harris和AngalProteinPurificationMethods:APracticalApproachIRLPress,Oxford,Oxford,England;Scopes(1993)ProteinPurification:Principles和Practice3rdEdition,SpringerVerlag,NY;Janson和Ryden(1998)ProteinPurification:Principles.HighResolutionMethodsandApplications,SecondEdition,Wiley-VCH,NY;和Walker(1998)ProteinProtocolsonCD-ROM,HumanaPress,NJ;和SatinderAhujaed.,HandbookofBioseparations,AcademicPress(2000)。描述了同時檢測許多蛋白質的"蛋白質組"檢測方法並且也如上所述,包括各種多維電泳方法(例如,2-d凝膠電泳)、基於質語的方法(例如,SELDI、MALDI、電噴射等)或表面等離振子共振法。它們還可以用於示蹤蛋白質活性和/或表達水平。類似地,可以使用任何可利用的方法,包括Northern分析、定量RT-PCR等4企測核酸表達水平(例如,mRNA)。足以通過這些方法指導本領域技術人員的參考文獻易於得到,包括Ausubel,Sambrook和Berger。篩選對表達和/或活性的作用的潛在調控劑文庫是可得到的。這些文庫可以是P逭^L的或可以是靶向的。耙向文庫包括使用任何形式的合理設計技術設計的那些,其選擇支架或構件來產生組合文庫。這些技術包括用於設計和組合合成靶聚焦文庫(targe-focusedlibrairy)的大量方法,包括用生物等排轉化變形(morphingwithbioisosterictransformation),輩巴標特異性特有結構的分析等。一般而言,如果有關圖l和/或2的結構基因或基因產物的信息可得到,那麼,有可能可以使用例如靈活停靠方法(flexibledockingapproach)等設計結合配偶體。類似地,各種基礎化學支架有隨機文庫。在任一情況中,化學文庫的數以千計的支架和構件是可獲得的,包括具有多肽、核酸、碳水化合物和其它骨架的那些。商購的文庫和文庫設計服務包括ChemicalDiversity(SanDiego,CA)、Affymetrix(SantaClara,CA)、Sigma(St.LouisMO)、ChemBridgeResearchLaboratories(SanDiego,CA)、TimTec(Newark,DE)、NuevolutionA/S(Copenhagen,Denmark)等提供的那些。用於治療乳腺癌表型的試劑盒可以包括如上所述鑑定的調控劑和用於將該化合物施用於患者以便治療乳腺癌的說明書。調控基因的基因表達可以使用本領域公知的各種技術中任意種調控與圖l和2中多態性連鎖的任何基因的基因表達(例如轉錄和/或翻譯)。例如,可以使用反義核酸或幹擾RNA抑制基因表達。抑制特定細胞類型中的表達可以用於進一步研究這些這類基因的特定等位基因導致的顯性效應的機理。基因表達調控劑為一類本發明提供的調控劑,例如應用於調控乳腺癌表型的調控劑。例如,反義核酸的應用為本領域眾所周知的。反義核酸具有與耙核酸,例如,靶基因、mRNA或cDNA互補的區。一般而言,將包含相對於內源性基因的編碼(有義)序列呈互補、反義方向的核苷酸序列的核酸導入細胞。反義核酸可以為RNA、DNA、PNA或任何其它合適的分子。雙鏈體可以在反義序列與其互補有義序列之間形成,導致基因失活。反義核酸可以通過與轉錄自基因的RNA形成雙鏈體、通過與雙鏈體DNA形成三鏈體等抑制基因表達。例如,對於編碼序列為已知的或可以通過許多充分確立的技術測定的任何基因,均可以產生反義核酸(例如,反義RNA或寡聚核苷酸(任選包括增加對降解的抗性或改善細胞攝取的修飾的核芬酸和/或鍵)的化學合成或體外轉錄)。例如,下列文獻中描述了反義核酸及其應用Haselton和Alexander的USP6,242,258(2001年6月5日),標題為"MethodsfortheselectiveregulationofDNAandRNAtranscriptionandtranslationbyphotoactivation";USP6,500,615;USP6,498,035;USP6,395,544;USP5,563,050;E.Schuch等(1991)SvmpSoc.ExdBiol45:117-127;deLange等(1995)CurrTopMicrobiolImmunol197:57-75:Hamilton等(1995)CurrTopMicrobiolImmunol197:77-89;Finnegan等(1996)ProcNatlAcadSciUSA93:8449-8454;Uhlmann和A.Pepan(1990)Chem.Rev.90:543;P.D.Cook(1991)Anti-CancerDrugDesign6:585;J.Goodchild,BioconiugateChem.1(1990)165;和S.L.Beaucage和R.P.Iyer(1993),Tetrahedron49:6123;和F.Eckstein,Ed.(1991),OligonucleotidesandAnalogues-APracticalApproach,IRLPress。還可以通過RNA沉默或幹擾抑制基因表達。"RNA沉默"意指細胞中單鏈或一般為雙鏈RNA的存在導致對耙基因表達的抑制的任何機制,所述的靶基因包含與RNA相同或近似相同的序列,包括,但不限於RNA幹擾、抑制轉錄自耙基因的靶mRNA翻譯但不改變mRNA的穩定性、和轉錄沉默(例如,導致靶mRNA轉錄抑制的組蛋白乙醯化和異染色質形成)。術語"RNA幹擾"("RNAi",有時稱作RNA介導的幹擾、轉錄後基因沉默、或鎮壓(quelling))意指細胞中RNA,—般為雙鏈RNA的存在導致基因表達抑制的現象,所述的基因包含與所述雙鏈RNA相同或近似相同的序列。誘導RNAi的雙鏈RNA稱作"幹擾RNA"。基因表達由如下所述的RNAi機制抑制,其中幹擾RNA的存在導致轉錄自基因的mRNA降解且由此mRNA和任何所編碼的蛋白質水平降低。RNAi機制已經和正在廣泛在大量真核生物體和細胞類型中研究。例如,參見如下綜述McManus和Sharp(2002)"GenesilencinginmammalsbysmallinterferingRNAs"NatureReviewsGenetics3:737-747;Hutvagner和Zamore(2002)"RNAi:Natureabhorsadoublestrand"CurrOpinGenet&Dev200:225-232;Harmon(2002)"RNAinterference"Nature418:244-251;Agami(2002)"RNAiandrelatedmechanismsandtheirpotentialusefortherapy"CurrOpinChemBiol6:829-834;Tuschl和Borkhardt(2002)"SmallinterferingRNAs:Arevolutionarytoolfortheanalysisofgeneflmctionandgenetherapy"MolecularInterventions2:158-167;Nishikura(2001)"AshortprimeronRNAi:RNA-directedRNApolymeraseactsasakeycatalyst"Cell107:415-418;和Zamore(2001)"RNAinterference:Listeningtothesoundofsilence"NatureStructuralBiology8:746-750。RNAi還描述在專利文獻中;例如,參見Kreutzer和Limmer的CA2359180,才示題為"Methodandmedicamentforinhibitingtheexpressionofagivengene";Beach等的WO01/68836,標題為"MethodsandcompositionsforRNAinterference";Graham等的WO01〃0949,標題為"Geneticsilencing";和Tuschl等的WO01/75164,標題為"RNAsequence-specificmediatorsofRNAinterference"。簡言之,例如,用稱作Dicer的RNA酶III樣酶將導入細胞(例如導入細胞質)的雙鏈RNA處理成較短的雙鏈片段,稱作小幹擾RNA(siRNA,也稱作短幹擾RNA)。產生的siRNA的長度和性質依賴於細胞種類,不過,一般siRNA為21-25個核普酸長度(例如,siRNA可以具有19個鹼基對的雙鏈體部分,在每端上帶有2個核苷酸的3'懸垂)。類似地,可以在體外產生siRNA(例如,通過化學合成或體外轉錄)並且將其導入細胞以便誘導RNAi。siRNA與RNA誘導的沉默複合物(RISC)結合。任選發生siRNA的有義和反義鏈的分離,及siRNA反義鏈與其靶mRNA通過互補鹼基配對相互作用的相互作用。最終mRNA裂解和降解。胞中的表達。用於設計合適的幹擾RNA的指導原則為本領域技術人員公知的。例如,一般針對外顯子序列,而非內含子或非翻譯區設計幹擾RNA。高效幹擾RNA的表徵可能因細胞類型而改變。例如,儘管siRNA可能需要3'懸垂和5'磷酸以便最有效地誘導果蠅細胞中的RNAi,但是哺乳動物細胞中缺乏5'磷酸的平末端siRNA和/或RNA誘導RNAi可以與有3'懸垂和/或5'磷酸的siRNA誘導RNAi同樣有效(例如,參見Czauderna等(2003)"StructuralvariationsandstabilizingmodificationsofsyntheticsiRNAsinmammaliancells"NuclAcidsRes31:2705-2716)。作為另一個實例,由於大於30-80個石威基對長度的雙鏈RNA活化哺乳動物細胞中的抗病毒幹擾素應答並且導致非特異性沉默,所以用於哺乳動物細胞的幹擾RNA—般小於30個鹼基對(例如,Caplen等(2001)"Specificinhibitionofgeneexpressionbysmalldouble-strandedRNAsininvertebrateandvertebratesystems"Proc.Natl.Acad.Sci.USA98:9742-9747;Elbashir等(2001)"Duplexesof21-nucleotideRNAsmediateRNAinterferenceinculturedmammaliancells"Nature411:494-498;和Elbashir等(2002)"AnalysisofgeneflmctioninsomaticmammaliancellsusingsmallinterferingRNAs"Methods26:199-213其描述了21個核苷酸的siRNA在特異性抑制哺乳動物細胞系中的基因表達中的應用;和Kim等(2005)"SyntheticdsRNADicersubstratesenhanceRNAipotencyandefficacy"NatureBiotechnology23:222-226,其描述了25-30個核苷酸雙鏈體的應用)。siRNA的有義和反義鏈一般但非一定在siRNA雙鏈區內(不包括任何懸垂)彼此完全互補。反義鏈一4殳在相同區內與靶mRNA完全互補,不過,可以耐受一些核苷酸取代(例如,反義鏈與mRNA之間的一個或兩個核苷酸錯配仍然可以產生RNAi,不過,效率降低)。雙鏈區的末端一般比中部更耐受取代;例如,已經證實在具有19bp雙鏈區的21聚物環境內反義鏈與耙mRNA之間的互補性小至l5bp(鹼基對)可產生功能性siRNA(例如,參見Czauderna等(20(B)"StructuralvariationsandstabilizingmodificationsofsyntheticsiRNAsinmammaliancells"NuclAcidsRes31:2705-2716)。任何懸垂可以但非一定與靶mRNA互補;例如,TT(兩個2'-脫氧胸苦)懸垂頻繁應用於降低合成成本。儘管最初認為需要雙鏈RNA(例如,雙鏈siRNA)啟動RNAi,但是幾個近期的報導表明這類siRNA的反義鏈足以啟動RNAi。單鏈反義siRNA可以通過與雙鏈siRNA相同的途逕啟動RNAi(正如所證實的,例如,根據特異性mRNA內切核酸降解裂解片段的出現)。就雙鏈幹擾RNA而言,高效單鏈siRNA的特徵可以因細胞類型的不同而改變(例如,在反義鏈上可能需要5'磷酸以便有效誘導某些細胞類型中的RNAi,而游離5'羥基在能夠使羥基磷酸化的其它細胞類型中是足夠的)。例如,參見Martinez等(2002)"Single-strandedantisensesiRNAsguidetargetRNAcleavageinRNAi"Cell110:563-574;Amarzguioui等(2003)"ToleranceformutationsandchemicalmodificationsinasiRNA"Nucl,AcidsRes.31:589-595;Holen等(2003)"Similarbehaviorofsingle-strandanddouble-strandsiRNAssuggeststhattheyactthroughacommonRNAipathway"Nucl.AcidsRes.31:2401-2407;和Schwarz等(2002)Mol.Cell10:537-548。由於在對應於指定耙mRNA不同區的siRNA之間的效率差異,所以一般設計幾種siRNA並且對耙mRNA測試以便確定那種siRNA最為有效。還可以產生小髮夾RNA(shRNA,也稱作短髮夾RNA)形式的幹擾RNA,它們在細胞中被處理成啟動RNAi的siRNA樣分子(例如,參見Siolas等(2005)"SyntheticshRNAsaspotentRNAitriggers"NatureBiotechnology23:227-231)。細胞中RNA,特別是雙鏈RNA的存在可以通過非RNAi的機制導致基因表達抑制,所述的基因包含與RNA相同或接近相同的序列。例如,與耙mRNA部分互補的雙鏈RNA可以抑制mRNA翻譯,但不影響其穩定性。作為另一個實例,雙鏈RNA可以誘導組蛋白曱基化和異染色質形成,從而導致包含與RNA相同或接近相同的序列的基因轉錄沉默(例如,參見Schramke和Allshire(2003)"HairpinRNAsandretrotransposonLTRseffectRNAiandchromatin-basedgenesilencing"Science301:1069-1074;Kawasaki和Taira(2004)"InductionofDNAmethylationandgenesilencingbyshortinterferingRNAsinhumancells"Nature431:211-217;和Morris等(2004)"SmallinterferingRNA-inducedtranscriptionalgenesilencinginhumancells"Science305:1289-1292)。已經在不同種類中鑑定了稱作microRNA(miRNA)的短RNA。一般而言,這些內源性RNA各自轉錄為長RNA,然後加工成約60-75個核苷酸的形成有缺陷髮夾(莖-環)結構的前-miRNA。前-miRNA—般隨後例如被Dicer裂解成成熟miRNA。成熟miRNA—般約為21-25個核苷酸長度,但可以改變,例如,約14-約25或以上個核香酸。儘管並非全部,但是已經證實某些miRNA抑制具有部分互補序列的mRNA的翻譯。這類miRNA包含一個或多個針對相應mRNA的內部錯配,預計它們在miRNA反義鏈與mRNA結合形成的雙鏈體中心產生凸起。miRNA—般與mRNA形成約14-17個沃森-克裡克鹼基對;還可以形成額外的擺動(wobble)鹼基對。此外,已經證實包含對相應mRNA的中心錯配的短合成雙鏈RNA(例如,與siRNA類似)抑制mRNA翻譯(但不會啟動卩爭解)。侈寸長口,參見Zeng等(2003)"MicroRNAsandsmallinterferingRNAscaninhibitmRNAexpressionbysimilarmechanisms"Proc.Natl.Acad.Sci.USA100:9779-9784;Doench等(2003)"siRNAscanfimctionasmiRNAs"Genes&Dev.17:438-442;Bartel和Bartel(2003)"MicroRNAs:Attherootofplantdevelopment"PlantPhysiology132:709-717;Schwarz和Zamore(2002)"WhydomiRNAsliveinthemiRNP"Genes&Dev.16:1025-1031;Tang等(2003)"AbiochemicalframeworkforRNAsilencinginplants"Genes&Dev.17:49-63;Meister等(2004)"Sequence-specificinhibitionofmicroRNA-andsiRNA-inducedRNAsilencing"RNA10:544-550;Nelson等(2003)"ThemicroRNAworld:Smallismighty"TrendsBiochem.Sci.28:534-540;Scacheri等(2004)"ShortinterferingRNAscaninduceunexpectedanddivergentchangesinthelevelsofuntargetedproteinsinmammaliancells"Proc.Natl.Acad.Sci.USA101:1892-1897;Sempere等(2004)"ExpressionprofilingofmammalianmicroRNAsuncoversasubsetofbrain-expressedmicroRNAswithpossiblerolesinmurineandhumanneuronaldifferentiation"GenomeBiology5:R13;Dykxhoorn等(2003)"Killingthemessenger:ShortRNAsthatsilencegeneexpression"NatureReviewsMolec.andCellBiol.4:457-467;McManus(2003)"MicroRNAsandcancer"SeminCancerBiol.13:253-288;和Stark等(2003)"IdentificationofDrosophilamicroRNAtargets"PLoSBiol.1:E60。涉及部分互補RNA(例如,某些miRNA)對mRNA翻譯抑制的細胞機制似乎與涉及RNAi的部分交疊,不過,正如注意到的,mRNA的翻譯但並非其穩定性受到影響,並且mRNA—般不會降解。在RNA的反義鏈結合mRNA時形成的凸起的位置和/或大小可以影響RNA抑制mRNA翻譯的能力。類似地,RNA自身內任何凸起的位置和/或大小也可以影響翻譯抑制效率。例如,參見上述參考文獻。一般而言,翻譯抑制在RNA反義鏈與mRNA3'非翻譯區(3'UTR)互補時最為有效。與RNA^義鏈互補的序列的多次重複,例如,串聯重複也可以提供更有效的翻譯抑制;例如,被內源性miRNA以翻譯方式抑制的某些mRNA在其3'UTR上包含miRNA結合序列的7-8個重複。值得注意的是翻譯抑制似乎比RNA幹擾更依賴於RNA濃度;認為翻譯抑制涉及各自抑制性RNA對單一mRNA的結合,而認為RNAi涉及單一siRNA-RISC複合物對mRNA多個拷貝的切割。為抑制指定靶mRNA翻譯而設計合適的RNA的指導原則可以在文獻中(例如,上述參考文獻和Doench和Sharp(2004)"SpecificityofmicroRNAtargetselectionintranslationalrepression"Genes&Dev.18:504-511;Rehmsmeier等(2004)"FastandeffectivepredictionofmicroRNA/targetduplexes"RNA10:1507-1517;Robins等(2005)"IncorporatingstructuretopredictmicroRNAtargets"ProcNatlAcadSci102:4006-4009;和Mattick和Makunin(2005)"SmallregulatoryRNAsinmammals"Hum.Mol.Genet.14:R121-R132等)和本文中找到。然而,由於不同結構(例如,凸起大小、序列和/或位置)的RNA與對應於靶mRNA的不同區的RNA之間翻譯抑制效率的差異,所以任選設計幾種RNA並且對靶mRNA測試以便確定哪種對抑制靶mRNA翻譯最為有效。針對基因產物的抗體另一類調控劑為結合與本文基因座連鎖的基因產物的抗體。這些抗體可以用於檢測和/或純化基因產物,例如在原位監測基因產物。抗體還可以用於在體內、原位或體外阻斷基因產物的功能。本文所用的術語"抗體"包括,但不限於多克隆抗體、單克隆抗體、人源化或嵌合抗體和生物學功能性抗體片段,它們為足以使抗體片段結合蛋白質的那些片段。為了產生針對相關基因產物的抗體,可以通過注射多肽或其部分對各種宿主動物中的任意種免疫接種。舉例而言,這類宿主動物可以包括,但不限於家兔、小鼠和大鼠。根據宿主種類的不同,各種佐劑可以用於加強免疫應答,包括,但不限於弗氏(完全和不完全)佐劑、礦物凝膠諸如氬氧化鋁、表面活性物質諸如溶血卵磷脂、pluronic多元醇、聚陰離子、肽、油乳劑、匙孔蟲戚血藍蛋白、二硝基酚和潛在有用的人佐劑,諸如BCG(卡介苗)和短小棒一犬才幹菌(Corynebacteriumparvum)。多克隆抗體為衍生自免疫接種了抗原,諸如靶基因產物或其抗原功能性衍生物的動物血清的抗體分子的異質性群體。為了產生多克隆抗體,可以通過注射補充了也如上所述的佐劑的所編碼的蛋白質或其部分對諸如上述那些宿主動物免疫4妄種。可以通過任何提供由培養物中連續細胞系產生抗體分子的技術獲得針對特定抗原的抗體同質性群體,即單克隆抗體(mAb)。這些技術包括,但不限於雜交瘤技術(Kohler和Milstein,Nature256:495-497,1975;和美國專利US4,376,110)、人B細胞雜交瘤技術(Kosbor等,ImmunologyToday4:72,1983;Cole等,Proc.Nat'lAcad.Sci.USA80:2026-2030,1983)和EBV雜交瘤技術(Cole等,MonoclonalAntibodiesandCancerTherapy,AlanR.Liss,Inc.,pp.77-96,1985)。這類抗體可以屬於任何免疫球蛋白類型,包括IgG、IgM、IgE、IgA、IgD及其任何的亞類。可以在體外或體內培養產生本發明mAb的雜交瘤。在體內產生高滴度的mAbs使得它成為目前優選的生產方法。此外,可以使用為通過剪接來自具有適當抗原特異性的小鼠抗體分子的的技術(Morrison等,Proc.Nat'l.Acad.Sci.USA81:6851-6855,1984;Neuberger等,Nature312:604-608,1984;Takeda等,Nature314:452-454,1985)。嵌合抗體為如下分子,其中不同的部分衍生自不同的動物種類,諸如具有衍生自鼠mAb的可寒區或高變區和人免疫球蛋白恆定區的那些。類似地,還可以使用可利用技術生產人源化抗體。可選擇地,為生產單鏈抗體描述的技術(美國專利US4,946,778;Bird,Science242:423-426,1988;Huston等,Proc.Nat'lAcad.Sci.USA85:5879-5883,1988;和Ward等,Nature334:544-546,1989)可以適合於生產差異表達的基因-單鏈抗體。單鏈抗體如下形成,即經胺基酸橋連接Fv區的重鏈和輕鏈片段,從而產生單鏈多肽。在一個方面中,可用於生產"人源化抗體"的技術可以適合於生產針對蛋白質、其片段或衍生物的抗體。這類技術披露在美國專利US5,932,448;5,693,762;5,693,761;5,585,089;5,530,101;5,569,825;5,625,126;5,633,425;5,789,650;5,661,016;和5,770,429中。可以通過公知技術產生識別特定表位的抗體片段。例如,這類片段包括,但不限於可以通過對抗體分子進行胃蛋白酶消化產生的F(ab')2片段和可以通過還原F(ab')2片段的二硫鍵產生的Fab片段。可選擇地,可以構建Fab表達文庫(Huse等,Science246:1275-1281,1989)以便能夠快速和便利地鑑定具有所需特異性的單克隆Fab片段。使用上述抗體檢測和測定基因產物表達的方案為本領域眾所周知的。這類方法包括,但不限於斑點印跡、Western印跡、竟爭性和非竟爭性蛋白質結合測定法、酶聯免疫吸附測定法(ELISA)、免疫組織化學、焚光活化細胞分選(FACS)和其它常用且廣泛描述在科學和專利文獻中的方法以及許多商業上使用的方法。易於檢測的一種方法為夾心式ELISA,其存在大量變化形式,所有這些均意圖包括在本發明內。例如,在典型的正向測定法中,將未標記的抗體固定在固相基質上並且使測試樣品接觸所結合的分子並且孵育足以形成抗體-抗原二元複合物的時間。此時,隨之加入使用能夠誘導可檢測信號的報導分子標記的第二抗體並且孵育,使得時間足以形成抗體-抗原-標記抗體的三元複合物。洗去任何未反應的物質並且通過觀察信號確定抗原的存在,或可以通過與包含已知量抗原的對照樣品進行比較對抗原進行定量。正向測定法的變化形式包括同時測定法,其中同時將樣品和抗體加入到所結合的抗體;或反向測定法,其中首先合併標記抗體和測試樣品,孵育並加至未標記的表面結合抗體。這些技術為本領域技術人員眾所周知的並且微小變化的可能性顯而易見。本文所用的"夾心式測定法"意圖包括基礎雙位點技術(basictwo-sitetechnique)的所有變化形式。就本發明的免疫測定法而言,唯一的限制性因素在於經過標記的抗體為對所關注的基因表達的蛋白質具有特異性的抗體。在這種類測定法中最常用的報導分子為酶、含焚光團分子或含放射性核素分子。就酶的免疫測定法而言,通常通過戊二醛或高碘酸鹽使酶與第二抗體偶聯。然而,正如易於公認的,存在本領域技術人員眾所周知的各種不同的連接技術。常用的酶包括辣根過氧化物酶、葡萄糖氧化酶、P-半乳糖苷酶和鹼性磷酸酶等。一般為通過相應酶水解時產生可;f企測顏色改變而選擇與特定酶一起使用的底物。例如,磷酸對硝基苯酯適用於鹼性磷酸酶偶聯物;就過氧化物酶偶聯物而言,常用l,2-苯二胺或曱苯胺。還可能使用螢光底物,其產生螢光產物,而非上述顯色底物。然後將包含合適底物的溶液加至所述的三元複合物。使底物與連接至第二抗體的酶反應,得到定性可禍/f言號,其通常可以進一步通過分光光度法將其定量,以便評價存在於血清樣品中PLAB的量。可選擇地,可以通過化學方式使螢光化合物,諸如螢光素和若丹明與抗體偶聯而不改變其結合能力。當通過用特定波長的光照射活化時,螢光染料標記的抗體吸收光能,誘導分子中的激發態,隨後在較長的特徵性波長處發射光。發射表現為可使用光學顯微鏡檢測到的可視特徵性顏色。免疫焚光和EIA技術均為本領域中充分確立的並且為特別優選用於本發明的方法。然而,也可以使用其它報導分子,諸如放射性同位素、化學發光或生物發光分子。如何改變規程以適合於所需的應用對本領域技術人員而言是顯而易見的。細胞挽救(cdlrescue)復甦和治療性給藥本發明在一個方面中包括挽救在圖1和/或2的一種或多種內源性基因或多肽的功能方面存在缺陷(由此賦予所關注的相關表型例如乳腺癌易感性、抗性等)的細胞。這可以單純通過將基因(或表勤目關蛋白質的異源性核酸),即具有所需等位基因的基因的新拷貝導入細胞來進行。還可以實施其它方法,諸如同源重組以修復缺陷基因(例如通過嵌合成形術(chimemplasty))。在任何情況下,例如,可以在本文所述的任何測定法中測量功能的挽救。實際上,該方法可以用作在體外對細胞篩選圖l和/或2任何基因或基因產物的表達或活性的一般方法。因此,體外功能挽救可用於上述大量體外篩選方法的環以及充分確立細胞的培養物)中的細胞。如果從患者中分離細胞,那麼它具有確立哪種基因或產物在呈現相關表型的患者中存在缺陷的額外診斷功用。在另一個方面中,細胞挽救在患者,例如人中發生,例如以便修補缺陷。因此,本發明的一個方面在於修補缺陷的基因療法。在這些應用中,任選將本發明的核酸克隆入適當的基因療法載體(和/或單純作為棵核酸或脂質體偶聯的核酸遞送),然後任選與適當的載體或遞送劑一起遞送。還可以直接遞送蛋白質,但一般優選在需要穩定表達的應用中遞送核酸。類似地,可以在治療上使用本文方法鑑定的任何缺陷的調控劑。例如,給藥組合物包含治療有效量的調控劑、基因療法載體或其它相關核素和藥學上可接受的載體或賦形劑。這類載體或賦形劑包括,但不限於鹽水、緩沖鹽水、右旋糖、水、甘油、乙醇、和/或其組合。製備適合於給藥方式的製劑。一般而言,局部應用的基因療法載體的給藥方法為本領域眾所周知的並且可以應用於給藥本發明的核酸。任選在一種或多種適當的體外和/或體內疾病動物模型中測試包含本發明一種或多種調控劑或基因療法核酸的治療性組合物,以便按照本領域眾所周知的方法證實功效、組織代謝和估算劑量。特別地,最初可以根據製劑的活性、穩定性或其它合適的度量來確定劑量。給藥通過常用於將分子與細胞緊密接觸的任何途徑進行。可以以任何合適的方式,任選使用一種或多種藥學上可接受的載體給藥調控劑和/或編碼相關序列的核酸。對患者給藥本發明上下文中的這類核酸的合適方法是可得到的,並且儘管可以將一種以上的途徑用於給藥特定的組合物,特定的途徑通常可以提供比另一種途徑更迅速和更有效的作用或反應。部分根據給藥的特定組合物以及用於給藥組合物的特定方法來確定藥學上可接受的載體。因此,存在極其多種本發明藥物組合物的合適製劑。可以通過許多途徑給藥組合物,包括,但不限於口服、靜脈內、腹膜內、肌內、透皮、皮下、表面、舌下或直腸給藥。可通過脂質體(例如,表面的)或通過棵DNA或病毒載體的表面遞送來給藥組合物。這類給藥途徑和合適的製劑一般為本領域技術人員公知的。製劑(即它們可以"霧化")以便通過吸入給藥。可以將氣溶膠製劑置於加壓可接受的推進劑中,諸如二氯二氟曱烷、丙烷、氮等。適合於諸如,例如通過關節內(在關節中)、靜脈內、肌內、真皮內、腹膜內和皮下途徑進行胃腸外給藥的製劑包括可以包含抗氧化劑、緩沖劑、抑菌劑和賦予該製劑與指定接受者血液等滲的溶質的水性和非水性等滲無菌注射溶液;和可以包括懸浮劑、增溶劑、增稠劑、穩定劑和防腐劑的水性和非水性無菌混懸液。可以將包裝好的核酸的製劑在單劑或多劑密封容器中提供,諸如安瓿和小瓶。在本發明的上下文中,對患者的給藥劑量足以隨著時間的過去對患者產生有益治療應答。根據特定載體或其它製劑的功效,表達的多肽的活性、穩定性或血清半衰期,和患者的狀況以及所治療患者的體重或表面積確定劑量。劑量的大小還4艮據伴隨患者中特定載體、製劑等給藥的任何不良副作用的存在、性質和程度來確定。在確定在治療疾病時給藥的載體或製劑的有效量時,醫師評價局部表達或循環血漿水平、製劑毒性、相關疾病的進展和/或重要時,針對多核苷酸編碼的蛋白質的抗體的產生。例如,對70千克的患者,給藥劑量範圍一般與目前使用的治療性蛋白質的劑量相當,根據相關組合物改變的活性或血清半衰期進行調整。本發明的載體可以通過任何公知的常規療法補充治療條件。為了給藥,可以以根據相關製劑的LD-50和/或本發明載體在不同濃度下(例如應用於大的(mass)或表面遞送區域)的任何副作用的觀察結果和患者的總體健康狀況確定的速率給藥本發明的製劑。可以通過單劑或分劑進行給藥。如果進行治療的患者發生發熱、發冷或肌痛,那麼他/她接受適當劑量的阿司匹林、布洛芬、對乙醯氨基酚或其它疼痛/發熱控制藥。對組合物有反應,諸如發熱、肌痛和發冷的患者在輸注前30分鐘進行前驅用藥,即阿司匹林、對乙醯氨基酚、或例如苯海拉明。哌替啶(meperidine)用於更嚴重的發冷和肌痛,這些症狀對解熱藥和抗組織藥沒有快速響應。治療根據反應嚴重性的不同而減緩或中斷。診斷和預後測定法核酸、多肽、抗體和本文的其它組合物可以用作乳腺癌表型易感性或抗性的預後和診斷試劑(例如,在預包裝試劑盒中)。可以將這些方法對已知具有乳腺癌表型一種或多種症狀的受試者實施作為其它疾病的差異診斷或預後組成部分。這些方法還可以對具有已知乳腺癌表型易感性的受試者實施。這類個體的多態性特徵語可以升高或降低對易感性的評價。例如,已知,具有兩個乳腺癌同胞的個體比一般群體對疾病的易感性增加。發現有利於易感性的額外因素增加了風險,而發現有利於抗性的因素降低了這種風險。本發明提供了測定個體在本發明一種或多種SNP處的多態性特徵譜的方法。SNP包括圖1和2中所示的那些和與之連鎖不平衡的那些。與之連鎖不過單倍型作圖確定與本文圖中SNP連鎖不平衡的SNP。可以通過融合來自不同種類的二倍體細胞測定單倍型。所得細胞為部分單倍體,從而能夠確定單倍體染色體上的單倍型(例如,參見US20030099964)。可選擇地,可以通過多態性特徵語由佔據個體各種多態性位點上的多態形式構成。在二倍體基因組中,兩種多態形式,彼此相同的或不同的,通常佔據每個多態位點。如此,在位點X和Y處的多態性特徵語可以表示為X(xl,xl)和Y(yl,y2)形式,其中xl、xl表示佔據位點X的等位基因xl的兩個拷貝,而yl、y2表示佔據位點Y的雜合等位基因。可以通過與佔據本文圖中所示每一位點處的、與乳腺癌表型抗性或易感性相關的多態形式比較對個體的多態性特徵語評分。可以對至少例如,1、2、5、10、25、50或全部多態位點和任選與之連鎖不平衡的其它位點進行比較。可以與其它多態位點組合分析多態位點。然而,通常分析的多態位點總數少於10,000、1000、100、50或25個並且可以為約10個或以下、約5個或以下、或約2個或以下。可以以疊加的方式合併存在於特定個體中的抗性或易感性等位基因的數量或形成比例以便提供有關個體對乳腺癌表型遺傳傾向的總體評價(參見USSN60,566,302,2004年4月28日提交;USSN60/590,534,2004年7月22日提交;USSN10/956,224,2004年9月30日提交;和PCTUS05/07375,2005年3月3日提交)。可以任意將抗性等位基因各自評分為+l並且將易感性等位基因評分為-l(或反之亦然)。例如,如果將個體對本發明的100個多態位點分型並且在其所有位點上的抗性而言為純合的,那麼可以將他指定為對乳腺癌表型的抗性的遺傳傾向得分為100%或對乳腺癌表型的易感性的傾向為0%。如果個體對所有易感性等位基因而言為純合的,則為相反的結果。更典型的是,個體對某些基因座上的抗性等位基因而言為純合的,對某些基因座上的易感性等位基因而言為純合的,並且對其它基因座上的抗性/易感性等位基因而言為雜合的。可以通過將所有抗性等位基因的評分指定為+1,並且將所有易感性等位基因的評分指定為-l(或反之亦然),並且合併評分,對這類個體的乳腺癌表型遺傳傾向進行評分。例如,如果個體具有102個抗性等位基因和204個易感性等位基因,那麼可以將該個體評分為具有33%的抗性遺傳傾向和67%的易感性遺傳傾向。可選擇地,可以將純合抗性等位基因的評分指定為+1,將雜合等位基因的評分指定為O,並且將純合易感性等位基因的評分指定為-1。還可以將抗性等位基因和易感性等位基因的相對數目表示為百分比。如此,對30個多態位點處的抗性等位基因而言為純合的、對60個多態位點處的易感性等位基因而言為純合的、且剩餘63個多態位點處為雜合的個體指定為33%的抗性遺傳傾向。作為另一種可替代選擇,可以將易感性純合性評分為+2,雜合性評分為+1,而抗性純合性評分為O。個體評分和多態性特徵語性質可用於個體對乳腺癌表型易感性的預後或診斷。任選可以告知患者通過遺傳特徵語表示的乳腺癌表型易感性。可以將對乳腺癌表型的高遺傳傾向的存在作為警告來對待,以開始預防性或治療性處理。例如,可以不同地監測具有發生乳腺癌表型的風險升高的個體(例如,更頻繁的乳房照相術)或可以預防性處理(例如,使用一種或多種藥物)。對乳腺癌表型的高度傾向的存在還指示進行第二測試,諸如活檢的有益性。例如,多態性特徵制譜可用於選擇在指定個體中實現乳腺癌表型治療或預防的藥劑劑。具有類似多態性特徵譜的個體有可能以類似的方式響應藥劑。多態性特徵制譜還可用於對測試藥劑在治療乳腺癌表型或相關疾患方面的能力的臨床試驗中的個體進行分層。這類試驗對具有類似或相同多態性特徵諳的治療或對照群體進行(參見EP99965095.5),例如,所述多態性特徵譜指示個體具有發生乳腺癌表型的風險增加。遺傳匹配的群體的應用消除或減少了因遺傳因素導致的治療效果的變異,從而導致對潛在藥物功效的評價更為準確。計算機執行的算法可以用於鑑定遺傳上更同質的亞群,其中治療或預防具有顯著作用,不過,治療或預防在更異質的更大群體中無效。在這類方法中,對具有乳腺癌表型的、用藥劑治療的第一群體和也具有乳腺癌表型、但用安慰劑治療的第二群體提供了數據。測定在選自圖l和/或2中所示基因中的至少一個多態位點或IOOkb或50kb或20kb內兩個群體中個體的多態性特徵語。還提供了群體中每位患者是否達到表示成功治療或預防的所需終點的數據。然後選擇第一和第二群體中的亞群,使得亞群中的個體彼此具有大於原始第一和第二群體中個體的多態性特徵語相似性。存在可以評價相似性的許多標準。例如,一項標準在於要求亞群中的個體在上述基因的至少IO個上各自具有至少一個易感性等位基因。另一項標準在於亞群中個體對測定了多態性特徵譜的各多態位點而言具有至少75%的易感性等位基因。與用於評價相似性的標準無關,比較亞群的終點數據以便確定治療或預防是否在亞群中實現了統計學顯著的結果。作為計算機執行的結果,可以分析億萬相似性標準以便鑑定表現出統計學顯著性的一個或幾個亞群。多態性特徵制鐠還可用於從臨床試驗中排除無乳腺癌表型惡病質的個體。在試驗中包括這類個體增加了獲得統計學顯著效果所需的群體的大小。可以通過如上所述測定多態性特徵語中抗性和易感性等位基因的數目鑑定無乳腺癌表型惡病質的個體。例如,如果受試者在與乳腺癌表型相關的本發明10個基因的10個位點上基因分型,那麼總計測定了20個等位基因。如果其中超過50°/。且優選超過60%或75%為抗性基因,那麼該個體不太可能發生乳腺癌表型並且可以將他/她從試驗中排除。在其它實施方案中,可以使用多態性特徵制語與其它分層方法的組合進行臨床試驗中個體的分層,所述的其它分層方法包括,但不限於家族史、風險模型(例如,Gail得分、Claus模型)、臨床表型(例如,非典型損害和乳腺密度)和特定候選生物標誌物(例如,IGF1、IFG2、IGFBP3、Ki-67和雌二醇)。例如,在包括基於多態性特徵鐠的分層的化學預防試驗中較高風險度的分層可以改善結果。特別地,與FGFR2連鎖的標誌物可以用於對抗VEGF或抗血管發生療法應答的分層,並且與PKHD1連鎖的標誌物可以用於對抗EGF療法功效(抗EGF療法在具有多嚢腎和肝病的患者中有活性)的分層。還可以在完成臨床試驗後使用多態性特徵語來闡明對指定治療的響應差異。例如,多態性組可以用於將登記患者分層為疾病亞型或類型。還有可能使用多態性鑑定具有類似多態性特徵譜的患者亞組,他們對治療具有不常見的(高或低)的響應或根本無響應(不響應者)。在這種方式中,有關影響對治療的響應的潛在遺傳因素的信息可以用於研發治療的許多方面(它們從新靶標的鑑定到經新試驗的設計到產物標記和患者靶向)。另外,多態性可以用於鑑定牽涉對治療的不良響應(不良事件)的遺傳因素。例如,表現出不良響應的患者可能具有比預計為偶然的更類似的多態性特徵語。這容許早期鑑定並且從治療中排除這類個體。還提供了可以用於理解不良事件的生物學原因和改進治療以避免這類後果的信息。多態性特徵語還可以用於其它目的,包括如US6,525,185中所述的親子鑑定和法醫分析。在法醫分析中,將來自犯罪現場的樣品的多態性特徵語與嫌疑人的進行比對。兩者之間的匹配是嫌疑人實際犯罪的證據,而缺乏匹配就可排除嫌疑人。提出的多態位點可以用於這類方法,正如用於人類基因組中的其它多態位點一樣。實施例提供下列實施例是為了例證,並非限制請求保護的發明。本領域技術人員將認出各種可以在本發明範圍內改變的非關鍵性參數。實施例l:鑑定乳腺癌標誌物的策略前言鑑定常見的遺傳變體在鑑定乳腺癌標誌物等位基因中存在公眾健康的重要應用。如果遺傳變異是因許多基因座所致,那麼個體的風險度就會廣泛變化,這取決於在易感性基因座上遺傳得到的高危等位基因的數目。我們基於Antoniou等"的模型的分析提示在群體的前、後20%之間可能存在多達40倍的風險度差異。在相同的模型中,所有乳腺癌中的半數發生在12%的最高風險度女性中,並且這些女性在到70歲時有8位中至少1位的風險度。相反,在50%的最低風險度女性中僅有12%的癌症,並且個體風險度低於30位中1位14。鑑定為與乳腺癌風險相關的基因可以用於評估相關的和個別的風險度這種風險度評估的實際結果是重要的。賦予中度風險的常見遺傳變體在群體水平上各自具有重要的作用。例如,個體風險度僅增加1.5倍的、具有20%頻率的常見變體佔負載癌症的群體的15%。與在心血管疾病中血壓或膽固醇中度升高具有相似性。如果該變體指示切實可行的幹預機制,那麼這也為靶向幹預提供了新的可能性。在這些實際結果外,癌症易感性基因的鑑定有助于澄清致癌機理(正如已經發生的例如5iC47和BiC42)。超越已知候選物擴展至整個基因組檢索具有全新機制出現的巨大優點。這些機制還提供了新的治療靶。最終,易感性基因的知識能夠使我們通過使用例如EPIC分組調查法(cohort)研究基因與這些危險因素的組合的作用來澄清生活方式危險因素。乳腺癌儘管對許多癌症中的相關性研究可能存在爭論,但是存在幾個為何特別適合於在乳腺癌中進行研究的原因。它是女性中最常見的癌症並且其病因學仍然了解甚少。對該病遺傳基礎比對任何其它常見的癌症研究得更充分。作為結果,有利於多基因基礎的證據比對其它癌症更清楚。長期研究組合了足夠大系列的病例以便可靠地鑑定易感性基因座。此外,具有明顯家族史的病例可通過癌遺傳學臨床獲得,並且可以在相關性研究的有效性中提供顯著收穫(參見"ResearchProposal")。最終,存在可以對發現處於風險度增加的女性提供的幹預。例如,預防性卵巢切除術可以明顯降低隨後乳腺癌的風險度15。近期研究提示通過MRI的篩選可以提供遠高於乳房x線攝影術的靈敏度,但成本明顯較高16。研究設計對一組400個家族性乳腺癌病例和來自EPIC組的400個對照測定200,000個單核苷酸多態性(SNP)的基因型;這些SNP中顯示最強相關性的5。/。在基於額外群體的4,600個病例和4,600個對照系列中進行分析。在額外的大量病例-對照系列中證實了這一階段的正相關性。在乳腺癌終點外,許多定量表型可以在對照組中獲得並且提供遺傳分析的額外數據。它們包括與癌症風險相關的表型(例如乳房照相圖式、激素水平)。收率掃描評價了重複序列外全基因組間10%或10%以上頻率(且某些在5-10%的範圍)的單核苦酸多態性。它在佔乳腺癌總體遺傳成分中2°/。或2%以上的這些區中具有約80%檢測任何常見變體的可信度(power)。用於尋找常見易感性變體的研究設計鑑定常見低風險度等位基因的有效設計為病例/對照研究。與易感性相關的變體通過其在癌症病例中明顯高於為遺傳背景匹配的對照中的出現頻率來鑑定。在本研究中,變體為單核苷酸多態性(SNP)。最常見的是,並不了解可能與疾病易感性相關的活性或功能性變體,且由此研究依賴於可以報告推定的(但未知的)活性變體的一組"標籤"SNP。病例-對照相關性研究方法已經廣泛應用於基於"候選基因"的乳腺癌。先前已經以這種方式研究了接近100個基因的編碼區和內含子中的多態性。這些基因包括,例如,涉及性類固醇激素代謝、細胞周期控制和DNA修復的基因。儘管已經對常見變體提示了某些相關性,但是無一得到最終確立。迄今為止的結果提示乳腺癌風險中的大部分變異並非因可以作為乳腺癌候選物第一選擇的基因的基因內DNA中的變體所致。此外,對候選基因方法存在嚴重限制。它緩慢並且相對昂貴,依賴於基於SNPxSNP的、對測試的每一基因開發的測定法;它甚至對候選基因的覆蓋不完全,特別是在大部分情況中忽略了潛在的調控變異;並且它限於對疾病生物學目前的知識。作為對比,全基因組搜索具有在沒有任何現有功能或位置知識的情況下鑑定活性常見變體的潛能。基因組掃描SNP對基因組掃描的要求在於確定在報告基因組間所有其它SNP組時提供完整性與成本之間最佳折衷的一組SNP。PerlegenSciences(www.perlegen.com)已經通過對在人/嚙齒類動物體細胞雜合物中分離的20-50個單倍體基因組中的人基因組的非重複序列進行再測序鑑定了110萬個常用SNP標誌物(密度為每2kb有l個SNP)。這種SNP搜索基於與在Patil等17報導的第21條染色體研究中報導的類似的策略。他們由此使用動態編程算法18確定了一組200,000個標籤SNP,它們明確地才艮告了超過80%的由完整組l10萬個SNP確定的常見單倍型。在本實施例中使用的就是該組的200,000個標籤SNP。SNP在Affymetrix研發的高密度寡核苷酸陣列上分型,這些陣列已經在常規應用中得到了廣泛驗證。簡言之,陣列設計使用80個特徵(25聚物寡核苷酸)以查詢每一SNP。80個特徵包含10個交疊特徵組,其中每個特徵組包括對參比等位基因特異的4個特徵(l個完全匹配和3個錯配特徵)和針對可選(altemative)等位基因的4個類似特徵。通過比較參比等位基因的完全匹配特徵的螢光強度與為可選等位基因的完全匹配的那些,可以區分三種可能的SNP基因型(常見的純合子、雜合子和罕見純合子)。為了進行基因分型測定,使用多重(78路)短程PCR特異性擴增樣品基因組包含所關注SNP的區。合併來自每一個體的PCR產物並且用生物素標記以便生成靶DNA。使靶DNA與SNP分型高密度寡核苷酸陣列雜交。在過夜雜交後,洗滌陣列,染色並且掃描焚光強度。在本實施例中,將用於對200,000個SNP進行基因分型的特徵排列在一系列6個高密度陣列上,要求具有約30,000個SNP的複雜性的靶DNA用於雜交。這一複雜性的靶物產生97.3。/。的呼叫率(ca11rate)。高密度陣列基因分型技術與其它技術(實時PCR和螢光極化)的比較顯示了在大約20,000個基因分型中99%以上的一致索引(concordance),有多至20個不同的SNP。這項技術已經在使用來自多個合作臨床和研究實驗室的DNA時證實為確實的,並且在使用基因組擴增的DNA時良好地起作用。在本研究中使用的200,000個標籤SNP的特性在於其"報告"基因組內所有其它SNP變體的能力。就指定的可信度(power)而言,所需的樣本大小與l/r2成正比,其中r為所尋找的功能性變體與最緊密連鎖的標籤SNP之間的連鎖不平衡係數19。根據經驗通過對在28個無關個體(56條染色體)中基因組DNA的4Mb的一分布參見表l。對所有988個測試SNP而言(每個的最低等位基因頻率>10%),平均1"2為67°/(>,69。/。的SNP具有大於0.5的r2。表l表l:在不同於用於SNP發現的那些的28個個體的第21條染色體4Mb區段中測定的417個選擇的"標籤"SNP與988個"測試"SNP之間的—值分布。整組SNP的15。/。具有最低等位基因頻率l-10。/;85%具有大於10%的頻率,在10-50%之間均勻分布。所有測試SNP具有最低等位基因頻率"0。/。。417個的標籤SNP組的平均間距為每10kb有1個,與用於基因組掃描的200,000個的SNP組類似。表lr2測試SNP的Q/00.9-1.034%0.8-0.89腦0.7-0.799%0.6-0.699%0.5-0.598%0.4-0.496%0.3-0.397%0.2-0.297%0.1-0.198%0.0-0.092%增加200,000個的標籤SNP組增加了整個基因組中報告的SNP的比例,但增加了成本。甚至一組110萬個SNP也不會提供完全覆蓋,因為不能測定某些鹼基並且某些常見SNP因調查的染色體數目有限而缺失。我們的結論是200,000個的標籤SNP組在覆蓋度與成本之間提供了良好的折衷。先前的研究集中於癌症惡病質的遺傳學,包括更加集中於低外顯率易感性13'14,2"3。相關的主題包括(1)病例和對照組的組合;(2)乳腺癌易感性遺傳模型的開發;(3)用於相關性研究的實驗室設施的建立。(1)樣品集/乙靡;#病#差於舉#的遂。我們已經集合了基於群體的、在70歲以前診斷為攻擊性(invasive)乳腺癌的病例組(目前4900個),通過當地盎^f各魯癌症登記處(AnglianCancerRegistry)確定。從診斷到完成募集的中值時間為6個月(四分位數間距(interquartilerange)為3-9個月)。所有合格病例中65%提供了血樣。該組提供了用於我們研究第l階段分析的某些家族性病例和用於第2階段的基於群體的系列病例。在血樣外,受試者還完成了問巻,它包括二級親屬的家族史、生殖史、人乳餵養、口服避孕藥和HRT的應用、良性乳腺疾病、包括其它癌症的醫療史、吸菸、酒精、教育和種族。登記數據包括臨床階段、病理學等級和階段、簡單的治療數據和存活隨訪。目前有800個病例可獲得腫瘤的石蠟塊,並且如果可獲得資金,那麼大體上可以對整個組的大多數採集。#乙靡^病辦-家滋'/^邀。通過劍橋的家族性乳腺癌診所和上述基於群體的組,組合了具有明顯乳腺癌家族史或雙側原發性乳腺癌的一組200個以上病例,它們已經測試為^C47和5iC42突變呈陰性。這些病例與通過與其他CRUK小組合作獲得的類似病例共同構成用於相關性研究第一階段的"遺傳富集的"病例組。對,裙遂。本研究第1階段和第2階段的對照DNA獲自EPIC-Norfolk組24。這是多中心歐洲前瞻性癌症調查(MulticentreEuropeanProspectiveInvestigationofCancer)的一部分,即450,000個募集時年齡在45-70歲的男性和女性的基於強大(strong)群體的組,可得到他們的血液、多方面流行病學信息和隨訪。EPIC-Norfolk中25,000個參與者為從Norfolk的家庭醫療實踐確定的志願者,Norfolk在與獲得乳腺癌病例相同的盎格魯區內。在提供用於本計劃的基因發現期的對照外,更大的EPIC組提供了用於證實肯定相關性和隨訪階段調查基因/生活方式相互作用的樣品和數據。本研究群體在人種上較為同質,群體中超過95%記錄為白種人並且出生在英國。已經通過對23個非連鎖基因中SNP的1655個對照進行基因分型評價了該群體中的群體分層(stratification)的證據。發現非連鎖的基因座之間無顯著相關性,指示無分層證據25。五屍/C^,裙桌#裔#的《型,感。就與研究的相關性而言,對於在第l階段對200,000個SNP進行基因分型的400個EPIC對照,可獲得廣泛表型信息(在個體子集中)或易於獲得。對這些定量或半定量表型評價了基因型相關性。與乳腺癌相關的表型包括乳房照相密度、踵的骨密度、體重指數和血清中的一系列測量,其中迄今為止雌激素代謝物、SHBG、IGF-1和某些細胞因子早就可在不同個體集中得到。其它表型包括血壓、脂質譜、C-反應性蛋白、纖維蛋白原、全血計數、糖化血紅蛋白和曱狀腺功能。在2004和2005年,計劃進行有限的招回以便進行再訪視和進一步採血樣,有可能進行額外的表型分型並且採集新鮮血清和活細胞。(2)乳腺癌易感性的遺傳模型我們對在基於盎格魯群體的研究中確定的前1500例乳腺癌分析了5WC^7和5/C42中的突變,並且發現與Peto等一致,即僅15%的乳腺癌家族群聚可歸因於這些基因中的突變。我們對本研究中病例家族中的乳腺癌模式的分離分析(隨後對其他系列進行測試)產生了較早概括的多基因模型13。該模型繼而作為通過使用家族性而非未選擇的病例提供的相關性研究的增加可信度(power)的計算的基礎,其為用於本實施例提出的兩階段設計的基礎。(3)樣品處理和SNP基因分型的實^i殳置基於384孔Taqman平臺的中度流通量基因分型實驗室用於候選基因相關性研究。基因分型容量為約100,000個SNP每周。簡言之,實驗室設置如下。募集期給研究參與者指定代碼,該代碼作為條形碼貼在所有其數據及其生物學樣品管上。在實驗室內,使用實驗室信息管理系統(LaboratoryInformationManagementSystem,Thermo,AltringhamUK)跟蹤樣品。在WhatmanLtd(Ely,UK)的編碼管中從全血中分批提取DNA,每批96位受試者,並且返回到編碼陣列中,DNA標準化至40ng/ul。對標準化的陣列進行全基因組預擴增並且將產物以等分試樣儲存。從相等數目的病例和對照生成用於基因分型的384孔日常儲液(workingstock),插入空白孔作為陰性對照。複製來自一項研究的3%的樣品。如此,將病例和對照(上述)保持在13塊板中-12塊為獨特樣品和第13塊為複製品。對所有研究板同時進行基因分型-由機器人(Matrix,UK)加入試劑,在MJTetrads(GRI,UK)上進行熱循環,並且由7900序列檢測儀(ABI,Warrington,UK)進行終點焚光檢測。將基因型輸出至資料庫並且與每位受試者的表型數據連接。對對照基因型測試自哈迪-溫伯格平衡(Hardy-WeinbergEquilibrium)的偏離,作為最終的質量控制步驟。研究設計分階段組織本研究階段l.在為家族史富集的400個無關乳腺癌病例和從EPIC研究中抽取的400個女性對照中分析全組200,000個標籤SNP。對乳腺癌病例的B/CM7/2突變篩選為陰性。階段2.在額外的4600個乳腺癌病例和4600個匹配的對照中再次評〗介在癌症系列與對照系列之間的頻率中顯示出pO.05水平的顯著差異的SNP。研究設計的原理選擇分階段設計以便將所需的基因分型的量減少至最低限度,同時保持檢測對風險度具有適度(modest)作用的SNP的可信度(power)高。就建議的閾值,約10,000個SNP會進入第2階段,而預計在第2階段結束時進入其它研究的額外驗證的明顯更少(取決於"真實,,相關性的數目)。計算已經顯示這種分階段設計與對所有樣品的所有SNP進行基因分型相比非常有效27。病例-第l階段病例為攻擊性乳腺癌女性,其有至少兩名具有乳腺癌的一級親屬或同樣明顯的家族史(例如,l名一級和2名二級親屬患病)。這些女性選自英國癌症遺傳中心或盎格魯乳腺癌研究(AnglianBreastCancerStudy)。排除其種族不被記錄為白種人的女性。我們先前證實檢測相關性的可信度(power)與病例的家族史程度極為相關26。具有兩名患病一級親屬的病例的使用將所需樣本大小比使用未選擇的病例減小了至少4倍。從所有可得到的病例中,我們選擇了具有最強家族史的400個病例。如果l個以上病例獲自同一家族,那麼我們選擇具有最強的近親屬家族史的病例,使得在該集中的所有病例不相關。對所有病例篩選的5/C47和WC42中的突變(並且為陰性)。這種篩選包括,通過敏感性篩選技術(例如CSGE)篩選所有外顯子和剪接點。實施該方法是因為不了解影響5iC47或萬WC^突變非攜帶者中乳腺癌風險度的低外顯率等位基因是否也會影響攜帶者中的風險度。Antoniou等。的分析提示了攜帶者中類似的"多基因"成分。然而,可能的情況是,改變B及C47和萬/C42攜帶者中的風險度的基因可以不同,特別是考慮到B/C47腫瘤的區別性病理學。BAC^和5WC42突變可以存在於20。/。以上根據階段1所用標準選擇的病例中。如果所關注的多態性不影響攜帶者中的疾病風險度,那麼包括攜帶者可能降低研究的可信度(power)。如此,本研究保守地篩選並且排除已知BiC^和&C42突變攜帶者。估計該手段排除約70%的^04/突變和90%的萬及C42突變,使得在最終集中低於5%的病例可能包含有未鑑別的突變。病例-階段2階段2的病例由從基於群體的盎格魯乳腺癌(AnglianBreastCancer,ABC)研究中抽取的4,600個病例組成。儘管對在第l階段為使可信度(power)最大化和將成本降至最低限度而使用"富集的"病例存在爭議,病例在第2階段得到了更細緻地平衡。家族性病例的應用增加了可信度(power),但增益較不顯著,因為可信度(power)的主要決定因素在於第l階段的效率。同時,基於群體的病例-對照集已經用於候選基因相關性研究,並且來自第1階段的DNA樣品已經排成陣列。在這一規模上發展一組新的家族性病例要承擔可觀的延遲和費用。第二,使病例在地理上與對照匹配,從而提供更多對因等位基因頻率的區域變異導致的假陽性相關性的防護。第三,基於群體的系列提供了與每種SNP或單倍型相關的相對風險度的直接評估。第四,ABC研究已經系統性地採集了有關生活方式危險因素和癌症臨床結果的信息。這為研究與存活的相關性和與生活方式危險因素的相互作用的進一步分析提供了可能性。對家族性病例不可能獲得相同質量的信息。概括地說,通過使用富集的和基於群體的病例系列,我們優化了檢測真實相關性的可信度(power),同時獲得了在基於充分表徵的群體的病例-對照研究中進行基因分型的額外價值。對照第1和2階段的對照均為來自如上所述的EPIC研究的女性。對照的年齡分布與病例的類似。排除已知發生了癌症或非白種人的女性。第l階段對照取樣自2,000個絕經後女性的子組,她們已經進行了性類固醇激素和乳房照相密度的詳細分析28。已經獲得了覆蓋用於遺傳相關性研究的病例和對照樣品的使用的倫理批准。病例和對照均獲得其DNA用於這類遺傳研究的知情許可。統計學考慮統計學分析第l和2階段的主要分析均用於評價每種SNP分別與乳腺癌的相關性。流度的差異,但曰在非常年輕的年^段可能存日在1,1^指示^大多數易感性等位基^幾乎沒有隱性(recessive)成分(正如Antoniou等's的多基因模型中所述)。因此,主要分析基於病例與對照之間等位基因頻率差異的趨勢檢驗29。給病例加權家族史以便改善檢驗效率。原則上,單倍型分析或連接基因型分析(jointgenotypeanalysis)可以提供可信度(power)上的一定改善3、然而,在目前的設計中,單倍型分析大大過多,因為僅少部分SNP會進入第2階段,並且可信度(power)計算由此採取(assume)單一SNP分析。將一塊中的所有標籤SNP進入第2階段以便進行完整單倍型分析的成本可能會超過可信度(power)的任何提高。單倍型分析用於那些在同一LD塊中有1種以上相連SNP在第2階段分型的病例,並且廣泛應用於隨訪研究。可信度(power)計算研究的可信度(power)基於兩階段合併的限制性水平p-10"而推導出。預計約12個基因座在該水平上偶然具有顯著性(考慮到分階段設計),從而得到了用於在更大系列中再次檢驗的可控數目的基因座和有利的"真""假"陽性比。可信度(power)計算推定第l階段中的病例具有2個患病一級親屬的家族史。實際上,該可信度(power)稍高,因為這是最低的標準並且許多病例具有更明顯的家族史。檢測疾病易感性等位基因的可信度(power)的實例列於表2,對疾病等位基因頻率和親屬風險度的不同值,採用(assuming)來自標籤集的r2估算分布。(就具有.05等位基因頻率的多態性而言,如下計算可信度(power),即假設多態性在LD中,在DH,其中從集中隨機選擇常見的多態性。)就常見的等位基因而言,可信度(power)主要依賴於基因座對總體遺傳變異的貢獻,並且解釋(explaining)1%變異的基因座為至少50%,並且解釋2%變異的基因座為約80%。相反,就具有低於5%的頻率的等位基因而言,除非作用大小極高,否則可信度(power)極低。表2表2:採用(assuming)基於先前報告的數據(表l)的易感性基因座與標記SNP之間的一分布,檢測具有指定等位基因頻率的、賦予指定相對風險度(兩階段後P〈0001)的顯性易感性基因座的估算總可信度(power),。括號中解釋了總遺傳變異百分比。tableseeoriginaldocumentpage73tableseeoriginaldocumentpage74就對照中測得的定量性狀而言,檢測解釋至少5%的表型變異的基因座的可信度(power)為約50。/。,在5%的顯著性水平。這些基因座可用於即將在EPIC組中進行的大規模研究中的進一步評價。易感性基因座的詳細評價一旦鑑定了顯著相關性,就評價在嘗試建立最明顯相關的變體或單倍型的區中額外的多態性。一般規程與用於調查候選基因的方法類似。對可利用的資料庫搜索已知的SNP。如果對所有可利用的SNP未進行系統性搜索,那麼使用對有限數目個體(例如,n=48)的公司內部再測序。在排除完全LD中的SNP後,將用於第l和2階段的病例和對照中的提供信息的SNP進行基因分型。將多重邏輯斯諦回歸(multiplelogisticregression)用於調查多個SNP的聯合作用(jointeffect)。可以進行額外的調查以便鑑定功能性變體。定量性狀基因座的額外評價將利用在第1階段上表現出顯著相關性的、具有定量性狀的SNP在額外的系列中進行複製。因為定量性狀的數目較大,所以基於相關性強度、基因座的似真性(plausibility)和表型的重要性進行優先化(prioritization)。例如,與血清性類固醇激素水平和乳房照相密度的相關性得到有利的優先化,因為它們與乳腺癌風險度相關。與這些表型相關的SNP在來自EPIC的絕經後女性的額外1,600個樣品中分型。如果相關性重複,那麼將它們如上追蹤(pursue)。參考文獻1.CollaborativeGroupinHormonalFactorsinBreastCancer(2001)Familialbreastcancer:collaborativereanalysisofindividualdatafrom52epidemiologicalstudiesincluding58,209womenwithbreastcancerand101,986womenwithoutthedisease.Lancet358:1389-1399.2.LichtensteinPetal(2000)Environmentalandheritablefactors'inthecausationofcancer-analysesofcohortsoftwinsfromSweden,DenmarkandFinland.NewEnglJMed243:78-85.3.PetoJ,MackTM(2000)Highconstantincidenceintwinsandotherrelativesofwomenwithbreastcancer.NatureGenet26:411-414.4.AntoniouAetal(2003)Averagerisksofbreastandovariancancerassociatedwithmutationsin5iCM7ordetectedincaseseriesunselectedforfamilyhistory:acombinedanalysisof22studies.AmJHumGenet72:1117-1130.5.PetoJetal(1989)TheprevalenceofandmutationsamongstearlyonsetbreastcancercasesintheU.K.JNatlCancerInst91:943-949.6.TheAnglianBreastCancerStudyGroup(2000)Prevalenceof朋C47and朋C42mutationsinalargepopulationbasedseriesofbreastcancercases.BrJCancer83:1301-1308.7.EastonDF(1999)HowmanymorebreastcancerpredispositiongenesarethereBreastCancerRes1:1-48.FordDetal(1998)GeneticheterogeneityandPenetranceanalysisofthe朋C47and朋C42genesinbreastcancerfamilies.AmJHumGenet62:334-345.9.ThompsonDetal(2002)EvaluationoflinkageofbreastcancertotheputativeBRCA3locusonchromosome13q21in128multiplecasefamiliesfromtheBreastCancerLinkageConsortium.ProcNatlAcadSciUSA99:827-831.10.HuuskoPetal(2003)Genome-widescanningforlinkageinFinnishbreastcancerfamilies.EurJHumGenet,印刷中.11.AntoniouACetal(2001)Evidenceforfartherbreastcancersusceptibilitygenesinadditionto朋C47and朋C42inapopulationbasedstudy.GenetEpidemiol21:1-18.12.CuiJetal(2000)After朋C47and朋C42國whatnextMultifactorialsegregationanalysisofthree-generational,population-basedAustralianfemalebreastcancerfamilies.AmJHumGenet68:420-431.13.AntoniouACetal(2002)Acomprehensivemodelforfamilialbreastcancerincorporating5/C47,5/C42andothergenes.BritJCancer86:76-83.14.PharoahPDPetal(2002)Polygenicsusceptibilitytobreastcancerandimplicationsforprevention.NatureGenetics31:33-36.15.Titus-EmstoffLetal(1998)Menstrualfactorsinrelationtobreastcancerrisk.CancerEpidemiolBiomarkersPrev.7:783-9.16.Kriegeetal(2003)MRIscreeningforbreastcancerinwomenwithhighfamilialandgeneticrisk:FirstresultsoftheDutchMRIscreeningstudy(MRISC).ProcAmSocClinOncol22:A5.17.PatilNetal(2001)Blocksoflimitedhaplotypediversityrevealedbyhigh-resolutionscanningofhumanchromosome21.Science294:1719-1723.18.ZhangKetal(2002)Adynamicprogrammingalgorithmforhaplotypeblockpartitioning.ProcNatlAcadSciUSA99:7335-7339.19.PritchardJK,PrzeworskiM(2001)Linkagedisequilibriuminhumans:modelsanddata.AmJHumGenet69:1-14.20.DunningAMetal(1999)Asystematicreviewofgeneticpolymorphismandbreastcancerrisk.CancerEpidemiolBiomarkersPrevention8:843-854.21.HealeyCSetal(2000)Acommonvariantin朋C42isassociatedwithbothbreastcancerriskandprenatalviability.NatureGenet26:362-364.22.KuschelBetal(2002)VariantsinDNAdoublestrandbreakrepairgenesandbreastcancersusceptibility.HumMolGenet11:1399-140723.DunningAMetal(2003)ATGF|3-1signalpeptidevariantincreasessecretionvzYraandisassociatedwithincreasedincidenceofinvasivebreastcancer.CancerRes63:2610-15.24.DayNetal(1999)EPIC-Norfolk:studydesignandcharacteristicsofthecohort.EuropeanProspectiveInvestigationofCancer.BrJCancer80Suppl1:95-103.25.GoodeELetal(2001)Assessmentofpopulationstratificationinalargepopulation-basedcohort.GenetEpidemiol21:A126.26.AntoniouA,EastonDF(2003)Polygenicinheritanceofbreastcancer:implicationsfordesignofassociationstudies.GenetEpidemiol25:190-202.27.SatagopanJMetal(2002)Two-stageddesignsforgene-diseaseassociationstudies.Biometrics58:163-170.28.DunningAMetal(2004)Polymorphismassociatedwithcirculatingsex76hormonelevelsinpost-menopausalwomen.JNatlCancerInst,印刷中.29.SasieniPD(1997)Fromgenotypestogenes:doublingthesamplesize.Biometrics53:1253-1261.30.ChapmanJPetal(2003)Detectingdiseaseassociationsduetolinkagedisequilibriumusinghaplotypetags:aclassoftestsandthedeterminantsofstatisticalpower.HumHered56:18-31.實施例2:與乳腺癌惡病質相關的標誌物多態性鑑定為與乳腺癌風險(惡病質)相關的SNP列於圖1和2。圖l提供了目前最優選的關聯;圖2提供了別的關聯。指定dbSNP一rsID號(參見"REFSNP—ID",圖中第2欄)的序列見http:〃www.ncbi.nlm.nih.gov/SNP/。在圖1和2中,第2欄標記為"REFSNP—ID"。在該欄中的值為依照由位於美國國家衛生研究所(USNationalInstituteofHealth)的美國國家醫學圖書館(USNationalLibraryofMedicine)的NCBI建立並且維護的dbSNP資料庫的SNP識別號。NCBIdbSNP資料庫是公眾可訪問的並且可以通過搜索資料庫容易的得到大量別的信息,搜索使用圖中提供的rsID號,在資料庫搜索窗口中輸入以"rs"為前綴的號並點擊"搜索"。提供的信息可以包括但不限於位於該SNP基因座的等位基因、側翼的核苷酸序列和提交信息。SNP一ID欄號(見圖1和2的第1欄)註明公眾可得到的PerlegenSNP識別號,其可以在Perlegen(dot)com上使用該公司可在genome(dot)perlegen(dot)com/browser/index(dot)htm處得到的基因組瀏覽器按照所提供的指令查閱相關信息(PerlegenSciences,Inc.,MenloPark,CA)。正如所提供的指令中所述,可以在SNP—ID開始處加入通配符(例如,"*"符號)以便鑑定SNP的所有等位基因的信息。該資料庫還與NCBI基因組資料庫連結。在圖中,每頁上的第一行為具有各欄名稱的標題行。各欄如下:tableseeoriginaldocumentpage77tableseeoriginaldocumentpage78儘管為清楚和理解的目的在一定程度上詳細描述了上述發明,但是本領圍的情況下從形式和詳細內容上做出各種改變。例如,所有上述技術和設備均可以以不同的組合形式使用。為所有目的而將本申請中引述的所有出版物、專利、專利申請和/或其它文件完整地引入作為參考,其引入程度與如同為所有目的而指定將每篇出版物、專利、專利申請和/或其它文件分別引入作為參考相同。權利要求1.對生物體或其衍生的生物學樣品鑑定乳腺癌表型的方法,該方法包括檢測生物體或生物學樣品中的多態性或與之緊密連鎖的基因座,所述的多態性選自圖1或2的多態性,其中所述的多態性與乳腺癌表型相關;並且將所述的多態性或基因座與所述的表型建立相關性。2.權利要求l所述的方法,其中所述的生物體為哺乳動物或所述的生物學樣品衍生自哺乳動物。3.權利要求l所述的方法,其中所述的生物體為人類患者或所述的生物學樣品衍生自人類患者。4.權利要求l所述的方法,其中所述的檢測包括擴增多態性、連鎖基因座或與之相關的序列,並且檢測所得擴增子。5.權利要求4所述的方法,其中所述的擴增包括a)混合擴增引物或擴增引物對與分離自所述生物體或生物學樣品的核酸模板,其中所述的引物或引物對與鄰近或包含所述的多態性或連鎖基因座的區互補或部分互補,並且能夠在所述核酸模板上由聚合酶啟動核酸聚合;和b)使引物或引物對在包括聚合酶和模板核酸的DNA聚合反應中延伸以便生成擴增子。6.權利要求4所述的方法,其中通過包括如下一個或多個步驟的方法檢測所述的擴增子使該擴增子與陣列雜交;用限制酶消化該擴增子;或實時PCR分析。7.權利要求4所述的方法,包括對所述的擴增子進行部分或完全測序。8.權利要求4所述的方法,其中所述的擴增包括進行聚合酶鏈反應(PCR)、逆轉錄酶PCR(RT-PCR)或連接酶鏈反應(LCR),其中使用分離自所述生物體或生物學樣品的核酸作為PCR、RT-PCR或LCR中的模板。9.權利要求l所述的方法,其中所述的多態性或連鎖基因座包含單核苷酸多態性(SNP)。10.權利要求l所述的方法,其中所述的多態性包含選自圖1或2中等位基因的等位基因。11.權利要求l所述的方法,其中所述的多態性為選自下組的單核苷酸多態性SNPID2312116、SNPID1622530、SNPID3712013、SNPID1509710、SNPID843029、SNPID1990126、SNPID604819、SNPID3025734、SNPID1152499、SNPID4415909、SNPID1732681、SNPID4281579、SNPID4454457、SNPID2616199、SNPID1720694、SNPID4077723、SNPID3711990、SNPID3337858、SNPID4093095、SNPID4213825、SNPID3488617、SNPID3610210、SNPID3451239、SNPID1582533、SNPID3488150、SNPID2770052、SNPID4141351、SNPID1335030、SNPID2211665和SNPID4538418。12.權利要求l所述的方法,其中所述的多態性在選自下組的基因或基因座中FGFR2、A2BP1、TNRC9、H19、FSTL5、LSPl、LOC388927、UNQ9391、HCN1、LOC441192、TNRC9、NR3C2、KIAA0826、FLJ31033、AACS、FRMD4A和SEC31L2。13.權利要求12所述的方法,其中該方法包括檢測在多個所述基因中的多個多態性或連鎖基因座。14.權利要求12所述的方法,其中該方法包括檢測在FGFR2、A2BP1、TNRC9、H19和FSTL5每種中的至少一個多態性。15.權利要求12所述的方法,其中該方法包括衝企測SNPID2312116、SNPID1622530、SNPID3712013、SNPID1509710和SNPID843029每種的至少一個多態性。16.權利要求12所述的方法,其中該方法包括檢測如下每種的至少一個多態性SNPID2312116、SNPID1622530、SNPID3712013、SNPID1509710、SNPID843029、SNPID1990126、SNPID604819、SNPID3025734、SNPID1152499、SNPID4415909、SNPID1732681、SNPID4281579、SNPID4454457、SNPID2616199、SNPID1720694、SNPID4077723、SNPID3711990、SNPID3337858、SNPID4093095、SNPID4213825、SNPID3488617、SNPID3610210、SNPID3451239、SNPID1582533、SNPID3488150、SNPID2770052、SNPID4141351、SNPID1335030、SNPID2211665和SNPID4538418;或如下每種中的至少一個多態性FGFR2、A2BP1、TNRC9、H19、FSTL5、LSP1、LOC388927、UNQ9391、HCN1、LOC441192、TNRC9、NR3C2、KIAA0826、FLJ31033、AACS、FRMD4A和SEC31L2。17.權利要求l所述的方法,其中所述的連鎖基因座為距離所述多態性約5cM或5cM以下的緊密連鎖基因座。18.權利要求l所述的方法,其中將所述多態性或連鎖基因座與所述乳腺癌表型建立相關性包括參閱查閱表,該查閱表包含所述多態性或連鎖基因座的等位基因與所述乳腺瘴表型的相關性的信息。19.組合物,包含多個標誌物探針或擴增引物,該標誌物探針或擴增引物用於4企測或擴增多個選自下組的多態性SNPID2312116、SNPID1622530、SNPID3712013、SNPID1509710、SNP1ID'843029、SNPID1990126、SNPID604819、SNPID3025734、SNPID1152499、SNPID4415909、SNPID1732681、SNPID4281579、SNPID4454457、SNPID2616199、SNPID1720694、SNPID4077723、SNPID3711990、SNPID3337858、SNPID4093095、SNPID4213825、SNPID3488617、SNPID3610210、SNPID3451239、SNPID1582533、SNPID3488150、SNPID2770052、SNPID4141351、SNPID1335030、SNPID2211665和SNPID4538418。20.權利要求19所述的組合物,其中所述的標誌物探針或擴增引物在溶液中游離。21.鑑定乳腺癌表型的調控劑的方法,該方法包括使潛在的調控劑接觸基因或基因產物,其中所述的基因或基因產物包含選自下組的多態性或與之緊密連鎖SNPID2312116、SNPID1622530、SNPID3712013、SNPID1509710、SNPID843029、SNPID1990126、SNPID604819、SNPID3025734、SNPID1152499、SNPID4415909、SNPID1732681、SNPID4281579、SNPID4454457、SNPID2616199、SNPID1720694、SNPID4077723、SNPID3711990、SNPID3337858、SNPID4093095、SNPID4213825、SNPID3488617、SNPID3610210、SNPID3451239、SNPID1582533、SNPID3488150、SNPID2770052、SNPID4141351、SNPID1335030、SNPID2211665和SNPID4538418;並且檢測該潛在的調控劑對所述基因或基因產物的作用,由此鑑定該潛在的調控劑是否調控所述的表型。22.權利要求21所述的方法,其中所述的基因或基因產物包含選自下組的多態性SNPID2312116、SNPID1622530、SNPID3712013、SNPID1509710、SNPID843029、SNPID1990126、SNPID604819、SNPID3025734、SNPID1152499、SNPID4415909、SNPID1732681、SNPID4281579、SNPID4454457、SNPID2616199、SNPID1720694、SNPID4077723、SNPID3711990、SNPID3337858、SNPID4093095、SNPID4213825、SNPID3488617、SNPID3610210、SNPID3451239、SNPID1582533、SNPID3488150、SNPID2770052、SNPID4141351、SNPID1335030、SNPID2211665和SNPID4538418。23.權利要求21所述的方法,其中所述的作用選自(a)在有所述調控劑存在下所述基因或基因產物的表達升高或降低;(b)在有所述調控劑存在下所述基因產物的活性;和升高或降低(c)在有所述調控劑存在下所述基因或基因產物的表達圖式改變。24.治療乳腺癌表型的試劑盒,該試劑盒包含通過權利要求21所述方法鑑定的調控劑和將該調控劑施用於患者以便治療所述表型的說明書。25.對生物體或其衍生的生物學樣品鑑定乳腺癌表型的系統,該系統包含a)—組標誌物探針或引物,設置用於檢測一個或多個多態性或連鎖基因座的至少一個等位基因,其中所述的多態性選自SNPID2312116、SNPID1622530、SNPID3712013、SNPID1509710、SNPID843029、SNPID1990126、SNPID604819、SNPID3025734、SNPID1152499、SNPID4415909、SNPID1732681、SNPID4281579、SNPID4454457、SNPID2616199、SNPID1720694、SNPID4077723、SNPID3711990、SNPID3337858、SNPID4093095、SNPID4213825、SNPID3488617、SNPID3610210、SNPID3451239、SNPID1582533、SNPID3488150、SNPID2770052、SNPID4141351、SNPID1335030、SNPID2211665和SNPID4538418;b)檢測器,設置用於檢測來自該組標誌物探針或引物的一種或多種信號輸出或由該組標誌物探針或引物產生的擴增子,由此鑑定所述等位基因的存在與否;和c)系統指令,其將所述等位基因的存在與否與預測的表型建立相關性。26.權利要求25所述的系統,其中該組標誌物探針或引物檢測選自下組的基因中的多態性FGFR2、A2BP1、TNRC9、H19、FSTL5、LSP1、LOC388927、UNQ9391、HCN1、LOC441192、TNRC9、NR3C2、KIAA0826、FLJ31033、AACS、FRMD4A和SEC31L2。27.權利要求25所述的系統,其中該組標誌物探針或引物檢測多個所述基因或遺傳基因座中的多個多態性。28.權利要求25所述的系統,其中該組標誌物探針或引物檢測FGFR2、A2BP1、TNRC9、H19和FSTL5每種中的至少一個多態性。29.權利要求25所述的系統,其中該組標誌物探針或引物檢測選自SNPID2312116、SNPID1622530、SNPID3712013、SNPID1509710和SNPID843029多態性的至少一個多態性。30.權利要求25所述的系統,其中所述的檢測器檢測一種或多種光發射,其中所述的光發射指示所述等位基因的存在與否。31.權利要求25所述的系統,其中所述的指令包含至少一種查閱表,該查閱表包括所述等位基因的存在與否與所述表型之間的相關性。32.權利要求25所述的系統,其中該系統包含樣品。33.權利要求32所述的系統,其中所述的樣品包含基因組DNA、擴增的基因《且DNA、cDNA、擴增的cDNA、RNA或擴增的RNA。34.權利要求32所述的系統,其中所述的樣品衍生自哺乳動物。全文摘要提供了多態性與乳腺癌之間的相關性。提供了乳腺癌的診斷、預後和治療方法。提供了乳腺癌診斷、預後和治療的系統和試劑盒。還記載了鑑定乳腺癌調控劑的方法。文檔編號C12Q1/68GK101535500SQ200680051710公開日2009年9月16日申請日期2006年11月29日優先權日2005年11月29日發明者丹尼斯·巴林傑,布魯斯·龐德,戴維·考克斯,道格·伊斯頓申請人:佩勒根科學有限公司;劍橋企業有限公司

同类文章

一種新型多功能組合攝影箱的製作方法

一種新型多功能組合攝影箱的製作方法【專利摘要】本實用新型公開了一種新型多功能組合攝影箱,包括敞開式箱體和前攝影蓋,在箱體頂部設有移動式光源盒,在箱體底部設有LED脫影板,LED脫影板放置在底板上;移動式光源盒包括上蓋,上蓋內設有光源,上蓋部設有磨沙透光片,磨沙透光片將光源封閉在上蓋內;所述LED脫影

壓縮模式圖樣重疊檢測方法與裝置與流程

本發明涉及通信領域,特別涉及一種壓縮模式圖樣重疊檢測方法與裝置。背景技術:在寬帶碼分多址(WCDMA,WidebandCodeDivisionMultipleAccess)系統頻分復用(FDD,FrequencyDivisionDuplex)模式下,為了進行異頻硬切換、FDD到時分復用(TDD,Ti

個性化檯曆的製作方法

專利名稱::個性化檯曆的製作方法技術領域::本實用新型涉及一種檯曆,尤其涉及一種既顯示月曆、又能插入照片的個性化檯曆,屬於生活文化藝術用品領域。背景技術::公知的立式檯曆每頁皆由月曆和畫面兩部分構成,這兩部分都是事先印刷好,固定而不能更換的。畫面或為風景,或為模特、明星。功能單一局限性較大。特別是畫

一種實現縮放的視頻解碼方法

專利名稱:一種實現縮放的視頻解碼方法技術領域:本發明涉及視頻信號處理領域,特別是一種實現縮放的視頻解碼方法。背景技術: Mpeg標準是由運動圖像專家組(Moving Picture Expert Group,MPEG)開發的用於視頻和音頻壓縮的一系列演進的標準。按照Mpeg標準,視頻圖像壓縮編碼後包

基於加熱模壓的纖維增強PBT複合材料成型工藝的製作方法

本發明涉及一種基於加熱模壓的纖維增強pbt複合材料成型工藝。背景技術:熱塑性複合材料與傳統熱固性複合材料相比其具有較好的韌性和抗衝擊性能,此外其還具有可回收利用等優點。熱塑性塑料在液態時流動能力差,使得其與纖維結合浸潤困難。環狀對苯二甲酸丁二醇酯(cbt)是一種環狀預聚物,該材料力學性能差不適合做纖

一種pe滾塑儲槽的製作方法

專利名稱:一種pe滾塑儲槽的製作方法技術領域:一種PE滾塑儲槽一、 技術領域 本實用新型涉及一種PE滾塑儲槽,主要用於化工、染料、醫藥、農藥、冶金、稀土、機械、電子、電力、環保、紡織、釀造、釀造、食品、給水、排水等行業儲存液體使用。二、 背景技術 目前,化工液體耐腐蝕貯運設備,普遍使用傳統的玻璃鋼容

釘的製作方法

專利名稱:釘的製作方法技術領域:本實用新型涉及一種釘,尤其涉及一種可提供方便拔除的鐵(鋼)釘。背景技術:考慮到廢木材回收後再加工利用作業的方便性與安全性,根據環保規定,廢木材的回收是必須將釘於廢木材上的鐵(鋼)釘拔除。如圖1、圖2所示,目前用以釘入木材的鐵(鋼)釘10主要是在一釘體11的一端形成一尖

直流氧噴裝置的製作方法

專利名稱:直流氧噴裝置的製作方法技術領域:本實用新型涉及ー種醫療器械,具體地說是ー種直流氧噴裝置。背景技術:臨床上的放療過程極易造成患者的局部皮膚損傷和炎症,被稱為「放射性皮炎」。目前對於放射性皮炎的主要治療措施是塗抹藥膏,而放射性皮炎患者多伴有局部疼痛,對於止痛,多是通過ロ服或靜脈注射進行止痛治療

新型熱網閥門操作手輪的製作方法

專利名稱:新型熱網閥門操作手輪的製作方法技術領域:新型熱網閥門操作手輪技術領域:本實用新型涉及一種新型熱網閥門操作手輪,屬於機械領域。背景技術::閥門作為流體控制裝置應用廣泛,手輪傳動的閥門使用比例佔90%以上。國家標準中提及手輪所起作用為傳動功能,不作為閥門的運輸、起吊裝置,不承受軸向力。現有閥門

用來自動讀取管狀容器所載識別碼的裝置的製作方法

專利名稱:用來自動讀取管狀容器所載識別碼的裝置的製作方法背景技術:1-本發明所屬領域本發明涉及一種用來自動讀取管狀容器所載識別碼的裝置,其中的管狀容器被放在循環於配送鏈上的文檔匣或託架裝置中。本發明特別適用於,然而並非僅僅專用於,對引入自動分析系統的血液樣本試管之類的自動識別。本發明還涉及專為實現讀