新四季網

預測影響表型性狀的特定遺傳基因座的系統和方法

2023-12-02 20:42:11 2

專利名稱:預測影響表型性狀的特定遺傳基因座的系統和方法
技術領域:
本發明涉及用於預測影響表型性狀的染色體區域的系統和方法。
背景技術:
對調節疾病易感性的遺傳基因座進行識別有希望了解病理生理機制並研究出新的治療常規人類疾病的方法。家族研究清楚地證實了許多常規人類疾病具有可遺傳性因素,此哮喘、孤獨症、精神分裂症、多發性硬化、系統性紅斑狼瘡以及I型和II型糖尿病。要了解這一點可參見Risch,Nature 405,847-856,2000。在過去20年中,已在人類群體中通過連鎖分析和定位克隆識別了許多高通透性單基因(孟德爾式)疾病而囊性纖維化病、亨廷頓病和杜興肌營養不良的致病性遺傳突變。這些成功識別發生在相對較罕見的疾病中,在這些疾病中,某一物種基因組的遺傳組合物(基因型)和該物種表現出的一種或多種物理特徵(表型)之間有密切的關係。
希望同樣的方法可用於識別與普通人群中對常規疾病的易感性有關的遺傳變體。為了解這一點可參見Lander和Schork,Science 265,2037-2048,1994。用這些方法已經識別了與對一些常規疾病亞類的易感性有關的遺傳變體,所述疾病已乳腺癌(BRCA-1和-2)、結腸癌(FAP和HNPCC)、阿耳茨海默病(APP)和II型糖尿病(MODY-1、-2、-3),這使人們看到了希望。然而,這些遺傳變體僅在非常有限的患病人群中有強大效果(Risch,Nature,405,847-856,2000)。
儘管已經進行了很多工作,但是還未識別出造成普通人群中常規的非孟德爾式疾病易感性的遺傳變體。由於涉及多個遺傳基因座,且每個基因座對疾病整體易感性的貢獻很小,因此通過對人類群體使用常規的連鎖和定位克隆方法很難識別常規疾病易感性基因座。繪製人類群體疾病易感性基因的圖譜也受到表型變化、群體間的遺傳不均一性和不受控制的環境影響的妨礙。關於染色體lq42區域和系統性紅斑狼瘡之間連鎖的各種報告證實了人類遺傳研究中遭遇的困難。一個小組報導了lq42區域(Tsao,J.Clin.Invest,99,725-731,1997)以及該區域內基因(PARP)的微衛星等位基因之間存在強烈連鎖(Tsao,J.Clin.Invest.103,1135-1140,1999)。相反,未提到與PARP微衛星標記有關的證據(Criswell等,J.Clin.Invest,Jun;105,1501-1502,2000;Delrieu等,Arthritis Rheumatism 42,2194-2197,1999);並在一些被分析的其它SLE群體中發現了對lq42區域的最小連鎖(Mucenski等,Molecular Cellular Biology 6,4236-4243,1986)或無連鎖(Lindqvist等,Journal of Autoimmunity,Mar;14,169-178,2000)。可能將需要其它工具和方法來識別與常規人類疾病有關的遺傳因子。
分析人類疾病生物學的實驗性鼠遺傳模型可大大簡化對常規人類疾病遺傳易感性基因座的識別。實驗性鼠模型在遺傳分析時有以下優點可提供自交(純合的)親本品系、可控制繁殖、環境常規、可控制實驗幹涉以及便於獲得組織。已經描述了大量人類疾病生物學的鼠模型,其中許多在十年前甚至更長時間便可獲得。然而,在利用鼠模型識別複雜疾病遺傳易感性基因座方面的進展卻相對有限。對鼠模型的遺傳分析要求產生大量雜交後代、進行表型篩選並分析基因型。用常規的工具,這是一個艱苦、昂貴且費時的過程,這大大限制了在人類中進行確認之前可在小鼠內識別遺傳基因座的速度。為了解這一點可參見Nadeau和Frankel,Nature Genetics Aug;25,381-384,2000。
將表型差異,如對常規疾病的易感性與遺傳變異進行關聯中遇到的難度使本領域需要有其它工具來識別對質量性狀或表型貢獻最大的染色體區域。在這種情況下,迫切需要提供一種不使用雜交實驗或艱巨的PCR後處理等費時技術而將表型與生物基因組內一個或多個特定遺傳基因座相關聯的技術。
發明概述本發明提供了將表型與單一物種基因組中的一個或多個特定的遺傳基因座相關聯的計算機系統和方法。在所述方法中,單一物種多個有機體之間的表型差異與該有機體各個基因組內的差異和/或相似性相關聯。本發明首先基於多個有機體的多態性用計算機繪製出單元型圖譜。然後將與物種相關的表型分布與單元型圖譜中等位基因在各個單元型模塊(haplotype block)內的分布相比較,以在單元型圖譜內識別有可能調節或影響表型的單元型模塊。
本發明的一個方面提供了將單一物種的多種不同有機體可能表現的表型與該單一物種基因組內一個或多個特定基因座相關聯的方法。在該方法中,根據表型數據結構的差異和單元型模塊的差異之間的一致性給單元型圖譜內的單元型模塊記分。在一些具體實施方案中,所述表型數據結構代表許多不同有機體所表現的表型差異,且所述單元型圖譜包含多個單元型模塊。單元型圖譜內的各個單元型模塊代表基因組的不同部分。對單元型圖譜中多個單元型模塊內的每個單元型模塊進行記分。這樣就可在多個單元型模塊中識別出記分高於多個單元型模塊中所有其它單元型模塊的一個或多個單元型模塊。
在一些具體實施方案中,多個單元型模塊中的一個單元型模塊包含多個連續的單核苷多態性。在一些具體實施方案中,單元型模塊內的各個單核苷多態性在該單元型模塊其它單核苷多態性的閾距離(threshold distance)之內。在一些具體實施方案中,這種閾距離小於10兆鹼基或小於1兆鹼基。在一些具體實施方案中,對單元型模塊內SNP之間的距離沒有限制。
在一些具體實施方案中,多個單元型模塊中的一個單元型模塊表示多個單元型,並小於在單元型模塊中僅出現一次的單元型模塊所代表的單元型的截斷比例(cutoff percentage)。換句話說,任何給定的單元型模塊中不超過截斷比例的單元型僅由多個有機體中的單個有機體表現。在一些具體實施方案中,所述截斷比例在5%和30%之間。
本發明的一些具體實施方案還包括在記分之前生成單元型圖譜的步驟。所述單元型圖譜可通過各種不同方法生成。在一個這樣的方法中,在遺傳資料庫中識別候選單元型模塊。候選單元型模塊含有多個連續的單核苷多態性。在一些具體實施方案中,該候選單元型模塊內的每個單核苷多態性在該候選單元型模塊內其它單核苷多態性的閾距離之內。在一些具體實施方案中,對候選單元型模塊內的單核苷多態性之間的距離沒有限制。對候選單元型模塊進行記分。重複進行識別和記分直到該基因型資料庫中所有可能的候選單元型模塊都被識別,從而生成一組候選單元型模塊。然後,選擇在一組候選單元型模塊中具有最高記分的候選單元型模塊以繪製單元型圖譜。然後,從這組候選模塊中除去所選候選單元型模塊和與所選候選單元型模塊全部或部分重疊的各個候選單元型模塊。重複為單元型圖譜選擇候選單元型模塊並從保留的模塊組中除去所選模塊和所有與所選模塊重疊的模塊的過程,直到候選單元型模塊組中不再保留候選單元型模塊。用這種方法,包含各個候選單元型模塊的單元型圖譜被從候選模塊組中選出。在一些具體實施方案中,記分是候選單元型模塊中單核苷多態性的數目除以該模塊所代表的單元型數目的平方的結果。
本發明還提供了計算單元型模塊的差異和單一物種多個不同有機體所表現的表型差異之間的記分的方法。在一些具體實施方案中,這種記分包括如下計算單元型模塊的S值,S=-log(Dintra|Dinter|)]]>其中,∑Dintra是在單元型模塊中具有相同單元型的多個有機體中有機體的表型值的差異的總和,和∑Dinter是在單元型模塊中不具有相同單元型的多個有機體中有機體間的表型值的差異的總和。在一些具體實施方案中,這種記分包括如下計算單元型模塊的S值,S=(Dintra|Dinter|)]]>其中,∑Dintra和∑Dinter的含義如上。在一些具體實施方案中,S是上述比值的負數、倒數、負倒數、對數、負對數。在一些具體實施方案中,∑Dintra或∑Dinter被變成冪(例如1/2、2或10)。
在一些具體實施方案中,用本發明的系統和方法識別的一個或幾個特定遺傳基因座內的特定遺傳基因座的長度小於0.5兆鹼基,在0.5兆鹼基和2.0兆鹼基之間,或小於10兆鹼基。在一些具體實施方案中,用本發明的系統和方法研究的表型是糖尿病、癌症、哮喘、精神分裂症、關節炎、多發性硬化、風溼病、自身免疫疾病或遺傳病。在一些具體實施方案中,所述表型數據結構是微陣列表達數據。在一些具體實施方案中,用本發明的方法研究的所述單一物種是動物(如人或小鼠)、植物、果蠅、酵母、病毒或秀麗隱杆線蟲(C.elegant)。在一些具體實施方案中,單一物種的多個不同有機體的數量在5-1000個有機體之間。
除了提供將單一物種的染色體區域與該單一物種的有機體所表現的表型相關聯的方法,本發明的系統和方法還提供了闡述單一物種內的生物學途徑的方法。達到這一目的的一種方法包括以下步驟(i)在用上述方法獲得的多個單元型模塊中的一個或多個單元型模塊內選擇一種單元型。用來選擇該單元型的該單元型模塊的記分高於所述多個單元型模塊中所有或大多數其它單元型模塊。用該單一物種多個不同有機體的有機體基因型數據(用所選單元型表示)產生該單一物種的第二單元型圖譜。然後,對第二單元型圖譜內的單元型模塊進行記分。這種記分代表了表型數據結構的差異和所選單元型模塊的差異之間的一致性。對第二單元型圖譜中的每個單元型模塊重複在第二單元型圖譜中篩選單元型模塊和對所選單元型模塊進行記分的步驟,這樣便可識別出一個或多個記分高於第二單元型圖譜中的所有其它單元型模塊的第二單元型模塊。然後可建立單一物種的生物學途徑。這種途徑包括(a)單元型模塊內的基因座,從該單元型模塊中選擇出了單元型,和(b)來自一個或多個第二單元型模塊的基因座,所述模塊的記分高於其它單元型模塊。
在一些具體實施方案中,表型數據結構代表了對多個有機體所含多種細胞成分的測量。在一些具體實施方案中,所述表型數據結構包括多個有機體中每種生物的表型陣列,且各個表型陣列包含表型陣列所代表的有機體所含多種細胞成分的差異表達值。每個不同的表達值反過來代表(i)多個有機體中的一個有機體所含細胞成分的天然表達值和(ii)在有機體暴露於微擾之後有機體所含細胞成分的表達值之間的差異。在一些具體實施方案中,所述微擾是藥劑。在一些具體實施方案中,所述微擾是分子量小於1000道爾頓的化合物。
在本發明的一些具體實施方案中,多個不同有機體中的有機體是所述單一物種的成員、來自所述單一物種成員的細胞組織、或來自所述單一物種所述成員的細胞培養物。
本發明的另一方面提供了與計算機系統聯合使用的電腦程式產品。所述電腦程式產品包括計算機可讀的存儲介質和其中所含的電腦程式機制。所述電腦程式機制包括基因型資料庫、表型數據結構、單元型圖譜和表型/單元型處理模塊。所述基因型資料庫用來儲存單一物種多個不同有機體在基因組序列上的變化。所述表型數據結構代表多個不同有機體所表現的表型的差異。所述單元型圖譜包括多個單元型模塊,單元型圖譜中的每個單元型模塊代表所述單一物種基因組的不同部分。所述表型/單元型處理模塊用來將多個不同有機體所表現的表型與單一物種基因組中一個或多個特定遺傳基因座相關聯。所述表型/單元型處理模塊包括表型/單元型比較子程序。所述表型/單元型比較子程序包括對單元型圖譜中的單元型模塊進行記分的指令,這種記分代表了表型數據結構的變化和單元型模塊的變化之間的一致性;和再次執行對單元型圖譜中多個單元型模塊中的各個單元型模塊進行記分的指令的指令,從而可識別多個單元型模塊中記分高於該多個單元型模塊中所有其它單元型模塊的一個或多個單元型模塊。
本發明的另一方面提供了將多個不同有機體所表現的表型與單一物種基因組內一個或多個特定遺傳基因座相關聯的計算機系統。所述計算機系統包括中央處理單元和與該中央處理單元結合的存儲器。所述存儲器存儲基因型資料庫、表型數據結構、單元型圖譜和表型/單元型處理模塊,其中每個具有如上所述的功能。
附圖的簡要說明

圖1示出了如本發明一個具體實施方案所述的將表型與有機體基因組內的單元型模塊相關聯的計算機系統;
圖2示出了如本發明一個具體實施方案所述的將表型與有機體基因組內的單元型模塊相關聯的處理步驟;圖3A、3B和3C示出了所選單核苷多態性(SNP)數據和所選SNP數據代表的單元型;圖4A和4B示出了所選單核苷多態性(SNP)數據和所選SNP數據代表的單元型;圖4C示出了圖4A和4B所代表的各個品系的假想數量表型值;圖5示出了在48-58兆鹼基之間的小鼠染色體1上的單元型模塊,其中每一列代表不同的小鼠品系(有機體),每一行代表一個SNP。兩個可能的SNP等位基因分別用濃陰影和淡陰影表示,不確定的單元型(由於數據丟失)未用陰影表示;圖6A示出了用A/J、129、C57BL/6和CAST/Ei品系構建的染色體7(22.7Mb)上代表性的單元型模塊結構,其中每個單元型模塊用水平線隔開;圖6B示出了分別用3種(A/J、129和C57BL/6)和13種小鼠(MusMusculus)品系構建的單元型模塊的對比,其中出現在單元型模塊邊緣的SNP用線連接起來;圖7A表示,採用小鼠染色體1上的所有SNP,將單元型模塊中所包括的SNP總數的比例(方塊)和每個模塊內的SNP數目(鑽石形)作為小鼠品係數的函數;圖7B表示,採用小鼠染色體1上所有SNP,將每個模塊內的單元型數目作為分析品係數目的函數;圖8A、8B和8C表示根據本發明的一個具體實施方案,通過計算機將表型數據繪製成單元型模塊圖譜;圖9示出了MHC K單元型和染色體17上一個預測的單元型模塊結構之間的相關性,其中大等位基因用深陰影表示,較小的等位基因用淡陰影表示,沒有陰影表示缺失等位基因數據;圖10A示出了每個自交小鼠品系肺Cyplal基因的表達水平;圖10B示出了染色體12上Ahr基因座單元型模塊結構內的79個SNP如何形成三個單元型組,以及7個外顯子SNP(用a-g表示)如何使蛋白質內的胺基酸發生變化;圖11示出了用本發明的方法重新構建生物學途徑的操作步驟。
同樣的參考數字在若干附圖中表示相同的部分。
發明詳述本發明涉及基於單一物種有機體基因組的差異來建立單元型圖譜的計算機系統和方法。本發明還涉及在所述基因型圖譜內識別可能影響與該物種有關的表型性狀的單元型模塊的計算機系統和方法。所述識別步驟是通過評價等位基因在單元型圖譜中每個單元型模塊內的分布與所研究的單一物種相關表型數據匹配的好壞來進行的。
1.1示例系統的概述圖1顯示了將表型與有機體基因組內的一個或多個單元型模塊相關聯的系統20。
系統20優選包括·中央處理器22;
·主非易失性存儲器34,優選包括一個或多個硬碟裝置,以存儲軟體和數據,所述存儲器34通常受硬碟控制器32控制;·系統內存38,優選為高速隨機存取存貯器(RAM),以存儲系統控制程序、數據和應用程式,包括加載自非易失性存儲器34的程序和數據;系統內存38也可包括只讀存儲器(ROM);·用戶界面24,包括一個或多個輸入裝置,如滑鼠26和鍵盤30,和顯示器28;·任選的網絡接口卡36以與任何有線或無線通訊網絡連接;和·內部總線33以連接上述系統元件。
系統20的運轉主要受作業系統40控制,這由中央處理器22執行。作業系統40可存儲在系統內存38中。除了作業系統40,典型的系統內存38的設備包括·文件系統42,以控制訪問本發明所用的各種文件和數據結構;·表型/單元型處理模塊44,以將表型與單元型圖譜內的一個或多個單元型模塊相關聯;·基因型資料庫52,以存儲單一物種多個有機體基因組序列的差異;和·表型數據結構60,其包括與單一物種相關的一個或多個表型性狀內的已測差異。
在優選的具體實施方案中,表型/單元型處理模塊44包括·表型數據結構派生子程序46,以驅動代表單一物種不同有機體之間表型差異的表型數據結構;·單元型圖譜派生子程序48,以從單一物種多個有機體基因組的差異生成單元型圖譜80;和·表型/單元型比較子程序50,以比較表型陣列和單元型圖譜80,從而識別單元型圖譜80內的單元型模塊,其中,所述模塊內等位基因的分布與所研究物種所表現的等位基因的分布相匹配。
1.2示例性基因型資料庫通常由基因型資料庫52所代表的信息是單一物種基因組內基因座54的集合。對於每個基因座54,可獲得遺傳差異信息的有機體56表示在資料庫52中。對代表有機體56的每個基因座,提供了差異信息58。差異信息58是單一物種的有機體之間任何形式的遺傳變異。代表性的差異信息58包括但不限於單核苷多態性(SNP)、限制性片段長度多態性(RFLP)、微衛星標記、短串聯重複、序列長度多態性和DNA甲基化。基因型資料庫52的例子給在表1中。
表1—基因型資料庫來源的例子
1.3單元型模塊的構建圖2示出了按照本發明一個具體實施方案進行的方法。圖2所示方法的前幾個步驟由單元型圖譜派生子程序48(圖1)執行,生成包含單元型模塊的單元型圖譜。這些步驟可在基因型資料庫52包含SNP信息的情況下使用。基因型資料庫52被用作單元型圖譜派生子程序48的輸入。換句話說,單元型圖譜派生子程序48利用基因型資料庫52內的數據生成單元型模塊。
在詳細描述圖2所示步驟之前先簡單介紹單元型模塊。一般來說,單元型模塊代表物種多個有機體之間物種基因組內的多個連續SNP或其它遺傳變異(例如RFLPs、微衛星標記、短串聯重複、序列長度多態性或DNA甲基化)。圖3A的表302代表單元型模塊。在圖3A中,在單一物種基因組內有兩個SNPs(SNP1和SNP2),其相互鄰近。單一物種用有機體A-G表示。每個有機體都有一個SNP1和SNP2值,大值「1」或小值「0」。每個值表示SNP所代表的基因座上的核苷在該物種有機體基因座上是通常較多被發現(大值,「1」)或通常較少被發現(小值,「0」)。
在圖3A的有機體A中,用SNP1和SNP2表示的基因座上的各個核苷是在這些基因座上通常較多被發現的核苷。因此,SNP1和SNP2在有機體A中都有大值。相反,在圖3A的有機體B中,用SNP1和SNP2表示的基因座上的各個核苷是在這些基因座上通常較少被發現的核苷。因此,SNP1和SNP2在有機體B中都有小值。
在圖3中,有機體A和B有不同的單元型。在一個具體實施方案中,單元型是給定單元型模塊中給定的有機體SNP值的集合。例如,單元型是圖3中表示有機體的任意欄中的值。在圖3A中有機體A的單元型是1,1。在圖3A中有機體B的單元型是0,0。表304列出了圖3A表302中所表示的所有單元型以及具有這些單元型的物種內的有機體。
現在已經介紹了術語單元型模塊和單元型,便可描述圖2所示的方法了。在步驟202中,識別了用於研究的單一物種基因組內有多個連續SNP的候選單元型模塊。為做到這一點,單元型圖譜派生子程序48從它可獲得的第一個SNP開始,通過向模塊中添加其它連續SNP來繼續執行以建立單元型模塊,條件是(1)該SNPs在模塊在前SNP的閾距離之內,和(2)不超過在單元型模塊中僅出現一次的單元型的預置閾比例。當再在模塊中添加下一個連續SNP無法滿足上述兩個條件中的任一個時,就終止模塊形成。在一些具體實施方案中,(未顯示),不需要SNPs在模塊在前SNP的閾距離之內。在步驟204中終止模塊形成時,單元型圖譜派生子程序48為單元型模塊產生記分(步驟206)。
在不同的具體實施方案中,單元型模塊內SNPs之間的閾距離小於10兆鹼基,小於5兆鹼基,小於3兆鹼基,小於2兆鹼基,或小於1兆鹼基。在一些具體實施方案中,沒有閾距離要求。在一些具體實施方案中,單元型模塊內獨特單元型的預置閾比例在5-10、10-15、15-20、20-25、5-30、15-25、25-30、30-40之間,或大於40。
圖3示出了預置閾比例在步驟202中的應用。在圖3A中,候選單元型模塊302中有四個單元型。三個單元型[(1,1)、(0,0)和(0,1)]分別用用來構建候選單元型模塊的兩個有機體表示。因此,每個單元型在單元型模塊中不只出現一次。第四個單元型(1,0)僅用一個有機體表示。因此,第四個單元型在候選單元型模塊中僅出現一次;即單元型模塊302中25%的單元型僅用一個用來構建候選單元型模塊的有機體表示。如果步驟202的閾比例被設置成20,則模塊302將不被作為候選單元型模塊。另一方面,如果該閾比例被設置成30,則模塊302將被作為候選單元型模塊。在優選的具體實施方案中,該閾比例被設置成20,模塊302不被作為候選單元型模塊。在圖3B中,有三個單元型在單元型模塊306中出現一次以上[(1,1,1)、(0,0,0)、(0,1,1)]並有一個單元型僅出現一次(1,0,0)。在圖3C中,只有兩個單元型在單元型模塊310中出現一次以上[(1,1,1,1)、(0,0,0,0)]而其餘的單元型在模塊310中僅出現一次。因此,如果閾比例被設置成20,則模塊306而不是模塊310被作為單元型模塊;但是,如果閾比例被設置成30,模塊306將滿足條件。
圖3示出了與候選單元型模塊有關的另一方面。對候選單元型模塊中SNPs的數目沒有限制,只要滿足步驟202的標準即可。換句話說,對候選單元型模塊中SNPs的數目沒有限制,只要(i)模塊中的SNPs是連續的,(ii)每個SNP在有機體基因組內其它SNP的截斷距離之內,和(iii)模塊內單元型的截斷比例都不是獨有的。
如上所述,在識別出候選單元型模塊之後,將在步驟204中進行記分。在本發明的一個具體實施方案中,該記分是模塊中SNP的數目除以該模塊中不同單元型數目的平方。舉例來說,候選單元型模塊302(圖3A)的記分為2除以4的平方(0.125)。候選單元型模塊306(圖3B)的記分為3除以4的平方(0.188)。候選單元型模塊310(圖3C)的記分為4除以5的平方(0.160)。本領域的普通技術人員將了解,可用多種不同的記分機制來為候選單元型模塊記分,所有這些記分機制都在本發明範圍之內。例如,在一些具體實施方案中,步驟204所用的記分函數是用模塊中SNPs的數目除以該模塊中不同單元型的數目。在其它具體實施方案中,步驟204所用的記分函數是用模塊中SNP的數目除以該模塊中不同單元型數目的2次以上冪(例如3次冪)。
在步驟206中將判斷是否所有的候選單元型模塊都已由基因型資料庫52生成。可用許多方法來完成這種判斷。在一個具體實施方案中,如果資料庫52中不存在被認為可引發形成新單元型模塊的SNP,則所有可能的候選單元型模塊都已由基因型資料庫52生成(206-是)。如果為生成所有可能的模塊(206-否),則控制返回步驟202並開始試圖識別其它候選單元型模塊。
一旦基因型資料庫52中所有可能的候選單元型模塊都被識別(206-是),則可生成最終的單元型模塊結構(單元型圖譜)。最初,例如在步驟202中被識別的所有候選單元型模塊都符合條件。在步驟208中,符合條件的候選單元型模塊組中記分最高的候選單元型模塊被從最終的單元型模塊中選出,並從符合條件的候選單元型模塊中除去。在步驟210中,與步驟208所選單元型模塊重疊的任何單元型模塊被從符合條件的候選模塊中除去,因此忽略。當兩個模塊共享至少一個公共SNP時這兩個單元型模塊相互重疊。此時,在符合條件的單元型模塊中可能得到重疊的單元型模塊,這是因為步驟202-206被設計用來生成所有可能的符合條件單元型模塊,而不論這些模塊是否相互重疊。
在步驟212中將判斷符合條件的單元型模塊中是否存在任何單元型模塊。如果是(212-是),則返回步驟208,並使最終的單元型模塊中包含在其餘符合條件的候選模塊組中記分最高的候選單元型模塊。步驟208-212被重複,直到符合條件的單元型模塊組中不再有單元型模塊。重複進行步驟208選出的單元型模塊被識別為最終的單元型模塊(單元型圖譜)結構。
步驟202-214示出了得到單元型模塊圖譜的一種方法。步驟202-214被用於研究了少量自交品系(有機體)並可獲得SNP數據的物種。然而本發明不限於圖2步驟202-214所示的單元型模塊圖譜構建步驟。實際上,用各種方法生成的單元型模塊圖譜都可用於本發明的方法。例如,當所研究的物種是人,基因型資料庫52中存在大量有機體時,可採用下述方法Patil等,2001,Science 294,1719-1723;Daly等,2001,Nature Genetics 29,229-232;和Zhang等,2002,Proceedingsof the National Academy of Sciences of the United States of America 99,7335-7339。此外,本發明也不限於基於SNPs構建單元型模塊。可採用類似於這裡所述的方法用任何形式的遺傳變異來生成單元型模塊。可從以下遺傳變異來構建單元型模塊限制性片段長度多態性(RFLPs)、微衛星標記、短串聯重複、序列長度多態性和DNA甲基化。例如,Kong等描述了用微衛星標記生成人類單元型圖譜的技術。參見Kong等,2002,Nat.Genet 31,241-247。
1.4將單元型模塊繪製成表型數據的示例在步驟216中,識別了在最終的單元型模塊結構中與物種所表現的表型性狀最匹配的單元型模塊。這是通過就所研究物種所表現的表型性狀對最終單元型模塊結構中每個單元型模塊進行記分完成的。用圖4所示的假設的表型數據來闡述本發明一個具體實施方案的步驟216所用的記分函數。在該具體實施方案中,較低的記分說明表型和單元型模塊匹配得較好。記分函數評價了等位基因在單元型模塊內的分布與假設的表型數據匹配的好壞。由步驟216所用的記分函數生成的較好的記分在這裡是代表表型和單元型模塊之間較好匹配的任何記分。在步驟216的一些具體實施方案所用的一些記分函數中,較好的記分是較低的記分,而在步驟216的一些具體實施方案所用的其它一些記分函數中,較好的記分是較高的記分。
圖4示出了候選單元型模塊402和404。模塊404包括用有機體A和B代表的單元型(0,1,1,0),以及用有機體C和D代表的單元型(1,0,0,1)。模塊406包括用有機體A、C和D代表的單元型(1,0,1,1),以及用有機體B代表的單元型(1,0,0,1)。
圖4C示出了用來對候選單元型模塊402和404進行記分的假設的表型數據的值。假設的表型數據可代表所研究物種的一些表型,例如肺容量、血液膽固醇水平等。每個有機體的表型值用候選單元型模塊表示。因此,有機體A具有有6個任意單位的表型PA,有機體B具有有7.5個任意單位的表型PB,等等。
在這個示例性的具體實施方案中,用於步驟216(圖2)的記分函數是
S=-log(Dintra|Dinter|)]]>公式1其中,∑Dintra是在單元型模塊中具有相同單元型的多個有機體中有機體表型值的差異的總和,和∑Dinter是在單元型模塊中不具有相同單元型的多個有機體中有機體表型值之間的的差異的總和。
公式1是單元型組內的表型差異與單元型組之間平均表型差異的比值的負對數。
為了用公式1計算模塊402和404,需要考慮與組408(圖4C)表型值不同的所有組DAB=1.5DAC=14DAD=16DBC=12.5DBD=14.5DCD=2通過兩個單元型(0,1,1,0)和(1,0,0,1)計算候選單元型模塊402的記分S402。有機體A和B屬於一個單元型,而有機體C和D屬於其它單元型。
S402=-log(DAB+DCD|DAB-DCD|)]]>S402=-log(1.5+221-6.75)]]>S402=0.610
候選單元型模塊406的記分S402是通過考慮兩個單元型(1,0,1,1)和(0,1,0,0)計算的。有機體A、C和D屬於一個單元型,有機體B屬於其它單元型S4062=-log(DAC+DAD+DCDDACD-DB)]]>S406=-log(14+16+216-7.5)]]>S406=-0.576公式1列出的記分函數說明模塊402與圖4C的假設表型數據的匹配程度優於模塊模塊406。設計了公式1,故而單元型模塊圖譜中與單一物種所表現的表型更好匹配的單元型模塊相比與表型不匹配的單元型模塊有更加正的記分。
1.4.1另一種記分函數除了公式1,可用其它記分函數來對單元型模塊圖譜中每個單元型模塊記分。在一個具體實施方案中,所述記分函數是S=(Dintra|Dinter|)]]>公式2其中,∑Dintra和∑Dinter有與公式1相同的含義。公式2強調了本發明的優點。公式2能夠根據單元型模塊與單元型模塊所代表的有機體表型數據的匹配程度區別單元型圖譜內的單元型模塊。如上所述,公式2將為較好匹配表型數據的單元型模塊指派較小的數值,而為較差匹配表型數據的單元型指派較大的數值。公式2也可寫成S=-(Dintra|Dimter|)]]>公式3
其中,∑Dintra和∑Dinter有與公式1相同的含義。在公式3中,將為較好匹配表型數據的單元型模塊指派負數程度較低的數值,而為較差匹配表型數據3的單元型指派負數程度更高的數值。關鍵是,該記分函數能夠區分與所給表型更加匹配的單元型模塊和與所給表型不十分匹配的單元型模塊。
本領域的普通技術人員將了解,在步驟216中可以採用許多不同的記分函數。在一個具體實施方案中,記分函數可以是任何可區分與所研究的單一物種所顯示的表型比較匹配的單元型模塊和與該表型不十分匹配的單元型模塊的函數。在其它具體實施方案中,所述記分函數可以是公式1、2或3中任何一個,公式1、2或3的負數、公式1、2或3的倒數、或公式1、2或3的負倒數。再在其它具體實施方案中,記分函數可以是公式2的對數、公式2的比值的倒數的對數,或公式2的比值的其它函數。
1.4.2加權記分函數在本發明的一些具體實施方案中,在記分函數的比值的分子和/或分母中引入了權的概念。一些情況下,權是常數值。其它情況下,權的大小是用來與表型數據比較的單元型模塊所代表的有機體數目的函數、被考慮的單元型模塊中SNPs(或遺傳變異的其它形式,如RFLPs)數目的函數,或與該數值有關的其它方面。在一些具體實施方案中,記分被乘以權重因子。例如,在一些具體實施方案中,公式1的負log值被乘以代表被記分的單元型模塊大小和結構的權重因子。
在本發明的一些具體實施方案中,用於步驟216的記分函數的分子和/或分母被乘以一個冪(例如平方根、平方、或10次冪)。例如,在一些具體實施方案中,該記分函數是S=-(Dintra|Dinter|)]]>公式4已經揭示了許多不同的可用於步驟216的各種具體實施方案的記分函數。這些例子只是為了說明而不是限制。本發明的技術的有利之處在於它們可將影響物種表型的遺傳元件定位到物種基因組的特定區域。然後可分析用本發明的技術識別的基因組的特定區域以進一步識別影響物種所表現的特定表型的特定基因。
在本發明的一些具體實施方案中,公式1被用來對每個單元型模塊進行記分。將每個記分乘以反應被記分的單元型模塊大小和結構的的權以得到原始的匹配記分。然後減去平均原始記分並除以被記分的所有單元型模塊的標準差,以將這種原始的匹配記分標準化。所得記分表明了高於或低於平均記分的記分的標準差的數值。
1.5表型在本發明的一些具體實施方案中,上述技術被用來將所研究物種所表現的表型與染色體內的特定單元型模塊相關聯。因此,在一些具體實施方案中,本發明的方法將所研究物種所表現的表型與某一染色體區域相關聯,該區域小於0.5兆鹼基(Mb)、小於1Mb、小於2Mb、在0.5Mb和2Mb之間、小於3Mb、小於4Mb、在2Mb和5Mb之間、小於5Mb、小於10Mb、在1Mb和10Mb之間、小於15Mb或小於20Mb。
可用本發明分析的表型可以是任何複雜性狀(相對簡單孟德爾式性狀而言)。複雜性狀包括可連續測量的任何性狀。因此,例如,複雜性狀可以是高度、重量、血液中生物分子的水平、以及對疾病的易感性。在一些具體實施方案中,所研究的複雜性狀是複雜疾病,如糖尿病、癌症、哮喘、精神分裂症、關節炎、多發性硬化和風溼病。在一些具體實施方案中,所研究的表型是疾病的臨床指標,例如但不限於,高血壓、異常甘油三酯水平、異常膽固醇水平、或異常高密度脂蛋白/低密度脂蛋白水平。在本發明的特定具體實施方案中,所述表型是對特定昆蟲或病原體感染的抵抗力弱。可用本發明的系統和方法研究的其它示例性表型包括變態反應、哮喘和強迫性神經失調,如驚恐性障礙、恐怖症和創傷後精神緊張性(精神)障礙。
可用本發明的方法研究的其它表型還包括以下疾病,如自體免疫性疾病(例如艾迪生病、斑禿、強直性脊柱炎、抗磷脂症候群、白塞病、慢性疲乏症候群、克羅恩病和潰瘍性結腸炎、糖尿病、纖維肌痛、肺出血腎炎症候群、移植物抗宿主病、狼瘡、梅尼埃病、多發性硬化、重症肌無力、肌炎、尋常型天皰瘡、原發性膽汁性肝硬變、銀屑病、風溼熱、結節病、硬皮病、血管炎、白癜風和韋格納氏肉芽腫病)、骨病(例如軟骨發育不全、骨癌、進行性骨化性纖維發育不良、纖維性結構不良、累-卡-佩三氏病、骨髓瘤、成骨不全、骨髓炎、骨質疏鬆、佩吉特病和和脊柱側彎)。
可用本發明的方法研究的其它表型包括癌症,例如膀胱癌、骨癌、腦瘤、乳腺癌、宮頸癌、結腸癌、婦科癌症、何杰金病、腎癌、喉癌、白血病、肝癌、肺癌、淋巴瘤、口腔癌、卵巢癌、胰腺癌、前列腺癌、皮膚癌和睪丸癌。
可用本發明的方法研究的其它表型包括遺傳病,如軟骨發育不全、全色盲、酸性麥芽糖酶缺乏症、腦白質腎上腺萎縮症、艾卡迪症候群、α-1抗胰蛋白酶缺乏症、雄激素不敏感症候群、阿佩爾症候群、發育異常、共濟失調毛細血管擴張症、藍色橡皮皰樣痣症候群、卡納萬病、貓叫症候群、囊性纖維化病、德卡姆病、範科尼貧血、進行性骨化性纖維發育不良、脆性X症候群、半乳糖血症、戈謝病、血色素沉著病、血友病、亨廷頓病、赫爾利症候群、磷酸酶過少症、克蘭費爾特症候群、克臘伯氏病、蘭-吉症候群、腦白質營養不良、QT間期延長症候群、馬方症候群、莫比烏斯症候群、粘多糖貯積症(mps)、指甲-髕骨症候群、腎性尿崩症、神經纖維瘤病、尼曼-皮克病、成骨不全、卟啉病、普拉德-威利症候群、吉福德氏症候群、Proteus症候群、視網膜母細胞瘤、蕾特氏症候群、魯賓斯坦-泰比症候群、山菲立普症候群、Shwachman症候群、鐮狀紅細胞病、Smith-Magenis症候群、Stickler症候群、泰-薩克斯病、血小板減少-橈骨缺失(tar)症候群、特雷歇·柯林斯氏症候群、三體性、結節性硬化症、特納症候群、尿素循環障礙、多發性成血管細胞瘤病(Von Hippel-Lindau disease)、瓦爾敦堡症候群、威廉斯症候群和威爾遜病。
可用本發明的系統和方法研究的其它表型包括心絞痛、發育異常、動脈粥樣硬化/動脈硬化、先天性心臟病、心內膜炎、高膽固醇、高血壓、QT間期延長症候群、二尖瓣脫垂、正體位心動過速症候群(posturalorthostatic tachycardia syndrome)和血栓症。
可用本發明的系統和方法研究的其它表型還包括有機體的壽命、有機體血液內抗體的基礎血漿水平、有機體接受微擾後有機體血液內抗體的血漿水平、有機體接受緩解疼痛的藥物後疼痛模型中的有機體的反應等等。
1.6示例性表型數據在本發明的一些具體實施方案中,表型數據結構60是微陣列表達數據。微陣列能夠定量測量數千個基因的表達水平;使其能夠生成品系和組織特異性基因表達數據的龐大資料庫。參見,例如,Zhao等,1995,「High-density cDNA filter analysisa novel approach forlarge-scale,quantitative analysis of gene expression」,Gene 156207-213;Blanchard等,1996,「Sequence to ArrayProbing the genome′s secrets」,Nature Biotechnology 141649;Blanchard等,1996,「High-DensityOligonucleotide Arrays」,Biosensors Bioelectronics 11687-90;Chee等,1996,「Accessing Genetic Information with High-Density DNAArrays」,Science 274610-614;Chait,1996,「Trawling for proteins in thepost-genome era」,Nat.Biotech.141544;DeRisi等,1996,「Use of a cDNAmivroarray to analyze gene expression pattern in human cancer」,NatureGenetics 14457-460;以及DeRisi等,1997,「Exploring the metabolic andgenetic control of gene expression on a genomic scale」,Science278680-686;Schena等,1995,「Quantitative moaitoring of geneexpression patterns with a complementary DNA micro-array」,Science270467-470;Schena等,1996,「Parallel human genome analysis;microarray-based expression nomitoring of 1000 genes」,Proc.Natl.Acad.Sci.USA 9310614-10619;Shalon等,1996,「A DNAmicroarray system for analyzing complex DNA samples using two-colorfluorescent probe hybridization」,Genome Res.6639-645。
在本發明的一些具體實施方案中,微陣列上基因或基因產物的平均表達水平被用作輸入,數據的變化被用作權重因子。這便可以更加精確地通過計算機將品系特異性基因表達數據繪製成單元型模塊。參見例如下面實施例2中的應用實例3。
1.6.1常規微陣列在本發明的一些具體實施方案中,表型數據結構60包括測量單一物種的有機體56的轉錄狀態。在一些具體實施方案中,轉錄狀態測量是通過將探針與由固相構成的微陣列雜交完成的。固相表面是被固定的多核苷酸群,如DNA或DNA模擬物群,或者是RNA群。微陣列可被用於,例如,分析細胞的轉錄狀態,比如與分級水平的目標藥物接觸的細胞的轉錄狀態。
在一些具體實施方案中,微陣列包括一具有有序結合(例如雜交)位點陣列的表面,以結合細胞或有機體基因組內的許多基因,優選是大多數或幾乎全部基因。微陣列可用許多方法製造,下面描述了其中一些方法。無論用什麼方法製造,微陣列都具有以下特徵陣列是可複製的,以便能夠製造所給陣列的多個拷貝並且容易相互比較。優選地,所述微陣列較小,通常小於5cm2,且它們是用在結合(例如核酸雜交)條件下穩定的材料製成的。優選地,微陣列上的某一給定的結合位點或獨特的結合位點組將與細胞內單基因的產物(例如特定的mRNA、或其衍生的特定的cDNA)特異性結合(例如雜交)。然而,通常,其它相關或類似序列將與給定的結合位點雜交。儘管每個特定的RNA或DNA可有一個以上的物理結合位點,為澄清下面的討論,將假定一個單一的完全互補的結合位點。
如本發明一個具體實施方案所述的微陣列包括一個或多個測試探針,其中每個具有與待測RNA或DNA亞序列互補的多核苷酸序列。每個探針優選含有不同的核酸序列。固體表面上每個探針的位置優選是已知的。在一個具體實施方案中,所述微陣列是高密度陣列,優選其密度為每平方釐米有60個以上的不同探針。在一個具體實施方案中,所述微陣列是一種陣列(例如矩陣),其中每個位置代表基因編碼產物(例如mRNA或其衍生的cDNA)的不連續的結合位點,且其中的結合位點代表物種基因組中大多數或幾乎全部基因的產物。例如,結合位點可以是DNA或DNA類似物,特定的RNA可與其特異性雜交。所述DNA或DNA類似物可以是,例如合成的寡聚體、全長cDNA、非全長cDNA或基因片段。
儘管在一些具體實施方案中微陣列含有與單一物種基因組中所有或幾乎所有基因產物結合的結合位點,但這是不必要的。一些情況下,微陣列將結合與基因組中至少50%、至少75%、至少85%、至少90%或至少99%的基因相對應的位點。優選地,微陣列含有與感興趣的藥物的作用有關、或在感興趣的生物學途徑中的基因的結合位點。「基因」是指編碼優選至少有50、75或99個胺基酸的序列的開放讀框(「ORF」),其在有機體或多細胞生物的一些細胞中可以轉錄出信使RNA。可根據有機體表達的mRNA的數目,或通過從已經定性的基因組部分外推來估計基因組中基因的數目。當對感興趣的有機體的基因組進行測序時,可通過分析DNA序列來確定ORF的數目和識別mRNA編碼區。例如,釀酒酵母(Saccharomyces cerevisiae)的基因組已被完全測序,據稱其含有約6275個長度大於99個胺基酸的ORF。對ORF的分析說明有5885個ORF可能編碼蛋白質產物(Goffeau等,1996,Science 274546-567)。
1.6.2製備微陣列探針如上所述,在本發明的一些具體實施方案中,與特定多核苷酸分子特異性雜交的「探針」是互補的多核苷酸序列。在一個具體實施方案中,微陣列探針是與物種基因組中每個基因的至少一部分相對應的DNA或DNA「模擬物」(例如衍生物和類似物)。在一些具體實施方案中,微陣列探針是互補的RNA或RNA模擬物。
DNA模擬物是由能夠與DNA發生特異性Watson-Crick樣雜交、或與RNA特異性雜交的亞單位構成的聚合物。核酸可在鹼基部分、糖部分、或磷酸主鏈上被修飾。示例性的DNA模擬物包括例如硫代磷酸酯。
例如可通過聚合酶鏈式反應(「PCR」)擴增基因組DNA、cDNA(例如通過RT-PCR)克隆序列的基因區段來獲得DNA。優選基於已知的基因或cDNA序列選擇PCR引物,這樣可擴增獨特片段(例如與微陣列上任何其它片段共享的連續相同序列不超過10個鹼基的片段)。此領域熟知的電腦程式可被用來設計具有所需特異性和最佳擴增特性的引物,例如Oligo 5.0版(National Biosciences)。一般來說,微陣列的每個探針的長度在約20-12,000個鹼基之間,通常在約300-2,000個鹼基之間,再通常在約300-800個鹼基之間。PCR法是此領域熟知的,並描述在例如Innis等編,1990,PCR ProtocolsA Guide to Methods andApplications,Academic Press Inc.,San Diego,Calif中。
另一種製造微陣列多核苷酸探針的方法是通過分析合成的多核苷酸或寡核苷酸,例如使用N-磷酸鹽或亞磷醯胺(Froehler等,1986,Necleic Acid Res.145399-5407;McBrid等,1983,Tetrahedron Lett.24246-248)。合成序列的長度通常在約15-500個鹼基之間,更通常在約20-50個鹼基之間。在一些具體實施方案中,合成的核酸包括非天然的鹼基,例如但不限於肌苷。如上所述,核酸類似物可用作雜交結合位點。合適的核酸類似物的一個例子是肽核酸(參見,例如,Egholm等,1993,Nature 363566-568;美國專利No.5,539,083)。
在其它具體實施方案中,雜交位點(例如探針)是從基因、cDNA(例如表達的序列標記)或其插入片段的質粒或噬菌體克隆製造的(Nguyen等,1995,Genomics 29207-209)。
1.6.3將探針附到微陣列的固體表面探針被附到用例如玻璃、塑料(例如聚丙烯、尼龍)、聚丙烯醯胺、硝酸纖維素膜或其它物質製造的固體支持物或表面。優選的將核酸附到表面的方法是在玻璃板上印刷,該方法通常如Schena等,1995,Science 270467-470的描述。該方法對於製備cDNA微陣列特別有效。
第二種優選的製備微陣列的方法是製造高密度寡核苷酸陣列。用來製造陣列的技術是已知的,該陣列在表面上規定的部位含有數千個與已知序列互補的寡核苷酸,其採用光版印刷技術以原位合成(參見Fodor等,1991,Science 251767-773;Lockhart等,1996,NatureBiotechnology 141675;美國專利No.5,578,832;5,556,752和5,510,270),或採用其它方法以迅速合成並保存規定的多核苷酸(Blanchard等,Biosensors Bioelectronics 11687-690)。當使用這些方法時,可在載玻片等表面直接合成已知序列的寡核苷酸(例如20-mers)。通常,所製造的陣列是豐餘的,每個RNA有數個寡核苷酸分子。可選擇寡核苷酸探針來檢測可選的已剪接的mRNA。
也可使用其它方法來製造微陣列,例如通過標記(Maskos和Southern,1992,Nuc.Acids.Res.201679-1684)。總之,可使用任何陣列類型,例如尼龍雜交膜上的斑點印跡。
1.6.4表型數據的其它來源本發明為表型數據結構60提供了其它表型數據來源(圖2)。例如,除了上述微陣列技術,可用此領域已知的基因表達技術測量細胞的轉錄狀態。其中一些技術製造複雜度有限的限制性片段的庫以進行電泳分析,如將雙限制性酶解與取相引物聯合的方法(參見,例如,Zabeau等的歐洲專利534858 A1,1992年9月24日提交),或用與規定的mRNA終點靠近的位點選擇限制性片段的方法(參見,例如Prashar等,1996,Proc.Natl.Acad.Sci.U.S.A.93659-663)。其它方法統計學取樣cDNA庫,如通過測序多個cDNA中每個cDNA內足夠數量的鹼基(例如20-50個鹼基),或通過測序短標記(例如9-10個鹼基),這種短標記是在相對於規定的mRNA末端的已知位置產生(參見,例如Velculescu,1995,Science 270484-487)。
在本發明的各種具體實施方案中,可測量生物狀態而不是轉錄狀態方面,如翻譯狀態、活性狀態、或其混合方面,以得到表型數據結構60的表型數據。這些具體實施方案在該部分內有詳細描述。
翻譯狀態的測量。可用幾種方法測量翻譯狀態。例如,可通過構建微陣列來檢測蛋白質的完整基因組(例如「proteome」,Goffea等,同上),其中結合位點包括固定的,優選單克隆的,對細胞基因組編碼的多種蛋白質種類特異的抗體。優選的,抗體存在於編碼蛋白質的實質性部分,或至少存在於與感興趣的藥物的作用有關的那些蛋白質中。製造單克隆抗體的方法是已知的(參見,例如,Harlow and Lane,1988,AntibodiesA Laboratory Manual,Cold Spring Harbor,N.Y.)。用這種抗體陣列,使細胞的蛋白質與陣列接觸,並用此領域已知的測定方法測定了它們的結合。
或者,可通過雙相凝膠電泳系統分離蛋白質。雙相凝膠電泳是此領域熟知的,通常包括在第一相進行等電聚焦然後在第二相進行SDS-PAGE電泳。參見,例如,Hames等,1990,Gel Electrophoresis ofProteinsA Practical Approach,IRL Press,New York;Shevchenko等,1996,Proc.Natl.Acad.Sci.U.S.A.931440-1445;Sagliocco等,1996,Yeast121519-1533;和Lander,1996,Science 274536-539。可用許多技術分析所得電泳圖譜,包括質譜技術、western印跡、以及用多克隆和單克隆抗體進行免疫印跡分析、以及內部和N-末端微測序。使用這些技術能夠識別所有蛋白質的主要部分,這些蛋白質在給定的生理條件下,包括在接觸藥物的細胞中(如在酵母中),或在通過例如刪除或過表達特定基因修飾的細胞中產生的。
活性狀態測量。在本發明的一些具體實施方案中,用來構建表型數據結構60的表型數據是單一物種有機體56的蛋白質的活性狀態測量。活性測量可通過任何適合已定性的特定活性的功能、生化、或物理方法來進行。這裡所述的活性包括化學轉化、可與天然物質聯繫的細胞蛋白質、以及測量的轉化率。這裡所述的活性包括多聚單元內的關聯,例如一種活性的DNA結合複合物與DNA的關聯。相關蛋白質的量或關聯的繼發性結果,如轉錄的mRNA的量,可被測量。同時,當僅僅知道功能活性時,例如在細胞周期中(控制),可觀察到功能表現。無論已知或測量過,可用本發明的方法將形成應答數據的蛋白質活性的變化與單元型模塊相匹配。
生物數據的多個方面。在另一個且非限制性的具體實施方案中,表型數據結構(圖2)可用單一物種多個不同有機體內的細胞成分(例如基因、蛋白質、mRNA、cDNA等)的生物狀態的多個方面來形成。例如,可從例如某些mRNA豐度的變化、某些蛋白質豐度的改變以及某些蛋白質活性的變化的組合來構建應答數據。
除了該部分提供的實施例,任何數目的數據來源都可用來定量測量複雜性狀。例如,可分析血液中的化合物的水平,可使用糖尿病測量模型等。
1.7物種和有機體本發明的系統和方法可用於將表型與許多物種內的染色體位置相關聯。在本發明的一些具體實施方案中,被研究的物種是動物,如哺乳動物、靈長目、人、大鼠、狗、貓、雞、馬、牛、豬、小鼠或猴。在其它特定的具體實施方案中,所研究的物種是植物、果蠅、酵母、病毒或秀麗隱杆線蟲(C.elegant)。然而,據信使用高度自交的有機體(例如各種小鼠品系)將得到較好結果。物種的各個有機體是該物種(例如特定的小鼠品系)的成員、來自該物種(例如獲自特定小鼠品系的小鼠品系)成員的細胞組織或器官、或來自該物種成員的細胞培養物。
1.8影響計算機分析性能的因子許多因子會影響計算機分析的性能。當表型數據結構60(圖1)反應了基因型資料庫52中單元型模塊內存在的遺傳變異時,本發明的方法表現較好。對一些標準有機體56(品系)而言,表型數據結構60或單元型信息內缺乏信息都不利於根據經驗繪製圖譜的表現。被分析的有機體56的數目是另一個重要的因素。計算機預測是基於被比較的不同有機體56的數目。成對比較的數目是被分析的品係數目的組合函數。覆蓋40-50中通常使用的雜交小鼠品系的單元型圖譜將使本發明的計算機預測方法具有識別可調節許多疾病相關表型性狀的遺傳基因座的能力。
在本發明的一些具體實施方案中,在基因型資料庫52中有5-1000個有機體56的基因型數據。在本發明的一些具體實施方案中,在基因型資料庫52中有10-100個有機體56的基因型數據。在本發明的一些具體實施方案中,在基因型資料庫52中有20-75個有機體56的基因型數據。
1.9闡明生物學途徑圖11示出了用本發明的系統和方法闡述被研究的單一物種內存在的生物學途徑的方法。這裡所用的生物學途徑是指任何生物過程,其中基因或基因產物會影響被研究的物種內其它基因或基因產物的表達或功能。
在步驟1102中,被研究的單一物種的第一單元型圖譜是用基因型資料庫52中的一組有機體56的基因型數據構建的。這可通過,例如,採用步驟202-214來完成(圖2)。然後,在步驟1104中,在第一單元型圖譜中識別與被研究的單一物種所表現的表型性狀高度匹配的第一單元型模塊。這可通過,例如,採用與圖2的步驟216有關的上述技術來完成。
在所述方法的這個階段,在步驟1104中識別的單元型模塊內的單元型被檢查。模塊內的每個單元型用基因型資料庫52內的一個或多個有機體56表示。在步驟1106中,在步驟1104中識別的單元型模塊內的單元型被選出,並在步驟1108中,僅用來自資料庫52(圖2)內的有機體56的數據58構建了第二單元型圖譜,它在步驟1106識別的單元型中。由於只用有機體56的一個亞組來構建第二單元型圖譜,所以第二單元型圖譜內的單元型模塊可能與第一單元型圖譜內的模塊不同。構建第二單元型圖譜是有利的,因為它提供了將基因型資料庫52細分成亞組的方法。分析這些亞組反過來可以識別影響被研究的物種內感興趣的表型的其它基因。圖11中其它的步驟提供了一種可分析這些亞組的方法。然而,本領域的普通技術人員將知道,可對包括圖11的步驟1110-1120在內的方法進行許多改進,所有這些改進都在本發明範圍之內。
在步驟1110中將決定第二單元型圖譜內是否有與表型性狀相關的單元型模塊。在非常規情況下,第二單元型圖譜中的單元型模塊將不與在步驟1104中識別的第一單元型模塊重疊。如果發現第二單元型圖譜中有與表型性狀相關的單元型模塊(1110-是),則就闡明了一種生物學途徑,該途徑包括(i)來自步驟1104中識別的第一單元型模塊的基因座,和(ii)來自步驟1110中識別的單元型模塊的基因座。
執行步驟1114的一個例子敘述在下面的1.10.3部分中。在1.10.3部分中識別了與小鼠中Cyplal表達相關的單元型模塊(步驟1104)。如1.10.3部分的詳細描述,這種單元型模塊包括包含芳香烴受體(Ahr)基因座在內的部分小鼠基因組。這種單元型模塊如圖10B所示。在1.10.3部分中,圖10B所示單元型模塊的組III所代表的物種被用來構建第二單元型圖譜(圖11;步驟1108)。第二單元型圖譜包括與Cyplal表達表達相關的單元型模塊(圖11;步驟1110-是)。這種第二單元型模塊包括Arnt基因座。通過這些數據可得出以下結論,即Arnt基因產物的高度表達可修飾小鼠中Ahr基因座的作用,詳細敘述見1.10.3部分(步驟1114)。
回到圖11,當在第二圖譜中未發現與所研究的表型性狀相關的單元型模塊時,便可決定第一單元型模塊中是否還有任何其它未被選擇的單元型(1112)。如果有,(1112-是),一種這樣的單元型被選擇1106,同時步驟1108和1110被重複。如果沒有,(1112-No),則終止該過程(1120)。
1.10實施例在實施例1中,呈現了用圖2所揭示的技術生成的作為基因型資料庫52中存在的品系(有機體)數目函數的單元型模塊的特徵。在實施例2中,本發明的系統和方法被用來將獲自自交小鼠品系的表型數據與單元型模塊相關聯。在實施例3中,本發明的系統和方法被用來構建生物學途徑。在實施例4,本發明的系統和方法被用來確定哪個染色體區域對微擾有反應。
1.10.1實施例1用於該實施例的示例基因型資料庫52獲自(http:\\mouseSNP.Roche.com)。用對靶基因組區域進行重測序的自動的高通量方法來發現SNP並表徵等位基因,參見Grupe等,2001,Science292,1915-1918。被分析的基因組區域都在已知的在生物上重要的基因之內;分析基因內的外顯子和關鍵基因內的調節區域。分析示例基因型資料庫52中的等位基因信息以表徵這些自交小鼠品系中遺傳變異的模式。提到人類基因組內的SNPs時(參見,例如,Patil等,2001,Science294,1719-1723;Daly等,2001,Nature Genetics 29,229-232;Johnson等,2001,Nature Genetics 29,233-237),小鼠基因組內物理上非常接近的等位基因通常是相關的,得到『SNP單元型』出現在模塊樣結構內(圖5)。模塊內的每個單元型顯然來自共同的祖先基因組;而模塊的大小反映了其它過程,包括重組和突變。
有一些確定單元型模塊的方法,適當的定義取決於預期應用。為分析人類遺傳變異,生成單元型模塊結構時應滿足使覆蓋每個模塊內單元型多樣性顯著比例的所需SNPs的總數最小的目的。參見,例如,Patil等,2001,Science 294,1719-1723;Daly等,2001,Nature Genetics29,229-232;和Zhang等,2002,Proceedings of the National Academyof Sciences of the United States of America 99,7335-7339。這種類型的單元型模塊結構對於人類遺傳分析是有用的,它需要生成大量個體的基因型以與進行關聯性研究。然而,這種方法無法得到試驗鼠類遺傳學的最佳模塊結構;其需要對較小數量的自交品系進行定性。通過檢測大小較小且單元型組成變化較少的模塊得到了在小鼠中進行關聯性研究的更精確的結果。
由於需要得到比用已知方法生成的那些單元型模塊更小的單元型模塊,用包括圖2步驟202-214的新方法來分析鼠類遺傳變異和確定鼠類基因組的單元型模塊結構。這種方法分析所有SNPs(不考慮等位基因頻率)和所有單元型(不僅僅是常規單元型)以構建單元型模塊。重要的是,分析所包含的品系的數量和類型會明顯影響單元型模塊的結構。例如,將僅分析4個品系(129/SvJ、A/J、C57BL/6J和CAST/Ei)(圖6A)得到的單元型模塊的結構與用13個自交小鼠品系(未顯示)得到的結構進行了比較。分析四個品系中存在的遺傳變異得到了不規則的(skewed)單元型模塊結構,如染色體1上的單元型模塊。這種情況下,所生成的94個單元型模塊中超過33%是以CAST/Ei作為唯一帶有最小等位基因的品系(即CAST/Ei具有其它品系中不存在的獨特單元型)。出於這個原因,僅CAST/Ei或SPRET/Ei品系所具有的最小等位基因的SNP不被用於構建單元型模塊;而單元型模塊是基於分析13個小鼠品系中的遺傳變異。通過採用圖2的步驟202-214分析13個小鼠品系生成的染色體1上單元型模塊的一般特性顯示在表2中。
表2——小鼠染色體1上單元型模塊的特性
即便在對小鼠品系進行分析時,被分析的品係數也會顯著影響單元型模塊的結構。當分析數目增加的小鼠品系的多態性時,分析時會將SNP數目的增加作為另一種遺傳變異。僅用3個品系構建的單元型圖譜明顯不同於用13個品系得到的圖譜(圖6B)。圖6B比較了用3個(A/J、129或C57BL/6)或13個小鼠品系在染色體12(29.6兆鹼基)上構建的單元型模塊。模塊邊界上的SNP用線連起來。
被分析的品係數目從3增加到13,分析中將包括穩定作為新品系的單元型模塊的一般結構(表3)。
表3—作為用於計算的品係數函數的小鼠染色體1上單元型模塊的特性
*僅考慮含有4個或更多SNP的模塊由表3可見,當分析中包含其它新品系時每個模塊內新單元型的數目僅略微增加。每個品系只增加了0.05新單元型(圖7),這說明每個額外的品系通常具有適合每個模塊內現有單元型的多態性模式。模塊內單元型的數目似乎在分析約8個品系後達到穩定。縱觀小鼠基因組,80%以上的SNP在含有4個或更多SNPs的模塊內,平均每個模塊含有14.6個SNP和2.7個單元型。
隨機試驗證實,用包括圖2的步驟202-214的方法生成的單元型模塊結構是由於單元型模塊內SNPs之間非常高水平的連鎖不平衡產生的。為隨機化,將染色體1上1,270個SNPs隨機排布並用隨機排列的SNPs生成單元型模塊結構。為將1,270個SNPs隨機排列,每次從組(1、2、...、1270)中隨機選取整數,直到所有的數都被取完。按照隨機順序將SNP等位基因信息重排,同時保持原始的染色體位置,以生成隨機模塊的結構。模塊中相鄰的NSP相鄰1兆鹼基。這一隨機過程被重複10次。每次重複後評價所得模塊的特性。當SNP順序被隨機化之後,相對於正確排序的SNP,含有至少4個SNPs的模塊內SNPs的百分比(23%±3%)以及每個模塊內SNP的平均數(5.7±0.4)顯著降低;同時每個模塊內單元型的平均數(3.82±0.18)明顯提高。按順序排列和隨機排列的SNP之間的強烈反差顯示了相同連鎖組內小鼠SNP連鎖不平衡的程度。這種高水平的連鎖不平衡是通常使用的試驗小鼠品系相對簡單的譜系造成的。
示例性基因型資料庫52含有27,112個獨特SNPs;通過分析15個自交小鼠品系得到了總共255,547個等位基因。示例性基因型資料庫52中有15個不同的品系,並排除M.Castenius和歐非小鼠(M.Spretus)品系特有的多態性以避免扭曲單元型模塊結構。除了在被評價的13個品系中呈多態性的10,766個SNPs,還排除了115個不是雙等位的SNPs,和在少於7個品系中含有等位基因的3,559個其它SNPs。其餘的7,092個SNPs來自1,709個模塊;其中有443個含有4個或更多SNPs(佔染色體1上所有SNP的81%)。具有至少4個SNPs的單元型模塊平均每個模塊上有11.3個SNPs和2.4個單元型,並覆蓋了28.6Mb的小鼠基因組。
1.10.2實施例2在2000年12月15日遞交的題為「預測控制表型性狀的染色體區域的系統和方法」的美國專利申請09/737,918和2001年12月11日遞交的題為「預測控制表型性狀的染色體區域的系統和方法」的美國專利申請10/015,167中,可通過對獲自自交小鼠品系的表型數據和等位基因在基因組區域內共享的程度進行相關分析,而用計算機來預測出調節複雜性狀的染色體區域。可以測定與美國專利申請09/737,918和美國專利申請10/015,167中所揭示的方法相比,將複雜表型與小鼠基因組的單元型圖譜相比較是否是計算機分析小鼠表型性狀的較佳方法。對於單元型圖譜內每個單元型模塊,通過計算單元型組內平均表型差異與單元型組之間表型差異的比值的負對數來計算相關性(公式1)。然後基於單元型模塊的大小和結構來調整對每個單元型模塊用公式1計算的記分。對單元型圖譜中所有單元型模塊重複這一過程,並得到最匹配的模塊。
1.10.2.1應用實例1(MHC)在第一個應用實例中,本發明所述的基於單元型的經驗主義繪圖法被用於預測位於鼠染色體17(約33Mb)上的主要組織相容性複合體(MHC)K基因座上的染色體位置。已知的13個自交品系MHC K基因座的H2單元型被用作該分析的輸入表型數據。13個品系中每個品系的H2單元型被轉化成數字。用同樣的數字代表具有相同H2單元型的品系。然後根據分析這些表型數據以用公式1作為記分函數通過表型/單元型處理模塊44(圖1)將單元型模塊相關聯。如圖8A所示,兩個單元型模塊顯示錶型數據之間強烈相關。在圖8A中,垂直軸是標準差,水平軸是小鼠染色體的數目和位置。就被分析的所有單元型模塊而言,計算出的相關性超過平均值5個標準差。這說明預測的單元型模塊與表型數據匹配得非常好(圖9);且在具有可與該表型比較的相關性的小鼠基因組中沒有其它的峰。預測的兩個單元型模塊都在染色體17上(33.7-33.9Mb和33.9-34.3Mb),並與MHC K基因座的已知位置直接相鄰。圖9示出了MHC K單元型(k,d,b,u,?)和染色體17上一個預測的單元型模塊結構(33.9-34.3兆鹼基)之間的相關性。多數和少數等位基因分別用深陰影和淡陰影表示,缺失的數據未用陰影表示。
1.10.2.2應用實例2(Ahr)在第二個應用實例中,本發明所述的基於單元型的經驗主義繪圖法被用於識別調節AH表型(即在自交小鼠品系肝臟微粒體內誘導芳烴羥化酶活性的水平)的遺傳基因座。芳烴受體(Ahr)是調節重要的環境試劑,包括多環芳烴(菸草煙氣和中發現)和2,3,7,8-四氯二苯並-對-二噁英(TCDD)代謝的胞內蛋白複合物的配體結合組分。在鼠類肝臟微粒體中誘導芳烴羥化酶活性的水平(AH表型)在自交小鼠品系中有50倍以上的變化(參見Nebert等,1982,Genetics 100,79-97)且這種變化被認為是由於Ahr配體結合親和性不同造成的(參見Chang等,1993,Pharmacogemetics 3,312-321)。40多種自交小鼠品系的AH表型之前已得到表徵(參見Nebert等,1982,Genetics 100,79-97);有7種品系在實施例1所描述的小鼠SNP資料庫中。所述AKR/J和DBA/2J品系是AH非反應性的,而A/J、A/HeJ、C57BL/6J、BALB/cJ和C3H/HeJ是AH反應性的。用公式1作為記分函數用表型/單元型處理模塊44(圖1)評價了這7個品系的表型反應。通過計算機預測在染色體12(29.6Mb)上含有Ahr基因座的單元型模塊,發現模塊44最可能是調節AH反應性的區域(圖8B),就這第二個應用實例中分析的所有單元型模塊而言,其與表型數據的相關性超過平均值10個標準差。在圖8B中,垂直軸是標準差,水平軸是小鼠染色體的數目和位置。
1.10.2.3應用實例3(Cyplal)自交小鼠品系的基因表達曲線提供了一種有用的中間表型,可對其進行分析以理解複雜性狀是如何通過遺傳調節的。換句話說,基因表達曲線可被作為表型數據結構60(圖1)。用同樣的方式,作為表型性狀信息,可根據經驗將品系特異性基因表達數據繪製成單元型模塊,以識別可能調節不同基因表達的遺傳基因座。作為一個例子,包括煙氣和二噁英在內的生物異源物質的肺部代謝所需的細胞色素P-450(Cyplal)(參見Nebert和Negishi,1982,Biochemical Pharmacology 31,2311-2317;Tukey等1982,Cell 31,275-284)在獲自自交小鼠品系的肺中是差異表達的(圖10A)。特別地,圖10A示出了每個被研究的自交小鼠品系Cyplal基因在肺部的表達水平。
圖10A中的數據按如下方法確定。總的RNA分離自整個小鼠肺組織。按照Affynzetrix Expression Analysis Technical Matiual中所述的方法來純化mRNA(PolyA+)、合成cDNA、生成標記的cRNA並與U74v2GeneChip雜交。在每個品系的三個小鼠上進行試驗。通過四次掃描(HP基因陣列掃描儀)從微陣列生成圖象文件,並用來自Affymetrix,SantaClara,CA的MAS 5.0軟體進行分析。為排除不同細胞色素基因數量過大造成微陣列數據不準確的可能性,還按照已知方法通過RT-PCR分析測量了肺部Cyplal表達。通過RT-PCR測得的Cyplal的表達水平與微陣列結果完全一致(數據未顯示)。
在被分析的小鼠品系所有8-kB Cyplal基因中僅識別了7個SNP。這些SNP都不位於外顯子中;且品系間多態性的模式與Cyplal的肺部表達水平無關。因此,這些小鼠品系中Cyplal的肺部表達水平在數量上截然不同可能是由於其它基因的多態性造成的,這些基因反式調節Cyplal表達。出於這些原因,以公式1作為記分函數用表型/單元型處理模塊44(圖1)來評價肺部Cyplal基因表達數據。有5個單元型模塊與Cyplal基因表達顯著相關。相關性水平第三高的染色體12上的單元型模塊是Ahr基因座(圖8C)。在圖8C中,垂直軸是標準差,水平軸是小鼠染色體的數目和位置。這與鼠類芳烴基因系統在調節包括Cyplal在內的許多藥物代謝酶的誘導中的作用相一致(參見Nebert等,1982,Genetics 100,79-87)。
Ahr基因座內的多態性可能會造成Cyplal的品系特異性差異表達。在Ahr基因座內識別的79個SNPs將自交小鼠品系分成三個單元型組。單元型組I包括B10.D2-H2/oSnJ和C57BL/6J品系;組II包括A/J、BALB/cJ和C3H/HeJ品系;組III包括129/SvJ、AKR/J、DBA/2J和MRL/MpJ品系(圖10B)。這些SNP大量位於外顯子中;這使編碼蛋白質的胺基酸序列發生顯著變化。4個胺基酸改變使組I的品系不同於其它自交小鼠品系。一個多態性將在組I的品系(B10.D2-H2/oSnJ和C57BL/6J)中發現的終止密碼子轉變為所有其它品系內的Arg;這在編碼蛋白質中產生了另一個羧基末端序列。3個胺基酸改變使組II的品系不同於組III的品系。一個多態性將組II品系中的Arg轉變為組III品系中的Val。該SNP位於基序(PAC)中,該基序對於該蛋白質中一個重要的(PAS)結構域的摺疊有貢獻(參見Ponting和Aravind,1997,Current Biology 7,R674-R677)。PAS結構域可促進結合,並形成一個表面以與含有蛋白質的PAS結構域二聚(參見Burbach等,1992,Proceedings of the National Academy of Sciences of the United States ofAmerica 89,8185-8189)。這種多態性模式和所得胺基酸變化與遺傳調節品系特異性Cyplal肺表達的Ahr基因座相一致。該應用實例證實,可用本發明的系統和方法通過計算機分析品系特異性基因表達數據。
對調節肺部Cyplal表達的遺傳基因座進行計算機識別,提供了第一個實施例說明了如何將基因表達數據本身直接用於遺傳分析。Cyplal是在鼠類(Hagg等,2002,Archiyes of Toxicology 76,621-627)和人類(Hukkanen等,2002,Critical Reviews in Toxicology 32,291-411)肺中表達的主要生物異源物質代謝酶。鼠肺中Cyplal mRNA和蛋白質的表達在試驗性接觸主要環境致癌物後顯示出增加(Hagg等,2002,Archives ofToxicology 76,621-627)。該酶直接參與環境汙染物和煙氣中存在的芳烴的轉化,以活化基因毒性酶。因此,它被認為在肺癌(Nebert等,1993,Annals of the New York Academy of Sciences 685,624-640;以及Hukkanen等,2002,Critical Reviews in Toxicology 32,291-411);以及與煙氣有關的肺病,如肺氣腫的發病機理中發揮重要作用。該實施例中的計算機遺傳分析說明,Ahr基因座內的遺傳變異調節小鼠肺內Cyplal表達的基礎水平。
總之,實施例2中的三個應用實例證實,可用單元型圖譜對小鼠中遺傳調節的複雜生物過程進行計算機分析。儘管美國專利申請號09/737,918和10/015,167中所揭示的技術將表型數據與大小大於20兆鹼基的染色體區域相關聯,但如實施例2所示,本發明的方法能夠預測負責這種性狀的單個遺傳基因座。
1.10.3實施例3基因表達通常是通過一個或多個途徑中蛋白質的活性來調節的,多基因通常亦是如此。因此,基因表達水平的遺傳調控通常是多個上遊基因多態性組合作用的結果。實施例2中完成的對調節Cyplal肺部表達的遺傳因子的分析說明了如何將基因表達數據與本發明所述繪製圖譜的方法聯合使用來識別調節複雜途徑的遺傳因子。實施例2的計算機分析預測出Ahr單元型調節Cyplal在肺內的表達,但還可能有其它水平的遺傳調節。相比其它具有相同Ahr單元型的品系,129/SvJ小鼠具有較高水平的肺部Cyplal表達(圖10B;組III)。這說明其它基因內的多態性可在具有相同Ahr單元型的小鼠內調節Cyplal基因的表達。用本發明的方法(圖11;步驟1110;也可參見1.9部分)分析了僅用來自Ahr單元型組III品系(129/SvJ,AKR/J,DBA/2J和MRL/MpJ)(圖11;步驟1106)的表達數據構建的基因表達數據的一個亞組。在染色體3上含有Arnt基因座的單元型模塊在前5個預測中,超過平均值4個標準差(數據未顯示)(圖11;步驟1110-是)。在Arnt基因座上,129/SvJ小鼠具有將其與其它Ahr單元型III品系清楚區分的單元型。已知Arnt結合Ahr並形成一種調節肺部Cyplal轉錄的異源二聚複合物(Hogenesch等,1997,Journal of Biological Chemistry 272,8581-8593;Reyes等,1992,Science 256,1193-1195;Hoffman等,1991,Science 252,954-958)。這一分析說明,Arnt單元型可修飾Ahr單元型在129/SvJ小鼠內的作用。若為129/SvJ小鼠,基於其Ahr基因座上的單元型可預測有相對低水平的肺部Cyplal表達。然而,所觀察到的129/SvJ小鼠中較高水平的Cyplal肺部表達可能是由於Arnt基因座上高表達單元型『拯救』的結果(圖11,步驟1114;1.9部分)。儘管該實施例中做出的預測需要單獨驗證,但該實施例說明了如何用本發明所述的使用小鼠單元型的方法來識別調節複雜途徑的遺傳因子。
1.10.4實施例4本發明可用來在物種接觸微擾之前和之後將單一物種多個有機體的表型與單一物種基因組中的特定位置相關聯。在該方法的一個實例中進行了兩組試驗。在第一組試驗中,本發明的方法被用來在單一物種的有機體接觸微擾之前將單元型圖譜與表型差異相關聯。在第二組試驗中,使單一物種的有機體分別接觸微擾,並用本發明的方法將物種的單元型圖譜與接觸微擾後的有機體所表現的表型差異相關聯。然後,用這裡所述的方法將第一組試驗中最匹配的單元型模塊與第二組試驗中最匹配的單元型模塊進行比較。通過比較這兩組最匹配的單元型模塊之間的差別或相似處,便可以識別對微擾反應性很高的單一物種的基因組區域。
術語「微擾」在本發明中的含義很廣。微擾可以是使有機體接觸藥物或致癌劑等化合物,在有機體基因組內加入外源基因,從有機體內除去外源基因,或改變基因或蛋白質在有機體內的活性。因此,例如,可在小鼠各個品系接觸抗原之前和之後測量代表多個不同小鼠種類的小鼠的抗體血清水平。然後,將多個不同小鼠品系的基因型差異與小鼠接觸微擾之前和之後所觀察到的表型相關聯。通過比較與接觸微擾之前和之後小鼠表型的差異相匹配的單元型模塊,便可將受微擾影響最大的小鼠基因組區域定位。在一些具體實施方案中,微擾是一種藥劑。在一些具體實施方案中,微擾是分子量小於1000道爾頓的化合物。
一旦識別出對微擾反應性很高的基因組區域,便可檢查包括識別出的基因組部分的基因晶片表達文庫。特別感興趣的是識別(i)用遭受微擾之前的物種品系建造的基因晶片文庫,和(ii)用遭受微擾之後的物種品系建造的基因晶片文庫中基因的差異表達。如本領域所熟知的,基因晶片文庫可以是mRNA表達水平的集合或一些其它標準,如有機體內各個基因的蛋白質表達水平。比較兩個基因晶片文庫內基因的差異表達水平將識別出在生物樣本接觸微擾之前和之後高度差異表達的單個基因。用上述相關性標準將這些單個基因的位置與已識別的基因組區域相關聯提供了一種識別對微擾反應性很高的特定基因的方法。
用於研究的基因晶片表達文庫的例子有以下文獻中所描述的那些Karp等,「Identification of complement factor 5 as a susceptibility locusfor experimental allergic asthma」,Nature Immunology 1(3),221-226(2000)和Rozzo等,「Evidence for an Interferon-inducible Gene,Ifj202,in theSusceptibility of Systemic Lupus」,Immunity 15,435-443(2001)。此外,Hyseq(Sunnyvale California)和Affymax(Palo Alto,California)等廠商提供了製造不同類型基因晶片文庫的方法。
在其它設計用來觀察基因組中哪個染色體區域受微擾影響的方法中,表型數據結構60包括基因型資料庫52中多個有機體56中每個有機體的表型陣列(圖2),且這些表型陣列中的每一個都包括該表型陣列所代表的有機體56中多種細胞成分中每種細胞成分的差異表達值。在一個具體實施方案中,每個差異表達值代表(i)多個有機體中有機體56內細胞成分的天然表達值;和(ii)有機體56接觸微擾後有機體56內細胞成分的表達值之間的差異。
術語「細胞成分」在這裡包括各個基因、蛋白質、表達基因的mRNA和/或其它細胞組分,它們通常由本領域的普通技術人員在生物應答試驗中測量。
在一些具體實施方案中,所述微擾是一種途徑微擾。將生物學途徑的微擾靶向不同細胞水平(途徑微擾)的方法在本領域是已知的並被採用。任何能夠特異性尋靶並可控制修飾(例如通過級聯方法或活化或通過級聯降低或抑制)特定細胞成分(例如基因表達、RNA濃度、蛋白質豐度、蛋白質活性等)的方法都可用來進行途徑微擾。對細胞成分的可控制修飾必然會可控制地擾亂始於被修飾的細胞成分的途徑。這種始於特定細胞成分的途徑在本發明中被優選用來代表藥物作用。優選的修飾方法能夠分別尋靶多種細胞成分中的每一種,且最優選這種細胞成分的實質性部分。參見,例如,Bassett,Jr.,等的美國專利6,453,24l中所述的方法。
1.11所引用的參考文獻在這裡將所有引用的參考文獻全文引入作為參考,就如將各個公開或專利或專利申請單獨提出並全文引入作為參考一樣。
1.12其它具體實施方案本發明可作為含有嵌入計算機可讀的存儲介質的電腦程式機制的電腦程式產品來實施。例如,所述電腦程式產品可含有圖1所示的程序模塊。這些程序模塊可儲存在CD-ROM、磁碟存儲產品或任何其它計算機可讀數據或程序存儲產品上。所述電腦程式產品內的軟體模塊也可通過網際網路或通過發送加載在載波上的計算機數據信號(其中嵌有軟體模塊)用電子學方法進行分布。
在不背離本發明精神和範圍的情況下可對本發明進行修改和變化,這對於本領域的普通技術人員是顯而易見的。這裡所描述的特定具體實施方案只是為了舉例說明,本發明的範圍僅由附加的權利要求及其等價範圍進行限定。
權利要求
1.一種將單一物種多個不同有機體所表現的表型與所述單一物種基因組內的一個或多個特定遺傳基因座相關聯的方法,所述方法包括對單元型圖譜內的單元型模塊進行記分,所述記分表示表型數據結構的差異和所述單元型模塊的差異之間的一致性,其中,所述表型數據結構代表所述多個不同有機體所表現的所述表型的差異;和所述單元型圖譜包括多個單元型模塊,且所述單元型圖譜內的每個單元型模塊代表所述基因組的不同部分;以及對所述單元型圖譜中所述多個單元型模塊內的每個單元型模塊重複所述記分,從而識別出所述多個單元型模塊中記分高於所述多個單元型模塊中所有其它單元型模塊的一個或多個單元型模塊;其中所述一個或多個特定遺傳基因座是由所述被識別的一個或多個單元型模塊所代表的所述基因組的各個所述不同部分。
2.如權利要求1所述的方法,其中所述多個單元型模塊內的單元型模塊包含多個連續單核苷多態性。
3.如權利要求2所述的方法,其中所述單元型模塊內的各個單核苷多態性在所述單元型模塊內另一個單核苷多態性的閾距離之內。
4.如權利要求3所述的方法,其中所述閾距離小於10兆鹼基。
5.如權利要求3所述的方法,其中所述閾距離小於1兆鹼基。
6.如權利要求1所述的方法,其中所述多個單元型模塊內的單元型模塊代表多個單元型,並小於在所述單元型模塊中僅出現一次的單元型模塊所代表的單元型的截斷比例。
7.如權利要求6所述的方法,其中所述截斷比例在5-30%之間。
8.如權利要求6所述的方法,其中所述截斷比例在15-25%之間。
9.如權利要求1所述的方法,其中所述方法還包括在所述記分之前生成所述單元型圖譜的步驟。
10.如權利要求9所述的方法,其中所述生成包括(i)識別具有多個連續單核苷多態性的候選單元型模塊,其中,所述候選單元型模塊內的每個單核苷多態性在所述候選單元型模塊內另一個單核苷多態性的閾距離之內;(ii)給所述候選單元型模塊賦予一個記分;(iii)重複所述識別步驟(i)和所述賦值步驟(ii)直到所有可能的候選單元型模塊都被識別,從而產生一組候選單元型模塊;(iv)挑選在該組候選單元型模塊中具有最高記分的候選單元型模塊以繪製單元型圖譜;(v)從所述候選模塊組中去除所挑選的候選單元型模塊和每個與所述所挑選的候選單元型模塊全部或部分重疊的候選單元型模塊;和(vi)重複所述挑選步驟(iv)和所述去除步驟(v)直到所述候選單元型模塊組中不再保留有候選單元型模塊;其中,所述單元型圖譜包含在重複步驟(iv)過程中挑選出的各個候選單元型模塊。
11.如權利要求10所述的方法,其中所述記分是所述候選單元型模塊中單核苷多態性的數目除以該模塊所代表的單元型數目的平方的結果。
12.如權利要求10所述的方法,其中所述記分是所述候選單元型模塊中單核苷多態性的數目除以該模塊所代表的單元型數目的結果。
13.如權利要求1所述的方法,其中對所述單元型模塊進行記分,包括為所述單元型模塊賦予記分S,其中S=-log(Dint ra|Dint er|)]]>其中,∑Dintra是在所述單元型模塊中具有相同單元型的所述多個有機體中有機體的表型值的差異的總和;和∑Dinter是在所述單元型模塊中不具有相同單元型的所述多個有機體中有機體之間的表型值的差異的總和。
14.如權利要求1所述的方法,其中對所述單元型模塊進行記分,包括為所述單元型模塊賦予記分S,其中S=(Dint ra|Dint er|)]]>其中,∑Dintra是在所述單元型模塊中具有相同單元型的所述多個有機體中有機體的表型值的差異的總和;和∑Dinter是在所述單元型模塊中不具有相同單元型的所述多個有機體中有機體之間的表型值的差異的總和。
15.如權利要求1所述的方法,其中對所述單元型模塊進行記分包括賦予記分S,其中S是以下比值的負數、倒數、負倒數、對數或負對數(Dint ra|Dint er|)]]>其中,∑Dintra是在所述單元型模塊中具有相同單元型的所述多個有機體中有機體的表型值的差異的總和;和∑Dinter是在所述單元型模塊中不具有相同單元型的所述多個有機體中有機體之間的表型值的差異的總和。
16.如權利要求15所述的方法,其中∑Dintra或∑Dinter被變成冪。
17.如權利要求16所述的方法,其中所述冪是1/2、2或10。
18.如權利要求1所述的方法,其中對所述單元型模塊進行記分,包括賦予記分S,其中S是以下比值的負數、倒數、負倒數、對數或負對數(Dint ra|Dint er|)]]>其中,∑Dintra是在所述單元型模塊中具有相同單元型的所述多個有機體中有機體的表型值的差異的總和;∑Dinter是在所述單元型模塊中不具有相同單元型的所述多個有機體中有機體之間的表型值的差異的總和;和∑Dintra或∑Dinter被變成冪。
19.如權利要求18所述的方法,其中所述冪是1/2、2或10。
20.如權利要求1所述的方法,其中在所述的一個或多個特定遺傳基因座內的特定遺傳基因座的長度小於0.5兆鹼基。
21.如權利要求1所述的方法,其中所述的一個或多個特定遺傳基因座內的特定遺傳基因座的長度在0.5兆鹼基和2.0兆鹼基之間。
22.如權利要求1所述的方法,其中所述的一個或多個特定遺傳基因座內的特定遺傳基因座的長度小於10兆鹼基。
23.如權利要求1所述的方法,其中所述表型是糖尿病、癌症、哮喘、精神分裂症、關節炎、多發性硬化或風溼病。
24.如權利要求1所述的方法,其中所述表型是自體免疫性疾病或遺傳疾病。
25.如權利要求1所述的方法,其中所述表型數據結構是微陣列表達數據。
26.如權利要求1所述的方法,其中所述單一物種是動物、植物、果蠅、酵母、病毒或秀麗隱杆線蟲(C.elegant)。
27.如權利要求1所述的方法,其中所述單一物種是小鼠或人。
28.如權利要求1所述的方法,其中所述單一物種的所述多個不同有機體是5-1000個有機體。
29.如權利要求1所述的方法,其中所述單一物種的所述多個不同有機體是10-100個有機體。
30.如權利要求1所述的方法,其中所述單一物種的所述多個不同有機體是20-75個有機體。
31.如權利要求1所述的方法,該方法還包括(i)在所述多個單元型模塊中的所述一個或多個單元型模塊內選擇一個單元型,該單元型的記分高於所述多個單元型模塊中所有或大多數其它單元型模塊;(ii)用以所述單元型表示的所述單一物種所述多個不同有機體的有機體基因型數據生成所述單一物種的第二單元型圖譜;(iii)對所述第二單元型圖譜內的單元型模塊進行記分,所述記分代表了所述表型數據結構的差異和所述單元型模塊的差異之間的一致性;(iv)對所述第二單元型圖譜中的每個單元型模塊重複所述記分步驟(iii),這樣便識別出一個或多個記分高於所述第二單元型圖譜中所有其它單元型模塊的第二單元型模塊;和(v)為所述物種建立生物學途徑,包括(a)來自從中挑選出所述單元型的單元型模塊的該單元型模塊內的基因座,和(b)來自所述一個或多個在步驟(iii)中識別的第二單元型模塊的基因座。
32.如權利要求1所述的方法,其中所述表型數據結構代表了對所述多個有機體所含多種細胞成分的測量。
33.如權利要求1所述的方法,其中所述表型數據結構包括所述多個有機體中每種生物的表型陣列,且各個所述表型陣列包含所述表型陣列所代表的有機體所含多種細胞成分中每種細胞成分的差異表達值,且各個所述差異表達值代表以下的(i)和(ii)之間的差異(i)所述多個有機體中的有機體所含細胞成分的天然表達值;和(ii)在所述有機體暴露於微擾之後所述有機體中所述細胞成分的表達值。
34.如權利要求33所述的方法,其中所述的微擾是藥劑。
35.如權利要求33所述的方法,其中所述的微擾是分子量小於1000道爾頓的化合物。
36.如權利要求1所述的方法,其中所述多個不同有機體中的一個有機體是單一物種的成員、來自所述單一物種成員的細胞組織、或來自所述單一物種所述成員的細胞培養物。
37.如權利要求1所述的方法,其中所述多個單元型模塊中的單元型模塊包含多個限制性片段長度多態性、微衛星標記、短串聯重複、序列長度多態性或DNA甲基化。
38.一種與計算機系統聯合使用的電腦程式產品,所述電腦程式產品包括計算機可讀的存儲介質和其中所含的電腦程式機制,所述電腦程式機制包括用來儲存單一物種多個不同有機體的基因組序列的差異的基因型資料庫;代表所述多個不同有機體所表現的表型差異的表型數據結構;包括多個單元型模塊的單元型圖譜,所述單元型圖譜中的每個單元型模塊代表所述單一物種基因組的不同部分;和用來將所述多個不同有機體所表現的表型與所述單一物種基因組中一個或多個特定遺傳基因座相關聯的表型/單元型處理模塊,所述表型/單元型處理模塊包括表型/單元型比較子程序,所述表型/單元型比較子程序包括對單元型圖譜中的單元型模塊進行記分的指令,所述記分代表所述表型數據結構的差異和所述單元型模塊的差異之間的一致性;再次執行所述指令以對所述單元型圖譜中所述多個單元型模塊中的各個單元型模塊進行記分的指令;和識別所述多個單元型模塊中記分高於所述多個單元型模塊中所有其它單元型模塊的一個或多個單元型模塊的指令。
39.如權利要求38所述的電腦程式產品,其中所述多個單元型模塊中的單元型模塊包含多個連續單核苷多態性。
40.如權利要求39所述的電腦程式產品,其中所述單元型模塊內的每個單核苷多態性在所述單元型模塊內另一個單核苷多態性的閾距離之內。
41.如權利要求40所述的電腦程式產品,其中所述閾距離小於10兆鹼基。
42.如權利要求40所述的電腦程式產品,其中所述閾距離小於1兆鹼基。
43.如權利要求38所述的電腦程式產品,其中所述多個單元型模塊內的單元型模塊代表多個單元型,並小於在所述單元型模塊中僅出現一次的單元型模塊所代表的單元型的截斷比例。
44.如權利要求43所述的電腦程式產品,其中所述截斷比例在5-30%之間。
45.如權利要求43所述的電腦程式產品,其中所述截斷比例在15-25%之間。
46.如權利要求38所述的電腦程式產品,其中所述的表型/單元型處理模塊還包括單元型圖譜派生子程序,其中所述單元型圖譜派生子程序包括用所述基因型資料庫生成所述單元型圖譜的指令。
47.如權利要求46所述的電腦程式產品,其中所述生成的指令包括(i)識別具有多個連續單核苷多態性的候選單元型模塊的指令,其中,所述候選單元型模塊內的每個單核苷多態性在所述候選單元型模塊內另一個單核苷多態性的閾距離之內;(ii)給所述候選單元型模塊賦予一個記分的指令;(iii)重複所述識別指令和所述賦值指令的指令,直到所述基因型資料庫中所有可能的候選單元型模塊都被識別,從而產生一組未經去除的候選單元型模塊;(iv)挑選在該候選單元型模塊組中具有最高記分的候選單元型模塊以繪製單元型圖譜的指令;(v)從所述候選模塊組中去除所挑選的選候選單元型模塊和每個與所述所挑選的選候選單元型模塊全部或部分重疊的候選單元型模塊的指令;和(vi)重複所述挑選指令和所述去除步驟的指令的指令,直到所述候選單元型模塊組中不再保留有候選單元型模塊;其中,所述單元型圖譜包含挑選出的各個候選單元型模塊。
48.如權利要求47所述的電腦程式產品,其中所述記分是所述候選單元型模塊中單核苷多態性的數目除以該模塊所代表的單元型數目的平方的結果。
49.如權利要求47所述的電腦程式產品,其中所述記分是所述候選單元型模塊中單核苷多態性的數目除以該模塊所代表的單元型數目的結果。
50.如權利要求38所述的電腦程式產品,其中對所述單元型模塊進行記分的指令包括為所述單元型模塊賦予記分S的指令,其中S=-log(Dint ra|Dint er|)]]>其中,∑Dintra是在所述單元型模塊中具有相同單元型的所述多個有機體中有機體的表型值的差異的總和;和∑Dinter是在所述單元型模塊中不具有相同單元型的所述多個有機體中有機體之間的表型值的差異的總和。
51.如權利要求38所述的電腦程式產品,其中對所述單元型模塊進行記分的指令包括為所述單元型模塊賦予記分S的指令,其中S=(Dint ra|Dint er|)]]>其中,∑Dintra是在所述單元型模塊中具有相同單元型的所述多個有機體中有機體的表型值的差異的總和;和∑Dinter是在所述單元型模塊中不具有相同單元型的所述多個有機體中有機體之間的表型值的差異的總和。
52.如權利要求38所述的電腦程式產品,其中對所述單元型模塊進行記分的指令包括賦予記分S的指令,其中S是以下比值的負數、倒數、負倒數、對數或負對數(Dint ra|Dint er|)]]>其中,∑Dintra是在所述單元型模塊中具有相同單元型的所述多個有機體中有機體的表型值的差異的總和;和∑Dinter是在所述單元型模塊中不具有相同單元型的所述多個有機體中有機體之間的表型值的差異的總和。
53.如權利要求51所述的電腦程式產品,其中∑Dintra或∑Dinter被變成冪。
54.如權利要求53所述的電腦程式產品,其中所述冪是1/2、2或10。
55.如權利要求38所述的電腦程式產品,其中對所述單元型模塊進行記分的指令包括賦予記分S的指令,其中S是以下比值的負數、倒數、負倒數、對數或負對數(Dint ra|Dint er|)]]>其中,∑Dintra是在所述單元型模塊中具有相同單元型的所述多個有機體中有機體的表型值的差異的總和;∑Dinter是在所述單元型模塊中不具有相同單元型的所述多個有機體中有機體之間的表型值的差異的總和;和∑Dintra或∑Dinter被變成冪。
56.如權利要求55所述的電腦程式產品,其中所述冪是1/2、2或10。
57.如權利要求38所述的電腦程式產品,其中所述一個或多個特定遺傳基因座內的特定遺傳基因座的長度小於0.5兆鹼基。
58.如權利要求38所述的電腦程式產品,其中所述一個或多個特定遺傳基因座內的一個特定遺傳基因座的長度在0.5兆鹼基和2.0兆鹼基之間。
59.如權利要求38所述的電腦程式產品,其中所述一個或多個特定遺傳基因座內的一個特定遺傳基因座的長度小於10兆鹼基。
60.如權利要求38所述的電腦程式產品,其中所述表型是糖尿病、癌症、哮喘、精神分裂症、關節炎、多發性硬化或風溼病。
61.如權利要求38所述的電腦程式產品,其中所述表型是自體免疫性疾病或遺傳疾病。
62.如權利要求38所述的電腦程式產品,其中所述表型數據結構是微陣列表達數據。
63.如權利要求38所述的電腦程式產品,其中所述單一物種是動物、植物、果蠅、酵母、病毒或秀麗隱杆線蟲(C.elegant)。
64.如權利要求38所述的電腦程式產品,其中所述單一物種是小鼠或人。
65.如權利要求38所述的電腦程式產品,其中所述單一物種的所述多個不同有機體是5-1000個有機體。
66.如權利要求38所述的電腦程式產品,其中所述單一物種的所述多個不同有機體是10-100個有機體。
67.如權利要求38所述的電腦程式產品,其中所述單一物種的所述多個不同有機體是20-75個有機體。
68.如權利要求38所述的電腦程式產品,其中所述表型/單元型處理模塊還包括(i)在所述多個單元型模塊中的所述一個或多個單元型模塊內挑選記分高於所述多個單元型模塊中所有或大多數其它單元型模塊的單元型的指令;(ii)用以所述單元型表示的所述單一物種所述多個不同有機體的有機體基因型數據生成所述單一物種的第二單元型圖譜的指令;(iii)對所述第二單元型圖譜內的單元型模塊進行記分的指令,所述記分代表了所述表型數據結構的差異和所述單元型模塊的差異之間的一致性;(iv)對所述第二單元型圖譜中的每個單元型模塊重複所述記分指令(iii)的指令,這樣便識別出一個或多個記分高於所述第二單元型圖譜中所有其它單元型模塊的第二單元型模塊;和(v)為所述物種建立生物學途徑的指令,包括(a)來自從中挑選出所述單元型的單元型模塊的該單元型模塊內的基因座,和(b)來自所述一個或多個在步驟(iii)中識別的第二單元型模塊的基因座。
69.如權利要求38所述的電腦程式產品,其中所述表型數據結構代表了對所述多個有機體所含多種細胞成分的測量。
70.如權利要求38所述的電腦程式產品,其中所述表型數據結構包括所述多個有機體中每種生物的表型陣列,且各個所述表型陣列包含所述表型陣列所代表的有機體所含多種細胞成分中每種細胞成分的差異表達值,且各個所述差異表達值代表以下(i)和(ii)之間的差異(i)所述多個有機體中的有機體所含細胞成分的天然表達值;和(ii)在所述有機體暴露於微擾之後所述有機體中所述細胞成分的表達值。
71.如權利要求70所述的電腦程式產品,其中所述微擾是藥劑。
72.如權利要求70所述的電腦程式產品,其中所述微擾是分子量小於1000道爾頓的化合物。
73.如權利要求38所述的電腦程式產品,其中所述多個不同有機體中的有機體是所述單一物種的成員、來自所述單一物種成員的細胞組織、或來自所述單一物種所述成員的細胞培養物。
74.如權利要求38所述的電腦程式產品,其中所述多個單元型模塊中的單元型模塊包含多個限制性片段長度多態性、微衛星標記、短串聯重複、序列長度多態性或DNA甲基化。
75.一種將多個不同有機體所表現的表型與單一物種基因組內一個或多個特定遺傳基因座相關聯的計算機系統,其中所述計算機系統包括中央處理器;與中央處理器結合的存儲器,所述存儲器存儲用來儲存所述單一物種所述多個不同有機體基因組序列的差異的基因型資料庫;代表所述多個不同有機體所表現的表型差異的表型數據結構;包括多個單元型模塊的單元型圖譜,所述單元型圖譜中的每個單元型模塊代表所述單一物種基因組的不同部分;和表型/單元型處理模塊,所述表型/單元型處理模塊包括表型/單元型比較子程序,所述表型/單元型比較子程序包括對所述單元型圖譜中的單元型模塊進行記分的指令,所述記分代表所述表型數據結構的差異和所述單元型模塊的差異之間的一致性;和再次執行所述指令以對所述單元型圖譜中所述多個單元型模塊中的各個單元型模塊進行記分的指令,從而識別出所述多個單元型模塊中記分高於所述多個單元型模塊中所有其它單元型模塊的一個或多個單元型模塊。
全文摘要
分析了一種遺傳變異資料庫以製備單一物種品系的基因組單元型圖譜。計算機方法被用來將複雜表型迅速繪製成單元型圖譜內的單元型模塊。用這些系統和方法識別了調節小鼠三種不同生物重要表型性狀的特定的遺傳基因座。
文檔編號C12Q1/68GK1795380SQ200480004993
公開日2006年6月28日 申請日期2004年1月27日 優先權日2003年1月27日
發明者喬納森·安德魯·尤索卡, 廖國春, 蓋瑞·艾倫·佩爾茨 申請人:弗·哈夫曼-拉羅切有限公司

同类文章

一種新型多功能組合攝影箱的製作方法

一種新型多功能組合攝影箱的製作方法【專利摘要】本實用新型公開了一種新型多功能組合攝影箱,包括敞開式箱體和前攝影蓋,在箱體頂部設有移動式光源盒,在箱體底部設有LED脫影板,LED脫影板放置在底板上;移動式光源盒包括上蓋,上蓋內設有光源,上蓋部設有磨沙透光片,磨沙透光片將光源封閉在上蓋內;所述LED脫影

壓縮模式圖樣重疊檢測方法與裝置與流程

本發明涉及通信領域,特別涉及一種壓縮模式圖樣重疊檢測方法與裝置。背景技術:在寬帶碼分多址(WCDMA,WidebandCodeDivisionMultipleAccess)系統頻分復用(FDD,FrequencyDivisionDuplex)模式下,為了進行異頻硬切換、FDD到時分復用(TDD,Ti

個性化檯曆的製作方法

專利名稱::個性化檯曆的製作方法技術領域::本實用新型涉及一種檯曆,尤其涉及一種既顯示月曆、又能插入照片的個性化檯曆,屬於生活文化藝術用品領域。背景技術::公知的立式檯曆每頁皆由月曆和畫面兩部分構成,這兩部分都是事先印刷好,固定而不能更換的。畫面或為風景,或為模特、明星。功能單一局限性較大。特別是畫

一種實現縮放的視頻解碼方法

專利名稱:一種實現縮放的視頻解碼方法技術領域:本發明涉及視頻信號處理領域,特別是一種實現縮放的視頻解碼方法。背景技術: Mpeg標準是由運動圖像專家組(Moving Picture Expert Group,MPEG)開發的用於視頻和音頻壓縮的一系列演進的標準。按照Mpeg標準,視頻圖像壓縮編碼後包

基於加熱模壓的纖維增強PBT複合材料成型工藝的製作方法

本發明涉及一種基於加熱模壓的纖維增強pbt複合材料成型工藝。背景技術:熱塑性複合材料與傳統熱固性複合材料相比其具有較好的韌性和抗衝擊性能,此外其還具有可回收利用等優點。熱塑性塑料在液態時流動能力差,使得其與纖維結合浸潤困難。環狀對苯二甲酸丁二醇酯(cbt)是一種環狀預聚物,該材料力學性能差不適合做纖

一種pe滾塑儲槽的製作方法

專利名稱:一種pe滾塑儲槽的製作方法技術領域:一種PE滾塑儲槽一、 技術領域 本實用新型涉及一種PE滾塑儲槽,主要用於化工、染料、醫藥、農藥、冶金、稀土、機械、電子、電力、環保、紡織、釀造、釀造、食品、給水、排水等行業儲存液體使用。二、 背景技術 目前,化工液體耐腐蝕貯運設備,普遍使用傳統的玻璃鋼容

釘的製作方法

專利名稱:釘的製作方法技術領域:本實用新型涉及一種釘,尤其涉及一種可提供方便拔除的鐵(鋼)釘。背景技術:考慮到廢木材回收後再加工利用作業的方便性與安全性,根據環保規定,廢木材的回收是必須將釘於廢木材上的鐵(鋼)釘拔除。如圖1、圖2所示,目前用以釘入木材的鐵(鋼)釘10主要是在一釘體11的一端形成一尖

直流氧噴裝置的製作方法

專利名稱:直流氧噴裝置的製作方法技術領域:本實用新型涉及ー種醫療器械,具體地說是ー種直流氧噴裝置。背景技術:臨床上的放療過程極易造成患者的局部皮膚損傷和炎症,被稱為「放射性皮炎」。目前對於放射性皮炎的主要治療措施是塗抹藥膏,而放射性皮炎患者多伴有局部疼痛,對於止痛,多是通過ロ服或靜脈注射進行止痛治療

新型熱網閥門操作手輪的製作方法

專利名稱:新型熱網閥門操作手輪的製作方法技術領域:新型熱網閥門操作手輪技術領域:本實用新型涉及一種新型熱網閥門操作手輪,屬於機械領域。背景技術::閥門作為流體控制裝置應用廣泛,手輪傳動的閥門使用比例佔90%以上。國家標準中提及手輪所起作用為傳動功能,不作為閥門的運輸、起吊裝置,不承受軸向力。現有閥門

用來自動讀取管狀容器所載識別碼的裝置的製作方法

專利名稱:用來自動讀取管狀容器所載識別碼的裝置的製作方法背景技術:1-本發明所屬領域本發明涉及一種用來自動讀取管狀容器所載識別碼的裝置,其中的管狀容器被放在循環於配送鏈上的文檔匣或託架裝置中。本發明特別適用於,然而並非僅僅專用於,對引入自動分析系統的血液樣本試管之類的自動識別。本發明還涉及專為實現讀