用於裝配成小組的癌細胞系以用於測試一種或多種藥物組合物的功效的方法
2023-06-08 00:17:56
專利名稱:用於裝配成小組的癌細胞系以用於測試一種或多種藥物組合物的功效的方法
用於裝配成小組的癌細胞系以用於測試一種或多種藥物組
合物的功效的方法相關申請信息本申請要求對2008年10月31日提交的美國申請No. 61/110,的優先權,所述申請的內容在此引入作為參考。序列表本申請包括已通過EFS-Web提交並且因此整體引入作為參考的序列表。所述 ASCII拷貝命名為9674W001. txt,且大小為1. 8千字節。領域本發明涉及用於限定腫瘤和癌細胞系的基因組亞組的生物信息學算法或方法。本發明還涉及按照基因組亞組裝配(assembling)成小組(panels)的腫瘤和癌細胞系以用於測試一種或多種藥物化合物在患有至少一種癌症的受試者的治療中的功效的方法。盤癌症是特徵在於臨床過程、結果和對治療的應答的相當大變異性的基因組的疾病。該變異性背後的主要因素是人癌症的遺傳異質性。已證明相同組織病理學亞型的個別腫瘤在其細胞DNA中具有不同的畸變。公認的是靶向的癌症療法靶向特定的遺傳畸變而非組織學疾病亞類。靶向分子異常的藥物的一些實例是甲磺酸伊馬替尼(imatinib mesylate)(其用於治療慢性髓細胞性白血病)和司徒曼步(其用於治療HER2陽性乳腺癌)O目前,基於其可用性(availability)、對小鼠中腫瘤形成的適應性、培養中的生長以及其他參數選擇用於腫瘤學藥物測試(oncology drug testing)的臨床前模型。對於該方法的問題是其未考慮親本腫瘤的遺傳異質性。這導致臨床前試驗過程中腫瘤的分子亞類的差的代表。因此,經常在臨床前試驗中看到的高反應率可能只代表臨床前試驗實驗室中代表的分子亞類的反應。如果該亞類只代表患者群體的一部分,並且如果藥物只針對該具體亞類有效,那麼臨床中的反應將是顯著較低的。因此,本領域內需要更好地代表所有親本腫瘤類型的改進的臨床前試驗模型。這樣的改進的臨床前試驗將增加新型藥物的臨床前試驗的可預測性。發明概述在一個方面,本發明涉及用於聚類腫瘤和細胞系以限定基因組亞組的算法。所述算法包括步驟(a)獲得多個,m個,包含至少一個腫瘤或癌細胞系的樣品;(b)獲得包括步驟(a)中獲得的每一個樣品的每一條染色體的至少一個基因座的拷貝數改變信息的數據集;(c)鑑定數據集中獲自被正常細胞汙染的樣品的拷貝數改變信息並且從數據集消除所述被汙染的樣品,其中鑑定和消除包括(1)對數據應用與代表腫瘤和正常樣品之間的差異的參數一致的機器學習算法 (machine learning algorithm);
(2)賦予每一個樣品如通過機器學習算法測定的正常細胞汙染的概率分數;(3)從數據集中消除每一個得分50%或更大的含正常細胞的概率的樣品的數據;(d)通過對數據集應用利用Pearson線性相異性算法的無監督聚類算法 (unsupervised clustering algorithm)估計數據集中亞組的數巨 r ;(e)利用改進的基因組非負矩陣因子分解(modified genomic non-negative matrix factorization) (gNMF)算法將數據集中的每一個樣品分配至至少一個簇,其中所述改進的gNMF算法包括(1)利用公式(1)計算每100步乘性更新(multiplicative updating)後算法的散度
權利要求
1.用於聚類腫瘤和細胞系以限定基因組亞組的算法,所述方法包括步驟(a)獲得多個,m個,包含至少一個腫瘤或癌細胞系的樣品;(b)獲得包括步驟(a)中獲得的每一個樣品的每一條染色體的至少一個基因座的拷貝數改變信息的數據集;(c)鑑定數據集中獲自被正常細胞汙染的樣品的拷貝數改變信息並且從數據集消除所述被汙染的樣品,其中鑑定和消除包括(1)對數據應用與代表腫瘤和正常樣品之間的差異的參數一致的機器學習算法;(2)賦予每一個樣品如通過機器學習算法測定的正常細胞汙染的概率分數;(3)從數據集中消除每一個得分50%或更大的含正常細胞的概率的樣品的數據;(d)通過對數據集應用利用Pearson線性相異性算法的無監督聚類算法估計數據集中亞組的數目r;(e)利用改進的基因組非負矩陣因子分解(gNMF)算法將數據集中的每一個樣品分配至至少一個簇,其中所述改進的gNMF算法包括(1)利用公式(1)計算每100步乘性更新後算法的散度
2.權利要求1的算法,其中所述無監督聚類算法是等級聚類。
3.權利要求1的算法,其中同表象相關用於提供來自數據集的簇的終數目。
4.權利要求1的算法,其中貝葉斯信息準則用於提供來自數據集的簇的終數目。
5.權利要求1的算法,其中將同表象相關和貝葉斯信息準則用於提供來自數據集的簇的終數目。
6.按照基因組亞組裝配成小組的腫瘤和癌細胞系的方法,所述方法包括步驟(a)獲得多個,m個,包含至少一個腫瘤或癌細胞系的樣品;(b)獲得包括步驟(a)中獲得的每一個樣品的每一條染色體的至少一個基因座的拷貝數改變信息的數據集;(c)鑑定數據集中獲自被正常細胞汙染的樣品的拷貝數改變信息並且從數據集消除所述被汙染的樣品,其中鑑定和消除包括(1)對數據應用與代表腫瘤和正常樣品之間的差異的參數一致的機器學習算法;(2)賦予每一個樣品如通過機器學習算法測定的正常細胞汙染的概率分數;(3)從數據集中消除每一個得分50%或更大的含正常細胞的概率的樣品的數據;(d)通過對數據集應用使用Pearson線性相異性算法的無監督聚類估計數據集中亞組的數目r;(e)利用改進的基因組非負矩陣因子分解(gNMF)算法將數據集中的每一個樣品分配至至少一個簇,其中所述改進的gNMF算法包括(1)利用公式(1)計算每100步乘性更新後算法的散度
7.權利要求6的方法,其中所述癌症選自小細胞肺癌、非小細胞肺癌、結腸直腸癌和黑色素瘤。
8.權利要求6的方法,其中所述拷貝數改變是拷貝數的獲得或喪失。
全文摘要
本發明涉及用於限定腫瘤和癌細胞系的基因組亞組的算法。本發明還涉及用於根據基因組亞組裝配成小組的腫瘤和癌細胞系以用於測試一種或多種藥物化合物在患有至少一種癌症的受試者的治療中的功效的方法。
文檔編號G06F19/24GK102203788SQ200980143442
公開日2011年9月28日 申請日期2009年10月28日 優先權日2008年10月31日
發明者D·塞米扎洛夫, K·張, R·R·列斯尼夫斯基, 盧欣 申請人:雅培製藥有限公司