新四季網

使用生物標記鑑別疾病狀態的方法和設備的製作方法

2023-11-01 14:58:42

專利名稱:使用生物標記鑑別疾病狀態的方法和設備的製作方法
技術領域:
本發明一般涉及用於鑑別患者疾病狀態的方法和設備,尤其涉及 根據一個或多個生物標記的水平鑑別患者的疾病狀態。
背景技術:
在醫學中使用生物標記以幫助診斷或確定特定疾病的存在、不存 在、狀態和/或階段。已經通過使用從人口的有統計顯著性數量的疾病 陰性主體和疾病陽性主體獲得的單個生物標記的測量水平並建立對於 疾病陰性狀態和疾病陽性狀態的均值和標準偏差來鑑別在診斷上有用 的生物標記。如果發現所測得的疾病陽性狀態和疾病陰性狀態的生物 標記的集中度具有區別很大的高斯分布或類高斯分布,則認為該生物 標記可用於預測該疾病的情況。如果以後的患者的生物標記集中度在 一般被定義為疾病陽性均值和疾病陰性均值之間的生物標記集中度的
分界點(cut point)以上(或者,在某些情況下為以下)並且偏離疾 病狀態陰性均值二到三個標準偏差,則可認為該患者為疾病陽性。
儘管傳統方法已經產生臨床上有用的生物標記,但是由於至少五 個原因,它們應用於確定主體的各種疾病狀態受到限制。首先,這些 方法假定人口的正態高斯數據分布,其中所有測得的生物標記集中度 在均值以上和以下大致對稱分布並且呈鐘形曲線形狀。在這種情況下, 在疾病陽性群組中或者在疾病陰性群組中,該數據的大約68%在均值 的一個標準偏差內,該數據的95%在均值的兩個標準偏差內,並且該 數據的99.7%在均值的三個標準偏差內。然而該假定僅對全部潛在的 生物標記的一部分保持正確。人體生物化學是一個複雜系統,其中許 多組成用於多種功能並且通過多種其它組成來調節它們自己。因此, 通常發現顯示非高斯分布的生物標記,其包括本質上偏離大部分值的值(在分布的遠高端和/和遠低端),並且可能跨度幾個數量級。
第二,傳統方法依賴於單個生物標記的分析以指示疾病狀態。然 而,考慮到人體生物化學的複雜相互作用,多個標記的相互作用經常 與疾病的存在或不存在有關。代替綜合多個有統計顯著性的標記,單 個標記模型依賴於單個標記的理想(或接近理想)表現,與綜合多個 生物標記相比,這可導致對疾病狀態診斷的較低準確度。
第三,傳統方法唯一地依賴於疾病陰性和疾病陽性人口之間大的 差異,並且當疾病陰性人口和疾病陽性人口的分布重疊到某顯著程度 時,將放棄所有信息。在傳統的單個標記模型中,當陰性疾病狀態的 均值和陽性疾病狀態的均值之間的差異小於一個半到兩個標準偏差 時,認為該差異幾乎沒有價值,即使當發現這些差異是穩定的並可重 復的時候也是如此。
第四,生物多樣性和疾病陰性人口或疾病陽性人口中的子群的存 在經常混淆傳統的單個標記方法。考慮到人體生物化學的複雜性,許 多因素可影響所測得的給定生物標記的集中度,如患者的人口統計學 特徵、家族歷史和病史。所有這些因素都可能增加潛在標記的觀測可 變性和標準偏差,掩蓋或模糊與疾病狀態的關係。
最後,儘管對生物標記的理解不斷增加並且可以使用用於檢測和 量化與疾病相關的特定生物標記的表達的方便的生物標記化驗(例如, 免疫組織化學化驗),但傳統分析仍然經常不能充分區分疾病陰性狀 態和疾病陽性狀態以允許可靠的疾病診斷。

發明內容
根據本發明各方面的用於鑑別疾病狀態的方法和設備包括分析 一個或多個生物標記的水平。該方法和設備可以使用狀況陽性群組和 狀況陰性群組的生物標記數據並自動從多個生物標記中選擇多個相關 生物標記。該系統可以自動生成用於根據各群組對於相關生物標記的 生物標記數據之間的差異確定疾病狀態的統計模型。該方法和設備還 通過產生個體患者的綜合得分並將該患者的綜合得分與用於鑑別潛在疾病狀態的一個或多個閾值相比較來幫助確定個體的疾病狀態。


通過結合以下說明性附圖參閱本詳細描述可以更完全地理解本 發明。在以下附圖中,同樣的附圖標記表示類似的元件和步驟。 圖l是計算機系統的框圖。
圖2是用於鑑別疾病狀態的處理的流程圖。
圖3是用於控制值的範圍的處理的流程圖。
圖4是用於歸一化數據的處理的流程圖。
圖5是用於根據分界點分類數據的處理的流程圖。
圖6是疾病陽性和疾病陰性生物標記集中度的累積頻率的曲線圖。
圖7是用於建立疾病狀態模型的處理的流程圖。 圖8是用於鑑別個體疾病狀態的處理的流程圖。 圖9是乳腺癌陽性集中度和乳腺癌陰性集中度的累積頻率相對於 PSA集中度的關係曲線。
圖IO示出用於選擇一個或多個分界點的數據記分模型。 為了簡化和清楚,示出了附圖中的元件和步驟,並且根據具體的 程序,不一定表現這些元件和步驟。例如,附圖中示出了可:,—', 行或者以不同順序進行的步驟,以幫助增進對本發明的實施方式的理
具體實施例方式
根據功能組件和各種處理步驟來部分地描述本發明。可以通過任 意數量的用於進行指定的功能並完成各種結果的組件、操作和技術來 實現所述功能組件和處理步驟。例如,本發明可以採用各種生物樣本、 生物標記、元件、材料、計算機、數據源、存儲系統和介質、信息收 集技術和處理、數據處理準則、統計分析、回歸分析等,它們可以實 現各種功能。另外,儘管關於醫學診斷情況描述了本發明,但是也可以結合許多應用、環境和數據分析來實踐本發明;所描述的系統僅是 本發明的示範性應用。
可以用任何適當的方式實施根據本發明各方面的用於分析生物 標記信息的方法和設備,例如使用在計算機系統上運行的電腦程式。 參照圖1,可以結合計算機系統110,例如包括處理器112和隨機存取 存儲器114的傳統計算機系統,如可遠程訪問的應用伺服器、網絡服 務器、個人計算機或工作站來實施根據本發明各方面的示範性生物標 記分析系統100。計算機系統110還適當地包括例如大容量存儲系統 116的附加存儲器裝置或信息存儲系統和例如傳統的監視器、鍵盤和 跟蹤裝置的用戶接口 118。然而,計算機系統110可以包括任何適當 的計算機系統和相關設備,並且可以用任何適當的方式配置。在一個 實施例中,計算機系統110包括單機系統。在另一個實施例中,計算 機系統110是包括伺服器120和資料庫122的計算機網絡的一部分。 該資料庫存儲可被多個用戶124A-C (如連接到伺服器120的不同用 戶)訪問的信息。在本實施例中,伺服器120包括可遠程訪問的服務 器,如可通過區域網或網際網路等網絡訪問的應用伺服器。
接收、處理和分析生物標記信息所需的軟體可以用單個裝置來實 施或者用多個裝置來實施。可以通過網絡訪問該軟體,使得對於用戶 124A-C遠程地進行信息的存儲和處理。根據本發明各方面的生物標記 分析系統100及其各種元件提供多種功能和操作以促進生物標記分 析,如數據收集、處理、分析、報告和/或診斷。該生物標記分析系統 100保持與生物標記相關的信息並促進分析和/或診斷。例如,在本實 施例中,計算機系統IIO執行電腦程式,其可以接收、存儲、搜索、 分析和報告與生物標記有關的信息。該電腦程式可以包括進行各種 功能或操作的多個模塊,如用於處理原始數據和收集追加數據的處理 模塊和用於分析原始數據和追加數據以生成疾病狀態模型和/或診斷 信息的分析模塊。
由生物標記分析系統100進行的程序可以包括任何適當的處理以 促進生物標記分析和/或診斷。在一個實施例中,生物標記分析系統100被配置用於建立疾病狀態模型和/或確定患者的疾病狀態。確定或鑑別 疾病狀態可以包括生成相對於該疾病關於患者的狀況的任何有用的信 息,如進行診斷,提供對診斷有幫助的信息,評估疾病的階段或發展, 鑑別可表示對該疾病的易感染性、鑑別是否可推薦進一步測試或者另 外評估疾病狀態、疾病可能性或患者的其它健康方面的狀況。參照圖
2,在本實施例中,生物標記分析系統IOO接收與提供提取生物標記數 據的生物樣本的一個或多個個體相關的原始生物標記數據和主體數據 (210 )。生物標記分析系統100處理該原始數據和主體數據以生成追 加數據(212),並分析該原始數據、主體數據和/或追加數據(214) 以建立疾病狀態模型和/或患者診斷(216)。
生物標記分析系統100還可以提供各種附加模塊和/或單獨功能。 例如,生物標記分析系統IOO還可以包括報告功能,例如提供與處理 和分析功能相關的信息。生物標記分析系統IOO還可以提供各種管理 功能,如控制訪問和執行其它管理功能。
生物標記分析系統100適當地生成疾病狀態模型和/或基於與群 組中的主體相關的附加主體數據和/或原始生物標記數據提供對患者 的診斷。
根據本發明的各方面,生物標記數據被獲得以及處理以建立疾病 狀態模型,該疾病狀態模型結合了來自多個生物標記的數據,如來自
的成員的數據。從有統計顯著'^數量的疾^陽性和疾病^月性主體適當 地獲得該生物樣本。疾病陽性群組和疾病陰性群組可以包含足夠數量 的主體以確保所獲得的數據基本上是疾病陰性狀態和疾病陽性狀態的 特徵,如統計上有代表性的群。例如,每個群組中可以具有至少30 個主體。每個群組可以表徵為幾個子群組,該子群組反映例如該疾病 可能以不同階段存在於疾病陽性個體中,或者反映可以影響疾病陽性 或疾病陰性個體的生物標記水平的其它人口統計學的、行為的或其它 的因素。
生物標記分析系統100可以使用任意單個生物材料或者生物材料的組合,可以從該單個生物材料或者生物材料的組合可再現地確定潛 在生物標記的水平。在本實施例中,從儘可能少的樣本源(如從單個 容易獲得的樣本)獲得所有測得的生物標記的水平。例如,樣本源可 以包括但不限於純粹的血液、血清、血漿、尿、唾液、粘液、吸出物 (包括乳頭吸出物)或組織(包括乳房組織或其它組織樣本)。生物 標記水平可能隨不同的源而變化,並且只有在特定的樣本源中才能發 現疾病表示水平。因此,同一樣本源被適當地用於創建疾病狀態模型 和估計患者二者。如果根據在純粹的血液中測得的生物標記水平構建 疾病狀態模型,那麼來自患者的測試樣本也可以是純粹的血液。在測 試之前處理樣本的情況下,所有樣本可被以相同的方式對待並隨機地 採集和處理。
生物標記分析系統IOO可以分析任何適當的量或特徵。在本情況
下,生物標記可以包括能夠量化的任何疾病間接物理特徵,並且在一 個實施例中,可以包括生物過程或事件的獨特生物化學指標。許多生
物標記可以使用,並且生物標記分析系統100提供用於模型化和評估
生物標記水平數據的分析構架。
可以使用多種方法中的任何一種來測量樣本中的原始生物標記 水平,並且可以使用多個測量工具來獲取生物標記水平數據。例如, 適當的測量工具可以包括但不限於任何適當形式的酶聯免疫吸附試驗
(enzyme linked immunosorbent assay, EUSA)、 放射性免疫試驗 (radioimmunoassay, RIA)、 ^充式細胞術(flow cytometry)、質"i脊等。由 於生物標記水平可以隨方法的不同和程序的不同而變化,所以本實施 例的生物標記分析系統100使用固定的方法和程序來創建疾病狀態模 型和評估患者。例如,如果根據使用指定的ELISA協議測量的生物標 記水平構建疾病狀態模型,則應該使用相同的ELISA協議測量來自患 者的測試樣本。
如原始生物標記水平的生物標記數據和任何其它相關數據被提 供給生物標記分析系統100進行處理。生物標記分析系統100可以分 析一個或多個標記。生物標記分析系統100可以處理生物標記數據以
14結合多個標記,最小化對非高斯分布的潛在影響以及解決生物多樣性。
在本實施例中,生物標記分析系統100分析多個生物標記,分配生物
標記水平的邊界值,基於原始數據和潛在相關生物標記影響因素生成 歸一化數據,將生物標記與分界點進行比較,並且/或者減小原始和/
或調節後的數據值的範圍。生物標記分析系統IOO還可以調節疾病特
定風險因素的數據並分析該數據以生成疾病狀態模型。
在一個實施例中,生物標記分析系統IOO可以分析多個生物標記
以建立疾病狀態模型並生成診斷。考慮到人體生物化學的複雜相互作 用,多個標記可能與疾病狀態的存在或不存在有關係。此外,單個生 物標記不可能只與一種疾病唯一相關。儘管單個生物標記可以提供有 用的信息,但是通過包括多個生物標記,例如最具有信息性的生物標
記,可以提高診斷可靠性。生物標記分析系統IOO適當地結合了多個
雖然不夠理想但是仍然具有統計顯著性的並且具有信息性的生物標 記。
生物標記分析系統IOO可以按照不具有信息性、具有信息性或者
信息性高的分類來評估所給的生物標記是否具有信息性,並估計該生
物標記是否有價值(productive),以將該標記包括在疾病狀態模型 中。例如,各種生物標記與乳腺癌相關,並且當模型化特徵生物標記 水平並評估主體的乳腺癌時,這些標記可能高度相關。在一個具體例 子中,前列腺特異抗原(prostate specific antigen, PSA)的血清的上 調(提高的)和/或下調(抑制的)水平、腫瘤壞死因子a (TNF-a)、 白細胞介素-6 (IL-6)、白細胞介素-8 (IL-8)、血管內皮生長因子 (VEGF)和/或核黃素載體蛋白質(riboflavin carrier protein, RCP ) 與乳腺癌相關。其中,RCP、 TNF-a、 IL-8和VEGF與其它兩個標記 相比,對於乳腺癌狀態來說更具有信息性。
人體生物化學是一個複雜系統,其中許多組成用於多重調節和其 它功能,並且被多個其它的組成調節。通常,特別是在疾病狀態下, 生物數據是非高斯的。因此,經常發現顯示非高斯分布的生物標記, 其中所測得的值可以包括在分布的遠高端、遠低端或者高端和低端兩處與大部分值充分分離的值,並且可以跨度幾個數量級。生物標記分
析系統IOO可以處理該數據以適應非高斯分布的影響。與高斯分布不
同,非高斯分布可能關於數據的均值向左或向右傾斜。可以使用對數 變換將非高斯分布數學變換為高斯分布。可以對非高斯數據進行子組
平均、數據分割、使用差分分布(differential distribution )或者使用 非參數統計。
為了結合多個生物標記並控制非高斯數據點對疾病狀態模型的 任何不利影響,該生物標記分析系統可以預處理該生物標記數據以生 成附加數據來幫助分析。例如生物標記分析系統100可以對來自原始 生物標記水平數據的附加數據施加各種限制並對其進行調節和/或計 算,以生成除了可以被處理的原始數據之外的包括一組變量的追加數 據,例如使用邏輯回歸以生成線性模型,或者使用描述生物標記與疾 病狀態的關係的其它適當的統計分析。
例如,生物標記分析系統100可以被配置為處理原始生物標記數 據以減小非高斯分布的負面影響。在一個實施例中,生物標記分析系 統100可以例如通過對每個生物標記分配最大和/或最小允許值或封頂 (cap)來減小具有非高斯分布的生物標記的非正態生物標記才〕彭 響。可以根據任何適當的準則來分配該封頂,如包含測得水平的火約 66%和大約99.7%之間並排除極高值。
參照圖3,可以這樣為每個候選生物標記建立最大和/或最小允許 值首先確定疾病陰性群組的該生物標記的中間值(310),如均值或 中值,並確定所測得的生物標記水平的所選量的標準偏差(312),如 在將該數據繪製在柱狀圖上時在中值的任一側上的數據點的大約30 %-45%,使得在確定標準偏差時考慮到測得的數據點的中心60%至 90%。可以根據所選生物標記數據的中間值和標準偏差確定最大允許 值(314),例如通過將中值增加到標準偏差的倍數,如不超過標準偏 差的四倍,更典型地為標準偏差的一倍半和三倍之間的量。
在本實施例中,生物標記分析系統100使用中值代替均值作為用 於確定所允許的最大值的基礎,以更準確地反映多數值,同時減小一個或幾個非常高的邊遠非高斯值的影響。還可以使用來自任何適當數 據集的數據和任何適當技術或算法來計算最大值,如來自疾病陽性群 組的數據或來自疾病陽性主體和疾病陰性主體的混合的數據。可以針 對每一個相關生物標記計算最大值。
例如,在本發明的被配置用於檢測乳腺癌的存在的實施例中,通 過將沒有乳腺癌的所有主體的生物標記的中值增加到沒有乳腺癌的所 有主體的該標記的標準偏差的兩倍半來計算可應用的生物標記的最大
值。在該示範性實施例中,PSA、 IL-6、 TNF-a、 IL-8和VEGF的適 當中值可以分別在0.01-10、 0.5-25、 0.1-10、 5-150和100-5000皮克每 毫升(pg/ml )的範圍內,如分別為0.53 、 0.34 、 2.51 、 52.12和329.98pg/ml。 例如可以分別在5-200、 10-300、 0.5-50、 100-2000和500-10000pg/ml 的範圍內對生物標記PSA、 IL-6、 TNF-a、 IL-8和VEGF的每一個分 配最大值,如分別為122.15、 12.52、 48.01、 350.89和821.15pg/ml。 因此,可以單獨地對生物標記PSA、 IL-6、 RCP、 TNF-a、 IL-8和VEGF 或對生物標記RCP、 TNF-a、 IL-8和VEGF計算不同的最大值。在本 實施例中,使用對健康婦女的ELISA測量確定這些數字。這些值可隨 更多數據的增加、ELISA程序和/或測試工具的變化、對疾病陽性婦女 的數據的依賴或非ELISA技術的使用而改變。
然後可以將得到的最大允許值與各個測得的生物標記水平相比 較(316)。如果特定主體的測得水平在最大值以上,則可以將修正指 示符或標誌(如整數值1或0)或其它適當的指示符與主體生物標記 數據相關聯,如記錄在他或她的追加數據組中的特定區域中;如果生 物標記水平在最大值以下,則將整數值0記錄在他或她的追加數據組 中(318)。可以在生成疾病狀態模型和對各個患者的生物標記水平記 分之間始終應用指示符準則,從而使疾病狀態模型的解釋容易。該指 示符還可以包括多於正好兩個離散水平。
另外,當主體的生物標記值的任何一個超過該生物標記的最大允 許值時,可以用該生物標記的最大允許值替換該原始生物標記值 (320)。該調整後的具有封頂值的數據和附加指示符可以是追加數據
17的一部分,使得該原始數據被保存並且該調整後的具有封頂值的數據 和附加指示符成為追加數據組的一部分。該附加指示符表明測得值非 常高,其可能對疾病狀態具有信息性,同時用該封頂值進行替換限制 了極高值的影響。如果沒有這種封頂,該極高值可"拉伸"該線性模 型,從而擬合作為例外的而非標準的數據。
這樣,如果患者的RCP生物標記超過最大允許值,則在主體的 追加數據中設置標誌以表示該RCP生物標記超過限制,並且可以用最 大允許值替換該原始生物標記水平。反過來,如果TNF-a生物標記水 平在被接受的值的範圍內,則該原始生物標記水平被保留並且主體的 追加數據中的對應標誌保持未被設置。
生物標記分析系統100還可以被配置成例如基於原始生物標記數 據和/或封頂的追加數據生成和分析歸一化數據。歸一化數據包括原始 數據,該原始數據被調整以解決在測得值中觀察到的變化,該測得值 可以歸因於一個或多個有統計顯著性的生物標記水平影響因素。例如, 遺傳、行為、年齡、藥物或其它因素可以增加或減少觀察到的個體的 特定生物標記水平,而與疾病狀態的存在或不存在無關。在本實施例 中,為了檢測乳腺癌,可能本質上影響指示乳腺癌的生物標記水平的
潛在因素包括年齡;絕經狀態;是否已經進行了子宮切除;各種激
素的使用,如節育、雌激素代替治療、它莫西芬(Tamoxifen)或雷 洛昔芬(Raloxifene)以及生育藥物;滿期懷孕次數;哺乳的總月數; 先前的乳房活體檢查;先前的乳房手術;乳腺癌家族史;身高;體重; 種族;飲食習慣;藥物使用,包括NSAID的使用;其它疾病的存在; 飲酒;身體活動水平;以及抽菸。
可以使用任何適當的源或系統來確定可能影響給定的生物標記 的因素,如文獻或研究。另外,可以使用任何適當的處理或技術來確 定特定的因素是否可以應用以及可以應用到什麼程度。例如,當採集 生物樣本時,可以通過主體調查問巻、附加臨床測試或其它適當的處 理以及關於可能影響其標記水平的各種因素的機制來詢問組群的成 員。可以例如以離散和/或連續變量的形式將包含關於主體本身的該信息的主體數據提供給具有原始數據的生物標記分析系統100 。
可以以任何適當的方式評估各種因素與生物標記水平的關聯及 對其影響。例如,當樣本採集完成,所有生物標記已被測量並且與附 加因素有關的原始數據和主體數據已被提供時,生物標記分析系統
100可以分析該原始數據和附加因素以確定在統計學上具有顯著影響 的這些因素。生物標記分析系統100還可以自動從多個生物標記中選 擇多個相關生物標記。在一個實施例中,參照圖4,生物標記分析系 統IOO使用作為因變量的每個生物標記和作為獨立變量的潛在影響其 水平的因素進行回歸分析或其它適當的統計分析(410)。然而生物標 記分析系統100可以使用任何適當的分析來確定所述因素和生物標記 數據的變化之間的潛在關係。
在本實施例中,可以重點考慮被發現保持低於預定水平的p值的 因素(例如,沒有限制,p〈0.1,p〈0.05或p<0.025)。還可以將生 物標記分析系統100配置為例如通過生成歸一化數據來補償該因素的 影響,其中由該因素導致的變化已從該分析中去除。例如,為了去除 因素導致的變化,可以使用描述生物標記水平和被發現重要的因素之 間的關係的線性方程的反演來轉換原始數據。在本發明的一個例子中, 可以將用於確定專用於檢測乳腺癌的生物標記的統計顯著性的所選P 值選擇為0.05。在另一具體例子中,如果原始數據和主體的線性回歸 或其它適當的分析顯示出主體的年齡和性別對與阿爾茨海默 (Alzheimer)病Y相關的潛在生物標記的影響達到具有統計顯著性 的水平,則所觀察到的生物標記水平和主體的年齡和性別之間的關係 可以用以下方程來描述
Y - ]V^ (年齡)+ M2 (小生另'J ) + B
其中Y是潛在的阿爾茨海默病生物標記的測量水平,Mi和M2是 由線性回歸確定的係數,(年齡)是發現在統計上對Y的確定有意義的連 續變量,(性別)U現在統計上對Y的確定有意義的離散變量,其中l 為男性,0為女性,B是截距(412)。為了去除可能由年齡和性別導致的 Y的變化,可以才艮據逆方程計算潛在的阿爾茨海默病生物標記Y的歸一化值或調節值Y, (414):
Y, - Y* (1/Mi)(年齡)-M2 (性別)
可以通過將該逆方程應用到原始數據和/或追加數據來生成歸一 化數據並將該數據加到追加數據。通過去除由已知的原因引起的變化, 可以將較大比例的剩餘變化歸因於疾病狀態的存在或不存在,從而弄 清可能不明顯的標記與疾病狀態的關係。當具有統計顯著性的因素被 確定為影響一個或多個潛在生物標記的水平時,可以在隨後的分析中 使用原始數據和歸 一化數據二者。對歸 一化值的分析可以闡明可能不 明顯的關係,同時原始數椐可以提供更容易的測試管理和傳送。
生物標記分析系統100可以進一 步以任何適當的方式處理原始數 據和/或追加數據,如減小非高斯分布的影響。例如,生物標記分析系 統100可以選擇一個或多個生物標記分界點並比較原始和/或追加生物 標記數據與至少 一個指定的生物標記分界點。可以根據任何適當的準 則選擇生物標記分界點,如根據與疾病對應的已知水平或基於原始和/ 或歸一化生物標記數據。例如,生物標記分析系統IOO可以比較特定 生物標記的狀況陽性和陰性生物標記數據的累積頻率分布,並根據所 選生物標記的狀況陽性累積頻率分布和狀況陰性累積頻率分布之間的 最大差異選擇該生物標記的一個或多個分界點。
在一個實施例中,參照圖5和圖6,生物標記分析系統100為每 個生物標記指定至少一個分界點。生物標記分析系統100可以首先針 對每個相關生物標記(如針對每個單獨的生物標記PSA、 IL-6、 RCP、 TNF-a、 IL-8和VEGF )生成疾病陽性群組630和疾病陰性群組620 二者的原始和/或追加數據的累積頻率分布(510)。生物標記分析系 統100可以選擇一個或多個分界點(512),例如在疾病陽性群組和疾 病陰性群組中的測量值的累積頻率分布之間的差超過預定值的水平。 該預定值可以是任何適當的閾值,如累積頻率差超過10%,其中較高 的值表示陽性群組和陰性群組之間的較大差異。
該生物標記分析系統100可以尋找陽性群組和陰性群組之間的差 異最大的水平以建立分界點640。疾病陽性和陰性狀態的累積頻率中的較大差異表示屬於疾病陽性或疾病陰性群組的傾向。反過來,顯示
為在任意點處累積頻率的差異小於10%的潛在標記的信息性的有用
程度可能較低,並且可以任選地在進一步分析中省略。
即使在累積頻率中的差異低的情況下,特別是在該分界點可被認 為特別具有信息性的情況下,如在不存在超過某一生物標記水平的疾
病陽性或疾病陰性值的情況下,也可以選擇分界點640。例如,參照 圖9,為了檢測乳腺癌,可以使用累積頻率曲線900將生物標記PSA 的分界點選擇為具有超過10%的絕對差異的局部最大值處的值。在本 實施例中,第一分界點910被選擇在1.25,第二分界點920被選擇在 2.5,第三分界點930被選擇在4.5。在這三個分界點的每一處疾病陽 性群組曲線940和疾病陰性群組曲線950之間的累積頻率差異分別為 24%、 22%和12%。在本實施例中,由於缺少超過PSA濃度為4.5的 疾病陰性值表示對於分布來說特別具有信息性的點,所以儘管累積頻 率的差異相對較低,也可以適當地選擇第三分界點930。
再參照圖5,可以將原始和/或歸一化生物標記數據與分界點進行 比較(514 )並且生物標記分析系統100可以記錄表示比較結果的值作 為分界點指示符(516)。該分界點指示符可以包括任何適當的值或指 標,如該值與分界點之間的差或其它值。在一個實施例中,如果原始 或歸一化生物標記水平在分界點以上,則記錄整數值1作為分界點指 示符並將其存儲在追加數據中;如果該水平低於該分界點,則記錄整 數值0。該整數值可以同樣地表示生物標記水平是否低於多於一個的 分界點,或者超過患者生物標記中的一些的分界點而不超過其它的分 界點。連續變量到離散變量的轉換表示屬於疾病陽性或陰性群體的傾 向。分界點的特定側的所有值可以接收相等的權重,而與它們可能有 多高或多低無關,這趨向於消除非高斯分布的影響。
生物標記分析系統100還可以被配置為例如在生物標記的測得的 或歸一化的水平值的範圍非常大的情況下減小數據值的範圍。可以將 值的範圍減小,並減少非常高的值的數量,同時保持該範圍的低端和 高端處的值之間有意義的差異。生物標記分析系統IOO可以以任何適當的方式調節值的範圍,例如通過將測得的值變化到分數冪
(fractional power)以獲得一組減小的生物標記值。生物標記分衝斤系 統100可以選擇任意適當的指數值來保持該數據中的有意義的差異。 如果選擇太小的分數冪使該範圍過窄,則可能喪失有意義的差異。
在本實施例中,生物標記分析系統可以通過將每個值變化到分數 冪來調節每個群組成員中對於每個生物標記(如生物標記PSA、 IL-6、 RCP、 TNF-a、 IL-8和VEGF)的測得值。在每個生物標記的分析中 可以包括多個不同的分數冪,如範圍從3/4到1/10的指數值,如2/3 和1/2。在與相關的生物標記數據組相關聯的追加數據中可以包括每個 減小的值。生物標記分析系統100可以例如通過去除缺乏統計顯著性 的值的組,例如在進行後期回歸分析的過程中分析該結果以確定最適 合該數據的分數冪值。以分數值指數變化測得的或歸 一化的水平值減 小了數據範圍,允許線性模型更好地擬合非線性數據,並提供記分的 連續性,其中可以施加不同的權重作為高或低值。例如在配置用於檢 測乳腺癌的實施例中,生物標記PSA、 IL-6、 RCP、 TNF-a、 IL-8和 VEGF的適當分數冪對於每個相關生物標記可以包括1/10、 1/5、 1/3、 1/2和2/3。
生物標記分析系統100可以對原始數據、歸一化數據、任何其它 追加數據和/或對疾病的發展的特定風險有影響的任何附加疾病風險 因素生成疾病狀態模型。考慮到人體生物化學的複雜性,許多因素可 能影響一個或多個生物標記的測量濃度,包括但不限於患者的人口統 計學特徵、家族史和病史。這些因素都增加潛在標記的觀測可變性和
標準偏差,掩飾或模糊與疾病狀態的關係。
生物標記分析系統100可以分析和/或處理可影響主體風險的疾 病風險因素以及可如上述不同地影響生物標記水平的生物標記因素。 例如,生物標記分析系統100可以與分析標記特定得分相結合在對數 據的全面分析中考慮疾病風險因素。考慮風險因素解決了流行性的差 異,並且本質上移動總體得分,從而反映該流行性。
例如,對於可能影響測得的生物標記水平的生物標記因素,在確定變量和疾病狀態之間的關係時可以將疾病風險因素包括在所確定的 變量當中。可以根據任何適當的準則和/或從任何適當的源選擇附加疾 病風險因素。例如,技術文獻可以確定對關注的特定疾病發展的特定 風險有影響的附加因素。特定風險因素可以包括但不限於年齡、種族、 家族史、初潮日期、絕經狀態、沮喪、疾病狀態、藥物治療狀態、體
重指數(BMI)、第一胎日期、頭部傷害和/或其它因素。當已知或懷 疑這些疾病風險因素與疾病狀態相關聯時,應該關於該疾病風險因素 詢問該主體的病史和/或實際主體。可以將該附加主體數據提供給生物 標記分析系統100,其可以利用主體的生物標記因素數據記錄主體的 疾病風險因素數據作為附加的連續或離散變量。
生物標記分析系統100適當地分析該數據以鑑別疾病狀態和各種 原始數據、追加數據和/或主體數據之間的關係。可以根據任何適當的 分析和準則來確定該關係。例如,生物標記分析系統100可以建立描 述所確定的變量和疾病狀態之間關係的方程,如線性方程。生物標記 分析系統100可以應用任何適當的分析,如使用疾病狀態作為因變量 和原始數據和追加數據的一個或多個元素作為獨立變量的一個或多個 傳統回歸分析(例如,線性回歸、對數回歸和/或泊術〉回歸),或者採 用其它分析方法,如通用線性模型方法、邏輯方法、判別函數分析、 協方差分析、矩陣代數和微積分,以及/或者接收器操作特徵方法。在 一個實施例中,生物標記分析系統IOO自動生成用於根據各群組對於 相關生物標記的生物標記數據之間的差異來確定疾病狀態的統計模
該生物標記分析系統IOO可以按照任何適當的技術或處理來評估
生物標記與特定疾病或狀況的相關性。在一個實施例中,生物標記分
析系統IOO進行生物標記數據的統計分析,如統計顯著性分析。例如, 生物標記分析系統100可以自動生成疾病狀態模型,該模型例如通過
放棄在對疾病狀態的統計分析時產生低於預定值的p值的所有潛在生 物標記來消除無信息和一些信息較少的生物標記。生物標記分析系統
100可以例如通過該模型施加到標記的係數或者通過每個標記的係數與其值的範圍的乘積來確定剩餘的各個生物標記的相對貢獻或強度。 在該模型中與其它生物標記的係數或乘積相比,較高的係數或乘積表 示該生物標記可被分配的較大的影響,以便在該疾病狀態模型中確定 疾病狀態。在本實施例中,該分析可以減少所使用的分界點和分數指 數值的數量,在許多情況下,可以減少到單個分界點和/或分數指數。
一些因數可能涉及完全相同的信息,所以生物標記分析系統100可以
選擇最有用的因素,如具有最低p值的因素。
參照圖7,生物標記分析系統IOO可以進行迭代分析,該迭代分 析或者以單個變量開始並且每次將變量加1,或者以全部變量開始並 且每次將變量減1,直到全部變量都被確定為統計顯著的,比如通過 使p值低於閾值水平(例如,但不是限制,p<0.1、 p〈0.05或者p〈 0.025 ) ( 710 )。可以將該迭代分析配置為鑑別並去除與其它數據相 比關於疾病狀態信息較少的生物標記數據。例如,在該模型中保留表 現出p值低於預定值的獨立變量,同時放棄p值高於該預定值的獨立 變量(712)。生物標記分析系統IOO可以分析變量的增加和減少的多 個變化,以獲得最佳方案(714),例如最大化該模型的調節後的R 平方或者貝葉斯信息準則並避免次優化該模型。例如,最終的記分模 型可以採用以下方程的形式
y = + m2X2 + m3xn + m4(^ + m5d2 + m5dn + b
其中,y是代表疾病狀態的連續變量;
x^是連續變量,如在生物標記樣本中測得的原始生物標記水平 和/或已經被確定為統計上顯著的歸一化或封頂的值,如RCP、TNF-a、 IL-8和VEGF生物標記的原始和追加數據;
d^是離散變量,如已經被確定為統計上顯著的離散疾病風險因 素或追加數據中的指示符,
iih至mn是與每個所確定的變量相關聯的係數,以及
b是該方程的y截距。
當限定了剩餘的變量並選擇出它們各自的係數時,生物標記分析 系統IOO建立作為疾病狀態模型的最終方程(716)。生物標記分析系統IOO可以建立作為進一步評估的候選的多個疾病狀態模型。生物標 記分析系統IOO可以通過將該疾病狀態模型中的變量的值乘以在建模
期間確定的係數並將乘積連同截距值相加來生成相關群組中的各主體
的綜合得分(718)。然而,該疾病狀態模型可以包括用於根據原始數 據、追加數據和/或主體數據預測疾病狀態的任何適當的模型或關係。
生物標記分析系統IOO可以使用對疾病狀態與各種原始數據、追 加數據和/或主體數據之間關係的分析結果來建立用於使用被鑑別為 具有信息性的數據確定疾病狀態的診斷準則。生物標記分析系統100 可以根據任何適當的處理和/或技術建立該診斷準則。例如,生物標記 分析系統100可以鑑別和/或量化疾病陽性群組的信息性數據(和/或 信息性數據的組合)與對應的疾病陰性群組的信息性數據(和/或信息 性數據的組合)之間的差異。
在本實施例中,生物標記分析系統100比較各群組的綜合得分以 確定可以表示疾病陽性或陰性狀態的該綜合得分中的一個或多個分界 點。例如,生物標記分析系統100可以選擇和/或檢索一個或多個診斷 分界點並比較各群組的綜合得分與診斷分界點(722)。可以根據任何 適當的準則,如根據各群組的綜合得分的中值和/或累積頻率之間的差 異來選擇該診斷分界點。作為選擇,該分界點可以是綜合得分的範圍 上的規則間隔。
生物標記分析系統100可以比較群組的每個成員的綜合得分與一 個或多個分界點,並記錄表示比較結果的值作為綜合得分分界點指示 符(724)。該綜合得分分界點指示符可以包括任何適當的值或指標, 如該值與分界點之間的差或其它值。在一個實施例中,如果綜合得分 在分界點以上,則記錄整數值l作為綜合得分分界點指示符;如果該 水平低於該分界點,則記錄整數值0。該整數值同樣可以表示綜合得 分是否低於多於一個的分界點。
在本實施例中,為了確定適當的分界點以確定疾病陽性或疾病陰 性狀態,以跨越該數據範圍的不同分界點適當地評估每個群組主體的 綜合得分。根據該數據和疾病之間關係的本質,在每個分界點處,等
25於或小於該分界點的值可以被認為是疾病陰性,而高於該分界點的值
可以被認為是疾病陽性點,反之亦然。生物標記分析系統100可以比
較每個分界點候選的綜合得分分界點指示符與每個群組成員的真實診
斷狀態(726),並量化每個分界點處的測試性能(728),例如由靈 敏度、特異性、真陽性比例、真陰性比例、假陽性比例、假陰性比例 等等所定義的測試性能。生物標記分析系統IOO可以從評估出的分界 點的範圍中為數據的將來評估選擇一個或多個分界點,使得靈敏度被 最大化,特異性被最大化,或者作為最大的靈敏度和特異性的折中將 總體測試性能最大化。
現在參照圖IO,在被配置用於檢測乳腺癌的存在的本發明的示範 性實施例中,可以通過使用數據記分模型1000來選擇適當的分界點。 在該實施例中,數據記分模型1000包括表示在各分界點處的特異性和 靈敏度的測試準確度的表格1020。使用在表格1020中提供的數據, 生物標記分析系統IOO可以選擇分界點1010以提供靈敏度和特異性之 間最佳平衡,如本示範性實施例中在0.55。
生物標記分析系統100還可以被配置用於核實疾病狀態模型的有 效性。例如,生物標記分析系統100可以接收來自疾病陰性和疾病陽 性個體的盲數據。該盲數據可以被分析以得出可以與實際診斷相比較 的診斷,從而確認該疾病狀態模型獨自基於測得的和確定的變量的值 區分疾病陰性和疾病陽性。如果幾個模型是可行的,則可以選擇與臨 床診斷具有最高一致性的模型用於進一步的主體評估。
在建立該疾病狀態模型之後,生物標記分析系統100可以分析生 物樣本數據和/或主體數據,以應用該疾病狀態模型作為各患者的疾病 狀態的指標。相關生物標記水平可以被測量並與相關主體數據一起提 供給生物標記分析系統100。
生物標記分析系統IOO可以處理生物標記數據和主體數據,例如 用於根據任何相關生物標記因素調節生物標記水平。生物標記分析系 統IOO可以不使用各種變量,如一個或多個與生物標記特定分界點相
關聯的整數值、減小的值、表示異常值的整數值以及原始或歸一化的數據。特定疾病狀態模型不需要的數據可以被放棄。生物標記分析系
統100可以只使用和/或生成相關生物標記和變量,它們顯示出統計顯
著性並且/或者在疾病狀態模型中使用,以評估各患者。例如,如果疾
病狀態模型最初考慮生物標記PSA、 IL-6、 RCP、 TNF-ou IL-8和 VEGF,但是》丈棄作為不顯著或低顯著的生物標記的生物標記PSA和
TT _《 Bill A 44 "il^i、?.A:l:jf玄4* 1 ftA "ST l" A直A 44 DC A知TT —/; 朵務
7 A一 ','一, ,7 j 'j、 i vf Vf j、/ i , w i ,| 「 v m ^
據並進行對生物標記RCP、 TNF-ou IL-8和VEGF的分析。
參照圖8,生物標記分析系統IOO可以對生物標記數據和其它患 者信息進行任何適當的處理。例如,生物標記分析系統100可以為患 者的相關生物標記水平的每一個建立指示符,如整數值,其表示每個 生物標記的水平是否超過在疾病狀態模型中指定的相關特定生物標記 最大允許值(810)。生物標記分析系統IOO還可以將對應的指示符與 患者的追加數據組相關聯,表示原始數據值超過相關限制。
另外,生物標記分析系統IOO可以根據在生成疾病狀態模型中建 立的歸一化準則以及患者的主體數據,如患者年齡、吸菸習慣等,生 成患者的歸一化數據(812)。可以將該歸一化數據加到患者的追加數 據。
生物標記分析系統100還可以將患者的原始數據和/或追加數據 與生物標記分界點進行比較,並生成每個相關生物標記分界點的分界 點指示符和對應數據(814)。生物標記分析系統IOO可以例如通過將 相關數據變化到由疾病狀態模型使用的分數冪,並將所有減小的數據 值與患者數據組相關聯來進一步為患者的相關測量生物標記水平的每 一個建立減小的數據值(816)。
生物標記分析系統100可以結合該疾病狀態模型評估原始生物標 記數據和任何其它相關數據。例如,生物標記分析系統IOO可以使用 患者的生物標記數據和其它數據以及該疾病狀態模型來計算患者的綜 合得分(818)。生物標記分析系統IOO可以比較綜合得分與記分模型 分界點(820)。分界點以上的得分暗示主體的疾病狀態是陽性的,同 時分界點以下的得分表示該主體是陰性的。生物標記分析系統100還
27可以將綜合得分與不確定區域的邊界限制進行比較,該不確定區域可 以構建在不能進行判斷的分界點周圍。該不確定區域例如可以解決患 者的生物可變性(關注的生物標記通常天天變化)和評估方法誤差二 者。
所示出和描述的具體實施方式
說明了本發明及其最佳模式,並不 意圖以任何方式限制本發明的範圍。實際上為了簡潔,傳統處理、數 據輸入、計算機系統以及該系統的其它功能方面可以不詳細描述。另 外,各附圖中所示出的連線用於代表各元件之間示範性的功能關係和/ 或物理耦合。在實際系統中可以存在許多可選擇的或附加的功能關係 或物理連接。
上面結合具體實施例描述了本發明。然而,可以對該具體實施例 進行變化和修改而不偏離本發明的範圍。這些和其它變化或修改意圖 包括在本發明的範圍內。
權利要求
1. 一種用於評估人的疾病狀態的方法,包括獲取狀況陽性群組對於多個生物標記的狀況陽性生物標記數據;獲取狀況陰性群組對於多個生物標記的狀況陰性生物標記數據;自動從多個生物標記中選擇多個相關生物標記;以及根據狀況陽性群組對於相關生物標記的生物標記數據和狀況陰性群組對於相關生物標記的生物標記數據之間的差異生成用於確定疾病狀態的統計模型。
2. 根據權利要求1所述的方法,其特徵在於,還包括 生成狀況陽性群組對於相關生物標記的範圍減小的生物標記數據和狀況陰性群組對於相關生物標記的範圍減小的生物標記數據;並且 其中生成統計模型包括根據以下差異生成統計模型 狀況陽性群組對於相關生物標記的生物標記數據和狀況陰性群組對於相關生物標記的生物標記數據之間的差異;以及狀況陽性群組對於相關生物標記的範圍減小的生物標記數據和狀況陰性群組對於相關生物標記的範圍減小的生物標記數據之間的差異。
3. 根據權利要求2所述的方法,其特徵在於,生成範圍減小的生 物標記數據包括將生物標記數據乘以分數的指數。
4. 根據權利要求l所述的方法,其特徵在於,還包括 比較所選的生物標記的狀況陽性生物標記數據的累積頻率分布和所選的生物標記的狀況陰性生物標記數據的累積頻率分布;根據所選的生物標記的狀況陽性累積頻率分布和狀況陰性累積頻 率分布之間的最大差異選擇生物標記的分界點。
5. 根據權利要求4所述的方法,其特徵在於,還包括將狀況陽性生物標記數據和狀況陰性生物標記數據與分界點進行 比較;以及根據與分界點比較的每個數據是否超過分界點生成包括一組離散值的分界點數據組。
6. 根據權利要求l所述的方法,其特徵在於,生成統計模型包括 對狀況陽性群組對於相關生物標記的生物標記數據和狀況陰性群組對 於相關生物標記的生物標記數據進行迭代分析,其中所述迭代分析被 配置為鑑別並去除與第二組數據相比關於疾病狀態的信息性較低的第 一組數據。
7. 根據權利要求1所述的方法,其特徵在於;還包括 將狀況陽性生物標記數據和狀況陰性生物標記數據與閾值進行比較;並且根據比較結果生成與閾值比較的狀況陽性生物標記數據和狀況陰 性生物標記數據的多個離散值;以及根據狀況陽性群組對於相關生物標記的離散值和狀況陰性群組對 於相關生物標記的生物標記數據的離散值之間的差異生成用於確定疾 病狀態的統計模型。
8. 根據權利要求7所述的方法,其特徵在於,還包括生成狀況陽封頂生物標記數據包括封頂限制內的數據的狀況陽性生物標記數據和狀況陰性生物標記 數據;以及超過封頂限制的狀況陽性生物標記數據和狀況陰性生物標記數據 的封頂值。
9. 根據權利要求8所述的方法,其特徵在於,還包括根據狀況陽 性生物標記數據和狀況陰性生物標記數據中的至少一個的中值選擇封 頂限制。
10. 根據權利要求l所述的方法,其特徵在於, 統計模型包括至少一個因變量和多於一個的獨立變量, 疾病狀態是因變量;並且多個相關生物標記的多個量值包括多個獨立變量。
11. 一種用於評估人的疾病狀態的系統,包括計算機系統,該計算機系統被配置用於接收狀況陽性群組對於多個生物標記的狀況陽性生物標記數椐; 接收狀況陰性群組對於多個生物標記的狀況陰性生物標記數據; 自動從多個生物標記中選擇多個相關生物標記;以及 根據狀況陽性群組對於相關生物標記的生物標記數據和狀況陰性群組對於相關生物標記的生物標記數據之間的差異自動生成用於確定處病;He水^i統i+;虔刑
12. 根據權利要求ll所述的系統,其特徵在於,所述計算機系統 被進一步配置用於生成狀況陽性群組對於相關生物標記的範圍減小的生物標記數據 和狀況陰性群組對於相關生物標記的範圍減小的生物標記數據;並且 根據以下差異自動生成統計模型對於相關生物標記的生物標記數據之間的差異;以及狀況陽性群組對於相關生物標記的範圍減小的生物標記數據和狀 況陰性群組對於相關生物標記的範圍減小的生物標記數據之間的差 異。
13. 根據權利要求12所述的系統,其特徵在於,所述計算機系統 被配置用於通過將生物標記數據乘以分數的指數來生成範圍減小的生 物標記數據。
14. 根據權利要求ll所述的系統,其特徵在於,所述計算機系統 還^Ji置用於比較所選的生物標記的狀況陽性生物標記數據的累積頻率分布和 所選的生物標記的狀況陰性生物標記數據的累積頻率分布;根據所選的生物標記的狀況陽性累積頻率分布和狀況陰性累積頻 率分布之間的最大差異選擇生物標記的分界點。
15. 根據權利要求14所述的系統,其特徵在於,所述計算機系統 還被配置用於將狀況陽性生物標記數據和狀況陰性生物標記數據與分界點進行比較;以及根據與分界點比較的每個數據是否超過分界點生成包括一組離散 值的分界點數據組。
16. 根據權利要求11所述的系統,其特徵在於,所述計算機系統 被配置用於通過對狀況陽性群組對於相關生物標記的生物標記數據和 狀況陰性群組對於相關生物標記的生物標記數據進行迭代分析自動生 成統計模型,其中迭代分析被配置為鑑別並去除與第二組數據相比關 於疾病狀態的信息性較低的第一組數據。
17. 根據權利要求11所述的系統,其特徵在於,所述計算機系統 被進一步配置用於將狀況陽性生物標記數據和狀況陰性生物標記數據與閾值進行比 較;並且性生物標記數據的多個離散值;以及根據狀況陽性群組對於相關生物標記的離散值和狀況陰性群組對 於相關生物標記的生物標記數據的離散值之間的差異自動生成用於確 定疾病狀態的統計模型。
18. 根據權利要求17所述的系統,其特徵在於,所述計算機系統 還被配置用於生成狀況陽性生物標記數據和狀況陰性生物標記數據的 封頂生物標記數據,其中封頂生物標記數據包括封頂限制內的數據的狀況陽性生物標記數據和狀況陰性生物標記 數據;以及超過封頂限制的狀況陽性生物標記數據和狀況陰性生物標記數據 的封頂值。
19. 根據權利要求18所述的系統,其特徵在於,所述計算機系統 還被配置用於根據狀況陽性生物標記數據和狀況陰性生物標記數據中 的至少 一個的中值選擇封頂限制。
20. 根據權利要求11所述的系統,其特徵在於, 統計模型包括至少一個因變量和多於一個的獨立變量,疾病狀態是因變量;並且多個相關生物標記的多個量值包括多個獨立變量。
21. —種電腦程式,該電腦程式被配置成使計算機執行用於評估人的疾病狀態的方法,該方法包括獲取狀況陽性群組對於多個生物標記的狀況陽性生物標記數據;獲取狀況陰性群組對於多個生物標記的狀況陰性生物標記數據;自動從多個生物標記中選擇多個相關生物標記;以及根據狀況陽性群組對於相關生物標記的生物標記數據和狀況陰性群組對於相關生物標記的生物標記數據之間的差異自動生成用於確定疾病狀態的統計模型。
22. 根據權利要求21所述的電腦程式,其特徵在於,所述方法還包括生成狀況陽性群組對於相關生物標記的範圍減小的生物標記數據和狀況陰性群組對於相關生物標記的範圍減小的生物標記數據;並且其中自動生成統計模型包括根據以下差異生成統計模型狀況陽性群組對於相關生物標記的生物標記數據和狀況陰性群組對於相關生物標記的生物標記數據之間的差異;以及狀況陽性群組對於相關生物標記的範圍減小的生物標記數據和狀況陰性群組對於相關生物標記的範圍減小的生物標記數據之間的差異。
23. 根據權利要求22所述的電腦程式,其特徵在於,生成範圍減小的生物標記數據包括將生物標記數據乘以分數的指數。
24. 根據權利要求21所述的電腦程式,其特徵在於,該方法還包括比較所選的生物標記的狀況陽性生物標記數據的累積頻率分布和所選的生物標記的狀況陰性生物標記數據的累積頻率分布;根據所選的生物標記的狀況陽性累積頻率分布和狀況陰性累積頻率分布之間的最大差異選擇生物標記的分界點。
25. 根據權利要求24所述的電腦程式,其特徵在於,所述方法還包括將狀況陽性生物標記數據和狀況陰性生物標記數據與分界點進行比較;以及根據與分界點比較的每個數據是否超過分界點生成包括一組離散值的分界點數據組。
26. 根據權利要求21所述的電腦程式,其特徵在於,自動生成統計模型包括對狀況陽性群組對於相關生物標記的生物標記數據和狀況陰性群組對於相關生物標記的生物標記數據進行迭代分析,其中迭代分析被配置為鑑別並去除與第二組數據相比關於疾病狀態的信息性較低的第 一 組數據。
27. 根據權利要求21所述的電腦程式,其特徵在於,所述方法還包括較;並且根據比較結果生成與閾值比較的狀況陽性生物標記數據和狀況陰性生物標記數據的多個離散值;以及根據狀況陽性群組對於相關生物標記的離散值和狀況陰性群組對於相關生物標記的生物標記數據的離散值之間的差異自動生成用於確定疾病狀態的統計模型。
28. 根據權利要求27所述的電腦程式,其特徵在於,所述方法還包括生成狀況陽性生物標記數據和狀況陰性生物標記數據的封頂生物標記數據,其中封頂生物標記數據包括封頂限制內的數據的狀況陽性生物標記數據和狀況陰性生物標記數據;以及超過封頂限制的狀況陽性生物標記數據和狀況陰性生物標記數據的封頂值。
29. 根據權利要求28所述的電腦程式,其特徵在於,所述方法還包括根據狀況陽性生物標記數據和狀況陰性生物標記數據中的至少一個的中值選擇封頂限制。
30.根據權利要求21所述的電腦程式,其特徵在於,統計模型包括至少一個因變量和多於一個的獨立變量,疾病狀態是因變量;並且多個相關生物標記的多個量值包括多個獨立變量。
全文摘要
根據本發明各方面的鑑別疾病狀態的方法和設備包括分析一個或多個生物標記的水平。該方法和設備可以使用狀況陽性群組和狀況陰性群組的生物標記數據並從多個生物標記中選擇多個相關生物標記。該系統可以生成用於根據各群組對於相關生物標記的生物標記數據之間的差異確定疾病狀態的統計模型。該方法和設備還可以通過產生個體患者的綜合得分並將該患者的綜合得分與用於鑑別潛在疾病狀態的一個或多個閾值相比較來幫助確定個體的疾病狀態。
文檔編號G01N33/48GK101479599SQ200780023720
公開日2009年7月8日 申請日期2007年4月25日 優先權日2006年5月1日
發明者G·F·蘭達爾 申請人:曾羅維斯塔診斷學有限責任公司

同类文章

一種新型多功能組合攝影箱的製作方法

一種新型多功能組合攝影箱的製作方法【專利摘要】本實用新型公開了一種新型多功能組合攝影箱,包括敞開式箱體和前攝影蓋,在箱體頂部設有移動式光源盒,在箱體底部設有LED脫影板,LED脫影板放置在底板上;移動式光源盒包括上蓋,上蓋內設有光源,上蓋部設有磨沙透光片,磨沙透光片將光源封閉在上蓋內;所述LED脫影

壓縮模式圖樣重疊檢測方法與裝置與流程

本發明涉及通信領域,特別涉及一種壓縮模式圖樣重疊檢測方法與裝置。背景技術:在寬帶碼分多址(WCDMA,WidebandCodeDivisionMultipleAccess)系統頻分復用(FDD,FrequencyDivisionDuplex)模式下,為了進行異頻硬切換、FDD到時分復用(TDD,Ti

個性化檯曆的製作方法

專利名稱::個性化檯曆的製作方法技術領域::本實用新型涉及一種檯曆,尤其涉及一種既顯示月曆、又能插入照片的個性化檯曆,屬於生活文化藝術用品領域。背景技術::公知的立式檯曆每頁皆由月曆和畫面兩部分構成,這兩部分都是事先印刷好,固定而不能更換的。畫面或為風景,或為模特、明星。功能單一局限性較大。特別是畫

一種實現縮放的視頻解碼方法

專利名稱:一種實現縮放的視頻解碼方法技術領域:本發明涉及視頻信號處理領域,特別是一種實現縮放的視頻解碼方法。背景技術: Mpeg標準是由運動圖像專家組(Moving Picture Expert Group,MPEG)開發的用於視頻和音頻壓縮的一系列演進的標準。按照Mpeg標準,視頻圖像壓縮編碼後包

基於加熱模壓的纖維增強PBT複合材料成型工藝的製作方法

本發明涉及一種基於加熱模壓的纖維增強pbt複合材料成型工藝。背景技術:熱塑性複合材料與傳統熱固性複合材料相比其具有較好的韌性和抗衝擊性能,此外其還具有可回收利用等優點。熱塑性塑料在液態時流動能力差,使得其與纖維結合浸潤困難。環狀對苯二甲酸丁二醇酯(cbt)是一種環狀預聚物,該材料力學性能差不適合做纖

一種pe滾塑儲槽的製作方法

專利名稱:一種pe滾塑儲槽的製作方法技術領域:一種PE滾塑儲槽一、 技術領域 本實用新型涉及一種PE滾塑儲槽,主要用於化工、染料、醫藥、農藥、冶金、稀土、機械、電子、電力、環保、紡織、釀造、釀造、食品、給水、排水等行業儲存液體使用。二、 背景技術 目前,化工液體耐腐蝕貯運設備,普遍使用傳統的玻璃鋼容

釘的製作方法

專利名稱:釘的製作方法技術領域:本實用新型涉及一種釘,尤其涉及一種可提供方便拔除的鐵(鋼)釘。背景技術:考慮到廢木材回收後再加工利用作業的方便性與安全性,根據環保規定,廢木材的回收是必須將釘於廢木材上的鐵(鋼)釘拔除。如圖1、圖2所示,目前用以釘入木材的鐵(鋼)釘10主要是在一釘體11的一端形成一尖

直流氧噴裝置的製作方法

專利名稱:直流氧噴裝置的製作方法技術領域:本實用新型涉及ー種醫療器械,具體地說是ー種直流氧噴裝置。背景技術:臨床上的放療過程極易造成患者的局部皮膚損傷和炎症,被稱為「放射性皮炎」。目前對於放射性皮炎的主要治療措施是塗抹藥膏,而放射性皮炎患者多伴有局部疼痛,對於止痛,多是通過ロ服或靜脈注射進行止痛治療

新型熱網閥門操作手輪的製作方法

專利名稱:新型熱網閥門操作手輪的製作方法技術領域:新型熱網閥門操作手輪技術領域:本實用新型涉及一種新型熱網閥門操作手輪,屬於機械領域。背景技術::閥門作為流體控制裝置應用廣泛,手輪傳動的閥門使用比例佔90%以上。國家標準中提及手輪所起作用為傳動功能,不作為閥門的運輸、起吊裝置,不承受軸向力。現有閥門

用來自動讀取管狀容器所載識別碼的裝置的製作方法

專利名稱:用來自動讀取管狀容器所載識別碼的裝置的製作方法背景技術:1-本發明所屬領域本發明涉及一種用來自動讀取管狀容器所載識別碼的裝置,其中的管狀容器被放在循環於配送鏈上的文檔匣或託架裝置中。本發明特別適用於,然而並非僅僅專用於,對引入自動分析系統的血液樣本試管之類的自動識別。本發明還涉及專為實現讀