處理色譜系統中數據的系統及方法
2023-07-27 21:55:21 1
處理色譜系統中數據的系統及方法
【專利摘要】描述了用於處理色譜系統中的數據的系統及方法。在實現中,系統及方法包括處理由色譜系統生成的數據,以生成處理後的數據,分析處理後的數據,並且基於處理後的數據準備和提供結果。
【專利說明】處理色譜系統中數據的系統及方法
[0001] 優先權聲明
[0002] 本申請要求於2012年3月12日提交的國際申請NO.PCT/US2012/028754和於2012 年1月16日提交的美國臨時申請序列No. 61/587, 041的優先權。以上提到的每個申請的 全部內容都通過引用被結合於此。
【技術領域】
[0003] 本公開內容涉及用於在色譜質譜分析系統中所獲得的數據的數據處理技術。
【背景技術】
[0004] 已知色譜質譜儀產生大量數據並且許多數據包括噪聲或不想要的信息。期望高效 並精確地區分相關信息和噪聲並且以高效和高解析度方式處理其的系統及方法。
【發明內容】
[0005] 描述了用於處理色譜系統中的數據的系統及方法。在實現中,該系統及方法包括 處理由色譜系統生成的數據以生成處理後的數據,分析處理後的數據,並且基於處理後的 數據準備和提供結果。
【專利附圖】
【附圖說明】
[0006] 圖1繪出了根據本公開內容中所描述的實現的、涉及識別並去卷積色譜峰的因子 分析技術的一般過程;
[0007] 圖2是氣相色譜、質譜系統的一般框圖;
[0008] 圖3說明了根據實現的技術的特徵;
[0009] 圖4代表根據實現的、用於預先處理來自數據獲取系統的數據的示例性方法; [0010] 圖5代表根據實現的基線校正的示例性方法;
[0011] 圖6識別過濾過程的示例性實現;
[0012] 圖7繪出了根據本公開內容中所討論的原理的、識別基本上優化的係數的代表性 過程;
[0013] 圖8說明了根據實施例的、可以用來證明子簇峰形狀的資格(限制,qualify)的 代表性過程;
[0014] 圖9陳述了根據實現的、通常無關數據可以從子簇除去以便精煉數據的方法;
[0015] 圖10繪出了識別共享質量的代表性過程;
[0016] 圖11繪出了根據這裡所述實現的各方面的引種(seeding)方法;
[0017] 圖12說明了根據所述實施例的、用於因子識別的過程;
[0018] 圖13繪出了示例性系統中Μ相對於峰相關性閾值的比較;
[0019] 圖14用圖形方式證明了實現中Μ與峰相關性閾值的關係曲線;
[0020] 圖15提供了防止因子分裂的方法;
[0021] 圖16繪出了根據本公開內容中所描述的實現的、涉及峰分組的一般過程;
[0022] 圖17繪出了根據實現的、用於確定峰均值(mean)和峰標準差的示例性方法;
[0023] 圖18繪出了根據實現的、用於確定第一峰和第二峰的均值保留時間是否基本相 同的示例性方法;以及
[0024] 圖19繪出了根據實現的、用於確定第一峰和第二峰的方差是否基本相同的示例 性方法。
[0025] 相同的標號在各個圖中指相同的元件。
【具體實施方式】
[0026] 參考圖1,公開了用於因子分子技術的示例性方法,該技術從色譜、質譜系統識別 並去卷積色譜峰。應當理解,這種方法可以在所有類型的色譜系統中使用,包括液相和氣 相。在實施例中,並且如所說明的,該方法包括步驟(i)預處理由分析系統接收到的數據 (S200),(ii)分析預處理後的數據(S300),(iii)處理與被相信在所述數據中表示的任何 同位素或加合物關聯的數據(S400);以及(v)準備並提供關聯的結果(S500)。
[0027] 在實現中,由與質譜儀關聯的數據獲取系統提供要分析的數據。對於本公開內容, 應當理解,數據獲取系統可以是如在美國7, 501,621、美國7, 825, 373和美國7, 884, 319中 所闡述的系統。
[0028] 另外,在進行這種分析之前,來自數據獲取系統的數據可以被調整,如在美國臨時 專利申請序列No. 61/445, 674中所闡述的。以上所述的以及所有其它引用的專利和申請的 全部內容都通過引用被結合於此。當所結合的參考文件中的術語的定義或使用與本文所提 供的那個術語的定義不一致或相反時,應用本文所提供的那個術語的定義並且不應用參考 文件中那個術語的定義。
[0029] 總而言之,上述數據獲取系統通常把來自質譜儀系統的原始數據轉換成稱為"棒 (stick) "的質心質譜,每個棒都代表一個離子峰並且由強度、確切的質量值和質量解析度 值組成。在棒的構造過程中,來自模數轉換器的原始數據已經經歷了大約1〇 4或1〇5:1的壓 縮並且大部分獲取噪聲和冗餘信息已經被除去了。結果是非常稀疏的兩維數據,但是化學 背景噪聲仍然可以存在,因為這種數據獲取系統的目標是把所有離子信息轉發到後續的處 理階段。接下來,棒在相鄰的保留時間掃描中被漂移校正並收集到統計相似質量的簇中。
[0030] 在實現中,具有相似強度分布的簇被認為代表來自從色譜柱洗脫的分子化合物的 各種同位素、加合物及碎片離子。此外,還有來自於諸如柱流失(column bleed)、移動相汙 染、環境汙染等各種來源的、不具有色譜結構的背景離子的簇。簇過濾器可以被應用來去除 具有小於期望的最小信噪比水平的簇,並且其餘的簇之後被送到處理系統,用於繼續分析。
[0031] 應當理解,基於本公開的內容,如圖3所示,在數據處理的每個階段,通常優選地 是以保留一些殘差噪聲為代價來保留好的信息。一般地,所描述的系統具有經優化的保留 噪聲量,以保持數據的完整性。
[0032] 圖4代表用於預處理由處理系統從數據獲取系統接收到的數據的示例性方法。在 實現中,處理(S200)包括步驟:分離長簇與短簇並且對長簇進行基線校正(S210)、過濾數 據以平滑數據(S220)、將過濾後的簇劃分為子簇(S230)以及證明子簇的資格(S240)。在 實施例中,如下文中更具體討論的,子簇的資格證明可以包括證明峰形狀的資格和證明信 噪比的資格中至少一個。
[0033] 已經發現,長簇可以具有與整個分析的長度接近的持續時間並且大部分長簇是如 果不被適當處理就可能使結果實際上偏移的背景離子。而且,長簇常常相對強並且通常具 有與其相關聯的高噪聲。但是,因為,由於來自於洗脫化合物的共享質量的貢獻,一些這種 數據也可能包括期望的色譜數據,所以優選地對長簇提供進一步分析,而不是將它們全部 提取出來。由於它們提升的強度,因此,在實現中,這種長簇可以首先經受基線校正。
[0034] 現在將公開這種基線校正的方法。在實現中並且如圖5所示,對數據執行基線校 正的步驟可以包括以下過程:將數據分離成塊,每個塊的長度被確定為色譜數據的期望全 寬半高的倍數(S211)、基於那個塊的下四分位中的基線強度估計在塊的中心的基線強度 (S212)、在前述等距四分位點之間進行線性內插,以產生基線估計(S213)、把基線之上的數 據剪切到基線水平,並且保留基線以下的數據(S214)、平滑所剪切的數據的曲線,以產生基 線的改善版本(S215)以及重複步驟(S214)和(S215),直到全部或基本全部數據降到平滑 後基線之上的最小公差內。上述基線校正可以對每個期望的分離後的塊進行,在實現中,塊 可以包括全部或基本全部分離後的塊。類似地,校正可以應用到每個長簇,在實現中,長簇 可以包括全部或基本全部長簇。
[0035] 在實現中,在步驟(S211)期間塊的長度被估計為色譜數據的期望全寬半高的五 (5)倍,但應當理解,基於本公開內容,該長度可以大於或小於五(5)倍。
[0036] 如所討論的,剪切數據(S214)涉及平滑剪切後的數據的曲線。在實現中,實現 Savitzky-Golay平滑算法,以提供平滑步驟。其它平滑算法也可以採用並且本發明不應當 由此受到限制。
[0037] 繼續參照圖4,數據可以接下來被過濾,以去除噪聲(S220)。這種過濾過程的實現 在圖6中說明。在實現中並且如所討論的,無限脈衝響應濾波器被用來執行這個步驟,但應 當理解,基於這裡的內容,其它類型的濾波器也可以代替使用,諸如有限脈衝響應濾波器。 繼續參照圖6,識別數據內的最大峰並且估計該峰的全寬半高(S221)。這個估計的值接下 來對照預定義的查找表進行匹配,以便基於它們的全寬半高識別一組前向和反向二級無限 脈衝響應濾波器係數,這些係數都被優化以平滑色譜峰(S222)。使用在步驟(S222)中得出 的識別出的、經優化的係數,數據被平滑(S223)。接下來,平滑後的數據與原始數據相比較, 以識別每個簇的噪聲圖(S224)。在實現中,每個簇的噪聲圖作為平滑數據與原始數據之間 的殘差的標準差來計算。為了基於本公開內容將變得明顯的目的,噪聲圖被保留,因為其將 會被分配到根據(S230)從簇得出的每個子簇。這種方法提供了最大似然最小二乘法估計, 其有助於沒有受到高強度數據過度影響的分析,並且允許低強度數據被充分表示。
[0038] 如所討論的,在實施例中,通過在(S222)使用查找表來識別經優化的係數。在實 現中,在進行任何處理之前,對於若干期望的全寬半高值,優化後的係數被預先計算並保存 在系統中。圖7說明了可以預先計算係數的一種方式。
[0039] 在(S225),在每個期望的全寬半高,形成若干純高斯峰。在實現中,這些峰的寬度 基本在目標全寬半高的約三分之一(1/3)到全寬半高的三(3)倍之間或者在這二者處,並 且它們被存儲為基準峰。接下來在(S226)將噪聲添加到全部或選定的基準峰。在實現中, 噪聲可以是白噪聲並且可以根據高斯分布添加到每個峰。之後,在(S227),以將經平滑的噪 聲峰與基準峰之間的殘差基本最小化的方式,每一個或選定的峰峰被優化,以調整濾波器 係數。可以使用非線性Levenburg-Marquardt法來提供優化(S227)。在優化期間,係數可 以被約束,以產生穩定的脈衝響應。對於每個或選定的基準全寬半高重複這個過程(S228) 並且優化後的係數值存儲在查找表中(S229)。在實現中,示例性結果平滑濾波器的脈衝響 應類似於正弦濾波器的脈衝響應,其中濾波器的原瓣的寬度近似為目標全寬半高的一半。 使用這種實現,峰形狀和結構可以基本被保留並且所檢測到的錯誤正峰的數目可以基本被 最小化。
[0040] 返回去參照圖4,過濾後的簇可以被劃分為子簇(S230)。在實現中,過濾後的簇數 據被檢查,以識別(位於兩個峰或頂點之間的)谷中的最小點小於最近峰的限定強度的每 個實例。作為例子,峰強度可以被選擇為處於一個或兩個最近峰的強度的二分之一(1/2) 或大約二分之一。一旦被識別出,該谷就被認為是簇切割點,由此將簇分離為一個或多個子 簇。如將會理解的,劃分後的子簇的數目將取決於給定簇的簇切割點的量。
[0041] 圖8說明了可以被用來證明子簇峰形狀的資格的代表性過程(S240)。這個過程 可以幫助確保相關子簇包括色譜信息。在實踐中,一些子簇可以包括不含色譜信息的數據, 下文中將其稱作為離群值(異常值,outlier)。優選的是從數據中提取並免除在實踐可能 的情況下儘可能多的離群值,而不去除相關數據。在實現中,可以使用以下一種或多種技術 來從離群值中分離期望的子簇:(i)選擇具有比最小信噪比更大的信噪比的子簇(S242); (ii)選擇具有比最小質量更高的峰形狀的子簇(S244);以及(iii)選擇具有最小簇長度的 子族(S246)。在實現中,在3-8棒之間、在4-7棒之間、在3-7棒之間、在4-8棒之間、在4-6 棒之間、在5棒處或者在以上範圍的邊界處選擇最小簇長度。可以使用其它的最小簇長度。 在實現中,可以使用每種分離過程。為了便於公開,本公開內容將討論如圖8所述使用全部 過程的實施例。此外,無論使用哪種分離過程,本公開內容都不應當局限於它們被處理的順 序。
[0042] 提供了用於選擇具有比最小或閾值信噪比更大的信噪比的子簇的示例性過程 (S241)。在實現中,閾值比率可以被選擇為硬編碼值與用戶限定值之間的較小者。作為例 子,閾值可以為十(10)或約為十。在其它技術中,噪聲可以被測量為四分之一(1/4)離子 面積的預定義獲取噪聲或者原始簇數據與平滑後的簇數據之間的殘差的標準差。但是,應 當理解,如果具有閾值之下的比率的子簇是合格的峰的同位素或加合物,則它們仍可以被 用在因子分析中。
[0043] 因為具有比閾值更大的信噪比的子簇仍然可能包含冗餘的數據或噪聲,所以可能 期望進一步修剪該子簇。一種修剪方法涉及從峰的左側和右側都修剪這種子簇的基線。在 實現中,子簇內的原始數據被從兩端或一端向中心掃描-強度(左/右)上升到閾值以上 的位置變為子簇的新的末端並且基線數據被丟棄。在實現中,閾值強度是子簇噪聲的標準 差的四(4)倍。
[0044] 如前所述,識別期望子簇並消除離群值的另一種技術是選擇具有比最小或閾值質 量更高的峰形狀的子簇(S244)。在實現中,閾值質量可以基於色譜峰具有可以優選地使用 雙高斯曲線合理建模的一般形狀的假設,但是本發明不應當被局限於此。雙高斯曲線相對 於諸如Pearson IV的其它峰形狀更優的地方在於擬合的速度和穩定性。因此,在實施例中 並如圖9所示,每個子簇首先被擬合到雙高斯峰(S247)。識別子簇與擬合峰之間的相關性 (S248)。選擇具有比閾值相關性更大或基本在閾值相關性處的相關性的峰,具有比閾值相 關性更小的相關性的峰被識別為離群值(S249)。在實現中,閾值相關性可以是0.6,優選地 為 0· 8。
[0045] 因為每個子簇可以被認為包括單個色譜峰,所以可以理解,由於來自兩個或更多 個共洗脫化合物的組合信息,因此每個子簇可以是共享的質量成分峰。因此,在實現中,去 卷積方法及系統可以可選地被採用,以確定峰是否包括共享的質量並且進一步識別可以關 聯到單個成分的峰的組。在識別這種峰的組時,去卷積過程可以對一個、一些或全部色譜峰 實現,以解密每個分析過的峰可以屬於的分組。
[0046] 如將理解的,耦合到質譜儀的色譜系統既可以產生質量峰,又可以產生色譜峰。質 量峰可以非常像高斯形狀並且,當與色譜峰比較時,通常不顯著變形或者包括噪聲。因此, 高斯模型常常在與質量峰的去卷積關聯的去卷積過程中實現。例如,已知跨這種質量峰採 用期望最大化(EM)算法。
[0047] 不像質量峰,色譜峰常常不非常像高斯形狀並且會在噪聲處包括顯著的變形。因 此,由於峰的歪斜,高斯和雙高斯模型常常不很好地擬合色譜峰並且EM算法具有差的匯 聚。非線性迭代方法也已經介紹過,以估計峰參數,但是這種方法在系統中會慢並且遲鈍。
[0048] 本發明人已經開發出新的曲線類型來建模峰,諸如以上討論的色譜峰。對於本公 開內容,所討論的模型和曲線類型將在這裡被稱為雙指數模型或者雙指數曲線。按照慣例, 並且如以上所討論的,高斯、雙高斯或一般指數曲線和模型已經被採用。新的雙指數模型在 頂點分離峰並且利用獨立的指數曲線建模峰的每一側。
[0049] 在實現中,雙指數模型可以如下表示:
[0050]
【權利要求】
1. 一種處理來自色譜、質譜系統中數據獲取系統的數據的方法,包括: 處理數據,以生成處理後的數據; 分析處理後的數據,以從中提取噪聲;以及 準備並提供關於處理後的數據的結果。
2. 如權利要求1所述的方法,其中數據包括長簇和短簇並且處理步驟包括: 分離長簇與短簇; 過濾數據以平滑數據,由此產生過濾後的簇; 把過濾後的簇分成子簇;以及 證明子簇的資格,以便從其中提取不期望的子簇。
3. 如權利要求2所述的方法,其中分離步驟還包括: 把數據分離成塊; 估計每塊中心基線的強度; 在每塊的等距四分位點之間線性內插,以產生基線估計; 剪切基線水平之上的數據並且保留該基線以下的數據;以及 平滑剪切後的數據,以產生基線的改進版本。
4. 如權利要求3所述的方法,其中每塊的長度是數據的預期全寬半高的倍數。
5. 如權利要求3所述的方法,其中每塊的長度被估計為是數據的預期全寬半高的五 倍。
6. 如權利要求3所述的方法,其中平滑步驟涉及Savitzky-Golay平滑算法的應用。
7. 如權利要求3所述的方法,其中塊中心基線的強度的估計是基於該塊下四分位中基 線的強度。
8. 如權利要求2所述的方法,其中資格證明步驟包括以下至少一個: 選擇具有大於閾值信噪比的信噪比的子簇; 選擇具有大於閾值質量的峰形狀的子簇;以及 選擇具有最小簇長度的子簇。
9. 如權利要求8所述的方法,其中閾值信噪比是10。
10. 如權利要求8所述的方法,其中噪聲是四分之一(1/4)離子面積的預定義獲取噪 聲。
11. 如權利要求8所述的方法,其中噪聲是原始簇數據和平滑後的簇數據之間殘差的 標準差。
12. 如權利要求8所述的方法,其中,如果具有小於閾值信噪比的信噪比的子簇是同位 素或加合物,則它們仍然在因子分析中使用。
13. 如權利要求8所述的方法,還包括步驟: 從峰的左和右側修剪子簇的基線。
14. 如權利要求13所述的方法,其中修剪步驟還包括: 從末端到中心掃描子簇中的原始數據; 識別在每個末端強度上升到高於閾值的地方為新的端點; 丟棄新端點之外的數據。
15. 如權利要求14所述的方法,其中閾值是子簇的標準差的四倍。
16. 如權利要求8所述的方法,其中閾值質量是基於子簇的擬合和預定義曲線之間的 相關性。
17. 如權利要求16所述的方法,其中預定義的曲線是雙-高斯曲線。
18. 如權利要求16所述的方法,其中閾值相關性是0. 6。
19. 如權利要求17所述的方法,其中閾值相關性是0. 8。
20. 如權利要求2所述的方法,其中過濾步驟使用無限脈衝響應濾波器。
21. 如權利要求2所述的方法,其中過濾步驟包括: 識別數據中的最大峰; 估計所識別出的峰的全寬半高; 對照查找表匹配估計出的全寬半高,以識別一個或多個優化的濾波器係數; 基於優化的濾波器係數平滑數據;以及 為每個簇識別噪聲圖。
22. 如權利要求21所述的方法,其中優化的濾波器係數是一組正向和反向二級無限脈 衝響應濾波器係數。
23. 如權利要求22所述的方法,其中噪聲圖是平滑數據和原始數據之間殘差的標準 差。
24. 如權利要求23所述的方法,其中噪聲圖分配給偏離簇的每個子簇。
25. 如權利要求22所述的方法,其中優化的係數是根據以下步驟計算的: 在每個預期的全寬半高形成高斯峰; 向高斯峰添加噪聲,由此產生帶噪聲的高斯峰;以及 優化高斯峰,以便以基本上最小化噪聲高斯峰和高斯峰之間殘差的方式調整濾波器系 數。
26. 如權利要求25所述的方法,其中優化步驟使用非線性Levenberg-Marquardt過程。
27. 如權利要求2所述的方法,其中簇具有峰和谷並且劃分步驟還包括: 識別過濾後的簇中的每個實例,其中位於兩個峰之間的谷具有小於兩個峰的定義的強 度的最小值點;以及 如果有,基於每個識別出的實例把簇分離成子簇。
28. 如權利要求19所述的方法,其中定義的強度是或者大約是兩個峰之一或二者的強 度的一半。
29. 如權利要求2所述的方法,其中分析步驟還包括: 確定用於因子分析的顯著性因子;以及 提供那些因子的初始種子估計。
30. 如權利要求29所述的方法,還包括: 消除較低質量的峰。
31. 如權利要求2所述的方法,其中分析步驟還包括: 在數據中選擇基礎峰; 評估並關聯所有局部數據與該基礎峰; 組合具有預定最小相關值的局部數據與該基礎峰,以創建因子;以及 為該因子估計頻譜。
32. 如權利要求31所述的方法,其中基礎峰是手動選擇的。
33. 如權利要求31所述的方法,其中數據集中的最強子簇峰被選作基礎峰。
34. 如權利要求31所述的方法,其中最小相關性值是0. 6。
35. 如權利要求34所述的方法,還包括: A) -旦識別出基礎峰,就在其餘數據中選擇下一個最強的峰作為下一個因子; B) 在完成步驟(A)之後,選擇其餘數據中下一個最強的峰作為下一個因子;以及 C) 重複步驟(B),直到為所有子簇都分配了因子。
36. 如權利要求31所述的方法,還包括: 比較相關性閾值和相關置信區間之一或者二者都比較,以便把在組合步驟中組合但不 應當被組合的局部數據分離成分離因子。
37. 如權利要求36所述的方法,其中比較步驟還包括: 選擇因子中最強的子簇; 確定基本子簇和該因子中至少一個其它子簇之間的相關性; 為這至少一個子簇確定頂點位置置信區間; 把具有以下條件的子簇分組到一起:(i)重疊基礎峰;以及(ii)與大於定義的相關性 閾值的基礎峰相關,其中每個分組都是因子。
38. 如權利要求36所述的方法,還包括: 為每個因子計算平均濃度分布。
39. 如權利要求38所述的方法,其中計算步驟利用多元曲線解析度方法來為每個因子 確定平均濃度分布。
40. 如權利要求39所述的方法,其中計算出的平均濃度分布用作每個因子的估計的峰 形狀。
41. 如權利要求38所述的方法,還包括: 測量平均濃度分布的峰質量;以及 除去具有小於閾值峰質量的峰質量的數據。
42. 如權利要求41所述的方法,其中測量步驟是通過確定每個濃度分布的擬合的殘差 的偏差來計算的。
43. 如權利要求42所述的方法,其中偏差是雙-1?斯系統中的標準差。
44. 如權利要求41所述的方法,其中閾值峰質量是0. 5。
45. 如權利要求44所述的方法,其中輸入相關性參數是手動錄入的。
46. 如權利要求40所述的方法,還包括: 比較估計的峰形狀與至少一個預先選擇的曲線。
47. 如權利要求46所述的方法,還包括: 在比較步驟之前歸一化估計出的峰形狀,以確定歸一化的估計的峰形狀。
48. 如權利要求47所述的方法,其中歸一化步驟包括通過重新採樣過程拉伸或收縮中 至少一個,然後使估計出的峰形狀居中,以匹配至少一個預先選擇的曲線的寬度和中心。
49. 如權利要求47所述的方法,還包括: 計算歸一化的峰形狀和至少一個預先選定的曲線之間的相關性。
50. 如權利要求49所述的方法,其中用於最佳匹配的偏度和峰度值被選擇作為用於優 化的種子。
51. 如權利要求46所述的方法,其中至少一個預先選定的曲線是從Pearson IV函數生 成的。
52. 如權利要求51所述的方法,其中至少一個預先選定的曲線是偏度和峰度中至少一 個的排列,而其餘的參數保持恆定,使得峰形狀其後為每個排列記錄並保存。
53. 如權利要求1所述的方法,還包括: 檢查用於與同位素和加合物之一或二者關聯的信息的數據; 選擇該關聯的數據; 證明該關聯數據的資格;以及 如果該關聯數據有資格,就把其分配給因子。
54. 如權利要求53所述的方法,其中資格證明步驟包括: 對照因子計算數據的相關性;以及 如果相關性大於最小相關性,就把其分配給因子。
55. 如權利要求54所述的方法,其中最小相關性是0. 9。
56. 如權利要求36所述的方法,還包括: 識別利用因子被不正確地分組的同位素/加合物;以及 把這樣識別出的同位素/加合物重新分配給正確的因子。
57. 如權利要求56所述的方法,其中識別步驟包括: 比較因子的濃度分布與相鄰因子的濃度分布,以識別相關性; 如果第一因子的濃度分布與相鄰因子的濃度分布之間的相關性大於閾值相關性,就檢 查該相鄰因子,以便從第一因子定位同位素/加合物;以及 基於檢查步驟把同位素/加合物重新分配給第一因子。
58. 如權利要求57所述的方法,其中閾值相關性是0. 9。
59. 如權利要求36所述的方法,其中相關性參數是用戶定義的。
60. 如權利要求36所述的方法,還包括: 防止因子分裂。
61. 如權利要求60所述的方法,其中防止步驟包括: 確定基於因子內基礎同位素/加合物子簇和該因子內其它子簇之間的平均相關性的 局部相關性閾值; 關聯該因子和最近因子的濃度分布;以及 如果相關性大於局部相關性閾值,則合併該因子與所述最近因子。
62. 如權利要求61所述的方法,還包括: 如果因子被合併,則關聯該因子與下一個最近因子的濃度分布。
63. 如權利要求61所述的方法,其中閾值相關性是0. 9。
64. 如權利要求8所述的方法,其中最小簇長度是5個棒。
65. 如權利要求60所述的方法,其中防止步驟包括: 基於其間的一個或多個條件比較第一峰和第二峰;以及 基於所述一個或多個條件把第一和第二峰歸類為相關或不相關,其中比較步驟包括以 下一個或兩個步驟:(i)比較第一峰的方差和第二峰的方差;以及(ii)比較第一峰的均值 保留時間和第二峰的均值保留時間。
66. 如權利要求65所述的用於處理色譜系統中色譜峰的方法,其中比較步驟既比較第 一峰的方差和第二峰的方差,又比較第一峰的均值保留時間和第二峰的均值保留時間。
67. 如權利要求66所述的用於處理色譜系統中色譜峰的方法,其中比較第一峰的方差 和第二峰的方差的步驟包括子步驟: 確定第一峰和第二峰之間的F-統計; 分配與t-統計相關的F-統計置信區間; 比較F-統計置信區間與預定的t-統計參數; 基於比較F-統計置信區間與預定F-統計參數的步驟,把第一峰和第二峰特徵化為相 關或不相關。
68. 如權利要求66所述的用於處理色譜系統中色譜峰的方法,其中比較第一峰的均值 保留時間和第二峰的均值保留時間的步驟包括子步驟: 確定第一峰和第二峰之間的t-統計; 分配與F-統計相關的t-統計置信區間; 比較t-統計置信區間與預定的F-統計參數; 基於比較t-統計置信區間與預定的F-統計參數的步驟,把第一峰和第二峰特徵化為 相關或不相關。
69. 如權利要求66所述的用於處理色譜系統中色譜峰的方法,其中比較第一峰的均值 保留時間和第二峰的均值保留時間的步驟包括子步驟: 確定第一峰和第二峰之間的t-統計; 分配與F-統計相關的t-統計置信區間; 比較t-統計置信區間與預定的F-統計參數; 並且其中比較第一峰的方差和第二峰的方差的步驟包括子步驟: 確定第一峰和第二峰之間的F-統計; 分配與t-統計相關的F-統計置信區間; 比較F-統計置信區間與預定的t-統計參數; 基於(i)比較t-統計置信區間與預定的F-統計參數的步驟和(ii)比較F-統計置信 區間與預定的t-統計參數的步驟,把第一峰和第二峰特徵化為相關或不相關。
70. 如權利要求66所述的用於處理色譜系統中色譜峰的方法,其中色譜系統包括具有 F-統計查找表的存儲器並且其中確定F-統計的步驟包括在查找表上查找F-統計的步驟。
71. 如權利要求70所述的用於處理色譜系統中色譜峰的方法,其中F-統計查找表包括 利用單值分解計算出並且存儲在系統存儲器中的預定F-統計值。
72. 如權利要求69所述的用於處理色譜系統中色譜峰的方法,其中色譜系統包括具有 F-統計查找表的存儲器並且其中確定F-統計的步驟包括在查找表上查找F-統計的步驟。
73. 如權利要求72所述的用於處理色譜系統中色譜峰的方法,其中F-統計查找表包括 利用單值分解計算出並且存儲在系統存儲器中的預定F-統計值。
74. 如權利要求35所述的用於處理色譜系統中色譜峰的方法,其中因子包括一個或多 個峰並且al、σ 1、a2和σ 2 -般對多個峰中每一個受約束,該方法還包括: 利用雙指數模型建模一個或多個色譜峰並且識別一個或多個色譜峰和雙指數模型之 間的殘差擬合;以及 如果殘差擬合不滿足殘差擬合的預定條件,則迭代地增加信號再多一個峰,直到迭代 的殘差滿足迭代殘差擬合的預定條件。
75. 如權利要求74所述的處理數據的方法,其中迭代增加的步驟涉及優化信號。
76. 如權利要求75所述的處理數據的方法,其中信號是通過使用 Levenberg-Marquardt (LM)算法優化的。
77. 如權利要求76所述的處理數據的方法,其中LM算法是利用解析表達式計算的。
78. 如權利要求36所述的用於處理色譜系統中色譜峰的方法,其中因子包括一個或多 個峰並且al、〇l、a2和σ 2-般對多個峰中每一個受約束,該方法還包括: 利用雙指數模型建模一個或多個色譜峰並且識別一個或多個色譜峰和雙指數模型之 間的殘差擬合;以及 如果殘差擬合不滿足殘差擬合的預定條件,則迭代地增加信號再多一個峰,直到迭代 的殘差滿足迭代殘差擬合的預定條件。
79. 如權利要求78所述的處理數據的方法,其中迭代增加的步驟涉及優化信號。
80. 如權利要求79所述的處理數據的方法,其中信號是通過使用 Levenberg-Marquardt (LM)算法優化的。
81. 如權利要求80所述的處理數據的方法,其中LM算法是利用解析表達式計算的。
【文檔編號】H01J49/00GK104126119SQ201280069812
【公開日】2014年10月29日 申請日期:2012年9月11日 優先權日:2012年1月16日
【發明者】王紀紅, P·M·威利斯 申請人:萊克公司