用於確定混合物譜中的譜成分存在的系統和方法
2023-12-06 16:21:06 3
用於確定混合物譜中的譜成分存在的系統和方法
【專利摘要】本發明公開了一種系統和方法,用於檢測一種混合物的譜中未知成分的譜和/或用於驗證一種混合物的譜中疑似成分的存在。該系統和方法涉及使用算法執行一個包含混合中的這些目標譜和已知譜的回歸分析,計算當該目標譜的係數為零時的一個殘差,被稱為提取譜,並且對比該提取譜和該目標譜。該系統和方法可以與化學計量學算法、多個已知譜、和/或多個目標譜一起使用。
【專利說明】用於確定混合物譜中的譜成分存在的系統和方法
[0001] 相關申請的交叉引用
[0002] 本申請要求於2012年5月31日提交的標題為"用於確定混合物的譜中的譜成分 存在的算法和方法"的共同未決的美國臨時專利申請序列號61/653743的優先權,其披露內 容通過引用以其整體結合在此。
[0003] 所引用的專利和參考資料:
[0004] 以下文件和參考資料通過引用以其整體結合在此,霍爾特(Hoult)(美國專利 第5, 023, 804號)、伊瓦爾迪(Ivaldi)等人(美國專利第5, 308, 982號)、裡特(Ritter) 等人(美國專利第7, 698, 098號)、博通吉奇-塞希奇(Botonjic-Sehic)等人(美國專 利申請第2011/0213746號)、K.田邊(K. Tanabe)等人,分析化學47,118(1975),、彼得 R.格裡菲思(Peter R. Griffiths)等人的"自加權相關係數以及它們對於測量譜相似性的 應用(Self-Weighted Correlation Coefficients and Their Application to Measure Spectral Similarity) ",應用波譜學(Appl. Spec.),第 63 卷,第 916 至 919 頁(2009)、 "為使用一種譜搜索算法鑑別的混合物成分估計概率置信度(Estimating Probabilistic Confidence for Mixture Components Identified Using a Spectral Search Algorithm),', 應用波譜學,第66卷,第334-340頁(2012)。
【技術領域】
[0005] 本發明涉及數據分析,並且更具體地是一種用於確定混合物的譜成分的系統和方 法。
【背景技術】
[0006] 將一種樣品的譜與一個參考譜進行對比以驗證或鑑別該樣品在分析化學中是一 種常規做法。用於這個目的的這些類譜的實例包括但不限於紅外譜、近紅外譜、拉曼譜、質 譜、紫外-可見譜、以及核磁共振(NMR)譜。有很多用於這種譜對比的度量(metrics),包含 歐氏(Euclidian)距離、最大距離、以及相關係數。
[0007] 當對比純樣或成分的譜、或混合物的譜,其中該樣品譜和參考譜包含相似濃度的 相同成分時,這些度量效果良好。當將一種混合物的樣品譜與包含在該混合物中的一種純 成分的參考譜進行對比時,或者與一種與該樣品譜中成分相同但濃度不同的混合物的參考 譜進行對比時,它們卻表現不佳,並且事實上可能表現非常糟糕。在本文中應該注意的是 "混合物"並不必定是指這些成分是物理混合的,而是它們都對該譜有貢獻。
[0008] 當使用該術語譜(或這些譜)時,我們指的是如所測量原樣的這些數據和/或是 所述數據的任何的後續數學轉換,包含導數(包含一階、二階、三階以及任何後續導數)、平 滑處理、基線校正等。
[0009] 本發明是一種改進的對比系統及方法,用於當一個樣品譜為多種成分的混合物 時。這樣一種混合物可包含已知存在的成分、疑似存在但其存在需確定的成分、需鑑別的未 知成分、或其任何組合。已知存在的這些成分可能已經通過任何方法得以鑑別,包含通過應 用以上提到的那些簡單對比度量、或通過應用此處描述的對比方法。
[0010] 當要被鑑別或確認的成分的濃度相比其他成分的濃度較小時,與其他對比度量相 比本發明表現特別好。在某些情況下,當該樣品譜中的兩個或更多個成分為未知時,它也表 現良好。
【發明內容】
[0011] 這部分的目的是總結本發明的一些方面並且簡略介紹一些優選實施方式。為避免 模糊這部分的目的可能進行了簡化或省略。這樣的簡化或省略不是有意限制本發明的範 圍。
[0012] 所有的參考資料,包含在本說明書中所引用的任何專利或專利申請都通過引用結 合在此。不承認任何參考資料構成現有技術。對這些參考資料的討論陳述了其作者的主張, 並且諸位 申請人:保留懷疑所引用文件的準確性和針對性的權利。將會清楚理解的是,儘管 多個現有技術公開物被引用在此,但是此引用不承認這些文件中的任一個形成在現有技術 中的公知常識。
[0013] 確認的是術語"包括"可以(在不同的法律管轄範圍內)被歸為一種封閉性的或 開放性的意思。對於本發明的目的,並且除非另有註明,術語"包括"應有包含的意思-即, 將用來指包含不僅它直接引用的這些所列成分,還有其他非指定的成分或元素。當術語"包 括了"或"包括有"與一種方法或工藝中的一個或多個步驟相關地使用時,也將使用此理論。
[0014] 在一個方面,本發明是關於一種用於確定在一種混合物中的譜成分存在的方法, 所述方法包括執行一種回歸分析,該回歸分析包含目標譜以及一種混合物中存在的一個或 多個已知的其他成分譜,計算提取譜,其中所述提取譜為該目標譜的係數被設為零的情況 下的殘差(residual),並且使用一種對比度量對比所述提取譜與所述目標譜。在另一個 方面,所述對比度量為一個相關係數、加權相關係數、歐氏距離和/或最大距離中的至少一 個。又另一個方面,所述加權相關係數中的這些權重不都相同。
[0015] 在另一個方面,它是關於對比所述提取譜與殘差譜。在一個方面,所述方法以一種 迭代方式使用。在另一個方面,所述回歸分析包括一個基線譜或其他成分的譜。在一個方 面,所述回歸分析譜包括導數譜或乘以一個包絡函數的導數譜。又另一個方面,它是關於使 用一個或多個回歸係數來計算濃度。在一個方面,該方法進一步包括一種目標成分的多個 譜以及一種已知成分的多個譜中的至少一個。
[0016] 在另一個方面,在所述混合物中存在多個目標並且對於每個不同目標使用不同的 譜區。在一個方面,使用多個譜區。又另一個方面,一種鑑別的或目標成分的多個譜被因子 化,並且這些因子的一個子集包含在所述回歸分析中。在另一個方面,對不同目標成分執行 兩次或更多次回歸分析。
[0017] 在一個方面,本發明關於該方法進一步包括將多個目標譜因子化,將這些要被分 析的譜和這些已知成分的譜投影到因子空間中,在該因子空間中執行所述回歸分析,並且 在該因子空間中對比該提取譜和這些目標譜,或者將該提取譜投影回到該原始譜空間並且 在該原始譜空間中執行在該提取譜與這些目標譜之間的對比。
[0018] 在一個方面,該方面進一步包括對於數個成分中的每一個將數個目標譜分組成 簇,使用這些目標譜的平均值、全部目標譜或者使用在每個簇中這些目標譜的這些因子的 一個子集對每個簇中的這些目標譜執行所述回歸分析,為每個簇計算提取譜並且對比這些 提取譜與目標譜的這些簇來確定該目標譜屬於哪一個(如果有的話)簇。又另一個方面, 這些回歸分析中包含一種已知成分的多個譜,或者這些回歸分析中包含一種已知成分的多 個譜的因子載荷(factor loadings)的一個子集。在一個方面,使用一個相關係數、一個加 權的相關係數、一個歐氏距離、或最大距離執行這些對比。又另一個方面,它進一步包含對 比這些提取譜與這些殘差譜。在另一個方面,這些回歸分析包含一個基線譜或其他成分譜。 在一個方面,使用多個譜區。在另一個方面,該方法使用一個或多個回歸係數來計算濃度。
[0019] 在一個發明,該方面包括對於數個目標成分中的每一個將數個目標譜因子化,將 這些因子分組成簇,將這些要被分析的譜和這些已知成分的譜投影到因子空間中;使用這 些目標譜的這些因子的平均值、或這些目標譜的全部這些因子,在該因子空間中對每個簇 的這些目標譜執行所述回歸分析,為每個簇計算該提取譜,並且在該因子空間中對比這些 提取譜和目標譜,或者將這些提取譜投影回該原始譜空間並且在該原始譜空間中在這些提 取譜與這些目標譜之間執行對比,以確定該目標譜屬於哪一個(如果有的話)簇。
[0020] 在另一個方面,該回歸分析中包含一種已知成分的多個譜。又另一個方面,使用一 個相關係數、一個加權的相關係數、一個歐氏距離、或一個最大距離。在一個方面,它進一步 包括對比這些提取譜與這些殘差譜。又另一個方面,這些回歸分析包含一個基線譜或其他 成分譜。在另一個方面,使用多個譜區。在另一個方面,該方法包括使用一個或多個回歸系 數來計算濃度。
[0021] 在一個方面,本發明是關於一種用於存儲計算機代碼的非瞬時性計算機可讀存儲 介質,該計算機代碼用於一種用於確定混合物中譜成分的存在的方法,所述方法包括執行 一種回歸分析,該回歸分析包括目標譜以及在一種混合物中存在的一個或多個已知的其他 成分譜;計算所述提取譜,其中所述提取譜為該目標譜的係數被設為零的情況下的殘差; 以及使用一種對比度量來對比所述提取譜與所述目標譜。
[0022] 通過結合附圖對以下一個本發明實施方式的詳細說明的查看,本發明的其他特徵 和優點將變得清晰。
【專利附圖】
【附圖說明】
[0023] 圖1根據本發明的一個示例性實施方式展示了在水蒸氣的存在下IOOppm的氧化 亞氮(NO)的譜(虛線)以及水蒸氣的譜(實線)的圖示。
[0024] 圖2根據本發明的一個示例性實施方式展示了在水蒸氣的存在下IOOppm的NO的 譜(實線)以及該殘差譜(虛線)的圖示。
[0025] 圖3根據本發明的一個示例性實施方式展示了 NO的目標譜(虛線)以及提取譜 (實線)的圖示。
[0026] 圖4展示了用於計算NO的部分相關係數的這些殘差譜的圖示。
[0027] 圖5A-5C展示了來自在IOOppm的NO樣品譜中一氧化碳和一氧化二氮的分析的這 些譜的圖示。圖5A為一氧化二氮的目標譜(虛線)以及來自第二次分析的提取譜(實線)。 圖5B為一氧化碳的目標譜(虛線)以及來自第一次分析的提取譜(實線)。圖5C為樣品 譜。以上均為根據本發明的示例性實施方式。
[0028] 圖6根據本發明的一個示例性實施方式展示了使用拉曼譜儀採集到的一個瓶內 的藥品的水溶液的譜(實線)、該瓶的譜(虛線)、水的譜(點虛線)、以及該藥品的目標譜 (點線)的圖示。
[0029] 圖7A-7C展示了來自一個瓶中的藥品的水溶液的拉曼譜的分析的這些目標譜 (7A)、提取譜(7B)以及殘差譜(7C)的圖示。以上均為根據本發明的示例性實施方式。
[0030] 圖8根據本發明的一個示例性實施方式展示了來自於未轉換的數據(底)的該藥 品(頂)目標譜以及該提取譜的圖示。
[0031] 圖9-10展示了混合物譜的實例簇,圖9,以及目標成分的譜,圖10。
[0032] 從以下詳細說明、附圖、以及所附權利要求書中,本領域的普通技術人員將會領會 和理解上述以及其他特徵。
【具體實施方式】
[0033] 為提供對本發明的全面理解,現在將說明某些說明性實施方式和實例。然而,本領 域的普通技術人員將會理解的是相同或等價的功能和順序可以通過不同的實施方式完成, 這些實施方式也旨在包含於本披露的精神和範圍內。這裡描述的這些組合物、儀器、系統和 /或方法可以被適配並修改為對於試圖解決的應用而言是適當的,並且這裡描述的那些可 以用於其他合適的應用,並且這樣的其他的添加和修改將不背離本發明範圍。
[0034] 在一個實施方式中,使S為一種樣品的譜,該樣品由具有譜K1. .. Kn的η個成分組 成。假設服從比爾-朗伯定律,該樣品譜可被建模為:
【權利要求】
1. 一種用於確定混合物中譜成分的存在的方法,所述方法包括: 執行一種回歸分析,該回歸分析包括目標譜以及在一種混合物中存在的一個或多個已 知其他成分譜; 計算提取譜,其中所述提取譜為在該目標譜的係數被設為零的情況下的殘差;以及 使用一種對比度量來對比所述提取譜與所述目標譜。
2. 如權利要求1所述的方法,其中: 所述對比度量為相關係數、加權的相關係數、歐氏距離或絕對最大距離中的至少一個。
3. 如權利要求2所述的方法,其中: 在所述加權的相關係數中的這些權重不都相同。
4. 權利要求1所述的方法,進一步包括: 對比所述提取譜與殘差譜。
5. 權利要求1所述的方法,其中: 其中所述方法以一種迭代的方式使用。
6. 權利要求1所述的方法,其中: 所述回歸分析包含一個基線譜或多個其他成分譜。
7. 權利要求6所述的方法,其中: 所述回歸分析譜包含導數譜或者乘以一個包絡函數的導數譜。
8. 權利要求1所述的方法,進一步包括: 使用一個或多個回歸係數來計算濃度。
9. 權利要求1所述的方法,其中所述回歸分析包括: 一種目標成分的多個譜中的至少一個,以及 一種已知成分的多個譜。
10. 權利要求1所述的方法,其中: 使用多個譜區。
11. 權利要求1所述的方法,其中: 將一種被鑑別的或目標成分的多個譜因子化,並且這些因子載荷的一個子集被包含在 所述回歸分析中。
12. 權利要求1所述的方法,其中: 對不同的目標成分執行兩次或更多次回歸分析。
13. 權利要求12所述的方法,其中: 所述混合物內存在多個目標成分並且對於每個不同的目標成分使用不同的譜區。
14. 權利要求1所述的方法,進一步包括: 對於數個目標成分中的每一個,將數個目標譜分組成為簇; 使用這些目標譜的平均值、全部這些目標譜、或者每一個簇中的這些目標譜的這些因 子的一個子集,對於每個簇中的這些目標譜執行所述回歸分析; 對於每一個簇計算該提取譜;以及 對比這些提取譜與目標譜的這些簇以確定該目標譜屬於哪一個,如果有的話,簇。
15. 權利要求14所述的方法,其中: 一種已知成分的多個譜被包含在這些回歸分析中,或者一種已知成分的多個譜的因子 載荷的一個子集被包含在這些回歸分析中。
16. 權利要求14所述的方法,其中: 使用相關係數、加權的相關係數、歐氏距離、或最大絕對距離執行這些對比。
17. 權利要求16所述的方法,其中: 對比這些提取譜與殘差譜。
18. 權利要求14所述的方法,其中: 這些回歸分析包含一個基線譜或其他成分譜。
19. 權利要求14所述的方法,其中: 使用多個譜區。
20. 權利要求14所述的方法,進一步包括 使用一個或多個回歸係數來計算濃度。
21. 權利要求1所述的方法,進一步包括: 對於數個目標成分中的每一個,將多個目標譜因子化; 將這些因子分組成簇; 將要分析的這些譜以及這些已知成分的譜投影到因子空間中; 使用這些目標譜的這些因子載荷的平均值、或者這些目標譜的全部因子載荷,對於該 因子空間中的每一個簇中的這些目標譜執行所述回歸分析; 對於每個簇計算該提取譜;以及 在該因子空間中對比這些提取譜和這些目標譜,或者將這些提取譜投影回該原始譜空 間並且在該原始譜空間中執行這些提取譜與這些目標譜之間的對比,以確定該目標譜屬於 哪一個,如果有的話,簇。
22. 權利要求21所述的方法,其中: 一種已知成分的多個譜被包含在該回歸分析中。
23. 權利要求21所述的方法,其中: 使用相關係數、加權的相關係數、歐氏距離、或最大絕對距離執行這些對比。
24. 權利要求23所述的方法,進一步包括: 對比這些提取譜與殘差譜。
25. 權利要求21所述的方法,其中: 這些回歸分析包含一個基線譜或其他成分譜。
26. 權利要求21所述的方法,其中: 使用多個譜區。
27. 如權利要求21所述的方法,其中: 使用一個或多個回歸係數來計算濃度。
28. -種用於存儲計算機代碼的非瞬時性計算機可讀存儲介質,該計算機代碼用於一 種用於確定混合物中譜成分的存在的方法,所述方法包括: 執行一種回歸分析,該回歸分析包括目標譜以及在一種混合物中存在的一個或多個已 知其他成分譜; 計算提取譜,其中所述提取譜為在該目標譜的係數被設為零的情況下的殘差;以及 使用一種對比度量來對比所述提取譜與所述目標譜。
【文檔編號】G01J3/00GK104364624SQ201380027527
【公開日】2015年2月18日 申請日期:2013年5月30日 優先權日:2012年5月31日
【發明者】理察·傑克遜, 王茜 申請人:理察·傑克遜, 王茜