新四季網

一種基於最小二乘法的肽質譜峰特徵參數提取方法

2023-10-25 12:27:37 8

一種基於最小二乘法的肽質譜峰特徵參數提取方法
【專利摘要】本發明涉及一種肽質譜峰特徵參數提取方法。現有方法針對在肽段質譜圖中形成譜峰的各樣點其分布存在較大偏差時,存在難以保證所提取出的質譜峰特徵參數精準度的不足。本發明提出基於最小二乘法的肽質譜峰特徵參數提取方法,通過對待擬合的質譜峰函數進行非線性變換,並利用經過適當選擇的樣點數據,按照最小二乘法的原理進行函數擬合,再經過反變換從而獲得最終特徵參數估值。該方法無需迭代操作,實現簡單,可有效減少樣點分布偏差對高斯曲線特徵參數求解帶來的不利影響,提高特徵參數數值精準度,進而有利於肽段鑑定精度的改善。
【專利說明】一種基於最小二乘法的肽質譜峰特徵參數提取方法

【技術領域】
[0001]本發明屬於生物質譜數據預處理及信息提取【技術領域】,具體涉及一種基於最小二乘法的肽質譜峰特徵參數提取方法。

【背景技術】
[0002]目前蛋白質組研究領域中,基於串聯質譜的肽鑑定是一種廣泛使用的技術。待鑑定的肽在串聯質譜儀中被誘導碰撞碎裂為碎片離子,碎片離子的質荷比與豐度值被質譜儀器檢測出來,從而生成串聯質譜數據,隨後與理論串聯質譜庫進行比對及分析,最終完成對肽段的鑑定。
[0003]通常情況下,每個碎片離子及其同位素離子在質譜圖中並非表現為單一數值點,而是存在若干樣點形成相應的譜峰,其輪廓擬合後近似為高斯曲線,即高斯峰。為確定該離子的荷質比,需對這些樣點進行預處理,計算出其橫軸方向上的質心(Cent1id),即該離子的實測質荷比。根據所求質心,可進而推算出該離子最大豐度值等其他特徵參數。
[0004]目前質心求解方法有多種,比較常見的思路是:假定質譜圖上構成高斯峰的各個樣點均嚴格分布在某條高斯曲線上,利用各樣點的數值(質荷比和豐度值),代入到參數未知的通用高斯曲線函數表達式中,構造聯立方程組,從而解出相應高斯峰的特徵參數,包括質心,最大豐度值等。當前應用極為廣泛的一款蛋白質組學數據分析軟體MAXQUANT採用的即是這一方法。然而在實際檢測中,受實驗條件、所在環境以及儀器設備噪聲等因素的影響,質譜圖上各個樣點往往並非嚴格分布在高斯曲線上,而是存在一定偏差。當各個樣點偏差數值較大,則上述方法中的假設條件難以成立,因而勢必造成求解出的特徵參數在數值上存在較大誤差,進而影響到肽段鑑定的精度。採用非線性迭代擬合方式的特徵參數提取方法可以有效克服樣點偏差對參數估值精準度的影響,但此類方法往往比較複雜,運算時間長,工作效率低,同時還存在對初始值敏感現象,以及迭代無法收斂的風險。


【發明內容】

[0005]本發明的目的在於解決上述方法的缺點和不足,提出一種基於最小二乘法的肽質譜峰特徵參數提取方法。
[0006]設質譜圖中某離子的質譜峰由N個樣點組成,通常情況下N彡3。其坐標構成集合A0
[0007]A = {(Hi1, (I1),(m2, d2),…(mN, dN)}
[0008]其中,Hii表示質荷比,(Ii表示豐度,其值大於O, i e {1,2,3,…,N}。需要通過樣點擬合出的高斯曲線其函數形式設為:
_9]/⑴=價丨」
[0010]其中,高斯曲線函數f(x)代表豐度值,自變量X代表質荷比,a、b和c為待求解的高斯曲線特徵參數,分別表徵縮放因子、質心和標準差。所述的特徵參數提取方法處理步驟如下:
[0011]步驟(I)對各個樣點的豐度值進行排序,選取出數值最大的3個樣點,假設其質譜圖坐標分別為(m」,dj)、(mk, dk)和(mn, dn), j, k, n e {1,2,...,N}。
[0012]步驟(2)對選取的3個樣點的豐度值數據進行預處理,並構造豐度向量Y。
V, =1η(?/,)
[0013]V2 = \n{dk)
Vi=Hdn)
[0014]Y = [Yl y2 y3]T
[0015]其中,ln(.)表示取自然對數操作。
[0016]步驟(3)根據3個樣點的質荷比數據構造係數矩陣M。
mf Wil I
[0017]M= m; JtI2 I
ml m3 I
[0018]步驟⑷構造分解矩陣Q和R。
[0019][Q, R] = qr (M)
[0020]其中,qr (.)表示對矩陣進行QR分解,矩陣Q為分解出的正交矩陣,大小為3X3,矩陣R為分解出的上三角矩陣,大小為3X3。
[0021]步驟(5)計算特徵參數信息向量P。
[0022]P = R^1X (QtXY)
[0023]步驟(6)令P = [P1 p2 ρ3]τ,計算特徵參數a、b和C。
[0024]卜-彔)
a-eK y
a— 廠,
剛 bs
ΓΤ
[0026]C=——
V Pi
[0027]本發明中肽質譜峰特徵參數提取方法,採用最小二乘法求解特徵參數。和非線性迭代擬合方式相比,不存在初始值敏感現象和迭代無法收斂的風險,實現較為簡單,可有效減少樣點分布偏差帶來的不利影響,提升參數提取精準度,進而有利於肽段鑑定精度的改盡口 ο

【具體實施方式】
[0028]步驟(I)對各個樣點的豐度值進行排序,選取出數值最大的3個樣點,假設其質譜圖坐標分別為(nij,dj)、(mk, dk)和(mn, dn), j, k, n e {1,2,...,N}。
[0029]步驟(2)對選取的3個樣點的豐度值數據進行預處理,並構造豐度向量Y。
>1 =In(^7)
[0030]V-, = In^i)
y3=ln(dj
[0031]Y= [yi y2 y3]T
[0032]其中,In (.)表示取自然對數操作。
[0033]步驟⑶根據3個樣點的質荷比數據構造係數矩陣M。
ml ml 1
[0034]Μ - m; m2 1
7?3 m3 1
[0035]步驟⑷構造分解矩陣Q和R。
[0036][Q, R] = qr (M)
[0037]其中,qr (.)表示對矩陣進行QR分解,矩陣Q為分解出的正交矩陣,大小為3X3,矩陣R為分解出的上三角矩陣,大小為3X3。
[0038]步驟(5)計算特徵參數信息向量P。
[0039]P = IT1X(QTXY)
[0040]步驟(6)令P = [p! p2 ρ3]τ,計算特徵參數a、b和c。
[0041][Λ—ft)
a=eK J
,_ Pi
[0042]
ΓΤ
[0043]C = J——
V A
【權利要求】
1.一種基於最小二乘法的肽質譜峰特徵參數提取方法,其特徵在於: 設質譜圖中某離子的質譜峰由N個樣點組成,N ^ 3 ;其坐標構成集合A ;
A = {(Hi1, (I1),(m2, d2),…(mN, dN)} 其中,IHi表示質荷比,(Ii表示豐度,其值大於O, i e {I, 2, 3,..., N};需要通過樣點擬合出的高斯曲線,其函數形式設為:
/(.r) -a^c {) 其中,高斯曲線函數f (X)代表豐度值,自變量X代表質荷比,a、b和c為待求解的高斯曲線特徵參數,分別表徵縮放因子、質心和標準差; 具體步驟如下: 步驟(I)對各個樣點的豐度值進行排序,選取出數值最大的3個樣點,假設其質譜圖坐標分別為(nij,dj)、(mk, dk)和(mn, dn), j, k, n e {1,2,...,N}; 步驟(2)對選取的3個樣點的豐度值數據進行預處理,並構造豐度向量Y ; y, =Mdj)
■ y:.= ln(4)..V3 = ln("?)
Y = [yi I2 y3]T 其中,ln(.)表示取自然對數操作; 步驟⑶根據3個樣點的質荷比數據構造係數矩陣M ;
//Zj2 m' I
M = nu Imt ///, I 步驟⑷構造分解矩陣Q和R ;[Q,R] = qr(M) 其中,qr (.)表示對矩陣進行QR分解,矩陣Q為分解出的正交矩陣,大小為3 X 3,矩陣R為分解出的上三角矩陣,大小為3X3 ; 步驟(5)計算特徵參數信息向量P ;P = IT1X (QtXY) 步驟(6)令P = [P1 p2 p3]τ,計算特徵參數a、b和c ;
^Pi c=fl
【文檔編號】G01N27/62GK104297328SQ201410498617
【公開日】2015年1月21日 申請日期:2014年9月25日 優先權日:2014年9月25日
【發明者】易志強, 李芸, 章劍秋, 姚英彪, 曾嶸, 張福洪, 李希元 申請人:杭州電子科技大學

同类文章

一種新型多功能組合攝影箱的製作方法

一種新型多功能組合攝影箱的製作方法【專利摘要】本實用新型公開了一種新型多功能組合攝影箱,包括敞開式箱體和前攝影蓋,在箱體頂部設有移動式光源盒,在箱體底部設有LED脫影板,LED脫影板放置在底板上;移動式光源盒包括上蓋,上蓋內設有光源,上蓋部設有磨沙透光片,磨沙透光片將光源封閉在上蓋內;所述LED脫影

壓縮模式圖樣重疊檢測方法與裝置與流程

本發明涉及通信領域,特別涉及一種壓縮模式圖樣重疊檢測方法與裝置。背景技術:在寬帶碼分多址(WCDMA,WidebandCodeDivisionMultipleAccess)系統頻分復用(FDD,FrequencyDivisionDuplex)模式下,為了進行異頻硬切換、FDD到時分復用(TDD,Ti

個性化檯曆的製作方法

專利名稱::個性化檯曆的製作方法技術領域::本實用新型涉及一種檯曆,尤其涉及一種既顯示月曆、又能插入照片的個性化檯曆,屬於生活文化藝術用品領域。背景技術::公知的立式檯曆每頁皆由月曆和畫面兩部分構成,這兩部分都是事先印刷好,固定而不能更換的。畫面或為風景,或為模特、明星。功能單一局限性較大。特別是畫

一種實現縮放的視頻解碼方法

專利名稱:一種實現縮放的視頻解碼方法技術領域:本發明涉及視頻信號處理領域,特別是一種實現縮放的視頻解碼方法。背景技術: Mpeg標準是由運動圖像專家組(Moving Picture Expert Group,MPEG)開發的用於視頻和音頻壓縮的一系列演進的標準。按照Mpeg標準,視頻圖像壓縮編碼後包

基於加熱模壓的纖維增強PBT複合材料成型工藝的製作方法

本發明涉及一種基於加熱模壓的纖維增強pbt複合材料成型工藝。背景技術:熱塑性複合材料與傳統熱固性複合材料相比其具有較好的韌性和抗衝擊性能,此外其還具有可回收利用等優點。熱塑性塑料在液態時流動能力差,使得其與纖維結合浸潤困難。環狀對苯二甲酸丁二醇酯(cbt)是一種環狀預聚物,該材料力學性能差不適合做纖

一種pe滾塑儲槽的製作方法

專利名稱:一種pe滾塑儲槽的製作方法技術領域:一種PE滾塑儲槽一、 技術領域 本實用新型涉及一種PE滾塑儲槽,主要用於化工、染料、醫藥、農藥、冶金、稀土、機械、電子、電力、環保、紡織、釀造、釀造、食品、給水、排水等行業儲存液體使用。二、 背景技術 目前,化工液體耐腐蝕貯運設備,普遍使用傳統的玻璃鋼容

釘的製作方法

專利名稱:釘的製作方法技術領域:本實用新型涉及一種釘,尤其涉及一種可提供方便拔除的鐵(鋼)釘。背景技術:考慮到廢木材回收後再加工利用作業的方便性與安全性,根據環保規定,廢木材的回收是必須將釘於廢木材上的鐵(鋼)釘拔除。如圖1、圖2所示,目前用以釘入木材的鐵(鋼)釘10主要是在一釘體11的一端形成一尖

直流氧噴裝置的製作方法

專利名稱:直流氧噴裝置的製作方法技術領域:本實用新型涉及ー種醫療器械,具體地說是ー種直流氧噴裝置。背景技術:臨床上的放療過程極易造成患者的局部皮膚損傷和炎症,被稱為「放射性皮炎」。目前對於放射性皮炎的主要治療措施是塗抹藥膏,而放射性皮炎患者多伴有局部疼痛,對於止痛,多是通過ロ服或靜脈注射進行止痛治療

新型熱網閥門操作手輪的製作方法

專利名稱:新型熱網閥門操作手輪的製作方法技術領域:新型熱網閥門操作手輪技術領域:本實用新型涉及一種新型熱網閥門操作手輪,屬於機械領域。背景技術::閥門作為流體控制裝置應用廣泛,手輪傳動的閥門使用比例佔90%以上。國家標準中提及手輪所起作用為傳動功能,不作為閥門的運輸、起吊裝置,不承受軸向力。現有閥門

用來自動讀取管狀容器所載識別碼的裝置的製作方法

專利名稱:用來自動讀取管狀容器所載識別碼的裝置的製作方法背景技術:1-本發明所屬領域本發明涉及一種用來自動讀取管狀容器所載識別碼的裝置,其中的管狀容器被放在循環於配送鏈上的文檔匣或託架裝置中。本發明特別適用於,然而並非僅僅專用於,對引入自動分析系統的血液樣本試管之類的自動識別。本發明還涉及專為實現讀