篩選胰腺癌的血清蛋白質譜模型及其構建方法
2024-01-20 18:04:15 1
專利名稱:篩選胰腺癌的血清蛋白質譜模型及其構建方法
技術領域:
本發明涉及檢測技術領域,尤其涉及一種篩選胰腺癌的血清蛋白質譜模型及其構 建方法。
背景技術:
胰腺癌是消化系統較常見的惡性腫瘤,因胰腺位置深而隱蔽且侵襲性強,故手術 切除率低,愈後很差,5年生存率不足6%,被稱為「癌中之王」。而提高早期診斷率對改善胰 腺癌的長期生存率意義重大,因此找到理想的可用於早期鑑別診斷的方法如特異的血清或 胰液蛋白標記物是解決此問題的關鍵。胰腺癌的早期診斷最可取的模式是對高危人群(老 年男性,有長期吸菸、嗜酒史,或有慢性胰腺炎、糖尿病,高脂飲食、與致癌物接觸的職業和 有胰腺癌家族史者)定期的普查和篩選,但採用這種模式對胰腺癌卻有一定困難。雖然目前 一些常用的腫瘤標誌物如CA19-9、CA50、CA242等,對於診斷胰腺癌、評估其預後及監測有 無復發起到了重要作用,但其特異性和敏感性尚不能滿足早期診斷的需要,因為這些指標 在無轉移的局限性胰腺癌中並不升高,而在非胰腺癌患者中也會升高,因此需要尋找新的 特異指標來進一步提高胰腺癌早期診斷水平。
發明內容
本發明的目的在於針對現有技術的不足,提供一種篩選胰腺癌的血清蛋白質譜模 型及其構建方法。本發明的目的是通過以下技術方案來實現的
一種篩選胰腺癌的血清蛋白質譜模型,它主要由人血清蛋白質質譜中質核比(M/Z)位 於 4976士380Da、6857士737Da、4407士726Da、5488士963Da、7068士142Da、3250士591Da、 4753士360Da、6885士572Da 、5644士382Da、2892士299Da、3281士348Da、4292士289Da、 2678士208Da和5364士 126Da的人血清蛋白質組成。進一步地,包括以下步驟
(1)血清的收集、處理、與蛋白晶片的結合收集胰腺癌、慢性胰腺炎、胰腺良性腫瘤患 者或健康志願者的血清,加入去垢劑、緩衝劑等,並與CMio蛋白晶片結合;
(2)質譜數據的收集首先用已知分子量的標準蛋白質晶片All-in-One將Ciphergen PBS- II -PLUS型SELDI-T0F-MS系統的分子量誤差校正到<0. 1%,再將結合好蛋白質的晶片 放入質譜儀中進行檢測。原始數據由Proteinchip Software 3. 2軟體採集,設置雷射強度 為180,檢測靈敏度6,檢測上限100,000 Λ,優化收集數據範圍2000 20000 Λ,信號收 集位置從20 80,每個樣本取168個點所收集信號的平均值。用Proteinchip Software 3. 2軟體以xlm的格式輸出原始質譜(3 )分析組成,從而得到本發明篩選胰腺癌的血清蛋白質譜模型。進一步地,所述步驟(3)具體為 (a)原始質譜圖上傳到伺服器;(b)先用小波變換(UDWT)去除質譜儀器本身造成的噪音;
(c)修正去除噪音後的質譜圖的基線;
(d)校正整個圖譜的分子量值;
(e)用局部極值法找出蛋白值峰,用信噪比和該峰在各樣本中出現的比率過慮蛋白質
峰;
(f)均一化所有樣本數據;
(g)對預處理完篩選出來的蛋白質峰做進一步的檢驗分析,篩選出P<0.05差異蛋白
峰;
(h)對篩選的差異蛋白峰進一步用遺傳算法結合支持向量機模型的方法篩選最佳模 型,用留一法評估模型的預測效果,選出建立支持向量機模型預測的約登指數最高的組合 作為最終的候選標誌物,建立的模型和留一法交叉驗證的結果作為最終的結果;
(i)輸出各種統計結果和圖片。本發明的有益效果是
1、本質譜模型的構建方法合理可行,且較簡便,操作性強,可批量處理;2、敏感性和特 異性較高;
3、本模型能夠對疑診胰腺癌的患者進行早期篩查,並為進一步發現可能的腫瘤標記物 提供基礎。
具體實施例方式本發明篩選胰腺癌的血清蛋白質譜模型能夠對疑診胰腺癌的患者進行早期篩查, 並為進一步發現可能的腫瘤標記物提供基礎。本發明篩選胰腺癌的血清蛋白質譜模型由人血清蛋白質質譜中質核比(M/Z)位 於 4976士380Da、6857士737Da、4407士726Da、5488士963Da、7068士142Da、3250士591Da、 4753士360Da、6885士572Da、5644士382Da、2892士299Da、3281士348Da、4292士289Da、 2678士208Da和5364士 126Da的人血清蛋白質組成。本發明質譜模型的構建方法包括以下步驟 1、血清的收集、處理、與蛋白晶片的結合。血清的收集、處理、與蛋白晶片(CMlO)的結合包括收集符合入選標準的各種患 者如胰腺癌、慢性胰腺炎、胰腺良性腫瘤患者或健康志願者的血清,加入去垢劑、緩衝劑等, 並與CMlO蛋白晶片結合。1)採集胰腺癌、慢性胰腺炎、胰腺良性腫瘤患者(或健康志願者)清晨空腹靜脈血 約3mL,室溫下靜置l-2h,3000rpm離心15min分離血清,_8(TC冰箱保存。2)實驗方法(如圖4所示) A、晶片的預處理
a、CMlO蛋白晶片的每個孔中加入200 μ 1 Binding Buffer。b、搖床上振蕩(600rpm,室溫)5分鐘使充分平衡後去除液體,重複平衡一次。B、血清的預處理
a、冰浴上緩慢融解血清(30 60分鐘),IOOOOrpm離心5分鐘(4°C )。bUOy 1 U9血清變性溶液中加入血清5yL,搖床上振蕩使充分混合(600rpm,41,30分鐘)。c、用Binding Buffer將U9處理後的血清稀釋至200 μ 1用於上樣,搖床上振蕩使 充分混合(600rpm,4°C,2分鐘)。至此血清被稀釋約40倍。C、蛋白質與晶片結合
a、取上述經U9處理並稀釋過的血清ΙΟΟμ 1加到晶片上,仔細檢查並去除每個孔中的 氣泡以免其影響蛋白質與晶片的結合。b、晶片與血清充分反應1小時(600rpm搖床上振蕩,4°C)後去除樣品。D、結合後衝洗
a、每孔加入200 μ 1相應的Binding Buffer,搖床上振蕩5分鐘(600rpm,室溫)後除去
液體。重複該過程2次。b、用水(純度HPLC級)200μ 1快速清洗每個孔1次,用力甩幹並將Bio-processor 倒扣在清潔的吸水紙上輕拍以去除多餘的水。C、將晶片從Bio-processor中取出,自然乾燥。E、加能量吸收分子(EAM)
每孔點加50%飽和的SPA溶液1 μ 1,待其自然乾燥後重複點加1次。自然乾燥即可上 機檢測。2、質譜數據的收集
採用的儀器可以為Ciphergen PBS- II -PLUS 型 SELDI-TOF-MS 系統。首先用已知分子量的標準蛋白質晶片Al Ι-in-One將SELDI質譜系統的分子 量誤差校正到 ZJU-PDAS (ZheJiang University-ProteinChip Data Analyze System) 分析組成。1) ZJU-PDAS分析具體參數
UserName浙醫二院PeaksfilteringfactorWilcoxonRepeatSample0SmallSizeSampleNoTestsamplepercent0. 3BatchAnalyze1Waveletthreshold30Smoothingwindow100Calibrationcoefficient (%)0. 03MinimalM/Z(%)2500Clusterfactor(%)0. 003Minimalpeakthreshold(%)0. 1Excludedspectrathreshold(%)0. 01Minimalsinal/noiseratio(%)3Minimalintensity300PvalueorNumberofpeaks33Algorithm1Evaluation1GApopulation50GAgeneration20
2)數據處理的整個流程如下
a、原始質譜圖上傳到伺服器。b、先用小波變換(UDWT)去除質譜儀器本身造成的噪音。C、修正去除噪音後的質譜圖的基線。d、校正整個圖譜的分子量值。
e、用局部極值法找出蛋白值峰,用信噪比和該峰在各樣本中出現的比率過慮蛋白 質峰。f、均一化所有樣本數據。g、對預處理完篩選出來的蛋白質峰做進一步的檢驗分析,篩選出P<0. 05差異蛋 白峰。h、對 篩選的差異蛋白峰進一步用遺傳算法結合支持向量機模型的方法篩選最佳 模型,用留一法評估模型的預測效果,選出建立支持向量機模型預測的約登指數最高的組 合作為最終的候選標誌物,建立的模型和留一法交叉驗證的結果作為最終的結果。i、輸出各種統計結果和圖片。結果
胰腺癌患者與非胰腺癌者血清中蛋白譜比較。檢測胰腺癌患者37例,非胰腺癌者27例(其中慢性胰腺炎5例,胰腺良性腫瘤患 者12例;健康志願者10例),進行t檢驗篩查ρ值小於0. 05的差異蛋白質。共檢測到33個經過信噪比和強調過濾的有統計學顯著性差異O°<0. 05,具體峰值 等見表1,示意圖見
圖1)的高質量質譜蛋白質峰,從中篩選出14個蛋白質峰(具體值見表
2)用於建立SVM判別模型,區分陽性組和陰性組的準確率為分別為83.8%,77. 8% (詳見表3)。表1 質譜蛋白質峰的峰值和P值__
權利要求
1.一種篩選胰腺癌的血清蛋白質譜模型,其特徵在於,它主要由人血清蛋白質質譜中 質核比(M/Z)位於 4976 士 380Da、6857 士 737Da、4407 士 726Da、5488 士 963Da、7068 士 142Da、 3250士 591Da、4753 士 360Da、6885 士 572Da 、5644士 382Da、2892 士 299Da、3281士 348Da、 4292±^9DaJ678士208Da和5364士 126Da的人血清蛋白質組成。
2.—種權利要求1所述質譜模型的構建方法,其特徵在於,包括以下步驟(1)血清的收集、處理、與蛋白晶片的結合收集胰腺癌、慢性胰腺炎、胰腺良性腫瘤患 者或健康志願者的血清,加入去垢劑、緩衝劑等,並與CMlO蛋白晶片結合;(2)質譜數據的收集首先用已知分子量的標準蛋白質晶片All-in-One將Ciphergen PBS- II -PLUS型SELDI-T0F-MS系統的分子量誤差校正到<0. 1%,再將結合好蛋白質的晶片 放入質譜儀中進行檢測;原始數據由I^roteinchip Software 3. 2軟體採集,設置雷射強度 為180,檢測靈敏度6,檢測上限100,000 Λ,優化收集數據範圍2000 20000 Λ,信號收 集位置從20 80,每個樣本取168個點所收集信號的平均值;用ftOteinchip Software 3. 2軟體以xlm的格式輸出原始質譜圖;(3 )分析組成,從而得到本發明篩選胰腺癌的血清蛋白質譜模型。
3.根據權利要求2所述構建方法,其特徵在於,所述步驟(3)具體為(a)原始質譜圖上傳到伺服器;(b)先用小波變換(UDWT)去除質譜儀器本身造成的噪音;(c)修正去除噪音後的質譜圖的基線;(d)校正整個圖譜的分子量值;(e)用局部極值法找出蛋白值峰,用信噪比和該峰在各樣本中出現的比率過慮蛋白質峰;(f)均一化所有樣本數據;(g)對預處理完篩選出來的蛋白質峰做進一步的檢驗分析,篩選出P<0.05差異蛋白峰;(h)對篩選的差異蛋白峰進一步用遺傳算法結合支持向量機模型的方法篩選最佳模 型,用留一法評估模型的預測效果,選出建立支持向量機模型預測的約登指數最高的組合 作為最終的候選標誌物,建立的模型和留一法交叉驗證的結果作為最終的結果;(i)輸出各種統計結果和圖片。
全文摘要
本發明公開了一種篩選胰腺癌的血清蛋白質譜模型及其構建方法,該血清蛋白質譜模型主要由人血清蛋白質質譜中質核比(M/Z)位於4976±380Da、6857±737Da、4407±726Da、5488±963Da、7068±142Da、3250±591Da、4753±360Da、6885±572Da 、5644±382Da、2892±299Da、3281±348Da、4292±289Da、2678±208Da和5364±126Da的人血清蛋白質組成,本發明的構建方法具有合理可行、操作簡便、可批量處理的特點。
文檔編號G01N27/64GK102128876SQ20101060022
公開日2011年7月20日 申請日期2010年12月22日 優先權日2010年12月22日
發明者蔡建庭, 陳妙研 申請人:浙江大學