蛋白質信號轉導子網的預測方法和裝置製造方法
2023-06-13 04:29:06
蛋白質信號轉導子網的預測方法和裝置製造方法
【專利摘要】本發明公開了一種蛋白質信號轉導子網的預測方法和裝置。其中,蛋白質信號轉導子網的預測方法包括:建立步驟:建立信號轉導網絡;第一計算步驟:計算信號轉導網絡中每個節點和每條邊的分值;第一獲取步驟:獲取信號轉導網絡中的目標節點及多個第一目標信號子網;第二計算步驟:計算每個第一目標信號子網的子網分值和顯著性概率值;第二獲取步驟:獲取第一目標信號子網中的多個第二目標信號子網;以及確定步驟:確定多個第二目標信號子網中子網分值最高的第二目標信號子網為信號轉導子網。通過本發明,解決了現有技術中蛋白質信號轉導子網的預測精度低的問題,進而達到了降低預測複雜度、提高預測效率的效果。
【專利說明】蛋白質信號轉導子網的預測方法和裝置
【技術領域】
[0001]本發明涉及數據處理領域,具體而言,涉及一種蛋白質信號轉導子網的預測方法和裝置。
【背景技術】
[0002]信號轉導網絡中涉及很多蛋白質及蛋白質之間的相互作用。大部分分析方法都是基於靜態的信號轉導模型,即假定一對蛋白質能夠發生相互作用,那麼在這兩個節點之間存在一個連接,網絡的結構和特性不隨著時間和條件的改變而改變。在實際系統中,信號轉導網絡時刻都在發生改變,也正是這種改變才使得生物體能夠對外界刺激快速作出響應,完成各種複雜的生物學功能。因此,對信號轉導網絡進行動態的分析是揭示生物系統運行規律的關鍵。
[0003]靜態網絡提供了對於細胞內系統行為的定性描述,而蛋白質或基因表達數據可以提供分子在不同條件/時間/樣本狀態下的定量信息,因此,將這兩種數據源結合起來可用於闡釋細胞內系統的動態組織形式。目前,常用的方法是利用不同條件對應的基因表達譜來識別條件特異子網,用於幫助篩選疾病相關的生物標誌物以及發現在不同表型之間通路的變化。條件特異的子網構建方法包括單基因差異分析、基因集差異分析以及基於聚類方法的基因共表達分析等。也有少數方法同時考慮單個基因的差異表達和基因對之間的變化相關性。
[0004]現有技術中一種基於基因表達數據發現條件特異的蛋白質相互作用子網的方法,詳細步驟如下:
[0005]I)從蛋白質相互作用資料庫HPRD中下載人的蛋白質相互作用數據集,構建靜態蛋白質相互作用網絡;
[0006]2)同時考慮網絡中節點和邊隨條件的變化,定義綜合打分函數;
[0007]3)建立全局優化算法COSINE,利用遺傳算法提取條件特異的子網;
[0008]4)基於兩個仿真數據集和三個真實的晶片數據集,發現目標疾病相關的特異子網;
[0009]5)將該方法篩選到的特異子網與其他方法得到的子網進行比較,評估預測方法的性能。
[0010]上述方式主要是基於基因表達信息,來預測條件特異的蛋白質相互作用子網,由於基因表達數據存在一定噪聲,且與實驗條件密切相關,使得該方法的預測精度不高,並且算法複雜性較大,運行速度較慢。
[0011]針對相關技術中蛋白質信號轉導子網的預測精度低的問題,目前尚未提出有效的解決方案。
【發明內容】
[0012]本發明的主要目的在於提供一種蛋白質信號轉導子網的預測方法和裝置,以解決現有技術中蛋白質信號轉導子網的預測精度低的問題。
[0013]根據本發明的一個方面,提供了一種蛋白質信號轉導子網的預測方法。
[0014]根據本發明的蛋白質信號轉導子網的預測方法包括:建立步驟:建立信號轉導網絡,其中,一種蛋白質為信號轉導網絡的一個節點,具有通信關係的兩種蛋白質之間的通道為信號轉導網絡的一條邊;第一計算步驟:計算信號轉導網絡中每個節點和每條邊的分值;第一獲取步驟:獲取信號轉導網絡中的目標節點及多個第一目標信號子網,其中,目標節點為信號轉導網絡中節點分值最高的節點,第一目標信號子網為信號轉導網絡中與目標節點連通的信號子網;第二計算步驟:計算每個第一目標信號子網的子網分值和顯著性概率值;第二獲取步驟:獲取第一目標信號子網中的多個第二目標信號子網,其中,第二目標信號子網為顯著性概率值小於預設值的第一目標信號子網;以及確定步驟:確定多個第二目標信號子網中子網分值最高的第二目標信號子網為信號轉導子網。
[0015]進一步地,採用以下方式計算每個節點的分值:獲取節點i對應的蛋白質的實際豐度比和預設豐度比,其中,節點i為信號轉導網絡中的任一節點;以及根據節點i對應的實際豐度比和目標節點對應預設豐度比,計算節點i的分值。
[0016]進一步地,根據實際豐度比和預設豐度比,計算節點i的分值包括:按照以下公式計算節點i的分值:
【權利要求】
1.一種蛋白質信號轉導子網的預測方法,其特徵在於,包括: 建立步驟:建立信號轉導網絡,其中,一種蛋白質為所述信號轉導網絡的一個節點,具有通信關係的兩種蛋白質之間的通道為所述信號轉導網絡的一條邊; 第一計算步驟:計算所述信號轉導網絡中每個節點和每條邊的分值; 第一獲取步驟:獲取所述信號轉導網絡中的目標節點及多個第一目標信號子網,其中,所述目標節點為所述信號轉導網絡中節點分值最高的節點,所述第一目標信號子網為所述信號轉導網絡中與所述目標節點連通的信號子網; 第二計算步驟:計算每個所述第一目標信號子網的子網分值和顯著性概率值; 第二獲取步驟:獲取所述第一目標信號子網中的多個第二目標信號子網,其中,所述第二目標信號子網為所述顯著性概率值小於預設值的所述第一目標信號子網;以及 確定步驟:確定多個所述第二目標信號子網中子網分值最高的所述第二目標信號子網為所述信號轉導子網。
2.根據權利要求1所述的預測方法,其特徵在於,採用以下方式計算每個節點的分值: 獲取節點i對應的蛋白質的實際豐度比和預設豐度比,其中,所述節點i為所述信號轉導網絡中的任一節點;以及 根據所述節點i對應的實際豐度比和所述目標節點對應預設豐度比,計算所述節點i的分值。
3.根據權利要求2所述的預測方法,其特徵在於,根據所述實際豐度比和所述預設豐度比,計算所述節點i的分值包括: 按照公式,
4.根據權利要求1所述的預測方法,其特徵在於,採用以下方式計算每條邊的分值: 獲取邊i所連接的兩個節點對應的蛋白質的實際豐度比,其中,所述邊i為所述信號轉導網絡中的任一邊;以及 根據所述邊i所連接的兩個節點對應的蛋白質的實際豐度比,計算所述邊i的分值。
5.根據權利要求4所述的預測方法,其特徵在於,根據所述邊i所連接的兩個節點對應的蛋白質的實際豐度比,計算所述邊i的分值包括:按照公式
6.根據權利要求1所述的預測方法,其特徵在於,按照以下公式計算每個所述第一目標信號子網的子網分值:
7.根據權利要求1所述的預測方法,其特徵在於,計算每個所述第一目標信號子網的顯著性概率值包括: 從所述信號轉導網絡中獲取預設數量的第三目標信號子網,其中,所述第三目標信號子網的節點的數量與第一目標信號子網i2的節點的數量相同,所述第三目標信號子網的邊的數量與所述第一目標信號子網i2的邊的數量相同; 計算每個所述第三目標信號子網的子網分值;以及 按照公式
8.根據權利要求7所述的預測方法,其特徵在於,在確定多個所述第二目標信號子網中子網分值最高的所述第二目標信號子網為所述信號轉導子網之後,所述預測方法還包括: 判斷所述信號轉導子網是否滿足預設條件;以及 在判斷出所述信號轉導子網不滿足所述預設條件的情況下,調整所述預設值和所述預設數量,並再次執行所述第二計算步驟、所述第二獲取步驟和所述確定步驟。
9.一種蛋白質信號轉導子網的預測裝置,其特徵在於,包括: 建立單元,用於建立信號轉導網絡,其中,一種蛋白質為所述信號轉導網絡的一個節點,具有通信關係的兩種蛋白質之間的通道為所述信號轉導網絡的一條邊; 第一計算單元,用於計算所述信號轉導網絡中每個節點和每條邊的分值; 第一獲取單元,用於獲取所述信號轉導網絡中的目標節點及多個第一目標信號子網,其中,所述目標節點為所述信號轉導網絡中節點分值最高的節點,所述第一目標信號子網為所述信號轉導網絡中與所述目標節點連通的信號子網; 第二計算單元,用於計算每個所述第一目標信號子網的子網分值和顯著性概率值;第二獲取單元,用於獲取所述第一目標信號子網中的多個第二目標信號子網,其中,所述第二目標信號子網為所述顯著性概率值小於預設值的所述第一目標信號子網;以及確定單元,用於確定多個所述第二目標信號子網中子網分值最高的所述第二目標信號子網為所述信號轉導子網。
10.根據權利要求9所述的預測裝置,其特徵在於,所述第一計算單元包括: 第一獲取模塊,用於獲取節點i對應的蛋白質的實際豐度比和預設豐度比,其中,所述節點i為所述信號轉導網絡中的任一節點;以及 第一計算模塊,用於根據所述節點i對應的實際豐度比和所述目標節點對應預設豐度t匕,計算所述節點i的分值。
11.根據權利要求10所述的預測裝置,其特徵在於,所述第一計算模塊用於按照以下公式計算所述節點i的分值:
12.根據權利要求9所述的預測裝置,其特徵在於,所述第一計算單元還包括: 第二獲取模塊,用於獲取邊i所連接的兩個節點對應的蛋白質的實際豐度比,其中,所述邊i為所述信號轉導網絡中的任一邊;以及 第二計算模塊,用於根據所述邊i所連接的兩個節點對應的蛋白質的實際豐度比,計算所述邊i的分值。
13.根據權利要求12所述的預測裝置,其特徵在於,所述第二計算模塊用於按照以下公式計算所述邊i的分值:
14.根據權利要求9所述的預測裝置,其特徵在於,所述第二計算單元用於按照以下公式計算每個所述第一目標信號子網的子網分值:
15.根據權利要求9所述的預測裝置,其特徵在於,所述第二計算單元包括: 第三獲取模塊,用於從所述信號轉導網絡中獲取預設數量的第三目標信號子網,其中,所述第三目標信號子網的節點的數量與第一目標信號子網i2的節點的數量相同,所述第三目標信號子網的邊的數量與所述第一目標信號子網i2的邊的數量相同; 第三計算模塊,用於計算每個所述第三目標信號子網的子網分值;以及 第四計算模塊,用於按照公式P = $計算所述的第一目標信號子網i2的顯著性概率值P,其中,N2為所述第三目標信號子網的數量,N1為子網分值大於所述第一目標信號子網i2的子網分值的所述第三目標信號子網的數量,所述第一目標信號子網i2為多個所述第一目標信號子網中的任一信號子網。
16.根據權利要求15所述的預測裝置,其特徵在於,所述預測裝置還包括: 判斷單元,用於判斷所述信號轉導子網是否滿足預設條件;以及 調整單元,用於在判斷出所述信號轉導子網不滿足所述預設條件的情況下,調整所述預設值和所述預設數量,以使所述第二計算單元、所述第二獲取單元和所述確定單元再次確定所述信號轉導子網。
【文檔編號】G06F19/12GK103870720SQ201410102941
【公開日】2014年6月18日 申請日期:2014年3月19日 優先權日:2014年3月19日
【發明者】劉偉, 謝紅衛 申請人:中國人民解放軍國防科學技術大學