一種篩選時間點晶片差異基因的方法
2023-06-17 19:30:26
專利名稱:一種篩選時間點晶片差異基因的方法
技術領域:
本發明屬於生物技術領域,涉及一種篩選時間點晶片差異基因的方法
背景技術:
基因晶片是一種固定有寡核苷酸、基因組DNA或互補DNA (脫氧核糖核酸)等的生物晶片,可用於生物學研究中對樣品基因表達譜的生物學信息進行快速定性和定量分析。 隨著人類基因組計劃的成功完成以及生物學基因研究的迅猛發展,越來越多的動植物、微生物基因組序列得以測定,基因序列數據以前所未有的速度迅速增長,面對如此海量的數據,其處理和分析成為科研中的一大難題。基因晶片技術正是在這種科學發展要求下產生的,並為各種生物基因的研究提供了光輝的前景。基因晶片的原理是將大量(通常每平方釐米點陣密度高於400)探針分子固定於支持物上後與標記的樣品分子進行雜交,通過檢測每個探針分子的雜交信號強度進而獲取樣品分子的數量和序列信息。在生物醫學研究中,有一類常用的基因晶片叫做時間點晶片, 和其他基因晶片不同的是它的取樣方法。時間點晶片一般將實驗開始時的基因晶片(即時間點為0時的樣本晶片)做為對照晶片,然後對樣本進行處理後,在每個特定的時間點(如處理後5分鐘、1小時、12小時、1天等)取一次樣本,做為各個時間點的樣本晶片。對各個樣本晶片和對照晶片的數據進行處理後,便可得到所研究基因的時間點表達譜。時間點晶片數據圖譜反映了樣品中基因在不同時間時的表達情況,通過將不同時間點的樣本晶片基因表達數據與對照晶片基因表達數據進行比較,篩選各個時間點表達數據有差異的基因,以此篩選出樣品中差異表達的基因。根據樣本的不同以及處理標準的不同,時間點晶片篩選差異基因的方法也不同, 本發明設計了一套方法,用於時間點晶片的差異基因的篩選中,以儘可能真實、準確地篩選出差異表達的基因。
發明內容
本發明專利所設計的方法適用於時間點基因晶片差異基因的篩選,為了方便而清楚的描述本方法,本方法將對時間點晶片實驗及數據分析中的部分名詞進行如下定義UP-call 基因晶片中某一個基因的表達信號值,可以代表該基因的的表達量。2、Ρ(Α、Μ)根據晶片中基因表達信號值的強弱可以對信號值進行分類,信號值高的記做P,即有效檢測基因;信號值低的記做Α,即無效檢測基因;少量居於中間的記為Μ。3, Fold change 在某個特定時間點,樣本晶片的表達信號與對照晶片的表達信號的比值。用於判斷該時間點時,基因表達是否有差異。本方法的基本實施流程為步驟1、對晶片數據進行預處理步驟2、設置差異基因篩選參數步驟3、應用步驟2中參數對基因晶片數據進行篩選
步驟4、差異基因的統計
圖1、本發明專利所述方法的實施流程圖實施方式本發明專利設計了一種針對於時間點晶片篩選差異基因的方法,下面介紹本方法的具體實施步驟步驟1、晶片數據預處理。這裡的晶片數據可以來自於晶片實驗的結果,運用R語言工具(http://cran.r-project.org)將基因的絕對表達值轉換成與對照的比值。為了降低倍數失真,我們將小於100的絕對表達值被賦予100。步驟2、設置差異基因的篩選參數。對於同時滿足以下兩個條件的基因,本方法認為是差異基因。條件一、該基因的對照P-call值(即該基因位於0時間點時的表達值)為P,或者 N個時間點中有N/2個時間點的P-call值為P (N為時間點個數,N/2取整數值)。條件二、該基因N個時間點中至少有N/2個時間點的R)ld Change值大於1. 5或者小於0. 67。步驟3、利用R語言工具包,依據步驟2中設置的參數對步驟1中預處理好的晶片數據進行處理,篩選出差異表達基因,導出結果。步驟4、統計分析兩類時間點晶片差異基因的篩選結果,整理成列表,以用作後續分析的依據。以上是對本發明的描述而非限定,基於本發明思想的其它實施方式,均在本發明的保護範圍之中。
權利要求
1.本發明專利所述的一種篩選時間點晶片差異基因的方法,它對如下幾個名詞進行了定義(1)>P-call基因晶片中某一個基因的表達信號值,可以代表該基因的的表達量。(2)、Ρ(Α、Μ)根據晶片中基因表達信號值的強弱可以對信號值進行分類,信號值高的記做P,即有效檢測基因;信號值低的記做Α,即無效檢測基因;少量居於中間的記為Μ。(3),Foldchange 在某個特定時間點,樣本晶片的表達信號與對照晶片的表達信號的比值。用於判斷該時間點時,基因表達是否有差異。該方法包括如下幾步主要步驟步驟1、對晶片數據進行預處理步驟2、設置差異基因篩選參數步驟3、應用步驟2中參數對基因晶片數據進行篩選步驟4、差異基因的統計。
全文摘要
本發明設計了一種篩選差異基因的方法,適用於時間點基因晶片的數據分析中。該方法儘可能真實、準確地篩選出差異表達基因,它包括幾步主要步驟步驟1、對晶片數據進行預處理;步驟2、設置差異基因篩選參數;步驟3、應用步驟2中參數對基因晶片數據進行篩選;步驟4、差異基因的統計。
文檔編號C12Q1/68GK102206700SQ20101022709
公開日2011年10月5日 申請日期2010年7月14日 優先權日2010年7月14日
發明者曾華宗 申請人:上海聚類生物科技有限公司