一種篩查HRDs致病突變的方法及涉及的基因晶片雜交探針設計方法
2023-05-31 23:15:46 3
一種篩查HRDs致病突變的方法及涉及的基因晶片雜交探針設計方法
【專利摘要】本發明屬於生物醫藥領域,涉及一種篩查HRDs致病突變的方法及涉及的基因晶片雜交探針設計方法。篩選HRDs致病基因的方法包括(1)HRDs遺傳資源庫的建立,(2)設計併合成HRDs致病基因的基因晶片雜交探針,並將其整合到基因晶片上;(3)利用製備的基因晶片捕獲目標區域並進行深度測序;(4)對測序數據進行生物信息學分析,篩選出候選致病基因;(5)針對新發現的剪切基因突變位點進行功能預測。本發明建立了高效的HRDs靶基因捕獲技術,以深度測序為手段,確認HRDs捕獲晶片效率,建立高效、可信的生物信息分析模型。
【專利說明】一種篩查HRDs致病突變的方法及涉及的基因晶片雜交探針設計方法
【技術領域】
[0001]本發明屬於生物醫藥領域,涉及一種篩查HRDs致病突變的方法及涉及的基因晶片雜交探針設計方法。
【背景技術】
[0002]遺傳性視網膜疾病(Hereditary retinal diseases, HRDs)是一組由遺傳缺陷引起的進行性視網膜退行性疾病,是臨床上常見且危害嚴重的遺傳性致盲疾病。作為世界範圍內工作年齡人群的第一大致盲眼病,HRDs在歐美發病率約為1/3000,在我國更是高達1/1000。我國是HRDs遺傳資源大國,但目前HRDs相關的遺傳學信息多來自西方國家,因此對我國HRDs患者進行深入的遺傳學研究顯得尤為重要。
[0003]HRDs多為單基因遺傳病,眾多基因缺陷均可導致其發生,其常見的遺傳模式有常染色體顯性遺傳、常染色體隱性遺傳及X連鎖隱性遺傳。迄今,全世界已鑑定出191個HRDs相關致病基因和231個連鎖位點(www.RetNet.0rg),且隨著研究深入,該數目正逐年遞增。其致病基因數之多表明臨床表現相同的患者,很有可能有不同的基因型,即顯著的遺傳異質性。目前仍有大於60%(西方國家統計結果,我國比率更高)HRDs患者的致病基因尚未找到,提示存在大量新致病基因有待挖掘。
[0004]由DNA轉錄得到的前體RNA (pre-mRNA)需經過剪接成為信使RNA (mRNA)才能進一步參與翻譯過程合成蛋白質,而該剪接過程主要發生在剪接體。剪接體是由小分子核糖核蛋白(snRNPs)組成的超大分子複合體,構成剪接體的snRNP有五種:U1、U2、U4/U6和U5。研究指出,與前體RNA剪接體蛋白編碼相關的基因(剪切基因)能夠引起常染色體顯性視網膜色素變性(ADRP)。目前已被`證實能夠引起ADRP的剪切基因有PRPF3、PRPF6、PRPF8、PRPF31、RP9以及由 申請人:所發現並報導的SNRNP200,這些剪切基因都是通過影響U4/U6-U5複合體而引起ADRP的。值得關注的是,上述六個剪切基因所編碼的蛋白在生物體各種細胞內廣泛表達,但目前研究僅發現該六個基因相關的突變能夠引起視網膜疾病,沒有引起其他疾病的報導。因此,針對剪切基因與RP發病的相關研究顯得尤為必要。
[0005]針對HRDs的研究必須建立在一定的分子生物學技術的基礎上。研究HRDs致病基因的一個重要目的是進行HRDs分子診斷,鑑於其顯著的遺傳異質性,如何檢測眾多致病基因突變是目前的難題之一。基於連鎖分析的定位克隆策略是鑑定單基因遺傳病致病基因的經典方法,但是同時也面臨一些困難:①通常需要多代家系,難以分析小家系和散發病例。②有時多代家系也不能定位致病位點。③難以在連鎖區域內篩選出正確的致病基因。因此,鑑於HRDs疾病本身的性質及傳統分析技術的局限性,尋求一種全新的HRDs致病基因的研究方法顯得尤為迫切。
【發明內容】
[0006]本發明的目的是針對上述缺陷,提供一種以深度測序為平臺篩查HRDs致病突變所涉及基因晶片的雜交探針的設計方法。
[0007]本發明的另一目的是提供一種以深度測序為平臺篩查HRDs致病突變的方法。
[0008]本發明的又一目的是提供新的HRDs致病基因。
[0009]本發明的目的可通過如下技術方案實現:
[0010]一種以深度測序為平臺篩查或檢測HRDs致病突變所涉及的基因晶片雜交探針的設計方法,包括:
[0011](1)候選基因的選擇:所述的基因捕獲晶片涵蓋了全部179個由RetNet公布的視網膜疾病相關基因,及高度懷疑可能與視網膜疾病相關的剪切基因;
[0012](2)轉錄本的選擇:針對不同基因選擇特定轉錄本,選擇原則是:首先考慮擁有CCDS編碼蛋白的轉錄本,若一個基因有多個轉錄本均編碼蛋白,則首選含胺基酸數最多的蛋白相對應的轉錄本,若多個轉錄本胺基酸含量相同,則進一步選擇含鹼基數最多的轉錄本;
[0013](3)雜交探針的設計:根據(2)中挑選出的不同轉錄本設計雜交探針,設計標準為:(a)探針覆蓋所有候選基因的外顯子區域及外顯子和內含子拼接處;(b)去除在人類基因組中出現的高度重複序列及出現2-5倍的較低頻率的重複片段;(c)對臨近外顯子的探針進行整合,整合標準為:當相鄰外顯子的綜合目標區域總和小於600bp時,即將其整合為一個探針,以求通過一對探針完成多對外顯子區域的捕獲;其中,所述的相鄰外顯子的綜合目標區域指前個外顯子的上遊lOObp起至後一個外顯子的下遊lOObp止;(d)當所設計探針序列小於250bp時,在其兩端各包含上下遊lOObp的內含子的基礎上,各繼續增加相同bp數的內含子,使探針大小達到250bp。
[0014]其中,所述的高度懷疑可能與視網膜疾病相關的剪切基因優選SNRNP40、SNRNP27、PRPF4和EFTUD2。本發明方法是一種通用的以深度測序為平臺篩查HRDs致病突變所涉及基因晶片的雜交探針設計方法,所述的高度懷疑可能與視網膜疾病相關的剪切基因不局限於上述優選的4個基因,也可以是其他的高度懷疑可能與視網膜疾病相關的剪切基因。
[0015]所述的外顯子和內含子拼接處是指外顯子上下遊至少各100個bp。
[0016]本發明基於深度測序為平臺篩選HRDs致病基因的基因晶片雜交探針設計方法中,設計的用於篩選HRDs致病基因SNRNP40的雜交探針序列共14條,序列如SEQ IDN0.l^SEQ ID N0.14所示;用於篩選HRDs致病基因SNRNP27的雜交探針序列共7條,序列如SEQ ID N0.15~SEQ ID N0.21所示;用於篩選HRDs致病基因PRPF4的雜交探針序列共15條,序列如SEQ ID N0.22~SEQ ID N0.36所示;用於篩選HRDs致病基因EFTUD2的雜交探針序列共28條,序列如SEQ ID N0.37~SEQ ID N0.64所示;用於篩選HRDs致病基因PRPF3的雜交探針序列共16條,序列如SEQ ID N0.65~SEQ ID N0.80所示;用於篩選HRDs致病基因SNRNP200的雜交探針序列共43條,序列如SEQ ID N0.81~SEQ ID N0.123所示;用於篩選HRDs致病基因RP9的雜交探針序列共8條,序列如SEQ ID N0.124~SEQ ID N0.131所示;用於篩選HRDs致病基因PRPF8的雜交探針序列共44條,序列如SEQ ID N0.132~SEQID N0.175所示;用於篩選HRDs致病基因PRPF31的雜交探針序列共12條,序列如SEQIDN0.176~SEQ IDN0.187所示;用於篩選HRDs致病基因PRPF6的雜交探針序列共21條,序列如 SEQ ID N0.188~SEQ ID N0.208 所示。
[0017]一種以深度測序為平臺篩查HRDs致病突變的方法,包括以下步驟:[0018](1)建立HRDs遺傳資源庫,收集HRDs類病人的臨床資料及血液標本,提取基因組DNA ;
[0019](2)按照上述雜交探針設計方法設計併合成HRDs致病基因晶片的雜交探針,並將其整合到基因晶片上;
[0020](3)利用製備的基因晶片捕獲目標區域並進行深度測序;
[0021](4)對測序結果進行優化的生物信息學分析,篩選出高度可疑的致病基因及致病突變;
[0022](5)針對新發現的剪切基因突變位點進行致病能力預測和功能研究。
[0023]步驟(2)所述的基因晶片優選Roche Nimblegen公司生產的基因晶片。
[0024]步驟(3)所述的利用製備的基因晶片捕獲目標區域並進行深度測序優選利用美國Illumina公司的Hi_seq2000儀器完成。
[0025]步驟(3)所述的利用製備的基因晶片捕獲目標區域並進行深度測序優選流程為:將基因組DNA片段化,在DNA末端標記「A」並與Illumina PE接頭-寡核苷酸混合物相連接;連接產物經PCR富集,獲得DNA文庫,並將DNA文庫與已知致病基因捕獲晶片雜交、洗脫、純化,獲得編碼序列;創建配對末端,在IlluminaHiSeqTM2000平臺上對目標序列進行測序。
[0026]步驟(4)所述的對測序數據進行生物信息學分析優選包括:
[0027](1)採用Mosai k軟體處理Illumina原始測序數據,產生.bam類型文件,將.bam文件輸入GATK,利用GATK檢測單核苷酸變異體和小的插入或缺失,同時進行質量評估,便於下遊的生物信息學分析,最後產生.vcf類型文件;
[0028](2)將患者的測序結果在包括dbSNP132
[0029](http://hgdownload.cse.ucsc.edu/goldenPath/hgl9/database/snpl32.txt.gz.), HapMap 計劃
[0030](ftp: //ftp.ncb1.nlm.nih.gov/hapmap) , lOOOGenome Pro ject (ftp: //ftp.lOOOgenomes.eb1.ac.uk/voll/ftp),炎黃資料庫(http://yh.genomics, org.cn/)以及 Exome Variant Server (http: //evs.gs.Washington.edu/EVS/)在內的五個單核苷酸多態性(SNP)資料庫中篩查,濾過所有已知的SNP位點;
[0031](3)將患者的測序結果所對應的基因序列進行比較和分析,優先分析插入/缺失突變、無義突變和錯義突變,結果可分為三類,包括已知突變、已知基因的新突變和新基因的突變。
[0032]通過本發明所述的方法獲得的HRDs致病基因為與視網膜疾病相關的剪切基因,分別為 SNRNP40、SNRNP27、PRPF4 和 EFTUD2。
[0033]有益效果
[0034]1.HRDs是常見的、嚴重的遺傳性致盲疾病,在我國發病率高達1/1000,是世界範圍內工作年齡人群中的第一大致盲眼病。挖掘HRDs的新致病突變和新致病基因有利於進一步探索HRDs的分子遺傳學病因,是充分利用我國的眼科遺傳病資源,造福遺傳性視網膜疾病患者的現實需要,是後基因組時代最重要的研究方向之一。本專利旨在探索HRDs的遺傳學病因,從而幫助了解發病機制、輔助臨床診斷、產前診斷和轉基因治療。
[0035]2.大量研究證實,剪切基因的功能異常能夠引起ADRP。因此,針對剪切基因與ADRP的相關研究顯得尤為必要。本專利的候選基因涵蓋了 6個已知致病的剪切基因及4個高度可疑的剪切基因,所有基因均是由 申請人:在多年從事遺傳學研究的基礎上查閱大量文獻所篩選出的,通過本發明方法的到進一步明確了這些基因與HRDs的關係。
[0036]3.一個基因可以對應多個不同的轉錄本,且不同轉錄本所編碼的RNA及蛋白有所不同。本專利中 申請人:根據長期從事遺傳學研究的經驗,篩選出最優轉錄本,並根據不同的轉錄本設計相應的探針,從而使篩查效益達到最高。
[0037]4.基因的外顯子區域發生改變,可直接引起胺基酸序列發生改變,從而導致蛋白的結構和功能發生改變。然而研究表明,外顯子和內含子交界區鹼基的改變可直接影響基因的剪切。本專利所設計的雜交探針覆蓋所有已知致病基因的外顯子區域及外顯子和內含子拼接處(外顯子上下遊至少各100個bp),使致病位點篩查面達到最廣。
[0038]5.在探針設計過程中,本專利對臨近的外顯子進行整合,旨在用一個探針檢測600bp以內的相鄰外顯子的綜合目標區域(即前個外顯子的上遊lOObp起至後一個外顯子的下遊lOObp止),以求通過一對探針完成兩對甚至多對外顯子區域的捕獲,使探針的篩查效率達到最高。與此同時,我們剔除了目標區域中所含有的高度重複序列以及在人類基因組中出現2-5倍的較低頻率的重複片段,避免捕獲其他同源基因,使篩查的假陽性率降到最低。
[0039]6.HRDs具有顯著的遺傳異質性,目前已知致病基因191個,已連鎖位點231個,且仍存在大量未知的致病基因。應用傳統技術研究顯然具有很大的局限性。深度測序技術是一種比較成熟的高通量測序技術,可一次性對海量基因(全基因組)進行平行測序,有傳統技術無法比擬的優勢。研究證實深度測序技術在孟德爾遺傳疾病的基因挖掘和致病基因篩查方面具有巨大優勢,將深度測序技術應用於我國遺傳性視網膜疾病研究是非常必要的、可行的。我們所申請的專利旨在建立高效的HRDs靶基因捕獲技術,以深度測序為手段,確認HRDs捕獲晶片效率,建立高效、可信的生物信息分析模型。
【專利附圖】
【附圖說明】
[0040]圖11980-2012年已鑑定的視網膜疾病相關基因及位點數目
[0041]圖2挖掘新致病基因的技術路線
[0042]圖3深度測序流程
[0043]圖4家系圖(紅框標註為已採血患者)
[0044]圖5先證者眼底照
[0045]圖6測序圖
[0046]圖7蛋白結構預測
【具體實施方式】
[0047]實施例1
[0048]實驗方法:
[0049]1.HRDs遺傳資源庫的建立。
[0050]1.1收集以下三類病人的臨床資料及血液標本:
[0051]1.1.13代或3代以上的常染色體顯性遺傳家系、常染色體隱性遺傳家系、X連鎖隱性遺傳家系,包括RP、Leber先天性黒朦、先天性靜止性夜盲、卵黃樣黃斑營養不良、Stargardt 病。
[0052]1.1.2收集各種HRDs的遺傳性小家系。
[0053]1.1.3收集無家族史的各種HRDs的散發病例。
[0054]1.2提取基因組DNA:
[0055]米用TIANamp 血液 DNA 抽提試劑盒(Tiangen Biotech C0.Ltd, Beijing, China),按照廠家提供的protocol從採集到的病人外周血中提取病人的基因組DNA。
[0056]2.挖掘HRDs新致病基因/已知致病基因的新突變(見圖2)。
[0057]2.1設計並定製HRDs相關基因捕犾晶片:
[0058]2.1.1候選基因的選擇:
[0059]該基因捕獲晶片涵蓋了全部179個由RetNet公布的視網膜疾病相關基因(其中包括6個已知致病剪切基因),及4個高度懷疑可能與視網膜疾病相關的剪切基因。其中,6個已知致病剪切基因分別為:PRPF3、PRPF6、PRPF8、PRPF31、RP9及SNRNP200(該基因由 申請人:率先發現並報導與HRDs疾病相關);4個高度可疑的剪切基因分別是:SNRNP40、SNRNP27、PRPF4及EFTUD2,其在Ensemble資料庫中的基因編號如下表所示。以上基因均是由 申請人:在多年從事遺傳學研究的基礎上查閱大量文獻所篩選出的。
[0060]
【權利要求】
1.一種以深度測序為平臺篩查HRDs致病突變所涉及的基因晶片雜交探針設計方法,其特徵在於包括:(1)候選基因的選擇:所述的基因捕獲晶片涵蓋了全部179個由RetNet公布的視網膜疾病相關基因,及高度懷疑可能與視網膜疾病相關的剪切基因;(2)轉錄本的選擇:針對不同基因選擇特定轉錄本,選擇原則是:首先考慮擁有CCDS編碼蛋白的轉錄本,若一個基因有多個轉錄本均編碼蛋白,則首選含胺基酸數最多的蛋白相對應的轉錄本,若多個轉錄本胺基酸含量相同,則進一步選擇含鹼基數最多的轉錄本;(3)雜交探針的設計:根據(2)中挑選出的不同轉錄本設計雜交探針,設計標準為:(a)探針覆蓋所有候選基因的外顯子區域及外顯子和內含子拼接處;(b)去除在人類基因組中出現的高度重複序列及出現2-5倍的較低頻率的重複片段;(c)對臨近外顯子的探針進行整合,整合標準為:當相鄰外顯子的綜合目標區域總和小於600bp時,即將其整合為一個探針,以求通過一對探針完成多對外顯子區域的捕獲;其中,所述的相鄰外顯子的綜合目標區域指前個外顯子的上遊lOObp起至後一個外顯子的下遊lOObp止;(d)當所設計探針序列小於250bp時,在其兩端各包含上下遊lOObp的內含子的基礎上,各繼續增加相同bp數的內含子,使探針大小達到250bp。
2.根據權利要求1所述的以深度測序為平臺篩查HRDs致病突變所涉及的基因晶片雜交探針設計方法,其特徵在於所述的高度懷疑可能與視網膜疾病相關的剪切基因優選SNRNP40、SNRNP27、PRPF4和EFTUD2,但不局限於上述優選的4個基因,也可以是其他的高度懷疑可能與視網膜疾病相關的剪切基因。
3.根據權利要求1所述的以深度測序為平臺篩查HRDs致病突變所涉及的基因晶片雜交探針設計方法,其特徵在於所述的外顯子和內含子拼接處是指外顯子上下遊至少各100個bp。
4.根據權利要求1所述的以深度測序為平臺篩查HRDs致病突變所涉及的基因晶片雜交探針設計方法,其特徵在於用於篩選HRDs致病基因SNRNP40的雜交探針序列共14條,序列如SEQ ID N0.rSEQ ID N0.14所示;用於篩選HRDs致病基因SNRNP27的雜交探針序列共7條,序列如SEQ ID N0.15~SEQ ID N0.21所示;用於篩選HRDs致病基因PRPF4的雜交探針序列共15條,序列如SEQ ID N0.22~SEQ ID N0.36所示;用於篩選HRDs致病基因EFTUD2的雜交探針序列共28條,序列如SEQ ID N0.37~SEQ ID N0.64所示;用於篩選HRDs致病基因PRPF3的雜交探針序列共16條,序列如SEQ ID N0.65~SEQ ID N0.80所示;用於篩選HRDs致病基因SNRNP200的雜交探針序列共43條,序列如SEQ ID N0.81~SEQ ID N0.123所示;用於篩選HRDs致病基因RP9的雜交探針序列共8條,序列如SEQ ID N0.124~SEQ ID N0.131所示;用於篩選HRDs致病基因PRPF8的雜交探針序列共44條,序列如SEQ ID N0.132~SEQID N0.175所示;用於篩選HRDs致病基因PRPF31的雜交探針序列共12條,序列如SEQ IDN0.176~SEQ ID N0.187所示;用於篩選HRDs致病基因PRPF6的雜交探針序列共21條,序列如 SEQ ID N0.188~SEQ ID N0.208 所示。
5.一種以深度測序為平臺篩查HRDs致病突變的方法,其特徵在於包括以下步驟:(1)建立HRDs遺傳資源庫,收集HRDs類病人的臨床資料及血液標本,提取基因組DNA;(2)按照上述雜交探針設計方法設計併合成HRDs致病基因晶片的雜交探針,並將其整合到基因晶片上;(3)利用製備的基因晶片捕獲目標區域並進行深度測序;(4)對測序結果進行優化的生物信息學分析,篩選出高度可疑的致病基因及致病突變;(5)針對新發現的剪切基因突變位點進行致病能力預測和功能研究。
6.根據權利要求5所述的以深度測序為平臺篩查HRDs致病突變的方法,其特徵在於步驟(2)所述的基因晶片為Roche Nimblegen公司生產的基因晶片。
7.根據權利要求5所述的以深度測序為平臺篩查HRDs致病突變的方法,其特徵在於步驟(3)所述的利用製備的基因晶片捕獲目標區域並進行深度測序是利用美國Illumina公司的H1-seq2000儀器完成。
8.根據權利要求7所述的以深度測序為平臺篩查HRDs致病突變的方法,其特徵在於利用製備的基因晶片捕獲目標區域並進行深度測序優選流程為:將基因組DNA片段化,在DNA末端標記「A」並與Illumina PE接頭-寡核苷酸混合物相連接;連接產物經PCR富集,獲得DNA文庫,並將DNA文庫與已知致病基因捕獲晶片雜交、洗脫、純化,獲得編碼序列;創建配對末端,在Illumina HiSeqTM2000平臺上對目標序列進行測序。
9.根據權利要求5所述的以深度測序為平臺篩查HRDs致病突變的方法,其特徵在於步驟(4)所述的對測序數據進行生物信息學分析包括:(1)採用Mosaik軟體處理Illumina原始測序數據,產生.bam類型文件,將.bam文件輸入GATK,利用GATK檢測單核苷酸變異體和小的插入或缺失,同時進行質量評估,便於下遊的生物信息學分析,最後產 生.vcf類型文件;(2)將患者的測序結果在包括dbSNP132(http://hgdownload.cse.ucsc.edu/goldenPath/hgl9/database/snpl32.txt.gz.),HapMap計劃(ftp://ftp.neb 1.nlm.nih.gov/hapmap),1OOOGenome Project (ftp://ftp.lOOOgenomes.eb1.ac.uk/voll/ftp),炎黃資料庫(http: //yh.genomics, org.cn/)以及 Exome Variant Server (http: //evs.gs.Washington.edu/EVS/)在內的個單木亥昔酸多態性(SNP)資料庫中篩查,濾過所有已知的SNP位點;(3)將患者的測序結果所對應的基因序列進行比較和分析,優先分析插入/缺失突變、無義突變和錯義突變,結果可分為三類,包括已知突變、已知基因的新突變和新基因的突變。
10.通過權利要求5所述的方法篩查得到的HRDs致病基因,其特徵在於所述的HRDs致病基因為與視網膜疾病相關的剪切基因,分別為SNRNP40、SNRNP27、PRPF4、EFTUD2。
【文檔編號】C12N15/10GK103667438SQ201310005252
【公開日】2014年3月26日 申請日期:2013年1月7日 優先權日:2013年1月7日
【發明者】趙晨, 陳雪, 趙堪興, 陳雪娟, 潘鑫源, 蔣超 申請人:趙晨