新四季網

一種水稻全基因組snp晶片及其應用的製作方法

2024-04-05 14:54:05

專利名稱:一種水稻全基因組snp晶片及其應用的製作方法
技術領域:
本發明涉及分子生物學、功能基因組學、生物信息學和基因組育種領域,更具體涉及一種水稻全基因組SNP晶片及製備方法,同時還涉及這種水稻SNP晶片的用途。
背景技術:
分子標記(Molecular marker)是指應用大分子化合物,蛋白質和DNA,在生物個體間的差異來標識遺傳變異的技術方法。由於蛋白質在個體間的差異較DNA小,而且難以檢測,因此,大部分分子標記是利用DNA水平上的遺傳多態性,也稱為DNA分子標記。分子標記技術(Molecular marker technology)主要是指檢測DNA變異的分子生物學技術。分子標記技術在作物研究中主要有以下4個方面的用途(I)遺傳連鎖圖的構建和基因定位;
(2)種質資源研究和品種鑑定;(3)生物性狀關聯分析和系統進化研究;(4)分子育種和作物遺傳改良。隨著分子生物學、基因組學和生物信息學的發展,分子標記技術也逐漸向低成本、高通量、高精度方向發展。傳統分子標記技術,如RFLP(Restriction Fragment LengthPolymorphism,限制性片段長度多態性)和SSR(Simple Sequence Repeat,簡單序列重複)技術在過去的30年裡發揮著重要作用。但是,傳統的分子標記技術存在許多局限性,如通量低、數量少、操作過程繁瑣,不能滿足功能基因組研究的需求。另外,現代分子育種技術對分子標記的要求越來越高,要求對基因進行準確操作,要求對全基因組遺傳背景進行精確控制,要求對特定性狀進行精準改良,迫切需要大規模高通量的分子標記技術。因此,開發和利用新型分子標記技術,對於功能基因組研究和作物遺傳改良具有重要的理論和實踐意義。SNP(Single Nucleotide Polymorphism,單核苷酸多態性),是指在基因組上單個核苷酸的變異形成的DNA序列上的多態性。理論上講,基因組DNA上任何一個核苷酸都有四種可能的鹼基組成形式,但大多數情況下只有兩種鹼基的變異,由一個鹼基發生轉換(Transitions)或顛換(Transversion)而變成另一個鹼基,通常轉換發生的頻率要高於顛換,所以SNP標記通常為雙等位基因(Vignal等,A review on SNP and other typesof molecular markers and their use in animal genetics. Genet Sel EvoI.2002,34:275-306.)。SNP標記數量多,在基因組上分布廣。基於SNP的新型高通量分子標記技術主要有兩大類一類是基於新一代測序技術的高通量分子標記技術;另一類是基於基 因晶片技術的分子標記技術。基於第二代測序技術開發分子標記的方法已經在水稻中得到了大量應用,如Huang等利用Illumina/Solexa測序技術對水稻中一個包含150個家系的RIL (Recombinant Inbred Line,重組自交系)群體進行了全基因組低覆蓋度測序獲得SNP標記,對RIL進行基因分型和構建高密度遺傳連鎖圖(Huang等,High-throughputgenotyping by whoIe-genome resequencing. Genome Res. 2009,19 :1068-1076) ;Xie 等發明了一種不依賴於親本的RIL群體基因分型方法,利用最簡約重組(Maximum Parsimonyof Recombination, MPR)原則從低覆蓋度測序RIL群體基因組序列信息中獲得SNP標記推測親本基因型,大大降低了測序成本(Xie等,Parent-independent genotyping forconstructing an ultrahigh-density linkage map based on population sequencing.Proc Natl Acad Sci USA. 2010,107 :10578-10583) ;Yu 等對基於第二代測序技術開發的SNP標記構建的遺傳連鎖圖與用傳統分子標記RFLP/SSR構建的連鎖圖進行了比較,闡述了基於測序的SNP構建遺傳連鎖圖在基因定位中的優勢(Yu等,Gains in QTL detectionusing an ultra-high density SNP map based on population sequencing relativeto traditional RFLP/SSR markers. PLoS One. 2011,6 :el7595)。最近,利用第二代測序技術對大量水稻品種進行全基因組測序開發SNP標記,用全基因組關聯分析(Genome-WideAssociation Study,GffAS)得到了許多與重要農藝性狀相關的位點(Huang等,Genome-wideassociation studies of 14 agronomic traits in rice landraces. Nat Genet. 2010,42 :961-967 ;Huang 等,Genome-wide association study of flowering time and grainyield traits in a worldwide collection of rice germplasm. Nat Genet. 2011)。但是,該方法也有一些不足,低覆蓋度的測序數據不能使標記覆蓋每個個體,具有測序隨機性,大多數個體SNP位點基因型是通過生物信息學計算得到的,不同個體之間測序的單個SNP基 因分型數據很難進行直接比較;而直接進行深度測序,即使是像水稻這樣的小基因組,目前測序成本仍然很高,難以滿足大規模育種需求。利用測序獲得SNP標記的另一種做法是對基因組DNA先經過酶切等方法處理減小基因組的複雜性構建複雜性降低的基因組DNA文庫,然後利用第二代測序技術進行深度測序,如RAD (Restriction site Associated DNA,酶切位點關聯 DNA)標籤測序(Baird 等,Rapid SNP discovery and genetic mappingusing sequenced RAD markers. PLoS One. 2008, 3 :e3376)。基於第二代測序技術的分子標記技術雖然通量高、靈活高效,但是短片段測序依賴於參照基因組序列、位於重複序列區域或者在參照基因組上沒有的區域很難檢測和分析,測序數據的處理、序列基因組定位和基因分型的計算等複雜過程對數據分析的要求較高,需要專業生物信息學人員才能完成。這些缺點一定程度上限制了該方法的廣泛使用,特別是在分子育種中大規模使用。另一種高通量分子標記技術是基於基因晶片的技術。基因晶片(gene chip)又稱DNA晶片(DNA chip)或DNA陣列(DNA array),指固定在玻片、矽片、尼龍膜等支持介質上的核酸分子探針所構成的點陣列(array)。基因晶片技術是20世紀80年代提出來的,在21世紀初進入飛速發展時期。基因晶片在研發初期主要應用於基因表達譜和調控網絡的研究(Birnbaum 等,Agene expression map of the Arabidopsis root.Science. 2003,302 :1956-1960 ;Wang 等,A dynamic gene expression atlas coveringthe entire life cycle of rice. Plant J.2010,61 :752-766 ;ffest 等,Global eQTLmapping reveals the complex genetic architecture of transcript-level variationin Arabidopsis. Genetics. 2007,175 :1441-1450 ;ffang 等,Aglobal analysis of QTLsfor expression variations in rice shoots at the early seedling stage. PlantJ. 2010,63 :1063-1074) 0現在更多地用於基因型分型和功能基因組學的研究。基於基因晶片的分子標記技術主要有SNP基因晶片(McNally等,Genomewide SNP variationreveals relationships among landraces and modern varieties of rice. Proc NatlAcad Sci USA. 2009,106 :12273-12278)、SFP (Single Feature Polymorphism,單片段多態性)(Borevitz 等,Large-scale identification of single-feature polymorphismsin complex genomes. Genome Res. 2003,13 :513-523)、DArT 技術(Diversity ArrayTechnology,多樣性晶片技術)(Jaccoud 等,Diversity arrays a solid statetechnology for sequence information independent genotyping. Nucleic AcidsRes. 2001,29 :E25)、RAD 技術(Miller 等,RAD marker microarrays enable rapidmapping of zebrafish mutations. Genome Biol. 2007,8 R105 ;Miller 等,Rapid andcost-effective polymorphism identification and genotyping using restrictionsite associated DNA(RAD)markers. Genome Res. 2007,17 :240-248.)等。最初開發的基因表達譜晶片就可以應用於檢測SFP,,用基因組DNA或RNA與基因表達譜晶片上的寡居核苷酸探針雜交即可,不需要專門開發標記基因晶片,但是該方法獲得的標記檢測結果假陽性高(Kumar 等,Single feature polymorphism discovery in rice. PLoS One. 2007,2 e284 ;Luo 等,SFP genotyping from affymetrix arrays is robust but largelydetects cis-acting expression regulators. Genetics. 2007,176 :789-800.)。DArT和RAD技術雖然不依賴於基因組序列,但是構建基因組文庫費時費力,並且只能達到中等密度和通量,很難滿足分子育種中大規模、高密度和高精度要求。RAD晶片技術後來發展為利用第二代測序技術開發SNP標記(Hohenlohe等,Population genomics ofparallel adaptation in threespine stickleback using sequenced RAD tags. PLoS Genet. 2010,6 e 1000862 ;Emerson 等,Resolving postglacial phylogeography usinghigh-throughput sequencing. Proc Natl Acad Sci USA. 2010,107 :16196-16200)。SNP晶片是基因晶片技術中最適合用於大規模育種的基因分型技術。目前,玉米中IllrnninaInfinium MaizeSNP50晶片用於種質資源鑑定和關聯分析(Ganal等,A large maize (Zeamays L.)SNP genotyping array !development and germplasm genotyping, and geneticmapping to compare with the B73 reference genome. PLoS One. 2011,6 e28334 ;Cook等,Genetic architecture of maize kernel composition in the nested associationmapping and inbred association panels. Plant physiology. 2011),水稻中 AffymetrixGeneChip Rice 44K基因晶片用於水稻種質資源遺傳多樣性分型和全基因組關聯分析(Zhao 等,Genome-wide association mapping reveals a rich genetic architectureof complex traits in Oryza sativa. Nat Commun. 2011,2 :467),而不同密度的 IlluminaGoldenGate SNP基因晶片已經應用於水稻分子育種(Zhao等,Genomic diversity andintrogression in 0. sativa reveal the impact of domestication and breeding onthe rice genome. PLoS One. 2010,5 el0780 ;Chen 等,Development and applicationof a set of breeder-friendly SNP markers for genetic analyses and molecularbreeding of rice(Oryza sativa L.). Theor Appl Genet. 2011,123 :869-879 ;Thomson等,High-throughput single nucleotide polymorphism genotyping for breedingapplications in rice using the BeadXpress platform. Mol Breeding. 2011 :1-12)。水稻中GoldenGate SNP晶片雖然很多,但是由於技術的限制,一張晶片上的標記數一般不超過3000,很難滿足育種中全基因組背景精確控制的需求,迫切需要高通量、重複性好、技術成熟的水稻育種晶片。 Illumina公司的Infinium SNP晶片技術是目前比較成熟和應用廣泛的全基因組SNP檢測平臺。它應用雷射共聚焦光纖微珠晶片技術和獨特的微珠陣列BeadAiray技術生產的晶片可以承載巨大的微珠——SNP數目。目前該公司生產的人類SNP晶片最多可容納110萬個SNP標記(http://www. illumina. com)。在晶片製作時,每個包含50個脫氧核苷酸的SNP探針序列與特定的微珠耦聯,微珠種類根據承載的SNP數目決定,從幾千至百萬以上,每類微珠由其特定的地址序列和SNP探針序列進行編碼和檢測。每種類型的微珠在每張晶片上平均重複30次,從而保證每個SNP被檢測的成功率和可重複性。IlluminaInfinium SNP晶片在人類、小鼠、玉米等物種的基因組變異研究中已得到廣泛應用,但在水稻中還沒有這類晶片的報導。為了使水稻功能基因組研究成果得到利用,不斷滿足水稻大規模商業化育種需求,申請人設計製作了這款SNP基因晶片。

發明內容
本發明的目的在於提供了一種水稻全基因組SNP晶片,命名為RICE6K水稻SNP晶片。該晶片上的SNP位點包括兩類,一類是從水稻品種測序數據中篩選出的多態性好並且具有代表性的SNP位點設計探針(本文稱為第一類探針),另一種是根據文獻報導的已克隆的水稻重要功能基因的與功能相關的SNP/INDEL位點設計的探針(本文稱為第二類探針)。其中,第一類探針包含從核心親本基因組序列及520個水稻品種重測序數據比較分析中篩選出的5,556個SNP位點,第二類探針包含與40個水稻功能基因的功能位點相關的80個SNP/INDEL位點,總共檢測5,636個SNP/INDEL位點。RICE6K水稻SNP晶片是採用IlluminaInfinium專利製造技術(美國專利,US Patent#US6, 429, 027)製作的光纖微珠晶片,每張晶片可同時檢測24個樣品。本發明的另一個目的是提供了一種水稻全基因組SNP晶片及製備方法,用於本發明的水稻SNP檢測晶片的特異性探針。本發明獲得的5,636個SNP/INDEL位點具有SEQIDNo. 0001 SEQ ID No. 5636所示的DNA序列和特徵。本發明所說的RICE6K水稻全基因組SNP晶片是指根據這5,636條序列利用Infinium專利設計製造技術(美國專利,USPatent#US 6,429,027)製作的晶片。本發明所說的RICE6K水稻全基因組SNP晶片上的SNP/INDEL位點是指SEQ ID No. 0001 SEQ ID No. 5636所示的序列中方括號([])中的核苷酸。本發明的再一個目的在於提供了一種水稻全基因組SNP晶片在檢測水稻DNA樣品(水稻種質資源分子標記指紋分析、秈稻和粳稻雜交群體基因型、育種材料的遺傳背景、水稻種子)中的應用,由於該晶片設計時傾向於挑選在秈稻和粳稻兩個亞種間具有多態性的SNP位點,所以優選檢測秈稻和粳稻兩個亞種間的雜交群體,同時還適用於檢測秈稻或粳稻亞種內的雜交群體。該晶片可以對水稻品種資源進行分子標記指紋分析、對雜交群體後代進行基因型鑑定、對具體材料的重要功能基因進行鑑定和表型預測。一種水稻全基因組SNP晶片的製備方法,包括以下步驟URICE6K SNP晶片上的第一類探針的獲得申請人:利用Illumina新一代測序技術對水稻核心親本材料進行了基因組測序。另外,2010年年底,Huang等公布了 520個水稻地方品種的基因組重測序數據(Huang等,Genome-wide association studies of 14 agronomic traits in rice landraces. NatGenet. 2010,42 :961-967)。申請人從公共資料庫下載了此數據,並以日本晴基因組(MSU第 6. I 版,http:"rice. plantbioloRY. msu. edu/)為參考序列,使用 MAQ 軟體(http://sourceforRe. net/pro iects/maq)將這些基因組序列數據進行匹配分析。探針設計的具體步驟如下(I)先按照下述標準鑑定得到了 4,236,029個高質量SNP 僅當測序序列在基因組上的匹配分數(mapping quality)至少為20時,該序列才用於鑑定SNP ; 計算基因組上每位點不同鹼基的測序質量分數(base quality)的總和,SNP位點必須只有兩種鹼基的測序質量分數總和大於100,並且這兩種鹼基每種都有至少10條測序序列支持;SNP位點的兩種鹼基每種至少有5條匹配分數超過40的序列支持,並且對應的鹼基測序質量都超過20 ;該SNP位點總的測序覆蓋度大於或等於50並小於或等於1000。(2)進一步使用更嚴格的標準獲得1,559,745個候選SNP 除去在至少5個品種中呈現雜合狀態的SNP位點;
除去測序覆蓋度小於80或大於800的SNP位點; 將所有品種分為秈稻和粳稻,並計算SNP的次要等位基因在這兩個亞種中的頻率,除去在所有品種、秈粳亞種中次要等位基因頻率均小於0. 2的SNP ; 除去仍然與左右兩側SNP距離均小於50bp的SNP。(3)由於探針長度為50bp,設計時需要選擇較保守序列,以免影響雜交。為了獲得合適的探針,申請人還做了以下分析 分別提取SNP左側和右側50bp序列(如果50bp內含有其他SNP,則不提取),使用 BLAT 程序(Kent 等,BLAT-the BLAST-Iike alignment tool. Genome Res. 2002,12 656-664.)比對基因組。如果兩側序列在基因組上均存在兩個或以上同一性(identity)超過85%的匹配,則去除該SNP ; 分別提取秈稻品種珍汕97和明恢63(見遺傳資源表I)對應的SNP左側和右側50bp序列,並與粳稻日本晴參照序列(MSU第6. I版,http://rice. plantbioloRY. msu.edu/)相比較,如果兩側序列均不一致,去除該SNP。通過上述分析,申請人獲得了 105,5959個符合探針設計要求的SNP,其中有35. 5%的SNP基本已在秈粳亞種中固定(秈粳亞種內佔主要地位的等位基因類型不同,並分別佔據90%以上的比例),42. I %的SNP在秈稻亞種中具有多態性,而16. 9%的SNP在粳稻亞種中具有多態性。申請人:進一步分析了 SNP之間的連鎖不平衡。將染色體分為每IOOkb—個區段,計算區段內所有SNP兩兩之間的r2(r為皮爾森相關係數,Pearson correlationcoefficient)。經過嘗試,申請人以r2 = 0. 64作為閾值,利用一種貪婪算法(Carlson等,Selecting a maximally informative set of single-nucleotide polymorphismsfor association analyses using linkage disequilibrium. Am J Hum Genet. 2004,74 106-120.),將相互間r2彡0. 64的SNP分為一組,一共獲得86,075組SNP。由於組內的SNP高度連鎖不平衡,只需要取一個代表性的SNP即可提供同組SNP的大部分信息。每組選擇最多 3 個 SNP,共獲得 187,284 個「標籤 SNP(tag SNP) 」。這些 SNP 由 Illumina 公司(http://www. illumina. com/)進行打分,去除Score分值小於0. 6的SNP,共獲得115,740可供定製晶片的SNP。由於該晶片設計主要針對秈稻和粳稻兩個亞種間雜交群體的鑑定及分型,因此申請人根據SNP在秈粳亞種中的分布情況,將染色體分為IOOkb —個區間,每個區間優先選擇秈粳兩個亞種間基本固定的SNP,如果不夠兩個,則選擇其他類型的SNP。由於Infinium技術的原因,A/T、G/C變化的SNP需要使用兩個探針檢測(Infinium I),而其他類型的SNP只需要一個探針(Infinium II)。為了在晶片上放置儘可能多的SNP,申請人定義了一套打分系統。根據經驗嘗試的結果,定義:總分S = MAF*100+ (非A/T、G/C變化的SNP) *3. 5 (其中MAF為Minor allele frequency,最小等位基因頻率)。去除總分S小於33的SNP,最後共獲得5,556個SNP位點。2、RICE6K SNP晶片上的第二類探針的獲得到2010年年底,水稻中已經成功克隆了 600多個基因,其中大量基因控制重要農藝性狀如產量、品質、抗生物和非生物脅迫、營養利用效率等,這些基因具有很大的育種潛力(Jiang Rice functional genomics research Progress and implications forcrop genetic improvement. Biotechnol Adv. 2011)。申請人希望能夠一次性對部分功能基因進行鑑定,於是設計了基因功能性SNP/INDEL探針。具體步驟如下
首先,查詢大量文獻從公共資料庫(http://www.ncbi.nlm.nih.gov)中獲得功能基因的不同等位基因形式,特別是在水稻品種間能夠反映基因功能的序列差異。如果不同等位基因之間的功能性差異為單鹼基的差異(SNP)並且單側有50個鹼基是相同的,那麼直接用這50個鹼基的保守序列作為候選探針位點;如果功能性位點是插入或缺失(INDEL)的差異,則使用兩種方法設計探針,一種是將INDEL轉換為SNP檢測,即根據INDEL單側保守序列設計探針,插入序列的第一個鹼基和缺失序列的下一個鹼基差異作為待測SNP(共顯性標記),另一種方法是探針直接設計在INDEL序列上,使得插入的等位基因能夠雜交檢測到信號,而缺失的等位基因雜交不上只有極低的檢測信號(顯性標記)。用這種方法共設計了 80個SNP/INDEL候選探針位點,可檢測40個水稻功能基因。以上兩種方法獲得的候選探針序列位點共5,636個,按照Illumina InfiniumiSelectHD要求設計探針製作晶片。兩種方法獲得的探針序列位點特徵沒有明顯差異,在晶片製作過程中不加以區分,晶片製成之後兩類探針的晶片檢測實驗操作也完全相同,視為同一套探針組。第一批晶片製作得到符合檢測要求的有效位點數5,102個,包含30多個基因的68個功能性位點。以下實驗檢測結果均指第一批晶片的檢測結果。一種RICE6K水稻SNP晶片在檢測水稻DNA樣品中的應用,包括下列步驟I.水稻基因組DNA提取根據檢測需要從水稻種子、葉片等組織抽提基因組DNA。其中水稻幼嫩葉片DNA抽提推薦採用Promega植物基因組抽提試劑盒按照標準流程抽提。2. DNA樣品質量檢測用質量分數為I %的瓊脂糖凝膠電泳檢測,用凝膠成像系統判斷電泳結果,保證基因組DNA完整性好,且該基因組DNA片段長度大於IOkb ;用紫外分光光度計測量基因組DNA中蛋白質和有機物質汙染水平,基因組DNAA260/280比值應在I. 8-2. 0之間,A260/230比值應在I. 8-2. 2之間。將DNA濃度稀釋到工作濃度50ng/ul。3.基因晶片檢測按照11 lumina Infinium基因晶片檢測標準流程操作(Infinium HD Assay Ultra Protocol Guide, http://www.illumina.com/)。晶片掃描使用Illumina HiScan晶片掃描儀。4.數據分析Illumina HiScan掃描結果用GenomeStudio軟體分析基因型。本發明與其他分子標記技術相比,具有以下優點和效果I)通量高。晶片上包含5000多個SNP位點,按照Illumina Inf inium檢測標準流程3天就可以得到一個樣本的分布於全基因組的約4500個位點的基因型,I張晶片可以同時檢測24個樣品,一個流程可以做8張晶片,即3天可以得到192個樣品共86. 4萬個數據點(4500*24*8);2)重複性好。不同批次檢測同一份樣品技術重複達到99. 9%以上,其重複性和準確性比同類晶片技術好;3)適用性廣。由於大多數SNP位點是來自於520多個水稻品種的測序數據,這些SNP位點具有廣泛的代表性。根據申請人對100多份水稻種質資源初步檢測結果,秈稻之間、粳稻之間、秈稻和粳稻之間能夠檢測到的多態性SNP位點平均分別約為800、1000和2600個,可廣泛適用於不同類型的水稻品種特別是秈稻和粳稻兩個亞種間雜交群體的基因分型;4)基因功能預測。晶片中包含已克隆的40個水稻重要功能基因的80個功能性SNP/INDEL位點,檢測這些位點就知道材料中這些基因的功能,根據基因功能推測其表型,普通分子標記技術僅針對個別基因開發功能性標記。


圖I.為一種基因功能性SNP/INDEL探針設計例子的示意圖。圖中顯示的是水稻中的「綠色革命基因」 Sd-I兩種等位基因一高杆基因型(Nipponbare,日本晴)與DGWG(Dee-geo_woo-gee,矮源低腳烏尖)類半矮杆基因型(Milyang 23,密陽23)的序列比對。相對於野生型Sd_l,DGWG類突變型sd_l從第一個外顯子中部起有383 bp的缺失,包括外顯子I和2的278 bp序列及105 bp的內含子(Monna等,Positional cloning of rice semidwarfing gene, sd_l rice 「green revolutiongene,,encodes a mutant enzyme involved in gibberellin synthesis. DNA Res. 2002,9 :11-17.)。針對這383bp的INDEL申請人設計了 3條探針探針IDOlgOOSDl. I和IDOlgOOSDl. 2為INDEL探針,探針序列位於INDEL內部,野生型基因組DNA與探針雜交分別延伸一個鹼基A和C而檢測到高信號,DGWG類突變型由於缺失探針對應的基因組序列不能與探針雜交而只有極低的信號;0s01g66100. I為SNP探針,探針序列位於INDEL邊界,邊界正好有個SNP的差異(T/A),可以作為普通SNP探針檢測,檢測該位點為T則為野生型,A為突變型。方框表示Sd-I基因起始密碼子ATG,箭頭表示探針序列所在位置和方向,三角型指不的喊基為探針與基因組DNA雜交後延伸的喊基。圖2.為一種Sd-I基因功能性SNP和INDEL探針檢測效果示意圖。水稻株高基因Sd-I功能性SNP/INDEL探針設計見圖I.該圖顯示71個水稻DNA樣品的檢測結果。SNP探針0s01g66100. I檢測結果表明,26個樣品為野生型(AA基因型),21個為DGWG (Dee-geo-woo-gee,矮源低腳烏尖)類(BB基因型),另外21個為雜合(AB基因型);INDEL探針IDOlgOOSDl. I檢測結果表明50個樣品的Sd-I基因至少有一個等位基因383 bp沒有缺失,與野生型一致,其他的樣品與DGWG類一致。圖3.為一種RICE6K水稻SNP晶片上所有探針位點在全基因組上分布示意圖。參照基因組為日本晴(水稻基因組MSU注釋第6. I版),染色體上的每一條短線表示I個SNP位點,三角形指示著絲粒的位置。圖4.為一種秈稻之間、粳稻之間以及秈稻和粳稻之間多態性SNP頻率分布示意圖。RICE6K SNP晶片檢測106份水稻種質資源(18個粳稻,88個秈稻)後兩兩之間的比較。4a為秈稻(indica)之間,4b為粳稻(japonica)之間,4c為秈稻和粳稻兩個亞種之間。圖5.為一種RICE6K水稻SNP晶片對秈稻和粳稻雜交得到的一個F2植株檢測的
結果示意圖。粳稻巴裡拉(Balilla)和秈稻南京11 (Nanjing 11)雜交F2植株全基因基因型。AA為巴裡拉純合基因型,BB為南京11純合基因型,AB為雜合基因型,圓點表示著絲粒位置。圖6.為一種回交育種定向改良材料的背景分析示意圖。
該圖顯示B親本供體基因導入A親本回交BC4F1的兩個家系基因型。染色體上的短線表示含有供體親本基因型,即為雜合基因型AB,圓點表示目標基因所在的位置,三角形指示著絲粒位置。圖7.為秈稻品種93-11與其衍生系安選6號之間差異位點分布示意圖。第8染色體上每條黑色短線代表一個差異SNP位置。三角形指示著絲粒位置。
具體實施例方式實施例I :RICE6K SNP晶片製備方法URICE6K SNP晶片上的第一類探針的獲得申請人:利用Illumina新一代測序技術對水稻核心親本材料進行了基因組測序。另外,2010年年底,Huang等公布了 520個水稻地方品種的基因組重測序數據(Huang等,Genome-wide association studies of 14 agronomic traits in rice landraces. NatGenet. 2010,42 :961-967)。申請人從公共資料庫下載了此數據,並以日本晴基因組(MSU第 6. I 版,http:"rice. plantbioloRY. msu. edu/)為參考序列,使用 MAQ 軟體(http://sourceforRe. net/pro iects/maq)將所有品種重測序數據匹配到參考序列。探針設計的具體步驟如下(2)先按照下述標準鑑定得到了 4,236,029個高質量SNP 僅當測序序列在基因組上的匹配分數(mapping quality)至少為20時,該序列才用於鑑定SNP ; 計算基因組上每位點不同鹼基的測序質量分數(base quality)的總和,SNP位點必須只有兩種鹼基的測序質量分數總和大於100,並且這兩種鹼基每種都有至少10條測序序列支持;SNP位點的兩種鹼基每種至少有5條匹配分數超過40的序列支持,並且對應的鹼基測序質量都超過20 ;該SNP位點總的測序覆蓋度大於或等於50並小於或等於1000。。(2)進一步使用更嚴格的標準獲得1,559,745個候選SNP 除去在至少5個品種中呈現雜合狀態的SNP位點; 除去測序覆蓋度小於80或大於800的SNP位點; 將所有品種分為秈稻和粳稻,並計算SNP的次要等位基因在這兩個亞種中的頻率,除去在所有品種、秈粳亞種中次要等位基因頻率均小於0. 2的SNP ; 除去通過上一步後仍然與左右兩側SNP距離均小於50bp的SNP。
(3)由於探針長度為50bp,設計時需要選擇較保守序列,以免影響雜交。為了獲得合適的探針,申請人還做了以下分析 分別提取SNP左側和右側50bp序列(如果50bp內含有其他SNP,則不提取),使用 BLAT 程序(Kent 等,BLAT-the BLAST-Iike alignment tool. Genome Res. 2002,12 656-664.)比對基因組。如果兩側序列在基因組上均存在兩個或以上同一性(identity)超過85%的匹配,則去除該SNP ; 分別提取秈稻品種珍汕97和明恢63 (見遺傳資源表I)對應的SNP左側和右側50 bp序列,並與粳稻日本晴參照序列(MSU第6. I版,http://rice, plantbiology. msu.edu/)相比較,如果兩側序列均不一致,去除該SNP。通過上述分析,申請人獲得了 105,5959個符合探針設計要求的SNP,其中有35. 5%的SNP基本已在秈粳亞種中固定(秈粳亞種內佔主要地位的等位基因類型不同,並佔據90 %以上的比例),42. I %的SNP在秈稻亞種中具有多態性,而16. 9 %的SNP在粳稻亞種中具有多態性。 申請人:進一步分析了 SNP之間的連鎖不平衡。將染色體分為每IOOkb—個區段,計算區段內所有SNP兩兩之間的r2(r為皮爾森相關係數,Pearson correlationcoefficient)。經過嘗試,申請人以r2 = 0. 64作為閾值,利用一種貪婪算法(Carlson等,Selecting a maximally informative set of single-nucleotide polymorphismsfor association analyses using linkage disequilibrium. Am J Hum Genet. 2004,74 106-120.),將相互間r2彡0. 64的SNP分為一組,一共獲得86,075組SNP。由於組內的SNP高度連鎖不平衡,只需要取一個代表性的SNP即可提供同組SNP的大部分信息。每組選擇最多 3個SNP,共獲得 187,284 個「標籤 SNP (tag SNP)」。這些 SNP 由 Illumina 公司(http://www. illumina. com/)進行打分,去除Score分值小於0. 6的SNP,共獲得115,740可供定製晶片的SNP。由於該晶片設計的主要針對秈稻和粳稻兩個亞種間雜交群體的鑑定及分型,因此申請人根據SNP在秈粳亞種中的分布情況,將染色體分為IOOkb —個區間,每個區間優先選擇兩個秈粳亞種間基本固定的SNP,如果不夠兩個,貝U選擇其他類型的SNP。由於Infinium技術的原因,A/T、G/C變化的SNP需要使用兩個探針檢測(Infinium I),而其他類型的SNP只需要一個探針(Infinium II)。為了在晶片上放置儘可能多的SNP,申請人定義了一套打分系統。根據經驗嘗試的結果,定義:總分S = MAF*100+ (非A/T、G/C變化的SNP) *3. 5 (其中MAF為Minor allele frequency,最小等位基因頻率)。去除總分S小於33的SNP,最後共獲得5,556個SNP位點。2、RICE6K SNP晶片上的第二類探針的獲得到2010年年底,水稻中已經成功克隆了 600多個基因,其中大量基因控制重要農藝性狀如產量、品質、抗生物和非生物脅迫、營養利用效率等,這些基因具有很大的育種潛力(Jiang Rice functional genomics research Progress and implications forcrop genetic improvement. Biotechnol Adv. 2011)。申請人希望能夠一次性對部分功能基因進行鑑定,於是設計了基因功能性SNP/INDEL探針。具體步驟如下首先,查詢大量文獻從公共資料庫(http://www.ncbi.nlm.nih.gov)中獲得功能基因的不同等位基因形式,特別是在水稻品種間能夠反映基因功能的序列差異。如果不同等位基因之間的功能性差異為單鹼基的差異(SNP)並且單側有50個鹼基是相同的,那麼直接用這50個鹼基的保守序列作為候選探針位點;如果功能性位點是插入或缺失(INDEL)的差異,則使用兩種方法設計探針,一種是將INDEL轉換為SNP檢測,即根據INDEL單側保守序列設計探針,插入序列的第一個鹼基和缺失序列的下一個鹼基差異作為待測SNP(共顯性標記),另一種方法是探針直接設計在INDEL序列上,使得插入的等位基因能夠雜交檢測到信號,而缺失的等位基因雜交不上只有極低的檢測信號(顯性標記)(圖I和圖2)。用這種方法共設計了 80個SNP/INDEL候選探針位點,可檢測40個水稻功能基因。以上兩種方法獲得的候選探針序列位點共5,636個,按照Illumina InfiniumiSelectHD要求設計探針製作晶片。第一批晶片製作得到符合檢測要求的有效SNP/INDEL位點為5,102個,這些位點在全基因組上的分布如圖3所示。實施例2 RICE6K水稻SNP晶片在檢測水稻DNA樣品中的應用
I.水稻基因組DNA提取根據檢測需要從水稻種子、葉片等組織抽提基因組DNA。其中水稻幼嫩葉片DNA抽提採用Promega植物基因組抽提試劑盒按照標準流程抽提(Wizard Magnetic 96 DNA Plant System Kit,貨號 FF3760 或 FF3761,美國 Promega 公司)。2. DNA樣品質量檢測用質量分數為I % (W/W)的瓊脂糖凝膠電泳檢測,用凝膠成像系統(Gel Doc XR System,美國Bio-Rad公司)判斷電泳結果,保證基因組DNA完整性好,且該基因組DNA片段長度大於IOkb ;用紫外分光光度計(NanoDrop2000,美國ThermoScientific公司)測量基因組DNA中蛋白質和有機物質汙染水平,基因組DNA A260/280比值應在I. 8-2. 0之間,A260/230比值應在I. 8-2. 2之間。將DNA濃度稀釋到工作濃度50ng/
ul O3.基因晶片檢測按照11 lumina Inf inium基因晶片檢測標準流程操作(Infinium HD Assay Ultra Protocol Guide, http://www.illumina.com/)。晶片掃描使用 Illumina HiScan 晶片掃描儀(HiScan,美國 Illumina 公司)。4.數據分析Illumina HiScan 掃描結果用 GenomeStudio 軟體(http://www.illumina. com/)分析基因型實施例3 RICE6K水稻SNP晶片在水稻種質資源分子標記指紋分析中的應用利用RICE6K SNP晶片,申請人對106份微核心水稻種質資源進行分子標記指紋分析。RICE6K晶片檢測這106份水稻品種基因組DNA,在5,102個有效檢測位點中,有636個位點在大於3個品種中檢測基因型為雜合位點,申請人認為這些位點的檢測能力較差,剩餘4466個高質量位點用於106個品種的基因分型。根據基因分型結果對這106份水稻品種進行聚類分析,結果發現全部18份粳稻聚為一類,其他88份秈稻聚為另一類。申請人分析了這批RICE6K SNP晶片能夠檢測到的任意兩個品種之間多態性SNP位點數。結果表明,粳稻與粳稻之間,秈稻與秈稻之間,秈稻與粳稻兩亞種之間多態性SNP比例平均分別為18. 2%、23. 4%和 58. 9% (圖 4),對應位點數為 813、1046 和 2630 個。該結果表明,RICE6K SNP晶片可優先適用於檢測秈稻與粳稻兩亞種之間雜交群體基因分型,也可用於粳稻與粳稻之間、秈稻與秈稻之間雜交群體,具有廣泛的適應性。實施例4 RICE6K水稻SNP晶片在檢測秈稻和粳稻雜交F2群體基因型中的應用粳稻巴裡拉(Balilla)和秈稻南京11 (Nanjing 11)(見遺傳資源表2)雜交Fl植株上收穫的種子在室內發芽,取發芽一周的幼嫩葉片抽提基因組DNA進行基因晶片實驗,同時以親本巴裡拉、南京11以及雜種Fl為對照(親本一次重複,雜種兩次重複)。經過分析,親本巴裡拉和南京11之間有差異,並且在雙親中判斷為純合基因型、在雜種Fl兩次重複均判斷為雜合基因型的位點共有3,775個,佔有效位點數的74.0% (3775/5102),用這些位點對F2群體的67個單株進行基因分型(圖5)。兩親本巴裡拉和南京11具有明顯的表型差異。巴裡拉是典型的粳稻品種,半矮杆、植株緊湊、穗子小、籽粒卵圓形,而南京11是典型的秈稻品種,高杆、植株披散、穗子大、籽粒橢圓型。利用RICE6K SNP晶片檢測,兩親本相關功能基因基因型結果與表型相符(表I),並且在F2群體中有分離。例如水稻Sd-I基因(MSU L0C_0s01g66100)SNP探針0s01g66100. I檢測71個單株(2親本+2雜種F1+67雜種F2)有26個為巴裡拉純合基因型(AA),21個為南京11純合基因型(BB),其餘24個為雜合基因型(AB)(圖2a) ;INDEL探針IDOlgOOSDl. I檢測結果有50個單株為插入基因型(巴裡拉純合基因型和雜合基因型),其餘21個為缺失基因型(南京11純合基因型)(圖2b),兩者結果一致。
該結果表明,RICE6K SNP晶片對秈稻和粳稻兩個亞種間的雜交群體具有很好的基因分型能力,並且對重要功能基因型具有很好的檢測能力。表I.巴裡拉和南京11部分功能基因檢測結果
某K型
基因 MSU位點探針 m田護土口土古丄」_巴裡拉南足11
Sd-IL0c_0s01g66100IDOlgOOSDl. I半矮杆高杆
IDOlgOOSDl.2半矮杆高杆
0s01g66100.1半矮杆高杆
TAClL0c_0s09g359800s09g35980.1植株緊湊植株披散
GnlaLOC—OsOlglOl 10OsOlglOl 10.1小穗大穗
OsOlglOl 10.2小穗大穗
SaFL0c_0s01g396700s01g39670.1粳型秈型
S5L0c_0s06gll0100s06gll010.1粳型秈型
0s06gl 1010.2 粳型秈型GW2 L0c_0s02gl4720 0s02gl4720.2 寬粒窄粒qSW5/GW5 GeneBank AB433345 Os05g00GW5.1 寬粒窄粒_ID05g00GW5.3 寬粒_窄粒實施例5 RICE6K水稻SNP晶片在檢測水稻育種材料的遺傳背景中的應用為了檢驗RICE6K水稻SNP晶片在育種中的應用效果,申請人對回交育種中間材料進行了遺傳背景分析。供體親本B (秈稻)兩個優異基因導入受體親本A(粳稻)以改良A親本的缺陷。經過4輪迴交得到BC4F1,回交過程中用傳統分子標記(SSR)進行目標基因前景選擇,以保證優異基因在回交過程中沒有丟失。用RICE6K SNP晶片檢測了經過表型篩選和SSR分子標記輔助選擇得到的BC4F1材料29份,具有代表性的兩個家系基因型結果如圖6所示。圖6a所示的家系除了目標基因區段以外,其他背景基因型都與受體親本一致,而圖6b所示的家系除目標基因區段以外,在第4、8和9染色體有三個區段帶有供體親本片段。為了儘量保持A親本的優良特性,優先選擇圖6a所示的家系進行後續育種工作。該結果表明,RICE6K水稻SNP晶片可以成功分析秈稻和粳稻兩個亞種間回交育種群體的遺傳背景,並指導育種。用傳統SSR等分子標記分析遺傳背景不僅費時費力,並且由於數量有限不能覆蓋整個基因組。RICE6K水稻SNP晶片可以準確、快速、高效地進行全基因組遺傳背景選擇,優先用於秈稻和粳稻兩個亞種間雜交群體,即使是用於亞種內的雜交群體,其標記密度也遠高於傳統SSR等分子標記。實施例6 RICE6K水稻SNP晶片在檢測水稻種子真實性中的應用 目前我國三系雜交水稻種子真實性檢測僅使用24個SSR位點判斷是否是相同品種(中華人民共和國國家標準GB/T20396-2006)。申請人使用RICE6K水稻SNP晶片檢測了兩份雜交水稻種子真實性,第I份待測樣品與標準樣品(特優009)(見遺傳資源表3)共檢測到4,968個位點,其中僅I個位點基因型不一致,一致性為99. 98 %,第2份待測種子與標準樣品(嶽優9264)(見遺傳資源表4)共檢測到4,876個位點,全部位點基因一致,一致性為100%。第I份樣品經國標規定的24個SSR標記檢測基因型完全一致。申請人:還用RICE6K水稻SNP晶片檢測了 2份常規稻,第I份待測樣品與標準樣品(玉香油佔)(見遺傳資源表5)共檢測到4,794個位點,其中僅2個位點基因型不一致,一致性為99. 96%,第2份待測樣品與標準樣品(R1303)(見遺傳資源表5)共檢測到4,696個位點,其中有4個位點基因型不一致,一致性為99. 91%。申請人:用RICE6K水稻SNP晶片檢測了 5份被稱為93_11的待測樣品(見遺傳資源表6,7),以I份93-11的標準樣品(見遺傳資源表2)和93-11衍生系安選6號標準樣品(見遺傳資源表7)為對照。結果發現其中的2份待測樣品與93-11標準樣品基因型一致性達到99. 9%以上,4,900多個位點中僅有1-4個位點基因型不一致;而與安選6號標準樣品基因型一致性為99. 3%,有約70個SNP位點有差異。於是,申請者比較了 93-11和安選6號之間的差異,結果發現它們之間約70個差異位點都集中在第8染色體的一個區間(圖7)。從以上檢測結果可以看出,RICE6K水稻SNP晶片適合於進行三系雜交水稻和常規稻的真實性檢測,其結果比SSR分子標記更具有說服力。同時也反映出RICE6K水稻SNP晶片檢測同樣的樣品技術重複可達到99. 9%以上。序列表
權利要求
1.一種水稻全基因組SNP晶片,其特徵在於所說的SNP晶片是指根據SEQ No. OOfSEQID No. 5636所示序列利用Infinium專利設計製造技術製作的晶片。
2.權利要求I所述的一種水稻全基因組SNP晶片在水稻種質資源分子標記指紋分析中的應用。
3.權利要求I所述的一種水稻全基因組SNP晶片在檢測水稻雜交群體基因型中的應用。
4.權利要求I所述的一種水稻全基因組SNP晶片在檢測水稻育種材料的遺傳背景中的應用。
5.權利要求I所述的一種水稻全基因組SNP晶片在檢測水稻種子中的應用。
全文摘要
本發明公開了一種水稻全基因組SNP晶片及其應用,步驟(1)晶片上第一類探針的獲得通過測序獲得親本的基因組序列,結合公共資料庫中的其他水稻品種重測序數據,以日本晴基因組為參考序列,使用MAQ軟體將所有測序數據進行匹配、分析,最後從中篩選出SNP標記;(2)晶片上第二類探針的獲得從公共資料庫獲得水稻功能基因,尋找反映基因功能的序列差異,據此設計出SNP/INDEL探針;(3)利用Infinium晶片製造技術製作SNP晶片。(4)測試晶片的準確性和應用效率。本晶片可應用於水稻種質資源分子標記指紋分析、種子真實性檢測、雜交後代基因分型,以及其他相關研究中。
文檔編號C40B40/06GK102747138SQ20121005577
公開日2012年10月24日 申請日期2012年3月5日 優先權日2012年3月5日
發明者周發鬆, 喻輝輝, 張啟發, 李菁, 謝為博 申請人:中國種子集團有限公司

同类文章

一種新型多功能組合攝影箱的製作方法

一種新型多功能組合攝影箱的製作方法【專利摘要】本實用新型公開了一種新型多功能組合攝影箱,包括敞開式箱體和前攝影蓋,在箱體頂部設有移動式光源盒,在箱體底部設有LED脫影板,LED脫影板放置在底板上;移動式光源盒包括上蓋,上蓋內設有光源,上蓋部設有磨沙透光片,磨沙透光片將光源封閉在上蓋內;所述LED脫影

壓縮模式圖樣重疊檢測方法與裝置與流程

本發明涉及通信領域,特別涉及一種壓縮模式圖樣重疊檢測方法與裝置。背景技術:在寬帶碼分多址(WCDMA,WidebandCodeDivisionMultipleAccess)系統頻分復用(FDD,FrequencyDivisionDuplex)模式下,為了進行異頻硬切換、FDD到時分復用(TDD,Ti

個性化檯曆的製作方法

專利名稱::個性化檯曆的製作方法技術領域::本實用新型涉及一種檯曆,尤其涉及一種既顯示月曆、又能插入照片的個性化檯曆,屬於生活文化藝術用品領域。背景技術::公知的立式檯曆每頁皆由月曆和畫面兩部分構成,這兩部分都是事先印刷好,固定而不能更換的。畫面或為風景,或為模特、明星。功能單一局限性較大。特別是畫

一種實現縮放的視頻解碼方法

專利名稱:一種實現縮放的視頻解碼方法技術領域:本發明涉及視頻信號處理領域,特別是一種實現縮放的視頻解碼方法。背景技術: Mpeg標準是由運動圖像專家組(Moving Picture Expert Group,MPEG)開發的用於視頻和音頻壓縮的一系列演進的標準。按照Mpeg標準,視頻圖像壓縮編碼後包

基於加熱模壓的纖維增強PBT複合材料成型工藝的製作方法

本發明涉及一種基於加熱模壓的纖維增強pbt複合材料成型工藝。背景技術:熱塑性複合材料與傳統熱固性複合材料相比其具有較好的韌性和抗衝擊性能,此外其還具有可回收利用等優點。熱塑性塑料在液態時流動能力差,使得其與纖維結合浸潤困難。環狀對苯二甲酸丁二醇酯(cbt)是一種環狀預聚物,該材料力學性能差不適合做纖

一種pe滾塑儲槽的製作方法

專利名稱:一種pe滾塑儲槽的製作方法技術領域:一種PE滾塑儲槽一、 技術領域 本實用新型涉及一種PE滾塑儲槽,主要用於化工、染料、醫藥、農藥、冶金、稀土、機械、電子、電力、環保、紡織、釀造、釀造、食品、給水、排水等行業儲存液體使用。二、 背景技術 目前,化工液體耐腐蝕貯運設備,普遍使用傳統的玻璃鋼容

釘的製作方法

專利名稱:釘的製作方法技術領域:本實用新型涉及一種釘,尤其涉及一種可提供方便拔除的鐵(鋼)釘。背景技術:考慮到廢木材回收後再加工利用作業的方便性與安全性,根據環保規定,廢木材的回收是必須將釘於廢木材上的鐵(鋼)釘拔除。如圖1、圖2所示,目前用以釘入木材的鐵(鋼)釘10主要是在一釘體11的一端形成一尖

直流氧噴裝置的製作方法

專利名稱:直流氧噴裝置的製作方法技術領域:本實用新型涉及ー種醫療器械,具體地說是ー種直流氧噴裝置。背景技術:臨床上的放療過程極易造成患者的局部皮膚損傷和炎症,被稱為「放射性皮炎」。目前對於放射性皮炎的主要治療措施是塗抹藥膏,而放射性皮炎患者多伴有局部疼痛,對於止痛,多是通過ロ服或靜脈注射進行止痛治療

新型熱網閥門操作手輪的製作方法

專利名稱:新型熱網閥門操作手輪的製作方法技術領域:新型熱網閥門操作手輪技術領域:本實用新型涉及一種新型熱網閥門操作手輪,屬於機械領域。背景技術::閥門作為流體控制裝置應用廣泛,手輪傳動的閥門使用比例佔90%以上。國家標準中提及手輪所起作用為傳動功能,不作為閥門的運輸、起吊裝置,不承受軸向力。現有閥門

用來自動讀取管狀容器所載識別碼的裝置的製作方法

專利名稱:用來自動讀取管狀容器所載識別碼的裝置的製作方法背景技術:1-本發明所屬領域本發明涉及一種用來自動讀取管狀容器所載識別碼的裝置,其中的管狀容器被放在循環於配送鏈上的文檔匣或託架裝置中。本發明特別適用於,然而並非僅僅專用於,對引入自動分析系統的血液樣本試管之類的自動識別。本發明還涉及專為實現讀