序列指導的分子育種方法
2023-06-12 03:38:46 2
專利名稱::序列指導的分子育種方法
技術領域:
:本發明屬於植物育種領域。更具體而言,本發明涉及高通量測序技術在與種質改良有關的活動中的應用。
背景技術:
:植物育種的主要目的是選擇一對最佳的親本進行雜交,然後選擇一個或多個該雜交產生的優良後代。在雜種作物中,第三個目的是鑑定測交系(tester)以形成高表現的雜種種子。傳統的植物育種依賴於植物或品系的目視觀察和表現數據,以作出滿足上述目的之一的選擇。最近幾年,已經證明分子育種在改進育種方法和提高遺傳獲得率方面大有希望。在分子育種中,分子標記為親本、後代或測交系的選擇提供基礎;該方法也可以與基於表型的選擇結合使用。與僅基於表型數據獲得的結果相比,在育種計劃中包括遺傳標記加速了有價值的性狀的鑑定和向種質庫中的積累。在此,「種質」包括育種種質、育種群體、優良近交系的集合、隨機雜交個體的群體和雙親雜交體。為使分子育種有效,標記基因型的差異必須與一個或多個表型或表現性狀可遺傳地相關聯。這些關聯是通過將標記基因型與一種或多種性狀分離的品系或群體進行關聯而建立的。遺傳標記等位基因(「等位基因」是一個基因座處的替代序列)用來鑑定在一個或多個基因座處含有希望的基因型並且預期將該希望的基因型與一種或多種性狀的希望的表型一起轉移給其後代的植物。與表型高度相關的標記推定與該性狀遺傳連鎖,因此,該標記然後可以代替評價該性狀本身,用作選擇決定的基礎。不相關的標記將獨立於性狀遺傳,並且對於選擇無用,但是在比較品種和品系之間的相似性和/或測量它們的遺傳距離方面可能具有價值。理想地,該標記將代表負責性狀的實際基因組變異,因此總是與性狀分離,儘管相關性可能被諸如環境相互作用或上位效應等現象所掩蔽。最初用於分子育種的標記平臺不需要預先知道相關序列。這些標記基於限制片段長度多態性(RFLP)。隨機或定向DNA探針在Southern雜交方案中使用,用來鑑定其大小隨一對限制酶識別位點的位置和之間的距離而不同的靶片段。大小上的這些差異可能與測試群體中的性狀有關。DNA探針然後用作能夠檢測相關限制片段長度多態性的標記,隨後又可用於預測相關的性狀。曾經使用了其它類型的標記,它們需要預先知道相關序列,並且包括但不限於使用擴增片段長度多態性(AFLP)或通用PCR引物(即RICE引物)的指紋分析。最近幾年,已經基於相關序列的知識開發了標記。例如,微衛星或簡單序列重複(SSR)標記依靠PCR和凝膠電泳來闡明DNA重複序列長度的變化。如果目標重複片段與相關性狀遺傳連鎖,這些標記所揭示的重複片段長度的差異可能與該性狀有關。但是,傳統的標記平臺不是最佳的,因為它們不適合自動化或高通量技術。另外,傳統的標記平臺易獲得假的標記_性狀相關性,其中兩個品系之間基因型的同一性可能不反映共同的親本,而是反映趨同序列(convergentsequence),對於在多代中追蹤特定標記等位基因來說,這是一個問題。可用作傳統標記的其它類型的變異有單核苷酸多態性(SNP)。它們是在兩個品系之間不同並且與遺傳連鎖的性狀分離的單鹼基變化。SNP可以通過多種商業上可獲得的標記技術來檢測。基於SNP的標記受到歡迎,因為其檢測容易且精確、與信息系統兼容並且成本較低。但是,SNP標記仍然是查詢相關序列的間接工具,並且SNP標記只限於檢測兩個等位基因,而不是可以在任意給定核苷酸位置處發現的四個可能的核苷酸。因此,本領域需要為了推動植物育種活動從至少一個植物基因組快速且精確地確定直接序列信息的方法,所述植物育種活動例如是品系開發、種質多樣性分析、罕見等位基因挖掘、純度測定、質量保證、特定基因組區域的滲入、基因組區域的堆積(stacking)、品系表現的預測以及雜種表現的預測。
發明內容本發明描述了利用高通量測序和分子育種方法以便能夠在分子植物育種中使用直接測序信息的新方法。本發明還包括在序列測定之前選擇性靶向特定基因座和DNA標籤樣品的手段。結合起來,本發明的方法能夠為植物育種者提供用於親本選擇、後代選擇、選擇測交系組合、開發系譜、樣品指紋分析、單元型多樣性篩選、保證質量、評估種質多樣性、檢測育種進展、提供品種或品系說明和建立序列與性狀和表現數據的關聯資料庫的更好的工具。這些資料庫為計算一種或多種性狀的核酸效應估計值提供了基礎,其中可以從頭進行關聯或者通過梳理(leveraging)歷史核酸序列-性狀相關數據進行關聯。本發明提供序列指導的選擇(SDS)、序列指導的育種(SDB)和序列指導的指紋分析(SDF)的方法,及其在進行親本選擇、後代選擇、測交系組合、等位基因變體滲入和至少兩份種質、指紋、系譜之間至少一個變體的定向選擇中以及在建立單元型和表型信息資料庫中的新應用,該信息可用於計算核酸序列效應估計值,並最終可用於計算育種值。這種先驗信息有助於為序列指導的預測育種(SDPB)所作的決定。在本發明中,育種選擇在序列基礎上直接進行,而不是在標記基礎上間接進行,其中第一植物與第二植物雜交,該第二植物含有與第一植物的一種或多種序列不同的至少一種序列;通過檢測第一植物的序列或序列組選擇至少一個後代植物,其中該後代植物在其基因組中包含第一植物的一種或多種目標序列和第二植物的至少一種目標序列;並且在與種質改良有關的活動中使用該後代植物,與種質改良有關的活動在此被定義為包括使用植物進行品系和品種開發、雜種開發、轉基因事件選擇、進行育種雜交、通過自體受精測試和開發植物、純化品系或亞系、使用植物或其部分進行轉化、使用植物或其部分作為表達構建體的候選物、以及使用植物或其部分進行誘變。本發明包括植物育種方法,該植物例如是玉米(Zeamays)、大豆(Glycinemax)、棉花(陸地棉(Gossypiumhirsutum))、花生(Arachishypogaea)、大麥(Hordeumvulgare);(Avenasativa);^(Dactylisglomerata);/JCfS(Oryzasativa,^括秈稻(indica)和粳稻(japonica)變種);高粱(雙色高粱(Sorghumbicolor));甘蔗7(甘蔗屬的種(Saccharumsp));高羊茅(Festucaarundinacea);草皮草物種(例如物種四季青(Agrostisstolonifera)、草地早熟禾(Poapratensis)、鈍葉草(Stenotaphrumsecundatum));小麥(Triticumaestivum)、苜猜(Medicagosativa)、芸苔屬的成員、花蓮甘藍、捲心菜、胡蘿蔔、花椰菜、大白菜、黃瓜、幹豆、茄子、茴香、青刀豆、葫蘆、韭菜、萵苣、甜瓜、秋葵、洋蔥、豌豆、胡椒、南瓜、蘿蔔、菠菜、筍瓜(squash)、甜玉米、蕃茄、西瓜、觀賞植物以及其它水果、蔬菜、塊莖、油籽和塊根農作物,其中油籽作物包括大豆、芸苔(Canola)、油菜、油棕、向日葵、橄欖、玉米、棉籽、花生、亞麻籽、紅花和椰子,它們具有增強的性狀,包括至少一種目的序列,進一步定義為賦予優選的性質,該性質選自除草劑耐受性、抗病性、昆蟲或害蟲抗性、改變的脂肪酸、蛋白質或碳水化合物代謝、增加的穀物產量、增加的油、增加的營養成分含量、提高的生長速度、增強的應激耐受性、優選的成熟度、增強的感官特性、改變的形態特徵、其它農學性狀、用於工業應用的性狀、或對消費者有提高的吸引力的性狀,其中所述性狀可以是非轉基因的或轉基因的。在一個實施方案中,本發明涉及一種植物育種方法。該方法包括確定育種群體中至少一個或多個植物的基因組內的多個核酸的序列;將每個核酸序列與一個數值關聯起來,其中該數值與一個或多個表型性狀相關;和基於這種關聯為一個或多個植物作出植物育種決定。在另一個實施方案中,本發明涉及一種植物育種方法。該方法包括提供包括一個或多個植物的育種群體,其中對該群體中每個植物的至少一個基因座處的至少一個核酸進行測序;利用歷史標記_表型性狀相關性確定基因座處核酸序列的核酸序列效應估計值;和基於對任意給定表型性狀所確定的核酸序列效應估計值對核酸序列進行排序。然後利用排序作出植物育種決定。在另外一個實施方案中,本發明涉及一種植物育種方法。該方法包括建立定義育種群體基因組內的多個基因座的指紋圖譜;將已知圖譜位置的QTL等位基因與作圖群體中的表型性狀相關聯;和測定該多個基因座內QTL等位基因和至少一個核酸序列的存在,以預測作圖群體以外的群體中表型性狀的表達。在另外一個實施方案中,本發明涉及一種標記輔助的育種方法。該方法包括提供包括至少兩個植物的育種群體,以及將至少一個表型性狀與該植物的基因組的基因座相關聯,條件是該基因座被至少一個核酸序列限定。然後測定該群體中該基因座的至少一個核酸序列的存在,以預測該育種群體的後代植物中至少一個表型性狀的表達。在另外一個實施方案中,本發明涉及一種選擇用於育種計劃的育種群體的方法。該方法包括提供至少兩個不同的育種群體;為每個育種群體建立可達10釐摩的至少兩個基因座的育種值資料庫;對每個育種群體的等位基因的育種值進行排序;以及選擇具有較高綜合育種值的育種群體。下面在詳述中更具體地描述了應用性的進一步的方面。應當理解,說明書和具體實施例只是用於說明目的,而非意在限制本公開內容的範圍。圖1是說明高通量核酸測序的分子方法的一般流程圖。圖2說明一種降低選擇性消化產生的模板核酸的複雜性的方法。8圖3說明一種轉錄組複雜性定向降低方法。圖4說明一種通過擴增至少一個目標基因組區域定向降低複雜性的方法。圖5說明一種通過等位基因特異性延伸/連接定向降低複雜性的方法,包括樣品標記。圖6說明一種使用通過連接附著到模板核酸上的DNA標籤複合(multiplexing)樣品的方法。圖7說明一種使用通過PCR附著到模板核酸上的DNA標籤複合樣品的方法。圖8顯示高通量核酸測序的工作流程。圖9說明一種為SNP和indel的序列指導的選擇而製備樣品的方法。圖10是對於如實施例1所述對Fad3bSNP使用高通量測序進行的序列指導的選擇,基因型分型結果的散布圖。圖11是對於如實施例1所述對Fad3cindel使用高通量測序進行的序列指導的選擇,基因型分型結果的散布圖。圖12顯示如實施例4所述利用等位基因特異性延伸/連接添加樣品DNA標籤的策略。圖13顯示如實施例4所述對96個大豆品種中的1536個SNP使用高通量測序技術進行指紋分析的成功率。發明詳述此處提供的定義和方法定義了本發明,並對本領域技術人員實施本發明起到指導作用。除非特別說明,根據相關領域普通技術人員的常規使用來理解這些術語。分子生物學的常見術語的定義還可以參見Alberts等人,MolecularBiologyofTheCell,5thEdition,GarlandSciencePublishing,Inc.:NewYork,2007;Rieger等人,GlossaryofGenetics!ClassicalandMolecular,5thedition,Springer-Verlag:NewYork,1991;King等人,ADictionaryofGenetics,6thed,OxfordUniversityPress:NewYork,2002;和Lewin,GenesIX,OxfordUniversityPress:NewYork,2007。使用37CFR§1.822規定的DNA鹼基命名法。「等位基因」是指在特定基因座處的替代序列;等位基因的長度可以短至1個核苷酸鹼基。等位基因序列可表示為核酸序列或由該核酸序列編碼的胺基酸序列。「基因座」是通常由參照點(pointofreference)發現的基因組序列上的位置;例如,作為基因或基因部分或基因間區域的短DNA序列。基因座可以指染色體上參照點處的核苷酸位置,如來自染色體末端的位置。特定基因組已知的基因座的有序排列被稱為遺傳圖譜。特定基因座處DNA序列的變體被稱為等位基因,基因座處的變異,即兩個或多個等位基因,構成多態性。任何核酸序列的多態性位點可以通過比較兩份或多份種質中一個或多個基因座處的核酸序列來確定。本文使用的「核酸序列」包括基因組內基因座處核苷酸的連續區域。此外,本文使用的「核酸序列」可以包括一個或多個單元型、一個或多個單元型的部分、一個或多個基因、一個或多個基因的部分、一個或多個QTL和一個或多個QTL的部分。另外,多個核酸序列可以包含一個或多個單元型、一個或多個單元型的部分、一個或多個基因、一個或多個基因的部分、一個或多個QTL和一個或多個QTL的部分。該序列可以直接或間接來源於DNA或RNA模板(即,從mRNA的逆轉錄獲得的cDNA)。本文使用的「多態性」是指在一個或多個個體的群體中,在一個或多個基因座處存在核酸序列的一種或多種變異。這種變異可以包括但不限於一個或多個鹼基改變、一個或多個核苷酸的插入或一個或多個核苷酸的缺失。多態性可能產生自核酸複製中的隨機過程、通過誘變、移動基因組元件的結果、拷貝數變化以及可能在減數分裂的過程產生,例如不等交換、基因組複製以及染色體斷裂和融合。這種變異可以是常見的,或者可能在群體中以低頻率存在,前者在普通植物育種中具有更大的應用,後者可能與罕見的但是重要的表型變異相關。有用的多態性可以包括單核苷酸多態性(SNP)、DNA序列中的插入或缺失(Indel)、DNA序列的簡單序列重複(SSR)、限制性片段長度多態性和標籤SNP。遺傳標記、基因、DNA衍生序列、單元型、RNA衍生序列、啟動子、基因的5』非翻譯區、基因的3』非翻譯區、微RNA、siRNA,QTL、衛星標記、轉基因、mRNA、dsmRNA、轉錄模式和甲基化模式可以包含多態性。此外,上述這些的存在、不存在或拷貝數的變化可以包含多態性。本文使用的「核酸效應估計值」是指反映與一個或多個表型性狀的關聯性的預測的核酸序列的效應估計值,其中所述關聯可以從頭進行或者通過梳理歷史核酸序列_性狀相關性數據來進行。本文使用的「育種值」是指基於核酸序列效應估計值和核酸序列頻率值的計算值,也可以確定在相同基因座(即單元型窗口)處或在基因座(即單元型窗口)中特定核酸序列相對於其它核酸序列的育種值。換句話說,通過固定所述核酸序列確定群體平均值的變化。另外,在評價通過基因滲入或轉基因事件置換基因組中的特定區域的效果時,育種值為比較特定核酸序列的置換效果提供基礎。另外,在雜種作物中,核酸序列的育種值可以在用來產生雜種的測交系的核酸序列中進行計算。本文使用的「基因型」是個體植物中基因座處的實際核酸序列。不同於其中基因型包含單核苷酸的遺傳標記如SNP,本發明鑑定的基因型是多個核苷酸,其中基因型長度取決於核酸序列長度。特別是,本領域已知的遺傳標記分析(例如通過TaqMan的SNP檢測)只檢測兩個等位基因。本發明的一個優點是能夠同時直接查詢任一個核苷酸位置處的全部4種核苷酸(腺嘌呤,A;胸腺嘧啶,T;胞嘧啶,C;和鳥嘌呤,G)。S卩,對於任一個鹼基對位置,與遺傳標記分析相比,使用直接核酸測序將獲得兩倍的信息。在確定兩個品系是否共有來源相同的DNA時,這可能是非常重要的。使用SNP基因型,可以只估計一對替代核酸鹼基是否存在於一個核苷酸基因座處。例如,可以查詢兩個品系在一個核苷酸基因座處是具有C還是T,以及發現一個品系具有C而另一個都不含。但是,不同於直接估計單核苷酸基因座處的序列,遺傳標記分析不能區別失敗的反應或在該基因座處是否存在替代鹼基,如腺嘌呤或鳥嘌呤。因此,本發明通過觀察該區域的核酸序列提供了關於給定區域是否來源相同的更大的確定性。本文使用的核酸序列可以包含1個或更多的核苷酸(例如2個或更多的核苷酸,25個或更多的核苷酸,250個或更多的核苷酸,1000個或更多的核苷酸,甚至20000個或更多的核苷酸)。在某些實施方案中,相鄰的核酸序列片段可以在體外連接或者在計算機上(insilico)對齊,以獲得更長的核酸序列。本文使用的來自兩個或多個個體植物中每一個的相同基因組區域(可能與一個或多個表型性狀值相關或可能不相關)的核酸序列為與種質改良活動有關的決定提供了基礎,其中可以評估一個或多個基因座。知道基因座處的兩個序列是否完全相同或者它們是否含有相同和不同基因座的組合可以幫助確定該基因座是否具有相同的性狀值並且與相同的性狀連鎖或者來源相同。因此,在另一方面,與表型性狀值相關的來自一個或多個個體植物的一個或多個核酸序列可以為與種質改良活動有關的決定提供基礎。本文使用的術語「單元型」是指單元型窗口內的染色體區域。典型地,每個單元型窗口中獨特的標記指紋組合定義和區別該窗口的各個單元型。本文使用的單元型由「單元型窗口」內一個或多個基因座處的一個或多個核酸序列限定和區別。本文使用的術語「單元型窗口」是指通過本領域技術人員所知的統計分析建立的、處於連鎖不平衡的染色體區域。在本領域中,兩個近交個體(或兩個配子)之間在位於該區域內的一個或多個分子標記基因座處的狀態同一性作為整個區域的來源同一性的證據,其中每個單元型窗口包括至少一個多態性分子標記。本文使用的單元型窗口由兩個或多個核酸序列基因型定義。單元型窗口可以沿基因組中的每個染色體定位,並且不一定需要是連續的。單元型窗口本身不是固定的,並且如果核酸序列信息量不斷增加,本發明預期單元型窗口的數目和大小將會發展,即窗口數目增加而其相應大小減小,從而導致在基因型狀態同一性的基礎上確定來源同一性的置信度不斷增大。單元型窗口可用於繪製目的核酸序列,因為這些基因組區域傾向於作為連鎖域(linkageblock)遺傳,因此對於相關性作圖和多代追蹤提供信息。本文使用的「表型」是指細胞或生物體的可受基因型影響的可檢測的特徵。本文使用的「標記」是指可以用來區別生物體的可檢測的特徵。這些特徵的例子可以包括遺傳標記、蛋白質組成、蛋白質水平、油組成、油水平、碳水化合物組成、碳水化合物水平、脂肪酸組成、脂肪酸水平、胺基酸組成、胺基酸水平、生物聚合物、藥物、澱粉組成、澱粉水平、可發酵的澱粉、發酵產率、發酵效率、能量產率、次級化合物、代謝物、形態特徵和農學特徵。本文使用的「遺傳標記」是指多態性核酸序列或核酸特徵。本文使用的「標記分析」是指使用特定方法檢測特定基因座處的多態性的方法,例如檢測至少一個表型(如種子顏色、花顏色或者其它可目視檢測的性狀)、限制性片段長度多態性(RFLP)、單鹼基延伸、電泳、序列比對、等位基因特異性寡核苷酸雜交(ASO)、隨機擴增多態性DNA(RAPD)、基於微陣列的技術和核酸測序技術等。本文使用的「共有序列」是指構建的DNA序列,其確定基因座處等位基因中的單核苷酸和Indel多態性。共有序列可以基於基因座處DNA的任一鏈,並且表示基因座中的各SNP中任一個的核苷酸鹼基及基因座中的所有Indel的核苷酸鹼基。因此,雖然共有序列可能不是一個實際的DNA序列的拷貝,但共有序列可用於精確設計用於基因座中的實際多態性的引物和探針。本文使用的「連鎖」是指雜交中產生配子類型的相對頻率。例如,如果基因座A具有基因「A」或「a」,基因座B具有基因「B」或「b」,具有AABB的親本I與具有aabb的親本B之間的雜交將產生4種可能的配子,其中基因分離為AB、Ab、aB和ab。空預期是會獨立相等地分離成4個可能的基因型中的每一個,S卩,如果沒有連鎖,每個基因型將會有1/4的配子。配子向基因型的分離不同於1/4是由於連鎖。本文使用的「連鎖不平衡」在一代的許多個體的群體中配子類型的相對頻率的文字環境中定義。如果等位基因A的頻率是p,a是ρ',B是q,b是q',那麼基因型AB的預期頻率(沒有連鎖不平衡)是pq,Ab是pq』,aB是p』q,ab是p』q』。相對於預期頻率的任何偏差被稱為連鎖不平衡。當兩個基因座處於連鎖不平衡時,它們被稱為是「遺傳連鎖的」。本文使用的「數量性狀基因座(QTL)」是指控制通常連續分布的在一定程度上可用數值表示的性狀的基因座。本文使用的「複雜性降低」是指降低核酸樣品的複雜性的方法,例如通過限制酶消化、逆轉錄、通過PCR方法的靶向擴增、或通過PCR方法的隨機擴增。複雜性降低可以對總基因組核酸或其亞組進行。在一個優選方面,將採用具有可重複結果的方法。複雜性降低方法包括在WO06/137734,WO06/137733和EP0534858中,它們特別在此全文引用作為參考。本文使用的「DNA標籤」是指用作核酸樣品標識物的短DNA區段。DNA標籤也被稱為分子條碼,其長度可以從大約2個到大約20個鹼基對不等,並且可以在模板核酸樣品的複雜性降低過程中添加。例如,DNA標籤組可以在美國專利7,157,564中獲得。標籤可以通過如EP1724348所述的測序或微陣列方法鑑定。在其它實施方案中,例如在寡核苷酸質量標籤的情況下,使用質譜法區分標籤(Zhang等人PNAS2007104:3061-3066)。此外,如美國專利申請2007/0054288所述,已經開發了用於通過其它成像平臺檢測的分子條碼,這些成像平臺包括表面等離子體共振、螢光或拉曼光譜法。在另外一個實施方案中,使用了RNA或蛋白質的摻入(spike-in)標籤,它們與靶樣品的分子不同,並且為了樣品鑑別目的與多種樣品共分析,樣品鑑別方法包括在WO03/052101中。在本發明的一個優選實施方案中,通過在性狀基因座測序之前或之後立即測序來估計標籤的身份。這樣,標籤的序列偶聯到基因座的序列上,並且可以用來保持基因座序列和樣品來源之間的連鎖。在另外一個實施方案中,標籤可以是組合的或分級的。例如,標籤的一部分可以指示多種核酸來源於同一樣品,而該標籤的另一部分可以指示核酸來源於不同的亞樣品。分級水平的數量或標籤的組合只受測序量的限制,測序可以用於DNA標籤對比性狀基因座。本文使用的「標記樣品,,是指相同的標籤已經連接到樣品中的每個個體核酸上的核酸樣品。本文使用的標記樣品包括用分級或組合標籤標記的樣品,其中至少該標籤的一部分是相同的,並且連接到樣品中的每個核酸序列上。本文使用的「等位基因特異性標籤」是對應於靶序列中的特定等位基因的DNA標籤。在一個優選實施方案中,只有除多態性加任何連鎖的DNA標籤以外的等位基因特異性標籤需要測序,以能夠將相應的多態性進行基因型分型。本文使用的「核酸測序」是指確定核酸樣品中核苷酸的順序,其中核酸包括DNA和RNA分子。「高通量核酸測序」是指用於確定核酸樣品中的核苷酸的自動化的和大規模並行的方法,其中高通量核酸測序技術的例子包括但不限於454LifeSciences,AgencourtBioscience、AppliedBiosystems、LI—CORBiosciences、MicrochipBiotechnologies、NetworkBiosystems、NimbleGenSystems、Illumina禾口VisiGenBiotechnologies提供的平臺,包括但不限於如Service(Science2006311=1544-1546)綜述的如下形式平行珠陣列、合成測序、連接測序、毛細管電泳、電子微晶片、「生物晶片」、微陣列、平行微晶片和單分子陣列。本文使用的兩個或多個核酸序列的「比對」是在同一基因座處發現的核酸序列的比較。幾種比對方法是本領域公知的,包括在大多數常用的生物信息學包中。本文使用的術語「引物」是指合成的寡核苷酸的單鏈,優選地為大約10個至大約120個核苷酸,它可以化學合成或者由幾種化學合成的寡核苷酸裝配而成。如本文使用的,引物可以用來啟動測序反應和聚合酶反應,如缺口填補反應和PCR。如本文使用的,引物在測定條件下將與希望的靶序列特異性雜交。如本文使用的,引物可以用來引入DNA標籤,弓丨入化學修飾的鹼基,如生物素標記的鹼基,或者引入雜交序列,該雜交序列隨後可以用於捕獲,例如捕獲到測序基質上或者含有抗生物素蛋白的表面上。本文使用的術語「連接體(adapter)」是指組成已知的雙鏈核酸分子,長度一般是大約10-120個鹼基對,設計為能夠例如通過使用DNA連接酶連接到第二核酸分子的一個或兩個末端上。連接體可以設計為連接到核酸的平端上(平端連接體)或者通過首先與特定突出端序列退火然後連接。在該實施方案中,連接體可以用來提供引物位點,用DNA標籤標記核酸,為了捕獲目的提供能夠雜交的序列,以及添加化學修飾的核酸序列如含有生物素的連接體。本文使用的術語「連接」是指由連接酶催化的生物化學反應,其中兩個DNA分子共價連接。本文使用的「DNA擴增」是指通過使用DNA聚合酶體外合成雙鏈DNA。一般地,這在聚合酶鏈反應(PCR)試驗中實現,但是也可包括其它方法,如缺口填補反應、錯配修復、Klenow反應等。DNA擴增用來提供可檢測的或過量的特定DNA。它也可以用來向靶核酸中引入雜交探針、退火的銜接體和引物,它們可以包括特定功能性或信息。本文使用的術語「轉基因」是指DNA如cDNA或基因組DNA形式的核酸分子,以及RNA如mRNA或微RNA形式的核酸分子,它們可以是單鏈或雙鏈。本文使用的術語「近交系」是指為了遺傳同質性而選育的品系。本文使用的術語「雜種」是指至少兩個遺傳上不同的親本之間雜交的後代。雜交方案的例子包括但不限於單雜交、、改良單雜交、雙改良單雜交、三源雜交、改良的三源雜交和雙雜交,其中改良的雜交中的至少一個親本為姐妹系間雜交的後代。本文使用的術語「測交系」是指在與另一品系的測交中使用的品系,其中測交系和測試的品系來自不同的種質庫。測交系可以是同基因的或非同基因的。本文使用的術語「玉米」是指玉米(Zeamays)或玉米,並包括可用玉米選育的所有植物品種,包括野生玉米種。更具體而言,來自玉米種和ZeamaysL.ssp.mays玉米亞種的玉米植物可通過使用本發明的組合物和方法進行基因型分型。另一方面,玉米植物來自ZeamaysL.subsp.maysIndentata組,也被稱為馬齒型玉米。另一方面,玉米植物來自ZeamaysL.subsp.maysIndurata組,也被稱為硬質玉米。另一方面,玉米植物來自ZeamaysL.subsp.maysSaccharata組,也被稱為甜玉米。另一方面,玉米植物來自ZeamaysL.subsp.maysAmylacea組,也被稱為麵粉玉米。另一方面,玉米植物來自ZeamaysL.subsp.maysEverta組,也被稱為爆粒玉米。可以使用此處所述的組合物和方法進行基因型分型的玉米屬或玉米植物包括雜種、近交系、部分近交系或或確定的或未確定的群體的成員。本文使用的術語「大豆」是指大豆(Glycinemax),包括可用大豆選育的所有植物品種,包括野生大豆種。更具體而言,來自大豆種和大豆max亞種(GlycinemaxL.ssp.max)或扁豆莢大豆(GlycinemaxL.ssp.formosana)的大豆植物可使用本發明的組合物和方法進行基因型分型。另一方面,大豆植物來自野生大豆(Glycinesoja)種,也被稱為野生大豆,可以使用這些組合物和方法進行基因型分型。或者,來自大豆、大豆max亞種、扁豆莢大豆和/或野生大豆的大豆種質可以使用在此提供的組合物和方法進行基因型分型。本文使用的術語「包括」是指「包括但不限於」。本文使用的術語「優良品系」是指針對優良的農學表現進行育種和選擇獲得的任何品系。優良植物是來自優良品系的任何植物。根據本發明,申請人發現了基於核酸序列本身在基因型上作出育種決定的方法。例如,本發明的方法提供直接的、基於序列的分析,代替使用遺傳標記作為選擇目的基因座的間接工具。此外,本發明的方法允許在育種計劃中使用核酸信息的提高的靈活性,其中可以查詢植物或動物的完整基因組,而不依賴預先確定的遺傳標記和遺傳標記檢測分析的發展。另外,可以調節來自任何基因座的序列的任何長度,以1)確定基因型-性狀關聯性,2)鑑別兩種或多種品系,3)預測品系表現或雜種表現,和最終,4)為與種質改良有關的活動中的決定提供基礎。分子育種通常被稱為標記-輔助的選擇(MAS)和標記輔助的育種(MAB),其中MAS是指基於至少一個基因座的分子標記基因型作出育種決定,MAB是表示在植物育種中使用分子標記的一般術語。在這些類型的分子育種計劃中,遺傳標記等位基因可以用來鑑定在一個標記基因座、幾個基因座或單元型處含有希望的基因型的植物,並且因此預期將希望的基因型連同希望的相關表型一起轉移給它們的後代。標記在植物育種中非常有用,因為一旦建立,它們就不經受環境或上位相互作用。此外,某些類型的標記適合高通量檢測,能夠以節省成本的方式快速鑑定。作物中的標記發現和開發為應用於MAB提供了最初的框架(美國專利5,437,697;美國專利申請2005000204780、2005000216545、2005000218305和2006000504538)。產生的「遺傳圖譜」是表徵的基因座(DNA標記或可以對其鑑定等位基因的其它任何基因座)沿染色體的相對位置的表示。該圖譜上距離的測量是相對於減數分裂時姐妹染色單體之間交換事件的頻率。作為一組,多等位基因標記已作為有用的工具用於植物的指紋分析,以獲得品系或品種的同一性程度(美國專利6,207,367)。這些標記構成確定與表型的相關性的基礎,並且可以用來促進遺傳增益。其中選擇決定基於標記基因型的MAS的實現依賴於檢測個體之間的相關遺傳差異的能力。由於這些分子標記中的等位基因差異,可通過分離群體的基因型和表型的統計學評價來鑑定QTL。QTL定位方法已經很好地描述(W090/04651;美國專利5,492,547、5,981,832,6,455,758;在Flint-Garcia等人2003Ann.Rev.PlantBiol.54:357_374中綜述)。在這些情況中使用標記來推斷表型,由於將昂貴、時間密集的表型分型替換為基因型分型,從而導致育種計劃節約化。標記方法允許在植物達到成熟之前進行選擇,從而節省了時間,並且導致更有效的田地使用。實際上,選擇可以在種子水平上均勻地進行,因此只種植優選的種子(美國專利申請2005000213435和2007000680611)。此外,育種計劃可以設計為通過針對特定基因型而明確推動特定的、有利的表型的頻率(美國專利6,399,855)。可以連續監測這些關聯性的保真度,以確保保持的預測性能力,並且因而有助於育種決定(美國專利申請2005/0015827)。該方法已經發展為使用標記作為工具,如統計學分析所確定的,通過優選基因座的滲入選擇「新的優良植物」(美國專利6,219,964)。標記輔助的基因滲入包括將一個或多個標記限定的染色體區從一個種質轉移給第二種質。該方法中的初始步驟是通過基因作圖定位基因組區域或轉基因,基因作圖是通過連鎖分析確定基因或基因組區域相對於其它基因和遺傳標記的位置的過程。連鎖作圖的基本原則是兩個基因在染色體上越緊密地靠近,它們一起遺傳的可能性就越大。簡要地說,通常在兩個遺傳學匹配但是相對於目的性狀不同的親本之間進行雜交。然後可以利用遺傳標記追蹤這些性狀在雜交(通常為回交(BCl))後代F2或重組近交群體中的分離。從歷史上看,遺傳標記不適合區分狀態同一性或來源同一性。長期以來一直認為,基因和基因組序列可以是狀態相同的(即,獨立起源相同;IBS)或來源相同的(即,通過來自共同祖先的歷史遺傳;IBD),這對於連鎖不平衡研究、且最終對定位研究具有重大的意義(Nordborg等人2002TrendsGen.18:83_90)。特別是,較新的標記類型,如SNP(單核苷酸多態性),更能說明起源。特定SNP等位基因源自特定物種的現存群體中的獨立來源的可能性非常低。連鎖基因中出現的多態性以緩慢但可預測的速度隨機分類,由連鎖不平衡的衰減或連鎖平衡的方法描述。這種良好建立的科學發現的後果是由多態性的特定組合確定的一長段編碼DNA是非常獨特的,並且除了通過連鎖不平衡以外,非常不可能重複存在,這指示來自共同祖先的最近的共祖先。由一些等位基因組合定義的特定基因組區域表示整個間插遺傳序列的絕對同一性的可能性取決於該基因組區域中連鎖的多態性的數量,除非在該區間中最近發生了突變。這些基因座也被稱為單元型窗口。該窗口內的每個單元型由等位基因的特定組合定義;等位基因的數量越大,潛在的單元型的數目就越大,而且該區域中狀態同一性是來源同一性的結果的確定性就越大。本發明允許通過使用直接核酸序列信息直接確定IBD,而不是通過標記信息推斷。在新品系的開發過程中,祖先單元型通過這一過程保留,並且一般被認為是作為單元通過譜系遺傳的『連鎖區組』。此外,如果特定的單元型具有已知的效應或表型,可以推斷它在具有相同單元型的其它品系中的效應。目前,使用一個或多個用於該單元型窗口的診斷標記在種質中鑑定和追蹤單元型。本發明提供一種通過使用核酸序列信息直接鑑定單元型的方法。此外,通過使用直接序列信息,與只使用遺傳標記相比,可以鑑定更多的在任何基因組區域內的多態性,因此導致其它單元型的鑑定。也可以更好地估計可能具有來源同一性的單元型。通過在較深的水平上區別單元型,可以獲得單元型-表型相關性的更高保真度。在另一方面,可以使用直接序列信息查詢外來種質的新單元型,從而能夠鑑定及隨後調節獨特的單元型。在另外一種方法中,可以在至少一個種質庫中查詢IBD的區域,以估計遺傳多樣性。例如,為了推斷作物馴化中的遺傳瓶頸,曾經查詢了等位基因變體(Doebley等人2006Cell127:1309-1321綜述)。但是,使用標記平臺查詢多樣性可能是有限制的,因為一種標記只能查詢序列中的一個位置。進一步地,一種雜種優勢理論預測了用來產生雜種的雄性和雌性品系之間的IBD區域將會降低雜種的表現。來源同一性在歷史上從不同品系中的標記等位基因的模式來推斷,其中在一系列相鄰基因座處的相同的一串標記可以被認為是來源相同的,如果它不可能偶然獨立發生的話。雄性和雌性品系中標記指紋的分析可以確認IBD區。在本發明中,可以對基因組直接查詢基因組內的至少一個基因座,以評價品系之間的IBD。對這些區域的了解有助於雜種親本的選擇,因為在雜種中避免IBD可能提高表現。這種了解也可能有助於育種計劃,因為雜交可以設計為產生顯示很少或沒有IBD的近交系對(一個為雄性,一個為雌性)。在本發明的一個方面,評價至少一個基因組區域的雜種優勢,其中如基於等位基因確定的雜交親本之間的雜合性可以推定為賦予表型優勢。在本發明的另一方面,提供了在基因組同線性(synteny)方面評價雜種優勢的方法,其中至少一個基因座的非同線性可以在雜種中導致雜種優勢和提高的表現。標記傳統上用於對品系進行指紋分析,因而提供遺傳純度的估計值,促進QA/QC操作,以及評估遺傳多樣性。本發明提供了直接評估鹼基對序列的方法,代替傳統標記方案中從單鹼基位點估計相關序列同一性的方法,從而對傳統標記方案進行了改進。例如,一種典型的雙等位基因SNP標記只提供了關於一個鹼基對位置的信息,並且它可能只區別2個而不是4個核苷酸。本發明的方法利用最近在高通量測序中的突破來提供新型分子育種方法。最近已經開發了高通量(HT)測序方法,利用該方法可以在一個測序儀運行中產生100MB或更多序列的信息。預期可以使用任何商業上可獲得的HT測序技術或任何其它可能在將來開發出來的商業上可獲得的核酸測序平臺,只要該平臺能夠確定單核酸分子的序列。商業上可獲得的HT測序技術的非限制性的例子由454LifeSciences(Branford,CT)、AgencourtBioscience(Beverly,ΜΑ)>AppliedBiosystems(FosterCity,CA)、LI-CORBiosciences(Lincoln,NE)、NimbleGenSystems(Madison,WI)、Illumina(SanDiego,CA)禾口VisiGenBiotechnologies(Houston,TX)提供(也參見www.solexa.com>www.454.com或www.abi.com)。商業上可獲得的HT測序技術也在Service(Science20063111544-1546)中綜述,其在此全文引入作為參考。實質上,IlluminaGenomeAnalyzer、454Flex和ABISolidtechnology能夠確定單DNA分子的序列,儘管該分子可能在該過程中擴增。這些例子中的一些採用合成測序,儘管這不是必要的。優選的HT測序平臺將在每個運行中產生100兆鹼基、1千兆鹼基或甚至更多的序列信息。非常優選的HT測序平臺將同時對最大量的個體DNA分子確定序列。這些系統被稱為是高度並行的。基於這個原因,IlluminaGenomeAnalyzer平臺通常是優選的,因為由於每個分子只產生小讀數,它可以對更多的DNA分子進行測序。對較少的序列產生較長讀數的平臺將是有效的,但是可能存在額外的時間和成本效率的挑戰。多態性核苷酸的直接確定比標記技術有重要的優點。儘管標記技術通常是可靠的,但是它們仍然可能不正確地報告相關序列、具有噪音、並且經歷失敗。此外,標記可能不會橫跨實際的目的基因組區域,並且取決於與目的基因組區域的連鎖程度,由於重組和連鎖喪失而在育種群體中喪失價值。核酸序列的直接確定通過不只是對目的核苷酸測序,而且也對周圍序列測序,克服了基於標記的系統固有的限制。另外,本發明提供了「間接」多態性檢測方法,其中使用與SNP直接相鄰的等位基因特異性標籤(圖5),因此測序反應只需要完成至標籤處,這對於產生短讀數的技術是特別有用的。間接測序同樣克服了典型的標記相對於包含原因性多態性更傾向於連鎖的缺點,因為該標籤與SNP基本上物理連接。核酸測序的應用也提供了更多的關於與重要性狀相關的基因座的序列信息,這些信息將幫助育種者更好地理解和利用基因座或性狀。此外,核酸序列的直接確定可以不需要為標記開發進行大量的預先測序。在一個實施方案中,本發明的方法包括對一個植物的全基因組進行測序,比較被測序的基因組與第二植物的基因型,然後作出使它們雜交的決定,選擇一個或兩個進行發展,或者測試這兩個的組合。或者,可以利用全基因組信息通過將具有相似性的品系分組,並且基於遺傳差異分離品系,以調節雜種優勢,來發展譜系。全基因組序列提供了多態性核苷酸的完全列表和單元型的完全列表。如公開領域所述的HT測序技術可能仍然在應用於植物基因型分型方面具有固有的限制,即使其具有每個樣品測序100兆鹼基或者甚至1千兆鹼基的序列的能力。這種限制是由於需要對支持現代育種計劃所需的數千萬個個體或品系進行測序。鑑定兩個基因座之間的罕見的重組體或者在多個基因座處具有最高頻率的有利等位基因的亞群需要大量的個體或品系。對這樣大量的個體的全基因組進行測序的能力仍然是無法實現的。需要能將基因組簡化到少量信息性多態性區域的手段,以及將來自多個個體的樣品組合到少量的測序運行或反應中的手段。本發明的一個方面是使用可重複的方法將全基因組的複雜性降至可以分析、比較並用於植物育種決定的代表性的序列亞組。本發明的另一方面是應用DNA標記的能力,使得多個樣品可以組合到一個測序運行中。然後可以解析(deconvolute)來自在一個運行中平行測定的組合樣品的序列,並追溯到它們所起源的個體植物或植物庫。一方面,本發明提供用於核酸測序的總基因組DNA或RNA亞組,使得獲得簡化的樣品(reducedrepresentationsample),以將測序目標縮小至(即)包括至少一個目的多態性的一個或多個編碼區。這些亞組有時可以被稱為複雜性降低的樣品或文庫。在本發明的另一方面,簡化的樣品針對或者限於基因組中選擇的一個或多個區域或基因座。選擇的基因座可以基於與一種或多種性狀或表現特徵之間的一種或多種關聯性而選擇,或者它們可以是基因組內所有基因座的代表性亞組,例如沿染色體均勻間隔並且在目標育種群體中分離的亞組。一個優選的基因座亞組是多態性基因座。多態性基因座由在一對或多個個體或品系之間變化的一個或多個核苷酸限定。該技術可以使用任何類型的多態性基因座,包括但不限於序列長度多態性、重複序列長度多態性、限制位點多態性和單核苷酸多態性。在本發明的一個優選實施方案中檢測單核苷酸多態性。目標基因座的序列可以通過引發基因座以合成互補寡核苷酸,然後直接對互補寡核苷酸測序來確定。靶區域可以通過缺口填補反應、引物延伸反應、聚合酶鏈反應或這些反應的組合來合成。或者,對於多態性靶向的基因座,可以利用錯配修復酶或核酶或其它這樣的核苷酸特異性酶特異性修復在多態性核苷酸處錯配的互補寡核苷酸。一旦互補核苷酸延伸、擴增、修復或者填補缺口,體外產生的寡核苷酸的序列就可以被確定,並且代表多態性基因座的序列。可以使用這些方法中的任何一種直接確定一個或多個核苷酸區的一條或兩條鏈的核苷酸序列。由於高通量測序方法可以在一個運行中產生大於100MB的序列信息,來自大量基因座的寡核苷酸可以合併並且同時測序,使得大量基因座的序列可以在一個測序反應中平行確定。在這種實施方案中,本發明提供高通量的和成本有效的直接確定多態性或非多態性核苷酸的方法。在另一方面,可以製備由特定的一類基因組片段組成的簡化的樣品。在一個優選的實施方案中,使用限制酶製備樣品。為了比較一個物種的至少兩種植物,通過用一種或多種限制性內切核酸酶消化,基於核苷酸序列的大小分級分離消化的DNA片段,並且比較級分中片段的序列,來製備每個樣品。更具體地,鑑定基因組DNA中至少一個基因座的方法包括使用對甲基化敏感的內切核酸酶消化來自真核物種的至少兩個變體的總基因組DNA,以提供一組消化的DNA片段。對於以較低的5-甲基化胞嘧啶百分比為特徵的DNA區,片段的平均核苷酸長度較小。這些片段可以基於核苷酸長度例如通過凝膠電泳分離。具有小於平均核苷酸長度的DNA的級分從消化的DNA的集合中分離。與編碼序列相比,重複序列更可能包含5-甲基化的胞嘧啶,例如在-CG-和-CNG-序列區段中。在該方法的一個優選方面,來自作物的至少兩個不同近交品種的基因組DNA用選自AciI.ApaI.AgeI.BsrFI、BssHIKEagI、EaeI、HhaI、HinPlI、HpaII、MspI、MspMII、NarI、NotI、PstI、PvuI、SacII、SmaI、StuI和XhoI的甲基化敏感性內切核酸酶消化,以提供一組可以通過例如凝膠電泳物理分離的消化的DNA。相當的DNA大小級分從所述品種中每一種的消化的DNA獲得,然後測序。在另一個實施方案中,可以使用RNA作為簡化的基因組,即表達的基因組的亞組。RNA可以是polyARNA、小RNA或其它RNA組分,它們可以在提取後直接使用,或者通過實驗處理以進一步降低複雜性或提高再現性。在測序之前,通過逆轉錄法將RNA轉化為cDNA,該cDNA可以直接測序或者通過實驗處理以進一步降低複雜性或提高再現性。在本發明的一個優選實施方案中,多個核酸樣品可以組合為樣品複合體,即集合,並且在同一運行中平行測序,以使每個測序運行的樣品通量達到最大。為了實現這一點,將包含該樣品特有的一個或多個核苷酸的DNA標籤添加到從個體樣品製備的核酸上。典型的DNA標籤包含1-10個核苷酸,但是可以延伸到任意長度,只要該標籤不幹擾確定樣品序列的能力。例如,2個核苷酸的DNA標籤可以用來分離16個樣品的混合物。3、4、5或6個核苷酸的DNA標籤可以用來分離64、256、1024或4096個樣品的混合物,等等。較短的DNA標籤對序列讀取長度有較小的限制,但是限制了可以混合的樣品數。在本發明的一個實施方案中,DNA標籤作為一個或兩個PCR引物的一部分簡單地合成,然後引入到PCR反應中。在另一方面,可以使用DNA連接酶將DNA標籤連接到樣品核酸上。將DNA標籤完全引入到核酸樣品中後,可以複合(即合併或組合)多個DNA製品,每一個DNA製品具有獨特的標籤。複合的混合物然後進行一個HT測序反應。複合的樣品的數目基於最佳地利用一次測序運行的全部測序能力。影響樣品混合物複雜性的參數包括所評估的基因座的數目、基因座的大小、HT平臺每個運行的信息含量、DNA標籤的長度、連接體或引物序列的存在(如果有的話)和給定序列的讀取長度。可以平衡複合水平,以達到每個樣品的最佳成本、每個序列讀取的冗餘。單個序列讀取的最小長度需要足以讀取樣品DNA標籤(例如,2-5個核苷酸,取決於合併的樣品數)、序列特異性標籤(6-20個核苷酸)和一個或多個相鄰的核苷酸。在HT測序反應後,首先將具有相同DNA標籤的序列在邏輯上分離為單獨的集合,這些集合代表提取其DNA的個體或品系或集合。然後可以讀取具有相同DNA標籤的序列,以確定被選擇進行查詢的基因座內的核苷酸身份。在本發明中,核酸的序列可以與目的性狀或植物表現相關聯,然後用來進行親本、後代或測交系的選擇。如果序列與性狀或表現特徵遺傳連鎖,則它們將是有用的。典型地,如果它們是性狀或表現特徵的原因或者與性狀或表現基因座密切物理連接,則它們是遺傳連鎖的。對於物理連接的序列,不需要知道基因和/或作為原因的變異的性狀或表現信息。只需要確定物理連接的核苷酸的序列。一旦序列與性狀或表現特徵遺傳連鎖,可以直接利用核酸序列選擇顯示該性狀或表現的親本、後代或測交系,而不需要預先測定性狀或表現特徵。關於核苷酸序列的知識也可以用來對植物或品系進行指紋分析,並且用來測定植物或品系之間的遺傳相似性/距離,和建立系譜。然後可以利用系譜進行親本的選擇或者控制種質庫中的多樣性。在另外一個實施方案中,可以使用高通量、非破壞性的種子採樣,針對一個或多個標記如核酸序列篩選植物。在一個優選方面,以這種方式對種子採樣,並且只發展具有至少一個目標基因型的種子。已經描述了用於高通量、非破壞性種子採樣的裝置和方法,它們通過允許單個種子分析可以克服統計樣本的障礙。例如,公開的美國專利申請US2006/0042527、US2006/0046244、US2006/0046264、US2006/0048247、US2006/0048248,US2007/0204366和US2007/0207485(在此全文引入作為參考)公開了用於種子自動採樣的裝置和系統以及採樣、測試和膨脹(bulking)種子的方法。如本發明所提供的,對核酸序列的了解可以用於在育種計劃的多個階段作出決定a)在分離的後代之間,作為預選擇方法,提高選擇指數和推動育種群體中有利核酸序列的頻率,其中預選擇定義為基於如通過HT測序確定的、育種雜交後代在一個或多個基因座處選擇的一組兩個或多個核酸序列的基因型,在育種雜交的後代之間進行選擇,並且梳理在以前的育種雜交中確定的核酸序列_性狀相關性。b)在來自育種群體的分離的後代之間,為了品系或品種的開發提高有利核酸序列的頻率。c)在來自育種群體的分離的後代之間,在該育種群體內QTL定位之前提高有利核酸序列的頻率。d)對於雜種作物,在來自不同雜種優勢群的親本品系之間,預測不同雜種的表現潛力。在另外一個實施方案中,本發明提供通過在種質中積累目的核酸序列改良植物種質的方法,包括確定植物種的基因組中至少兩個基因座的核酸序列,以及將該核酸序列與至少一種性狀相關聯,並且使用該核酸序列效應估計值指導育種決定。這些核酸序列效應估計值可以使用歷史核酸序列-性狀相關性獲得或者從作圖群體從頭獲得。一種或多種性狀的核酸序列效應估計值為在育種計劃中作決定提供了基礎。本發明還基於估計的種質中核酸序列的效應和頻率,使用育種值計算為決定的作出提供替代基礎。可以使用核酸序列育種值將特定一組核酸序列排序。在特定一組核酸序列中,這些育種值構成了計算指數以對基因座之內和之間的等位基因進行排序的基礎。例如,在每個染色體具有不同核酸序列的群體中,任何給定的染色體區段可以在給定群體中由許多核酸序列表示,這些核酸序列可以從1(區域固定)到群體大小相比該物種倍性水平的倍數(在二倍體物種中為2)變化。非固定群體中多個個體攜帶的核酸序列之間的來源同一性將會導致中等數目的不同核酸序列和不同核酸序列之間可能不同的頻率。新的核酸序列可以通過雜合祖先中存在的核酸序列之間的減數分裂重組而產生。每個核酸序列的頻率可以通過幾種本領域技術人員所知的方法來估計(例如通過直接計數,或者通過使用EM算法)。讓我們假定已知「k」不同的核酸序列,其中核酸序列代表至少一個核苷酸,並且可以構成等位基因或單元型,確定為「n/』(i=1,...,k),它們在群體中的頻率是「fi」(i=l,...,k),對於這些核酸序列中的每一種,我們的效應估計值為「Est/』(i=1,...,k)。如果我們稱「育種值」(BVi)為固定該核酸序列對該群體的影響,則該育種值對應於該群體的目的性狀的平均值在該窗口處單元型分布的原始狀態與核酸序列「η/』以100%的頻率遇到它自身時的最終狀態之間的變化。該群體中的育種值Iii可以如下計算formulaseeoriginaldocumentpage20本領域技術人員應當認識到,在其效應被估計的群體中罕見的核酸序列傾向於精確度較低地被估計,這種置信度的差異可導致計算的調節。例如,通過在調節其頻率後計算較熟知的核酸序列的育種值(通過將其除以較熟知的核酸序列的頻率總和),人們可以忽略罕見核酸序列的效應。人們也可以為每個核酸序列的育種值提供置信區間。該育種值將作為核酸序列頻率差異的函數,隨所計算的群體而變化。術語群體於是可以假定為不同的含義,以下是特殊情況的兩個例子。第一,它可以是單一近交系,其中意圖將其當前的核酸序列Hj替換為新的核酸序列叫,在該情況下formulaseeoriginaldocumentpage20第二,可以是F2群體,其中兩個親本核酸序列Iii和η」最初以相等的頻率(50%)存在,在該情況下formulaseeoriginaldocumentpage20這些統計方法能夠使核酸序列效應估計值在多種情況下促進育種決定。其它計算育種值的統計方法是本領域技術人員所知的,並且可以在不背離本發明的精神和範圍的情況下替換使用。此外,確定表型與基因型(在此情況下為核酸序列)之間相關性的統計學顯著性的方法可以通過本領域所知的任何統計學檢驗來確定,並且需要任何公認的統計學顯著性閾值。特定方法和顯著性閾值的應用是本領域普通技術人員公知的。核酸序列效應估計值和/或一個或多個目的性狀的育種值為與兩個或多個核酸序列相比確定一個或多個目的核酸序列提供了基礎。使用這種先驗信息,在核酸序列基礎上而不是在標記基礎上進行育種選擇,其中第一植物與含有至少一個基因座的第二植物雜交,其中第二植物的核酸序列不同於第一植物的核酸序列;並且通過檢測第一植物的核酸序列或核酸序列組選擇至少一個後代植物,其中該後代植物在其基因組中包含第一植物的一種或多種目的核酸序列和第二植物的至少一種目的核酸序列;並且在與種質改良有關的活動中使用該後代植物,與種質改良有關的活動在此定義為包括使用植物進行品系和品種開發、雜種開發、轉基因事件選擇、進行育種雜交、通過自體受精測試和發展植物、純化品系或亞系、使用植物或其部分進行轉化、使用植物或其部分作為表達構建體的候選物、以及使用植物或其部分進行誘變。在一個方面,本發明提供高通量測序,以鑑定植物基因組的一個或多個區域中的大核酸區段,這為比較兩份或多份種質提供了基礎。這些連續核酸序列區域表明來自共同祖先的所有間插基因的遺傳同一性的保守。在保守序列區段與已經鑑定QTL的區段一致的情況中,可以高可能性地推斷QTL推斷可以擴展到其它在該基因座中具有相同序列的種質。這種先驗信息為在給定群體內QTL定位之前選擇有利QTL提供了基礎。例如,植物育種決定可以包括a)在新育種群體之間選擇,以確定哪些群體具有最高的有利核酸序列頻率,其中序列基於與以前的QTL定位一致而被稱為有利的;或者b)在該群體內QTL定位之前,或者代替該QTL定位,在育種群體中選擇含有所述有利核酸序列的後代,其中選擇可以在任何育種階段進行,並且也可以用來推動多代輪迴選擇;或者c)預測特定育種雜交的後代表現;或者d)基於所述有利的單元型選擇用於種質改良活動的品系,所述種質改良活動包括品系開發、雜種開發、基於插入轉基因的單元型的育種值在轉基因事件之間選擇、進行育種雜交、通過自體受精測試和發展植物、使用植物或其部分進行轉化、使用植物或其部分作為表達構建體的候選物、以及使用植物或其部分進行誘變。本發明的另一個獨特方面是選擇特定基因或等位基因的能力,因為它們被高通量測序定向。例如,在核酸序列與已鑑定基因的區段一致的情況中,可以高可能性地推斷基因推斷可以擴展到其它在該基因座中具有相同基因型的種質。這種先驗信息為基於給定群體內的核酸測序選擇有利基因或等位基因提供了基礎。例如,植物育種決定可以包括a)在新育種群體之間選擇,以確定哪些群體具有最高的有利核酸序列頻率,其中序列基於與以前的基因定位一致而被稱為有利的;或者b)在育種群體中選擇含有所述有利核酸序列的後代,其中選擇能夠在基因水平上有效進行,其中選擇可以在任何育種階段進行,並且也可以用來推動多代輪迴選擇;或者c)預測特定育種雜交的後代表現;或者d)基於所述有利的單元型選擇用於種質改良活動的品系,所述種質改良活動包括品系開發、雜種開發、基於插入轉基因的單元型的育種值在轉基因事件之間選擇,進行育種雜交、通過自體受精測試和發展植物、使用植物或其部分進行轉化、使用植物或其部分作為表達構建體的候選物、以及使用植物或其部分進行誘變。此外,在本發明的另一個優選實施方案中,關於育種群體中有利核酸序列的頻率的先驗信息使得能夠進行預選擇。即,為了同時推動多種性狀的有利核酸頻率,基於歷史基因型-表型相關性信息選擇親本品系。在預選擇中,育種者可以基於該品系的指紋信息預測任何品系的多種性狀的表型貢獻,該信息對應於預定義的序列的組成。這種多性狀序列選擇方法通過在選擇親本雜交的開始階段啟動選擇而使育種計劃經濟化,並且它也減少了對昂貴的、費時的後代表型分型的需要。當通過標記方法或表型方法選擇時,一種優選的序列為親本植物和親本的後代提供了優選的性質。本發明的方法提供優選序列或目的序列的選擇,以及這些序列在育種群體中的積累。在另一個實施方案中,本發明使得能夠基於至少一個核酸序列效應估計值,通過對至少一個核酸序列的選擇決定進行間接選擇,從而基於其它表型性狀的另外的核酸序列效應估計值間接選擇另外的表型。本發明的另一個優選實施方案是通過選擇核酸序列的組成建立另外的值,其中每個序列具有估計的相關表型,該表型相對於產量不為負,或者相對於成熟度不為正,或者相對於成熟度為零,或者與一組種質中相同基因座處其它任何核酸序列相比在農學性狀、轉基因和/或多個性狀指數方面最好的50%中,或者與一組種質中整個基因組上其它任何基因座相比在農學性狀、轉基因和/或多個性狀指數方面最好的50%中,或者在育種群體或一組種質中以75%或更高頻率存在的核酸序列可以被作為其高值的證據,或者它們的任意組合。本發明預期通過雜交含有不同核酸序列即不同基因型的親本植物或品系,將來自至少兩個基因座的核酸序列堆積到植物或品系中。在其基因組中包含來自兩個或多個基因座的堆積核酸序列的植物或品系的值可以通過綜合育種值來估計,綜合育種值取決於性狀值和與該性狀連鎖的核酸序列值的組合。本發明進一步預期植物或品系的綜合育種值可以通過改變一個或每個核酸序列的成分來改進。另外,本發明預期另外的值可以加入植物或品系的綜合育種值,其實現方法是通過選擇至少一個具有優選核酸序列效應估計值的接受核酸序列,或者與所述核酸序列在種質庫中的頻率一起,與其它核酸序列中的一個或任一個連鎖的育種值,或者通過育種選擇用於堆積來自兩個或多個基因座的兩個或多個核酸序列的植物或品系。本發明的另一個實施方案是一種通過在種質中在一個或多個基因座中積累一個或多個核酸序列增強育種群體的方法。基因座包括遺傳信息,並且給植物提供表型性狀。遺傳信息中的變異可以導致表型性狀的變異,並且表型的值可以測定。核酸序列的遺傳作圖允許確定序列之間的連鎖。目的核酸序列在後代植物的基因組中是新型的,並且其本身可以作為目的基因座的遺傳標記。特別是,該核酸序列還可以用作基因或QTL的標識物。例如,如果有與核酸序列相關的多種性狀或性狀效應,只有一個標記是選擇目的所必需的。另夕卜,目的基因座可以提供選擇具有連鎖基因座的植物的工具。在另外一個實施方案中,本發明的至少一個優選核酸與至少一個轉基因堆積。在另一方面,基於與優選核酸的連鎖或在其中的插入發展至少一個轉基因事件,如公開的美國專利申請US2006/0282911所公開的,該專利申請在此全文引入作為參考。在再另一個實施方案中,本發明承認可以發展通過此處所述的方法鑑定的優選核酸作為包含在表達構建體中的候選基因,即轉基因。通過與在植物中具有功能的啟動子可操作地連接,目的核酸可以在植物細胞中表達。在另一方面,目的核酸的表達可以被雙鏈RNA介導的基因抑制改變,後者也被稱為RNA幹擾(「RNAi"),包括小幹擾RNA(「siRNA")、反式作用小幹擾RNA(「ta-siRNA")或微RNA("miRNA")介導的抑制。適合用於植物的RNAi技術的例子在美國專利申請公開2006/0200878和2007/0011775中詳細描述。裝配構建體和將其引入細胞中的方法在本領域中已知,該方法使得性狀的核酸分子被轉錄為功能性mRNA分子,該功能性mRNA分子可翻譯和表達為蛋白質產物。為了實施本發明,用於製備和使用構建體和宿主細胞的常規組合物和方法是本領域技術人員公知的,參見例如MolecularCloning:ALaboratoryManual,3rdedition第1、2、3卷(2000)J.F.Sambrook,D.W.Russell,andN.Irwin,ColdSpringHarborLaboratoryPress。特別適合植物轉化的製備轉化構建體的方法包括但不限於美國專利4,971,908,4,940,835、4,769,061和4,757,011中描述的方法,所有這些專利都全文引入作為參考。用於向植物內引入表達單元的轉化方法是本領域中已知的,包括如美國專利5,384,253所述的電穿孔;如美國專利5,015,580,5,550,318,5,538,880,6,160,208,6,399,861和6,403,865所述的微粒轟擊;美國專利5,508,184所述的原生質體轉化;和美國專利5,635,055,5,824,877、5,591,616,5,981,840和6,384,301所述的土壤桿菌介導的轉化。本發明也提供篩選後代植物的目的基因座和使用核酸效應估計值作為用於育種計劃的選擇的基礎,以增強優選核酸序列的積累。使用這種方法,本發明涉及從大植物群體中選擇目的核酸序列。另外,這些核酸序列可以在描述的育種方法中使用,以積累其它有益的和優選的基因座,並且在育種群體中維持它們,以增強植物的整體種質。考慮用於該方法的植物包括但不限於玉米、大豆、棉花、小麥、水稻、芸苔、油菜、甜菜、高粱、粟、苜蓿、飼料作物、油籽作物、穀類作物、水果作物、觀賞植物、蔬菜作物、纖維作物、香料作物、堅果作物、草料作物(turfcrops)、糖料作物、飲料作物、塊莖作物、塊根作物和森林作物。總之,本發明描述了高通量測序和分子育種方法的新型組合,以能夠使用直接核酸序列信息進行分子植物育種。本發明也包括在序列確定之前選擇性靶向多態性核苷酸位點和DNA標記樣品的方法。結合起來,本發明使得植物育種者能夠在親本選擇、後代選擇、選擇測交系組合、開發系譜、樣品指紋分析、篩選單元型多樣性和建立序列與性狀和表現數據之間關聯性的資料庫中使用序列信息。實施例實施例1.序列指導的選擇任何育種計劃的一個重要目的是將經濟學上或其它方面重要的性狀引入到育種品系或群體中。直接確定與性狀連鎖的區域的序列或直接確定作為該性狀原因的基因座的序列的能力將使育種者能夠確定群體中哪些個體或品系有可能顯示該目的性狀,從此有利於開發決定。用於高通量測序的樣品工作流程在圖1中顯示。本實施例證明本發明的用於進行序列指導的選擇的方法。該方法與傳統標記輔助的選擇的不同在於它使用直接核酸序列信息進行選擇而不是使用標記。低亞麻酸含量的大豆油在商業上是重要的,因為它在加工和使用過程中不產生反式脂肪,因此對於人類消費而言更加健康。亞麻酸生物合成必需的一種基因是fad3基因。在大豆中,存在至少三種fad3基因,並且fad3b和fad3c兩種基因中的突變可能導致低亞麻酸含量。用於檢測這些基因中的突變的示例性的引物和探針在公開的美國專利申請20060107348中描述,在此全文引入作為參考。在一個方面,序列指導的選擇的第一步可以是降低基因組複雜性,其中不同的策略在圖2-5中說明。即,通過使用本領域所知的酶進行選擇性消化和純化可以獲得簡化形式的文庫(圖2)。在其它方面,可以從轉錄組定向該文庫(圖3)。在另外其它方面,使用等位基因特異性延伸/連接分離含有SNP的區域(圖5)。在其它方面,選擇性擴增序列靶向的基因組區域(圖4)。在本實施例中,使用用於插入和缺失的特異性引物擴增Fad3cindel區。當目的區域含有indel時該方法是有用的,並且特別可用於篩選轉基因。可替代地,擴增橫跨目的核酸的區域。在本實施例中,使用第二複雜性降低策略,其中為了測序目的,利用Fad3b區域的SNP分析擴增含有SNP的區域。通常,該方法特別可用於梳理已有的SNP的基於PCR的分析文庫,並且使用已知的引物組作為複雜性降低的工具。本發明涉及使用公開的美國專利申請US2005/0204780、US2005/0216545、US2005/0218305和US2006/0504538提供的SNP,作為測序靴標,以及在此處所述的基因組複雜性降低中使用。可用於序列指導的選擇的第二步是使用DNA標籤以允許樣品複合。在本實施例中,給複合組中的每種樣品分配獨特的DNA標籤,即,與該組中的其它條碼有至少一個鹼基對不同的序列標籤。在一個優選方面,平衡G和C鹼基的百分比,以使測序過程中的偏差減至最小。DNA標籤的長度可以從大約2bp到大約20bp。在本實施例中,對於代表分析Fad3bSNP和Fad3cindel的192份種質的384個PCR樣品,使用6bp序列,對每個樣品的SNP和indel區域進行測序。在一方面,如圖7所示向PCR引物中添加DNA標籤。或者,如圖5所示,它們可以引入到等位基因特異性延伸/連接中,利用PCR將條碼與等位基因特異性延伸/連接產物連接,或者添加到產物中。在本實施例中,DNA標籤包含在PCR引物中。圖9顯示了將用於測序的產生的模板的示意圖,顯示Fad3bSNP和Fad3cindel。具體地,合成一對寡核苷酸以幫助fad3b基因座的序列測定。合成正向寡核苷酸引物,其包含6個核苷酸的DNA標籤(表1)和與位於已知影響基因功能的fad3b突變5'側的核苷酸序列匹配的序列。對於本發明,突變與多態性核苷酸相同,並且代表多態性基因座。合成反向寡核苷酸引物,其為與位於fad3a突變3'側的區域互補的序列。第二對正向和反向PCR引物以類似的方式產生,以與缺失了已知減少大豆油中的亞麻酸的fad3c基因的突變相匹配。由於該缺失延伸到fad3基因的邊界以外,在基因編碼區內設計一對引物,以確定fad3c基因的序列(如果該基因存在的話),並且設計第二組引物,其橫跨fad3c基因座的缺失(如果該基因不存在的話)。核苷酸對之間的距離設計為10-200個核苷酸,並且該突變鄰近正向引物的末端,因此緊靠DNA標籤。引物之間的距離越相似,多個基因座上模板的PCR擴增越可能無偏差,但是,在某些實施例中可能需要較長的距離來發現適合有效引物設計的核苷酸段,例如不含重複序列、不存在的序列結構和平衡的GC含量。三對引物中的正向引物可以使用相同的DNA標籤。這三對代表可以用於一個樣品的基因型分型或指紋分析組。具體地,在本實施例中使用以下引物對:Fad3B(SNPNS0193115),192正向引物ACACTCTTTCCCTACACGACGCTCTTCCGATCT+192DNA標籤+CATTGGCACCCATGTTATCC;單Fad3B反向引物CAAGCAGAAGACGGCATACGAGCTCTTCCGATCT+GACTTAGATCACATAGGCAGACATAC;Fad3C插入,192正向引物ACACTCTTTCCCTACACGACGCTCTTCCGATCT+192DNA標籤+TAAGTGACACTGGAGATGTGG;Fad3C缺失,192正向引物ACACTCTTTCCCTACACGACGCTCTTCCGATCT+192DNA標籤+CAGAAAGTATTGGTAAAGTACTGGTA;單Fad3C反向引物CAAGCAGAAGACGGCATACGAGCTCTTCCGATCT+TAAATATTCCATTGAGGCCCACTA,其中混合等摩爾量的引物。表1.用於在本實施例中基因型分型的192個大豆品種的示例性的6核苷酸DNA標籤tableseeoriginaldocumentpage25tableseeoriginaldocumentpage26tableseeoriginaldocumentpage27然後產生另外的192個基因型分型組,其中除了三對寡核苷酸的正向引物中的DNA標籤更換來自4096個可能標籤列表的獨特標籤以外,每個組是相同的。然後以以下方式確定192個大豆品種群體的fad3b和fad3c突變的序列。從192個品系中的每一個上採樣一個種子,除去一部分種子組織而保留種子的生存力,例如如US2006/0046264和US2007/0204366所述,該專利均在此引用作為參考。為了製備用於測序的模板,為每個組織樣品製備DNA,然後將IOng分配到2個96孔微量滴定板中。按照廠商的推薦(Roche,ABI)向每個孔中加入PCR主混合物以及Taq聚合酶。最後,向每孔中加入ΙΟΟμΜ選擇的基因型分型引物組,其包括匹配的DNA標籤。將板加熱到95°C保持9分鐘,以變性DNA。然後使用以下條件完成20個循環的PCR:94°C30sec,55°C30sec,72°C2min,最後72°C延伸10分鐘。PCR後,將所有192個品系合併到一個孔中,然後根據廠商的說明(IlluminaGenomeAnalyzer)進行HT測序反應。簡言之,混合等量的384個PCR產物,然後使用本領域已知的PCR純化法純化。約5-10ng純化的模板按照IlluminaGenomeAnalyzer的說明利用富集PCR擴增。如果連接體未引入到引物中的話,富集PCR也添加下遊橋連PCR反應所需的連接體。再次使用本領域所知的PCR純化方法純化富集PCR產物,按照IlluminaGenomeAnalyzer的說明對產生的模板進行測序。從測序反應獲得的序列根據DNA標籤序列裝箱(binned)。在每個箱(bin)內,通過與SNP和indel正向引物對齊分析序列,以確定已知的突變、任何其它變異或野生型核苷酸是否靠近3'互補寡核苷酸存在。SNP基因型基於SNP位置處的序列檢出(call)(獲得的散布圖見圖10)。Indel基因型通過與兩條正向引物序列的匹配來確定(獲得的散布圖見圖11)。匹配序列計數可以作圖以處理背景。可以使用/開發用於標準化/校正和更可靠的基因型檢出的高級評分工具。如果突變序列和野生型序列都鑑定到,則預測樣品為雜合的。如果只存在對應於野生型序列的核苷酸序列,則樣品被分類為正常亞麻酸。如果鑑定到已知的突變序列,則樣品被分類為低亞麻酸。鑑定和分類fad3b基因座、fad3c基因座和fad3c缺失基因座處的序列允許育種者篩選植物,以表徵低亞麻酸相關的基因型,然後決定選擇哪種低亞麻酸品種進行測試。實施例2.序列指導的基因滲入植物育種中一種有效的工具是回交。回交允許育種者提取供體品系中的一個或多個最佳特徵,並將其系統滲入到回歸親本品系中。實質上,將一個或多個選擇的供體DNA基因座處的基因組區域系統滲入到回歸親本基因組中,代替回歸親本基因組中相應基因座處的核酸。一般滲入到品系之間的特徵類型包括但不限於轉基因、抗病性、害蟲抗性、質量性狀、農學性狀等。傳統上,這種過程可以進行5代或更多代,以在顯示與回歸親本等同並且具有回歸親本的農學表現的後代中獲得目的性狀。如果轉變的品系的表現不等於回歸親本加新性狀預測的表現,則可能通常非常難以理解該問題以及不知如何修正。序列指導的回交(SDBC)可以極大地加速該過程並且導致更可定量的結果。使用序列,檢查來自每一回交代的後代中編碼目的特徵或與目的特徵連鎖的供體親本核酸序列和回歸親本基因組中的核酸序列。該檢查考慮序列之間的差異(多態性)和同一性。基於其核酸序列組成選擇和發展回交後代,其核酸序列組成包括編碼目標性狀或與目標性狀連鎖的核酸序列和與回歸親本序列匹配的最高百分比的核酸序列。通過使用序列而不是標記信息指導該過程,該過程可以在較少的幾代內完成,具有較高的回歸親本回收率。SDBC的一個具體實例是轉基因從供體品系向回歸親本品系中的定向滲入,轉基因的一個例子編碼除草劑抗性,也被稱為細菌CP4基因,它是RoundupReady性狀所需序列的關鍵部分。在該實施例中,供體系在CP4基因方面是固定的或者是純合的,並且希望將CP4滲入到回歸親本品系中。育種者在靠近CP4供體親本的一行15個種子的一行中種植回歸親本的15個種子。通過用來自回歸親本的花粉對供體的穗授粉進行四個雜交。得到的種子是Fl種子。種植三行,回歸親本行種植在兩行從一個或兩個外觀最佳的Fl穗獲得的Fl種子之間。在花粉散播時,用回歸親本對側面每一行中的4個Fl授粉(總共8個雜交)。從每行收穫最好的兩個BCl穗,並且膨脹BCl種子。平均起來,預期BCl種子含有25%的供體基因組和75%的回歸親本基因組,但是,任一個體植物的提取物含量在正常分布內變化。通過選擇具有最高回歸親本基因組並且含有轉基因的種子亞組加強隨後的回交工作。BCl種子也將是CP4轉基因分離的,利用測序確定93個BCl植物中哪些具有最高含量的回歸親本核酸序列並且含有轉基因。希望的亞組可以通過觀察在許多基因座(例如96)處的序列來確定,其中所述基因座之一是CP4基因座。將來自每個親本、Fl批和93個BCl中的每一個的種子種植在行中,並栽培植物。在V4階段(第4葉階段),從每個植物上取葉液(leaftear),並且置於96孔板的一個孔中。按照Dellaporta等人,1983PlantMolBiolRep119-21(在此全文引入作為參考)所述的方法製備DNA。來自96個基因座中每一個的DNA進一步使用初始擴增來製備。在該實施例中,利用擴增引入DNA標籤和連接體,但是其它方法也是已知的和適用的。設計基因座特異性正向引物,其在將與靶基因座的5'雜交的3'末端含有18個核苷酸。正向引物的5'末端也含有與通用正向PCR引物3'端的15個核苷酸匹配的15個核苷酸。以類似的方式設計反向PCR引物,其中3'末端的18個鹼基與靶基因座3'核苷酸互補。反向引物在與通用反向引物的3'末端匹配的5'末端上也含有15個鹼基對。在該實施例中,靶基因座為6-10個核苷酸,但是它們可以在從恰好2個核苷酸到幾百個或更多核苷酸的範圍內變化。對96個基因座中的每一個重複該方法,其中一個基因座是CP4基因座。選擇95個基因座覆蓋每個染色體的每個臂,並且包括少數位於CP4基因座側翼的額外的標記。除了基因特異性引物以外,也設計通用引物。合成正向通用引物,其在正向基因特異性引物的5'末端含有15個核苷酸。合成反向通用引物,其與反向基因特異性引物上的通用PCR核苷酸雜交,並且另外在5'末端含有5個核苷酸的標籤。合成九十六(96)個不同的通用反向引物,每個引物含有獨特的標籤序列,該標籤序列選自在5個核苷酸位置的每一個處由4個鹼基之一提供的1024種可能的組合。樣品使用標準條件進行PCR。開始幾輪PCR的目的是將通用引物和DNA標籤引入有限拷貝數的每個基因座中。將96個基因特異性正向和反向引物對稀釋,然後組合形成複合的、等摩爾的貯備溶液,終濃度為每升溶液10μmol總寡核苷酸。PCR測定含有IXPCR緩衝液、2.5mMMgCl2、0.2mMdNTP混合物、IUTaqDNA聚合酶、1μM正向通用引物、IOOnM複合引物和1μ1DNA提取物。另外,對於ΙμΜ的終濃度,向每個獨特樣品中加入獨特標記的反向通用引物。循環在ABI7900中進行,採用以下循環程序94°C初始變性90秒;然後94°C30秒、55°C30秒和72°C30秒的4個循環;然後94°C30秒和72°C60秒22個循環。通過PCR或連接引入DNA標籤是該方法的關鍵,後來的擴增不一定是必要的,但是可以有利於準備測序中的下遊樣品處理步驟。PCR後,通過在2%瓊脂糖凝膠上進行瓊脂糖凝膠電泳,然後用溴化乙錠染色以證實單一產物的存在,檢測2μ1的擴增產物。具有陽性PCR反應的分析組合為單一集合,並使用Qiagen試劑盒(Qiagen,USA)純化。純化的產物然後按照廠商方案(IlluminaGenomeAnalyzerIG分析儀,Illuminhlnc.)進行高通量測序。從每個測序的分子獲得兩個讀數。第一個讀數使用對應於正向通用PCR引物序列的引物獲得。該測序引物導致在對其設計引物的基因座處和給定樣品內的序列為短讀數,如根據標籤所確定的。使用短運行從設計為與反向通用引物序列雜交的測序引物讀取標籤。該第二序列讀數在完成基因座序列的讀取後重新開始。從測序反應獲得的序列根據DNA標籤序列裝箱。這通過將第二序列讀數修剪為DNA標籤然後在一個運行內彼此blast標籤而進行。在每個樣品箱內,序列聚類以組合同一基因座的多個讀數。然後將給定基因座處的序列與回歸親本和供體親本和CP4基因的預期序列比較(使用BLAST)。如果所有序列讀數都與回歸親本匹配,則該基因座被稱為對於回歸親本是固定的。如果所有序列都與供體親本匹配,則該基因座對於供體親本是固定的,並且需要一個或多個另外的回交向該群體內重新引入該基因座的回歸親本核酸。如果回歸親本和供體親本序列都被觀察到,則該基因座被稱為雜合的,並且該品系可以自交或進一步回交,以對回歸親本固定。所有95個基因座和CP4基因座都遵循這一邏輯。選出具有最大數目的回歸親本基因座並且含有CP4基因座的後代進一步回交,以進一步在所有基因座處滲入和固定回歸親本核酸,除了CP4基因座處的供體核酸以外。本發明進一步涉及使用此處描述的方法滲入2個或更多的基因組區域,該區域可以是轉基因的或常規的(即QTL)。實施例3.使用HT測序的分子指紋分析(序列指導的指紋分析)核苷酸序列是個體植物的遺傳組成和植物品種/品系之間遺傳相似性的最後估計和量度。基於核苷酸譜的分子指紋可以提供基因組中的一般信息,該信息在各種應用中尤其可以用於評估種質多樣性、幫助選擇高表現的親本和測交系、針對可能的滲入靶標查詢新的種質庫、針對與至少一個目標表型相關的基因組區域查詢新的或已有的種質庫,以及保護種質的智慧財產權。如果兩個品系足夠不同,它們可能處在不同的雜種優勢群中。即,它們可能彼此互補,並且當雜交時,具有產生生產性育種雜交或雜種組合的高可能性。另一方面,品系之間的相似性可以提示潛在的亞最佳雜交。此外,指紋相似性為評價智慧財產權侵權提供了基礎。分子指紋可以集中於選擇的基因組區域,並且揭示特定基因座處的序列信息,包括但不限於引起經濟學上重要的性狀或者與之連鎖的那些基因座。在一個或多個基因座處是否存在特定核苷酸序列或特定核苷酸序列變體可能與目標性狀相關,並且用來預測這些性狀的表現,以及選擇高表現的品系代替直接基因型分型。分子指紋可以基於整個基因組序列產生,這是高成本的和費時的,並且通常不實用。在測序之前可以使用各種方法降低基因組複雜性以產生基於基因組一小部分(選擇的區域或基因座)的指紋。本發明提供比現有技術更有效的和更經濟的方法,該方法涉及多種遺傳多態性的基於PCR的檢測。其中,通過PCR擴增選擇的多態性區域/基因座,然後利用HT測序直接基因型分型。可以利用多重PCR同時擴增多達數十萬個這樣的區域/基因座。使用DNA標籤複合樣品可以進一步利用每輪通過HT測序方法產生的大量序列信息。對於分子指紋分析,第一步是選擇多態性區域或基因座,以用來產生基於核苷酸序列的分子指紋。SNP是候選基因座的一個來源,儘管它們不是唯一的來源。使用的基因座數目取決於多種因素,包括但不限於該計劃的目標和預算以及所研究的基因組的結構。例如,我們選擇384個玉米SNP來證明分子指紋分析方法,儘管單HT測序運行的能力允許使用更大的一組SNP。IlluminaGenomeAnalyzer流動池的一個通道在每一測序運行中能夠產生大約600萬個序列讀數。因此可以同時對大約300,000個基因座進行基因型分型,具有大約20X的序列冗餘度。如果需要較少量的基因座,則通過複合樣品可以同時對來自96個不同樣品的大約3,000個基因座進行測序(見下文)。在最大化信息含量的嘗試中,基於包括玉米基因組中的平均分布和大於3.0的多態性信息含量(PIC)值的特徵從較大的SNP集合中選擇這384個SNP。SNP的一部分與玉米中的重要表現相關特徵連鎖。第二步是使用多重PCR擴增選擇的基因座。為每個SNP合成一對寡核苷酸,其中之一與SNP中多態性核苷酸5'的核苷酸序列匹配,另一個與多態性核苷酸3'的區域互補。對於最佳測序結果,儘管不是必需的,但兩個寡核苷酸之間分離與HT測序方法建議的片段大小相匹配的長度(對於IlluminaGenomeAnalyzer為50-150個核苷酸),其中之一與多態性核苷酸相鄰但是不重疊。為了提高多重PCR的效率,設計用於384個基因座的寡核苷酸,使得它們彼此幹擾最小,並且產生的384個PCR產物具有相似的長度和GC含量。使用含有基因組特異性序列的由兩部分構成的寡核苷酸和通用PCR引物的兩階段PCR也可以幫助提高多重PCR的效率。當使用兩階段PCR時,使用的HT測序方法需要能夠通過通用PCR引物和基因組特異性寡核苷酸測序,以達到目標多態性核苷酸。否則,需要處理PCR產物,以確保測序讀入多態性核苷酸。另一個選擇是使用測序引物作為通用PCR引物的一部分(參見實施例2),以減少測序引物和將要測序的核苷酸之間的核苷酸數。儘管能夠基於實驗目的和/或給定樣品群體中各個基因座的信息量「如希望地」集合基因座,但是對於分子指紋分析,選擇的基因座通常用作固定組。384對寡核苷酸(每個選擇的基因座一對)在水中稀釋,並且合併在一起達到每種寡核苷酸5nM的終濃度。使用標準提取方案從每個將要進行指紋分析的玉米品系製備DNA。根據實驗中品系的數目和樣品複合形式,將大約各IOOngDNA(根據使用的基因座數目和基因組的大小而變化)分配到96孔或384孔微量滴定板中。在該實施例中,我們指紋分析了96個玉米近交系。按照標準PCR方案將PCR主混合物連同高保真度DNA聚合酶一起添加到每個孔中。最後,向每個孔中添加384對寡核苷酸的混合物至終濃度為每種寡核苷酸為0.5nM並且終體積為10μL。PCR條件的一個例子是94°Clmin,55°C2min,在7分鐘內從55°C升至72°C共25個循環,然後72°C7min。可以使用任何PCR方案,只要其能夠產生足以用於HT測序的來自所有選擇的基因座的特異性產物。為了最小化PCR擴增錯誤和基因座之間的不均勻擴增,通過減少循環數和/或寡核苷酸的量控制擴增。目的是產生相當於HT測序方法建議的起始DNA的PCR產物量。然後在與測序連接體連接之前按照HT測序的要求純化PCR產物。由於基因組DNA較大,在下遊測序反應中,PCR中使用的模板基因組DNA將不與PCR產物明顯競爭。為了獲得最佳結果,可以使用本領域已知的方法從PCR產物中除去模板DNA。實際上,如果為了連接使用Qiagen純化柱純化PCR產物,將除去大多數基因組DNA。在該實施例中,使用QiagenPCR純化試劑盒(96孔形式,根據廠商說明書)純化PCR產物並且除去模板基因組DNA(基因組DNA由於其大小而與柱子非常緊密地結合,並且難以洗脫)。最後,PCR產物與用於IlluminaGenomeAnalyzerHT測序的測序連接體連接。其它方法是本領域已知的,並且在本發明的精神和範圍內。實際上,如果在兩階段PCR方案中使用通用引物,並且使用連接體序列作為通用引物,PCR產物與連接體的連接不是必需的,因為它們已經通過PCR引入。為了利用IlluminaGenomeAnalyzer測序技術產生的大量序列信息,在測序反應中集合多個樣品,然後使用DNA標籤序列解析。DNA標籤通常是2-6個核苷酸(用於複合的16-4096個獨特標籤),儘管希望更長的序列,使得樣品的區別為一個以上的核苷酸差異,以減少錯誤。在各種因素中,樣品複合水平尤其取決於每個運行產生的測序讀數的數目、使用的基因座的數目和希望的冗餘水平。可以應用各種方法將DNA標籤引入測序模板(在該例子中為PCR產物)中,包括實施例2中的方法,S卩,在PCR引物中包含DNA標籤序列。或者可以合成不同形式的連接體,每種形式在3'末端添加一個獨特的DNA標籤序列;然後每種形式用於複合組中的一個樣品。在該實施例中,我們使用IlluminaGenomeAnalyzer提供的一組96個連接體,並且每個連接體根據廠商的說明在PCR板的96個孔之一中與PCR產物連接,這96個孔對應於樣品複合形式中的96個樣品之一。然後將96個孔中的連接產物合併到一個孔中,用於根據IlluminaGenomeAnalyzer的測序方案進行HT測序反應。384個SNP的相同的寡核苷酸混合物可以用來擴增更多的樣品,來自每板96個樣品的PCR產物可以與96種形式的連接體連接,並且合併到一個孔中進行HT測序。每個IlluminaGenomeAnalyzer流動池在每個測序運行中可以加工最多8個這樣的集合。從HT測序反應獲得的序列首先根據DNA標籤序列裝箱,將序列分配給集合中的96個樣品。在每個箱內,基於與多態性核苷酸相鄰的寡核苷酸序列對序列進一步分組,並且用於擴增PCR產物。每個箱中應當有384組序列,每一組對應於384個SNP基因座中的每一個。然後分析該序列,以確定在96個樣品中每一個中,在384個基因座的每一個處存在哪個等位基因。利用序列信息確定可以用來與經濟學上重要的性狀的表現相關聯的基因座處特定核苷酸序列或該核苷酸序列的特定變體的存在或不存在。一旦建立這種關聯,使用作為目的性狀的原因或與之緊密連鎖的特定序列或序列變體,可以利用該序列預測這些性狀的表現,並且選擇高表現的親本、測交系或後代以代替直接基因型分型。該序列或序列變體也可以用來估計以及用於提高有利的序列或序列變體的頻率。有時,多個基因座處的幾種核苷酸序列或核苷酸序列的變體的組合更能預測某些性狀。在緊密連鎖的基因座處使用該序列或變體的組合,即,在預定的單元型窗口內定義單元型,比個別處理基因座能提供更多的信息和預測。在連鎖的基因座處使用序列組合的其它優點是只需要有一亞類基因座具有關於整個基因組的信息,因為染色體在連鎖不平衡區組(單元型窗口)中遺傳,並且來自一個區組的選擇的基因座(標記基因座)處的序列信息能夠提供關於該區組上所有基因座的信息。實施例4.使用HT測序的分子指紋分析(序列指導的指紋分析)本發明提供比現有技術更有效和更經濟的方法,其涉及多個遺傳多態性的基於PCR的檢測。在此,擴增選擇的大豆多態性區域/基因座,然後直接使用HT測序進行基因型分型。在本實施例中,使用IlluminaGenomeAnalyzerHT測序技術評價了1536個基因座。本實施例也提供了間接測序方法,其中將等位基因特異性標籤引入相應的模板中,使得只需要對標籤進行測序以推斷多態性。如圖2-5所示,有多種策略用於降低基因組複雜性。為了指紋分析,可以使用本領域已知的一個或多個複雜性降低方法。在本實施例中,調節現有的基於PCR的SNP分析,以靶向已知的多態性,其中如圖4所示使用對應於SNP的PCR引物(直接指紋分析),或者如圖5所示使用等位基因特異性延伸/連接(間接指紋分析)。調節現有的SNP文庫對於參考一個或多個含有一組核心SNP的歷史基因型信息的資料庫特別有利。然後,為了能夠複合樣品摻入DNA標籤。在本實施例中,複合組中的每個樣品被分配有獨特的DNA標籤,即,與該組中的其它條碼有至少一個鹼基對不同的序列標籤。在一個優選方面,平衡G和C鹼基的百分比,以使測序過程中的偏差減至最小。DNA標籤的長度可以在大約2bp到大約20bp的範圍內。在本實施例中,對於96個樣品(種質樣品),5bp序列用於DNA標籤,每個DNA標籤有2個或更多的核苷酸不同(表2)。將這些樣品DNA標籤引入等位基因特異性標籤中,並且利用PCR將這些等位基因特異性寡核苷酸加入到等位基因特異性延伸/連接計劃中。在另一方面,可以使用連接反應將等位基因特異性標籤加入到延伸/連接產物中。表2.用於96個樣品的示例性的5核苷酸DNA標籤。?L密碼孔密碼孔密碼孔密碼~~ΠAAGCT~~Α4CAAGA~~Α7CTGTC~~AlOGTTCA~~ACACA~~Β4CACAG~~Β7CTTAG~~BlOGTTTC~~ClACAGC~~C4CACGT~~C7CTTCT~~ClOTACCT~D1ACCAG~~D4CACTC~~D7GAACA~~DlOTACGC~~ElACCTA~~E4CAGAC~~E7GAATC~~ElOTACTG~~FlACGAA~~F4CAGCA~~F7GACAT~~FlOTAGGT~~GlACGGT~~G4CAGTG~~G7GACGA~~GlOTAGTC~~HlACGTC~~H4CATCC~~H7GAGAG~~HlOTATCG~~A2ACTAC~~A5CCAAG~~A8GATAC~~AllTCATCB2ACTCT~~B5CCCAA~~B8GATGT~~BllTCCACC2AGACTC5CCTATC8GATTGCllTCCCAD2AGCAC~~D5CCTGA~~D8GCAAC~~DllTCGATtableseeoriginaldocumentpage34該指紋分析實施例包括1536個大豆SNP,其中將每個SNP處理為二等位基因的,因此具有兩個等位基因特異性寡核苷酸(等位基因特異性標籤加樣品DNA標籤)和一個基因座特異性寡核苷酸(圖7)。基因座特異性寡核苷酸在3'末端包含通用連接體序列,在此為GTCTGCCTATAGTGAG,通用連接體序列也可以是下遊測序所需的引物的一部分(即,11IuminaPCR2.1引物)。等位基因特異性寡核苷酸的長度大約為15個核苷酸,具有平衡的解鏈溫度。為了製備用於測序的模板,如上所述對每個組織樣品製備DNA。為了產生等位基因特異性延伸/連接產物,將等位基因特異性標籤和基因座特異性寡核苷酸與模板混合,開始時在70°C加熱,然後逐漸冷卻,接著對於DNA聚合酶和連接酶反應45°C15分鐘,如圖5所示。延伸/連接後,使用本領域已知的磁珠純化產物。隨後進行PCR以添加樣品DNA標籤,樣品DNA標籤緊靠等位基因特異性標籤添加,如圖12所示。使用96個(x2)正向引物,對應於96個種質樣品。另外,向5'末端添加IlluminaGenomeAnalyzer基因組測序引物,其中該序列的5'末端為ACACTCTTTCCCTACACGACGCTCTTCCGATCT+5-nt樣品條碼(96種形式)+15/16-nt等位基因密碼(2種形式)。使用一種反向引物,其對應於通用連接體序列,並且向該反向引物的5'末端添加IlluminaGenomeAnalyzerPCR引物2.1,其中該序列的3'末端為CAAGCAGAAGACGGCATACGAGCTCTTCCGATCT+CTCACTATAGGCAGAC。按照標準PCR方案,將PCR主混合物連同0.3U高保真度DNA聚合酶一起添加到5μL延伸/連接產物中,反應終濃度為0.16μM引物,0.ImMdNTP,終體積為25μL。將板於95°C加熱9分鐘以變性DNA。然後使用以下條件完成15個PCR循環94°C30sec,50°C30sec,72°C2min,最後在72°C下延伸10分鐘。按照IlluminaGenomeAnalyzer的說明使用富集PCR擴增大約5-lOng純化的模板。如果連接體沒有被引入引物中的話,富集PCR也添加下遊橋連PCR反應所需的連接體。再次使用本領域所知的PCR純化方法純化富集PCR產物,並且按照IlluminaGenomeAnalyzer的說明對產生的模板進行測序。從測序反應獲得的序列根據DNA標籤序列和等位基因特異性標籤序列進行裝箱。圖13顯示標記和大豆樣品的成功率,幾乎90%的標記和種質具有90-100%的檢出率(callrate)。本實施例使用等位基因特異性標籤,其在序列解析具有優點,使得樣品的基因型可以根據前20個鹼基對分配,因為前5個鹼基對確定種質樣品,而後來的15個鹼基對代表等位基因。在其它實施方案中,DNA標籤可以短至2個鹼基對,並且等位基因特異性標籤可以短至兩個鹼基對,以進一步減少基因型分型所需的序列讀數。在一個優選實施方案中,本發明的方法涉及根據複合程度,基於恰好2個鹼基對的標籤推斷基因型。在另一方面,本發明的方法涉及基於單鹼基對推斷基因型。同時產生大量指紋數據的能力,加上用連續序列飽和特定區域或者調節單元型、染色體或者甚至基因組中已知多態性位點的指紋數據的靈活性,為種質改良活動、確定目標基因組區域的實驗工作、質量保證和控制和監測IP保護提供了有價值的工具。實施例5.使用DNA標記的隨機引物的複雜性降低測序本發明的一個方面是同時對多個核酸模板進行測序的能力,該多個核酸模板可以包括來自不同個體或集合個體的樣品以及多個基因座。在該實施例中,我們使用用編碼系統標記的隨機引物(六聚體到十聚體,這取決於計劃)。該編碼系統由從2個核苷酸到隨機引物長度的一半不等的一系列非天然核苷酸序列組成。產生用至少兩個DNA標籤標記的隨機引物的混合物,以擴增和鑑定任何數目的基因組或基因組部分。然後通過任何測序方法確定擴增的序列,這些方法包括但不限於使用ABI3730或類似平臺的Sanger測序、使用454或類似平臺的焦磷酸測序,以及使用IlluminaGenomeAnalyzer測序設備或類似平臺的合成測序。預期該方法將在新測序技術出現時用在這些技術上面。本發明此方面允許研究人員合併DNA樣品,這為測序節約了有價值的金錢和時間資源。為了同時評價多個基因組或基因組區域,使用一組不同的DNA標記的隨機引物獨立擴增每個模板。隨機引物的長度取決於基因組的複雜性水平;重複序列越多,選擇性排除這些區域就需要越長的引物。一旦基因組被擴增,它們就可以通過給定測序技術特定的標準方法純化。為了使後面的步驟更容易,隨機引物也可以用捕獲分子如生物素標記。擴增後,純化的DNA可以通過任何核酸測序方法測序,並且進行比較,以確定基因組多樣性以及是哪些特定基因組導致多樣性。本發明的使用可以不使用DNA標籤,但是一旦為了測序而合併,就沒有辦法將序列「分開」,並且需要通過測序或特定基因型分型反應進行進一步的評價。該方法提供將序列標籤應用於多重基因組測序和基因型分型的非常新型的方法。實施例6.挖掘罕見等位基因使用直接核酸序列數據能夠檢測植物基因組中的罕見等位基因或單元型。對於在育種計劃中尋找罕見但是重要的基因組區域來說,這是特別重要的,例如來自外來的或未適應的(imadapted)種質的抗病性基因座,其中罕見的等位基因被定義為在種質庫內低頻率出現,並且可能以前在該種質庫內未檢測到。本實施例提供罕見等位基因的檢測方法、實驗設計(即選擇外來種質、具有已知目的表型的種質、篩選非優良gp)和應用(即,特定性狀的有益罕見變體的滲入計劃和/或在一個或多個特定種質庫中如每個成熟度區域擴大種質多樣性)。提供包含至少2份種質的一組種質。影響納入至少一個基因座的測序計劃中的非限制性因素包括種質來源或地理、至少一個目的基因型、至少一個目的表型、雜種雜交中的表現、轉基因的表現、和種質或關於種質及其表現的預測的其它發現。使用此處提供的方法,對至少2份種質的至少一個鹼基對進行測序。使用本領域已知的序列比對和計算機評價方法,確定差異和相似性並與來源種質進行關聯。確定目的等位基因後,可以作出選擇決定。在罕見等位基因的挖掘中,罕見等位基因可以與已知的表型相關聯。另外,罕見等位基因的確定可以為其它的表型分型、關聯研究和其它試驗提供基礎,以評價罕見等位基因對植物表型和育種表現的影響。此外,罕見等位基因的直接核酸序列可以通過本領域已知的和此處描述的方法立即確定,以用作標記,以在其它種質中檢測該罕見等位基因,用作選擇的基礎,以及促進該罕見等位基因向缺乏該罕見等位基因的種質中滲入。在其它方面,使用本領域已知的方法分離罕見等位基因,並且將分離的核酸轉化到植物中,以賦予接受植物優選的表型。接受植物隨後可以用作轉換程序的供體,以為了性狀整合目的與優良種質雜交。罕見等位基因的鑑定可用於挖掘任何種質庫(S卩,一組2份或更多份種質)的全部遺傳潛力。這可用於確定育種雜交策略、提高2個或多個種質庫之間的多樣性、評價雜種優勢庫、以及幫助作出育種決定。高通量測序既加速了等位基因的鑑定又允許同時檢測罕見等位基因和鑑定相關標記。權利要求一種植物育種方法,包括確定育種群體中至少一個或多個植物的基因組內多個核酸的序列;將每個核酸序列與一個數值相關聯;和基於該數值對所述一個或多個植物作出至少一個植物育種決定。2.權利要求1的方法,其中所述植物選自飼料作物、油籽作物、穀類作物、水果作物、觀賞植物、蔬菜作物、纖維作物、香料作物、堅果作物、草料作物、糖料作物、飲料作物、塊莖作物、塊根作物和森林作物。3.權利要求1的方法,其中所述數值是核酸序列效應估計值。4.權利要求1的方法,其中所述數值是育種值。5.權利要求1的方法,其中所述數值是核酸頻率。6.權利要求1的方法,其中所述表型性狀選自除草劑耐受性、抗病性、昆蟲或害蟲抗性、改變的脂肪酸、蛋白質或碳水化合物代謝、增加的穀物產量、增加的油、增加的營養成分含量、提高的生長速度、增強的應激耐受性、優選的成熟度、增強的感官特性、改變的形態特徵、不育性、其它農學性狀、用於工業應用的性狀、或對消費者有提高的吸引力的性狀。7.權利要求1的方法,其中所述作出至少一個植物育種決定的步驟包括基於所述至少一個數值在育種群體中選擇。8.權利要求1的方法,其中所述作出至少一個植物育種決定的步驟包括基於所述至少一個數值在一個或多個育種群體中選擇後代。9.權利要求1的方法,其中所述作出至少一個植物育種決定的步驟包括預測親本品系的後代表現,和基於預測的後代表現選擇親本品系。10.權利要求1的方法,其中所述作出至少一個植物育種決定的步驟包括為雜種種子生產選擇測交系。11.權利要求1的方法,其中所述作出至少一個植物育種決定的步驟包括基於所述至少一個數值在種質改良活動中發展品系。12.權利要求11的方法,其中所述種質改良活動選自品系和品種開發、雜種開發、轉基因事件選擇,進行育種雜交、通過自體受精測試和發展植物、品系或亞系的純化、使用植物或其部分進行轉化、使用植物或其部分作為表達構建體的候選物、和使用植物或其部分進行誘變。13.權利要求1的方法,其中所述作出至少一個植物育種決定的步驟包括基於至少一個與另一表型性狀相關的數值選擇至少一個表型性狀。14.一種植物育種方法,該方法包括;提供至少兩個植物,其中已經對該至少兩個植物中的每一個確定了至少一個基因座的至少一個核酸的序列信息;對所述至少一個基因座的至少兩個核酸序列確定對於至少一個表型性狀的核酸序列效應估計值;和基於確定的對於至少一個表型性狀的核酸序列效應估計值作出至少一個植物育種決定。15.權利要求14的方法,其中所述植物選自飼料作物、油籽作物、穀類作物、水果作物、觀賞植物、蔬菜作物、纖維作物、香料作物、堅果作物、草料作物、糖料作物、飲料作物、塊莖作物、塊根作物和森林作物。16.權利要求14的方法,其中所述表型性狀選自除草劑耐受性、抗病性、昆蟲或害蟲抗性、改變的脂肪酸、蛋白質或碳水化合物代謝、增加的穀物產量、增加的油、增加的營養成分含量、提高的生長速度、增強的應激耐受性、優選的成熟度、增強的感官特性、改變的形態特徵、不育性、其它農學性狀、用於工業應用的性狀、或對消費者有提高的吸引力的性狀。17.權利要求14的方法,其中所述作出至少一個植物育種決定的步驟包括基於一個或多個確定的核酸效應估計值在育種群體中選擇。18.權利要求14的方法,其中所述作出至少一個植物育種決定的步驟包括基於一個或多個確定的核酸效應估計值在一個或多個育種群體的後代中選擇。19.權利要求14的方法,其中所述作出至少一個植物育種決定的步驟包括基於一個或多個確定的核酸效應估計值選擇親本品系的預測的後代表現,和基於預測的後代表現在親本品系中選擇。20.權利要求14的方法,其中所述作出至少一個植物育種決定的步驟包括為雜種種子生產選擇測交系。21.權利要求14的方法,其中所述作出至少一個植物育種決定的步驟包括基於一個或多個確定的核酸效應估計值在種質改良活動中發展品系。22.權利要求21的方法,其中所述種質改良活動選自品系和品種開發、雜種開發、轉基因事件選擇,進行育種雜交、通過自體受精測試和發展植物、品系或亞系的純化、使用植物或其部分進行轉化、使用植物或其部分作為表達構建體的候選物、和使用植物或其部分進行誘變。23.權利要求14的方法,其中所述作出至少一個植物育種決定的步驟包括基於至少一個與另一表型性狀相關的數值選擇至少一個表型性狀。24.一種植物育種方法,該方法包括建立定義育種群體基因組內的多個基因座的指紋圖譜;將具有已知圖譜位置的QTL等位基因與作圖群體中的表型性狀相關聯;使用與表型性狀相關聯的多個基因座中的至少一個的至少一個核酸序列檢測至少一個其它植物中QTL等位基因的存在。25.權利要求24的方法,其中所述植物選自飼料作物、油籽作物、穀類作物、水果作物、觀賞植物、蔬菜作物、纖維作物、香料作物、堅果作物、草料作物、糖料作物、飲料作物、塊莖作物、塊根作物和森林作物。26.權利要求24的方法,其中所述表型性狀選自除草劑耐受性、抗病性、昆蟲或害蟲抗性、改變的脂肪酸、蛋白質或碳水化合物代謝、增加的穀物產量、增加的油、增加的營養成分含量、提高的生長速度、增強的應激耐受性、優選的成熟度、增強的感官特性、改變的形態特徵、不育性、其它農學性狀、用於工業應用的性狀、或對消費者有提高的吸引力的性狀。27.權利要求24的方法,其中該方法進一步包括基於預測的表型性狀的表達在育種群體中選擇。28.權利要求24的方法,其中所述植物育種決定包括在一個或多個育種群體中的後代中選擇。29.權利要求24的方法,其中所述植物育種決定包括預測親本品系的後代表現,和基於預測的後代表現在親本品系中選擇。30.權利要求24的方法,其中所述植物育種決定包括為雜種種子生產選擇測交系。31.權利要求24的方法,其中所述植物育種決定包括在種質改良活動中發展品系。32.權利要求31的方法,其中所述種質改良活動選自品系和品種開發、雜種開發、轉基因事件選擇,進行育種雜交、通過自體受精測試和發展植物、品系或亞系的純化、使用植物或其部分進行轉化、使用植物或其部分作為表達構建體的候選物、和使用植物或其部分進行誘變。33.權利要求24的方法,其中所述植物育種決定包括基於至少一個與另一表型性狀相關聯的數值選擇至少一個表型性狀。34.權利要求24的方法,其中所述檢測的核酸序列是等位基因特異性標籤。35.一種標記輔助的育種方法,包括提供包括至少兩個植物的育種群體;將至少一個表型性狀與育種群體的植物的基因組的至少一個基因座相關聯,其中該基因座由至少一個核酸序列定義;和檢測該育種群體的後代植物中與至少一個表型性狀相關聯的該至少一個基因座的至少一個核酸序列的存在;和對該育種群體的一個或多個後代作出植物育種決定。36.權利要求35的方法,其中所述植物選自飼料作物、油籽作物、穀類作物、水果作物、觀賞植物、蔬菜作物、纖維作物、香料作物、堅果作物、草料作物、糖料作物、飲料作物、塊莖作物、塊根作物和森林作物。37.權利要求35的方法,其中所述表型性狀選自除草劑耐受性、抗病性、昆蟲或害蟲抗性、改變的脂肪酸、蛋白質或碳水化合物代謝、增加的穀物產量、增加的油、增加的營養成分含量、提高的生長速度、增強的應激耐受性、優選的成熟度、增強的感官特性、改變的形態特徵、不育性、其它農學性狀、用於工業應用的性狀、或對消費者有提高的吸引力的性狀。38.權利要求35的方法,其中所述植物育種決定包括在育種群體中選擇。39.權利要求35的方法,其中所述植物育種決定包括在育種群體的後代中選擇。40.權利要求35的方法,其中所述植物育種決定包括預測後代表現和基於預測的後代表現在親本品系中選擇。41.權利要求35的方法,其中所述植物育種決定包括為雜種種子生產選擇測交系。42.權利要求35的方法,其中所述植物育種決定包括在種質改良活動中發展品系。43.權利要求42的方法,其中所述種質改良活動選自品系和品種開發、雜種開發、轉基因事件選擇,進行育種雜交、通過自體受精測試和發展植物、品系或亞系的純化、使用植物或其部分進行轉化、使用植物或其部分作為表達構建體的候選物、和使用植物或其部分進行誘變。44.權利要求35的方法,其中所述植物育種決定包括基於至少一個與另一表型性狀相關聯的數值選擇至少一個表型性狀。45.權利要求35的方法,其中所述檢測的核酸序列是等位基因特異性標籤。46.一種選擇用於育種計劃的育種群體的方法,包括提供至少兩個不同的育種群體;對所述育種群體的至少一個基因座的至少兩個核酸使用對於至少一個表型性狀的多個育種值;和基於至少一個育種值選擇至少一個育種群體。47.權利要求46的方法,其中所述育種群體包括選自飼料作物、油籽作物、穀類作物、水果作物、觀賞植物、蔬菜作物、纖維作物、香料作物、堅果作物、草料作物、糖料作物、飲料作物、塊莖作物、塊根作物和森林作物的植物。48.權利要求46的方法,其中對至少一個表型性狀計算所述育種值,所述表型性狀選自除草劑耐受性、抗病性、昆蟲或害蟲抗性、改變的脂肪酸、蛋白質或碳水化合物代謝、增加的穀物產量、增加的油、增加的營養成分含量、提高的生長速度、增強的應激耐受性、優選的成熟度、增強的感官特性、改變的形態特徵、不育性、其它農學性狀、用於工業應用的性狀、或對消費者有提高的吸引力的性狀。49.權利要求46的方法,其中所述育種群體在種質改良活動中使用。50.權利要求49的方法,其中所述種質改良活動選自品系和品種開發、雜種開發、轉基因事件選擇,進行育種雜交、通過自體受精測試和發展植物、品系或亞系的純化、使用植物或其部分進行轉化、使用植物或其部分作為表達構建體的候選物、和使用植物或其部分進行誘變。全文摘要本發明提供利用直接核酸序列信息提高植物種質的育種方法和組合物。所述方法描述了植物育種群體的種質中優選的核酸序列的鑑定和積累。文檔編號A01H1/04GK101802219SQ200880024977公開日2010年8月11日申請日期2008年6月9日優先權日2007年6月8日發明者F·董,F·阿查德,N·陶,S·埃辛頓,S·多森,Z·瑪卡丁申請人:孟山都技術公司