調節作物中高水平組織優選表達的多核苷酸的製作方法
2023-09-21 22:26:45
專利名稱:調節作物中高水平組織優選表達的多核苷酸的製作方法
專利說明調節作物中高水平組織優選表達的多核苷酸 發明領域 本發明涉及農業生物技術領域。本文公開了能夠指導作物中高水平組織優選表達的分離的核酸,以及包含這樣的核酸的表達載體,和由其產生的植物。
背景技術:
在農學重要的穀類作物中,種子形成是植物發育的最終目標。將種子收穫用於食品、飼料及工業產品。這些種子的用途和價值由種子中所含有的蛋白質、油和澱粉的數量和品質決定。於是,所產生的種子的品質和數量可能在受精前至種子成熟的任何時點上受環境條件影響。尤其,在受精時刻及其附近的脅迫可以明顯地影響種子發育。包括穀類穀粒(cereal grain)在內的禾本科(Poaceae)成員產生幹的單種子果實。嚴格地說,這種類型的果實是穎果,但通常叫做核(kernel)或穀粒(grain)。核或穀粒包括種子和它的種皮(coat)或果皮。種子包括胚或胚芽,由珠心表皮包被的胚乳,以及種皮。胚是下一代的微型祖先,包括用於新植株的根和苗生長的細胞。這也是油和蛋白質在核中的貯存組織。胚乳更多是作為營養組織起作用,並以所需的貯存澱粉、蛋白質和油的形式為胚發芽及最初的生長提供所需的能量。
考慮到高等植物中核生長過程中發生的複雜調控,而且穀物是動物和人類共同的主要營養來源,用以改進這樣的營養來源所需的關鍵的工具包括基因啟動子,其可以驅動提高營養的基因的表達。另一方面,核對脅迫很敏感。針對植物的脅迫可以由生物介質和非生物介質引起。例如,脅迫的生物原因包括病原體感染、昆蟲採食及被另一種植物(如槲寄生)寄生以及反芻動物啃食。非生物性脅迫例如包括過量或不充分的可用水、不充分的光照、極端溫度、人工化學品(如除草劑)、大風、土壤極端pH、受限的營養獲得性和空氣汙染。然而,利用多種內部機制及外部機制以躲避或耐受脅迫,植物存活下來並且經常枝繁葉茂,甚至在不利條件下也是如此。植物對脅迫的生理應答反映在基因表達方面的改變。
儘管操作脅迫誘導型基因可能在改善植物的脅迫耐受性方面發揮重要作用,然而已經證實當脅迫不存在時,脅迫誘導型基因的組成型表達嚴重不利地影響植物生長和發育。因此,本領域需要驅動具有時間和/或空間差異性地表達的啟動子,旨在提供在重要時間處控制並指導在特定細胞或組織中基因表達的工具,尤其旨在提供脅迫耐受性或躲避。尤其,玉米的乾旱脅迫和/或密度脅迫經常導致減產。為穩定在不利環境下的植物發育及穀粒產量,調節種子萌發期間對核的激素和營養供應是有意義的。因此,需要在正常或非生物脅迫條件下驅動胚乳、胚或核中基因表達的轉錄調節元件。
描述了在種子或穀粒成熟期間賦予表達增強的啟動子,如大麥(barley)的大麥醇溶蛋白啟動子;見美國專利申請20040088754。在雙子葉植物中指導胚特異性或種子特異性表達的啟動子(例如大豆(soybean)伴大豆球蛋白啟動子;Chen 1988;油菜籽蛋白啟動子,Kridl 1991)通常不能在單子葉植物中指導相似的表達。不幸地是,相當少的啟動子被鑑定為特異性指導此方面的生理學(見例如US 20040163144)。
所描述的種子特異性或穀粒特異性啟動子包括與編碼植物種子貯藏蛋白的基因(如編碼大麥的大麥醇溶蛋白、稻(rice)的稻穀蛋白、水稻素、谷醇溶蛋白或球蛋白;小麥(wheat)的麥醇溶蛋白或麥谷蛋白;玉米(maize)的玉米醇溶蛋白或谷蛋白;燕麥(oat)的谷蛋白;高粱(sorghum)的高粱醇溶蛋白;黍(millet)pennisetins或黑麥(rye)的裸麥醇溶蛋白的基因)相關的那些啟動子。然而,這些啟動子的表達往往是滲漏的,或是低表達水平的。此外,用多個轉基因(「堆積」)改良作物植物的興趣正在增長。例如,單個玉米雜交體可以包含不僅賦予昆蟲抗性,也賦予特定除草劑抗性的重組DNA。然而,當用同一的調控序列來驅動多基因表達時,常常會觀察到基因沉默的現象。作物的代謝工程可能需要多個新的DNA調控序列,其驅動同一植物中不同轉基因以組織或時間上特異形式的表達。
因此,本領域迫切需要鑑定可以用於經濟重要的植物中表達所選擇的轉基因的新序列。本領域還需要在早期種子發育期間允許在胚乳或核中表達的轉錄調節序列。因此,本發明的一個目的是提供用於胚乳優選或核優選表達的新穎和備選的調控序列。該目的由本發明實現。
發明概述 本發明涉及農業生物技術領域。本文公開了能夠指導作物中高水平組織優選表達的分離的核酸,以及包含這樣的核酸的表達載體,和其產生的植物。
因此,本發明的第一個實施方案中涉及分離的植物轉錄調控元件,其包含的多核苷酸選自a)具有如SEQ ID NO1、2或3所示序列的多核苷酸;b)與SEQ ID NO1、2或3所示序列的多核苷酸有70%的序列同一性的多核苷酸;c)具有這樣的片段的多核苷酸,該片段具有如SEQ IDNO1、2或3所示序列的多核苷酸中至少50個連續核苷酸,或至少100個連續核苷酸,或至少200個連續核苷酸;d)多核苷酸,其在嚴格地條件下與包括具有如SEQ ID NO1、2或3所示序列的多核苷酸中至少50個連續核苷酸,或至少100個連續核苷酸,或至少200個連續核苷酸的多核苷酸雜交;以及e)與a)至d)中的任何多核苷酸互補的多核苷酸。
在一個實施方案中,該植物轉錄調控元件調節植物或者植物細胞中目的基因的胚乳優選表達。在另一實施方案中,該植物或植物細胞是單子葉植物或雙子葉植物。本領域內技術人員能認識到這種植物或植物細胞可以是,但不局限於,玉米、小麥、稻、大麥、燕麥、黑麥、高粱、香蕉、黑麥草、豌豆、苜蓿、大豆、胡蘿蔔、芹菜、番茄、馬鈴薯、棉花、菸草、胡椒、油菜、甜菜、甘藍、花椰菜、椰菜、萵苣和擬南芥(Arabidopsis thaliana)。此外,本領域內技術人員能認識到,植物轉錄調控元件可有效地與一個或多個核酸連接。
而另一個實施方案涉及,用分離的植物轉錄調控元件轉化植物,該植物轉錄調控元件包括的多核苷酸選自 a)具有如SEQ ID NO1、2或3所示序列的多核苷酸; b)與SEQ ID NO1、2或3所示序列的多核苷酸有70%的序列同一性的多核苷酸; c)具有這樣的片段的多核苷酸,該片段具有如SEQ ID NO1、2或3所示序列的多核苷酸中至少50個連續核苷酸,或至少100個連續核苷酸,或至少200個連續核苷酸; d)多核苷酸,其在嚴格地條件下與包括具有如SEQ ID NO1、2或3所示序列的多核苷酸中至少50個連續核苷酸,或至少100個連續核苷酸,或至少200個連續核苷酸的多核苷酸雜交;以及 e)與a)至d)中的任何多核苷酸互補的多核苷酸。
在一個實施方案中,該植物轉錄調控元件有效地與一個或多個異源核酸連接。這些異源核酸編碼的多肽使植物具有這樣的特徵或者特性,該特徵或者特性選自增加產量、脅迫條件下增強抗性、增加營養品質、增加或改變澱粉含量、和/或增加或改變種子或芽的含油量。該增加的營養品質和/或含油量可能包括增加至少一種化合物的含量,該化合物選自維生素、類胡蘿蔔素、抗氧化劑、不飽和脂防酸、多不飽和脂防酸或其胺基酸含量改變的蛋白質。同樣優選的是,該表達載體中功能性連接的核酸的轉錄導致了蛋白質的表達或功能性核苷酸的表達,該表達能夠影響靶植物中至少一個基因的功能。該功能RNA至少包括反義RNA、有義RNA、雙鏈RNA(dsRNA)、微RNA、小幹擾RNA(siRNA)或其組合。
在另一實施方案中,該有效連接的異源核酸所表達的調控RNA選自dsRNA、siRNA和微RNA(miRNA)。在又一個實施方案中,該轉錄調控元件調節一個或多個有效地連接的核酸的胚乳優選表達。在另一實施方案中,該植物是單子葉植物或雙子葉植物。本領域內技術人員能認識到,該植物可以是,但不局限於,玉米、小麥、稻、大麥、燕麥、黑麥、高粱、香蕉、黑麥草、豌豆、苜蓿、大豆、胡蘿蔔、芹菜、西紅柿、馬鈴薯、棉花、菸草、胡椒、油菜、甜菜、甘藍、花椰菜、椰菜、萵苣和擬南芥。
本發明的其他實施方案涉及核酸構建體或表達載體,其包括有效地與一個或多個異源核酸連接的植物轉錄調控序列。
本發明的一個實施方案提供了由轉基因植物生產的種子,該轉基因植物用有效地與一個或多個核酸連接的轉錄調控元件轉化。該通過轉基因植物產生的種子表達的蛋白質或功能RNA能夠影響靶植物中至少一個基因的功能。其中該種子或植物具有在脅迫條件下增強的抗性、和/或增加的產量、和/或增加的營養品質、和/或增加或改變的澱粉含量、和/或增加或改變的種子或芽的油含量。在另一實施方案中,該種子或植物是單子葉植物或雙子葉植物。在又一實施方案中,該種子或植物選自玉米、小麥、稻、大麥、燕麥、黑麥、高粱、香蕉、和黑麥草。
本發明的另一實施方案涉及一種方法,其用於使植物增加產量、增加脅迫耐性、增加營養品質、提高營養價值、增加或改變澱粉含量、和/或增加或改變種子或芽的含油量,其中該方法包括這些步驟 1)向植物細胞或植物中引入表達載體,該載體包括 A)植物轉錄調控元件,其選自 a)具有如SEQ ID NO1、2或3所示序列的多核苷酸; b)與SEQ ID NO1、2或3所示序列的多核苷酸有70%的序列同一性的多核苷酸; c)具有這樣的片段的多核苷酸,該片段具有如SEQ ID NO1、2或3所示序列的多核苷酸中至少50個連續核苷酸,或至少100個連續核苷酸,或至少200個連續核苷酸; d)多核苷酸,其在嚴格地條件下與包括具有如SEQ ID NO1、2或3所示序列的多核苷酸中至少50個連續核苷酸,或至少100個連續核苷酸,或至少200個連續核苷酸的多核苷酸雜交;以及 e)與a)至d)中的任何多核苷酸互補的多核苷酸; 該植物轉錄調控元件有效地與一個或多個異源核酸連接; B)其中該有效地連接的核酸編碼的多肽或RNA能夠使植物增加產量、增加脅迫耐性、增加營養品質、提高營養價值、增加或改變澱粉或者增加或改變植物的油含量; 2)篩選轉基因植物,其中該植物相對於野生型或無效分離子(nullsegregant)植物具有增加的產量,脅迫條件下增強的抗性、增加的營養品質、增加的營養價值、增加或改變的澱粉含量,或者增加或改變該植物的種子或芽的含油量。
用來獲得產量和/或脅迫抗性的各種核酸是本領域內技術人員已知。該核酸可以包括但不局限於編碼多肽的多核苷酸,該多肽參與生物合成植物激素、植物激素調節、細胞周期調控、或碳水化合物的代謝。營養品質、營養價值、澱粉含量和含油量的定義如下。
本發明的另一實施方案涉及分離的植物轉錄終止元件,其包括的多核苷酸選自 a.具有如SEQ ID NO4或者SEQ ID NO5所示序列的多核苷酸; b.與SEQ ID NO4或者SEQ ID NO5所示序列的多核苷酸有70%的序列同一性的多核苷酸; c.具有這樣的片段的多核苷酸,該片段具有如SEQ ID NO4或者SEQID NO5所示序列的多核苷酸中至少50個連續核苷酸,或至少100個連續核苷酸,或至少200個連續核苷酸; d.多核苷酸,其在嚴格地條件下與包括具有如SEQ ID NO4或者SEQID NO5所示序列的多核苷酸中至少50個連續核苷酸,或至少100個連續核苷酸,或至少200個連續核苷酸的多核苷酸雜交;以及 e)與a)至d)中的任何多核苷酸互補的多核苷酸。
附圖概述
圖1展示了玉米SSI啟動子區(pEXS1033)(SEQ ID NO1)。
圖2展示了質粒pEXS1032中的玉米SSI啟動子(mutNcoINdeI)區(SEQ ID NO2)。
圖3展示了OsSSI啟動子(pEXS1031)(SEQ ID NO3)。
圖4展示了質粒RLM661中的OsSSI終止子(t-OSSSI-3)(SEQ IDNO4)。
圖5展示了質粒RLM662中的OsSSI終止子(t-OSSSI-5)(SEQ IDNO5)。
圖6a和6b展示了SEQ ID NO1和SEQ ID NO2的序列比對。該項分析是利用Fast運算法則用Vector NTI軟體包執行(缺口開口15,缺口延伸6.66和缺口分離8,矩陣是swgapdnamt)。
發明詳述 除非另有說明,本文所使用的術語應按照相關領域內的普通技術人員的常規用法理解。分子生物學中常用術語的定義,可以在該領域內技術人員已知的許多參考資料中找到,包括但不局限於,Rieger等,1991 Glossaryof geneticsclassical and molecular,第5版,BerlinSpringer-Verlag;和Current Protocols in Molecular Biology,F.M.Ausubel等合編,CurrentProtocols,Greene Publishing Associates出版公司和John Wiley & Sons出版公司的短期合夥,(1998年增刊)。
必須注意的是,在本文和所附的權利要求書中使用時,除非上下文另有明確規定,單數形式「一個/種」或「該」包括複數。
如本文中所用,詞語「或」意指特定列舉的任一成員並且也包括所列舉成員的任意組合。
術語「約」在本文中用來意指大約地、粗略地、左右或在……範圍內。當術語「約」與數字範圍相連使用時,該術語通過延伸邊界值高於和低於所述值而修飾這個範圍。通常,術語「約」在本文中用來以高於和低於一個數字值的10%以上或以下(之上或之下)的變異修飾所述值。
在本文使用的術語「核酸」、「核苷酸」或「多核苷酸」旨在包括DNA分子(例如cDNA或基因組DNA)、RNA分子(例如mRNA)、天然存在、突變、合成的DNA或RNA分子、以及使用核苷酸類似物產生的DNA或RNA的類似物。可以是單鏈或者雙鏈。這種核酸或多核苷酸包括但不限於結構基因的編碼序列、反義序列、不編碼mRNA或蛋白質產物的非編碼調控序列。多核苷酸可以編碼有價值的農藝性狀或表型特性。
術語「基因」廣泛用於指任何與生物功能相關的核酸片段。因此,基因包括基因組序列中的內含子和外顯子,或者就是cDNA中的編碼序列和/或其表達所需的調控序列。例如,基因是指表達mRNA或功能RNA、或者編碼特定蛋白質的核酸片段,且包括調控序列。
本文可互換使用的術語「多肽」和「蛋白質」指的是連續胺基酸殘基的聚合物。
本文所使用的術語「轉基因」是指通過實驗操作引入到細胞基因組中的任何多核苷酸。轉基因可以是「內源DNA」、或「異源DNA」。「內源DNA」是指在所導入的細胞中天然存在的多核苷酸,只要其相對於自然存在的多核苷酸不包含任何的修飾。「異源DNA」是指多核苷酸,其與這樣的多核苷酸連接,該多核苷酸在自然中不與之相連,或者該多核苷酸在自然中在不同位置與之相連。外源DNA並不是在其引入的細胞中內生的,而從另一個細胞中獲得。異源DNA可以包括包含了一些修飾的內源DNA。
本文所使用的「細胞」或「植物細胞」是指單個細胞,也包括細胞群體。該群可以是包含一種類型細胞的純的種群。同樣,該群體可以包含一種以上的細胞類型。本發明所指的植物細胞可以是分離的(例如懸浮培養物),或包括在任何發展階段的植物組織、植物器官或植物中。
本文所用的術語「有效地連接」或「功能上連接」是指在核酸序列之間相連接,使一個序列的功能受另一個的影響。例如,如果兩個DNA的定位使得調控DNA影響編碼DNA的表達,則稱調控DNA與表達RNA或編碼多肽的DNA「有效地連接」。
本文使用的術語「特異」或「優選」是指基因產物的表達僅限於一種或幾種植物組織(特別限制)和/或一個或幾個植物發育階段(暫時限制)。已知幾乎沒有真正的特異性存在啟動子似乎優選在一些組織中啟動,而在其它組織可以沒有或只有很少的活性。這種現象也可以被稱為不同「遺漏」水平的遺漏表達。在植物其他部位的一個或者幾個具有較低水平的組成性表達的植物組織中,遺漏也可以顯示為優選表達。
「5』非編碼區」或「5』-非翻譯區」或「5』UTR」指位於編碼序列5』(上遊)的核苷酸序列。這種核苷酸序列存在於充分加工的mRNA的起始密碼子上遊並且可以影響初級轉錄物的加工、mRNA穩定性或翻譯效率。
「3』非編碼區」或「3』-非翻譯區」或「3』UTR」指位於編碼序列3』(下遊)的核苷酸序列並且包括聚腺苷酸化信號序列和其他序列,其中所述的其他序列編碼能夠影響mRNA加工過程或基因表達的調節信號。聚腺苷酸化信號通常以影響聚腺苷酸添加至mRNA前體的3』末端為特點。
本文使用的術語「轉錄調控元件」是指多核苷酸,其能夠調控有效連接的多核苷酸的轉錄。包括但不限於啟動子、增強子、內含子、5』UTR和3』UTR。
本文使用的「RNAi」或「RNA幹擾」是指由雙鏈RNA(dsRNA)介導的、序列特異性的轉錄後基因沉默的過程。本文所使用的「dsRNA」是指部分或完全雙鏈的RNA。雙鏈RNA也稱為小或短幹擾RNA(siRNA)、短幹擾核酸(siNA)、短幹擾RNA、微RNA(miRNA)等。在RNA幹擾過程中,將dsRNA引入寄主細胞,所述dsRNA包括與一部分靶基因基本上相同的第一鏈、和與第一鏈互補的第二鏈。引入之後,靶基因特異性dsRNA被處理成相對小的片段(siRNA),並且隨後能夠分布於宿主細胞各處,導致功能喪失突變,其在一代期間的表型可能與靶基因全部或部分缺失而產生的表型非常相似。可選地,靶基因特異性dsRNA被含有RNAi處理機制的植物細胞處理成相對小的約19-24bp的片段。
本文所使用的「細胞」或「植物細胞」是指單個細胞,也包括細胞群體。該群可以是包含一種類型細胞的純的種群。同樣,該群體可以包含一種以上的細胞類型。本發明所指的植物細胞可以是分離的(例如懸浮培養物),或包括在任何發展階段的植物組織、植物器官或植物中。
就植物而言,術語「組織」(或「植物組織」)意思是許多植物細胞的排列,包括分化和未分化的植物組織。植物組織可以構成植物器官的一部分(例如植物葉的表皮),但也可以構成腫瘤組織(例如愈傷組織)和不同類型的培養中的細胞(例如單細胞、原生質體、胚、愈傷組織、類原球莖(protocorm-like body)等)。植物組織可在植物、器官培養物、組織培養物或細胞培養物中。
就植物而言,術語「器官」(或「植物組織」)意思是植物的一部分,可以包括但不限於例如根、果實、苗、莖、葉、下胚軸、子葉、花葯、萼片、花瓣、花粉、種子等。
本文所使用的術語「植物」根據上下文可以理解為指整個植株、植物細胞、植物器官、芽、植物種子及其後代。用語「植物」亦指任何植物,特別是種子植物,可以包括但不限於作物植物。植物種類基本上與可用轉化技術處理的高等和低等植物的種類同樣廣泛,包括被子植物(單子葉和雙子葉植物)、裸子植物、蕨類植物、木賊(horsetail)、裸蕨植物、苔蘚植物和多細胞藻類。植物的屬可選自苜蓿屬(Medicago)、番茄屬(Lycopersicon)、芸苔屬(Brassica)、黃瓜屬(Cucumis)、茄屬(Solanum)、核桃屬(Juglans)、棉屬(Gossypium)、蘋果屬(Malus)、葡萄屬(Vitis)、金魚草屬(Antirrhinum)、楊屬(Populus),草莓屬(Fragaria)、擬南芥屬、雲杉屬(Picea)、辣椒屬(Capsicum)、藜屬(Chenopodium)、菊屬(Dendranthema)、牽牛屬(Pharbitis)、松屬(Pinus)、豌豆屬(Pisum)、稻屬(Oryza)、玉蜀黍屬(Zea)、小麥屬(Triticum)、小黑麥(Triticale)、黑麥屬(Secale)、黑麥草屬(Lolium)、大麥屬(Hordeum)、大豆屬(Glycine)、黃杉屬(Pseudotsuga)、伽藍菜屬(Kalanchoe)、甜菜屬(Beta)、向日葵屬(Helianthus)、菸草屬(Nicotiana)、南瓜屬(Cucurbita)、薔薇屬(Rosa)、草莓屬、百脈根屬(Lotus)、苜蓿屬、驢食草屬(Onobrychis)、車軸草屬(trifolium)、胡盧巴屬(Trigonella)、豇豆屬(Vigna)、橘屬(Citrus)、亞麻屬(Linum)、老鸛草屬(Geranium)、木薯屬(Manihot)、胡蘆巴屬(Daucus)、蘿蔔屬(Raphanus)、白芥屬(Sinapis)、顛茄屬(Atropa)、曼陀羅屬(Datura)、天仙子屬(Hyoscyamus)、菸草屬、碧冬茄屬(Petunia)、毛地黃屬(Digitalis)、Majorana、菊苣屬(Ciahorium)、萵苣屬(Lactuca)、雀麥屬(Bromus)、天門冬屬(Asparagus)、金魚草屬、萱草屬(Heterocallis)、水仙屬(Nemesis)、天竺葵屬(Pelargonium)、稷屬(Panieum)、狼尾草屬(Pennisetum)、毛莨屬(Ranunculus)、千裡光屬(Senecio)、喇叭舌屬(Salpiglossis)、藍英花屬(Browaalia)、菜豆屬(Phaseolus)、燕麥屬(Avena)和蔥屬(Allium)。
本文所使用的術語「植物」可以是單子葉作物,例如,穀類植物,包括小麥、大麥、高粱、黑麥、黑小麥、玉米、稻、甘蔗和樹木,所述樹木包括蘋果、梨、溫柏(quince)、李、櫻桃、桃、油桃、杏、番木瓜、芒果、楊、松、紅杉(sequoia)、雪松和橡樹。本文所使用的術語「植物」可以是雙子葉作植物,例如豌豆、苜蓿、大豆、胡蘿蔔、芹菜、番茄、馬鈴薯、棉花、菸草、胡椒、油菜(oilseed rape)、甜菜、甘藍、花椰菜、椰菜、萵苣和擬南芥(Arabidopsis thaliana)。
本文所使用的術語「轉基因」意指細胞和/或植物,其含有轉基因或其基因組已由於引入轉基因而改變,或已整合外源基因或多核苷酸。可以用若干方法產生轉基因細胞、組織、器官和植物,包括通過人工幹涉將包含多核苷酸(通常是DNA)的「轉基因」引入靶細胞或將轉基因整合到靶細胞的染色體的方法,如本文所述的方法。
本文所使用的術語「純種」是指對於某一特定性狀的許多植物,其對該性狀的遺傳純合達到這樣的程度,當純種的品種自花授粉,後代中觀察不到該性狀顯著量的獨立分離。
本文所使用的術語「無效分離子」是指由於孟德爾分離法則而不含有轉基因的轉基因植物的後代(或基於該後代的株系)。
本文使用「野生型」是指植物細胞、種子、植物成分、植物組織、植物器官或整個植物,其未經基因修飾或者實驗處理。
本文使用的「對照植物」是指植物細胞、外植體、種子、植物成分、植物組織、植物器官或整個植物,其用於和轉基因或基因修飾的植物進行對照,目的是鑑定轉基因或基因修飾植物中的增強表型或期望性狀。「對照植物」在一些情況下可以是轉基因植物株系,其包含空載體或標記基因,但不包含存在於所評價的轉基因或基因改造植物中的目的重組多核苷酸。對照植物可以與所測試的轉基因或基因改造植物是同一株系或者品種,或可以是另一株系或品種,如已知具有特定的表型、特徵或已知基因型的植物。本文中適當的對照植物包括用來產生轉基因植物、基因上未被改變或非轉基因的親本株系的植物。
本文所使用的術語「性狀」是指植物或者特定植物材料或細胞的生理的、形態的、生化的、或物理的特性。在一些情況下,這種特點是肉眼可見的,如種子或植物的大小,或者可以通過生化技術來測量,如檢測種子或者葉中蛋白質、澱粉、或油的含量,或者觀察代謝或生理過程(例如通過測量對缺水或特定濃度的鹽或糖的耐性),或者觀察一個基因或多基因表達水平(例如通過採用Northern分析、RT-PCT、微陣列基因表達測定),或者農藝觀察如滲透脅迫耐性或產量。可以使用任何技術測量轉基因植物中任何選定的化學化合物或的高分子的數量、相對水平、或差異。
通過參考以下本發明優選的實施方案的詳細說明以及其中的實施例,將更容易理解本發明。然而,應該了解的是,本發明不局限於特定的核酸、特定的多肽、特定的細胞類型、特定的宿主細胞、特定的條件、或特定的方法等,因為這些當然可能會有變化,並且其中的許多修飾和變化對於該領域的技術人員是顯而易見的。還應該了解的是,本文所使用的術語僅僅是為了描述具體實施方案,且並無意限制。
用於克隆、DNA和RNA分離、擴增和純化的標準技術,涉及DNA連接酶、DNA聚合酶、限制性內切酶等的酶反應的標準技術,以及各種分離技術是本領域的技術人員已知和常用的。許多標準技術於Sambrook和Russell,2001 Molecular Cloning,第三版,Cold Spring Harbor Laboratory,Plainview,New York;Sambrook等,1989 Molecular Cloning,第二版,Cold Spring Harbor Laboratory,Plainview,New York;Maniatis等,1982Molecular Cloning,Cold Spring Harbor Laboratory,Plainview,New York;Wu(編)1993 Meth.Enzymol.218,第I部分;Wu(編)1979 MethEnzymol.68;Wu等,(合編)1983 Meth.Enzymol.100和101;Grossman和Moldave(合編)1980 Meth.Enzymol.65;Miller(編)1972Experiments in Molecular Genetics,Cold Spring Harbor Laboratory,ColdSpring Harbor,New York;Old和Primrose,1981Principles of GeneManipulation,University of California Press,Berkeley;Schleif和Wensink,1982 Practical Methods in Molecular Biology;Glover(編)1985 DNACloning卷I和II,IRL Press,Oxford,UK;Hames和Higgins(合編)1985Nucleic Acid Hybridization,IRL Press,Oxford,UK;和Setlow和Hollaender 1979 Genetic EngineeringPrinciples and Methods,卷1-4,Plenum Press,New York中有所描述。所用的縮寫和名稱為本領域內標準和專業期刊(如本文引用的)中常用的。
本發明首次描述了澱粉合成酶基因上遊的調控元件。因此,本發明的一個實施方案涉及分離的植物轉錄調控元件,其包括的多核苷酸選自 a)具有如SEQ ID NO1、2或3所示序列的多核苷酸; b)與SEQ ID NO1、2或3所示序列的多核苷酸有70%的序列同一性的多核苷酸; c)具有這樣的片段的多核苷酸,該片段具有如SEQ ID NO1、2或3所示序列的多核苷酸中至少50個連續核苷酸,或至少100個連續核苷酸,或至少200個連續核苷酸; d)多核苷酸,其在嚴格地條件下與包括具有如SEQ ID NO1、2或3所示序列的多核苷酸中至少50個連續核苷酸,或至少100個連續核苷酸,或至少200個連續核苷酸的多核苷酸雜交;以及 e)與a)至d)中的任何多核苷酸互補的多核苷酸。
本發明也包括了分離的植物轉錄調控元件,該元件包括的多核苷酸序列,與SEQ ID NO1、SEQ ID NO2、或SEQ ID NO3、或其一部分所示的核苷酸序列,至少有約50-60%、或至少約60-70%、或至少約70-80%、80-85%、85-90%或90-95%、或者至少約95%、96%、97%、98%、99%或更多同一或相似。核酸序列比對長度至少為50個連續核苷酸、或至少為100個連續核苷酸、或至少為200個連續核苷酸。序列同一性和序列相似性定義如下。
在另一實施方案中,本發明的分離的核酸在嚴格的條件下與SEQ IDNO1、SEQ ID NO2、或SEQ ID NO3、或其一部分所示的多核苷酸雜交。在另一實施方案中,分離的核酸在嚴格的條件下與這樣的多核苷酸雜交,該多核苷酸包括SEQ ID NO1、2、或3、或者其一部分所示序列的多核苷酸中,至少50個連續核苷酸、或至少100個連續核苷酸、或至少200個連續核苷酸。本文所使用的術語「在嚴格的條件下雜交」意在描述雜交和衝洗的條件,在該條件下序列彼此之間至少有60%相似或相同的核苷酸通常保持彼此雜交。在另一實施方案中,該條件是彼此之間至少約65%,或者至少約70%,或至少約75%,或至少約80%或更多相似或相同的序列通常保持彼此雜交。這種嚴格的條件為本領域內技術人員已知並描述如下。嚴格條件的優選的非限制性例子是在6倍氯化鈉/檸檬酸鈉(SSC)中,於約45℃雜交,隨後在50-65℃用0.2倍SSC,0.1%的SDS洗滌一次或多次。
「雜交」,可以用來指示兩個核酸分子間相似或者同一性的水平,也可以在Southern或Northern分析中用來檢測同一或相似的核酸分子的存在。兩個DNA分子的雜交,取決於雜交程序和衝洗條件兩者的參數。「嚴格的雜交條件」和「嚴格的雜交衝洗條件」是序列依賴性的並且在不同環境參數下是不同的。雜交的穩定性表示為解鏈溫度Tm,Tm是50%的靶序列與完全匹配的探針雜交的溫度。特異性通常是雜交後洗滌的函數,關鍵因素是終末洗液的離子強度和溫度。對於DNA-DNA雜交,該Tm可以近似地由下面的等式(Sambrook等,1989)得到 a)Tm=81.5℃+16.6(log10[Na+]+0.41(%G+C)-0.61(%甲醯胺)-(600/L) 其中Na+=單價鈉陽離子的摩爾濃度 G+C=DNA中鳥嘌呤和胞嘧啶核苷酸的百分比 L=雜交鹼基對的長度 對於兩個異源序列間的雜交,同源性每減少1%,雜交雙鏈的Tm隨之減少約1℃(Sambrook等,1989)。因此,可以調節Tm、雜交條件和/或洗滌條件以便與具有目的同一性的序列雜交。通常,選擇的嚴格條件是在定義的離子強度和pH處低於具體序列的Tm約5℃。然而,極嚴格的條件可以使用比Tm低1、2、3或4℃時雜交和/或衝洗;中等嚴格的條件可以使用比Tm低6、7、8、9或10℃時雜交和/或衝洗;低嚴格的條件可以使用比Tm低11、12、13、14、15或20℃時雜交和/或衝洗。使用該等式、雜交和洗滌組合物以及想要的T,技術人員將理解雜交溶液和/或洗滌溶液嚴格性的變化是內在描述的。嚴格的雜交條件優選的非限制例子如上所述。
「反義」多核苷酸包括核苷酸序列,其與編碼蛋白質的「有義」核酸互補,例如與mRNA序列互補。因此,反義核酸可以通過氫鍵與有義核酸結合。
反義核酸可與整個靶基因或部分靶基因互補。反義核酸分子通常施用於細胞或原位產生,從而與細胞mRNA和/或基因組DNA雜交或結合。雜交可以在如上所述的嚴格的條件下進行。
而在另一個實施方案中,分離的核酸互補於SEQ ID NO1或SEQ IDNO2中所示的多核苷酸,或者互補於與SEQ ID NO1或SEQ ID NO2中所示的多核苷酸有70%的序列同一性的多核苷酸,或互補於與SEQ IDNO1中所示的多核苷酸雜交的多核苷酸。本文所使用的「互補」多核苷酸是指那些能夠根據標準的Watson-Crick互補規則進行鹼基配對的多核苷酸。具體來說,嘌呤將與嘧啶鹼基配對形成組合,該組合是鳥嘌呤與胞嘧啶配對(G:C),在DNA的情況下腺嘌呤或與胸腺嘧啶配對(A:T),或在RNA的情況下腺嘌呤與胸尿嘧啶配對(A:U)。
本發明還包括玉米或稻中得到的澱粉酶上遊的調控元件,其能夠調節作物中有效連接的異源核酸的組織特異性表達。因此,發明的另一實施方案涉及分離的植物轉錄調控元件,其包括的多核苷酸選自a)具有如SEQID NO1、2或3所示序列的多核苷酸;b)與SEQ ID NO1、2或3所示序列的多核苷酸有70%的序列同一性的多核苷酸;c)具有這樣的片段的多核苷酸,該片段具有如SEQ ID NO1、2或3所示序列的多核苷酸中至少50個連續核苷酸,或至少100個連續核苷酸,或至少200個連續核苷酸;d)多核苷酸,其在嚴格地條件下與包括具有如SEQ ID NO1、2或3所示序列的多核苷酸中至少50個連續核苷酸,或至少100個連續核苷酸,或至少200個連續核苷酸的多核苷酸雜交;以及e)與a)至d)中的任何多核苷酸互補的多核苷酸;並且其中的植物轉錄調節元件調節植物或者植物細胞中異源目的核酸的胚乳特異表達。
在一個實施方案中,任何轉錄調控元件中如a)、b)、c)、d)和e)所述的分離的核酸均能夠修飾植物中的轉錄,優選地,其能調節植物中的胚乳優選表達。在另一項實施方案中,本發明分離的核酸所包括的核苷酸序列與SEQ ID NO1、2或3或其一部分所示的核苷酸序列,至少有約50-60%、或至少約60-70%、或至少約70-80%、80-85%、85-90%或90-95%、或者至少約95%、96%、97%、98%、99%或更多同一或相似。核酸序列比對長度至少為50個連續核苷酸、或至少為100個連續核苷酸、或至少為200個連續核苷酸。在另一實施方案中,本發明的分離的核酸互補於SEQID NO1、2或3中所示的多核苷酸,或互補於與SEQ ID NO1、2或3中所示的多核苷酸有70%序列同一性的多核苷酸,或互補於在嚴格的條件下與SEQ ID NO1、2或3中所示的多核苷酸雜交的多核苷酸。
在另一實施方案中,該特定轉錄調控元件的同源物可以包括但不限於這樣的多核苷酸,其包括核苷酸片段缺失、單個或多個點突變、在特定限制性酶位點處改變、功能元件的增加或重排、或其他分子修飾手段。該修飾可能會也可能不會增強或改變所述核酸的轉錄調節活性。例如,本領域技術人員可以限定所述序列中的功能性元件並且刪除任意非必需元件。功能元件可以因任何特定的應用,而被修飾、合併或重排,以提高本發明的多核苷酸的效用或表達。在不刪除必需序列的情況下,也可通過移除或刪除非必需的序列,獲得本發明的轉錄調節性核苷酸序列的功能性等效片段。可以通過體外試誤法(trial-and-error)缺失突變或在計算機(in silico)中使用啟動子元件搜索常用程序,而實現將轉錄調節性核苷酸序列縮減至其必需和介導轉錄的元件。啟動子活性必需的區域經常顯示某些已知啟動子元件的簇集。此類分析可以使用可獲得的計算機算法如PLACE(「植物順式作用調節性DNA元件(Plant Cis-acting Regulatory DNA Elements)」;Higo1999,BIOBASE資料庫「Transfac」(Biologische Datenbanken GmbH,Braunschweig;Wingender 2001)或資料庫PlantCARE(Lescot 2002)進行。轉錄調控核苷酸序列的等同片段也可以通過刪除編碼mRNA 5』非翻譯區的區域而獲得,從而只提供(非轉錄)啟動子區域。可以通過本領域已知的方法(例如5』-RACE分析)方便地確定5』非翻譯區。因此,本發明的轉錄調控核苷酸序列中的一些,與其他序列是等同片段。
本發明預期,除了SEQ ID NO1、2或3中所示的特定多核苷酸之外,還可以使用SEQ ID NO1、2或3中所示的多核苷酸中的特定元件和同源物。此處所使用的術語「類似物」是指具有同一的或者相似的功能,但是在不相關的生物體中分別進化的基因。本文所使用的術語「同源物」是指一個基因與另一基因由於兩者是從共同的祖先DNA序列得到的後代而相關。術語「同源物」可適用於由於物種形成而分離的基因之間的關係(例如直向同源物),或由於基因複製而分離的基因之間的關係(例如旁系同源物)。本文所使用的術語「直向同源物」是指基因源於不同物種,但由共同的祖先基因通過物種形成進化而來。直向同源物在進化的過程中保留了相同的功能。直向同源物編碼的蛋白質具有相同或相似的功能。本文所使用的術語「旁系同源物」是指通過基因組內的複製而相關的基因。旁系同源物通常具有不同的功能或新的功能,但這些功能可能是相關的。
本文所使用的術語「等位基因變體」是指具有多態性的多核苷酸,該多態性導致該核苷酸所編碼蛋白質的胺基酸序列改變,且該多態性存在於天然群體(例如植物物種或種類)。這種天然等位基因變體通常可以導致編碼蛋白質的多核苷酸1-5%的差異。等位基因變體可以通過許多不同植物中目的核酸的測序鑑定,這可以容易地通過利用例如雜交探針進行,以鑑定這些植物中相同基因的遺傳基因座。由天然的等位基因變體而得、並且不改變所編碼蛋白質的功能活性的本發明的核酸中,任何及所有這樣的核酸的變體以及由此產生的胺基酸多態性或變體,均在本發明所涵蓋的範圍內。
本文所使用的術語「序列比對」是指一種方法,這種方法排列DNA、RNA或蛋白質的主要的序列,來識別這些區域之間由功能、結構或者進化關係而導致的相似區域。序列比對的計算方法一般分為兩類全局比對和局部比對。全局比對是一種整體優化的形式,其使比對貫穿所有查詢序列的全部長度。局部比對識別常常在整體上有很大程度不同的長序列中的相似區域。
本文所使用的術語「保守區」或「保守區域」是指異源的多核苷酸或多肽序列中的區域,其中在不同的序列之間存在相對較高程度的序列同一性。「保守區域」可以通過例如使用Clustal W算法進行多序列比對來鑑定。如本文中所用,「序列同一性」或「同一性」在兩個核酸序列或多肽序列的情況中意指在指定比較窗口範圍內為最大對應進行比對時,這兩個序列中相同的殘基,例如作為全局比對中的全部序列或局部比對中的相似區域。當序列同一性百分數用於蛋白質時,認識到不相同的殘基位置經常因保守性胺基酸置換而不同,其中胺基酸殘基被替換為具有相似化學特性(例如電荷或疏水性)的其他胺基酸殘基並且因而並不改變該分子的功能特性。當序列因保守性置換而不同時,序列同一性百分數可以上調以校正置換的保守性本質。因此類保守性置換而不同的序列稱作具有「序列相似性」或「相似性」。本領域技術人員熟知開展這種調整的方法。通常,這種方法包括將一個保守性置換評定為部分錯配而非完全錯配,因而提高序列同一性百分數。
本文使用的「序列同一性的百分比」或「序列同一性百分比意指通過比較一個比較窗口內兩個最佳比對序列所確定的值,其中,比較窗口中的一部分序列可能會包括這兩個序列最佳比對的缺口。原則上,通過這種方式計算該百分數,即通過確定其中相同核酸鹼基或相同胺基酸殘基在兩個序列內均存在的位置數目以產生匹配位置數,將匹配位置數除以比較窗口中的位置總數,並且結果乘以100以產生所述序列同一性百分數。蛋白質序列的「序列相似性百分比」可以使用相同的原則計算,其中,保守取代算作部分而非完全錯配。因此,例如當給予相同胺基酸的分數是1,給予非保守取代的分數為0,則給予保守取代的分數在0和1之間。保守取代的得分可由本領域已知的胺基酸矩陣獲得,例如Blosum或PAM矩陣。
用於比較的序列比對方法是本領域內眾所周知的。可以通過利用數學算法確定兩個序列之間的同一性百分比或者相似性百分比(對於蛋白質)。這種數學算法優選的非限制的例子是Myers和Miller算法(Bioinformatics,4(1)11-17,1988)、Needleman-Wunsch全局比對法(J.MoI.Biol.,48(3)443-53,1970)、Smith-Waterman局部比對法(J.MoI.Biol.,147195-197,1981)、Pearson和Lipman的相似性搜索法(PNAS,85(8)2444-2448,1988)、Karlin和Altschul算法(Altschul等人,J.MoI.Biol.,215(3)403-410,1990;PNAS,905873-5877,1993)。
可以利用計算機實現這些數學算法,用於序列比較,以確定序列同一性或鑑定同源物。這樣的實現包括但不限於下述程序。
BLAST(Basic Local Alignment Search Tool)程序的設計是為了快速找到高評分的局部比對。BLAST採用啟發式算法(heuristic algorithm)尋找局部的,而不是全局的比對,因此能夠檢測僅僅共有分離的相似性區域的序列之間的關係(Altschul等,1990和1993)。BLAST程序包含幾個單獨的程序BLASTN以核苷酸序列資料庫為對照比較核苷酸查詢序列,BLASTP以蛋白質序列資料庫為對照比較蛋白質查詢序列,BLASTX以蛋白質序列資料庫為對照比較核苷酸查詢序列(雙鏈)中六框的概念翻譯產物(six-frame conceptual translation product),TBLASTN取一蛋白質序列,並以核苷酸序列資料庫為對照而比較,該核苷酸資料庫已於所有6個閱讀框中翻譯,TBLASTX在所有6個閱讀框中將核苷酸查詢序列轉換成蛋白質序列,然後將其與核苷酸資料庫比較,該核苷酸資料庫已於在所有六個閱讀框上翻譯。Gapped BLAST可以被利用於獲得以比對為目的的缺口比對(Nucleic Acids Research,25(17)3389-3402,1997)。可選地,PSI-BLAST可被用於開展可檢測分子之間遠緣關係的多重搜索。執行BLAST分析的軟體可通過國家生物技術信息中心(National Centerfor Biotechnology Information)網站公開獲得。
除了計算序列同一性百分比或者序列相似性百分比,BLAST運算法則還執行兩個序列之間相似性的統計分析(Altschul等,1993)。由BLAST算法提供的一種相似性測量是最小總和概率(P(N)),也被稱為P值,這種統計分析提供了兩個核苷酸序列或胺基酸序列之間的匹配會因偶然發生匹配的概率的指示。另一項測量是預期值(E值),它代表了在整個資料庫的搜索中,預期此匹配或更好的匹配純粹出於偶然所出現的次數。因此,E值越低,輸入序列與匹配序列之間的相似越高。
FASTA是基於Pearson和Lipman運算法開發的DNA和蛋白質序列比對軟體包。該FASTA軟體包包含蛋白質蛋白質、DNADNA、蛋白質翻譯的DNA(移碼的)、及有序的或無序的肽搜索。該FASTA包可通過University of Virginia的網站獲得。
多重比對(例如,兩個以上的DNA或蛋白質序列之間)可以通過使用ClustalW運算法則(Thompson等Nucleic Acids Res.224673-4680,1994)用例如,Vector NTI包(Invitrogen,1600 Faraday Ave.,Carlsbad,CA92008)實行。
領域內熟知,原始序列中一個或多個胺基酸可以被另一個(些)電荷和極性與原始胺基酸相似的胺基酸取代,即保守的胺基酸取代。對原始多肽序列中胺基酸的保守取代,可以選自,天然存在的胺基酸所屬的種類中的其他成員。胺基酸可分為以下四類(1)酸性胺基酸、(2)鹼性胺基酸、(3)中性極性胺基酸、(4)中性非極性胺基酸。這些不同組中代表性的胺基酸包括但不限於(1)酸性(帶負電)胺基酸,如天門冬氨酸和穀氨酸;(2)鹼性(帶正電)胺基酸,如精氨酸、組氨酸和賴氨酸;(3)中性極性胺基酸,如甘氨酸、絲氨酸、蘇氨酸、半胱氨酸、酪氨酸、天冬醯胺和穀氨醯胺,及(4)中性非極性(疏水性)胺基酸,如丙氨酸、亮氨酸、異亮氨酸、纈氨酸、脯氨酸、苯丙氨酸、色氨酸和蛋氨酸。
利用本文所提供的資料,以及生物技術領域內技術人員所熟知的技術,本發明的轉錄調控元件可以從除了玉米或稻以外的植物中分離。例如,可以從植物組織cDNA文庫中分離出編碼澱粉合成酶的多核苷酸,其中,該植物可以選自小麥、大麥、高粱、黑麥、黑小麥、玉米、稻、甘蔗、豌豆、苜蓿、大豆、胡蘿蔔、芹菜、番茄、馬鈴薯、棉花、菸草、胡椒、油菜、甜菜、甘藍、花椰菜、椰菜、萵苣和擬南芥。聚合酶鏈式擴增反應的合成的寡核苷酸引物,可以在上述編碼澱粉合成酶的多核苷酸序列的基礎上設計。在PCR中利用相應的植物基因組DNA為模板,可以分離多核苷上遊、或多核苷酸下遊、或內含子區域的轉錄調控元件。可選地,可以從植物組織基因組DNA庫分離來自植物的多核苷酸,該多核苷酸在嚴格的條件下與SEQ ID NO1、2或3所示序列的多核苷酸雜交,或該多核苷酸與SEQID NO1、2或3所示序列的多核苷酸至少有70-80%、80-85%、85-90%或90-95%,或者至少約95%、96%、97%、98%、99%或更多的同一或相似。可以用任何數量的標準方法,例如如上所述的PCR分離源自所述多核苷酸的轉錄調控元件。依此分離的轉錄調控元件可以被克隆到合適的載體上,並用DNA序列分析表徵。
在另一實施方案中,轉錄調控核苷酸的同源物的轉錄調控活性,與本文中明確公開的轉錄調控核苷酸實質上相同(或等同),也就是說該表達依上述的胚乳優選方式進行調節。除了這一點,同源物的轉錄調控活性可能會與其親本多核苷酸有所不同,特別是表達水平方面。該表達水平可能高於或低於其親本多核苷酸的表達水平。取決於待表達的目的核酸,這兩種衍生物都可能是有利的。優選的是這樣的功能上等同的多核苷酸,相對於其親本核苷酸,其表達水平與所述親本多核苷酸表達水平的偏離不會超過50%、或25%、或10%。相對於其親本多核苷酸顯示出增強表達的等同多核苷酸也是優選的,其增強為至少50%、或者至少是100%、或至少增強500%。該表達水平可通過mRNA表達或蛋白質表達而判斷。蛋白質表達譜可以利用與所述轉錄調控多核苷酸有效地連接的報告基因顯示。上下文中優選的報告基因(Schenborn 1999)是綠色螢光蛋白(GFP)(Chui1996;Leffel 1997)、氯黴素轉移酶、螢光素酶(Millar 1992)、β-葡萄糖醛酸糖苷酶、β-半乳糖苷酶(Jefferson 1987)。測定轉錄調控的方法為本領域熟知,包括Northern印跡和RT-PCR。
本發明的另一實施方案涉及分離的植物轉錄終止元件,其包括的多核苷酸選自a)具有如SEQ ID NO4或者SEQ ID NO5所示序列的多核苷酸;b)與SEQ ID NO4或者SEQ ID NO5所示序列的多核苷酸有70%的序列同一性的多核苷酸;c)具有這樣的片段的多核苷酸,該片段具有如SEQ ID NO4或者SEQ ID NO5所示序列的多核苷酸中至少50個連續核苷酸,或至少100個連續核苷酸,或至少200個連續核苷酸;d)多核苷酸,其在嚴格地條件下與包括具有如SEQ ID NO4或者SEQ ID NO5所示序列的多核苷酸中至少50個連續核苷酸,或至少100個連續核苷酸,或至少200個連續核苷酸的多核苷酸雜交;以及e)與a)至d)中的任何多核苷酸互補的多核苷酸。
在另一實施方案中,本發明的分離的植物轉錄終止元件包括的核苷酸序列,與SEQ ID NO4或者SEQ ID NO5或其一部分所示的核苷酸序列至少有約50-60%、或至少約60-70%、或至少約70-80%、80-85%、85-90%或90-95%、或者至少約95%、96%、97%、98%、99%或更多相同或相似。核酸序列比較長度為至少50個連續核苷酸、或至少100個連續核苷酸、或至少200個連續核苷酸。在另一實施方案中,本發明的分離的核酸與SEQ ID NO4或5所示的多核苷酸互補,或互補於與SEQ ID NO4或5所示序列的多核苷酸有70%的序列同一性的多核苷酸,或者互補於在嚴格的條件下與SEQ ID NO4或5所示序列的多核苷酸雜交的多核苷酸。
在另一實施方案中,分離的核酸在嚴格的條件下與多核苷酸雜交,該多核苷酸包括SEQ ID NO4或5或其一部分所示序列的多核苷酸中至少50個連續核苷酸、或至少100個連續核苷酸、或至少200個連續核苷酸。在另一實施方案中,其條件使彼此至少約60%、或者至少約65%、或至少約70%、或至少大約75%或更多相似或同一的序列通常保持彼此雜交。這種嚴格的條件是本領域技術人員已知和如上所描述的。嚴格條件的優選的非限制性例子是在6倍氯化鈉/檸檬酸鈉(SSC)中,於約45℃雜交,隨後在50-65℃用0.2倍SSC,0.1%的SDS洗滌一次或多次。
本發明的另一實施方案涉及用分離的植物轉錄調控元件的轉化的植物,其中,該轉錄調控元件包括的多核苷酸選自a)具有如SEQ ID NO1、2或3所示序列的多核苷酸;b)與SEQ ID NO1、2或3所示序列的多核苷酸有70%的序列同一性的多核苷酸;c)具有這樣的片段的多核苷酸,該片段具有如SEQ ID NO1、2或3所示序列的多核苷酸中至少50個連續核苷酸,或至少100個連續核苷酸,或至少200個連續核苷酸;d)多核苷酸,其在嚴格的條件下與包括具有如SEQ ID NO1、2或3所示序列的多核苷酸中至少50個連續核苷酸,或至少100個連續核苷酸,或至少200個連續核苷酸的多核苷酸雜交;以及e)與a)至d)中的任何多核苷酸互補的多核苷酸。
本發明的另一實施方案涉及用植物轉錄調控元件轉化的植物,該植物轉錄調控元件包含有效地連接於一個或多個異源核酸的多核苷酸,其中包括多核苷酸的所述植物轉錄調控元件選自a)具有如SEQ ID NO1、2或3所示序列的多核苷酸;b)與SEQ ID NO1、2或3所示序列的多核苷酸有70%的序列同一性的多核苷酸;c)具有這樣的片段的多核苷酸,該片段具有如SEQ ID NO1、2或3所示序列的多核苷酸中至少50個連續核苷酸,或至少100個連續核苷酸,或至少200個連續核苷酸;d)多核苷酸,其在嚴格的條件下與包括具有如SEQ ID NO1、2或3所示序列的多核苷酸中至少50個連續核苷酸,或至少100個連續核苷酸,或至少200個連續核苷酸的多核苷酸雜交;以及e)與a)至d)中的任何多核苷酸互補的多核苷酸。
在一個實施方案中,該轉化植物可以是選自單子葉植物和雙子葉植物的植物。該植物的屬可以選自於玉米、小麥、稻、大麥、燕麥、黑麥、高粱、香蕉、黑麥草。該植物的屬可以選自豌豆、苜蓿、大豆、胡蘿蔔、芹菜、番茄、馬鈴薯、棉花、菸草、胡椒、油菜、甜菜、甘藍、花椰菜、椰菜、萵苣和擬南芥。在另一實施方案中,該轉化植物表達了農藝相關性狀或特性。這些特性包括但不限於含油量和油質量、蛋白質的質量和數量、胺基酸組成、含澱粉的質量和數量、增加的飼料含量和價值、增加的食物含量和價值、增加產量、增加的脅迫耐性或抗性,例如對乾旱、高溫、低溫、冷凍、過多的水分、鹽、氧化脅迫和氮脅迫的耐性或抗性、除草劑抗性或耐性、昆蟲抗性和耐性、疾病抗性和耐性、外觀、雄性不育、雌性不育等等。
本發明還提供轉化的單子葉植物或雙子葉植物、來自該植物的種子和部分,以及源自這樣的植物的後代植株,包括雜種或純種。發明的另一實施方案提供了轉基因植物產生的種子,該轉基因植物用包含本發明的植物轉錄調控元件的表達載體轉化。該種子是植物轉錄調控元件的純種,其中,該轉錄調控元件調控外源性或內源性基因的胚乳特異性表達。本發明還提供了植物育種方法,例如,製備雜交能育的轉基因植株。該方法包括,將含有本發明特定表達載體的能育的轉基因植物與其自身雜交或者另一植物(例如缺乏該特定表達載體的植物)雜交,以製備包括該特定表達載體的雜交能育的轉基因植株的種子。然後種植該種子而獲得雜交能育的轉基因植株。該植株可以是單子葉植物或雙子葉植物。雜交能育轉基因植株可以通過繼承母本或父本而擁有該表達載體。另一種植物可以是近交植物。該雜交能育轉基因植物可以是雜交體。任何這些雜交能育轉基因植物的種子也包含在本發明的範圍內。
經濟上最相關的特性之一是增加了植物的營養價值。因此,本發明的另一實施方案涉及使植物種子或芽增加營養價值、提高營養品質、增加或改變澱粉含量、增加或改變含油量的方法,所述方法包括以下步驟 1)向植物細胞或植物中引入表達載體,該載體包括 A)植物轉錄調控元件,其選自 a)具有如SEQ ID NO1、2或3所示序列的多核苷酸; b)與SEQ ID NO1、2或3所示序列的多核苷酸有70%的序列同一性的多核苷酸; c)具有這樣的片段的多核苷酸,該片段具有如SEQ ID NO1、2或3所示序列的多核苷酸中至少50個連續核苷酸,或至少100個連續核苷酸,或至少200個連續核苷酸; d)多核苷酸,其在嚴格地條件下與包括具有如SEQ ID NO1、2或3所示序列的多核苷酸中至少50個連續核苷酸,或至少100個連續核苷酸,或至少200個連續核苷酸的多核苷酸雜交;以及 e)與a)至d)中的任何多核苷酸互補的多核苷酸; 該植物轉錄調控元件有效地與一個或多個異源核酸連接,其中有效地連接的核酸編碼的多肽能夠使植物提高營養價值和/或增加或改變植物的澱粉含量; B)篩選轉基因植物,其中該植物相對於野生型或無效分離子,植物的種子或芽具有增加的營養價值、增加的營養品質、增加或改變的澱粉含量,或者增加或改變的含油量。
該營養價值可以包括蛋白質的質量和數量、含油質量和數量、胺基酸組成、澱粉質量和數量、飼料成份和價值、食品成份和價值,並且至少含有一種選自維生素、類胡蘿蔔素、抗氧化劑、不飽和脂肪酸和多聚不飽和脂肪酸的化合物成分。本文對營養價值和相應的待表達的核酸定義如下。優選的植物轉錄調控元件如上文所述。本發明的方法應用的植物可以選自玉米、小麥、稻、大麥、燕麥、黑麥、高粱、香蕉、黑麥草、豌豆、苜蓿、大豆、胡蘿蔔、芹菜、番茄、馬鈴薯、棉花、菸草、胡椒、油菜、甜菜、甘藍、花椰菜、椰菜、萵苣和擬南芥。
該增加的營養價值可以,例如,導致一個或多個下列性質修改的植物的脂肪酸組成、胺基酸含量、植物代謝物濃度增加。根據穀粒的最終具體用途,可以預見種類廣泛的以這種方式產生的新穎轉基因植物。
例如,玉米穀粒的最大用途是飼料或食品。導入改變穀粒成分的基因可以明顯增強飼料價值或食品價值。玉米穀粒的主要成分是澱粉、蛋白質和油。玉米穀粒的這些主要成分中的每一種可以通過改變其水平或組成加以改良。可以提及數個用於說明目的的實例,但是無論如何不是提供對可能性的窮舉。
就飼料和食品目的而言,多種穀類穀粒的蛋白質是次優的,尤其用於豬、家禽和人食用時。蛋白質在這些物種的飲食中的數種必需胺基酸上有缺陷,需要向穀粒添加補充物。這些必需胺基酸可以包括賴氨酸、甲硫氨酸、色氨酸、蘇氨酸、纈氨酸、精氨酸和組氨酸。某些胺基酸僅在穀粒以用於飼料配合的其它輸入物補充後才變成受限的。例如,當時穀粒用豆粕補充以滿足賴氨酸要求時,甲硫氨酸變成受限的。種子和穀粒內這些必需胺基酸的水平可以通過如此機制提高,所述的機制包括,但不限於導入增加胺基酸生物合成的基因、減少胺基酸降解、增加蛋白質中胺基酸的貯藏或增加胺基酸轉運至種子或穀粒內。
用於增加胺基酸生物合成的一個機制是導入解除胺基酸生物合成途徑中受控制的基因以至於植物不再能夠充分控制胺基酸的產生水平。這可以通過解除控制胺基酸生物合成途徑中通常受途徑內胺基酸終產物水平調節的步驟或繞過所述步驟而完成。實例包括導入編碼用於增加賴氨酸和蘇氨酸產生的解除控制形式的天冬氨酸激酶或二氫吡啶二羧酸(DHDP)合酶和用於增加色氨酸產生的鄰氨基苯甲酸合酶的基因。減少胺基酸的代謝可以通過導入減少或消除編碼酶的基因表達的DNA序列完成,其中所述的酶催化分解代謝途徑中的步驟,如賴氨酸-酮戊二酸還原酶。
穀粒的蛋白質組成可以用多種方式加以改變以改善胺基酸的平衡,所述方式包括提高天然蛋白質的表達、降低那些具有不良組成的天然蛋白質的表達、改變天然蛋白質的組成或導入編碼具有優異組成的全新蛋白質的基因。可以導入降低玉米中的貯藏蛋白中玉米醇溶蛋白家族成員表達的DNA。這種DNA可以編碼旨在破壞玉米醇溶蛋白表達或破壞玉米醇溶蛋白表達的調節物(如不透明-2基因產物)表達的核酶或反義序列。穀粒的蛋白質組成可以通過共抑制(即通過表達經轉化作用導入的相同結構性基因或基因片段而抑制內源基因的表達)進行修飾(Goring 1991)。此外,導入的DNA可以編碼降解玉米醇溶蛋白的酶。所實現的玉米醇溶蛋白表達降低可以伴隨增加具有更希望的胺基酸組成的蛋白質以及增加種子其它主要成分如澱粉。或者,可以導入嵌合基因,其中該嵌合基因包含具有適當胺基酸組成的天然蛋白質(如玉米中球蛋白的一種或10kD玉米醇溶蛋白)的編碼列以及設計旨在提高所述蛋白質表達的啟動子或其它調節序列。所述基因的編碼序列可以包括必需胺基酸的額外密碼子或替換密碼子。此外,可以使用從其它物種中獲得的編碼序列,或編碼完全獨特的肽序列的部分或完全合成的序列,其中所述肽序列的設計目的旨在增強種子的胺基酸組成。
導入改變穀粒油含量的基因可以是有價值的。油含量增加可以導致增加用於飼料和食品中的種子的可代謝能量含量及期望的密度。導入的基因可以編碼移除或減弱脂肪酸或脂類生物合成中限速步驟或受調節步驟的酶。此類基因可以包括,但不限於編碼乙醯CoA羧化酶、ACP-醯基轉移酶、β-酮醯基-ACP合酶和其它眾所周知的涉及脂肪酸生物合成活性的蛋白質的那些基因。其它可能基因是編碼無酶活性的蛋白質如醯基載體蛋白的基因。額外的實例包括2-乙醯基轉移酶、油質蛋白丙酮酸脫氫酶複合體、乙醯CoA合成酶、ATP檸檬酸裂合酶、ADP-葡萄糖焦磷酸化酶和涉及肉鹼CoA-乙醯-CoA穿梭的基因。可以導入改變存在於油中的脂肪酸平衡的基因,提供更有益健康或更有營養的飼料原料。導入的DNA還可以編碼這樣的序列,該序列阻遏參與脂肪酸生物合成的酶的表達,從而如下所述改變存在於穀粒中的脂肪酸的比例。
除了改變穀粒的主要成分之外,可以導入影響飼料或食品用穀粒的多種其它養分方面、加工步驟方面或其它品質方面的基因。例如,可以增加或減少穀粒的色素形成。某些動物飼料中黃色色素形成的增強和穩定性是受到歡迎的並可以通過導入這樣的基因而實現,其中所述的基因通過消除葉黃素及胡蘿蔔素產生中的限速步驟而導致增強產生葉黃素和胡蘿蔔素。此類基因可以編碼改變形式的八氫番茄紅素合酶、八氫番茄紅素去飽和酶或番茄紅素合酶。或者,無色素的白色玉米是眾多食品產品產生所需要的並且可以通過導入阻遏或消除色素產生途徑中的步驟的DNA而產生。
包含一些穀類穀粒的飼料或食品具有不充分量的維生素並且必須進行補足以提供合適的營養價值。可以設想導入增強種子中維生素生物合成的基因,包括例如維生素A、E、B12、膽鹼等。例如,玉米穀粒也不具有用於最佳營養價值的充分礦物質含量。影響含磷、硫、鈣、錳、鋅和鐵等的化合物累積或可用性的基因是有價值的。實例可以是導入減少植酸生產或編碼植酸酶的基因,這增強植酸分解。這些基因將增加食物中的可用磷酸鹽水平,減少用礦物磷酸鹽作補充的需要。
除了指導改良飼料價值或食品價值外,還可以導入這樣的基因,該基因改善穀粒加工並改善從加工中所產生產品的價值。加工某些穀粒如玉米的主要方法是溼磨法。玉米可以通過新基因的表達受到改良,其中所述的新基因提高加工效率並降低加工成本(如通過減少浸泡時間)。
改善溼磨法產物的價值可以包括改變澱粉、油、玉米面筋粉的數量或品質或玉米澱粉渣的成分。可以如此實現澱粉的升高,即通過鑑定並消除澱粉生物合成中的限速步驟或通過降低穀粒其它成分水平,從而導致成比例地增加澱粉。前者的實例可以是導入這樣的基因,該基因編碼具有改變的調節活性或在更高水平上表達的ADP-葡萄糖焦磷酸化酶。後者的實例可以包括在穀粒發育晚期期間表達的例如蛋白質生物合成或油生物合成的選擇性抑制物。
油是玉米和其它穀物的另一種溼磨法產物,其價值可以通過導入並表達基因加以改善。能夠通過溼磨法提取的油量可以通過如以上對飼料和食品所述的方法加以提高。也可以改變油的特性以改善油在食用油、起酥油、潤滑油或其它的油衍生性產物的生產和使用中的性能或改善其在用於食品相關性應用中的健康特性。還可以合成可在提取後充當化學合成原材料的新脂肪酸。油特性的改變可以通過改變存在於油中的脂肪酸的類型、水平或脂類排列而實現。這又可以通過添加編碼酶的基因(其中所述的酶催化新脂肪酸合成)或通過提高天然脂肪酸的水平,與此同時可能降低前體的水平而完成。或者,可以導入這樣的核酸,其延緩或阻斷脂肪酸生物合成中的步驟,導致前體脂肪酸中間體增加。可以添加的基因包括去飽和酶、環氧酶、水合酶、脫水酶和催化涉及脂肪酸中間體的反應的其它酶。可以被阻斷的催化步驟的代表性實例包括從硬脂酸至油酸和從油酸至亞麻酸的去飽和步驟,阻斷所述步驟導致相應地累積硬脂酸酸和油酸。
也可以通過導入用來獲得新植物的基因實現改良其它的穀物溼磨法產物、麵筋粉和玉米澱粉渣。代表性的可能方式包括但不限於以上對改善食品價值和飼料價值所述的那些方式。
此外,還可以考慮應當使用植物來產生或製造植物中先前根本不產生或不以這個水平產生的有用生物化合物。可能通過轉化方法導入並表達基因而製備產生這些化合物的新植物。有可能包括,但不限於目前通過任何生物所產生的任一生物化合物,如蛋白質、核酸、初級代謝物和中間代謝物、糖類聚合物等。化合物可以由植物產生、在收穫和/或加工後提取並且用於任何目前認識到的有用目的,如藥物、香料、工業用酶,不一而足。
可以結合本發明的轉錄調控元件,並提供改善的終產物的特性的有用的核酸,包括但不限於這樣的核酸,其編碼種子貯藏蛋白質、脂肪酸途徑酶(fatty acid pathway enzyme)、維生素E生物合成酶、胺基酸生物合成酶、核酸合成酶和澱粉分支酶。用於植物顯型改良的示例性基因的論述可以在,例如,US專利號6,194,636、6,207,879、6,232,526、6,426,446、6,429,357、6,433,252、6,437,217、6,515,201和6,583,338以及在WO02/057471中找到,所述每篇文獻具體地在本文中完整引用作為參考。所述性狀包括但不限於 -用於食品和飼料領域內的代謝酶(如植酸酶和纖維素酶)的表達。尤其優選核酸,如編碼微生物植酸酶的人工cDNA(GenBank登錄號A19451)或其功能等同物。
-引起精細化學品如生育酚、生育三烯酚或類胡蘿蔔素累積的基因的表達。可以提到的實例是八氫番茄紅素去飽和酶。優選編碼黃水仙(Narcissus pseudonarcissus)八氫番茄紅素去飽和酶的核酸(GenBank登錄號X78815)或其功能等同物。優選的生育酚生物合成酶包括tyrA、slr1736、ATPT2、dxs、dxr、GGPPS、HPPD、GMT、MT1、tMT2、AANT1、slr1737和用於尿黑酸雙加氧酶的反義構建體(Kridl等(1991);Keegstra(1989);Nawrath等(1994);Xia等(1992);Lois等(1998);Takahashi等(1998);Norris等(1998);Bartley和Scolnik(1994);Smith等(1997);WO 00/32757;WO 00/10380;Saint Guily等(1992);Sato等(2000)),全部文獻在本文中引用作為參考。
-澱粉生產(US專利號5,750,876和6,476,295)、高量蛋白質生產(US6,380,466)、果實成熟(US 5,512,466)、增強的動物及人營養(US專利號5,985,605和6,171,640)、生物聚合物(US 5,958,745和US專利
發明者C·卡費爾, H·關 申請人:巴斯福植物科學有限公司