多肽在葉綠體中的表達以及用於表達多肽的組合物和方法
2023-05-10 02:32:16 1
專利名稱::多肽在葉綠體中的表達以及用於表達多肽的組合物和方法
技術領域:
:本發明一般地涉及用於在植物細胞葉綠體中表達多肽的組合物和方法,更具體地,是涉及編碼異源多肽的具有葉綠體密碼子偏好性(chloroplastcodonbiased)的多聚核苷酸,以及可以使異源多肽在細菌和葉綠體中強表達的載體,所述的異源蛋白包括,例如,蛋白複合物,如通過多肽亞基的特定聯接而形成的抗體和抗體嵌合體。
背景技術:
:分子生物學和遺傳工程可以產生大量的生物活性物質,這些物質可以用作健康個體的營養補充或者用作治療具有病理紊亂的個體的治療試劑。比如,生長激素已經通過遺傳工程的方法被生產出來了,而且重組生長激素已經被用於治療患有生長功能障礙的個體。與此類似,具有所需要的特異性特徵的單克隆抗體也被發現可以用作治療各種紊亂的試劑,所述紊亂包括癌症,如淋巴癌和乳癌。應用遺傳工程技術來生產生物類治療試劑的一個主要優點是這種方法可以保證生產出大量所需要的蛋白質。在許多情況下,能夠獲得足夠量的例如用作治療試劑的生物物質的別的方法,就只有通過從產生這些物質的生物細胞中純化自然生成的活性物質來實現。因此,在遺傳工程發明之前,生長激素只能從動物比如牛的腦下垂體中提取。胰島素是這樣的生物類試劑的另一個例子,在遺傳工程發明之前,它只能從動物如豬的胰腺中分離才能夠獲得足夠量和生物活性形式的胰島素。雖然遺傳工程提供了一種生產大量生物物質的方法,特別是蛋白質和核酸,但目前可利用的方法仍然存在一些局限性。比如,人類的蛋白可以在細菌細胞中大量表達。但是細菌並不能夠提供合適的環境以便於更加複雜的蛋白質的組裝,比如抗體,它是一種通過四條多肽鏈的聯接而形成的具有生物活性的蛋白質。因此,即使細菌可以用來生產生物物質,但仍可能需要一些額外的步驟如在特定條件下對蛋白質進行變性和摺疊,從而獲得生物活性物質。重組蛋白也可以在真核細胞中表達,比如昆蟲細胞和哺乳動物細胞,這些細胞可以提供將表達出來的蛋白質加工成生物活性試劑所必需的環境和必要的因子。比如抗體含有一條重鏈和一條輕鏈,它們構成二聚體,然後再進一步與另外一個由重鏈和輕鏈構成的二聚體聯接成具有活性的抗體。這樣的加工可以在真核細胞如哺乳動物細胞中進行。然而,真核細胞也可能會修飾蛋白質,比如對蛋白質進行糖基化修飾,這樣,所述蛋白便在其特定的位置含有糖基。這種翻譯後修飾可能會提供帶來益處的特性,同時也可能帶來一些缺點而限制了重組蛋白的用途。例如,糖基團可能具有非常強的抗原性,當它被注入到體內之後,會引起強烈的免疫應答而使得重組蛋白失活,甚至在某些情況下,可能會產生非常壞的影響,對個體造成比這種藥物最初被注入個體時更大的傷害。一般地,編碼將要通過重組DNA方法來獲得的多肽的多聚核苷酸是包含在載體中,所述載體是一種有助於對多聚核苷酸的操作的核酸分子。載體可以用來將感興趣的多聚核苷酸導入到原核細胞如細菌細胞或者真核細胞如哺乳動物細胞中。根據載體所在宿主細胞的不同,載體還含有調控元件,比如使載體能在宿主細胞中擴增的元件。另外,載體也可以被設計成可以在原核細胞和真核細胞之間穿梭。這樣的穿梭載體可能非常有用,比如,它們可以允許先在細菌中產生大量的載體(多聚核苷酸也包含在內),然後載體再被轉移到哺乳動物細胞中,使得由它編碼的多肽可以在適合於正確組裝出生物活性蛋白質的條件下被生產出來。雖然這樣的穿梭載體比那些特異地針對一種或者幾種特定細胞類型的載體具有一些優勢,但是它們還是不能夠避免由翻譯後修飾如糖基化帶來的潛在的問題,這種情況在真核細胞中常常發生。因此需要一種可以方便地產生生物活性蛋白的方法,而且所產生的蛋白不會具有不需要的特徵,例如在施用於個體如人類個體時產生強烈的抗原性。本發明就滿足了這樣的需要,而且還提供了額外的優點。發明概述本發明是部分地基於一個確定的事實,即通過對編碼多肽的核苷酸序列進行修飾使之反映出葉綠體的密碼子使用(codonusage),可以使所述異源多肽在植物中強烈表達。因此,本發明涉及合成的多聚核苷酸,其包括編碼至少第一多肽的至少第一核苷酸序列,其中第一核苷酸序列中的至少一個密碼子反映出葉綠體密碼子使用偏好性。在一種具體實施方案中,第一核苷酸序列中的每一個密碼子都反映出葉綠體密碼子使用偏好性。合成的多聚核苷酸可以包含編碼單個多肽的單個核苷酸序列,或者可以進一步包括編碼第二多肽的至少第二核苷酸序列,其中所述第二核苷酸序列中的一個或者多個密碼子也可以反映出葉綠體密碼子使用偏好性。如果合成的多聚核苷酸編碼兩個或者更多個多肽,這些編碼核苷酸序列可以被有效連接(operativelylinked),這樣單條多聚核苷酸可以被轉錄出來,而編碼的多肽可以被分別表達,或者可以進一步有效連接,這樣同時含有第一多肽和第二多肽的融合蛋白就可以被表達出來。在一種具體實施方案中,第一核苷酸序列和第二核苷酸序列通過一個第三核苷酸序列有效連接,所述第三核苷酸序列例如可以編碼一段連接肽。這樣,就可以由所述的合成的多聚核苷酸表達出融合蛋白,其含有通過連接肽連接在一起的第一多肽和第二多肽。本發明中由合成的多聚核苷酸編碼的多肽可以是任何感興趣的多肽,而且通常是正常情況下不在質體中表達的多肽,特別是不在葉綠體中表達的多肽。比如,編碼的多肽可以是免疫球蛋白(Ig)家族成員的一條或者多條鏈,例如,Ig可變區,Ig恆定區,Ig重鏈,Ig輕鏈,或者其組合;或者是T細胞受體(TCR)α鏈,TCRβ鏈,或者其組合;或者是任何可溶性的受體比如T細胞受體的可溶形式或者這樣的受體與例如IG重鏈構成的融合蛋白。在一種具體實施方案中,合成的多聚核苷酸編碼Ig家族成員融合蛋白,比如一個單鏈抗體,其包含與一個輕鏈可變區有效連接的完整重鏈。這樣的融合蛋白的一個示例是單鏈抗單純皰疹病毒(HSV)抗體,其胺基酸序列如SEQIDNO16所示,它可以由具有SEQIDNO15所示的核苷酸序列的合成的多聚核苷酸編碼,所述的核苷酸序列具有葉綠體密碼子使用偏好性。在另外一個示例中,由具有葉綠體密碼子使用偏好性的合成的多聚核苷酸編碼的融合蛋白是單鏈抗HSV抗體Fv片斷,其胺基酸序列如SEQIDNO43所示,而編碼這段胺基酸序列的核苷酸序列如SEQIDNO42所示。在又另外一個示例中,由具有葉綠體密碼子使用偏好性的合成的多聚核苷酸編碼的融合蛋白是HSV8-lsc(大單鏈)抗體,其胺基酸序列如SEQIDNO48所示,而編碼這段胺基酸序列的核苷酸序列如SEQIDNO48所示。本發明中由合成的多聚核苷酸編碼的多肽也可以是報告多肽(reporterpolypeptide),比如一種螢光素酶多肽。這樣的螢光素酶報告多肽的一個示例是含有通過連接肽有效連接的細菌螢光素酶A亞基和細菌螢光素酶B亞基的螢光素酶融合蛋白,該融合蛋白的胺基酸序列如SEQIDNO46所示,而編碼這段胺基酸序列的具有葉綠體密碼子使用偏好性的核苷酸序列如SEQIDNO45所示。因此,本發明提供一種具有SEQIDNO46所示的胺基酸序列的螢光素酶融合多肽。編碼報告多肽的具有葉綠體密碼子偏好性的合成的多聚核苷酸,比如示出的編碼細菌luxAB融合多肽(SEQIDNO46)的多聚核苷酸(SEQIDNO45)是非常有用的,比如,可以作為鑑定葉綠體啟動子、5』非翻譯區(5』UTRs)、3』UTR、蛋白酶缺陷性株系以及類似物的工具,這樣就提供了一種在葉綠體中進一步改善異源多肽表達的方法。本發明還涉及一種通過導入合成的多聚核苷酸到質體中來產生異源多肽的方法,所述的合成的多聚核苷酸包括編碼至少第一多肽的至少第一核苷酸序列,其中在所述第一核苷酸序列中至少一個密碼子具有葉綠體密碼子使用偏好性,而所述的導入是在允許所述的至少第一多肽在所述質體中表達的條件下進行的。這種合成的多聚核苷酸可以與一段編碼至少一個核糖體結合序列(RBS)——特別是引導所述多肽在質體中翻譯的RBS序列——的核酸序列有效連接。根據本發明的方法所使用的合成的多聚核苷酸可以是任何合成的多聚核苷酸,其包括至少一個密碼子具有葉綠體密碼子使用偏好性的至少第一核苷酸序列。如此,所述的合成的多聚核苷酸可以進一步包括編碼第二多肽的至少第二核苷酸序列,其中所述的第一核苷酸序列可以但不是必須與所述的第二核苷酸序列有效連接,而且其中所述第二多肽可以但並非必須是與葉綠體異源的。如果所述的合成的多聚核苷酸編碼兩個(或者更多個)多肽,那麼所述被編碼的多肽可以被表達成獨立的不同的多肽,或者是被表達成含有第一和第二(或者更多)多肽的融合蛋白。在一種具體實施方案中,依據本發明的方法由合成的多聚核苷酸表達的融合蛋白包括通過連接肽連接的第一多肽和第二多肽。這樣的方法的一個示例是表達包含相互連接的IgA重鏈和輕鏈可變區的單鏈抗體,該融合蛋白具有SEQIDNO16所示的胺基酸序列,而編碼這段胺基酸序列的具有葉綠體密碼子使用偏好性的核苷酸序列如SEQIDNO15所示,其中被表達出來的單鏈抗體仍然具備抗原結合特異性(也參見,具有SEQIDNO43所示的胺基酸序列的單鏈抗HSV抗體Fv片斷(由SEQIDNO42編碼)和具有SEQIDNO48所示的胺基酸序列的HSV8-lsc抗體(由SEQIDNO48編碼)。本發明的方法在此的進一步示例是表達一個報告多肽,特別是包含與螢光素酶B亞基有效連接的螢光素酶A亞基的螢光素酶融合蛋白,所述融合蛋白具有SEQIDNO46所示的胺基酸序列,而編碼這段胺基酸序列的核苷酸序列如SEQIDNO45所示,其中所述的異源螢光素酶在葉綠體中的表達可以在體內或者在體外檢測。本發明的方法可以在任何質體中實踐,包括植物的葉綠體。含有葉綠體的植物可以是任何自然含有葉綠體的植物,包括藻類(微藻類或者巨藻類)和高等植物。所述方法還可以進一步包括將表達的異源多肽從含有所述多肽的植物細胞(或者分離的葉綠體)中分離出來的方法。因此,本發明提供利用本發明的方法所產生的異源多肽。本發明進一步涉及一種檢測含有質體的植物細胞的方法。這樣的方法可以這樣來實施,例如,將本發明的合成的多聚核苷酸導入到植物細胞的質體中,如導入到葉綠體中,其中所述的多聚核苷酸編碼報告多肽,這樣的導入允許所述的報告多肽在葉綠體中表達,然後檢測所述的報告多肽的表達。所述的報告多肽可以是任何期望的多肽,它的示例是表達具有SEQIDNO46所示的胺基酸序列的螢光素酶融合蛋白。本發明也涉及一種在質體中產生蛋白的方法。這樣的方法可以這樣來實施,例如,將至少第一重組核酸分子導入到質體中,其中所述的第一重組核酸分子包括第一核苷酸序列,該第一核苷酸序列編碼至少一個核糖體結合序列(RBS)和與之有效連接的編碼至少一種多肽的至少一個異源多聚核苷酸,其中所述RBS能夠在允許所述的至少一種多肽表達的條件下指導所述多肽在質體中的翻譯,由此可以在所述質體中產生所述多肽。所述質體可以是任何質體,包括例如一種葉綠體。根據本方法,第一多聚核苷酸中的一個或者多個密碼子可以具有葉綠體密碼子使用偏好性。在一種具體實施方案中,被編碼的多肽是抗體,或者抗體的亞基。在另一個具體實施方案中,第一多聚核苷酸編碼第一多肽和第二多肽,例如,第一多肽包括Ig重鏈或者其可變區,第二多肽包括Ig輕鏈或者其可變區。通過本發明的方法所表達出來的這樣的抗體的一個示例是具有SEQIDNO14所示的胺基酸序列的抗破傷風毒素抗體,其由SEQIDNO13所示的核苷酸序列編碼。在另外一種具體實施方案中,第一多聚核苷酸具有葉綠體密碼子使用偏好性。通過本發明的方法被表達出來的這樣的抗體的示例是具有SEQIDNO16,SEQIDNO43和SEQIDNO48中的一個所示的胺基酸序列的抗HSV抗體,這些抗體可以由序列分別為SEQIDNO15,SEQIDNO42和SEQIDNO47的核苷酸序列編碼。在另外一個具體實施方案中,第一多聚核苷酸編碼第一多肽和至少一個第二多肽,其中所述第一多肽和第二(或更多個)多肽可以但並不一定是一種蛋白複合物的亞基,所述蛋白複合物例如是一個異源二聚體、異源三聚體等。在另外一個具體實施方案中,所述方法可以進一步包括向質體中導入至少第二重組核酸分子。這樣的第二重組核酸分子可以包括第一核苷酸序列,所述第一核苷酸序列編碼至少第一RBS和與之有效連接的編碼至少第二多肽的至少第二異源多聚核苷酸,其中所述第一RBS能夠指導所述多肽在質體中的翻譯,特別是葉綠體。優選地,所述的第一重組核酸分子和第二重組核酸分子在質體中共表達。根據本發明的方法,第一重組核酸分子可以包含在載體之內。在一種具體實施方案中,所述載體是葉綠體載體,其含有可以與葉綠體基因組DNA進行同源重組的葉綠體基因組DNA核苷酸序列,含有所述第一重組核酸分子的載體被導入到葉綠體中。這樣的載體可以進一步包含原核生物的複製起點。本發明的方法可以進一步包括從質體中分離多肽。因此,本發明也提供通過這樣的方法獲得的分離的多肽,例如,一種在葉綠體中異源表達的分離的抗體。本發明進一步涉及在植物葉綠體中產生一種或者多種多肽的方法,包括產生能夠特異性地聯接形成蛋白複合體的多肽的方法。同樣地,本發明的方法提供了一種產生功能性蛋白複合物的手段,比如,包括第一重鏈和輕鏈和與之聯合的第二重鏈和輕鏈的二價抗體。本發明的方法可以這樣來實施,例如,向葉綠體中導入第一重組核酸分子,其包括編碼至少一種多肽的第一多聚核苷酸;與第二多聚核苷酸有效連接,所述第二多聚核苷酸包括編碼第一核糖體結合序列(RBS)的核苷酸序列和與之有效連接的編碼第二RBS的核苷酸序列,其中第一RBS可以指導多肽在原核生物中的翻譯,第二RBS可以指導多肽在葉綠體中的翻譯,這樣的方法是在允許所述的至少一種多肽表達的條件下進行的,這樣就可以在葉綠體中表達所述多肽。本發明中的這些方法可以在任何含有葉綠體的植物(植物細胞)中進行,包括單細胞植物和藻類,以及多細胞植物和藻類。在一種具體實施方案中,在本發明的方法中所用到的第一多聚核苷酸編碼第一多肽和至少一個第二多肽,比如,一個第一多肽和一個第二多肽;或者一個第一多肽,一個第二多肽和一個第三多肽;等等,任何一種或者全部的多肽都可以是相同的或者不同的。在另外一個具體實施方案中,所述第一多聚核苷酸的一個或者多個密碼子具有葉綠體密碼子使用偏好性。正如在這裡所公開,在植物葉綠體比如微藻萊茵衣藻(Chlamydomonasreinhardtii)的葉綠體中表達的多肽正確地組裝,而且可以與一種或者多種在葉綠體中表達的其它多肽聯合形成功能性蛋白複合物。因此,在另外一個具體實施方案中,在本發明的方法中有用的第一多聚核苷酸可以編碼一種或者多種多肽亞基,這些亞基可以聯合形成功能性蛋白複合物。所述的蛋白複合物可以是二聚體、三聚體、四聚體或者類似的多聚體,而這些亞基可以相同,也可以不同,或者是二者的組合。比如,當所述的蛋白複合物是一個二聚體時,它可以是同源二聚體或者異源二聚體。當所述的蛋白複合物是一個三聚體時,它可以是同源三聚體、異源三聚體或者是由兩個相同的多肽和一個不同的多肽組成的三聚體。本發明的方法對於生產功能性蛋白複合物特別有用,所述蛋白複合物例如通常在自然發生時含有兩條重鏈和兩條輕鏈的抗體,或者細胞表面受體如T細胞受體、生長素受體、荷爾蒙受體、G蛋白偶聯受體,其中G蛋白偶聯受體可以與G蛋白聯合,以及類似的複合物。應用本發明的方法在葉綠體中產生蛋白如抗體的一個優點是多肽在葉綠體中表達之後不會被糖基化,因此,其抗原性與在動物中獲得的或者在真核生物細胞的細胞質中表達的抗體抗原性相比大大降低。正如在這裡所公開的,在葉綠體中產生功能性蛋白複合物的方法可以這樣來實施應用第一重組核酸分子,按照定義,其中所述第一多聚核苷酸編碼複合物的兩個或者多個亞基;或者應用第一重組核酸分子和第二重組核酸分子,前者按照定義,編碼複合物的一個多肽亞基,而後者具有和第一重組核酸分子同樣的特性,編碼所述蛋白質複合物的另外一個多肽亞基。因此,本發明的方法可以應用第一重組核酸分子來實施,其中所述第一多聚核苷酸編碼第一多肽和第二多肽,前者是免疫球蛋白重鏈(H)或其可變區,後者是免疫球蛋白輕鏈(L)或其可變區。如果需要的話,一段編碼內在核糖體進入位點的核苷酸序列可以放在編碼H和L的核苷酸序列之間,這樣可以促進第二(下遊)編碼多肽的表達。在編碼的H和L鏈在葉綠體中被翻譯之後,一個H鏈可以與一個L鏈聯合形成一個單價抗體(即,一個H:L複合物),而兩個H:L複合物可以進一步聯合形成一個二價抗體。本發明的方法也可以這樣來實施,向植物葉綠體中導入第一重組核酸分子,其中第一多聚核苷酸編碼,比如,H鏈或者其可變區,進一步向葉綠體中導入第二重組核酸分子,其包含編碼L鏈或者其可變區的第一多聚核苷酸,並且所述第一多聚核苷酸與第二多聚核苷酸有效連接,所述第二多聚核苷酸包含編碼第一RBS的核苷酸序列以及與之有效連接的編碼第二RBS的核苷酸序列,其中所述第一RBS可以指導多肽在原核生物中的翻譯,而第二RBS可以指導多肽在葉綠體中的翻譯,被編碼的多肽在葉綠體中基本上共表達。其中重鏈(H)和輕鏈(L)可以聯合形成一個H:L複合體,而其中H:L複合體又可以進一步聯合生成一個二價抗體。在實踐本發明的方法時,第一重組核酸分子可以包含在載體當中。而且,如果本方法還用到第二(或者更多)其它重組核酸分子,那麼第二重組核酸分子也可以包含在載體當中,這個載體可以但並不一定與含有第一重組核酸分子的載體相同。作為選擇,植物細胞可以被遺傳修飾,以使植物的葉綠體含有一個穩定整合的編碼蛋白複合物的一個亞基的重組核酸分子,這樣,本發明的方法可以包括,比如將含有第二重組核酸分子的載體導入到所述植物的葉綠體中,所述第二重組核酸分子編碼蛋白複合物的一個或者多個亞基,這樣,在多肽被表達出來之後,一個功能性的蛋白複合物便產生了。本發明中所用的載體可以是任何一種用來向葉綠體中導入多聚核苷酸的載體。特別地,所述載體可以包括葉綠體基因組DNA的核苷酸序列,通過它可以介導與葉綠體基因組DNA的同源重組。這樣的葉綠體載體可以包含任何有利於載體的應用或者操作的附加核苷酸序列,比如,一個或者多個轉錄調控元件,或者選擇性標記,或者克隆位點,或者類似的元件,包括它們的組合。在一種具體實施方案中,載體可以是一個葉綠體載體,它包括植物葉綠體基因的轉錄啟動子和5』非翻譯區(5』UTR),它還可以包括,或者通過修飾之後可以包括如前所述的第一RBS以及與之有效連接的第二RBS。在另外一個具體實施方案中,載體可以是一個葉綠體載體,它包括原核生物的複製起始位點(ori),比如大腸桿菌(E.coli)的ori,因此提供了可以在原核宿主細胞和葉綠體中穿梭和操作的穿梭載體。本發明的穿梭載體可以含有任何感興趣的多聚核苷酸,包括具有葉綠體密碼子偏好性的合成的多聚核苷酸,比如具有SEQIDNO45所示的序列的合成的多聚核苷酸,它編碼一種細菌luxAB融合蛋白(SEQIDNO46)。這樣的表達SEQIDNO46的穿梭載體提供的優勢是,對於在細菌中的表達,可以檢查調控元件或者其他感興趣的序列,然後含有那些具有所需要的表達特性的元件的載體可以被穿梭,連同與之有效連接的同樣的或者其它的合成多聚核苷酸或者其他多聚核苷酸被穿梭到葉綠體中,在其中可以獲得被編碼的異源多肽的被改善的表達。本發明的方法可以進一步包括從葉綠體中分離所表達的多肽或者蛋白複合物的步驟。因此,本發明還提供根據這裡所公開的方法得到的分離的多肽或者蛋白複合物。比如,本發明提供在植物葉綠體中表達並從中獲得的分離的抗體。本發明的分離的抗體的一個優點是所述抗體的多肽成分沒有糖基化,因此當抗體被施予個體時其抗原性會降低。而且,本發明的這種抗體與自然發生的抗體相比,可以有降低的效應活性(effectoractivities),例如補體結合活性(complementfixationactivity),因此提供了可以用於對個體進行診斷的抗體。本發明還涉及包括第一核糖體結合序列(RBS)和與之有效連接的第二RBS的分離的核糖核苷酸序列,其中所述第一RBS和第二RBS被5到25個核苷酸間隔開來,其中,當所述的核糖核苷酸序列與一個編碼多肽的多聚核苷酸有效連接時,所述第一RBS可以指導所述多肽在原核生物中的翻譯,而第二RBS可以指導所述多肽在葉綠體中的翻譯。本發明的分離的核糖核苷酸序列一般是大約11到50個核糖核苷酸長度,可以是大約15到40個核糖核苷酸長度,或者是大約20到30個核糖核苷酸,可以作為一個獨立的單位,或者可以與一個異源的RNA分子有效連接。在本發明的核糖核苷酸序列中,有效連接的第一RBS和第二RBS一般被大約5到25核苷酸間隔開來,常常是大約10到20個核苷酸,比如是大約15個核苷酸。第一RBS和第二RBS可以各自獨立地由大約3到9個核苷酸組成,常常是大約4到7個核苷酸,而且可以含有任何具有Shine-Delgamo(SD)序列特徵的序列,比如包含5』-GGAG-3』的序列,該序列與16SrRNA的反SD序列的一部分互補。指導多肽在葉綠體中翻譯的第二RBS可以包含在一個葉綠體基因的5』UTR中,所述的葉綠體基因可以是編碼一種可溶性葉綠體蛋白或者葉綠體膜結合蛋白的葉綠體基因,其中所述5』UTR可以進一步包括轉錄調控元件,包括啟動子。本發明的核糖核苷酸序列可以進一步包括與所述第一和第二RBS有效連接的起始AUG密碼子。這樣的起始AUG密碼子可以進一步包括Kozak序列的相鄰核苷酸,比如ACCAUGG,該序列可以促進多肽在細胞中的翻譯。本發明的核糖核苷酸序列還可以與編碼多肽的多聚核糖核苷酸有效連接,所述多聚核糖核苷酸序列可以含有一個內源性起始AUG密碼子或者可以通過修飾之後含有一個起始AUG密碼子,或者也可以缺少起始AUG密碼子,而這個密碼子可以是本發明的核糖核苷酸序列的一個組分。本發明的分離的核糖核苷酸序列可以通過化學方法合成,或者可以採用酶學方法生成,比如從一個脫氧核糖核苷酸(DNA)或者核糖核苷酸(RNA)模板分別利用DNA依賴型RNA聚合酶或者RNA依賴型RNA聚合酶生成。這樣的DNA模板可以化學合成或者可以從自然發生的DNA分子中分離,或者基於自然發生的DNA序列,經過一定修飾之後具備所需的特性,比如一段原核基因的DNA序列,其具有編碼定位在起始ATG密碼子上遊大約5到15個核苷酸的RBS的核苷酸序列,而且還可以通過進一步修飾含有第二RBS,第二RBS定位在第一RBS上遊且與第一RBS分開,這樣第二RBS可以指導多肽在葉綠體中的翻譯。因此,本發明還涉及編碼如此定義的第一RBS以及與之有效連接的第二RBS的多聚核苷酸。所述多聚核苷酸可以是DNA或者RNA,可以是單鏈或者雙鏈。本發明的多聚核苷酸可以包括起始ATG密碼子,它與編碼第一RBS和第二RBS的核苷酸序列有效連接。另外,本發明的多聚核苷酸可以包含克隆位點,所述克隆位點的位置允許能夠編碼多肽的可表達的多聚核苷酸有效連接到第一RBS和第二RBS上,這樣所述多肽可以在葉綠體或者原核宿主細胞中表達。所述克隆位點可以是任何便於可表達的多聚核苷酸插入或者連接到第一和第二RBS的核苷酸序列,這樣編碼多肽的翻譯就可以在適當的條件下從第一RBS和第二RBS啟動,所述克隆位點例如一個或者多個限制性內切酶識別位點或者重組酶識別位點或者它們的組合。如在此定義的編碼第一和第二RBS的多聚核苷酸可以與一個可表達的多聚核苷酸有效連接,所述的可表達的多聚核苷酸可以編碼至少一種多肽,包括肽或者多肽的肽部分。同樣,所述的可表達的多聚核苷酸可以編碼一種第一多肽和一種或者更多種額外的多肽,這些多肽可以是相同的或者不同的。比如,所述的可表達的多聚核苷酸可以編碼一個第一多肽和一個第二多肽,這些多肽可以互不相同。進一步,這樣的第一多肽和第二多肽可以作為融合蛋白表達,或者可以作為獨立的多肽表達,如果是後一種情況,編碼一個內在核糖體進入位點的核苷酸序列可以但並不一定有效連接在所述第一多肽的編碼序列和所述第二多肽的編碼序列之間,這樣可以所述便於所述第二多肽的翻譯。本發明的多聚核苷酸的兩側還可以具有第一克隆位點和第二克隆位點,這樣就提供了一個可以方便地插入或者連接到第二多聚核苷酸的序列盒。這種側邊的第一和第二克隆位點可以相同或者不同,而且其中之一或者兩者都可以獨立地作為一系列克隆位點中的一個,即多克隆位點。在一種具體實施方案中,本發明的多聚核苷酸包含一個編碼第二RBS的核苷酸序列,一個編碼第一RBS的核苷酸序列,和一個起始ATG密碼子,這些序列都是有效連接並且方向是5』到3』的;以及/或者與這樣的多聚核苷酸互補的核苷酸序列。在另外一個具體實施方案中,本發明的多聚核苷酸包含一個編碼第二RBS的核苷酸序列,一個編碼第一RBS的核苷酸序列,和一個起始ATG密碼子,和至少一個克隆位點,這些序列都是有效連接並且方向是5』到3』的;以及/或者與這樣的多聚核苷酸互補的核苷酸序列。在又另外一個具體實施方案中,本發明的多聚核苷酸包含一個編碼第二RBS的核苷酸序列,一個編碼第一RBS的核苷酸序列,和至少一個定位在編碼第一RBS的核苷酸序列的3』側大約3到10個核苷酸位置的克隆位點,這些序列都是有效連接並且方向是5』到3』的;以及/或者與這樣的多聚核苷酸互補的核苷酸序列。本發明還涉及一種載體,其包括編碼如在此定義的有效連接的第一RBS和第二RBS的多聚核苷酸,和一段葉綠體基因組脫氧核糖核酸(DNA)的核苷酸序列,它可以與葉綠體基因組DNA發生同源重組。這樣的葉綠體基因組DNA核苷酸序列一般是雖然並不必然是一段沉默的核苷酸序列,它不編碼某個葉綠體基因,而且要足夠長以使載體能夠與葉綠體基因組上對應的核苷酸序列發生同源重組。本發明的載體還可以包含一個或者多個額外的可以賦予載體所需特性的核苷酸序列,包括,比如,有利於載體操作的序列。如此,載體可以包含,比如,一個或者多個克隆位點,例如多克隆位點,其定位使得異源多聚核苷酸可以插入到載體當中並與第一RBS和第二RBS有效連接。所述載體還可以包含原核生物複製起始位點(ori),比如大腸桿菌的ori或者粘粒的ori,由此提供可以在原核宿主細胞或者植物葉綠體中按照需要穿梭的穿梭載體。因此,在一種具體實施方案中,本發明提供了葉綠體/原核生物穿梭載體,其中所述穿梭載體包括1)葉綠體基因組DNA的核苷酸序列,它可以與葉綠體基因組DNA發生同源重組;2)原核生物的原點;3)與第二RBS有效連接的第一RBS,其中所述第一(或者第二)RBS可以指導有效連接的可表達的多聚核苷酸在葉綠體中的翻譯,而第二(或者第一)RBS可以指導有效連接的可表達的多聚核苷酸在原核生物中的翻譯;和4)有效連接的可表達的多聚核苷酸,或者其定位可以使異源多聚核苷酸插入並有效連接到第一和第二RBS上的克隆位點。本發明的載體可以是一種環化載體,或者也可以是具有第一末端和第二末端的線性載體。本發明中的線性載體可以在一端或者兩端具有一個或者多個克隆位點,這樣就提供了環化所述載體的手段或者將所述載體連接到第二多聚核苷酸上的方法,所述第二多聚核苷酸可以是一個與本發明的所述載體相同或者不同的第二載體。所述克隆位點可以包括限制性內切酶識別位點(或者其切割產物),重組酶位點,或者這樣的位點的組合。所述載體可以進一步包括一個或者多個表達控制元件,比如轉錄調控元件、額外的翻譯元件和類似的元件。在一種具體實施方案中,所述載體含有與編碼第一RBS和第二RBS的序列有效連接的起始ATG密碼子,這樣編碼多肽的多聚核苷酸可以相鄰地與ATG密碼子有效連接,在轉錄之後,可以產生可以在原核生物中和在葉綠體中翻譯的RNA。因此,所述載體還可以含有克隆位點,其定位允許至少一段異源多聚核苷酸與這樣的ATG密碼子有效連接。本發明的載體也可以含有與第一RBS和第二RBS有效連接的編碼第一多肽的核苷酸序列,其中所述的編碼核苷酸序列經過修飾之後含有一個或者多個克隆位點,包括,比如在ATG密碼子的上遊附近,ATG密碼子的下遊附近,以及/或者在被編碼的多肽的C末端或其附近。這樣的載體提供了一種方便地插入一段編碼第二多肽的核苷酸序列於其中的手段,或者是通過替代編碼所述第一多肽的核苷酸序列來實現,或者是在所述的被編碼的多肽的N末端或者C末端進行有效連接,這樣包含第一多肽和第二多肽的融合蛋白可以被表達出來。本發明還涉及一種含有本發明的多聚核苷酸或者載體的細胞。所述細胞可以是針對本發明的載體的宿主細胞,可以是原核生物細胞或者真核生物細胞,包括,比如細菌細胞如大腸桿菌細胞;植物細胞如藻類或單子葉或者雙子葉植物;昆蟲細胞;或者脊椎動物細胞如哺乳動物細胞。如果所述細胞是植物細胞,那麼所述多聚核苷酸或者載體可以包含在植物細胞的質體內,特別是葉綠體內,而且可以但並不一定整合到所述質體的基因組中。一般地,本發明的多聚核苷酸可以包含在載體內,並與可表達的多聚核苷酸有效連接,因此含有所述的多聚核苷酸的細胞就提供了一個表達系統,其允許由所述的可表達的多聚核苷酸編碼的一種或者多種多肽的翻譯。如此,所述的可表達的多聚核苷酸可以具有所述質體的密碼子使用偏好性,特別是葉綠體密碼子使用偏好性,所述的可表達的多聚核苷酸編碼至少第一多肽,比如編碼第一多肽和第二多肽。在一種具體實施方案中,所述的可表達的多聚核苷酸編碼抗體。在另外一種具體實施方案中,所述的可表達的多聚核苷酸具有葉綠體密碼子使用偏好性,例如,所述的可表達的多聚核苷酸具有SEQIDNO1,SEQIDNO13,SEQIDNO15,SEQIDNO42,SEQIDNO45或者SEQIDNO47所示的核苷酸序列。本發明進一步涉及一種轉基因植物,其包含含有本發明的多聚核苷酸,並且已經整合到葉綠體基因組DNA中的植物細胞。因此,本發明提供從這樣的轉基因植物獲得的植物細胞器或者細胞或者組織,比如從所述轉基因植物中分離出的葉綠體,或者是從所述轉基因植物中分離出的葉或者花,從所述轉基因植物中分離出的果實或者根莖,或者所述轉基因植物的插枝,或者由所述轉基因植物產生的種子。另外,本發明提供從本發明的轉基因植物,或者由所述的轉基因植物獲得的植物細胞或者組織中製備的cDNA或者葉綠體基因組DNA庫。本發明的轉基因植物可以是任何類型的植物,包括,比如藻類,可以是微藻或者巨藻;單子葉植物;或者雙子葉植物比如被子植物(例如穀物類植物,豆科植物,含油種子植物,或者硬木樹),包括觀賞類植物。本發明進一步涉及一種組合物,其中包括從本發明的轉基因植物或者通過遺傳修飾含有整合到植物葉綠體基因組DNA中的本發明的多聚核苷酸的植物細胞中獲得的植物材料。優選地,在所述的轉基因植物或者遺傳修飾過的植物細胞中,編碼所述的有效連接的第一RBS和第二RBS的多聚核苷酸與可表達的多聚核苷酸有效連接,所述的可表達的多聚核苷酸可以但並不一定具備葉綠體密碼子使用偏好性。這樣,所述的植物材料,可以是細胞器,細胞,或者一種或多種由轉基因植物獲得的組織,例如,葉綠體,或者葉或花,果實或根莖,或者由轉基因植物產生的種子,它們提供了由所述的可表達的多聚核苷酸編碼的一種或多種多肽的來源。例如,如果所述的可表達的多聚核苷酸編碼抗體,或者其抗原結合片斷,那麼所述植物材料,以及所述的組合物便提供了所述抗體的來源。本發明的組合物可以被配製成適合於施予活體的形式,所述活體例如脊椎動物或者其他哺乳動物,可以是家養動物或者寵物,或者可以是人。相應地,根據由所述的可表達的多聚核苷酸編碼的一種多肽或者多種多肽的不同,如在此公開的包含植物材料的組合物可以用作營養添加劑、治療試劑以及類似的產品。比如,如果所述的可表達的多聚核苷酸編碼抗體,或者其抗原結合片斷,那麼所述組合物可以用於例如暴露於皰疹病毒或破傷風毒素的個體的被動免疫。同樣,本發明提供用於改善一種病理狀態比如皰疹病毒感染的藥物。本發明還涉及編碼螢光蛋白或者其突變體或者其變異體的分離的多聚核苷酸,其中所述多聚核苷酸的密碼子具有葉綠體密碼子使用偏好性。所述多聚核苷酸可以是DNA序列或者RNA序列,可以是單鏈或者雙鏈,可以是在一端或者兩端含有克隆位點的線性多聚核苷酸。所述多聚核苷酸也可以與編碼第一RBS和第二RBS的多聚核苷酸有效連接,其中這兩個RBS序列被大約5到25個核苷酸分開,這樣,所述螢光蛋白可以方便地在原核生物和葉綠體中翻譯。編碼本發明的螢光蛋白的一種或者多種密碼子可以具有偏好性,例如,在第三個位置含有腺嘌呤或者胸腺嘧啶,這樣可促進所述螢光蛋白在葉綠體中的翻譯。例如,所述螢光蛋白可以是綠色螢光蛋白(GFP),如由Aequoreajellyfish產生的螢光蛋白。本發明的這樣的多聚核苷酸的示例是編碼序列為SEQIDNO2的多肽的多聚核苷酸,比如,SEQIDNO1所示的多聚核苷酸。因此,本發明也提供由這樣的多聚核苷酸編碼和表達的螢光蛋白,例如,具有SEQIDNO2所示的胺基酸序列的螢光蛋白。本發明進一步涉及重組核酸分子,其包括第一多聚核苷酸和第二多聚核苷酸,所述第一多聚核苷酸編碼至少一種多肽而且含有一個或者多個具有葉綠體密碼子使用偏好性的密碼子,所述第二多聚核苷酸包括編碼第一RBS的核苷酸序列和與之有效連接的編碼第二RBS的核苷酸序列,其中所述第一RBS可以指導所述多肽在原核生物中的翻譯,所述第二RBS可以指導所述多肽在葉綠體中的翻譯。所述第一多聚核苷酸可以編碼單個多肽,或者可以編碼兩個或者更多多肽,如果是後一種情況,所述多肽可以分別表達或者作為融合蛋白表達。如果所述第一多聚核苷酸編碼兩個或者更多多肽,各編碼序列之間的核苷酸序列可以但並不一定編碼內在核糖體進入位點,該位點的定位便於第二(或者其它)多肽的翻譯。本發明的重組核酸分子可以進一步包括第三多聚核苷酸,它可以與所述的第一和第二多聚核苷酸有效連接,它可以但並不一定編碼一個或者多個多肽。本發明還涉及製備葉綠體/原核生物穿梭表達載體的方法。這種方法可以這樣來實施,比如,向足以與葉綠體基因組DNA發生同源重組的一段葉綠體基因組DNA的核苷酸序列中導入下列序列包含原核生物複製原點的核苷酸序列;編碼第一RBS的核苷酸序列;編碼第二RBS的核苷酸序列,其中所述第一RBS和第二RBS被大約5到25個核苷酸分開;和克隆位點,其中所述克隆位點被定位以允許編碼多肽的多聚核苷酸有效連接到所述第一RBS和第二RBS,這樣,所述第一RBS可以指導所述多肽在原核生物中的翻譯,而所述第二RBS可以指導所述多肽在葉綠體中的翻譯。製備葉綠體/原核生物穿梭表達載體還可以通過遺傳修飾一段葉綠體基因組脫氧核糖核酸(DNA)的核苷酸序列來實現,所述這段核苷酸序列可以與葉綠體基因組DNA發生同源重組,經過修飾之後它含有原核生物複製起始位點,編碼被大約5到25個核苷酸分開的第一RBS和第二RBS的核苷酸序列,和克隆位點,其中所述克隆位點被定位以允許編碼多肽的多聚核苷酸有效連接到所述第一RBS和第二RBS,這樣,所述第一RBS可以指導所述多肽在原核生物中的翻譯,而所述第二RBS可以指導所述多肽在葉綠體中的翻譯。因此,本發明還提供如上所述的根據本發明的方法製備的葉綠體/原核生物穿梭載體。本發明進一步涉及重組多聚核苷酸,其包括編碼葉綠體RBS的第一核苷酸序列和與之有效連接的編碼多肽的第二核苷酸序列,其中所述第一核苷酸序列與所述第二核苷酸序列是相對異源的。這樣的重組多聚核苷酸可以進一步包括有效連接的編碼第二(或者其它)多肽的第三(或者更多)核苷酸序列,由此提供編碼雙順反子(或者多順反子)多聚核糖核苷酸序列的重組多聚核苷酸。編碼有效相連的RBS的核苷酸序列一般距離起始ATG密碼子大約20到40個核苷酸位置(上遊),而起始密碼子則與編碼所述多肽的所述核苷酸序列有效連接。在一種具體實施方案中,所述的第一核苷酸序列包括距離編碼RBS的序列的3』大約20到40個核苷酸位置的起始ATG密碼子。在另外一個具體實施方案中,一個內部核糖體結合序列被有效連接於編碼多肽的兩段或者更多核苷酸序列之間,所述的這些核苷酸序列可以相同也可以不同。本發明還涉及一種載體,其包括位於克隆位點5』端大約20到40個核苷酸位置的編碼RBS的核苷酸序列。所述克隆位點可以是任何便於核苷酸序列插入或者連接到載體中的核苷酸序列,比如,一個或者多個限制性內切酶識別位點,一個或者多個重組酶識別位點,或者是這些位點的組合。優選地,所述的克隆位點是多克隆位點,其中包括一系列限制性內切酶識別位點或者重組酶識別位點,或者是至少一個限制性內切酶識別位點和至少一個重組酶識別位點的組合。所述載體可以進一步包含位於所述克隆位點的5』端並與之相鄰的起始ATG密碼子或者其中的一部分,這樣就為缺乏起始ATG密碼子的編碼序列提供了翻譯起始位點。另外,所述載體可以包含葉綠體基因的3』非翻譯區,其位於所述克隆位點的3』端。圖1提供了GFPct(SEQIDNO1)和GFPncb(SEQIDNO3)編碼區的對比。GFPct的胺基酸序列(SEQIDNO2)在核苷酸序列下面標出。改變的密碼子用方框標記出來,在密碼子使用上被顯著改變的密碼子用陰影標記。優化的密碼子定義為萊茵衣藻(C.reinhardtii)葉綠體基因組中每1000個密碼子使用超過10次的密碼子(Nakamura等,Nucl.AcidsRes.27292,1999)。星號(*)標示GFPct和GFPncb之間的兩個胺基酸改變,分別在第2和第65位胺基酸上。圖2提供了pET表達的GFPct和GFPncb的表徵。在大腸桿菌中由質粒pET19b表達的GFPct和GFPncb蛋白通過Ni瓊脂糖親和色譜純化(實施例1)。含有GFPct或者GFPncb蛋白的E.colli細胞粗裂解物(20μl)不經過沸水浴直接上樣到12%的SDS-PAGE上,電泳結束過後,拆開電泳設備,讓膠留在玻璃板之間。螢光凝膠通過指定的激發(ex)和發射(em)濾鏡觀察。5微克通過親和純化得到的GFPct和GFPncb蛋白在12%的SDS-PAGE上分離,並用考馬斯亮藍染色。100ng的通過親和純化得到的GFPct和GFPncb蛋白經過12%的SDS-PAGE之後,再進行蛋白質印跡,用抗GFP一抗檢測。激發譜是從經過親和純化的GFPct(4μg)和GFPncb(20μg)蛋白得到的。記錄了在激發波長從350到550nm時的相對螢光強度,其中發射波長固定在510nm。GFPncb(點劃線)和GFPct(黑線)的發射譜如圖所示;虛線表示的是在兩個樣品在510nm處的發射峰。圖3提供了用於在萊茵衣藻葉綠體中的表達的GFPct和GFPncb報告基因的圖譜。圖3A顯示的是將rbcL5』UTR(BanmHI/NdeI;也可參見SEQIDNO5)與GFPct(SEQIDNO1)或GFPncb(SEQIDNO3)編碼區(NdeI/XbaI)以及rbcL3』UTR(XbaI/BamHI;也請參見SEQIDNO10)進行劃界的相關限制性位點。每個片斷的大小都以鹼基對數(bp)標明。圖3B顯示的是將rbcL5』和3』UTR控制下的GFPct和GFPncb基因整合到萊茵衣藻葉綠體基因組中的整合位點。萊茵衣藻的葉綠體DNA如5.7kb的EcoRI至XhoI片斷所標示。雙箭頭指示的是DNA雜交(Southernblot)分析中所用的探針的對應區域。圖4顯示的是突變的psbA5』UTR(SEQIDNOS35到40)的線性序列,其對應的位置是相對於野生型5』UTR(SEQIDNOS34)的起始密碼子+3到-36位置。5』UTR被置於D1cDNA的上遊,該cDNA是野生型psbA基因的無內含子拷貝。一級序列的改變用下劃線標示,起始密碼子用方框標示。星號表示mRNA的5』端,它們是在體內由剪切5』UTR的加工事件產生的(參見Mayfield,TrendsPlantSci.4190-195,1998,這篇文獻在此整入作為參考)。圖5A至5C提供了用於在萊茵衣藻葉綠體中表達的HSV8-lsc基因的限制性酶切圖譜。HSV8-lsc核苷酸序列(SEQIDNO47)及其胺基酸序列(SEQIDNO48)在序列表中提供。圖5A和5B顯示的是描繪下列片斷的相關限制性位點rbcL5』UTR(BamHI/NdeI),HSV8編碼區和flag標記(NdeI/XbaI),和rbcL3』UTR(XbaI/BamHI;圖5A),以及atpA5』UTR(BamHI/NdeI),HSV8編碼區和flag標記(NdeI/XbaI),和rbcL3』UTR(XbaI/BamHI;圖5B)的相關限制性位點。圖5C提供了一個限制性圖譜,其顯示了將HSV8-lsc基因整合到質粒p322中以便於將其整合到萊茵衣藻葉綠體基因組中的整合位點。p322質粒的DNA含有一段5.7kb的從EcoRI到XhoI的片斷,這個片斷對應於萊茵衣藻的葉綠體基因組中44,877到50,577的位置(參見全球資訊網URL地址「biology.duke.edu/chlamy_genome/chloro.html」)。雙箭頭指示的區域對應於Southem雜交分析中所用的探針。黑框指示(從左到右)的分別是psbA的外顯子5,5S核糖體基因和小部分的23S核糖體基因。圖6提供了結合於HSV8病毒蛋白的HSV8-lsc的表徵,這是通過ELISA獲得的。從轉基因的萊茵衣藻株系(10-6-3和16-3)中通過親和純化得到的HSV8-lsc在ELISA分析中用HSV蛋白來進行篩選,HSV蛋白從被病毒侵染的細胞中製備得到的。100,80,70,60,30,20,10或者5微升通過Flag純化的HSV8-lsc蛋白在微滴定板中用恆定量的病毒蛋白包被溫育。在這些親和純化的提取液中蛋白的濃度為13ng/μl,其中大約10%是HSV8-lsc,這是通過考馬斯亮蘭染色鑑定的。等體積的野生型萊茵衣藻的蛋白作為陰性對照(濃度為1μg/μl)。圖7提供了luxAB(SEQIDNO44)和luxCt(序列SEQIDNO46的胺基酸殘基2到695)編碼區的序列比對。帶有修改過的密碼子的胺基酸序列用方框和陰影標記的胺基酸來表示。優化的密碼子被定義為萊茵衣藻葉綠體基因組中每1000個密碼子中使用超過10次的密碼子(Nakamura等,1999)。這兩個蛋白質的胺基酸序列差異通過用方框和陰影標記的胺基酸來標示,而導致得到活性螢光素酶而被改變的兩個胺基酸用**在改變的胺基酸上方標示出來。圖8A和8B提供了在萊茵衣藻葉綠體中表達的luxCt基因的圖譜。圖8A說明了描繪atpA5』UTR(BamHI/NdeI),luxCt編碼區(NdeI/XbaI),和rbcL3』UTR(XbaI/BamHI)的相關限制性位點。圖8B提供了一個顯示有質粒p322和萊茵衣藻葉綠體基因組之間的同源區域的圖譜,嵌合的luxCt基因就是被插入到這個同源區域中。萊茵衣藻葉綠體DNA是以5.7kb的EcoRI到XhoI的片斷表示的,這個片斷是定位在葉綠體基因組的反向重複區域中。雙箭頭表示的區域對應於Southern和Northern雜交分析中所用的探針。黑框從左到右分別指示的是,psbA的外顯子5,5S核糖體RNA和23S核糖體RNA基因。發明詳述本發明提供了在質體中,特別是在植物葉綠體中表達功能性多肽,包括功能性蛋白複合物的組合物和方法,以及促進多聚核苷酸在植物葉綠體和原核生物之間穿梭和允許被編碼的多肽在葉綠體和原核生物中表達的組合物。在一種具體實施方案中,本發明的方法通過表達功能性抗體來例示,所述抗體包括正確地組裝並且可以特異性地結合抗原的單鏈抗體,以及作為單鍊表達並且可以特異性地聯合形成特異性地結合抗原的同源二聚體的抗體及其抗原結合片斷。根據本發明的一種方法,編碼所述抗體的多聚核苷酸與一個5』端非翻譯區(5』UTR)有效連接,所述的非翻譯區包括指導所述抗體在葉綠體中翻譯的核糖體結合序列(RBS)。在另外一個具體實施方案中,編碼所述抗體的多聚核苷酸與一個指導在原核細胞中的翻譯的第一RBS,以及一個指導在葉綠體中的翻譯的第二RBS有效連接。在又另外一個具體實施方案中,編碼所述抗體的多聚核苷酸具有葉綠體密碼子使用偏好性。根據本發明的另外一種方法,將合成的多聚核苷酸導入細胞,所述的合成的多聚核苷酸包括編碼至少第一多肽的至少第一核苷酸序列,其中所述的第一核苷酸序列中至少一個密碼子具有葉綠體密碼子使用偏好性,被編碼的多肽可以在細胞中被表達。在一種具體實施方案中,所述的第一核苷酸序列中每個密碼子都具有葉綠體密碼子使用偏好性,在另外一個具體實施方案中,所述的合成的多聚核苷酸含有至少一個第二核苷酸序列,所述第二核苷酸序列可以但並不一定與第一核苷酸序列有效連接,而且所述第二核苷酸序列編碼至少一種第二多肽,其中所述多聚核苷酸的表達可以但並不一定生成包括所述第一和第二(或者更多)多肽的融合蛋白。因此,本發明提供合成的多聚核苷酸,它包括編碼至少第一多肽的至少第一核苷酸序列,其中所述的第一核苷酸序列中至少一個密碼子具有葉綠體密碼子使用偏好性。這裡使用的名詞「合成的多聚核苷酸」意指經過修飾的核酸分子,其中多肽中不具有葉綠體密碼子使用偏好性的密碼子被改變為具有葉綠體密碼子使用偏好性的密碼子(參見表1,如下)。如在此所公開的,由這樣的合成的多聚核苷酸編碼的多肽在葉綠體中的表達強烈。在其它具體實施方案中,提供了實踐本發明的方法的組合物。由本發明提供的優點包括可以使功能性多肽在植物葉綠體中強烈表達的能力,其中多肽還不會被糖基化,因此當施用於個體時抗原性會降低,另外還能在不需要發酵設備以及相關花費的情況下生產出大量的功能性多肽。本發明的方法提供了在植物葉綠體中表達一種或者多種多肽的手段,這樣所述多肽可以組裝產生功能性蛋白複合物。如在此公開的,葉綠體中表達的多肽不僅可以正確組裝,而且當這些多肽包括一個蛋白複合物的亞基時,這些多肽可以特異性地聯合生成功能性蛋白複合物。這裡用到的術語「蛋白複合物」意指通過至少兩個多肽的特異性聯合而形成的組合物,所述多肽可以相同也可以不同。能夠特異性地聯合起到蛋白複合物的功能的多肽是已知的,包括酶、生長因子和激素受體,以及類似物。這裡用到的術語「特異性聯合」或者「特異性相互作用」或者「特異性結合」意指兩個或者更多多肽形成在生理條件下相對穩定的複合體。這裡用到的術語可以是指各種相互作用,包括,例如第一多肽亞基和第二多肽亞基的相互作用,通過這種相互作用可以形成功能性蛋白複合物,以及抗體和它的抗原之間的相互作用。特異性的相互作用可以通過至少為大約1×10-6M的解離常數來表徵,一般是至少大約1×10-7M,常常是至少大約1×10-8M,特別情況下是至少大約1×10-9M或者1×10-10M或更大。特異性的相互作用一般在生理條件下是穩定的,所述生理條件包括活體細胞中的條件或者亞細胞區室中的條件,所述活體包括植物或者動物,其中動物可以是脊椎動物或者無脊椎動物,以及在細胞培養中用到的條件,比如用於維持某種生物的細胞或者組織的條件。檢測兩個分子是否特異性地相互作用的方法是已知的,包括例如平衡透析,表面質體共振,凝膠阻滯分析,以及類似的方法。本發明的方法可以用於產生功能性的多肽,包括功能性蛋白複合物,這種用途通過功能性抗體的產生在此例示。這裡廣泛使用的術語「抗體」意指可以特異性地結合抗原的抗原決定部位的多肽或者蛋白複合物。一般地,抗體含有至少一個抗原結合結構域,這個結構域是由重鏈可變區結構域和輕鏈可變區結構域,特別是高度可變區聯合形成的。根據本發明中的方法生成的抗體可以是基於自然發生的抗體,比如二價抗體,它含有可以通過第一重鏈和輕鏈可變區和第二重鏈和輕鏈可變區形成的兩個抗原結合結構域(例如,IgG或者IgA同型),或者通過第一重鏈可變區和第二重鏈可變區形成的兩個抗原結合結構域(VHH抗體;參見,比如美國專利號6,005,079),或者是基於非自然發生的抗體,包括比如,單鏈抗體,嵌合抗體,雙功能抗體,人類化的(humanized)抗體,以及抗體的抗原結合片斷,比如Fab片斷,Fd片斷,Fv片斷,以及類似物。在一種具體實施方案中,本發明的方法用編碼包括重鏈和與之有效連接的輕鏈的單鏈抗體的多聚核苷酸來例示,其中所述抗體特異性地結合破傷風毒素(參見SEQIDNO13和14)。在另外一種具體實施方案中,本方法是用編碼包括重鏈和與之有效連接的輕鏈的單鏈抗體的多聚核苷酸來例示,其中所述抗體特異性地結合單純皰疹病毒1型和2型,而且其中編碼所述抗體的多聚核苷酸具有葉綠體密碼子使用偏好性(參見SEQIDNO15和16;SEQIDNO42和43;SEQIDNO47和48;也請參見實施例3)。用於實踐本發明的方法的多聚核苷酸可以從產生感興趣的抗體的細胞中分離,比如,來自免疫個體的B細胞或者來自接觸過特定抗原的個體,也可以應用已知的多聚核苷酸合成方法從頭合成,還可以通過重組方法產生,或者可以例如通過篩選編碼可變重鏈和可變輕鏈的多聚核苷酸的組合文庫來獲得(參見Huse等,Science2461275-1281(1989),這篇文獻在此整入以供參考),而且所述多聚核苷酸可以具有葉綠體密碼子使用偏好性,如果需要的話(參見實施例1和表1)。製備編碼例如嵌合、人化、CDR移植、單鏈和雙功能抗體的多聚核苷酸的這些方法和其它方法對於本領域技術人員來說是廣為人知的(Winter和Harris,Immunol.Today14243-246,1993;Ward等,Nature341544-546,1989;Harlow和Lane,AntibodiesAlaboratorymanual(ColdSpringHarborLaboratoryPress,1988);Hilyard等,ProteinEngineermgApracticalapproach(IRLPress1992);Borrabeck,AntibodyEngineering,第二版(OxfordUniversityPress1995);每篇都在此整入以供參考)。舉個例子,編碼人化的單克隆抗體的多聚核苷酸可以這樣來獲得,將編碼鼠免疫球蛋白重鏈和輕鏈可變區的互補決定區域的核苷酸序列轉移到人類的可變結構域基因中,然後在鼠的相應的框架區域中替換人類的殘基。用於克隆鼠免疫球蛋白可變結構域的一般技術是已知的(參見,比如,Orlandi等,Proc.Natl.Acad.Sci.,USA863833,1989,這篇文獻在此整入以供參考),製備人化單克隆抗體的方法也是已知的(參見,比如,Jones等,Nature321522,1986;Riechmann等,Nature332323,1988;Verhoeyen等,Science2391534,1988;Carter等,Proc.Natl.Acad.Sci.,USA894285,1992;Sandhu,Crit.Rev.Biotechnol.12437,1992;和Singer等,J.Immunol.1502844,1993;每篇文獻都在此整入作為參考)。本發明的方法還可以應用編碼從組合免疫球蛋白文庫中分離出的人類抗體片斷的多聚核苷酸來實踐(參見,比如,Barbas等,MethodsACompaniontoMethodsinImmunology2119,1991;Winter等,Ann.Rev.Immunol.12433,1994;每篇文獻都在此整入以供參考)。用於產生人類免疫球蛋白噬菌體文庫的克隆載體和表達載體可以通過例如從StratageneCloningSystems(加尼福利亞州,拉霍亞)獲得。編碼人類單克隆抗體的多聚核苷酸還可以例如從轉基因鼠中獲得,所述的轉基因鼠已經過遺傳工程改造,可以產生響應抗原反應的特異性人類抗體。在這種技術中,人類的重鏈和輕鏈基因座的元件被導入到鼠的株系中,所述株系是來自於內源重鏈和輕鏈基因座被靶向破壞的胚胎幹細胞系。這種轉基因鼠可以合成針對人體抗原的特異性人體抗體,而且這種鼠可以用來產生分泌人體抗體的雜交瘤,從中可以獲得用於實踐本發明的方法的多聚核苷酸。從轉基因鼠中獲得人類抗體的方法在如下文獻中描述過,比如Green等,NatureGenet.713,1994;Lonberg等,Nature368856,1994;和Taylor等,Intl.Immunol.6579,1994;每篇文獻都在此整入以供參考,而且這樣的轉基因鼠是可以通過商業渠道獲得的(Abgenix公司;加尼福利亞州,佛利蒙)。所述的多聚核苷酸也可以是編碼抗體的抗原結合片斷的多聚核苷酸。抗原結合片斷,包括,比如Fv,Fab,Fab』,Fd,和F(ab』)2片斷,這些都是本領域所熟知的,而且最初都是通過抗體的蛋白酶水解而鑑定出的。例如,抗體片斷可以通過傳統的胃蛋白酶和木瓜蛋白酶水解整個抗體得到。用胃蛋白酶酶解得到的抗體片斷產生一個5S的片斷,被稱為F(ab』)2片斷。這種片斷可以進一步用一種巰基還原試劑剪切,對於由二硫鍵連接的切割而產生的巰基還可以選擇地使用封閉基團,這樣便產生一個3.5S的Fab』單價片斷。作為選擇,可以用胃蛋白酶進行酶切割,直接產生兩個Fab』單價片斷和一個Fc片斷(參見,比如,Goldenberg,美國專利號4,036,945和美國專利號4,331,647,每一個都在此整入以供參考;Nisonhoff等,Arch.Biochem.Biophys.89230.1960;Porter,Biochem.J.73119,1959;Edelman等,Meth.Enzymol.1422(AcademicPress1967);Coligan等,在Curr.ProtocolsImmunol.1992,參見2.8.1-2.8.10和2.10.1-2.10.4;每篇文獻都在此整入以供參考)。抗體片斷的另外一種形式是編碼單個互補決定區(CDR)的肽。CDR肽可以通過構建編碼感興趣的抗體的CDR的多聚核苷酸來獲得,比如通過聚合酶鏈式反應由產生抗體的細胞的RNA來合成所述的可變區(參見,比如,Larrick等,MethodsACompaniontoMethodsinEnzymology2106,1991,這篇文獻在此整入以供參考)。編碼這樣的抗體片斷——包括這些片斷的亞基和連接例如重鏈可變區和輕鏈可變區的連接肽——的多聚核苷酸可以通過化學合成方法或者常規的重組DNA方法來製備,這樣的製備可以從按如前所述的方法獲得的編碼全長重鏈和輕鏈的多聚核苷酸起始。本方法部分地基於這樣的事實,即核糖體結合序列(RBS)相對於編碼序列的正確定位能導致這段編碼序列在植物葉綠體中強烈地翻譯(參見下面的內容;也參見實施例2),那些當在生物體內自然生成時已知會特異性地聯合形成蛋白複合物的多肽(例如抗體)也可以在葉綠體中正確聯合(參見實施例3)。在葉綠體中表達這樣的多肽的一個優點是這樣表達出來的多肽不會像由核基因表達出來的多肽一樣經過一些細胞區室,這樣也就不會發生某些翻譯後修飾比如糖基化。同樣,通過本發明的方法產生的多肽或者蛋白複合物可以具有較從導入到真核生物細胞核的多聚核苷酸中表達出來的同樣的多肽更低的抗原性。本發明的方法提供了產生功能性多肽和蛋白複合物的手段,前者例如單鏈抗體,後者例如二價抗體,包括比如第一重鏈和輕鏈以及與其聯合的第二重鏈和輕鏈。如在此所公開的,本發明的方法可以這樣來實施,比如,向葉綠體中導入重組核酸分子,其中所述重組核酸分子包括編碼至少一個多肽(即,1,2,3,4或更多)的第一多聚核苷酸和與之有效連接的第二多聚核苷酸,所述第二多聚核苷酸包括編碼第一RBS的核苷酸序列和與之有效連接的編碼第二RBS的核苷酸序列,所述導入的條件允許所述的至少一種多肽的表達。這樣的條件包括允許或者有利於所述重組核酸分子進入葉綠體的條件,優選地,是將所述重組核酸分子整合到葉綠體基因組中的條件。這樣的方法包括在此列舉的方法,以及在本領域已知的常規的其它方法。在這裡使用的術語「有效連接」意指兩個或者更多個分子被相對彼此定位,這樣它們可以作為一個單一的單位看待,而且表現出來的功能是具備其中一個或者兩個分子或者它們的組合的特性。例如,編碼多肽的多聚核苷酸可以與轉錄調控元件或者翻譯調控元件有效連接,這種情況下,所述元件對於所述多聚核苷酸的調控作用就如同它們在細胞中調控與它們正常相連的多聚核苷酸序列一樣。一個第一多聚核苷酸編碼序列可以與一個第二(或者更多)編碼序列有效連接,這樣一個嵌合多肽就可以從該有效連接的編碼序列中表達出來(參見,比如,SEQIDNO30,其顯示了編碼GFP並且具有葉綠體密碼子使用偏好性的多聚核苷酸(即,SEQIDNO1)插入到PsbD基因中的位點,這樣一種包含了融合有GFP的PsbD基因產物的螢光融合蛋白便產生了)。所述嵌合多肽可以是融合多肽,其中被編碼的兩個(或者更多)肽被翻譯成單個多肽,即通過肽鍵共價相連,例如,包括(通過連接肽,如果需要的話)有效連接的重鏈可變區和輕鏈可變區的單鏈抗體;或者可以翻譯成兩個獨立的多肽,然後在翻譯之後可以特異性地互相聯合形成穩定的蛋白複合物,例如,抗體的重鏈和輕鏈,它形成四級結構,得到功能性的單價抗體,這種單價抗體可以進一步聯合形成功能性的二價抗體。編碼這樣的融合蛋白的合成的多聚核苷酸的例子包括SEQIDNO45,它編碼細菌螢光素酶融合蛋白,以及SEQIDNO15,42和47,它們編碼單鏈抗HSV抗體。在這裡被廣泛使用的術語「多聚核苷酸」或者「核苷酸序列」或者「核酸分子」意指由兩個或者多個脫氧核糖核苷酸或者核糖核苷酸通過磷酯鍵連接起來的序列。這樣,這些術語包括RNA和DNA,可以是一個基因或者是基因的一部分,還包括cDNA,合成的多聚脫氧核糖核苷酸序列,或者類似的分子,而且可以是單鏈或者雙鏈,也可以是DNA/RNA雜交分子。進一步,這裡用到的這些術語包括自然發生的核酸分子,它們可以從細胞中分離,也包括合成的多聚核苷酸,它們可以比如通過化學合成的方法或者酶學方法如聚合酶鏈式反應(PCR)來製備。需要注意的是,這裡所用的不同術語只不過是為了討論的方便,比如為了區分一個組合物的不同組分,作為例外的是在此用到的術語「合成的多聚核苷酸」,它是專指經過修飾之後具有葉綠體密碼子使用偏好性的多聚核苷酸。一般地,組成多聚核苷酸的核苷酸包括自然發生的脫氧核糖核苷酸,比如連接到2』脫氧核糖上的腺嘌呤,胞嘧啶,鳥嘌呤或者胸腺嘧啶,或者核糖核苷酸,比如連接到核糖上的腺嘌呤,胞嘧啶,鳥嘌呤或者尿嘧啶。然而,根據用途的不同,多聚核苷酸還可以含有核苷酸類似物,這些類似物包括非自然發生的合成的核苷酸或者經過修飾的自然發生的核苷酸。核苷酸類似物在本領域是已熟知的,而且可以從商業途徑獲得(比如Ambion公司;AustinTX),含有這樣的核苷酸類似物的多聚核苷酸也是如此(Lin等,Nucl.AcidsRes.225220-5234,1994;Jellinek等,Biochemistry3411363-11372,1995;Pagratis等,NatureBiotechnol.1568-73,1997,每篇文獻都在此整入以供參考)。多聚核苷酸中連接核苷酸的共價鍵一般都是磷酯鍵。然而,根據多聚核苷酸被應用的目的,所述共價鍵也可以是其它很多種鍵中的一種,包括硫酯鍵,硫代磷酯鍵,肽類似鍵或者任何其它本領域已知的可以連接核苷酸生成合成的多聚核苷酸的鍵(參見,比如,Tam等,Nucl.AcidsRes.22977-986,1994;Ecker和Crooker,Biotechnology13351360,1995,每篇文獻都在此整入以供參考)。含有自然發生的核苷酸和磷酯鍵的多聚核苷酸可以化學合成,或者可以利用合適的多聚核苷酸作為模板通過重組DNA方法製備。與此相比,含有核苷酸類似物或者非磷酯鍵的共價鍵的多聚核苷酸一般需要通過化學合成製備,儘管諸如T7聚合酶的酶也可以將某些類型的核苷酸類似物整合到多聚核苷酸中,並因此可以用來由合適的模板通過重組方法製備這樣的多聚核苷酸。這裡使用的術語「重組核酸分子」意指通過人為介入來操作的多聚核苷酸。重組核酸分子可以包含兩個或者多個核苷酸序列,它們被連接起來形成在自然界的細胞中沒有被發現的產物。特別地,所述兩個或者多個核苷酸序列可以有效連接,而且可以例如編碼一個融合多肽,或者可以包含編碼核苷酸序列和調控元件,特別地,所述調控元件指有效連接的第一RBS和第二RBS。重組核酸分子也可以基於自然發生的多聚核苷酸,但是經過操作之後,它們與自然發生的多聚核苷酸有所不同,例如其中有一個或者多個核苷酸發生變化,這樣在這個多聚核苷酸中正常出現的第一密碼子具有了葉綠體密碼子使用偏好性,或者感興趣的序列被導入到所述多聚核苷酸中,例如限制性內切酶識別位點或者剪接位點,啟動子,DNA複製原點,或者類似的序列。如在此所公開的,RBS定位在起始密碼子比如AUG密碼子的上遊(5』)大約20到40個核苷酸使得起始於該AUG密碼子的編碼序列可以強烈地翻譯(參見實施例2)。這樣,定位於AUG密碼子上遊大約20到40個核苷酸位置的RBS可以被認為是與所述AUG密碼子「有效連接」。進一步,已經知道的是,定位在起始密碼子上遊大約5到15個核苷酸位置的RBS可以指導編碼序列在原核生物中的翻譯,而且如在此公開的,這樣的RBS可以與定位在起始密碼子上遊大約20到40個核苷酸位置的第二RBS有效連接,這樣得到的翻譯調控元件可以指導編碼序列在原核生物和葉綠體中的翻譯。這樣,第一和第二RBS被大約5到25個核苷酸分開,它們也被認為是有效連接的。需要注意的是,這裡使用的術語「第一」,「第二」,「第三」等等是指一個RBS或者多聚核苷酸或者多肽,或類似物,這些術語的使用只是為了討論的方便,除非特別指明,否則不暗指任何順序或者重要性或者類似的意思。同樣地,例如談到可以指導在原核生物中的翻譯的第一RBS和可以指導在葉綠體中的翻譯的第二RBS時,這裡使用的「第一」、「第二」(或者類似的名稱)只是為了便於區分這兩個(或者更多個)元件而已。對於RBS具有「指導翻譯」的能力,這是指當它與通常以起始密碼子起始的編碼序列有效連接時,所述RBS可以與核糖體結合,這樣翻譯就可以從所述起始密碼子處開始。這裡使用的術語「起始密碼子」是指作為編碼序列的第一個密碼子的核糖核苷酸序列或者編碼脫氧核糖核苷酸序列。一般地,起始密碼子是一個「起始AUG密碼子」(在RNA中)或者一個「起始ATG密碼子」(在DNA中),它編碼一個甲硫氨酸,儘管其它的密碼子也可以作為起始密碼子,包括例如CUG。可以使編碼多聚核苷酸的一個或者多個密碼子表現出葉綠體的密碼子使用偏好(實施例1)。大多數胺基酸由兩個或者更多個不同的(簡併)密碼子編碼,而且已經知道的是,不同的生物利用某些密碼子相對於其它密碼子來說具有優先性。這種優選的密碼子使用也被葉綠體採用,這也就是這裡提到的「葉綠體密碼子使用」。表1(下面)顯示的是萊茵衣藻的葉綠體密碼子使用。當術語「被傾向於(biased)」被用來形容一個密碼子的時候,它是指多聚核苷酸中一個密碼子的序列已經被改變,使得該密碼子成為在葉綠體中優選使用的密碼子(參見表1)。被傾向於葉綠體的密碼子使用的多聚核苷酸可以從頭合成,或者可以應用常規的重組DNA技術進行遺傳修飾得到,比如通過位點專一性突變方法來改變一個或者多個密碼子使得它們具有葉綠體密碼子使用偏好性(參見實施例1)。如在此公開的,葉綠體的密碼子偏好在不同植物之間可能有些差別,比如藻類的葉綠體與菸草的葉綠體相比。一般地,根據本發明的目的——包括例如在製備在此公開的合成的多聚核苷酸時——所選擇的葉綠體密碼子偏好要反映出某種植物葉綠體的密碼子使用,包括這樣一種密碼子偏好,即一個密碼子的第三個位置偏向於A/T,例如,第三個位置具有超過大約66%的AT偏好,特別地,具有超過大約70%的AT偏好。這樣,根據本發明的目的而偏好的葉綠體密碼子排除了例如在Nicotianatabacus(菸草)觀察到的第三位偏好,其在密碼子的第三位上具有34.56%的GC偏好(參見,例如,全球資訊網URL「kazusa.or.jp/codon/」,和其中的「葉綠體」連結)。在一種具體實施方案中,所述葉綠體密碼子使用偏好性是藻類葉綠體密碼子使用的偏好性,比如萊茵衣藻,其葉綠體的密碼子第三位上具有74.6%的AT偏好。表1萊茵衣藻中的葉綠體密碼子使用UUU34.1*(348**)UCU19.4(198)UAU23.7(242)UGU8.5(87)UUC14.2(145)UCC4.9(50)UAC10.4(106)UGC2.6(27)UUA72.8(742)UCA20.4(208)UAA2.7(28)UGA0.1(1)UUG5.6(57)UCG5.2(53)UAG0.7(7)UGG13.7(140)CUU14.8(151)CCU14.9(152)CAU11.1(113)CGU25.5(260)CUC1.0(10)CCC5.4(55)CAC8.4(86)CGC5.1(52)CUA6.8(69)CCA19.3(197)CAA34.8(355)CGA3.8(39)CUG7.2(73)CCG3.0(31)CAG5.4(55)CGG0.5(5)AUU44.6(455)ACU23.3(237)AAU44.0(449)AGU16.9(172)AUC9.7(99)ACC7.8(80)AAC19.7(201)AGC6.7(68)AUA8.2(84)ACA29.3(299)AAA61.5(627)AGA5.0(51)AUG23.3(238)ACG4.2(43)AAG11.0(112)AGG1.5(15)GUU27.5(280)GCU30.6(312)GAU23.8(243)GGU40.0(408)GUC4.6(47)GCC11.1(113)GAC11.6(118)GGC8.7(89)GUA26.4(269)GCA19.9(203)GAA40.3(411)GGA9.6(98)GUG7.1(72)GCG4.3(44)GAG6.9(70)GGG4.3(44)*每1000個密碼子中某個密碼子的使用頻率。**在36個葉綠體編碼序列(10193個密碼子)中觀察到的次數。本發明的方法可以應用編碼一個第一多肽和至少一個第二多肽的多聚核苷酸來實施。這樣,所述多聚核苷酸可以編碼比如一個第一多肽和一個第二多肽;一個第一多肽,一個第二多肽和一個第三多肽;等等。進一步,任何一個或者所有被編碼的多肽可以相同也可以不同。如在此公開的,在微藻萊茵衣藻的葉綠體中表達的多肽裝配形成功能性多肽和蛋白複合物(參見實施例1和3)。這樣,本發明的方法提供了一種生產功能性蛋白複合物的手段,所述蛋白複合物包括例如二聚體,三聚體和四聚體,其中所述複合物的亞基可以相同或者不同(例如分別是同源二聚體或者異源二聚體)。在葉綠體中表達功能性多肽和蛋白複合物的方法通過抗體的生產以及報告蛋白的生產來例示,所述報告蛋白包括綠色螢光蛋白和螢光素酶(luxAB融合蛋白;參見實施例1和4;也可分別參見SEQIDNOS1和45),抗體可以從具有葉綠體密碼子使用偏好性的多聚核苷酸表達出來(參見實施例3,也可參見SEQIDNOS15,42和47)。如在此例示的,葉綠體用重組核酸分子進行轉染,所述重組核酸分子包括編碼一個單鏈抗體的多聚核苷酸,所述的單鏈抗體具有一個連接到輕鏈可變區上的完整重鏈,而由此生成了包括兩個單鏈抗體的同源二聚體,所述兩個單鏈抗體通過其重鏈結構域之間的特異性相互作用聯合在一起。這些結果提供了證明異源多肽可以在葉綠體中特異性地聯合形成四級結構的證據,並證明了異源多聚體可以通過本發明的方法來產生,通過向葉綠體中導入編碼所述異源多聚體的各個不同的多肽的單個重組核酸分子,或者導入兩個或者多個多聚核苷酸,其中的每一個編碼所述異源多聚體的一個(或者多個)亞基。本發明的方法可以應用一個第一重組核酸分子來實施,所述重組核酸分子包括編碼指導在葉綠體中的翻譯的RBS的核苷酸序列,優選地,這段核苷酸序列還進一步編碼有效連接的指導在原核生物中的翻譯的RBS,所述核苷酸序列與編碼至少第一多肽的至少一個多聚核苷酸有效連接。例如,所述重組核酸分子可以包括編碼免疫球蛋白重鏈(H)或者其可變區(VH)的多聚核苷酸,還可以進一步編碼第二多肽,所述第二多肽是免疫球蛋白輕鏈(L)或者其可變區(VL)。如果需要的話,編碼內在核糖體進入位點的核苷酸序列可以定位於編碼H鏈和L鏈的核苷酸序列之間,這樣有助於被編碼的第二(下遊)多肽的表達。被編碼的H鏈和L鏈在葉綠體中被翻譯出來之後,一個H鏈可以與一個L鏈聯合形成一個單價抗體(比如一個H:L複合體),而兩個H:L複合體可以進一步聯合形成一個二價抗體。本發明的方法也可以這樣來實踐,向植物葉綠體中導入第一重組核酸分子,所述第一重組核酸分子包括編碼例如一個H鏈或者VH鏈的多聚核苷酸,再進一步向所述葉綠體導入第二重組核酸分子,所述第二重組核酸分子包括編碼一個L鏈或者VL鏈的多聚核苷酸,其中每個重組核酸分子都包括編碼第一RBS的核苷酸序列和與之有效連接的編碼第二RBS的核苷酸序列,其中所述第一RBS可以指導多肽在原核生物中的翻譯,而所述第二RBS可以指導多肽在葉綠體中的翻譯,其中編碼這兩個RBS的核苷酸序列與所述的編碼多聚核苷酸序列有效連接。當含有所述葉綠體的植物細胞暴露於允許被編碼的多肽共表達的條件時,H鏈和L鏈可以聯合形成H:L複合體,然後H:L複合體可以進一步聯合產生二價抗體。包含有編碼多肽的多聚核苷酸的重組核酸分子可以進一步包含肽標記物比如His-6標記或者類似的標記,所述標記與所述編碼序列有效連接,有助於鑑定所述多肽在細胞中的表達。例如His-6的多組氨酸標記肽可以用二價陽離子比如鎳離子,鈷離子或者類似的離子檢測。其它的肽標記包括,例如,FLAG表位,它可以通過抗FLAG抗體來檢測(參見,比如,Hopp等,BioTechnology61204(1988);美國專利號5,011,912,每篇文獻都在此整入以供參考);c-myc表位,它可以用特異性地針對該表位的抗體來檢測;生物素,它可以用鏈親和素或者親和素來檢測;以及穀胱甘肽S轉移酶,它可以用穀胱甘肽來檢測。這樣的標記可以提供一些額外的優點,例如,它們有助於與之有效連接的多肽的分離,如果希望獲得基本上純化的多肽的話。本發明的方法中用到的重組核酸分子可以包含在載體中。進一步,如果這種方法用到第二(或者更多)重組核酸分子,那麼所述的第二重組核酸分子也可以包含在載體中,該載體可以但並不一定與含有第一重組核酸分子的載體相同。所述載體可以是任何一種用於向葉綠體中導入多聚核苷酸的載體,優選地,所述載體含有一段葉綠體基因組DNA的核苷酸序列以便於與葉綠體基因組發生同源重組,比如一段包含有葉綠體基因組DNA中400到1500或者更多個連續核苷酸的核苷酸序列。葉綠體載體和選擇葉綠體基因組上的某些區域作為載體的方法是已熟知的(參見,比如,Bock,J.Mol.Biol.312425-438,2001;也可參見Staub和Maliga,Plantcell439-45,1992;Kavanagh等,Genetics1521111-1122,1999,每篇文獻都在此整入以供參考)。萊茵衣藻的整個葉綠體基因組是可以通過全球資訊網上的公共資料庫獲取,其URL地址為「biology.duke.edu/chlamy_genome/chloro.html」(參見「以文本文件格式查看完整基因組」連結和「葉綠體基因組圖譜」連結),這裡的每一篇文獻都在此整入以供參考(J.Maul,J.W.Lilly,和D.B.Stern,未發表結果;在2002年1月28日修改;將要以GenBank註冊號AF396929發表)。一般地,被選擇的葉綠體基因組DNA的核苷酸序列都不是基因的一部分,包括不是調控序列或者編碼序列,特別地,如果由於同源重組導致基因被破壞,從而會對葉綠體造成破壞性的影響,比如影響葉綠體基因組的複製,或者會對含有葉綠體的植物細胞造成破壞性影響,那麼,被選擇的葉綠體基因組DNA的核苷酸序列不能是這樣的基因的一部分。基於這種考慮,公布了萊茵衣藻葉綠體基因組序列的網站也提供了顯示葉綠體基因組的編碼區和非編碼區的圖譜,因此有助於挑選出可用於構建本發明的載體的序列。例如,在此所公開的實驗中用到的葉綠體載體p322是一個從位置大約是143.1kb的Eco(EcoRI)位點延伸到位置大約是148.5kb的Xho(XhoI)位點的克隆(參見全球資訊網,URL地址為「biology.duke.edu/chlamygenome/chloro.html」,點擊「葉綠體基因組圖譜」連結,然後再點擊「140-150kb」連結;也可以直接通過全球資訊網URL「biology.duke.edu/chlamy/chloro/chloro140.html」進入;也參見實施例1)。所述載體還可以包含一些額外的有助於載體的應用或者操作的核苷酸序列,比如,一個或者多個轉錄調控元件,編碼選擇性標記的序列,一個或者多個克隆位點,以及類似的序列。在一個具體實施方案中,所述葉綠體載體含有原核生物的複製原點(ori),比如,大腸桿菌的ori,從而提供了可以在原核宿主細胞和葉綠體之間轉移和操作的穿梭載體。本發明的方法通過使用微藻萊茵衣藻來說明。根據本發明的方法,使用微藻來表達多肽或者蛋白複合物的優點是可以這種微藻可以大量培養,包括商業上的渠道(Cyanotech公司;Kailua-KonaHI),從而可以生產和分離出大量所需要的產品,如果需要的話。然而,任何植物都可以在葉綠體中表達例如功能性哺乳動物多肽包括蛋白複合物的能力也允許這樣的植物可以大量種植,因此也可以方便地產生大量的多肽。因此,本發明的方法可以用任何一種含有葉綠體的植物來實踐,包括,比如,巨藻如海洋藻類和海草,以及生長在土壤中的植物,比如穀物(玉米(Zeamays)),白菜(比如B.napus,B.rapa,B.juncea),特別是那些用於生產植物油的品種,苜蓿(Medicagosativa),水稻(Oryzasativa),黑麥(Secalecereale),高粱(Sorghumbicolor,Sorghumvulgare),玉蜀黍(比如,珍珠黍(Pennisetumglaucum),稷黍(Panicummiliaceum),狐尾草(Setariaitalica),手指黍(Eleusinecoracana)),向日葵(Helianthusannuus),紅花(Carthamustinctorius),小麥(Triticumaestivum),大豆(Glycinemax),菸草(Nicotianatabacum),馬鈴薯(Solanumtuberosum),花生(Arachishypogaea),棉花(Gossypiumbarbadense,Gossypiumhirsutum),甜馬鈴薯(Ipomoeabatatus),木薯(Manihotesculenta),咖啡(Cofeaspp.),椰子(Cocosnucifera),菠蘿(Ananascomosus),柑橘樹(Citrusspp.),可可樹(Theobromacacao),茶(Camelliasinensis),香蕉(Musaspp.),鱷梨樹(Perseaultilane),無花果(Ficuscasica),番石榴(Psidiumguajava),芒果(Mangiferaindica),橄欖木(Oleaeuropaea),番木瓜(Caricapapaya),腰果(Anacardiumoccidentale),夏威夷核果(Macadamiaintegrifolia),杏仁果(Prunusamygdalus),糖用甜菜(Betavulgaris),甘蔗(Saccharumspp.),燕麥,浮萍(Lemna),大麥,番茄(Lycopersiconesculentum),萵苣(比如Lactucasativa),綠豆(Phaseolusvulgaris),利馬豆(Phaseoluslimensis),豌豆(Lathvrusspp.),以及瓜類比如黃瓜(C.sativus),香瓜(C.cantalupensis),麝香瓜(C.melo)。觀賞類植物也可以包括在內,比如杜鵑花(Rhododendronspp.),八仙花(Macrophyllahydrangea),芙蓉(Hibiscusrosasanensis),玫瑰(Rosaspp.),鬱金香(Tulipaspp.),水仙花(Narcissusspp.),矮牽牛花(Petuniahybrida),康乃馨(Dianthuscaryophyllus),猩猩木(Euphorbiapulcherrima),和菊花。另外一些可以用於實踐本發明的方法的觀賞類植物包括鳳仙花,秋海棠,天竺葵,堇菜,櫻草,馬鞭草,長春花,萬壽菊,櫻草屬的植物,聖保羅花,藿香,莧,Antihirrhinum,毛莨,菊,苜蓿,科茲莫花,豇豆,大麗花,曼陀羅花,翠雀花,大丁草,劍蘭,大巖桐,孤挺花,松葉菊,蛾蝶花,以及魚尾菊。針葉類樹木也可以用於實踐本發明中的方法,比如包括,松樹如火炬松(Pinustaeda),愛氏松(Pinuselliotii),美國黃松(Pinusponderosa),梁木松(Pinuscontorta),以及輻射松(Pinusradiata),花旗松(Pseudotsugamenziesii);西洋松科常青樹(Tsugaultilane);雲杉(Piceaglauca);美國杉樹(Sequoiasempervirens);冷杉如銀杉(Abiesamabilis)和橡膠杉(Abiesbalsamea);以及杉樹如西洋紅杉(Thujaplicata)和阿拉斯加黃杉(Chamaecyparisnootkatensis)。可以用於實踐本發明的方法的豆科植物包括豆類植物和豌豆。豆類植物包括瓜爾豆,刺槐豆,葫蘆巴,大豆,花園豆,豇豆,綠豆,蠶豆,扁豆,鷹嘴豆,等等。豆科植物包括但並不限於,落花生比如花生,巢菜屬比如小冠花,毛葉苕子,小豆,綠豆,以及鷹嘴豆,羽扇豆屬比如羽扇豆,三葉草,菜豆屬比如菜豆和利馬豆,豌豆屬比如野豌豆,草本樨屬比如丁香,苜蓿屬比如苜蓿,蓮屬,比如車軸草,小扁豆屬,比如小扁豆,假靛藍。在本發明的方法中使用的優選的草料草和草地草包括苜蓿,田園草,高羊茅,多年生黑麥草,匍匐性本特草,以及小糠草。可以用於本發明的其它植物包括洋槐,香草,洋薊,黃花南芥菜,黑草莓,油菜,芫荽葉,地中海早橘,菊苣,桉樹,茴香,葡萄柚,哈密瓜,豆薯,獼猴桃,檸檬,酸橙,蘑菇,堅果,秋葵,橘子,歐芹,柿子,大蕉,石榴,白楊,輻射松,紫葉菊苣,南方松,楓香,橘,小黑麥,葡萄樹,山藥,蘋果,梨樹,溫柏樹,櫻桃,杏樹,甜瓜,大麻,蕎麥,葡萄,樹莓,藜,藍草莓,油桃,桃,李子,草莓,西瓜,茄子,胡椒,花椰菜,白菜屬,比如椰菜,大白菜,鱷梨苗,洋蔥,胡蘿蔔,韭菜,甜菜,蠶豆,旱芹,蘿蔔,南瓜,菊苣,葫蘆,大蒜,四季豆,菠菜,葫蘆瓜,蕪箐甘藍,鱷梨,生菜,落花生和青瓜。本發明的方法可以獲得含有經過遺傳修飾之後含有被穩定整合的多聚核苷酸的葉綠體的植物(即,轉質體(transplastomes);參見,比如,Hager和Bock,Appl.Microbiol.Biotechnol.54302-310,2000,這篇文獻在此整入以供參考;也可參見,Bock,如上,2001)。所述的被整合的多聚核苷酸可以包括例如與在此定義的第一和第二RBS有效連接的編碼多聚核苷酸。因此,本發明進一步提供了轉基因(轉質體)植物,它含有一個或者多個含有編碼一種或者多種異源多肽的多聚核苷酸的葉綠體,所述多肽包括那些可以特異性地聯合形成功能性蛋白複合物的多肽。含有轉質體的轉基因植物與那些將多聚核苷酸整合到核基因組中的轉基因植物相比具有一些優勢。比如,在大多數作物植物中,葉綠體嚴格地通過卵細胞母性遺傳;而花粉(精子)中則缺乏葉綠體(參見,比如,Hager和Bock,如上,2000)。這樣,含有轉質體的轉基因植物就不能與其他植物發生交叉授粉,包括可能在轉基因植物的附近的本地植物,這樣就減少了轉基因植物的生長可能給環境帶來的生態威脅。在這裡廣泛使用的術語「植物」是指一種含有質體特別是葉綠體的真核生物,而且包括處於各個發育時期的這樣的生物,或者是指植物的一部分,包括植物插枝,植物細胞,植物細胞系,植物器官,植物種子,植物苗。植物細胞是植物的結構和生理單位,包括原生質體和細胞壁。植物細胞可以是分離的單個細胞的形式或者培養的細胞的形式,或者可以是一個更高級的組織單位的一部分,比如植物組織,植物器官,或者植物。因此,植物細胞可以是原生質體,能生成接合體的細胞,或者是可以再生為一整株植物的細胞或者細胞群。這樣,含有多個細胞並可再生成整個植株的種子可以看成是用於本發明的植物細胞。植物組織或者植物器官可以是種子,原生質體,愈傷組織,或者組織成一個結構或者功能單位的任何其它植物細胞群。植物中特別有用的部分包括可收割部分和對子代植物的繁殖有用的部分,比如花,花粉,子葉,塊莖,葉,莖,果實,種子,根,以及類似的部分。植物用於繁殖的部分包括比如,種子,果實,插枝,子葉,塊莖,根莖,以及類似的部分。轉基因植物可以由含有經過遺傳修飾的葉綠體的轉化植物細胞再生。在這裡使用的術語「再生」是指從植物細胞、一群植物細胞、原生質體、種子或者植物的一小部分比如愈傷或者組織生長出一整個植株。源自原生質體的再生在不同植物物種之間有所不同。比如,可以製備出原生質體的懸浮物,在某些物種中,可以由所述的原生質體懸浮物誘導胚胎的形成,然後再到成熟、傳代。培養基一般含有生長和再生所必需的各種組分,包括比如激素比如植物生長激素和細胞分裂素;以及胺基酸比如穀氨酸和脯氨酸,這些組分取決於特定的植物種類。有效的再生部分地依賴於培養基,基因型,以及培養的歷史。然而,如果這些變量被控制,那麼再生是可重複的。再生可以發生自植物的愈傷組織,外植體,器官或者植物的某部分。可以在器官或者植物部分再生中實施轉化。(參見,Meth.Enzymol.第118卷;Klee等,Ann.Rev.PlantPhysiol.38467,1987,這些文獻在此整入以供參考)。例如,利用葉盤-轉化-再生這種方法,葉盤在選擇性培養基上培養,接著在大約兩到四周內幼芽形成。生長中的幼芽從愈傷中摘下,並移植到適合於誘導根的選擇性培養基中。出根的小苗在根出現之後儘早移植到土壤中。這樣的小苗可以根據需要再次移植,直到達到成熟期。在營養繁殖作物中,成熟的轉基因植物是通過插枝或者組織培養技術產生多個相同植株來實現繁殖的。所需的轉基因子(transgenotes)被選擇出來,新的變種可以被獲得並且可以用於商業目的的營養繁殖。在種質繁殖作物中,成熟的轉基因植物可以自交產生純合的近交植株。這樣得到的近交植株可以產生含有被導入的異源多聚核苷酸的種子,它們可以被培養而得到能夠表達由所述多聚核苷酸編碼的多肽的植株。這樣,本發明進一步提供了由通過本發明的方法獲得的轉基因植物產生的種子。如果需要,本發明的含有經過遺傳修飾而可以表達不同的異源多肽的葉綠體的轉基因植物可以相互雜交,由此提供了一種獲得含有兩個或者更多個不同的轉基因的轉基因植物的手段。植物交配以及選擇具有所需特性或者其他感興趣的特性的雜交植物的方法是在本領域所熟知的。在葉綠體或者本發明的轉基因植物中生產異源多肽或者蛋白複合物的方法可以進一步包括從植物細胞葉綠體中分離被表達的多肽或者蛋白複合物的步驟。這裡使用的術語「分離的」或者「基本上純化的」是指多肽或者多聚核苷酸以相對去除了在自然狀態下與之聯繫的蛋白質,核酸,脂類,碳水化合物或者其它材料的形式存在。一般地,分離的多肽(或者多聚核苷酸)組成了樣本的至少大約20%,通常組成了樣本的至少50%,特別情況下是樣本的至少大約80%,更特別的情況下是樣本的至少大約90%或者95%或者更多。這裡使用的術語「異源」在一種比較意義上來說是指一段核苷酸序列(或者多肽)來自非參照來源的來源,或者連接到一個在正常情況下不相聯繫的第二核苷酸序列(或者多肽)上,或者經過修飾之後使得修飾之後的形式是與參照材料非正常相關的。例如,編碼抗體的多聚核苷酸序列相對於植物葉綠體的核苷酸序列是異源的,含有例如與第二核苷酸序列有效連接的第一核苷酸序列的重組核酸分子的組分也是異源的,被導入到葉綠體中的突變多聚核苷酸在所述突變多聚核苷酸在正常情況下沒有在葉綠體中發現時也是異源的。多肽或者蛋白複合物可以利用任何一種適合於特定多肽或者蛋白複合物的方法從葉綠體中分離出來,這些方法包括例如,鹽分級分離方法和色譜方法,如利用可以特異性地結合多肽或者蛋白複合物的配體或者受體來進行的親和色譜方法。用來確定根據本發明的方法產生的多肽或者蛋白複合物已是分離的形式的方法是已熟知的方法,比如進行電泳,鑑定特定的分子為相對獨立的條帶,或者鑑定特定的複合物為一系列條帶。因此,本發明還提供了根據本發明的方法產生的分離的多肽或者蛋白複合物。本發明還提供可以單獨使用或者組合使用以獲得異源多肽在葉綠體中的強烈表達的組合物。在一種具體實施方案中,本發明提供包括(或者編碼)第一RBS和第二RBS的核苷酸序列,其中所述第一RBS和第二RBS在空間上是被分開的,這樣一個RBS指導在原核細胞中的翻譯,而另外一個RBS可以指導在植物葉綠體中的翻譯。在一個方面,所述核苷酸序列還可以包括(或者編碼)與所述第一RBS和第二RBS有效連接的起始密碼子,比如起始密碼子AUG(或者ATG),或者可以包括克隆位點,其定位允許一段編碼序列與所述的第一RBS和第二RBS有效連接。在另外一個方面,所述核苷酸序列被包含在載體中,所述載體優選含有一段葉綠體基因組DNA的核苷酸序列,使得可以與葉綠體基因組發生位點特異性同源重組。在又另外一個方面,所述載體是穿梭載體,它可以進一步包括原核生物複製原點。在另外一個具體實施方案中,利用密碼子選擇使編碼多聚核苷酸偏向於葉綠體密碼子使用,從而提供了一種在葉綠體中強烈表達一種或者多種被編碼的多肽的手段。利用密碼子選擇可以優化多肽在葉綠體中的表達,這通過表達水母(Aequeoriavictoria)綠色螢光蛋白來例示(GFP;實例1)。這樣,本發明還提供編碼GFP的多聚核苷酸,其中所述多聚核苷酸已經具有可以在葉綠體中優化表達的密碼子。如在此所公開的,變異多聚核苷酸編碼可以以一定量表達出來的GFP,這使得它可以用作檢測植物葉綠體的試劑,包括檢測葉綠體中的基因表達。葉綠體密碼子優化對於表達多肽的普遍有用性通過製備編碼螢光素酶的合成的多聚核苷酸來進一步證明(實施例4),這種蛋白的表達可以在體內或者體外被檢測,還可以通過編碼抗體的多聚核苷酸來證明(實施例3)。進一步,作為例子被說明的組合物和方法證明了功能性融合蛋白可以在葉綠體中強烈表達,包括單鏈抗體和報告多肽(參見實施例3和4)。高等植物和藻類的葉綠體很有可能起源於光合原核生物到真核生物宿主的內共生整合。在整合的過程中許多基因從葉綠體轉移到宿主細胞核中(Gray,Curr.Opin.Gen.Devel.9678-687,1999)。這樣,葉綠體中正常的光合成功能需要核編碼蛋白和質體編碼蛋白的共同參與,以及這兩個基因組之間基因表達的協作。植物中核編碼和葉綠體編碼基因的表達在對發育和環境因子的響應中會非常敏感地協作。在葉綠體中,基因表達的調控一般是發生在轉錄之後,而且常常發生在翻譯起始階段。這種調控依賴於葉綠體的翻譯裝置,以及核編碼的調控因子(參見Barkan和Goldschmidt-Clermont,Biochemie82559-572,2000;Zerges,Biochemie82583-601,2000;Bruick和Mayfield,如上,1999)。葉綠體翻譯裝置與細菌中的翻譯裝置比較相似;葉綠體含有70S的核糖體;其mRNA缺乏5』帽而且一般不含有3』端多聚腺苷酸化尾(Harris等,Microbiol.Rev.58700-754,1994);而且葉綠體和細菌的翻譯都可以被選擇性試劑如氯黴素抑制。在細菌中,介導正確的翻譯起始的RNA元素包括起始密碼子,RBS,RBS和起始密碼子的特定間隔,翻譯增強序列,第二密碼子的偏向,以及影響RNA可接觸性的二級結構(Gold,Ann.Rev.Biochem.57199-233,1988)。在葉綠體中,核糖體的結合和翻譯起始位點的正確選擇是通過,至少是部分通過,順式作用RNA元件完成的(參見Bruick和Mayfield,如上,1999)。與細菌相似,葉綠體起始密碼子也會影響翻譯起始的效率,但是並不決定起始位點的位置(Chen等,PlantCell71295-1305,1995),這表明葉綠體中翻譯起始位點的選擇需要額外的決定因素。介導翻譯調控的數個RNA元件已經在葉綠體mRNA的5』端非翻譯區內被鑑定到(Alexander等,Nucl.AcidsRes.262265-2272,1998;Hirose和Sugiura,EMBOJ.151687-1695,1996;Mayfield等,J.CellBiol.1271537-1545,1994;Sakamoto等,PlantJ.6503-512,1994;Zerges等,如上,1997,每篇文獻都在此整入以供參考)。這些元件可能與核編碼因子相互作用,而且一般與已知的原核生物調控序列沒有相似性(McCarthy和Brimacombe,TrendsGenet.10402-407,1994)。保守的原核生物RBS元件的特徵是Shine-Dalgamo(SD)序列,這段序列含有3到9個核苷酸,其中一般有大約4、5或者6個核苷酸與16SrRNA的3』端互補。在翻譯起始的早期,30S的核糖體亞基藉助於16SrRNA內互補的反SD序列在SD序列處與mRNA結合。因為原核生物mRNA的SD序列位於起始密碼子上遊5到15個核苷酸的位置,這樣30S核糖體亞基被定位,正確的起始密碼子就進入核糖體P位點。許多葉綠體mRNA含有類似於原核生物RBS元件的元件(Bonham-Smith和Bourque,Nucl.AcidsRes.172057-2080,1989;Ruf和Kossel,FEBSLett.24041-44,1988,每篇文獻都在此整入以供參考)。然而,這些RBS序列在葉綠體翻譯中的功能效用仍然不清楚,這是因為這些元件的定位比通常在原核生物中觀察到的位置要更加位於起始密碼子的上遊。在一些研究中,報導葉綠體mRNA中5』端非翻譯區內推定的RBS的改變會影響翻譯(Betts和Spremulli,J.Biol.Chem.26926456-26465,1994;Hirose等,FEBSLett.430257-260,1998;Hirose和Sugiura,如上,1996;Mayfield等,如上,1994),而在其它葉綠體mRNA中可能的RBS元件的改變對翻譯的影響很小(Fargo等,Mol.Gen.Genet.257271-282,1998;Koo和Spremulli,J.Biol.Chem.2697494-7500,1994;Rochaix,PlantMol.Biol.32327-341,1996;Sakamoto等,如上,1994)。對於這些結果的解釋由於葉綠體RBS元件缺乏保守性而變得複雜,而且還因為為了研究這些推定的RBS序列而產生的突變可能改變了5』端非翻譯區內其它的重要序列。RBS元件在葉綠體翻譯中的一個功能性作用已經在這裡被揭示(實施例2)。葉綠體16SrRNA反SD序列位於16SrRNA的3』端,其序列為3』-CUUCCUCCAC-5』(SEQIDNO29),對其進行突變,去除其與葉綠體mRNA上SD序列的可能的鹼基配對,這嚴重地削弱了萊茵衣藻葉綠體編碼的數種整合膜蛋白的翻譯(實施例2)。帶有16SrRNA反SD突變的核糖體仍然可以進行翻譯,因為可溶性葉綠體蛋白的合成很大程度上都不受這些突變的影響。對編碼光系統II反應中心D1蛋白的葉綠體psbAmRNA的5』端非翻譯區內可能的SD元件進行分析,發現類似於原核生物的單個RBS元件的存在,所述元件定位在起始密碼子AUG的5』端(上遊)27個核苷酸處。這個RBS位於起始密碼子上遊太遠的位置以致於核糖體30S亞基不能夠像在細菌中一樣同時與RBS元件和起始密碼子接觸。當重新定位該RBS元件使之距離起始密碼子更近時,它卻不再支持葉綠體中翻譯的起始,但卻可以使該轉錄子在大腸桿菌中翻譯(實施例2)。由於起始前複合體可以在這個RBS元件處形成,因此它具有核糖體30S亞基的真實識別位點的特徵。然而,這個RBS元件在沒有額外的因子參與下不能夠正確地限定翻譯起始位點,所述因子包括核編碼的翻譯激活蛋白(Danon和Mayfield,1991;Yohn等,1998a;Yohn等,1998b)。這個結果表明,psbA的mRNA中RBS與起始密碼子之間額外的距離用於容納額外的翻譯因子,它的一個例證是葉綠體中RBS元件與光調控反式作用因子聯合起到促進翻譯起始的功能。因此,本發明提供一種分離的核糖核苷酸序列,它包括與第二RBS有效連接的第一RBS。如在此公開的,這樣的有效連接的第一和第二RBS一般被大約5到25個核苷酸分隔開來,這樣,當這段核糖核苷酸序列與編碼多肽的多聚核苷酸有效連接時,所述第一RBS可以指導所述多肽在原核生物中的翻譯,而所述第二RBS可以指導所述多肽在葉綠體中的翻譯。當將一個RBS序列定位在起始密碼子AUG上遊(5』端)至少大約19個核苷酸的時候,這個RBS在葉綠體的翻譯過程中是有活性的,這裡所述的有活性包括允許多聚核糖體的形成,如果RBS的位置離AUG更近一些,就會導致其在葉綠體中的翻譯活性降低(參見圖4)。正如圖4所示,psbAmRNA的RBS(SD序列)從-27的位置開始(即,在AUG密碼子上遊的-27位置之後)。致使RBS與AUG密碼子的距離少於大約19個核苷酸的缺失導致葉綠體中翻譯活性和多聚體的形成明顯降低,但是卻發現在細菌中的翻譯活性有增加(參見實施例2,還顯示了細菌中RBS距離AUG密碼子的位置超過大約15個核苷酸時翻譯活性會降低)。本發明的分離的核糖核苷酸序列一般長度為大約11到50個核苷酸,可以是大約15到40個核苷酸,或者大約20到30個核苷酸。這樣一個長度允許一般是大約3到9個核苷酸,常常是大約4到7個核苷酸的兩個SD序列被大約5到25個核苷酸分隔開來(一般是被大約10到20個核苷酸,特別地是被大約15個核苷酸分隔開)。例如,本發明的核糖核苷酸序列可以包括4個核苷酸長的第一RBS,比如GGAG,它通過5個核苷酸與大約4個核苷酸長的第二RBS比如GGAG分開,這樣就提供了一段長度為13個核苷酸的核糖核苷酸序列。第一RBS和第二RBS可以分別獨立地具有任何具有SD序列特徵的序列。如在此公開的,用於指導植物葉綠體中的翻譯的RBS需要與16SrRNA的3』端反SD序列(3』-CUUCCUCCAC-5』;SEQIDNO29)中的至少三個,特定地,是四個,五個,或者六個,或者更多的核苷酸互補,特別地,與反SD序列的中間8個核苷酸互補。例如,包括GGAG,GGAGG,或者ACGAGA(與SEQIDNO29互補的核苷酸用斜體標示)的RBS序列在與一段編碼多肽有效連接時,可以指導其在植物葉綠體中的翻譯。用於製備本發明的組合物或者實踐本發明的方法的RBS可以化學合成,或者可以從自然發生的核酸分子中分離出來。例如,指導葉綠體中的翻譯的RBS一般存在於葉綠體基因的5』端非翻譯區,因此它可以從一個葉綠體基因中被分離出來。另外,包含進一些與所述基因的SD序列正常相關的額外的核苷酸序列也會有一些益處。例如,5』端非翻譯區可能包括轉錄調控元件比如啟動子,因而有助於構建能夠在植物葉綠體中轉錄和翻譯的重組核酸分子。另外,如在此公開的,來自於編碼膜相關D1(psbA)葉綠體蛋白的葉綠體基因的額外的5』UTR序列的整入導致膜異源多肽在葉綠體中的表達(實施例3)。這樣,本發明的含有指導葉綠體中的翻譯的RBS的核糖核苷酸可以進一步包含一個葉綠體基因的5』端非翻譯區,例如,編碼一個可溶性蛋白的葉綠體基因的5』端非翻譯區,或者編碼一個膜結合葉綠體蛋白的基因的5』端非翻譯區。這樣的5』端非翻譯區在本領域是已熟知的,包括那些由編碼可溶性蛋白的基因編碼的5』端非翻譯區,比如,AtpA的5』端非翻譯區(SEQIDNO4)或者RbcL的5』端非翻譯區(SEQIDNO5),以及那些由編碼膜結合蛋白的葉綠體基因編碼的5』端非翻譯區,比如PsbD的5』端非翻譯區(SEQIDNO6),或者PsbA的5』端非翻譯區(SEQIDNO7)。另外,16SrRNA的5』端非翻譯區(SEQIDNO8)可以被用來例如指導與之有效連接的異源多聚核苷酸的轉錄,而且可以在與反SD序列的互補的序列處進行修飾,使得如此生成的RBS可以特別有效地指導由多聚核苷酸編碼的多肽在植物葉綠體中的翻譯。本發明的核糖核苷酸序列可以進一步包括起始密碼子,比如起始密碼子AUG,並與第一和第二RBS有效連接。這樣的起始密碼子AUG可以進一步包括Kozak序列的相鄰核苷酸,比如,ACCAUGG或者GCCAUGG或者CC(A/G)CCAUGG或者類似的序列(參見Kozak,J.Mol.Biol.196947-950,1987,這篇文獻在此整入以供參考),這樣的序列有利於編碼多肽在細胞中的翻譯。另外,本發明的核糖核苷酸序列可以與編碼多肽的多聚核苷酸有效連接,其中所述多聚核苷酸包括起始密碼子,所述密碼子可以是但並不一定是內源性的起始密碼子,或者可以通過修飾之後含有一個起始密碼子。本發明的分離的核糖核苷酸序列可以化學合成,或者可以利用酶學方法生成,比如,由DNA或者RNA模板分別利用DNA依賴型RNA聚合酶或者RNA依賴型RNA聚合酶生成。編碼本發明的核糖核苷酸的DNA模板可以化學合成,可以從自然發生的DNA分子中分離,或者可以由經過修飾而具有所需特性的自然發生的DNA序列中衍生得來。例如,原核基因的DNA序列正常情況下含有編碼RBS的核苷酸序列,這段序列在起始密碼子上遊大約5到15個核苷酸處。這樣的核苷酸序列可以被分離,並通過常規的DNA重組方法進行修飾使之含有位於內源性原核RBS上遊(5』)適當位置的第二RBS。因此,本發明提供編碼在此定義的有效連接的第一和第二RBS的多聚核苷酸。編碼與第二RBS有效連接的第一RBS的多聚核苷酸可以是DNA或者RNA,可以是單鏈或者雙鏈,其中所述第一RBS可以指導原核生物中的翻譯,而所述第二RBS可以指導在葉綠體中的翻譯。所述多聚核苷酸還可以包括與編碼所述第一RBS和第二RBS的核苷酸序列有效連接的起始密碼子,例如ATG,起始密碼子定位在所述第一RBS下遊(3』端)大約3到15個核苷酸的位置,包括在所述下遊大約4,5,6,7,8,9,10,11,12,13或者14個核苷酸的位置。本發明的多聚核苷酸還可以包括克隆位點,所述克隆位點的定位允許編碼多肽的可表達的多聚核苷酸與所述第一和第二RBS有效連接,以及與ATG密碼子有效連接,如果存在這樣的密碼子的話,這樣,所述多肽就可以在葉綠體或者原核宿主細胞中表達。在這裡廣泛用到的術語「克隆位點」是指任何有助於第一多聚核苷酸與第二多聚核苷酸連接的核苷酸或者核苷酸序列。一般地,克隆位點包括一個或者多個限制性內切酶識別位點,例如多克隆位點,或者一個或多個重組酶識別位點,例如loxP位點或者att位點,或者這樣的位點的組合。被提供的克隆位點是為了便於插入或者連接操作,所述連接可以是第一和第二多聚核苷酸的有效連接,比如編碼有效連接的第一和第二RBS的第一多聚核苷酸與編碼感興趣的多肽的第二多聚核苷酸有效連接,所述多肽將要在原核生物中或者葉綠體中或者在二者中翻譯。在此定義的編碼第一和第二RBS的多聚核苷酸可以與可表達的多聚核苷酸有效連接,所述的可表達的多聚核苷酸編碼至少一種多肽,包括肽或者多肽的肽部分。這樣,所述的可表達的多聚核苷酸可以只編碼一個第一多肽,或者可以編碼兩個或者更多個多肽,這些多肽可以與第一多肽相同或者不同。例如,所述的可表達的多聚核苷酸可以編碼一個第一多肽和一個第二多肽,這兩個多肽是不同的,特別地,第一多肽和第二多肽可以特異性地聯合形成功能性的異源二聚體比如抗體;酶;細胞表面受體比如T細胞受體,生長因子受體,大麻類受體;或者類似物。這樣的第一和第二(或者其他)多肽可以表達成一個融合蛋白,比如包括連接在一起的H鏈和L鏈的單鏈抗體,或者可以表達成獨立分開的多肽,這些多肽可以但並不一定具有特異性地聯合形成功能性蛋白複合物的能力。如果要將這些多肽表達為分離的單位,那麼可以在編碼所述第一多肽的序列和編碼所述第二多肽的序列之間有效連接上編碼內在核糖體進入位點(IRES)的核苷酸序列,這樣有助於第二(或者下遊)多肽的翻譯。在此定義的編碼有效連接的第一和第二RBS的多聚核苷酸可以是線性的核苷酸序列,而且可以在一個末端具有第一克隆位點,在另外一個末端具有第二克隆位點,這樣就提供了可以方便地插入或者連接第二多聚核苷酸的序列盒。末端的第一和第二克隆位點可以相同也可以不同,而且其中之一或者兩者都可以獨立地包括多克隆位點。所述多聚核苷酸可以進一步包括任何其他感興趣的核苷酸序列,比如與之有效連接的起始密碼子ATG。如在此定義的,本發明進一步提供含有編碼有效連接的第一和第二RBS的多聚核苷酸的載體。所述載體可以是任何可以用於將一段多聚核苷酸導入到原核或者真核細胞中的載體,包括克隆載體或者表達載體。在一種具體實施方案中,所述載體包括一段葉綠體基因組DNA的核苷酸序列,特別是不編碼任何葉綠體基因的沉默核苷酸序列,有了它可以保證與葉綠體基因組DNA之間的同源重組。這樣的葉綠體載體在本領域是已熟知的,包括例如p322(參見實施例1;也可參見,Kindle等,Proc.Natl.Acad.Sci.,USA881721-1725,1991,這篇文獻在此整入以供參考;Hager和Bock,如上,2000;Bock,如上,2001)。本發明的載體還可以包含一個或者多個額外的可以為載體帶來所需特性的核苷酸序列,包括比如,有利於載體的操作的克隆位點,指導載體複製或者其中所包含的核苷酸序列的轉錄的調控元件,編碼選擇性標記的序列,以及類似的序列。這樣,所述載體可以包含例如一個或者多個克隆位點如多克隆位點,所述克隆位點的定位可以但並不是必須使得異源多聚核苷酸可以插入到所述載體中,並且與所述第一和第二RBS有效連接。所述載體還可以包含原核生物的複製原點(ori),比如大腸桿菌的ori或者粘粒的ori,這樣就可以使得所述載體在原核宿主細胞中以及植物葉綠體中按照需要進行轉移。這裡廣泛使用的術語「調控元件」意指調控多聚核苷酸的轉錄或者翻譯或者多肽的定位並與之有效連接的核苷酸序列。除了RBS,表達控制序列還可以是啟動子,增強子,轉錄終止子,起始密碼子,用於切除內含子和維持正確閱讀框架的剪接信號,終止密碼子,琥珀密碼子或者赫石密碼子,IRES,或者將多肽導向到特定位置的序列,例如細胞區室化作用信號,它可以用於將多肽導向到細胞質,細胞核,質膜,內質網,線粒體膜或者基質,葉綠體膜或者內腔,中間反區高爾基體池,或者溶酶體或者內涵體。細胞區室化作用結構域在本領域是已熟知的,包括例如含有人類II型膜錨定蛋白半乳糖基轉移酶的第1到81個胺基酸殘基的肽,或者含有細胞色素c氧化酶IV亞基的前體序列的第1到12個胺基酸殘基的肽(也可參見,Hancock等,EMBOJ.104033-4039,1991;Buss等,Mol.Cell.Biol.83960-3963,1988;美國專利號5,776,689,每篇文獻都在此整入以供參考)。在應用本發明的方法生產的多肽中加入細胞區室化作用結構域,可以使包括蛋白複合物在內的多肽按照需要定向到個體內特定的細胞區室中,並在那裡使用。本發明的載體或者其它重組核酸分子可以包括編碼報告多肽或者其他可選擇標記的核苷酸序列。術語「報告子」或者「選擇性標記」是指可以賦予可被檢測的表型的多聚核苷酸(或者被編碼的多肽)。一般,報告子編碼可以被檢測的多肽,比如,一種綠色螢光蛋白或者一種酶如螢光素酶,當它們與合適的試劑(分別是特定波長的光或者螢光素)接觸之後就會產生可以被肉眼檢測或者通過合適的儀器檢測到的信號(Giacomin,PlantSci.11659-72,1996;Scikantha,J.Bacteriol.178121,1996;Gerdes,FEBSLett.38944-47,1996;也可參見,Jefferson,EMBOJ.63901-3907,1997,f1-葡糖苷酸酶)。選擇性標記一般是一種分子,當它在細胞中存在或者表達的時候,會給含有這種標記的細胞提供一定的選擇優勢(或者劣勢),比如含有這種標記的細胞在一種試劑存在的條件下具備生長的能力,而不含有這種標記的細胞則會被這種試劑殺死。選擇性標記可以提供獲得表達這種標記的原核細胞或者植物細胞或者二者的手段,這樣,這種選擇性標記就可以作為本發明的載體的一部分(參見,例如,Bock,如上,2001)。選擇性標記的例子包括那些賦予抗代謝物抗性的標記,比如,二氫葉酸還原酶,它可以賦予對氨甲蝶呤的抗性(Reiss,PlantPhysiol.(LifeSci.Adv.)13143-149,1994);新黴素磷酸轉移酶,它可以賦予對氨基糖苷新黴素的抗性,卡那黴素抗性和巴龍黴素的抗性(Herrera-Estrella,EMBOJ.2987-995,1983),hygro,它可以賦予對潮黴素的抗性(Marsh,Gene32481-485,1984),trpB,它允許細胞利用吲哚替代色氨酸;hisD,它允許細胞利用組氨醇替代組氨酸(Hartman,Proc.Natl.Acad.Sci.USA858047,1988);甘露糖6磷酸異構酶,它允許細胞利用甘露糖(WO94/20627);鳥氨酸脫羧酶,它可以賦予對鳥氨酸脫羧酶抑制劑,2-(二氟甲基)-DL-鳥氨酸的抗性(DMFO;McConlogue,1987,在CurrentCommunicationinMolecularBiology,ColdSpringHaborLaboratoryed.);以及來自於土麴黴(Aspergillusterreus)的脫氨酶,它可以賦予對殺稻瘟菌素S的抗性(Tamura,Biosci.Biotechnol.Biochem.592336-2338,1995)。另外一些選擇性標記包括那些可以賦予除草劑抗性的標記,比如膦絲菌素醯基轉移酶基因,它可以賦予對膦絲菌素的抗性(White等,Nucl.AcidsRes.181062,1990;Spencer等,Theor.Appl.Genet.79625-631,1990),EPSPV合酶的突變型,它可以賦予草甘膦抗性(Hinchee等,BioTechnology91915-922,1998),乙醯乳酸合成酶的突變型,它可以賦予咪唑啉酮或者磺脲抗性(Lee等,EMBOJ.71241-1248,1988),突變型psbA,它可以賦予對莠去津的抗性(Smeda等,PlantPhysiol.103911-917,1993),或者原卟啉原氧化酶的突變型(參見美國專利號5,767,373),或者其它可以賦予對除草劑比如草丁膦的抗性的標記。選擇性標記包括那些使真核細胞具有二氫葉酸還原酶或者新黴素抗性,使原核生物比如大腸桿菌具有四環素,青黴素抗性;以及使植物具有博來黴素,慶大黴素,草甘膦,潮黴素,卡那黴素,氨甲喋呤,腐草黴素,膦絲菌素,大觀黴素,鏈黴素,磺胺藥物和磺脲抗性的多聚核苷酸(參見,比如Maliga等,MethodsinPlantMolecularBiology,ColdSpringHaborLaboratoryPress,1995,39頁)。由於本發明的組合物或者方法可以使多肽在葉綠體中表達,這樣如果將可賦予植物細胞一定的選擇優勢的多肽與一段編碼細胞內定位基序的核苷酸序列有效連接,便可以將所述多肽轉運到細胞質,細胞核,或者其他亞細胞器,而這些地方正好是例如選擇性標記導致的毒性效果起作用的地方(參見,比如,VonHeijne等,PlantMol.Biol.Rep.9104,1991;Clark等,J.Biol.Chem.26417544,1989;dellaCioppa等,PlantPhysiol.84965,1987;Romer等,Biochem.Biophys.Res.Comm.1961414,1993;Shah等,Science233478,1986;Archer等,J.BioenergBiomemb.22789,1990;Scandalios,Prog.Clin.Biol.Res.344515,1990;Weisbeek等,J.CellSci.Suppl.11199,1989;Bruce,TrendsCellBiol.10440,2000)。本發明的穿梭載體在原核生物中穿梭的能力使得對於載體的操作更加方便。例如,含有所述載體和假定已經插入的感興趣的多聚核苷酸的反應混合物可以轉化到原核宿主細胞比如大腸桿菌中,然後採用常規的方法擴增並收集,對其進行檢驗以鑑定含有插入片斷或者感興趣的構建物的載體。如果需要的話,所述載體還可以被進一步操作,比如對被插入的多聚核苷酸進行位點專一性突變,然後再擴增並挑選出含有感興趣的突變多聚核苷酸的載體。所述穿梭載體然後可以被導入到植物細胞葉綠體中,在那裡感興趣的多肽可以被表達出來,如果需要的話,還可以通過本發明的方法分離出這些多肽。本發明的多聚核苷酸或者重組核酸分子可以包含在載體當中,所述載體包括本發明的載體,所述的多聚核苷酸或者重組核酸分子可以通過本領域已知的任何方法被導入到植物葉綠體中。這裡用到的術語「導入」是指將多聚核苷酸轉移到細胞中,所述細胞包括原核細胞或者植物細胞,特別是導入到植物細胞的質體中。多聚核苷酸可以通過各種方法被導入到細胞中,這些方法在本領域是已熟知的,這些方法的選擇部分地依賴於特定的宿主細胞。例如,多聚核苷酸可以通過直接的基因轉移方法被導入到植物細胞中,比如電穿孔,或者利用顆粒槍進行的微彈射介導(生物彈射)的轉化,或者「玻璃珠方法」(參見,比如,Kindle等,如上,1991),或者花粉介導的轉化,脂質體介導的轉化,利用損傷或者酶降解的未成熟胚胎進行的轉化,或者利用損傷或者酶降解的胚胎發生愈傷進行的轉化(參見,Potrykus,Ann.Rev.Plant.Physiol.PlantMol.Biol.42205-225,1991,這篇文獻在此整入以供參考)。質體轉化是一種常規並且已熟知的將多聚核苷酸導入植物細胞葉綠體的方法(參見,美國專利號5,451,513,5,545,817和5,545,818;WO95/16783;McBride等,Proc.Natl.Acad.Sci.USA917301-7305,1994,每篇文獻在此整入以供參考)。葉綠體轉化涉及利用例如生物彈射(biolistic)或者原生質體轉化方法(例如氯化鈣或者PEG介導的轉化),將兩側有葉綠體DNA某些區域的所需核苷酸序列導入到合適的目標組織。1到1.5kb的兩側的葉綠體基因組DNA核苷酸序列可以使載體和所述葉綠體基因組之間發生同源重組,而且可以替代或者修飾質體基因組(plastome)的特定區域。採用這種方法,能夠賦予對大觀黴素和鏈黴素的抗性的葉綠體16SrRNA和rpsl2基因點突變可以用作轉化的選擇性標記(Svab等,Proc.Natl.Acad.Sci.USA878526-8530,1990;Staub和Maliga,如上,1992),結果可以獲得穩定的同質轉化體(homoplasmictransformants),成功的頻率大約是100個被轟擊的目標葉片中有一個。存在於這些標記之間的克隆位點為構建載體——包括本發明的載體——提供了方便的核苷酸序列(Staub和Maliga,EMBOJ.12601-606,1993)。用顯性的選擇性標記,編碼大觀黴素脫毒酶氨基糖苷-3』-腺嘌呤轉移酶替代隱性的rRNA或者核糖體蛋白抗生素抗性基因,可以獲得明顯增加的轉化效率(Svab和Maliga,Proc.Natl.Acad.Sci.USA90913-917,1993)。轉化後常常需要大約15到20個細胞分裂周期才能夠達到同質狀態。在質體表達中,基因通過同源重組插入到每一個植物細胞的所有的數千個的環狀質體基因組拷貝中,由於與核表達的基因相比,它可以利用巨大的拷貝數目,因此使得表達水平可以容易地超過植物可溶性蛋白總量的10%。直接的基因轉移方法比如電穿孔也可以用於將本發明的多聚核苷酸導入到植物葉綠體中(Fromm等,Proc.Natl.Acad.Sci.USA825824,1985,這篇文獻在此整入以供參考)。高場強的電脈衝可以可逆地使細胞膜穿透,從而允許多聚核苷酸的導入。被電穿孔的植物原生質體重新形成細胞壁,分裂並形成植物愈傷。微注射可以按照Potrykus和Spangenberg所著的GeneTransferToPlants(SpringerVerlag,Berlin,NY1995)中描述的方法來進行。含有導入的多聚核苷酸的轉化植物細胞可以通過檢測由導入的多聚核苷酸帶來的表型來鑑定,所述表型例如是報告基因或者選擇性標記的表達。也可以應用微射彈(microprojectile)介導的轉化來將多聚核苷酸導入到植物細胞葉綠體中(Klein等,Nature32770-73,1987,這篇文獻在此整入以供參考)。這種方法利用微射彈比如金或者鎢,其上通過氯化鈣,亞精胺或者聚乙二醇沉澱方法而包被有所需的多聚核苷酸。所述微射彈顆粒被高速打入植物組織中,用到的設備可以是例如BIOLISTICPD-1000顆粒槍(BioRad;加利福尼亞州,赫庫勒斯)。利用生物彈射方法進行轉化的方法是已熟知的(Wan,PlantPhysiol.10437-48,1984;Vasil,BioTechnology111553-1558,1993;Christou,TrendsinPlantScience1423-431,1996)。微射彈介導的轉化可以用於例如,獲得各種轉基因植物物種,包括棉花,菸草,玉米,雜交白楊或者番木瓜。重要的穀類作物比如小麥,燕麥,大麥,高粱和水稻也可以採用微射彈介導的傳送進行轉化(Duan等,NatureBiotech.14494-498,1996;Shimamoto,Curr.Opin.Biotech.5158-162,1994)。大多數雙子葉植物都可以採用上述方法轉化。單子葉植物也可以轉化,比如採用上述的生物彈射方法,原生質體轉化,部分通透的細胞的電穿孔,用玻璃纖維導入DNA,玻璃珠攪拌方法(Klindle等,如上,1991),以及類似的方法。本發明還提供包含位於克隆位點5』端大約20到40個核苷酸位置的編碼RBS的核苷酸序列的載體。所述克隆位點可以是任何有助於異源核苷酸序列插入或者連接到載體中的核苷酸序列,例如一個或者多個限制性內切酶識別位點,一個或者多個重組酶識別位點,或者這些位點的組合。優選地,所述克隆位點是多克隆位點,其包括一系列限制性內切酶識別位點或者重組酶識別位點,或者至少一個限制性內切酶識別位點和至少一個重組酶識別位點的組合。所述載體可以進一步含有位於所述克隆位點5』端附近的起始密碼子或者其一部分,從而為缺乏起始密碼子ATG或者由於例如限制性內切酶的切割而導致只含有部分起始密碼子的編碼序列提供一個翻譯起始位點(或者隱蔽起始位點)。所述載體還可以含有定位在所述克隆位點3』端的葉綠體基因3』UTR,比如PsbA的3』UTR(SEQIDNO9),RbcL的3』UTR(SEQIDNO10),AtpA的3』UTR(SEQIDNO11),tRNAARG的3』UTR(SEQIDNO12),或者PsbD的3』UTR(參見SEQIDNO30,從位置1553開始;還顯示了編碼PsbD-GFP融合蛋白的GFP構建物的插入位點)。還提供了一種製備葉綠體/原核生物穿梭表達載體的方法。本發明的穿梭載體可以通過這樣來製備,例如,向足以與葉綠體基因組DNA發生同源重組的一段葉綠體基因組DNA的核苷酸序列中導入下列序列包含原核生物複製原點的核苷酸序列;編碼第一RBS的核苷酸序列;編碼第二RBS的核苷酸序列,其中所述第一RBS和第二RBS被大約5到25個核苷酸分開;和克隆位點,其中所述克隆位點被定位以允許編碼多肽的多聚核苷酸有效連接到所述第一RBS和第二RBS,這樣,所述第一RBS可以指導所述多肽在原核生物中的翻譯,而所述第二RBS可以指導所述多肽在葉綠體中的翻譯。製備葉綠體/原核生物穿梭表達載體還可以通過遺傳修飾一段葉綠體基因組DNA的核苷酸序列來實現,所述這段核苷酸序列可以與葉綠體基因組DNA發生同源重組,經過修飾之後它含有原核生物複製起始位點,編碼被大約5到25個核苷酸分開的第一RBS和第二RBS的核苷酸序列,和克隆位點,其中所述克隆位點被定位以允許編碼多肽的多聚核苷酸有效連接到所述第一RBS和第二RBS,這樣,所述第一RBS可以指導所述多肽在原核生物中的翻譯,而所述第二RBS可以指導所述多肽在葉綠體中的翻譯。因此,本發明還提供如上所述的根據本發明的方法製備的葉綠體/原核生物穿梭載體。本發明還提供一種重組核酸分子,它包括與編碼多肽的第二核苷酸序列有效連接的編碼葉綠體RBS的第一核苷酸序列,其中,所述第一核苷酸序列與所述第二核苷酸序列是相對異源的。有效連接的RBS一般定位在起始密碼子5』端(上遊)大約20到40個核苷酸的位置,而所述起始密碼子又與編碼多肽的多聚核苷酸有效連接。在一種具體實施方案中,所述第一核苷酸序列包括定位在編碼RBS的核苷酸序列的3』端大約20到40個核苷酸位置的ATG密碼子。本發明的重組核酸分子可以進一步包括其它調控元件或者感興趣的編碼多聚核苷酸,正如在此例示的或者本領域已知的。報告基因已經在高等植物的葉綠體中被成功應用,而且高水平的重組蛋白表達也有報導。另外,報告基因也已經在萊茵衣藻的葉綠體中被應用,但是在絕大多數情況下都是只有少量的蛋白質被表達出來。在許多生物物種中,報告基因都可以大大增強監測基因表達的能力。在高等植物的葉綠體中,β-葡糖苷酸酶(uidA,Staub和Maliga,EMBOJ.12601-606,1993),新黴素磷酸轉移酶(nptII,Carrer等,Mol.Gen.Genet.24149-56,1993),腺苷-3-腺嘌呤轉移酶(aadA,Svab和Maliga,Proc.Natl.Acad.Sci.USA90913-917,1993),以及Aequoreavictoria中的GFP(Sidorov等,PlantJ.19209-216,1999)都已經用作報告基因了(Heifetz,Biochemie82655-666,2000)。這些基因中的每一個都具有可以使之用作葉綠體基因表達的報告子的特性,比如它們具有分析上的方便性,靈敏性,或者具有原位檢測基因表達的能力。基於這些研究,其它異源蛋白也已經可以在高等植物的葉綠體中表達,比如蘇雲金桿菌(Bacillusthuringiensis)的Cry毒素,它可以使植物具有對食草昆蟲的抗性(Kota等,Proc.Natl.Acad.Sci.,USA961840-1845,1999),或者人體生長激素(Staub等,Nat.Biotechnol.18333-338,2000),這是一種生物類藥物。已經有數種報告基因在真核綠藻萊茵衣藻的葉綠體中表達,儘管成功表達的程度有所不同。這些基因包括aadA(Goldschmidt-Clermont,Nucl.AcidsRes.194083-40891991;Zerges和Rochaix,Mol.CellBiol.145268-5277,1994),uidA(Sakamoto等,Proc.Natl.Acad.Sci.,USA90477-501,1993;Ishikura等,J.Biosci.Bioeng.87307-3141999),海腎(Renilla)螢光素酶(Minko等,Mol.Gen.Genet.262421-425,1999)和來自於鮑氏不動桿菌(Acinetobacterbaumanii)的氨基糖苷磷酸轉移酶,aphA6(Bateman和Purton,Mol.Gen.Genet.263404-410,2000)。產生的重組蛋白的量僅僅對於uidA基因有報導(Ishikura等,如上,1999),基於蛋白質印記分析和活性測定,其表達量非常低。為了提高異源多肽在葉綠體中的表達,本發明研究了針對萊茵衣藻葉綠體基因組的密碼子偏好(Nakamura等,如上,1999)對表達的影響。由於遺傳密碼先天的簡併性,有時多達6種核苷酸三聯體編碼同一種胺基酸,而同工tRNA又常常由多基因家族編碼。例如,在所有核tRNA基因都已知的線蟲(Caenorhabditiselegans)中,有31個tRNAUCCGly編碼基因(Duret,TrendsGenet.16287-289,2000)。這種簡併性的一個結果就是許多物種表現出明顯的密碼子偏好,其中某些密碼子的使用頻率大大超過其他密碼子。密碼子偏好對於異源蛋白表達的影響已經在原核生物和真核生物中有詳細的描述,甚至病毒基因都表現出一定的密碼子偏好,從而影響它們暫時的和組織特異性的表達。一般情況下,密碼子的使用與同工tRNA的水平相關。這樣,編碼高效表達的蛋白的基因往往是利用其同功tRNA水平特別高的密碼子(Duret,如上,2000;Kanaya等,Gene238143-155,1999)。萊茵衣藻的葉綠體基因組表現出強烈的密碼子使用偏好,在第三個位置優選使用腺嘌呤或者尿嘧啶(或者胸腺嘧啶)(Nakamura等,如上,1999)。通過從頭合成編碼GFP並且具有萊茵衣藻葉綠體編碼的大部分蛋白所具有的葉綠體密碼子使用偏好的多聚核苷酸來研究葉綠體密碼子使用在重組多肽在萊茵衣藻葉綠體中表達時的作用(實施例1)。用處於萊茵衣藻RbcL5』UTR和3』UTR(分別是SEQIDNOS5和10)控制之下的帶有優化的密碼子的GFP序列盒(GFPct;SEQIDNO1)轉化萊茵衣藻葉綠體,監測其中GFP的積累,並與用沒有優化的GFP序列盒(GFPncb;SEQIDNO3)轉化的萊茵衣藻中GFP的積累比較。如在此公開的,用GFPct序列盒轉化的萊茵衣藻葉綠體中GFP的積累量大約是用GFPncb轉化的株系中的80多倍,而且這種表達足夠強烈,以致於可以報告基於環境條件的微小變化而造成的蛋白合成上的差異(實施例1)。相似的結果也在螢光素酶上得到,其中一種編碼包括細菌螢光素酶A亞基和通過連接肽與之融合的細菌螢光素酶B亞基的融合螢光素酶蛋白(SEQIDNO46)的具有葉綠體密碼子偏好性的合成的多聚核苷酸(SEQIDNO45)的表達導致了螢光素酶的強烈的表達,而且還提供了其它的優點,如螢光素酶的表達可以在體內被檢測(參見實施例4)。因此,本發明提供編碼螢光蛋白或者其突變體或者變異體的分離的合成的多聚核苷酸,其中所述多聚核苷酸的密碼子具有葉綠體密碼子使用偏好性。所述的合成的多聚核苷酸可以是DNA或者RNA,可以是單鏈或者雙鏈,可以是在一端或者兩端含有克隆位點的線性多聚核苷酸。所述多聚核苷酸可以包含在載體內,還可以與編碼被大約5到25個核苷酸分隔開來的第一RBS和第二RBS的多聚核苷酸有效連接,這樣螢光蛋白可以方便地在原核生物和葉綠體中翻譯。表1示出了在藻類葉綠體基因中優選使用的密碼子。這裡的術語「葉綠體密碼子使用」就是用來指這樣的密碼子,而且它在被使用時是相對於那些編碼同樣的胺基酸但是卻很少在葉綠體基因中發現的簡併密碼子而言的。當術語「偏好」是參照葉綠體密碼子使用來使用時,是指對多聚核苷酸進行操作,使它的一個或者多個密碼子上的一個或者多個核苷酸發生改變,結果得到在葉綠體中優選使用的密碼子。葉綠體密碼子偏好在這裡通過列在表1中的藻類葉綠體密碼子偏好來說明。葉綠體密碼子偏好可以但並不是必須基於將要在其中表達合成的多聚核苷酸的特定植物來選擇。上述的操作可以是通過例如定點突變的方法來改變密碼子,也就是利用與將要被改變的核苷酸錯配的引物來進行PCR,使得擴增產物具有葉綠體密碼子使用偏好性,上述的操作或者可以是從頭合成多聚核苷酸序列,使這樣的變化(或者偏好)通過合成步驟導入到序列中。除了利用葉綠體密碼子偏好作為提供有效的多肽翻譯的手段之外,需要注意的是,還有別的方法可以使多肽在葉綠體中的高效翻譯,例如對葉綠體基因組(例如萊茵衣藻的葉綠體基因組)進行工程改造,使之表達正常情況下不由所述葉綠體基因組表達的tRNA。這樣的工程化藻類表達一種或者多種異源tRNA分子,這就可以提供一個優點,可以避免對將要導入到葉綠體基因組中並由其表達的每一個多聚核苷酸進行修改;這樣就可以提供具有遺傳修飾的葉綠體基因組的藻類比如萊茵衣藻,並且可以根據本發明的方法將它用於多肽的有效翻譯。高效表達的基因中的密碼子使用與tRNA豐度之間的相關性已經為人熟知(Franklin等,PlantJ.30733-744,2002;Dong等,J.Mol.Biol.260649-663,1996;Duret,TrendsGenet.16287-289,2000;Goldman等,J.Mol.Biol.245467-473,1995;Komar等,Biol.Chem.3791295-1300,1998,每篇文獻都在此整入以供參考)。例如,在大腸桿菌中,使未充分利用的tRNA表達出來的菌株重新加工可以使利用這些密碼子的基因增強表達(參見,Novy等,inNovations121-3,2001,這篇文獻在此整入以供參考)。利用外源tRNA基因時,可以應用定點突變來製備合成的tRNA基因,這樣的tRNA基因可以被導入到葉綠體中以補充在葉綠體基因組比如萊茵衣藻葉綠體基因組中稀有或者不被使用的tRNA基因。編碼本發明的螢光蛋白的一種或者多種密碼子可以具有偏好性,例如在第三個位置上含有腺嘌呤或者胸腺嘧啶,這樣有利於螢光蛋白在葉綠體中的翻譯。如在此公開的,編碼水母(Aequoreavictoria)GFP的多聚核苷酸可以通過從頭合成一段含有121個同義密碼子變化的編碼序列來使之具有偏向性,其中包括代表著朝向葉綠體密碼子使用的適度改變的66個變化和導致不常用的密碼子朝向葉綠體使用改變的54個變化(實施例1)。這樣,如SEQIDNO1所示的編碼修飾過的GFP(SEQIDNO2)的多聚核苷酸提供了本發明的多聚核苷酸的一個例子,編碼SEQIDNO2但卻具有更少的具有偏好性的密碼子的多聚核苷酸則提供了額外的例子。本發明還提供具有如SEQIDNO2所示的胺基酸序列的修飾過的GFP。GFP是一種在本領域所熟知的從西北太平洋水母,僧帽水母,海腎,Renillareiniformis和Phialidiumgregarium中分離出的蛋白(Ward等,Photochem.Photobiol.35803-808,1982,Levine等,Comp.Biochem.Physiol.72B77-85,1982,每篇文獻都在此整入以供參考)。類似地,紅色螢光蛋白也是熟知的,可以從珊瑚蟲Discosoma中分離出來(Matz等,NatureBiotechnol.17969-973,1999,這篇文獻在此整入以供參考)。另外,通過對水母中自然發生的GFP的胺基酸序列進行修改,可以獲得與水母GFP相關的各種螢光蛋白,它們具有有用的激發和發射譜(參見Prasher等,Gene111229-233,1992;Heim等,Proc.Natl.Acad.Sci.,USA9112501-12504,1994;美國專利號6,319,669;國際專利申請號PCT/US95/14692,每篇文獻都在此整入以供參考)。這樣,需要注意的是,編碼這樣的螢光蛋白的核苷酸序列也可以使之具有葉綠體密碼子使用偏好性,從而為本發明的螢光蛋白提供額外的例子。試圖通過下面的實施例來說明本發明,但並不是限制本發明。實施例1為了在葉綠體中表達而進行編碼序列的優化這個實施例證明了具有葉綠體密碼子偏好性的編碼綠色螢光蛋白的核苷酸序列可以在藻類葉綠體中高效地表達(也可參見,Franklin等,PlantJ.30733-744,2002,這篇文獻在此整入以供參考)。萊茵衣藻株系,轉化和生長條件所有的轉化都是在萊茵衣藻株系137c(mt+)上進行的。細胞在含有40mM的5-氟脫氧尿苷的TAP培養基中培養至對數期晚期(大約7天)(Gorman和Levine,Proc.Natl.Acad.Sci.,USA541665-1669,1965,這篇文獻在此整入以供參考),培養條件是溫度為23℃,光照恆定為450勒克斯(Lux),在轉速設定為100rpm的旋轉搖床上培養。4000×g,4℃離心5分鐘之後得到50毫升的細胞。上清被去掉,然後將細胞重懸於4毫升的TAP培養基中,以便隨後用顆粒轟擊法(particlebombardment)進行葉綠體轉化(Cohen等,如上,1998)。所有的轉化都是在大觀黴素(150μg/ml)的選擇作用下進行,其中對大觀黴素的抗性是通過共轉化p228質粒上的大觀黴素抗性核糖體基因來實現的(ChlamydomonasStockCenter,DukeUniversity)。用於表達GFP的萊茵衣藻轉化子的培養是在TAP培養基中進行的(Gorman和Levine,如上,1965),培養條件是溫度為23℃,光照恆定為5000勒克斯,在轉速設定為100rpm的旋轉搖床上培養,除非特別指明,否則都是這個培養條件。在細胞收集之前,培養物要在密度為1×107個細胞每毫升的情況下維持至少48小時。質粒構建所有DNA和RNA操作都基本上按照Sambrook等,如上,1989和Cohen等,如上,1998中所描述的進行。GFP基因的編碼區通過PCR從含有原始GFP序列(GFPncb)的質粒中擴增(Tsien,Ann.Rev.Biochem.67509-544,1998,這篇文獻在此整入以供參考)。PCR引物的設計可以使得在所述編碼區的外側緊挨著一個5』端NdeI位點和一個3』端XbaI位點,這有助於接下來的克隆。針對GFPncb的5』端的序列為5』-CATATGAGTAAAGGAGAAGAAC-3』(SEQIDNO17);針對GFPct的3』端引物序列為5』-TCTAGATTATTTGTATAGTTCATCC-3』(SEQIDNO18)。GFPct的編碼區是按照Stemmer等,Gene16449-53,1995(這篇文獻已在此整入以供參考)中的描述,從每一個引物長度為40個核苷酸的引物庫中通過從頭合成得到的。5』端和3』端的引物分別含有NdeI和XbaI限制性位點。根據製造商提供的操作手冊,將得到的717bp的含有GFPct和GFPncb基因的PCR產物克隆到質粒pCR2.1TOPO(Invitrogen公司),分別得到質粒pCrGFPct和pCrGFPncb。rbcL的3』UTR是利用克隆到質粒pUC19中的萊茵衣藻葉綠體基因組DNA的1.6kbHindIII片斷作為模板,通過PCR反應得到的。對應於rbcL3』UTR的5』端和pUC19多克隆位點的一部分的PCR引物的序列為5』-TCTAGAGTCGACCTGCAG-3』(SEQIDNO19),其中包括XbaI位點。對應於rbcL3』UTR的3』端的PCR引物的序列為5』-GGATCCGTCGACGTATG-3』(SEQIDNO20),其中包括為了隨後的克隆而設置的BamHI限制性位點。將得到的433bp的產物克隆到質粒pCR2.1TOPO中,得到p3rbcL質粒。rbcL的5』UTR是以萊茵衣藻基因組DNA為模板通過PCR得到的。與起始於相對於翻譯起始位點的位置-189的rbcL基因5』端互補的PCR引物序列為5』-GAATTCATATACCTAAAGGCCCTTTCTATGC-3』(SEQIDNO21),其中包含EcoRI限制性位點。與rbcL基因的5』UTR的3』端互補的PCR引物從翻譯起始位點開始,其序列為5』-CATATGTATAAATAAATGTAACTTC-3』(SEQIDNO22),其中包含NdeI限制性位點。將得到的24lbp的PCR產物克隆到質粒pCR2.1TOPO中,獲得p5rbcL質粒。質粒p5rbcL被BamHI和NdeI酶切,將得到的片斷連接到同樣經過BamHI和NdeI酶切的pCrGFPct或者pCrGFPncb上分別產生質粒p5CrGFPct和p5CrGFPncb。最終,p5CrGFPct和p5CrGFPncb再被BamHI和XbaI酶切,將得到的958bp的片斷連接到同樣用BamHI和XbaI酶切之後的p3rbcL上,獲得p53rGFPct和p53rGFPncb。p53rGFPct和p53rGFPncb都用NdeI和BamHI酶切,將1.2kb的片斷連接到pET19b(Novagen)中,分別產生可以在大腸桿菌中表達的質粒pETGFPct和pETGFPncb。p53rGFPct和p53rGFPncb接著用BamHI酶切,將1.43kb的片斷連接到萊茵衣藻葉綠體轉化載體p322(ChlamydomonasGeneticsCenter,DukeUniversity),形成pExGFPct和pExGFPncb質粒。p322載體是基於萊茵衣藻葉綠體基因組DNA的核苷酸序列構建的,這段序列是從位置143073開始的Eco(EcoRI)位點到位置148561開始的Xho(XhoI)位點(參見全球資訊網,URL「biology.duke.edu/chlamy_genome/chloro.html」,點擊「以文本文件格式察看整個基因組」;也可參見「葉綠體基因組圖譜」連結,然後再點擊「140-150kb」連結,察看位置大約是143.1kb的Eco位點和位置大約是148.5kb的Xho位點)。這段Eco/Xho葉綠體基因組序列被插入到用EcoRI/XhoI酶切過的pBS質粒(Stratagene公司,拉霍亞,加利福尼亞州)。p322上的BamHI位點對應於葉綠體基因組DNA序列上從146522位置開始的位點。Southern和Northern雜交Southern雜交和DNA的32P標記是按照Sambrook等,如上,1989中描述的方法進行的。在Southern雜交中用到的放射性探針包括2.2kb的p322BamHI/PstI片斷(探測5』p322),2.0kb的p322BamHI/XhoI片斷(探測3』p322)和來自於p53rGFPct(探測GFPct)和p53rGFPncb(探測GFPncb)的717bp的NdeI/XbaI片斷。後兩個探針還用於在Northern雜交中檢測GFPct和GFPncb的mRNA。在Northern雜交分析中用到的其它放射性探針包括psbA和rbcLcDNA。Southern和Northern雜交都是採用配備了OPTIQUANT軟體包的PackardCycloneStoragePhosphorSystem來觀察。蛋白表達,蛋白質印跡和螢光凝膠根據製造商的操作手冊,將質粒pETGFPct和pETGFPncb轉化到大腸桿菌株系BL21中,用IPTG誘導帶6His標記的GFPct或GFPncb蛋白的表達。His標記的蛋白的純化通過鎳-瓊脂糖親合層析(Qiagen)進行。蛋白質印跡按照Cohen等(如上,1998)描述的方法,利用一種鼠抗GFP一抗(Clontech)和一種鹼性磷酸酶標記的抗鼠二抗(Sigma)進行。螢光凝膠的操作與用於考馬斯亮蘭染色和蛋白質轉膜的凝膠操作相同,但是蛋白質在上樣之前不需煮沸。凝膠中的GFP通過型號為LB981的BertholdNightOwlCCD相機觀察,該相機配備了485nm的激發濾鏡和535nm的發射濾鏡(Chroma公司)。圖像通過WinLight軟體生成。GFPct和GFPncb激發譜的形成激發譜是利用親合純化的GFPct和GFPncb蛋白在型號為LS50的PerkinElmer螢光光度計上產生。重組蛋白在光度計上讀數之前被稀釋到50mMNaH2PO4,300mMNaCl,250mM咪唑,pH8.0的溶液中。掃描波長從350到550nm,在510nm處記錄發射強度,從而得到激發譜。從頭合成具有萊茵衣藻葉綠體密碼子偏好性的GFP基因為了開發出可以在萊茵衣藻葉綠體中強烈表達的報告基因,合成了其密碼子使用經過優化而能反映出萊茵衣藻葉綠體基因組的密碼子使用的綠色螢光蛋白基因。針對原始GFP(GFPncb)編碼區設計了兩個胺基酸變化,以改善蛋白的螢光和表達特性。這些胺基酸改變中的第一個改變並不認為會影響到GFP的光譜性質,它是將在胺基酸位置2上的絲氨酸變成丙氨酸,這樣可以使起始密碼子處於一個更加合適的序列環境中。第二個改變是胺基酸位置65的絲氨酸變成蘇氨酸,這個改變相對於原始GFP可以增強在485nm處的激發幅度(大約6倍),同時降低395nm處的激發幅度(Heim等,Nature373663-664,1995,這篇文獻在此整入以供參考)。這個改變被引入到GFPct編碼序列中以改善使用可見光時的螢光檢測。正如在圖1中顯示的,GFPncb基因與野生型GFP基因相比,還有一個胺基酸改變,Q80R。這個改變是在挑選克隆之前,原始GFP基因的PCR擴增過程中被導入的。這個Q80R突變是一種在採用PCR擴增原始GFP編碼序列時常見的改變(Tsien,如上,1998),它對蛋白質的功能沒有影響。這樣,為了一致性,這個改變也被引入到GFPct基因中。大腸桿菌中表達的GFPct和GFPncb的表徵為了確定GFPct基因和GFPncb基因是否能夠產生功能性的GFP蛋白,由轉化了pETGFPct或者pETGFPncb的細胞製備的大腸桿菌細胞裂解物被用來檢驗。大腸桿菌裂解物的鎳親合色譜得到了具有正確GFP分子量的蛋白。用SDS-PAGE分離大腸桿菌產生的蛋白,直接螢光分析顯示這兩種蛋白在藍光照射下都會發出螢光,而且它們顯示出的螢光性質的微小差異也與導入的胺基酸變化一致。GFPct中的S65T變化導致蛋白在485nm處的螢光水平大大增強(相對於GFPncb蛋白在檢測中的用量,大腸桿菌中表達的GFPct蛋白的用量只有前者的1/5),而且它在395nm激發時的螢光大大降低(參見圖2)。利用抗原始GFP的鼠多克隆抗體進行的蛋白質印跡分析顯示,GFPct和GFPncb發出類似的信號。在GFPct蛋白的光譜性質相對於GFPncb蛋白被有意增強的情況下,這個結果顯得非常的重要。這樣,基於可見光下的激發(485nm)的螢光檢測會更加有利於GFPct蛋白的檢測,而同時免疫標記則沒有區別,這就允許對GFPct蛋白和GFPncb蛋白在萊茵衣藻葉綠體中的積累進行直接比較。GFPct和GFPncb轉化子的Southern和Northern雜交證明了GFPct和GFPncb編碼序列可以產生功能性的GFP蛋白之後,便用pExGFPct和pExGFPncb轉化萊茵衣藻葉綠體。另外,這些細胞還用可以賦予大觀黴素抗性的選擇性標記質粒p228進行共轉化。原代轉化子通過PCR以及Southern雜交分析進行篩選,接著陽性的轉化子再通過額外的數輪篩選分離出同質細胞系(homoplasmiclines),在這樣的細胞系中所有的葉綠體基因都含有導入的GFP基因。兩個同質GFPct轉化子18.3和21.2以及兩個GFPncb同質轉化子5.8和12.1被挑選出來作進一步分析(參見圖3A,顯示的是標示有相關的限制性位點的GFPct和GFPncb構建物)。利用在基因圖譜上標示出來的探針,確定質粒pExGFPct和pExGFPncb的7.1kb的Eco/Xho區域已經正確地整合到葉綠體基因組中(圖3B)。從野生型和GFPct轉化子和GFPncb轉化子中獲得的基因組DNA經過EcoRI和XhoI酶切,在瓊脂凝膠上分離,接著進行Southern雜交分析。由於rbcL的5』UTR含有一個EcoRI限制性位點(圖3A),所以用EcoRI和XhoI酶切轉化子DNA與野生型DNA相比,應該會產生一段更小的與p322的5』端或者3』端探針雜交的片斷。萊茵衣藻葉綠體的GFPct和GFPncb轉化子的Southern雜交分析證明了轉基因細胞系是同質的。萊茵衣藻的DNA同時用EcoRI和XhoI酶切,然後濾膜再與放射性探針雜交。5』p322的32P標記探針和3』p322的32P標記探針分別和GFPct和GFPncb轉化子中3.7kb和3.3kb的EcoRI片斷雜交。然而,正如被預料的,同樣的這些探針是與沒有轉化的野生型萊茵衣藻株系中5.7kb的EcoRI/XhoI片斷雜交。DNA印跡被洗掉,然後重新用GFPct和GFPncb特異性的探針探測。用GFPncb特異性的探針在轉化子5.8和12.1中檢測到3.3kb的EcoRI/XhoI片斷(圖4,中間板塊),而且類似大小的片斷也在轉化子18.3和21.2中用GFPct特異性的探針檢測到。而用這兩種探針在野生型萊茵衣藻DNA中檢測不到任何信號。GFPmRNA在轉基因株系中的積累總RNA的Northern雜交分析被用來確定GFPct和GFPncb基因是否在轉基因萊茵衣藻的葉綠體中轉錄。10微克總RNA從野生型,轉基因細胞系5.8,12.1,18.3,21.2中被分離出來,並且在變性瓊脂凝膠上分離,然後印記到尼龍膜上。兩份同樣的濾膜與32P標記的psbA或者rbcLcDNA探針雜交,每個株系中積累的psbA和rbcLmRNA的水平都相似,這證明等量的RNA被上樣到每一個泳道中,而且葉綠體轉錄和mRNA的積累在這些轉基因株系中都是正常的。這些濾膜被洗脫之後再重新用GFPct和GFPncb特異性探針探測。株系5.8和12.1積累GFPncbmRNA,而株系18.3和21.2則積累GFPctmRNA。正如預測的一樣,沒有GFP信號在野生型細胞中被觀察到。所有四種cDNA探針被標記成具有幾乎相等的比活度,得到的GFPct和GFPncb信號是相似的,而GFP探針探測的兩種濾膜需要更長(大約是4倍)的曝光時間才能夠達到和rbcL探針類似的信號。這些結果表明GFPmRNA的積累水平大約是內源rbcLmRNA的四分之一。分析GFP在轉基因萊茵衣藻葉綠體中的積累為了測定GFPct和GFPncb蛋白在轉基因細胞系中的積累水平,通過螢光分析和蛋白質印跡分析來測定GFP。比較表達GFPct的萊茵衣藻轉基因株系21.2和表達GFPncb的株系5.8和12.1中GFP的積累。細胞在連續光照下(5000勒克斯)生長到密度為1×107個細胞每毫升,這個生長條件是已知的可以最大限度的積累GFP的條件。對可溶性總蛋白進行SDS-PAGE分析,接著用抗GFP的抗血清進行蛋白質印跡分析。對於GFPncb轉基因株系5.8和12.1,用20微克可溶性總蛋白上樣,而對於GFPct轉基因株系21.2,用250ng(1/80)到20微克(1/1)的可溶性總蛋白上樣。6微克可溶性總蛋白(tsp)通過SDS-PAGE分離,得到的凝膠用於考馬斯亮蘭染色,螢光成像,或者蛋白質印跡分析。考馬斯亮蘭染色後的凝膠(從指定的萊茵衣藻株系中分離出來的6微克可溶性總蛋白被上樣到12%的SDS-PAGE凝膠上)表明同等量的蛋白被上樣到每個泳道中。螢光凝膠(蛋白製備與考馬斯亮蘭染色凝膠的情況類似,但是樣本在上樣之前不煮沸;蛋白通過SDS-PAGE分離)——激發波長設置在485nm,發射波長設置在535nm;485nm激發,535nm發射時成像——表明只有GFPct轉化子18.3和21.2才有信號。當激發波長為366nm的時候,對於任何GFP轉化子都沒有螢光信號。表明GFPct和GFPncb蛋白在轉基因萊茵衣藻株系的葉綠體中表達。對同樣的樣本進行的蛋白質印跡分析給出了和螢光分析類似的結果,在GFPncb轉化子中沒有檢測到GFP,而在GFPct株系中有很好的信號(在蛋白質印跡分析中,葉綠體表達的GFP蛋白被轉移到硝酸纖維素膜上,並用抗GFP抗血清檢測)。進行滴定試驗以更加準確地確認GFPct和GFPncb轉化子之間GFP積累的不同。來自於GFPncb轉化子5.8和12.1的20微克tsp與來自於GFPct轉化子21.2的tsp一起被分離。對於GFPct株系,蛋白濃度從20微克變化到250ng。樣本之間的比較表明,在轉化子21.2中GFPct的積累水平大約是在任何一種GFPncb轉化子中觀察到的80倍左右。利用針對葉綠體優化的GFP作為葉綠體基因表達的報告子研究了不同生長條件對轉基因株系中GFPct的積累的影響,以便確認GFPct基因可以作為葉綠體基因表達的報告子。在收穫細胞之前,萊茵衣藻的GFPct轉基因株系21.2在恆定的光照條件下,維持在1×106個細胞每毫升的密度,所述光照的強度是5000勒克斯(高光照)或者450勒克斯(低光照)。對於每一份處理樣本,取1微克tsp進行蛋白質印跡分析。研究了光強度對萊茵衣藻中GPFct的積累的影響。在收穫之前,萊茵衣藻轉基因株系21.2在指定光強的恆定光照下被維持在1×106個細胞每毫升或者1×107個細胞每毫升的濃度達48個小時。可溶性總蛋白(1微克)上樣到12%SDS-PAGE上分離,用抗GFP一抗來進行蛋白質印跡分析。細胞在以5000勒克斯的恆定光照下維持於1×106個細胞每毫升的濃度時,積累的GFPct的量大約是在低光照下維持於1×106個細胞每毫升的濃度時細胞中的表達量的10%左右。將第三個搖瓶在5000勒克斯的恆定光照條件下維持細胞濃度為1×107個細胞每毫升,GFP可以再次積累至高水平,因為在培養物內高的細胞密度起到了降低光照強度的作用,實際上就是創造了低光照的環境。這些結果證明,GFPct基因可以用於報告由於微小的環境變化所導致的蛋白合成的差異,證明了GFPct基因可以作為葉綠體基因表達的報告子。已經有數種異源基因被用作萊茵衣藻中葉綠體基因表達的報告子,但是它們的實用性都由於低水平的蛋白表達而受到限制。這些異源蛋白在萊茵衣藻葉綠體中的低水平表達有幾個可能的原因。例如,用來驅使這些基因轉錄的啟動子可能導致了低水平的轉錄。或者,其中一些報告基因的mRNA先天不穩定,結果導致低水平的mRNA積累。另外一種可能是這些嵌合的mRNA缺乏翻譯所需要的RNA元件。萊茵衣藻葉綠體基因強烈的密碼子偏好也有可能阻礙異源mRNA的翻譯。雖然啟動子的活性和mRNA的穩定性會在很大程度上影響基因在葉綠體中的表達,但是對轉基因萊茵衣藻葉綠體的分析表明有足夠的異源mRNA積累以支持高水平的蛋白質合成。另外,在絕大多數情況下,萊茵衣藻的5』UTR和3』UTR都會在嵌合基因的構建中被使用,這使得這些報告基因的mRNA不太可能缺乏關鍵的RNA元件。如在此公開的,更改密碼子使用可以作為提高異源蛋白在萊茵衣藻葉綠體中的積累的一種手段。這種改變密碼子使用的方法可以通過水母的綠色螢光蛋白(GFP)來說明。GFP的GFP編碼區被工程改造,以使蛋白編碼序列的密碼子使用與萊茵衣藻葉綠體基因組相配。將這種GFPct基因以及原始GFP基因(GFPncb)的表達置於萊茵衣藻葉綠體rbcL的5』端非翻譯區和3』端非翻譯區的控制之下。GFPncb基因和GFPct基因都可以在萊茵衣藻葉綠體中轉錄,並且mRNA積累的水平相當。表達GFPct的轉基因株系中GFP的積累量大約是表達GFPncb的株系中的80倍。在優化的生長條件下,產生GFPct的株系21.2中積累的GFP大約佔可溶性總蛋白的0.5%左右。這個水平的蛋白表達使得可以通過細胞總蛋白的螢光檢測來分析GFP的表達。以前有報導,在萊茵衣藻葉綠體中,uidA(GUS)在rbcL的5』UTR和3』UTR控制下的表達表現出低水平的蛋白表達,大約佔可溶性蛋白的0.01%;這個水平的GUS積累與從使用了相同的rbcL控制元件的GFPncb基因獲得的GFP積累水平相當(Ishikura等,如上,1999,這篇文獻還報導了rbcL-GUSmRNA的相對低水平積累)(類似於rbcLGFPmRNA的低水平,如在此公開的)。與GFPncb基因相比,GFPct基因中一共有123個密碼子變化,其中包括121個同義密碼子變化和兩個使胺基酸發生替換的密碼子變化(參見上面內容)。這121個同義密碼子變化中,有66個變化代表著向更加優化的密碼子使用的溫和轉變。在剩下的密碼子中,54個變化導致不常用的密碼子被常用的密碼子代替。這種密碼子優化基本上平均分布於整個GFP基因中,其中有15個變化位於編碼區域的前三分之一,20個變化位於中間三分之一和18個變化位於後三分之一。對於以前報導的在萊茵衣藻葉綠體中表達的基因的分析,這些基因包括Renilla螢光素酶(Minko等,如上,1999),uidA(Sakamoto等,如上,1993),aadA(Goldschmidt-Clermont,如上,1991)和aphA6編碼序列(Bateman和Purton,如上,2000),表明在以上各基因中分別有61,252,121和65個非優選的密碼子。如果這些非優選的密碼子在這些報告基因中的數目以它們佔總密碼子數目的百分比來算的話,分別是20%,42%,46%和25%。這與GFPncb基因的情況可以相比,在GFPncb基因中有佔密碼子總數的23%的非優選密碼子。這些結果表明這些其他報告子在萊茵衣藻葉綠體中的表達可以通過改變密碼子使用而得到大大增強。因為GFP序列的鹼基組成已經被明顯地改變了,所以針對GFPct和GFPncb的mRNA研究了這些改變對於mRNA結構的影響。這個分析確定了GFPctmRNA的翻譯的增強是由於密碼子使用的不同,而不是mRNA二級結構可能阻礙GFPncb定位到核糖體上的的影響。GFPct和GFPncb的mRNA的前250個核苷酸用RNA摺疊程序mfold(Zucker等,在RNABiochemistryandBiotechnology11-43(ed.Barciszewski和Clark,NATOASISeries,KluwerAcad.Publ.1999;Matthews等,J.Mol.Biol.288911-940,1999)來研究。在這兩個基因之間沒有預測到任何明顯的二級結構差異,其中GFPct序列的最適結構的自由能為-42kcal,而GFPncb序列則是類似的-38kcal。在此公開的結果證明優化密碼子使用可以促進多肽的翻譯和表達,比如優化的GFPct基因,它可以用作萊茵衣藻葉綠體基因表達的報告子。證明了密碼子優化可以用於在萊茵衣藻中獲得高水平的重組蛋白表達,這表明密碼子優化一般可以提高其它異源多肽在植物葉綠體中的翻譯效率。與內源性的rbcLmRNA相比相對低水平的GFPmRNA積累表明,優化GFPct的啟動子活性和mRNA穩定性可能會提供一種將GFPct的信號增強到更高的或者更加需要的水平的方法。這樣,GFPct基因提供了一個可以用於方便地優化GFP在植物葉綠體包括萊茵衣藻葉綠體中的轉錄、mRNA穩定性和翻譯的工具。實施例2植物葉綠體核糖體結合序列(RBS)的表徵本實施例說明了在葉綠體中指導翻譯的核糖體結合序列的鑑定和表徵。突變體的構建和表徵利用下面的寡聚核苷酸對psbA5』UTR進行PCR擴增,產生位點特異性突變5-GAAGCTTGAATTTATAAATTAAAATATTTTTACAATATTTTACCCAGAAATTAAAAC-3』(RBS-Alt;SEQIDNO23);5』-TGTCATATGTTAATTTTTTTAAAGTTTTTCTCCGTAAAATATTG-3』(RBS-23;SEQIDNO24);5』-TGTCATATGTTAATTTTTTTAAAGTCTCCGTAAAATATTG-3』(RBS-19,SEQIDNO25);5』-TGTCATATGTTAATTTTTTTTCTCCGTAAAATATTG-3』(RBS-15;SEQIDNO26);5』-GTCATATGTTAATTTCTCCG-3』(RBS-11;SEQIDNO27);和5』-TGTCATATGTTAATCCTCCTAAAGTTTTAATTTCTCCG-3』(RBS-Add;SEQIDNO28)。質粒構建和萊茵衣藻的轉化是按照Mayfield等(如上,1994)的描述進行的。16S-1470/71和16S-1467/68突變體是採用QUICK-CHANG突變試劑盒(Qiagen)構建的。突變體通過northern雜交或者蛋白質印跡分析來表徵。RNA提取,northern雜交分析,蛋白質分離,蛋白質印跡分析,以及體內條件下對蛋白用(14C)-乙酸鹽進行的脈衝標記都是按照Cohen等(如上,1998)的描述進行的。對於「腳趾印記(toeprinting)」分析,30S的核糖體亞基按照Harris(Microbiol.Rev.58700-754,1989,這篇文獻在此整入以供參考)描述的方法分離,作了一些小的改動。野生型萊茵衣藻細胞(2137a)重懸於TKMD緩衝液(25mMTris-HCl(pH7.8),25mMKCl,25mMMgOAc,5mMDTT),然後通過一次高壓細胞破碎儀(Frenchpress)來破碎細胞,壓力為5000psi。細胞滲出物再在BeckmanJA-20轉頭中40000×g,4℃離心30分鐘。將200個A260單位的上清放入具有10-30%蔗糖線性梯度的TKMD緩衝液當中,緩衝液中還含有100mMKCl,以用於30S和50S的核糖體亞基的一步分離。所述梯度在BeckmanSW28.1轉頭中22500rpm,2℃離心20小時。用可以讀取260nm處吸光度值的光學掃描器和部分收集器處理所述梯度。30S和50S級分分別收集到一起,然後用含有800mMKCl的高鹽TKMD以1∶1的比例稀釋,然後再在BeckmanTLA-100轉頭上200000×g,4℃離心20小時。再將這些沉澱在含有100mMKCl的TKMD緩衝液中重懸,然後在液氮中冷凍,存放在-70℃冷藏。30S和50S亞基之間的交叉汙染的程度用RNA點雜交分析來檢測(Cohen等,如上,1998)。初始複合體的形成通過如Hartz等描述的延伸抑制(J.Mol.Biol.21883-97,1988,這篇文獻在此整入以供參考)來分析,做了一些小的改動。在10微升的反應混合物有含有0.6pmol的5』端32P標記的寡聚核苷酸和0.2pmol的合成的psbAD1-HA轉錄物的退火混合物(參見實施例2)。延伸抑制從加入3.75mMdNTPs以及8×10-5到2×10-3μM高鹽洗脫過的30S核糖體亞基開始。反應在37℃溫育5分鐘之後,不帶電的大腸桿菌tRNA(tRNAfmet;羅氏診斷試劑)加入到反應體系中,終濃度為5μM。再將AMV反轉錄酶(0.5個單位)加入,反應在37℃再溫育15分鐘。反應在8%的測序凝膠上分析。測序反應按照前面所描述的進行,使用的dNTPs的終濃度為200μM,而且沒有核糖體或者tRNA存在。凝膠阻滯分析(gelshiftassays)大約1微克通過肝素瓊脂糖純化的蛋白(Cohen等,1998)和0.4個單位的PRIMERNase抑制劑(5Prime→3Prime,Inc.)在總體積為8微升的透析緩衝液(20mMTris-HCl(pH7.5),100mMKOAc,0.2mMEDTA(pH8.0),2mMDTT,20%甘油,4mMMgCl2)中室溫下溫育10分鐘。加入0.04pmol的體外轉錄(32P)標記的psbARNA,20微克小麥胚芽tRNA(Sigma),以及3微克FuD7(缺少psbAmRNA的萊茵衣藻株系)總RNA之後,反應在室溫下溫育10分鐘,所述的psbARNA覆蓋的區域是相對於翻譯起始密碼子-90到+171位置。在某些反應中,10pmol的沒有標記的體外轉錄未標記的psbARNA被加入到反應體系中作為競爭者。RNA/蛋白複合體在5%的非變性聚丙烯醯胺膠上分離。葉綠體30S核糖體亞基識別psbA5』UTR中的Shine-Delgarno核糖體結合序列為了鑑定葉綠體mRNA翻譯所需要的RNA元件,5』UTR中含有位點特異性突變的psbA基因變異體被導入到psbA缺陷性萊茵衣藻株系的葉綠體中(Mayfield等,如上,1994)。psbA5』UTR中可能的定位於起始密碼子上遊27個核苷酸的RBS基於它識別葉綠體16SrRNA上的反義SD序列的潛能被鑑定出來。這段序列的缺失(RBS-del)導致psbAmRNA與核糖體結合的失敗,從而導致完全不能合成相應的D1蛋白(Mayfield等,如上,1994)。雖然這個結果表明這個元件可能起到RBS的功能,但是這個缺失也有可能會通過一系列另外的機制來影響核糖體的結合,包括直接或者間接破壞結合於所述RBS鄰近的5』UTR的反式作用因子的結合位點(Yohn等,Proc.Natl.Acad.Sci.,USA952238-2243,1998a;Yohn等,J.CellBiol.142435-442,1998b;Danon和Mayfield,EMBOJ.103993-4001,1991,每篇文獻都在此引入作為參考;也可參見,Fargo等,如上,1998)。RBS元件中的SD序列通過與30S核糖體小亞基的16SrRNA的3』端的互補序列(反SD序列)配對而促進原核轉錄子的翻譯(Voorma,在TranslationalControl(ed.Hershey等,ColdSpringHarborLaboratoryPress1996),這篇文獻在此引入作為參考)。這種相互作用已經在體外利用純化的30S核糖體亞基加入到原核轉錄子中而被測到(Hartz等,如上,1991)。結合的30S亞基阻止了mRNA上的下遊寡聚核苷酸引物的延伸,結果形成核糖體的「腳趾印記(toeprint)」。為了確定30S的亞基是否可以識別psbAmRNA的5』端非翻譯區中的RBS,30S的核糖體亞基從萊茵衣藻中提取出來。與psbAmRNA起始密碼子下遊的區域互補的5』端(32P)標記的寡聚核苷酸引物和純化的體外合成的psbA轉錄子退火。將32P標記的寡聚核苷酸/RNA複合物與濃度遞增的純化的萊茵衣藻30S核糖體亞基,以及大腸桿菌的fMettRNA(參見實施例2)溫育。由於核糖體亞基的結合會導致引物延伸過程中出現停留位點(pausesites)。進行測序反應以確定結合的核糖體的位置。在含有30S核糖體的反應中,腳趾印記反應的停留發生在Shine-Delgamo序列3』端12個核苷酸(RBS停留)和起始密碼子3』端12個核苷酸(AUG停留)。當葉綠體30S核糖體亞基與對應於psbAmRNA的5』端的RNA轉錄子溫育時,觀察到引物延伸腳趾印記。這些停留發生在假定的SD序列和起始密碼子下遊大約12個核苷酸,這個結果同30S核糖體亞基與這兩個序列結合相一致。大腸桿菌30S亞基可以結合到來自於大麥的psbAmRNA上,其結果也揭示了一個對應於潛在的SD序列的腳趾印記,該SD序列的位置類似於來自於萊茵衣藻的psbAmRNA的SD序列的位置(Kim和Mullet,PlantMol.Biol.25437-448,1994,這篇文獻在此引入以供參考)。這些結果表明假定的RBS元件具有一個功能性RBS元件的特性。因此,這些體外生化數據支持前期研究得到的體內遺傳證據的解釋,也就是psbAmRNA中的RBS元件定位在起始密碼子5』端(上遊)27個鹼基處(Mayfield等,如上,1994)。16SrRNA中反SD序列的突變抑制一系列葉綠體mRNA的翻譯為了證明葉綠體核糖體通過與SD序列相互作用來識別信息,構建了兩個同質萊茵衣藻株系,其中葉綠體16SrRNA的反SD序列被突變。定位在16SrRNA的3』端的反SD序列中的核苷酸從CCUCC變成了GGUCC(16SrRNA的1467和1468核苷酸)或者從CCUCC變成了CCUGG(16SrRNA的1470和1471核苷酸,也可參見,SEQIDNO29)。這些突變體在可以支持沒有光合成的生長的完全培養基中培養時都是存活的,而且不表現出任何明顯的由於葉綠體能量合成上的變化而導致的形態缺陷。16S-1467/68突變體株系可以在最小培養基上以降低的生長速度生長,而16S-1470/71突變體株系則不可以在最小培養基上生長,這些表明這些突變體中光合成的功能分別降低和去除了。這些株系中葉綠體編碼的蛋白的積累是通過蛋白質印跡分析來檢驗的。從野生型(wt)萊茵衣藻株系或者突變型16S-1467/68和16S-1470/71中製備出同等量的總蛋白(通過考馬斯亮蘭染色測定),再通過SDS-PAGE分離,然後印跡到硝酸纖維素膜上,接著用特異性的針對D1,D2,ATPase,或者Lsu蛋白的兔多克隆抗血清處理。16SrRNA中的反SD序列的突變影響了某些葉綠體蛋白的積累。psbA編碼的D1蛋白在16S-1470/71突變體中沒有積累,而在16S-1467/68突變體中只有野生型中積累水平的20%。psbD編碼的D2蛋白表現出類似的情況,在16S-1470/71突變體中的積累水平還不到野生型的10%,而在16S-1467/68突變體中大約有25%。葉綠體ATPase的積累在16S-1470/71突變體中也被削弱(只有野生型積累水平的50%),儘管在16S-1467/68突變體中積累的水平和野生型接近。相反地,葉綠體編碼的可溶性的核酮糖雙磷酸羧化酶(Lsu)大亞基在任何一種16S突變株系中的積累都基本不受到影響。D1蛋白在突變株系中積累的失敗表明假定的RBS元件和16SrRNA之間的Shine-Delgamo相互作用是優化翻譯所需要的。這些株系中D2蛋白積累的失敗可能是由於psbDmRNA的翻譯需要和psbAmRNA同樣的反SD序列,或者是由於D1亞基的丟失導致D2蛋白合成之後不穩定。例如,不能合成PSII的單個亞基的萊茵衣藻核突變體也不能夠積累由葉綠體編碼的PSII的其他核心多肽,儘管這些蛋白也以同野生型一樣的速度在合成(Erickson等,EMBOJ51745-1754,1986)。為了檢驗單個葉綠體蛋白的翻譯速度,野生型株系,帶有突變的16SrRNA的株系,以及缺乏psbA基因的萊茵衣藻株系,都用(14C)-乙酸脈衝標記。結果16S-1470/71突變體中幾乎所有的膜蛋白,包括D1,D2,P5,和P6蛋白,都沒有合成。同等量的膜相關總蛋白或者可溶性總蛋白(Cohen等,Meth.Enzymol.297192-208,1998,這篇文獻在此整入以供參考;也可參見實施例2)從被(14C)乙酸脈衝標記的野生型和突變型萊茵衣藻株系中製備出來,蛋白的量是用考馬斯亮蘭染色測定,然後再將所有蛋白在SDS-PAGE上分離。14C標記的蛋白通過放射自顯影成像。16SrRNA的反SD序列的突變降低了數種葉綠體編碼的蛋白的合成速率。這個結果表明D2蛋白積累的下降不是由於D1蛋白積累的缺乏而導致的,而是psbD基因的翻譯是需要反SD序列。ATPase的mRNA的翻譯在這個株系中同樣也是降低的,雖然降低的程度要小於其他膜蛋白。受影響程度稍小一些的影響在16S-1467/68突變體中觀察到,這與觀察到的蛋白積累水平一致。一些膜相關的蛋白在16S-1470/71株系中以和野生型中一樣的水平持續翻譯。與膜蛋白截然相反的是,可溶性葉綠體蛋白的翻譯在16SrRNA突變體中幾乎沒有變化。可溶性蛋白以野生型中的速度合成說明帶有16SrRNA中反SD元件的改變的葉綠體核糖體依然是有功能的,可以支持翻譯。這些結果表明葉綠體中可溶性蛋白和膜蛋白的表達調控可能是通過一種依賴於RBS的機制被不同地調控的。psbA編碼的D1蛋白的表達需要RBS中SD序列的存在以及特定的間隔要求RBS在psbAmRNA的翻譯中的作用進一步採用萊茵衣藻株系驗證,其中RBS由GGAG改變為CCAG(RBS-Alt)。每一個株系都在連續的光照下生長在完全(TAP)培養基中(參見實施例2),等量的膜蛋白(通過考馬斯亮蘭染色測定)通過SDS-PAGE分離,然後印跡到硝酸纖維素膜上,再用針對D1蛋白的兔多克隆抗血清處理。由於D1蛋白的不完全變性,由結合的葉綠體產生多個條帶。RBS-Alt突變破壞了在psbAmRNA和16SrRNA3』端之間潛在的SD鹼基配對,但是並沒有破壞5』UTR內其他元件的相對位置(參見圖4)。如前面顯示的RBS-del的結果(Mayfield等,如上,1994)一樣,D1蛋白在RBS-Alt中也沒有積累。這個結果證明GGAG序列對於psbA的表達是必需的,如同一個真正的RBS。如果認為在RBS和起始密碼子的間隔大於15個核苷酸時,30S的核糖體亞基不能夠同時與這兩段序列接觸的話(Chen等,Nucl.AcidsRes.224953-4957,1994),那麼psbAmRNA中與psbA起始密碼子相距27個核苷酸的假定的SD序列應該就不能指導翻譯在正確的起始密碼子處開始。為了檢驗psbAmRNA的RBS的相對位置是如何影響表達的,一系列缺失突變被導入到5』端非翻譯區中使得RBS元件距離起始密碼子的距離越來越近(圖4)。隨著RBS被逐漸地向起始密碼子移近,D1蛋白在萊茵衣藻細胞中的積累開始下降。那些使得所述RBS的位置接近於原核RBS元件的最佳位置的缺失(RBS-15,RBS-11),導致萊茵衣藻的葉綠體中沒有D1蛋白的積累。進一步,在野生型psbA的RBS序列存在的條件下,在起始密碼子上遊7個核苷酸位置加入額外的原核RBS元件(SD-add)並沒有促進D1的積累。D1蛋白在psbA突變株系中的積累失敗並不是mRNA的穩定性丟失造成的雖然在其psbA的5』UTR的假定SD序列中存在突變的株系不能積累D1可以用核糖體不能識別來解釋,但是還有其他解釋存在。比如,使轉錄子不穩定的突變常常降低mRNA積累的水平,這也可以導致翻譯水平降低或者蛋白積累水平降低。psbAmRNA在含有影響RBS序列的定點突變的萊茵衣藻株系中積累。來自於總RNA庫中或者核糖體相關的RNA庫中的psbAmRNA的水平通過特異性針對psbA或者16SrRNA(保證同樣的上樣量)的放射性標記探針來檢測。相對的psbAmRNA水平通過16SrRNA的差異來校正,然後再通過野生型進行歸一化。雖然psbA的5』端非翻譯區中SD序列的突變導致積累的psbAmRNA的穩態水平降低,但是積累的mRNA的相對水平並不與觀察到的D1蛋白的積累水平相一致。比如,RBS-23突變體中D1蛋白的積累水平就比較高,而psbAmRNA的水平下降了50%。RBS-15和RBS-11株系不能夠積累任何D1蛋白,或者是不能夠在最低生長條件下生長,但是,即便如此,它們積累的psbAmRNA的水平卻和RBS-19突變體的差不多,而後者卻可以積累D1蛋白。事實上,積累相當於野生型psbAmRNA水平的僅僅10%,比如在RBS-del和RBS-Alt突變體中觀察到的情況,就足夠可以在另外的psbA突變體中觀察到野生型水平的D1蛋白積累(Mayfield等,如上,1994)。這樣,所觀察到的由於那些突變而造成的影響並不能歸咎於mRNA穩定性/積累的變化。如果psbA的5』端非翻譯區的突變/缺失導致結構改變而致使產生的轉錄子不能夠被翻譯,也可能發生D1蛋白積累的丟失。為了確定核糖體是否能夠識別SD序列,縱使存在著改變SD序列和起始密碼子的相對位置的突變,通過將細胞抽提物在蔗糖緩衝液中離心使來自於各種突變株的核糖體相關RNA與自由mRNA分開。在含有改變的或者缺失的RBS的株系中,與核糖體相關的psbAmRNA水平大大降低。然而,含有RBS元件的每個株系都有明顯數量(大於野生型水平的50%)的psbAmRNA與核糖體締聯,即使是在一些不能夠積累D1蛋白的株系中。不能夠積累D1蛋白表明,RBS-15和RBS-11突變株中核糖體相關RNA主要是由和單核糖體而不是多核糖體結合的RNA組成。為了進一步證明使SD序列更加靠近起始密碼子的突變並不是無意地阻止70S核糖體上的翻譯,構建了嵌合基因,其中含有的細菌螢光素酶的編碼區域被安放在野生型或者突變型psbA5』UTR的後面。這些嵌合基因被轉化到大腸桿菌中,螢光素酶mRNA的翻譯是通過發光活性來檢測的。在大腸桿菌中螢光素酶的表達模式與在萊茵衣藻中觀察到的D1的表達模式相反。使psbASD序列更加靠近起始密碼子的突變重新促進細菌中的翻譯。來自於哈氏弧菌(Vibrioharveyi)的細菌螢光素酶基因(luxAB)的編碼區域融合到野生型(wt)或者突變型psbA5』UTR,再連接到含有野生型psbA啟動子和3』UTR的質粒中。這些質粒再被轉化到大腸桿菌BL21(DE3)株系中,然後在螢光素酶底物n-癸醛存在的條件下,應用攝像機通過光子計數來監測螢光素酶的翻譯(Welsh和Kay,Curr.Opin.Biotech.5617-622,1997,這篇文獻在此引入作為參考)。每個株系相對於最佳表達(RBS-11)的百分比被測定出來。在細菌中由含有距離起始密碼子上遊11到15個核苷酸的RBS的構建物高效地翻譯出螢光素酶,但是當RBS的定位距離起始密碼子上遊超過19個核苷酸時,翻譯效率非常低。這個結果與關於萊茵衣藻的atpBmRNA的5』UTR的報導形成反差,後者被報導可以驅使在細菌或者葉綠體中進行相似水平的翻譯(Fargo等,如上,1998)。萊茵衣藻的psbA和psbD轉錄子的5』端非翻譯區內的序列可能影響mRNA加工。psbA5』UTR在體內在RBS序列上遊4個核苷酸位置處被剪切,而這個成熟過程與核糖體結合相關聯,而且依賴於RBS序列的存在(Bruick和Mayfield,如上,1998)。對psbA5』端的分析提供了額外的證據證實來自突變體的psbARBS序列被參與核糖體早期組裝的因子所識別。葉綠體psbA突變體的引物延伸分析證明psbA的5』端非翻譯區在每一個含有RBS序列的株系中都經過加工過程,但在RBS-Alt和RBS-del突變體中卻沒有觀察到(參見圖4;也可參見,Bruick,GraduateThesis,Scipps研究所,1998)。這些結果表明RBS-15和RBS-11株系中RBS元件被葉綠體中的核糖體亞基識別,但是這種識別,由於其本身的原因,不足以指導在起始密碼子處的正確翻譯起始。psbA5』端非翻譯區的缺失突變並不阻止核編碼的反式作用翻譯因子的結合核編碼的蛋白複合物特異性地識別psbA5』端非翻譯區,並且可以通過刺激翻譯起始而極大地增強D1蛋白的合成(Danon和Mayfield,如上,1991;Yohn等,如上,1998a;Yohn等,如上,1998b)。為了確定psbA5』端非翻譯區的突變是否會影響這個複合體結合mRNA的能力,應用體外凝膠阻滯分析來測定各個突變體中RNA結合的親和力。進行psbA特異性複合物與psbA5』UTR的結合的凝膠阻滯分析。放射性標記的對應於野生型psbA的5』端的RNA片斷在體外被轉錄出來,然後與用肝素瓊脂糖純化的蛋白在一起反應。RNA/蛋白相互作用導致RNA在非變性PAGE膠上阻滯。250倍逾量的非標記的競爭RNA也被加到同樣的反應中。對應於來自於各個突變體的psbA5』UTR的過量的未標記的RNA用於競爭蛋白複合物與對應於野生型psbA5』UTR的標記RNA的結合。每個突變體的psbA的5』端非翻譯區都在體外條件下被蛋白複合物識別,只有RBS-11的RNA沒有能夠完全競爭掉野生型RNA與蛋白複合物的結合。這個結果表明這些突變體中的大部分的翻譯丟失不是由針對這些翻譯激活蛋白的特定結合序列的喪失造成的。起源於內共生的原核生物的葉綠體的轉錄和翻譯機制通常類似於細菌。葉綠體啟動子含有一些類似於細菌的元件,而且質體啟動子可以驅動在大腸桿菌中的轉錄。葉綠體的核糖體明顯地與細菌中的核糖體有同源關係,而且葉綠體的核糖體RNA和核糖體蛋白表現出與細菌中對應物高度的保守性(Harris等,如上,1994)。葉綠體mRNA也和原核生物的mRNA一樣,末端沒有帽結構,一般也不多聚腺苷酸化,而且可以含有多順反子信息。在葉綠體中的翻譯裝置保留它的一些原核生物特徵的同時,經過時間的積累,許多調控特性已經開始受制與細胞核。葉綠體的類似原核生物的組分是如何與源自細胞核的反式作用調控因子整合的,至今仍然所知甚少。由於葉綠體翻譯裝置的原核生物特性,Shine-Delgamo(SD)相互作用在早期被認作是葉綠體翻譯可能的調控子。然而,在大多數情況下可被鑑定的SD序列都定位在相對起始密碼子上遊太遠的位置,以至都不認為是保守的RBS元件。結合變異研究,其中類似細菌的保守SD序列的突變並沒有導致翻譯的喪失,SD相互作用在葉綠體翻譯中的重要性被解除了(Fargo等,1998;Koo和Spremulli,1994;Rochaix,1996;Sakamoto等,1994)。為了研究SD相互作用一般對於葉綠體翻譯的影響,特別是對於psbAmRNA的翻譯的影響,葉綠體16SrRNA中反SD序列被突變,從而破壞與假定的SD序列可能的鹼基配對。結果這樣的核糖體依然保持合成可溶性葉綠體蛋白的能力,這表明這些16S突變一般不抑制核糖體的活性或者功能。然而,絕大多數,但不是全部的膜相關葉綠體蛋白的合成由於16SrRNA中反SD區域的突變而受到了嚴重的影響。這些結果表明了反SD區域在葉綠體翻譯中的重要性,並且表明這個元件可能是質體中翻譯調控的一個組分。為了從mRNA這一邊來研究SD相互作用,一系列突變被導入到psbAmRNA中定位在起始密碼子上遊27個核苷酸位置的可能的SD序列中,前期的研究工作暗示該可能的SD序列是psbAmRNA的加工和翻譯過程中重要的元件(Bruick和Mayfield,如上,1999;Mayfield等,如上,1994)。如在此公開的,psbA的SD元件的突變破壞了mRNA/核糖體的聯合,而且破環了psbA的翻譯和D1蛋白的積累。綜合16S突變分析和腳趾印記分析,這些結果證明Shine-Delgarno相互作用對於psbAmRNA的翻譯是需要的,而且對於其他一系列葉綠體mRNA也是如此。考慮到psbAmRNA中SD元件和起始密碼子之間不尋常的間隔,葉綠體中位置效應對於SD功能的影響被研究。一系列使得psbA的SD元件的定位更加接近與細菌中保守元件位置的缺失突變造成D1在葉綠體中的翻譯對應地降低,但是卻可以促進這些轉錄子在細菌中的翻譯。這個結果表明葉綠體和細菌在SD相互作用之後採用不同的機制來確定起始密碼子。這些結果還證明了psbAmRNA中SD元件不在原核生物的SD元件的保守位置內,而且可以解釋為什麼其他質體mRNA中在細菌保守位置處的可能的SD元件的缺失對於它們的翻譯沒有影響。由於信息穩定性,核糖體締合和翻譯常常緊密地聯繫在一起,這樣造成了鑑定mRNA的5』端非翻譯區的突變的首要效應的困難性。已經表明psbD的5』端非翻譯區中定位在起始密碼子上遊大約30個核苷酸位置的類RBS元件(AUGAG序列PRB2)會作為一個信息穩定元件影響葉綠體中D2蛋白的合成(Nickelsen等,PlantCell11957-970,1999)。基於16S突變體中psbD翻譯的丟失和PRB2元件與psbA的SD元件的相對位置,PRB2元件很可能是psbDmRNA的SD元件。缺乏這個元件的突變體中psbDmRNA穩定性的降低,與那些觀察到的影響psbASD的各種突變一樣,很有可能反映出核糖體不能締合,而這種締合原本可以保護mRNA免被降解(Wagner等,J.Bacteriol.1761683-1688.1994)。16S突變體中膜蛋白和可溶性蛋白翻譯的反差表明SD相互作用可能是葉綠體中翻譯調控的一個造成差異的組分。對膜蛋白合成的研究表明至少兩種膜相關蛋白在16S突變體中的翻譯水平和野生型相當。兩種16S突變體中膜蛋白的翻譯差異表明葉綠體mRNA可能採用稍有不同的序列作為SD元件,而且暗示葉綠體中可能有兩種類型的核糖體存在。psbAmRNA中RBS元件的定位表明葉綠體中存在一種新的促使早期起始複合物從RBS遷移到起始密碼子的機制。二級結構可以縮短某些原核信息中非典型定位的RBS元件之間的距離。然而,psbA的RBS元件和起始密碼子之間的核苷酸可以被明顯地改變但psbA的翻譯卻不會喪失,預測這個區域相對來說對結構是無影響的。在真核生物的翻譯起始過程中觀察到的一種掃描(scanning)機制也被認為適用於葉綠體mRNA,但是需要ATP作為解旋酶活性的能量來源,這一特徵還沒有在葉綠體翻譯中被描述。另外,葉綠體mRNA可能利用蛋白因子將在RBS處結合的30S亞基拉到起始密碼子處與之作用。一種結合於psbAmRNA的5』端非翻譯區的特異性蛋白因子同已知與翻譯起始因子相互作用的真核蛋白具有同源性(Yohn等,如上,1998a)。這樣的與真核蛋白類似的蛋白可能會將翻譯起始複合物帶到正確的起始密碼子處,這樣就可以作為葉綠體翻譯調控子而發揮其功能。RBS元件和起始密碼子之間額外的間隔可以為這些蛋白因子提供安放的位置,就像這裡研究的絕大多數突變體都不會阻止這些因子的體外結合一樣。類似的遠距離SD序列還在高等植物的psbA的5』端非翻譯區被鑑定到,這表明這樣的SD元件是植物葉綠體mRNA的特徵。實施例3在葉綠體中表達抗體本實施例證明了編碼單鏈抗體的通過葉綠體密碼子優化的多聚核苷酸在葉綠體中的表達,以及這種單鏈抗體組裝成二聚體。將編碼可以特異性地結合單純皰疹病毒(HSV)1型和2型的單鏈抗體(HSV8;SEQIDNO16)的多聚核苷酸(SEQIDNO15)通過pExGFP植物葉綠體載體轉化到萊茵衣藻葉綠體中(參見實施例1),不同的是用編碼HSV8的多聚核苷酸(SEQIDNO15)代替GFP編碼序列。來自於兩個轉化子(10.6和11.3)的可溶性總蛋白樣本在有和沒有還原劑二硫代蘇糖醇(DTT)的情況下收集,然後在10%的SDS-PAGE上採用Laemmli緩衝液系統進行分離,再轉移到硝酸纖維素濾膜上(Cohen等,1998)用於蛋白質印跡分析。所述HSV8抗體包含一個有效連接的FLAG肽標記,可以採用抗FLAG肽標記抗體(M2單克隆抗體;Sigma)和抗鼠鹼性磷酸酶偶連的抗體(Sigma)來檢測。在所述兩個不同的轉化子中表達的HSV8單鏈抗體遷移到預料的分子量所在的位置(大約65kDa)。明顯地,在沒有DTT存在的條件下分離得到的HSV8抗體是作為一個二聚體進行遷移。這些結果證明蛋白複合物比如抗體二聚體可以在植物葉綠體中組裝。同樣,葉綠體密碼子偏好的編碼抗HSV抗體的單鏈Fv片斷(SEQIDNO43)的合成的多聚核苷酸(SEQIDNO42)被構建出來,並且在萊茵衣藻中表達,結果獲得功能性的單鏈抗HSVFv抗體。當組合抗體文庫解決了利用大量免疫譜的問題時,有效的生產這些複合分子依然是一個問題。這裡,獨特的大單鏈(lsc)抗體的有效表達在單細胞生物,綠藻,萊茵衣藻的葉綠體中實現。通過合成具有葉綠體密碼子偏好性的lsc基因,並通過利用兩套萊茵衣藻葉綠體啟動子和5』端和3』端RNA元件中的一套來驅動嵌合基因的表達,從而實現高水平的蛋白積累。這種直接識別單純皰疹病毒的糖蛋白D的lsc抗體由藻以可溶性的形式產生,並且在體內條件下組裝成更高級的複合體。除了通過二硫鍵的形成介導二聚化,所述抗體不經過任何可檢測到的翻譯後修飾。進一步,這些結果證明所述抗體的積累可以被用於培養所述藻的特定生長控制所調控,而且還可以通過選擇用於驅動抗體基因表達的5』端和3』端元件來調控。這些結果證明藻類作為表達重組蛋白的一種平臺的實用性,而且描述了一種新型的含有整個重鏈蛋白包括Fc結構域在內的單鏈抗體。目前已經有大量異源蛋白表達系統可用於產生重組蛋白,而且每個系統都在蛋白質產量和操作的方便以及操作的費用上提供不同的優點(1)。單克隆抗體(mAbs)主要是通過在發酵設備中培養轉基因哺乳動物細胞來生產的。由於高資金投入以及哺乳動物表達系統先天的複雜性,單克隆抗體的生產能力將會在未來5年內陷入供不應求的境地(2)。由於通過哺乳動物細胞培養生產單克隆抗體具有缺陷,就需要建立另外的投入產出比高的生產單克隆抗體的方法以適應目前治療蛋白的發展步伐。酵母和細菌表達系統雖然在培養基組分上來說更加經濟,但是有好幾個缺點,包括不能夠有效地產生正確摺疊的功能性分子,以及更加複雜的蛋白質的低產量。除了傳統的發酵,已經有好幾個研究組開始拓展陸生植物來生產單克隆抗體(3,4,5)。在這樣的系統中,植物本身成了生物反應器,而抗體則沉積在葉或者種子組織中。雖然植物能夠提供生物技術產業中前所未有的經濟規模(比如,一個人可以種植幾千英畝的玉米),但是這種方法也有幾個先天性的缺點。首先,從起始的轉化事件到獲得有用量(毫克到克)的重組蛋白所需要的時間長度可能會長達三年,比如對於玉米這樣的物種。第二個考慮圍繞著人類治療藥物在食用作物中的表達,這很可能由於(通過花粉)向周圍作物的基因流(geneflow)而發生(6),正如在表達蘇雲金桿菌殺蟲蛋白的轉基因玉米和本地長白豬之間發生的情況(7)。這些考慮使得控制機構可能會禁止表達人類治療藥物的轉基因食用植物(像玉米,水稻和大豆)的公開種植。對葉綠體進行工程改造使之表達治療用蛋白的嘗試還是比較少的(8),雖然在一些例子中重組蛋白相當高水平的表達已經在這種細胞器中實現了(9-12)。關於產生用於表達重組蛋白的轉基因藻類的報導就更少了,儘管綠藻已經作為一種模式生物被用來了解從光調控和營養調控基因表達的機制到光合成裝置的組裝和功能的各個方面(13)。如實施例1公開的,使GFP報告基因反映出萊茵衣藻葉綠體基因組的密碼子偏好的密碼子使用優化增加了GFP的積累大約80倍,佔可溶性蛋白的0.5%(也可參見14)。如在此公開的,人類單克隆抗體及其片斷可以在轉基因藻類的葉綠體中表達。大單鏈抗體基因被改造之後具有萊茵衣藻葉綠體密碼子偏好性,並利用萊茵衣藻葉綠體atpA或者rbcL基因的啟動子和5』端非翻譯區來驅動表達。這種抗體直接識別單純皰疹病毒糖蛋白D(15),而且包含通過柔性連接肽融合在一起的輕鏈可變區和整個IgA重鏈。這種lsc抗體在轉基因葉綠體中作為可溶性蛋白積累,而且通過ELISA分析確定其可以結合皰疹病毒蛋白。這種大單鏈抗體可以在體內組裝成更高級的結構(二聚體),而且不含有明顯的翻譯後修飾,除了與二聚化相關的二硫鍵。這些結果證明了藻類作為複雜重組蛋白的表達平臺的實用性。方法萊茵衣藻株系,轉化和生長條件[224]所有的轉化都是按照如前所述(14)在萊茵衣藻株系137c(mt+)上進行的。用於表達HSV8-LSC的萊茵衣藻轉化子的培養在TAP培養基(19)中,培養溫度為23℃,光照和細胞密度一定的條件下進行。質粒構建所有DNA和RNA操作都是基本上按照文獻(20;21;也可參見,Mayfield等,Proc.Natl.Acad.Sci.,USA100438-442,2003,這篇文獻在此引入以供參考)描述進行的。HSV8-lsc基因的編碼區(SEQIDNO47)是根據文獻(22)的方法和前面描述(14)的方法從頭合成的。根據製造商的操作手冊,將得到的1893bp的PCR產物克隆到質粒pCR2.1TOPO(Invitrogen公司)中。atpA和rbcL的啟動子和5』端非翻譯區,以及rbcL的3』端非翻譯區是通過PCR生成的(14)。Southern和northern雜交分析Southern雜交和用作探針的DNA的32P標記是按照文獻描述(20)的方法進行的。用在Southern雜交上的放射性標記探針包括2.2kb的p322BamHI/PstI片斷(探測p322的5』端),2.0kb的p322BamHI/XhoI片斷(探測p322的3』端)和來自於HSV8-lsc的1926bp的NdeI/XbaI片斷。另外的用於northern雜交分析的放射性探針包括psbAcDNA。Southern雜交和northern雜交都是採用配備了Optiquant軟體的PackardCycloneStoragePhosphorSystem來檢測結果的。蛋白表達,蛋白質印跡和ELISA為了進行蛋白質印跡分析,按照文獻(14)描述的方法從萊茵衣藻中分離出蛋白。Flag親合純化的萊茵衣藻HSV8-lsc在含有完全蛋白酶抑制劑雞尾酒劑片(completeproteaseinhibitorcocktailtablets,Roche,Inc.)和終濃度為1mM的苯甲基磺醯氟(PMSF)的TRIS緩衝鹽溶液(TBS;25mMTRISpH7.4,150mMNaCl)中分離出來。根據製造商的操作手冊,抽提物用抗FlagM2瓊脂糖珠(Sigma)純化。ELISA分析是在96孔微滴定板(Costar)中進行的,100微升的體積用100微升的HSV蛋白包被。用於ELISA的樣本用封閉緩衝液稀釋,封閉緩衝液由磷酸鹽緩衝液(PBS;137mMNaCl,2.7mMKCl,1.8mMK2PO4,10mMNa2HPO4,pH7.4)和5%的脫脂無水牛奶組成。在4℃和搖晃的條件下溫育8小時。然後用PBS和0.5%的Tween20漂洗96孔板3次,然後再在4℃用抗Flag抗體溫育8個小時。再次漂洗96孔板三次然後用鹼性磷酸酶偶連的羊抗鼠抗體(SantaCruz生物技術公司)在4℃溫育8個小時。再次用PBS和0.5%的Tween20漂洗96孔板三次,然後用100微升對硝基苯磷酸酯(pNPP,Sigma)顯色。反應通過加入50微升3N的NaOH終止。蛋白濃度是利用BioRad蛋白分析試劑來測定的。蛋白質印跡是按照文獻(23)描述的方法,利用鼠抗Flag一抗(Sigma)和鹼性磷酸酶偶連的羊抗鼠二抗(SantaCruz生物技術公司)進行的。結果利用具有密碼子偏好的多聚核苷酸在萊茵衣藻葉綠體中從頭合成大單鏈抗體基因為了實現重組抗體在在萊茵衣藻中的強烈表達,利用經優化而能反映出被大量翻譯的萊茵衣藻葉綠體mRNA的偏好性的密碼子來合成單鏈抗體基因。這種工程化的抗體是來自於展示在噬菌體上的人類抗體文庫,而且通過與單純皰疹病毒蛋白的作用被鑑定出來(15)。這種被稱為HSV8的抗體以前被證明可以結合病毒表面抗原糖蛋白D(16),而且這種抗體的Fab或者IgG1形式在體外和體內都可以作為有效的中和抗體(15,16)。由於簡單的scfv抗體可以在細菌或者酵母系統中合成,因此嘗試在葉綠體中合成更加複雜的,但仍然可以由單個mRNA翻譯的抗體。一條單鏈抗體經過設計含有通過柔性連接肽融合在一起的整個重鏈和輕鏈可變區。這種獨特的大單鏈(lsc)蛋白的一級胺基酸序列如SEQIDNO48所示,這段序列由序列SEQIDNO47編碼。構建嵌合的萊茵衣藻葉綠體大單鏈抗體基因為了得到表達重組抗體的轉基因葉綠體,合成一段嵌合基因,這段基因含有atpA或者rbcL啟動子和5』端非翻譯區,並融合到密碼子優化的HSV8-lsc編碼區上,接著還有rbcL的3』端非翻譯區(分別是圖5A和5B)。整合基因到葉綠體基因組中是通過同源重組完成的,這需要轉化載體和葉綠體基因組之間的序列同源性(17)。萊茵衣藻葉綠體轉化載體p322(14)被利用。正如圖5B所展示的,所述嵌合抗體基因被連接到p322的BamHI位點,從而產生質粒p322/atpA-HSV8和p322/rbcL-HSV8。這些p322/HSV8構建物與質粒p228通過顆粒轟擊(17)被共轉化到萊茵衣藻的葉綠體中,p228含有一段可以賦予大觀黴素抗性的16S核糖體基因。HSV8-lsc轉基因葉綠體的Southern雜交分析初始轉化子(primarytransformants)在含有大觀黴素的培養基上被挑選出來,並通過Southern雜交分析篩選出整合有HSV8基因的轉化子。HSV8陽性轉化子經過額外的數輪選擇以分離出同質細胞系,其中所有葉綠體基因組的拷貝都含有導入的HSV8-lsc基因。兩個同質轉化體被挑選出來,一個是10-6-3,它含有控制HSV8-lsc的atpA啟動子,而另外一個是20-4-4,它含有控制HSV8-lsc的rbcL啟動子。從野生型和這兩個HSV8-lsc轉化子得到的基因組DNA用EcoRI和XhoI酶切,然後在瓊脂凝膠上分離,再進行Southern雜交分析。萊茵衣藻DNA的製備方法按照實施例3中描述的方法進行,用EcoRI和XhoI酶切,然後濾膜再與放射性探針雜交,探針的位置在圖5C中用雙箭頭指示出來。用32P標記的HSV8編碼區域的NdeI/XbaI片斷雜交在atpA-HSV8和rbcL-HSV8轉基因株系中都鑑定出6.0kb的條帶,但在野生型所在的泳道中如期望的一樣沒有鑑定到任何可以檢測到的條帶。當同樣的雜交膜與32P標記的p322的5』端的1.5kb的EcoRI到PstI之間的片斷雜交時,在野生型樣本中有一條5.7kb的片斷被顯現出來,而在兩個轉基因株系中則稍稍大於6.0kb的片斷被鑑定出來。用p322的3』端的32P標記的BamHI/XhoI片斷雜交,則分別在10-6-3和20-4-4鑑定到2.5kb和2.0kb的片斷,而在野生型株系中則再次顯現的是5.7kb的條帶。這些結果證明HSV8基因已經正確地整合到葉綠體基因組的p322沉默位點,而且所有葉綠體基因組的拷貝都含有HSV8基因。HSV8-lscmRNA在轉基因株系中的積累在轉基因萊茵衣藻株系中檢測了葉綠體表達的HSV8-lscmRNA。從沒有轉化的株系(wt),atpAHSV8-lsc轉化的株系(10-6-3)和rbcL轉化的株系(20-4-4)中分離的總RNA在變性瓊脂糖凝膠上分離之後轉移到尼龍膜上。這些膜用甲基藍染色或者與psbAcDNA探針,或者與hsv8特異性的探針雜交。總RNA的northern雜交分析用來檢測HSV8基因是否在轉基因萊茵衣藻葉綠體中轉錄。來自野生型和兩個轉基因細胞系的10微克總RNA在變性瓊脂糖膠上分離之後轉移到尼龍膜上。雙份同樣的濾膜用甲基藍染色和用32P標記的psbAcDNA探針或者HSV8特異性的探針雜交。核糖體RNA和psbAmRNA在野生型和各種轉基因株系中的積累水平相似,這證明上樣的RNA的量是一樣的,而且轉基因的導入並沒有改變內源mRNA的積累。用HSV8特異性的探針進行雜交,顯示10-6-3和20-4-4株系中積累了大小正確的HSV8-lscmRNA,而且正如期望的一樣,在野生型所在泳道沒有檢測到HSV8信號。分析HSV8-lsc蛋白在轉基因萊茵衣藻葉綠體中的積累利用抗flag抗體通過蛋白質印跡分析來測定HSV8-lsc抗體的水平,以確定HSV8-lsc蛋白是否在轉基因細胞系中積累。20微克來自於從pET載體中表達HSV8-lsc的大腸桿菌株系的總蛋白,20微克來自於野生型和兩個轉基因萊茵株系的總蛋白,通過SDS-PAGE分離,然後用考馬斯亮蘭染色或者用抗Flag抗血清進行蛋白質印跡分析。為了在細菌中表達,密碼子優化的HSV8-lsc基因的NdeI/BamHI片斷被連接到pET載體中,並通過加入IPTG誘導表達。考馬斯染色的凝膠表明在每個泳道中上樣的蛋白的量都是一樣的,而且還表明轉基因株系中總蛋白的積累也是正常的。利用抗Flag抗體對同樣的樣本進行蛋白質印跡分析,表明在HSV8-lsc轉基因株系和大腸桿菌中有正確分子量的強烈信號,但是在萊茵衣藻野生型所在泳道如期望的一樣沒有信號。在大腸桿菌和葉綠體中表達的HSV8-lsc抗體的表徵為了確定在萊茵衣藻葉綠體中積累的HSV8-lsc是否具有功能,葉綠體表達的蛋白和細菌表達的HSV8-lsc蛋白一起被表徵。HSV8-lsc轉基因的細菌和藻在TBS溶液中重懸,然後用超聲破碎細胞。可溶性蛋白與不可溶性蛋白通過離心被分開。從可溶性組分和不可溶性組分中取出同樣量的蛋白用SDS-PAGE分離,然後HSV8-lsc蛋白通過蛋白質印跡分析來顯現。細菌中產生的HSV8-lsc蛋白的大約60%分布在不溶性組分中,而葉綠體中產生的蛋白幾乎全部在可溶性組分中被發現。為了確定葉綠體中表達的抗體是否含有翻譯後修飾,這些抗體在還原性和非還原性凝膠上用SDS-PAGE和蛋白質印跡分析來檢測。來自於萊茵衣藻轉基因株系10.6.3的可溶性蛋白在用SDS-PAGE分離之前用B巰基乙醇(+Bme)處理或者不用還原性試劑(沒有Bme)處理。蛋白被轉移到硝酸纖維素膜上,然後再用抗flag抗體檢測。在非還原條件下,所述抗體的兩條重鏈之間形成的任何二硫鍵都保持不變,而使抗體可以作為更大的分子遷徙。在非還原條件下葉綠體表達的HSV8-lsc在電泳中是以一個更大的蛋白遷移的,分子量大約是140kDa,這個大小是一個二聚體所具有的。用Bme處理之後,二硫鍵被還原,結果使得葉綠體的HSV8-lsc蛋白在電泳中以預測的單體分子量——68kDa——遷移。為了確定是否有其他翻譯後修飾存在於葉綠體表達的蛋白中,細菌和葉綠體表達的蛋白通過質譜來表徵。來自於大腸桿菌和葉綠體中表達的蛋白的肽段的質譜是幾乎相同的譜型,這說明對於葉綠體蛋白是沒有任何額外的修飾的。葉綠體表達的HSV8-lsc結合HSV8蛋白的能力被檢驗以確認在轉基因葉綠體中積累的HSV8-lsc是具有功能的。HSV8-lsc通過抗flag親合樹脂從轉基因葉綠體中純化得到。如圖6所示,在ELISA分析中,葉綠體產生的抗體以強勁的方式識別HSV8蛋白。HSV8-lsc在轉基因藻中的積累的調節不同生長條件對於抗體在兩個轉基因株系10-6-3和20-4-4中積累的影響被檢測以確定HSV8-lsc在萊茵衣藻葉綠體中的表達是否可以受調控。每個株系的培養維持在106或者107個細胞每毫升,在12/12光照-黑暗的循環(5000勒克斯)條件下生長,或者在連續光照(5000勒克斯)光照條件下生長。細胞通過離心收集,然後20微克可溶性蛋白在SDS-PAGE中分離,然後HSV8-lsc用抗Flag抗體進行的蛋白質印跡來顯現。HSV8-lsc的積累明顯地依賴於生長條件而變化。在株系20-4-4中,rbcL啟動子/5』UTR控制之下的蛋白表達在黑暗期的末期或者在剛剛進入光照期之後,表現出明顯的抗體積累增長,而且與細胞密度無關。相比較而言,在株系10-6-3中,atpA啟動子/5』UTR在106個細胞每毫升的細胞密度下在光照-黑暗循環中指導水平基本恆定的HSV8-lsc蛋白表達,然而當細胞培養密度為107個細胞每毫升的時候,在進入光照期後會表現出lsc積累的明顯增加。當生長在連續光照條件下時,兩個株系在細胞濃度為106個細胞每毫升時的蛋白積累要高於細胞濃度為107個細胞每毫升時的蛋白積累。這些結果證明HSV8-lsc在萊茵衣藻葉綠體中的積累可以被優化,這依賴於用於培養細胞的光照條件,細胞收集時細胞所處的循環時期,以及用於驅動表達的啟動子/UTR。一種人類單克隆抗體在綠藻葉綠體中被表達出來。高水平的重組蛋白的表達是通過優化抗體編碼序列的密碼子使用使之反映出大多數葉綠體蛋白的密碼子使用,以及用葉綠體atpA或者rbcL的啟動子和5』UTR來驅動嵌合基因的表達來實現的。這種大單鏈(lsc)抗體含有通過一段柔性連接肽融合在一起的IgA整個重鏈和輕鏈可變區,而且在葉綠體中以完全可溶的蛋白形式積累。這種抗體用來識別單純皰疹病毒的糖蛋白D,而這種由藻表達的抗體和皰疹蛋白之間的結合是通過ELISA測定的。這種lsc抗體含有重鏈的Fc部分,這個部分正常情況下涉及分子間二硫鍵的形成,從而導致抗體的二聚化。所述葉綠體表達的抗體組裝成更高級的複合物,這種複合物對於由Bme介導的還原是敏感的,這表明葉綠體表達的抗體在體內形成二聚體。在葉綠體中表達的重組蛋白中二硫鍵的形成已經在菸草葉綠體表達的人體生長激素中被描述過(8),由於藻類葉綠體中存在蛋白二硫鍵異構酶,因此葉綠體中表達的重組蛋白中形成二硫鍵也是在幾分預料之中(18)。這種lsc抗體也含有假定的N連接糖基化位點。葉綠體編碼的蛋白不被認為有糖基化的發生,而且實際上基於質譜分析,也沒有任何證據表明葉綠體表達的抗體有糖基化作用。產生的轉基因株系表現出不同水平的抗體積累,這依賴於用於驅動蛋白表達的啟動子,以及細胞密度和培養這些株系的光照條件。抗體積累的這些大範圍波動的原因可能是由各種因素造成的,包括嵌合mRNA的穩定性和翻譯能力,抗體蛋白的更新(turnover)。這些結果證明抗體的積累可以受到生長條件的正面影響,而且還表明高水平的抗體積累(超過可溶性蛋白的1%)可以在藻中實現,只要簡單地通過優化適合於特定啟動子和UTR組合的生長條件就可以實現。重組蛋白可以在各種蛋白表達系統中生產。複雜的治療用蛋白,比如單克隆抗體(mAbs),主要是在培養的轉基因哺乳動物細胞中生產。在培養的哺乳動物細胞中生產單克隆抗體的成本平均大約是150美元每克原材料,而在植物系統中單克隆抗體生產的成本估計是0.05美元每克原材料(1)。在藻類系統中生產單克隆抗體的成本被認為比在陸生植物中生產的成本更具有競爭優勢,藻類的培養基的價格就相當合理(0.002美元每升)。另外,藻類可以連續培養而它們的生長培養基可以循環。在藻中生產單克隆抗體除了無與倫比的成本優勢之外,還有一系列的特殊優點使得藻類成為重組蛋白生產理想的候選。首先,轉基因藻類可以很快地得到,從產生初始轉化子到擴大規模至生產體積這個過程只需要幾周。第二,藻類葉綠體基因組和核基因組都可以被遺傳轉化,這就為在一個物種中生產一系列不同的轉基因蛋白提供了可能性,這在要生產多聚蛋白複合物比如分泌抗體時這是需要的。另外,藻類具有以非常經濟的方式在各種規模上培養的能力,從幾毫升到500000升。這些優點以及綠藻被歸入GRAS目錄(通常被視為安全目錄)的事實,使得萊茵衣藻成為一個特別引人注意的替代其它系統表達重組蛋白的選擇。最後,雖然本實例特別強調在藻類中抗體的生產,但是這個系統實質上可以勝任任何重組蛋白的生產。引用文獻下面每篇文章都在此引入作為參考。1.Dove,(2002)NatureBiotechnol.20,777-7792.Motmans和Bouche,AntibodiesTheNextGeneration(2000)ReporttoAuerbachGraysonCompany,Inc.3.Hiatt等,(1989)Nature342,76-784.Ma等,(1994)Eur.J.Immunol.24,131-1385.Ma等,(1995)Science268,716-7196.Ellstrand,(2001)PlantPhysiol.125,1543-1545.7.Quist和Chapela,(2001)Nature414,541-543.8.Staub等,(2000)NatureBiotechnol.18,333-338.9.Kota等,(1999)Proc.Natl.Acad.Sci.USA96,1840-1845.10.Sidrov等,(1999)PlantJ.19,209-216.11.Ruf等,(2001)NatureBiotechnol.19,870-875.12.Heifetz,(2000)Biochemie82,655-66613.Harris,(1989)TheChlamudomonasSourcebookAcademicPress,Inc.14.Franklin等,(2002)PlantJ.30,733-734.15.Burioni等,(1994)Proc.Natl.Acad.Sci.USA.91,355-359.16.DeLogu等,(1998)J.Clin.Microbiol.36,3198-3204.17.Boynton等,(1988)Science240,1534-153818.Kim和Mayfield,(1997)Science278,1954-195719.Gorman等,(1965)Proc.Natl.Acad.Sci.USA54,1665-1669.20.Sambrook等,(1989)MoecularCloning.ALaboratoryManualColdSpringHarborLaboratoryPress.21.Cohen等,(1998).Meth.Enzymol.297,192-208.22.Stemmer等,(1995)Gene164,49-53.實施例4由具有葉綠體密碼子偏好性的細菌luxAB基因表達螢光素酶融合蛋白本實施例證實了由具有葉綠體密碼子偏好性的合成的多聚核苷酸編碼的螢光素酶融合蛋白在葉綠體中的強烈表達。螢光素酶報告基因已經成功地在各種生物中用來檢測活細胞中的基因表達,但是還沒有在葉綠體中被成功應用過。如實施例1中所描述的,綠色螢光蛋白(gfp)已經從具有葉綠體密碼子偏好性的多聚核苷酸中表達出來,而且可以用作葉綠體中基因表達的報告基因。由於gfp能夠發出高強度的自發性螢光,並且在葉綠體中相對高水平的表達和gfp蛋白積累對於可視化是必需的,由具有葉綠體密碼子偏好性的多聚核苷酸編碼的螢光素酶報告蛋白,通過合成兩個細菌螢光素酶亞基,luxAB,成為一個具有萊茵衣藻葉綠體密碼子偏好性的融合蛋白,而被開發出來。如在此公開的,葉綠體螢光素酶基因,luxCt,在atpA啟動子和5』UTR和rbcL的3』UTR的控制下在萊茵衣藻的葉綠體中表達。該luxCt是葉綠體基因表達的一個敏感報告子,可以允許用CCD相機在體內條件下測定螢光素酶的活性或者用光度計在體外條件下測量其活性。進一步,通過蛋白質印跡分析測量出的luxCt蛋白積累與體內和體外條件下測得的發光成正比。這些結果證明luxCt基因作為活體細胞中葉綠體基因表達的通用且靈敏的報告基因的實用性。報告基因已經大大增強了在大量生物中監測基因表達的能力。在高等植物的葉綠體中,β-葡萄糖苷酸酶(uidA,Staub和Maliga,1993),新黴素磷酸轉移酶(nptII,Carrer等,1993),腺苷-3-腺嘌呤轉移酶(aadA,Svab和Maliga,1993),和來自水母的綠色螢光蛋白(Sidorov等,1999;Reed等,2001)都已經被用作報告基因(Heifetz,2000)。數種報告基因也已經在真核綠藻,萊茵衣藻的葉綠體中表達,這些基因包括aadA(Goldschmidt-Clermont,1991;Zerges和Rochaix,1994),uidA(Sakamoto等,1993,Ishikura等,1999),aphA6(Bateman和Purton,2000)和海腎螢光素酶(Minko等,1999)。不幸的是,這些早期的報告基因表達盒生產的蛋白積累水平非常低,使它們不能夠很好地作為定量分析基因表達的報告子。正如在實施例1中公開的,高水平的報告基因的表達通過優化綠色螢光蛋白報告基因的密碼子使用來獲得(也可參見,Franklin等,2002)。比較轉化了非優化的gfp基因和優化的cgfp基因的株系中GFP蛋白的積累,發現由萊茵衣藻葉綠體的cgfp基因而來的GFP蛋白的積累有80倍的增加。這些結果證明,以前報告基因在萊茵衣藻葉綠體中的表達不能夠達到高水平的原因是由萊茵衣藻葉綠體基因的密碼子使用偏好性導致的。為了拓展用gfp獲得的結果,以及為了獲得一種可以在體內條件下被觀察的報告子,具有萊茵衣藻葉綠體密碼子偏好性的細菌螢光素酶基因被合成出來。該從頭合成的lux基因是基於哈維氏弧菌(Vibrioharveyi)的細菌luxAB基因合成的(Baldwin等,1984,Johnson等,1986)。螢光素酶的編碼序列被合成之後使得螢光素酶A和B亞基作為一個通過柔性連接肽將A和B亞基連接在一起的單個編碼區域來表達(Kirchener等,1989,Olsson等,1989,Almashanu等,1990)。這種就葉綠體而被優化的螢光素酶基因(luxCt)被放置在含有atpA啟動子和5』端非翻譯區以及rbcL的3』端非翻譯區的表達盒中。含有所述luxCt基因的轉基因細胞系中有luxCtmRNA和LUXCt蛋白積累,這是分別通過RNA雜交和蛋白質印跡分析來判斷的(參見下面內容)。當細胞用細菌螢光素酶的底物癸醛處理時,表達luxCt的轉基因細胞系的發光通過CCD相機很容易觀測到,而在同樣的試驗中野生型細胞中則沒有顯示任何發光。通過蛋白質印跡分析測定的luxCt的表達和通過應用CCD相機的發光分析以及應用體外光度計分析測定的luxCt的表達是成正比的。轉基因株系中螢光素酶的活性可以在好幾個數量級上被測量,這證明luxCt作為活體細胞葉綠體中基因表達的報告子具有靈敏性和實用性。方法萊茵衣藻株系,轉化和生長條件轉化是用萊茵衣藻株系137c(mt+),或者psbA缺陷型株系cc744(REF)進行的。細胞在含有40mM的5-氟脫氧尿苷的TAP培養基(Gorman和Levine,1965)中,在轉速為100rpm的搖床上於23℃,4000勒克斯(高光)的恆定光照中生長到後對數期(大約7天)。經過4000×g,4℃離心5分鐘之後收集到50毫升的細胞。上清被棄掉,細胞在4毫升TAP培養基中重懸,通過已述(Cohen等,1998)的顆粒轟擊方法進行接下來的葉綠體轉化。所有轉化都是在大觀黴素(150μg/ml)選擇下進行的,其中大觀黴素抗性是通過共轉化質粒p228的大觀黴素抗性核糖體基因(ChlamydomonasStockCenter,杜克大學)實現的。為了表達luxCt,萊茵衣藻轉化子的培養是在TAP培養基(Gorman和Levine,1965)中恆定光照於23℃進行的。質粒構建DNA和RNA操作主要是按照Sambrook等(1989)和Cohen等(1998)描述的方法來進行的。luxCt基因的編碼區域是根據Stemmer等(1995)的方法由一個每個長度都是40個核苷酸的引物庫通過從頭合成得到。在這樣的組裝中所使用的引物的5』和3』端分別含有NdeI和XbaI位點。根據製造商的操作手冊,將得到的2094bp的含有luxCt基因的PCR產物克隆到pCR2.1TOPO質粒中(Invitrogen公司),產生質粒pluxCt。atpA的啟動子和5』端非翻譯區以及rbcL的3』端非翻譯區是按照文獻描述(Mayfield等,2002)的方法生成。葉綠體轉化質粒p322按照文獻描述(Franklin等,2002)構建。Southern雜交和northern雜交分析Southern雜交和作為探針使用的DNA的32P標記是按照文獻(Sambrook等,1989;和Cohen等,1998)描述的方法進行的。用於Southern雜交的放射性探針包括luxCt編碼區的2kb的NdeI/XbaI片斷(探測luxCt),和p322的2.0kb的BamHI/XhoI片斷(探測p322的3』端)。0.9kb的EcoRI/XbaIluxCt探針在northern雜交分析中用於檢測luxCtmRNA。在northern雜交分析中使用的其它放射性探針包括rbcLcDNA。Southern雜交和northern雜交是通過配備了Optiquant軟體的PackardCycloneStoragePhosphorSystem檢測的。蛋白表達,蛋白質印跡分析和發光分析質粒pluxAB和pluxCt被轉化到大腸桿菌BL21株系中,細胞在液體培養基中過夜培養。為了進行蛋白質印跡分析,將蛋白從大腸桿菌或者萊茵衣藻中提取分離出來,採用的緩衝液含有750mMTris·Cl,pH8.0,15%蔗糖(wt/vol),100mMBme,1mMPMSF。樣本於13000×g,4℃離心30分鐘,得到的上清用於蛋白質印跡分析。在體外發光分析中所用的萊茵衣藻蛋白是在50mMNa2HPO4,pH7.0,50mMBme,400mM蔗糖的緩衝液中製備,然後粗裂解物於13000×g,4℃離心30分鐘,得到的上清用於發光分析。96孔微量滴定板分析是從細菌螢光素酶方法(Langridge和Szalay,1994)修改得到。萊茵衣藻可溶性蛋白用螢光素酶提取緩衝液稀釋到100微升每個樣本,向其中加入125微升含有500μMNADH的50mMTris-Cl,pH8.0的緩衝液,以及含有0.025U心肌黃酶的50mMNa2HPO4,50mMBme,1%牛血清白蛋白緩衝液。再往上面得到的混合物中加入130微升溶液,其中含有125微升含有100μMFMN的200mM三(羥甲基)甲基甘氨酸,pH7.0溶液和5微升含有超聲10秒鐘的0.1%癸醛的50mMNa2HPO4,pH7.4溶液。以相對光單位(relativelightunits,rlu)為單位的光子測量是在FMN-/癸醛加入5秒鐘後開始的,測量是用配備了CriterionHost軟體的LJLBiosystemsAnalystAD光度計(螢光強度計)進行的。蛋白濃度是用BioRad蛋白分析試劑測定的。蛋白印跡是按照Cohen等(1998)描述的方法,採用兔抗luxAB一抗(REF)和鹼性磷酸酶標記的羊抗兔二抗(Sigma)進行的。克隆發光是通過型號為LB981的BertholdNightOwlCCD相機成像的,相機配備了700nm的發射濾鏡以阻止葉綠體螢光(Chroma公司)。30秒到5分鐘的曝光時間足夠可以在絕大多數情況下顯現螢光素酶的發光。圖像採用WinLight軟體生成。結果從頭合成具有萊茵衣藻葉綠體密碼子偏好性的luxAB基因為了開發出一種監測葉綠體中基因表達的靈敏的報告子,利用經過優化而反映出萊茵衣藻葉綠體中大量表達的基因的密碼子使用的密碼子來合成螢光素酶基因(實施例1;Franklin等,2002)。這種螢光素酶基因,luxCt(圖7),是基於哈維氏弧菌的細菌螢光素酶AB基因設計的(luxAB;Baldwin等,1984)。為了在葉綠體中的表達,luxAB的兩個亞基被連接成一段單個編碼序列,其中通過去除A亞基上的終止密碼子使它在正確的閱讀框架中與B亞基相連,A亞基和B亞基通過一段柔性肽序列生成單個融合蛋白(圖7)。哈維氏弧菌luxAB序列是從GenBank資料庫中獲得的,基於該胺基酸序列設計出一系列寡聚核苷酸,但是改變了密碼子使用以反映出那些在萊茵衣藻葉綠體中高度表達的基因的密碼子使用。所述基因根據Stemmer等(1995)的方法組裝。PCR產物被克隆到大腸桿菌質粒中,合成的基因被測序,一些序列錯誤通過點突變來校正。一個NdeI位點被設計在起始密碼子的地方,而一個XbaI位點則被安放在緊跟著終止密碼子下遊的地方,這是為了接下來的克隆作準備的。得到的基因,luxCt,被克隆到大腸桿菌表達盒中,螢光素酶的表達通過利用CCD相機的發光成像來分析。令人驚奇的是,沒有任何發光在含有luxCt基因的細菌中被檢測到,雖然在轉化了細菌luxAB基因的細菌中可以檢測到高強度的發光(Kondo等,1993)。為了確認是否有突變在克隆到大腸桿菌載體的時候被無意地導入到luxCt基因中,在大腸桿菌表達質粒中含有的luxCt基因和細菌luxAB基因都被測序。與所需的序列相比沒有在luxCt基因中檢測到錯誤,但是在來自用於在細菌中表達luxAB的質粒的luxAB序列(Kondo等,1993)中鑑定到大量與GenBank資料庫中報告的luxAB序列(Acc.No.E12410)的序列差異。來自於數個不同的細菌物種的luxAB蛋白與合成的luxCt蛋白之間的序列比對鑑定出胺基酸序列上的大量差異,但是這些差異中只有一個是在保守胺基酸上。因此,應用位點特異性突變恢復204胺基酸位置上的穀氨酸,以及相鄰的205位置上的亮氨酸。沒有其他的胺基酸序列被改變,因為這些其他的胺基酸中沒有一個是在這一系列被考察的luxAB蛋白中保守的。luxCt融合蛋白基因在細菌中產生功能性的螢光素酶為了確定合成的luxCt基因是否可以產生功能性的螢光素酶,在轉化了含有luxAB或者luxCt基因的表達質粒的大腸桿菌細胞中測量發光。利用來自於表達luxAB基因或者luxCt基因的大腸桿菌細胞的粗裂解物進行蛋白質印跡分析;20微升被用於SDS-PAGE,然後轉移到硝酸纖維素膜上。再用抗luxAB的一抗結合到這些膜上,然後再用偶連了鹼性磷酸酶的抗兔二抗結合,接著蛋白通過鹼性磷酸酶活性染色來顯現。luxAB的alpha(A)和beta(B)亞基被鑑定到,luxCt的單個融合蛋白(FP)被鑑定到。另外,螢光素酶的表達在瓊脂糖培養基上過夜培養並用癸醛蒸氣處理的大腸桿菌中測定。沒有轉化的大腸桿菌細胞或者表達luxAB或luxCt基因的細胞用反射光來拍照(拍照),或者通過利用CCD相機的發光成像來觀測(發光)。當大腸桿菌細胞用癸醛處理並用CCD相機成像的時候,兩個含有螢光素酶的株系都發光,而沒有轉化的大腸桿菌則如期望的一樣沒有光信號。蛋白質印跡分析是用識別原始luxAB蛋白的多克隆抗體來進行的,結果在luxAB株系中顯示有細菌螢光素酶蛋白的A和B亞基的信號,而在luxCt株系中,鑑定到的是對應於所述融合蛋白的單一條帶。在細菌中luxAB的A蛋白和B蛋白積累的水平要高於luxCt的單個融合蛋白,而這些蛋白的發光信號與螢光素酶蛋白的積累呈大致的正比關係,2份luxAB1信號對應於1份luxCt信號。luxCt表達盒的構建和luxCt轉化子的Southern雜交分析證明了luxCt編碼序列產生功能性的螢光素酶之後,用luxCt表達盒轉化萊茵衣藻的葉綠體。為了使螢光素酶在葉綠體中表達,按照圖8所示的表達盒被構建出來。luxCt編碼序列被連接到atpA啟動子和5』端非翻譯區的下遊,rbcL的3』端非翻譯區的上遊(圖8A)。這種嵌合的atpA/luxCt基因然後再被連接到葉綠體轉化載體p322上獨特的BamHI位點處,形成質粒p322-atpA/luxCt(圖8B)。用p322-atpA/luxCt質粒和選擇性標記質粒p228轉化野生型萊茵衣藻細胞,其中質粒p228可以使細胞具有大觀黴素抗性。對初始轉化子用CCD相機進行發光分析,以篩選出luxCt基因的存在,陽性的轉化子通過Southern雜交分析被進一步驗證。轉化子再經過額外的數輪篩選,從中分離出同質細胞系,這樣的細胞系中所有拷貝的葉綠體基因組都含有導入的luxCt基因。兩個同質luxCt轉化子,10.6和11.5,被挑選出來進行進一步分析。圖8顯示的是luxCt構建物,相關的限制性位點被標記出來。質粒p322-atpA/luxCt的8.7kbEco/Xho區域正確地整合到葉綠體基因組中是利用luxCt的NdeI-XbaI片斷,或者質粒p322的BamHI-XhoI片斷來確認的,這些片斷都在圖8中被標記出來。對luxCt的萊茵衣藻葉綠體轉化子進行了Southern雜交分析。萊茵衣藻的DNA製備如實施例4所描述,然後同時用EcoRI和XhoI酶切,再進行Southern雜交分析。濾膜與如圖8B所標示的放射性探針雜交。所述兩個轉化子都含有luxCt雜交條帶,而野生型株系用luxCt編碼區探針雜交的時候沒有信號。在轉基因細胞系中鑑定到兩個條帶,這是因為luxCt基因在其中間位置含有一個EcoRI位點。用來自於p322質粒的BamHI-XhoI片斷進行雜交,在野生型中鑑定到單個條帶,而在兩個轉化子中則鑑定到與之大小不同的條帶,這些都與之前的預測結果吻合。野生型和轉化子細胞系的每個條帶的分子量大小都是所預測的正確大小。這些結果證明所述兩個轉基因株系是同質的。luxCt的mRNA在轉基因株系中的積累應用總RNA的northern雜交分析來確認luxCt基因在轉基因萊茵衣藻葉綠體中的轉錄。分別從野生型和所述兩個轉基因株系中提取的10微克總RNA在變性瓊脂糖凝膠上分離,然後轉移到尼龍膜上。兩份同樣的濾膜用甲基藍染色或者用32P標記的luxCt探針或rbcLcDNA探針雜交。每個株系中積累的rRNA(染色的條帶)和rbcLmRNA的水平都類似,這說明每個泳道上樣的RNA是等量的,而且葉綠體轉錄和mRNA的積累在轉基因細胞系中是正常的。濾膜與luxCt特異性探針的雜交表明兩個轉基因細胞系中都積累了預測大小的luxCtmRNA,而在野生型細胞中則如所期望的一樣沒有觀察到luxCt信號。luxCt蛋白在轉基因萊茵衣藻葉綠體中積累的分析應用蛋白質印跡分析來確認luxCt蛋白是否在轉基因細胞系中積累。來自於野生型和所述兩個轉基因細胞系的20微克可溶性總蛋白(tsp)通過SDS-PAGE分離,然後或者用考馬斯亮蘭染色,或者進行蛋白質印跡分析。經過考馬斯染色的凝膠表明每個泳道中上樣的蛋白量是一樣的,而且轉基因細胞系中積累了一系列與野生型相類似的蛋白。同樣的樣本的蛋白質印跡分析在所述兩個luxCt轉基因泳道中鑑定到對應於所述融合蛋白的單一條帶。在野生型萊茵衣藻泳道,正如期望的一樣沒有觀察到信號。用luxCt作為活細胞中葉綠體基因表達的報告子為了確定luxCt基因作為活體萊茵衣藻細胞中葉綠體基因表達的報告子的實用性,對在瓊脂平板上生長的野生型和轉基因細胞進行了螢光測量。細胞被塗在固體培養基上,維持在連續光照條件下(1000勒克斯)7天。luxAB的底物癸醛被塗到皮氏平板的蓋子上,然後平板放置在CCD相機下面。轉基因細胞系在環境光照下與野生型細胞看起來很相似。經過5分鐘的黑暗適應(adaptation)去除葉綠體螢光之後,用CCD相機成像,結果在所述兩個轉基因細胞系中表現出明亮的發光信號,而對於野生型株系則沒有信號發生。來自於luxCt轉基因細胞系的信號足以在體內條件下顯現出即使是很小的單個克隆。除了轉化luxCt表達盒到野生型(137c)細胞中,所述表達盒還被轉化到psbA缺陷型的萊茵衣藻株系中(cc744,ChlamydomonasGeneticsCenter,http://www.botany.duke.edu/chlamy/)。與前面的情況一樣,初始轉化體通過利用CCD相機進行的發光分析來篩選,陽性轉基因細胞系再經過額外的數輪篩選之後獲得同質細胞系。來自cc744/luxCt株系的發光要遠遠高於137c/luxCt株系。為了確定這種增強的發光是否直接與增加的螢光素酶積累相關,測量了137c和cc744轉基因細胞系中luxCt蛋白的積累和螢光素酶活性。野生型和luxCt轉基因細胞系luxCt137c和luxCtcc744在瓊脂培養板上生長,然後用癸醛處理。細胞或者在反射光下照相(照片,photograph),或者通過CCD相機來顯現(發光,luminescence)。蛋白從細胞中抽提出來,然後進行蛋白質印跡分析(用抗luxAB抗體)或者用光度計分析來定量(光度計)。當細胞在光照下生長在固體TAP培養基上的時候,蛋白質印跡分析揭示,相比於137c細胞系,cc744細胞系中大約有10倍多的luxAB蛋白積累。CCD相機發光分析揭示,cc744細胞系相比於137c細胞系有類似的信號增加。採用光度計進行的螢光素酶活性的定量揭示cc744-luxCt細胞系相比於137c-luxCt細胞系大約有11倍多的螢光素酶活性。這些結果證明luxCt基因是葉綠體基因表達的強勁報告子,而且體內條件下的lux活性測量與通過蛋白質印跡分析和體外發光分析測得的螢光素酶積累相一致。數種異源基因已經被用作葉綠體基因表達的報告子,但是它們的實用性都由於靈敏性差或者無法在體內可視化而受到限制。螢光素酶已經在許多生物中被用作報告基因(Greer和Szalay,2002;Langeridge等,1994;Kondo等,1993;Kay,1993),這是由於螢光素酶高水平的靈敏性以及螢光素酶可以在活體細胞中方便地可視化,而且對於生物體只有很小的影響。本實施例展示了用於葉綠體表達的螢光素酶報告基因的構建,其中合成細菌螢光素酶luxAB的兩個亞基作為單個的融合蛋白,而且通過優化這個合成的螢光素酶基因的密碼子使用而使其反映出在萊茵衣藻葉綠體中高效表達的基因的密碼子使用。本實施例拓展了實施例1的結果,實施例1通過合成具有就葉綠體而被優化的密碼子的gfp證明了密碼子使用極大地影響異源蛋白在萊茵衣藻葉綠體中的表達(Franklin等,2002)。這種cgfp在轉基因的葉綠體中積累到可溶性總蛋白的0.5%,而且可以通過葉綠體抽提物的螢光分析來顯現。然而,即使相對高水平的GFP的積累也不足以在體內看到該報告基因。採用一種線粒體優化的gfp基因,Komine等報導了應用螢光顯微鏡觀察轉基因萊茵衣藻葉綠體中的gfp(Komine等,2002)。儘管如此,對於這種轉基因細胞系,GFP蛋白的積累水平依然是非常低,而且mGFP株系的螢光輸出看上去並不高於沒有轉化的株系的背景螢光。基於葉綠體優化的gfp在促進蛋白積累方面的成功,再加上即使是相對高水平的GFP依然不能夠在體內條件下使之在葉綠體中可視化的事實,用葉綠體優化的密碼子合成了一種螢光素酶基因,從而獲得靈敏的有意義的報告子。這種密碼子被優化的luxCt基因置於萊茵衣藻葉綠體atpA的5』啟動子和UTR以及rbcL的3』UTR的控制之下,該基因的表達說明了luxCt的mRNA和蛋白在轉基因萊茵衣藻葉綠體中的積累。進一步,表達luxCt的轉基因株系積累了足夠量的螢光素酶,使得它可以用CCD相機方便地在體內通過發光分析被可視化。通過蛋白質印跡分析測定的luxCt蛋白積累與通過CCD相機發光分析或者體外光度計分析測定的螢光素酶活性成正比關係。萊茵衣藻被稱為「綠色酵母」,這是一個實至名歸的名稱,這種生物極佳的遺傳特性使得它可以用於揭示大量的細胞過程,最著名的就是鞭毛和光合成裝置的生物發生。然而目前明顯缺乏的就是一種分析基因表達,特別是在葉綠體中的基因表達的方便手段。本結果證明了所述的優化的luxCt基因作為體內條件下葉綠體基因表達的報告子的實用性。本結果還證明了luxCt作為一個靈敏的報告子可以監測甚至在很小的細胞克隆中的基因表達,使得luxCt成為葉綠體基因表達的任何高通量分析可以選擇的報告子。引用文獻下面的每篇文章都在此引入作為參考。Almashanu等,J.Biolumin.Chemilumin.589-97,1990.Bateman和Purton,Mol.GenGenet.263404-410,2000.Baldwin等,Biochemistry233663-7,1984.Carrer等,Mol.Gen.Genet.24149-56,1993.Cohen等,Meth.Enzymol.297,192-208,1998.Franklin等,PlantJ.30733-44,2002.Goldschmidt-Clermont,Nucl.AcidsRes.194083-4089,1991.Greer和Szalay,Luminescence1743-47,2002.Gorman和Levine,Proc.Natl.Acad.Sci.USA541665-1669,1965.Heifetz,Biochemie82655-666,2000.Ishikura等,J.Biosci.Bioeng.87307-314,1999.Johnson等,J.Biol.Chem.2614805-11,1986.Kirchner等,Gene81349-54,1989.Komine等,Proc.Natl.Acad.Sci.USA194085-90,2000.Kondo等,Proc.Natl.Acad.Sci.USA905672-5676,1993.Langridge等,J.Biolumin.Chemilumin.9185-200,1994.Minko等,Mol.Gen.Genet.262421-425,1999.Nakamura等,Nucl.AcidsRes.27292,1999.Olsson等,Gene81335-47,1989.Reed等,PlantJ.27257-265,2001.Sambrook等,MolecularCloningALaboratoryManual(ColdSpringHarborLaboratoryPress1989).Sakamoto等,Proc.Natl.Acad.Sci.USA90497-501,1993.Sidrov等,PlantJ.25209-216,1999.Staub和Maliga,EMBOJ.12601-606,1993.Stemmer等,Gene.16449-53,1995.Svab和Maliga,Proc.Natl.Acad.Sci.USA913-917,1993.Zerges和Rochaix,Mol.Cell.Biol.145268-5277,1994.雖然本發明已經參考上述實施例作了描述,但是需要理解的是,修改或者變化也都包括在本發明的精神和範圍之內。因此,本發明只受權利要求的限制。序列表110斯克裡普斯研究所120多肽在葉綠體中的表達以及用於表達多肽的組合物和方法130CPUSZ42310150US60/375,1291512002-04-23150US60/434,9571512002-12-1916048170PatentInversion3.12101211717212DNA213人工序列220223葉綠體密碼子優化的綠色螢光蛋白4001atggctaaaggtgaagaattattcacaggtgttgtacctattttagtagaattagacggt60gatgtaaacggtcacaaattttcagtttctggtgaaggtgaaggtgacgcaacttatggt120aaattaacacttaaattcatttgtactacaggtaaattaccagtaccttggccaacttta180gttacaacttttacatacggtgtacaatgtttcagtcgttaccctgatcacatgaaacaa240catgactttttcaaatctgctatgccagaaggttatgttcaagaacgtactatttttttc300aaagatgacggtaattataaaacacgtgctgaagtaaaatttgaaggtgatactttagtt360aaccgtattgaattaaaaggtattgacttcaaagaagatggtaatattttaggtcacaaa420cttgaatataactacaattcacataacgtatatattatggcagacaaacaaaaaaatggt480attaaagtaaactttaaaattcgtcataatatcgaggatggttctgtacaattagctgac540cactatcaacaaaacacaccaattggtgatggtcctgttttacttccagacaatcattat600ttaagtactcaatctgctttatcaaaagatcctaacgaaaaacgtgaccacatggtatta660cttgaatttgttacagcagctggtattactcacggtatggatgaattatacaaataa7172102211238212PRT213人工序列220223葉綠體密碼子優化的綠色螢光蛋白4002MetAlaLysGlyGluGluLeuPheThrGlyValValProIleLeuVal151015GluLeuAspGlyAspValAsnGlyHisLysPheSerValSerGlyGlu202530GlyGluGlyAspAlaThrTyrGlyLysLeuThrLeuLysPheIleCys354045ThrThrGlyLysLeuProValProTrpProThrLeuValThrThrPhe505560ThrTyrGlyValGlnCysPheSerArgTyrProAspHisMetLysGln65707580HisAspPhePheLysSerAlaMetProGluGlyTyrValGlnGluArg859095ThrIlePhePheLysAspAspGlyAsnTyrLysThrArgAlaGluVal100105110LysPheGluGlyAspThrLeuValAsnArgIleGluLeuLysGlyIle115120125AspPheLysGluAspGlyAsnIleLeuGlyHisLysLeuGluTyrAsn130135140TyrAsnSerHisAsnValTyrIleMetAlaAsplysGlnLysAsnGly145150155160IleLysValAsnPheLysIleArgHisAsnIleGluAspGlySerVal165170175GlnLeuAlaAspHisTyrGlnGlnAsnThrProIleGlyAspGlyPro180185190ValLeuLeuProAspAsnHisTyrLeuSerThrGlnSerAlaLeuSer195200205LysAspProAsnGluLysArgAspHisMetValLeuLeuGluPheVal210215220ThrAlaAlaGlyIleThrHisGlyMetAspGluLeuTyrLys2252302352103211717212DNA213海洋水母(Aequoreavictoria)4003atgagtaaaggagaagaacttttcactggagttgtcccaattcttgttgaattagatggt60gatgttaatgggcacaaattttctgtcagtggagagggtgaaggtgatgcaacatacgga120aaacttacccttaaatttatttgcactactggaaaactacctgttccatggccaacactt180gtcactactttctcttatggtgttcaatgcttttcaagatacccagatcatatgaaacgg240catgactttttcaagagtgccatgcccgaaggttatgtacaggaaagaactatatttttc300aaagatgacgggaactacaagacacgtgctgaagtcaagtttgaaggtgatacccttgtt360aatagaatcgagttaaaaggtattgattttaaagaagatggaaacattcttggacacaaa420ttggaatacaactataactcacacaatgtatacatcatggcagacaaacaaaagaatgga480atcaaagttaacttcaaaattagacacaacattgaagatggaagcgttcaactagcagac540cattatcaacaaaatactccaattggcgatggccctgtccttttaccagacaaccattac600ctgtccacacaatctgccctttcgaaagatcccaacgaaaagagagaccacatggtcctt660cttgagtttgtaacagctgctgggattacacatggcatggatgaactatacaaataa7172104211544212DNA213萊茵衣藻(Chlamydomonasreinhardtii)4004ggatcccatttttataactggtctcaaaatacctataaacccattgttcttctcttttag60ctctaagaacaatcaatttataaatatatttattattatgctataatataaatactatat120aaatacatttacctttttataaatacatttaccttttttttaatttgcatgattttaatg180cttatgctatcttttttatttagtccataaaacctttaaaggaccttttcttatgggata240tttatattttcctaacaaagcaatcggcgtcataaactttagttgcttacgacgcctgtg300gacgtcccccccttccccttacgggcaagtaaacttagggattttaatgcaataaataaa360tttgtcctcttcgggcaaatgaattttagtatttaaatatgacaagggtgaaccattact420tttgttaacaagtgatcttaccactcactatttttgttgaattttaaacttatttaaaat480tctcgagaaagattttaaaaataaacttttttaatcttttatttattttttcttttttca540tatg5442105211241212DNA213萊茵衣藻(Chlamydomonasreinhardtii)4005ggatccactagtaacggccgccagtgtgctggaattcggcttccgaattcatatacctaa60aggccctttctatgctcgactgataagacaagtacataaatttgctagtttacattattt120tttatttctaaatatataatatatttaaatgtatttaaaatttttcaacaatttttaaat180tatatttccggacagattattttaggatcgtcaaaagaagttacatttatttatacatat240g2412106211468212DNA213萊茵衣藻(Chlamydomonasreinhardtii)4006ggatccctagtaacggccgccagtgtgctggaatttgagtatatgaaattaaatggatat60ttggtacatttaattccacaaaaatgtccaatacttaaaatacaaaattaaaagtattag120ttgtaaacttgactaacattttaaattttaaattttttcctaattatatattttacttgc180aaaatttataaaaattttatgcatttttatatcataataataaaacctttattcatggtt240tataatataataattgtgatgactatgcacaaagcagttctagtcccatatatataacta300tatataacccgtttaaagatttatttaaaaatatgtgtgtaaaaaatgcttatttttaat360tttattttatataagttataatattaaatacacaatgattaaaattaaataataataaat420ttaacgtaacgatgagttgtttttttattttggagatacacgcatatg4682107211373212DNA213萊茵衣藻(Chlamydomonasreinhardtii)4007ggatccgtcgactggtaccgccactgcctgcttcctccttcggagtatgtaaaccccttc60gggcaactaaagtttatcgcagtatataaatataggcagttggcaggcaactgccactga120cgtcctattttaatactccgaaggaggcagttggcaggcaactgccactgacgtcccgta180agggtaaggggacgtccactggcgtcccgtaaggggaaggggacgtaggtacataaatgt240gctaggtaactaacgtttgattttttgtggtataatatatgtaccatgcttttaatagaa300gcttgaatttataaattaaaatatttttacaatattttacgagaaattaaaactttaaaa360aaattaacatatg3732108211223212DNA213萊茵衣藻(Chlamydomonasreinhardtii)4008ggatccgttggcaggcaacaaatttatttattgtcccgtaaggggaagggggaaacaatt60attattttactgcggagcagcttgttattgaagttttattaaaaaaaaaataaaaatttg120acaaaaaaaataaaaaagttaaattaaaaacactgggaatgttctacatcataaaaatca180aaagggtttaaaatcccgacaaaatttaaactttaaacatatg2232109211397212DNA213萊茵衣藻(Chlamydomonasreinhardtii)4009tctagacttagcttcaactaactctagctcaaacaactaatttttttttaaactaaaata60aatctggttaaccatacctggtttattttagtttagtttatacacacttttcatatatat120atacttaatagctaccataggcagttggcaggacgtccccttacgggacaaatgtattta180ttgttgcctgccaactgcctaatataaatattagtggacgtccccttccccttacgggca240agtaaacttagggattttaatgctccgttaggaggcaaataaattttagtggcagttgcc300tcgcctatcggctaacaagttccttcggagtatataaatatcctgccaactgccgatatt360tatatactaggcagtggcggtaccactcgacggatcc39721010211434212DNA213萊茵衣藻(Chlamydomonasreinhardtii)40010ctagagtcgacctgcaggcatgcaagcttgtactcaagctcggaacgaaggtcgtgcctt60gctcggaaggtggcgacgtaattcgttcagcttgtaaatggtctcccagaacttgctgct120gcatgtgaagtttggaaagaaattaaattcgaatttgatactattgacaaactttaattt180ttatttttcatgatgtttatgtgaatagcataaacatcgtttttatttttatggtgttta240ggttaaatacctaaacatcattttacatttttaaaattaagttctaaagttatcttttgt300ttaaatttgcctgtctttataaattacgatgtgccagaaaaataaaatcttagcttttta360ttatagaatttatctttatgtattatattttataagttataataaaagaaatagtaacat420acgtcgacggatcc43421011211411212DNA213萊茵衣藻(Chlamydomonasreinhardtii)40011tctagattttaattaagtaggaactcggtatatgctcttttggggtcttattagctagta60ttagttaactaacaaaagatcaatattttagtttgttttatatattttattacttaagta120gtaaggatttgcatttagcaatcttaaatacttaagtaataatctataaataaaatatat180tttcgctttaaaacttataaaaattatttgctcgttataagcctaaaaaaacgtaggatc240tctacgagatattacattgtttttttctttaattggctttaatattactttgtatatata300aaccaaagtacttgttaatagttattaaattatattaactatacagtacaaagaaatttt360ttgctaaaaaaagtatgttaacattaaaaatttttgtttatacagggatcc41121012211266212DNA213萊茵衣藻(Chlamydomonasreinhardtii)40012tctagattataatacattaaaattgtaacgcctttacaagacagtataaaatgggaatta60attaattaggagggtcactttcagccactcgttttttaaataggtaagtaacctttttaa120gagaacgtaagagattgtggattacgttctcaagagacataactcaaaatactagtaggt180ttgagcttgacttcaagctttaacctccgtcagcgataaaacctattttgagcgcatttt240aatatatttgggacgccagtggatcc26621013211792212DNA213人工序列220223葉綠體密碼子優化的特異性地針對破傷風毒素的抗體220221CDS222(1)..(789)22340013atgctcgagcagtctggggctgaggtgaagaagcctgggtcctcggtg48MetLeuGluGlnSerGlyAlaGluValLysLysProGlySerSerVal151015aaggtctcctgcagggcttctggaggcaccttcaacaattatgccatc96LysValSerCysArgAlaSerGlyGlyThrPheAsnAsnTyrAlaIle202530agctgggtgcgacaggcccctggacaagggcttgagtggatgggaggg144SerTrpValArgGlnAlaProGlyGlnGlyLeuGluTrpMetGlyGly354045atcttccctttccgtaatacagcaaagtacgcacaacacttccagggc192IlePheProPheArgAsnThrAlaLysTyrAlaGlnHisPheGlnGly505560agggtcaccattaccgcggacgaatccacgggcacagcctacatggag240ArgValThrIleThrAlaAspGluSerThrGlyThrAlaTyrMetGlu65707580ctgagcagcctgagatctgaggacacggccatatattattgtgcgaga288LeuSerSerLeuArgSerGluAspThrAlaIleTyrTyrCysAlaArg859095ggggatacgatttttggagtgaccatgggatactacgctatggacgtc336GlyAspThrIlePheGlyValThrMetGlyTyrTyrAlaMetAspVal100105110tggggccaagggaccaccgtcaccgtctcctctggtggcggtggctcg384TrpGlyGlnGlyThrThrValThrValSerSerGlyGlyGlyGlySer115120125ggcggtggtgggtcgggtggcggcggatctgagctcgttctcacgcag432GlyGlyGlyGlySerGlyGlyGlyGlySerGluLeuValLeuThrGln130135140tctccaggcaccctgtctttgtctccaggggaaagagccaccctctcc480SerProGlyThrLeuSerLeuSerProGlyGluArgAlaThrLeuSer145150155160tgcagggccagtcacagtgttagcagggcctacttagcctggtaccag528CysArgAlaSerHisSerValSerArgAlaTyrLeuAlaTrpTyrGln165170175cagaaacctggccaggctcccaggctcctcatctatggtacatccagc576GlnLysProGlyGlnAlaProArgLeuLeuIleTyrGlyThrSerSer180185190agggccactggcatcccagacaggttcagtggcagtgggtctgggaca624ArgAlaThrGlyIleProAspArgPheSerGlySerGlySerGlyThr195200205gacttcactctcaccatcagcagactggagcctgaagattttgcagtg672AspPheThrLeuThrIleSerArgLeuGluProGluAspPheAlaVal210215220tactactgtcagcagtatggtggctcaccgtggttcggccaagggacc720TyrTyrCysGlnGlnTyrGlyGlySerProTrpPheGlyGlnGlyThr225230235240aaggtggaactcaaacgaactagtggccaggccggccagtacccgtac768LysValGluLeuLysArgThrSerGlyGlnAlaGlyGlnTyrProTyr245250255gacgttccggactacgcttcttaa792AspValProAspTyrAlaSer26021014211263212PRT213人工序列220223葉綠體密碼子優化的特異性地針對破傷風毒素的抗體40014MetLeuGluGlnSerGlyAlaGluValLysLysProGlySerSerVal151015LysValSerCysArgAlaSerGlyGlyThrPheAsnAsnTyrAlaIle202530SerTrpValArgGlnAlaProGlyGlnGlyLeuGluTrpMetGlyGly354045IlePheProPheArgAsnThrAlaLysTyrAlaGlnHisPheGlnGly505560ArgValThrIleThrAlaAspGluSerThrGlyThrAlaTyrMetGlu65707580LeuSerSerLeuArgSerGluAspThrAlaIleTyrTyrCysAlaArg859095GlyAspThrIlePheGlyValThrMetGlyTyrTyrAlaMetAspVal100105110TrpGlyGlnGlyThrThrValThrValSerSerGlyGlyGlyGlySer115120125GlyGlyGlyGlySerGlyGlyGlyGlySerGluLeuValLeuThrGln130135140SerProGlyThrLeuSerLeuSerProGlyGluArgAlaThrLeuSer145150155160CysArgAlaSerHisSerValSerArgAlaTyrLeuAlaTrpTyrGln165170175GlnLysProGlyGlnAlaProArgLeuLeuIleTyrGlyThrSerSer180185190ArgAlaThrGlyIleProAspArgPheSerGlySerGlySerGlyThr195200205AspPheThrLeuThrIleSerArgLeuGluProGluAspPheAlaVal210215220TyrTyrCysGlnGlnTyrGlyGlySerProTrpPheGlyGlnGlyThr225230235240LysValGluLeuLysArgThrSerGlyGlnAlaGlyGlnTyrProTyr245250255AspValProAspTyrAlaSer260210152111926212DNA213人工序列220223葉綠體密碼子優化的特異性地針對單純皰疹病毒的抗體220221CDS222(1)..(1917)22340015catatggctgctcaccaccaccaccaccacgttgctcaagctgcttca48HisMetAlaAlaHisHisHisHisHisHisValAlaGlnAlaAlaSer151015tcagaattaacgcaatcaccaggtaccttatcattatcaccaggtgaa96SerGluLeuThrGlnSerProGlyThrLeuSerLeuSerProGlyGlu202530cgtgctaccttatcatgtcgtgcttcacaatcagtttcatcagcttac144ArgAlaThrLeuSerCysArgAlaSerGlnSerValSerSerAlaTyr354045ttagcttggtaccaacaaaaaccaggtcaagctccacgtttattaatt192LeuAlaTrpTyrGlnGlnLysProGlyGlnAlaProArgLeuLeuIle505560tacggtgcttcatcacgtgctactggtattccagatcgtttctcaggt240TyrGlyAlaSerSerArgAlaThrGlyIleProAspArgPheSerGly65707580tcaggttcaggtacagatttcactttaaccatttcacgtttagaacca288SerGlySerGlyThrAspPheThrLeuThrIleSerArgLeuGluPro859095gaagatttcgctgtttactactgtcaacaatacggtcgttcaccaact336GluAspPheAlaValTyrTyrCysGlnGlnTyrGlyArgSerProThr100105110ttcggtggtggtaccaaagttgaaattaaacgtacttcatcaggtggt384PheGlyGlyGlyThrLysValGluIleLysArgThrSerSerGlyGly115120125ggtggttcaggtggtggtggtggtggttcatcacgttcatcattagaa432GlyGlySerGlyGlyGlyGlyGlyGlySerSerArgSerSerLeuGlu130135140caatcaggtgctgaagttaaaaaaccaggttcatcagttaaagtttca480GlnSerGlyAlaGluValLysLysProGlySerSerValLysValSer145150155160tgtaaagcttcaggtggttcattctcatcatacgctattaactgggtt528CysLysAlaSerGlyGlySerPhegerSerTyrAlaIleAsnTrpVal165170175cgtcaagctcaaggtcaaggtttagaatggatgggtggtttaatgcca576ArgGlnAlaGlnGlyGlnGlyLeuGluTrpMetGlyGlyLeuMetPro180185190attttcggtacaacaaactacgctcaaaaattccaagatcgtttaacg624IlePheGlyThrThrAsnTyrAlaGlnLysPheGlnAspArgLeuThr195200205attaccgctgatgtttcaacgtcaacagcttacatgcaattatcaggt672IleThrAlaAspValSerThrSerThrAlaTyrMetGlnLeuSerGly210215220ttaacatacgaagatacggctatgtactactgtgctcgtgttgcttac720LeuThrTyrGluAspThrAlaMetTyrTyrCysAlaArgValAlaTyr225230235240atgttagaaccaaccgttactgctggtggtttagatgtttggggtaaa768MetLeuGluProThrValThrAlaGlyGlyLeuAspValTrpGlyLys245250255ggtaccacggttaccgtttcaccagcttcaccaacctcaccaaaagtt816GlyThrThrValThrValSerProAlaSerProThrSerProLysVal260265270ttcccattatcattatgttcaacccaaccagatggtaacgttgttatt864PheProLeuSerLeuCysSerThrGlnProAspGlyAsnValValIle275280285gcttgtttagttcaaggtttcttcccacaagaaccattatcagttacc912AlaCysLeuValGlnGlyPhePheProGlnGluProLeuSerValThr290295300tggtcagaatcaggtcaaggtgttaccgctcgtaacttcccaccatca960TrpSerGluSerGlyGlnGlyValThrAlaArgAsnPheProProSer305310315320caagatgcttcaggtgatttatacaccacgtcatcacaattaacctta1008GlnAspAlaSerGlyAspLeuTyrThrThrSerSerGlnLeuThrLeu325330335ccagctacacaatgtttagctggtaaatcagttacatgtcacgttaaa1056ProAlaThrGlnCysLeuAlaGlyLysSerValThrCysHisValLys340345350cactacacgaacccatcacaagatgttactgttccatgtccagttcca1104HisTyrThrAsnProSerGlnAspValThrValProCysProValPro355360365tcaactccaccaaccccatcaccatcaactccaccaaccccatcacca1152SerThrProProThrProSerProSerThrProProThrProSerPro370375380tcatgttgtcacccacgtttatcattacaccgtccagctttagaagat1200SerCysCysHisProArgLeuSerLeuHisArgProAlaLeuGluAsp385390395400ttattattaggttcagaagctaacttaacgtgtacattaaccggttta1248LeuLeuLeuGlySerGluAlaAsnLeuThrCysThrLeuThrGlyLeu405410415cgtgatgcttcaggtgttaccttcacctggacgccatcatcaggtaaa1296ArgAspAlaSerGlyValThrPheThrTrpThrProSerSerGlyLys420425430tcagctgttcaaggtccaccagaacgtgatttatgtggttgttactca1344SerAlaValGlnGlyProProGluArgAspLeuCysGlyCysTyrSer435440445gtttcatcagttttaccaggttgtgctgaaccatggaaccacggtaaa1392ValSerSerValLeuProGlyCysAlaGluProTrpAsnHisGlyLys450455460accttcacttgtactgctgcttacccagaatcaaaaaccccattaacc1440ThrPheThrCysThrAlaAlaTyrProGluSerLysThrProLeuThr465470475480gctaccttatcaaaatcaggtaacacattccgtccagaagttcactta1488AlaThrLeuSerLysSerGlyAsnThrPheArgProGluValHisLeu485490495ttaccaccaccatcagaagaattagctttaaacgaattagttacgtta1536LeuProProProSerGluGluLeuAlaLeuAsnGluLeuValThrLeu500505510acgtgtttagctcgtggtttctcaccaaaagatgttttagttcgttgg1584ThrCysLeuAlaArgGlyPheSerProLysAspValLeuValArgTrp515520525ttacaaggttcacaagaattaccacgtgaaaaatacttaacttgggct1632LeuGlnGlySerGlnGluLeuProArgGluLysTyrLeuThrTrpAla530535540tcacgtcaagaaccatcacaaggtaccaccaccttcgctgttacctca1680SerArgGlnGluProSerGlnGlyThrThrThrPheAlaValThrSer545550555560attttacgtgttgctgctgaagattggaaaaaaggtgataccttctca1728IleLeuArgValAlaAlaGluAspTrpLysLysGlyAspThrPheSer565570575tgtatggttggtcacgaagctttaccattagctttcacacaaaaaacc1776CysMetValGlyHisGluAlaLeuProLeuAlaPheThrGlnLysThr580585590attgatcgtttagctggtaaaccaacccacgttaacgtttcagttgtt1824IleAspArgLeuAlaGlyLysProThrHisValAsnValSerValVal595600605atggctgaagttgatggtacctgttacgattataaagatcacgatggt1872MetAlaGluValAspGlyThrCysTyrAspTyrLysAspHisAspGly610615620gattacaaagatcacgatattgattataaagatgatgatgataaa1917AspTyrLysAspHisAspIleAspTyrLysAspAspAspAspLys625630635taatctaga192621016211639212PRT213人工序列220223葉綠體密碼子優化的特異性地針對單純皰疹病毒的抗體40016HisMetAlaAlaHisHisHisHisHisHisValAlaGlnAlaAlaSer151015SerGluLeuThrGlnSerProGlyThrLeuSerLeuSerProGlyGlu202530ArgAlaThrLeuSerCysArgAlaSerGlnSerValSerSerAlaTyr354045LeuAlaTrpTyrGlnGlnLysProGlyGlnAlaProArgLeuLeuIle505560TyrGlyAlaSerSerArgAlaThrGlyIleProAspArgPheSerGly65707580SerGlySerGlyThrAspPheThrLeuThrIleSerArgLeuGluPro859095GluAspPheAlaValTyrTyrCysGlnGlnTyrGlyArgSerProThr100105110PheGlyGlyGlyThrLysValGluIleLysArgThrSerSerGlyGly115120125GlyGlySerGlyGlyGlyGlyGlyGlySerSerArgSerSerLeuGlu130135140GlnSerGlyAlaGluValLysLysProGlySerSerValLysValSer145150155160CysLysAlaSerGlyGlySerPheSerSerTyrAlaIleAsnTrpVal165170175ArgGlnAlaGlnGlyGlnGlyLeuGluTrpMetGlyGlyLeuMetPro180185190IlePheGlyThrThrAsnTyrAlaGlnLysPheGlnAspArgLeuThr195200205IleThrAlaAspValSerThrSerThrAlaTyrMetGlnLeuSerGly210215220LeuThrTyrGluAspThrAlaMetTyrTyrCysAlaArgValAlaTyr225230235240MetLeuGluProThrValThrAlaGlyGlyLeuAspValTrpGlyLys245250255GlyThrThrValThrValSerProAlaSerProThrSerProLysVal260265270PheProLeuSerLeuCysSerThrGlnProAspGlyAsnValValIle275280285AlaCysLeuValGlnGlyPhePheProGlnGluProLeuSerValThr290295300TrpSerGluSerGlyGlnGlyValThrAlaArgAsnPheProProSer305310315320GlnAspAlaSerGlyAspLeuTyrThrThrSerSerGlnLeuThrLeu325330335ProAlaThrGlnCysLeuAlaGlyLysSerValThrCysHisValLys340345350HisTyrThrAsnProSerGlnAspValThrValProCysProValPro355360365SerThrProProThrProSerProSerThrProProThrProSerPro370375380SerCysCysHisProArgLeuSerLeuHisArgProAlaLeuGluAsp385390395400LeuLeuLeuGlySerGluAlaAsnLeuThrCysThrLeuThrGlyLeu405410415ArgAspAlaSerGlyValThrPheThrTrpThrProSerSerGlyLys420425430SerAlaValGlnGlyProProGluArgAspLeuCysGlyCysTyrSer435440445ValSerSerValLeuProGlyCysAlaGluProTrpAsnHisGlyLys450455460ThrPheThrCysThrAlaAlaTyrProGluSerLysThrProLeuThr465470475480AlaThrLeuSerLysSerGlyAsnThrPheArgProGluValHisLeu485490495LeuProProProSerGluGluLeuAlaLeuAsnGluLeuValThrLeu500505510ThrCysLeuAlaArgGlyPheSerProLysAspValLeuValArgTrp515520525LeuGlnGlySerGlnGluLeuProArgGluLysTyrLeuThrTrpAla530535540SerArgGlnGluProSerGlnGlyThrThrThrPheAlaValThrSer545550555560IleLeuArgValAlaAlaGluAspTrpLysLysGlyAspThrPheSer565570575CysMetValGlyHisGluAlaLeuProLeuAlaPheThrGlnLysThr580585590IleAspArgLeuAlaGlyLysProThrHisValAsnValSerValVal595600605MetAlaGluValAspGlyThrCysTyrAspTyrLysAspHisAspGly610615620AspTyrLysAspHisAspIleAspTyrLysAspAspAspAspLys6256306352101721122212DNA213人工序列220223擴增引物40017catatgagtaaaggagaagaac222101821125212DNA213人工序列220223擴增引物40018tctagattatttgtatagttcatcc252101921118212DNA213人工序列220223擴增引物40019tctagagtcgacctgcag182102021117212DNA213人工序列220223擴增引物40020ggatccgtcgacgtatg172102121131212DNA213人工序列220223擴增引物40021gaattcatatacctaaaggccctttctatgc312102221125212DNA213人工序列220223擴增引物40022catatgtataaataaatgtaacttc252102321157212DNA213人工序列220223擴增引物40023gaagcttgaatttataaattaaaatatttttacaatattttacccagaaattaaaac572102421144212DNA213人工序列220223擴增引物40024tgtcatatgttaatttttttaaagtttttctccgtaaaatattg442102521140212DNA213人工序列220223擴增引物40025tgtcatatgttaatttttttaaagtctccgtaaaatattg402102621136212DNA213人工序列220223擴增引物40026tgtcatatgttaattttttttctccgtaaaatattg362102721120212DNA213人工序列220223擴增引物40027gtcatatgttaatttctccg202102821138212DNA213人工序列220223擴增引物40028tgtcatatgttaatcctcctaaagttttaatttctccg382102921110212RNA213萊茵衣藻(Chlamydomonasreinhardtii)40029caccuccuuc10210302112000212DNA213萊茵衣藻(Chlamydomonasreinhardtii)220221CDS222(497)..(1552)22340030cgtcatagtatatcaatattgtaacagattgacaccctttaagtaaacattttttttgag60tcatatggagtcatatgaaattaaatggatatttggtacatttaattccacaaaaatgtc120caatacttaaaatacaaaattaaaagtattagttgtaaacttgactaacattttaaattt180taaattttttcctaattatatattttacttgcaaaatttataaaaattttatgcattttt240atatcataataataaaacctttattcatggtttataatataataattgtgatgactatgc300acaaagcagttctagtcccatatatataactatatataacccgtttaaagatttatttaa360aaatatgtgtgtaaaaaatgcttatttttaattttattttatataagttataatattaaa420tacacaatgattaaaattaaataataataaatttaacgtaacgatgagttgtttttttat480tttggagatacacgcaatgacaattgcgatcggtacatatcaagagaaacgc532MetThrIleAlaIleGlyThrTyrGlnGluLysArg1510acatggttcgatgacgctgatgactggcttcgtcaagaccgtttcgta580ThrTrpPheAspAspAlaAspAspTrpLeuArgGlnAspArgPheVal152025ttcgtaggttggtcaggtttattactattcccttgtgcttactttgca628PheValGlyTrpSerGlyLeuLeuLeuPheProCysAlaTyrPheAla303540ttaggtggttggttaactggtactactttcgttacttcatggtatacg676LeuGlyGlyTrpLeuThrGlyThrThrPheValThrSerTrpTyrThr45505560catggtttagctacttcttacttagaaggttgtaacttcttaacagca724HisGlyLeuAlaThrSerTyrLeuGluGlyCysAsnPheLeuThrAla657075gctgtttctacacctgctaacagtatggctcactctcttctatttgtt772AlaValSerThrProAlaAsnSerMetAlaHisSerLeuLeuPheVal808590tggggtccagaagctcaaggtgatttcactcgttggtgtcaacttggt820TrpGlyProGluAlaGlnGlyAspPheThrArgTrpCysGlnLeuGly95100105ggtttatgggcattcgttgctttacacggtgcatttggtttaattggt868GlyLeuTrpAlaPheValAlaLeuHisGlyAlaPheGlyLeuIleGly110115120ttcatgcttcgtcagtttgaaattgctcgttcagtaaacttacgtcca916PheMetLeuArgGlnPheGluIleAlaArgSerValAsnLeuArgPro125130135140tacaacgcaattgctttctcagcaccaattgctgtattcgtttcagta964TyrAsnAlaIleAlaPheSerAlaProIleAlaValPheValSerVal145150155ttcctaatttacccattaggtcaatcaggttggttctttgcacctagt1012PheLeuIleTyrProLeuGlyGlnSerGlyTrpPhePheAlaProSer160165170ttcggtgtagctgctatcttccgtttcattttattcttccaaggtttc1060PheGlyValAlaAlaIlePheArgPheIleLeuPhePheGlnGlyPhe175180185cacaactggacacttaacccattccacatgatgggtgttgctggtgtt1108HisAsnTrpThrLeuAsnProPheHisMetMetGlyValAlaGlyVal190195200ttaggtgctgctttattatgtgctattcacggtgctactgttgaaaac1156LeuGlyAlaAlaLeuLeuCysAlaIleHisGlyAlaThrValGluAsn205210215220acattattcgaagacggtgacggtgctaacacattccgtgcattcaac1204ThrLeuPheGluAspGlyAspGlyAlaAsnThrPheArgAlaPheAsn225230235cctacacaggctgaagaaacatactctatggttactgctaaccgtttc1252ProThrGlnAlaGluGluThrTyrSerMetValThrAlaAsnArgPhe240245250tggtcacaaatcttcggtgttgctttctctaacaaacgttggcttcac1300TrpSerGlnIlePheGlyValAlaPheSerAsnLysArgTrpLeuHis255260265ttcttcatgttattagttccagtaactggtctttggatgagtgctatt1348PhePheMetLeuLeuValProValThrGlyLeuTrpMetSerAlaIle270275280ggtgttgtaggtttagctctaaacttacgtgcttacgacttcgtatca1396GlyValValGlyLeuAlaLeuAsnLeuArgAlaTyrAspPheValSer285290295300caagagattcgtgctgctgaagaccctgaattcgaaacattctacact1444GlnGluIleArgAlaAlaGluAspProGluPheGluThrPheTyrThr305310315aaaaacattcttcttaacgaaggtattcgtgcttggatggctgctcaa1492LysAsnIleLeuLeuAsnGluGlyIleArgAlaTrpMetAlaAlaGln320325330gaccaaccacacgaacgtttagtattccctgaagaagtattaccacgt1540AspGlnProHisGluArgLeuValPheProGluGluValLeuProArg335340345ggtaacgctctataatatatttttatataaattaccaatactaattagtatt1592GlyAsnAlaLeu350ggtaatttatattactttattatttaaaagaaaatgcccctttggggctaaaaatcacat1652gagtgcttgagccgtatgcgaaaaaactcgcatgtacggttctttaggaggatttaaaat1712attaaaaaataaaaaaacaaatcctacctgactaaaccaggacatttttcacgtactctg1772tcaaaaggtccaaacacaacaacttggatttggaaccttcacgcagatgctcatgacttt1832gacagtcatacaagtgatctagaagaaatttctagaaaagtattcagtgcacactttggt1892caattaggtatcattttcatttggttaagtgggtgcgacacgaagacgtatatattttta1952tagtttaaaaagatacttttacactgtagttgaaaagtataagcactt200021031211352212PRT213萊茵衣藻(Chlamydomonasreinhardtii)40031MetThrIleAlaIleGlyThrTyrGlnGluLysArgThrTrpPheAsp151015AspAlaAspAspTrpLeuArgGlnAspArgPheValPheValGlyTrp202530SerGlyLeuLeuLeuPheProCysAlaTyrPheAlaLeuGlyGlyTrp354045LeuThrGlyThrThrPheValThrSerTrpTyrThrHisGlyLeuAla505560ThrSerTyrLeuGluGlyCysAsnPheLeuThrAlaAlaValSerThr65707580ProAlaAsnSerMetAlaHisSerLeuLeuPheValTrpGlyProGlu859095AlaGlnGlyAspPheThrArgTrpCysGlnLeuGlyGlyLeuTrpAla100105110PheValAlaLeuHisGlyAlaPheGlyLeuIleGlyPheMetLeuArg115120125GlnPheGluIleAlaArgSerValAsnLeuArgProTyrAsnAlaIle130135140AlaPheSerAlaProIleAlaValPheValSerValPheLeuIleTyr145150155160ProLeuGlyGlnSerGlyTrpPhePheAlaProSerPheGlyValAla165170175AlaIlePheArgPheIleLeuPhePheGlnGlyPheHisAsnTrpThr180185190LeuAsnProPheHisMetMetGlyValAlaGlyValLeuGlyAlaAla195200205LeuLeuCysAlaIleHisGlyAlaThrValGluAsnThrLeuPheGlu210215220AspGlyAspGlyAlaAsnThrPheArgAlaPheAsnProThrGlnAla225230235240GluGluThrTyrSerMetValThrAlaAsnArgPheTrpSerGlnIle245250255PheGlyValAlaPheSerAsnLysArgTrpLeuHisPhePheMetLeu260265270LeuValProValThrGlyLeuTrpMetSerAlaIleGlyValValGly275280285LeuAlaLeuAsnLeuArgAlaTyrAspPheValSerGlnGluIleArg290295300AlaAlaGluAspProGluPheGluThrPheTyrThrLysAsnIleLeu305310315320LeuAsnGluGlyIleArgAlaTrpMetAlaAlaGlnAspGlnProHis325330335GluArgLeuValPheProGluGluValLeuProArgGlyAsnAlaLeu3403453502103221145212RNA213萊茵衣藻(Chlamydomonasreinhardtii)40032caauauuuuacggagaaauuaaaacuuuaaaaaaauuaacauaug452103321113212RNA213萊茵衣藻(Chlamydomonasreinhardtii)40033gcucaccuccuuc132103421138212RNA213萊茵衣藻(Chlamydomonasreinhardtii)40034uuacggagaaauuaaaacuuuaaaaaaauuaacauaug382103521134212RNA213人工序列220223SEQIDNO32的突變序列40035uuacaaauuaaaacuuuaaaaaaauuaacauaug342103621138212RNA213人工序列220223SEQIDNO32的突變序列40036uuacccagaaauuaaaacuuuaaaaaaauuaacauaug382103721134212RNA213人工序列220223SEQIDNO32的突變序列40037uuacggagaaaaacuuuaaaaaaauuaacauaug342103821130212RNA213人工序列220223SEQIDNO32的突變序列40038uuacggagacuuuaaaaaaauuaacauaug302103921126212RNA213人工序列220223SEQIDNO32的突變序列40039uuacggagaaaaaaaauuaacauaug262104021122212RNA213人工序列220223SEQIDNO32的突變序列40040uuacggagaaauuaaacauaug222104121138212RNA213人工序列220223SEQIDNO32的突變序列40041uuacggagaaauuaaaacuuuaggaggauuaacauaug3821042211840212DNA213人類(homosapiens)40042catatggttgctcaagctgcttcatcagaattaacgcaatcaccaggtaccttatcatta60tcaccaggtgaacgtgctaccttatcatgtcgtgcttcacaatcagtttcatcagcttac120ttagcttggtaccaacaaaaaccaggtcaagctccacgtttattaatttacggtgcttca180tcacgtgctactggtattccagatcgtttctcaggttcaggttcaggtacagatttcact240ttaaccatttcacgtttagaaccagaagatttcgctgtttactactgtcaacaatacggt300cgttcaccaactttcggtggtggtaccaaagttgaaattaaacgtacttcatcaggtggt360ggtggttcaggtggtggtggtggtggttcatcacgttcatcattagaacaatcaggtgct420gaagttaaaaaaccaggttcatcagttaaagtttcatgtaaagcttcaggtggttcattc480tcatcatacgctattaactgggttcgtcaagctcaaggtcaaggtttagaatggatgggt540ggtttaatgccaattttcggtacaacaaactacgctcaaaaattccaagatcgtttaacg600attaccgctgatgtttcaacgtcaacagcttacatgcaattatcaggtttaacatacgaa660gatacggctatgtactactgtgctcgtgttgcttacatgttagaaccaaccgttactgct720ggtggtttagatgtttggggtaaaggtaccacggttaccgtttcagattataaagatcac780gatggtgattacaaagatcacgatattgattataaagatgatgatgataaataatctaga84021043211277212PRT213人類(homosapiens)40043HisMetValAlaGlnAlaAlaSerSerGluLeuThrGlnSerProGly151015ThrLeuSerLeuSerProGlyGluArgAlaThrLeuSerCysArgAla202530SerGlnSerValSerSerAlaTyrLeuAlaTrpTyrGlnGlnLysPro354045GlyGlnAlaProArgLeuLeuIleTyrGlyAlaSerSerArgAlaThr505560GlyIleProAspArgPheSerGlySerGlySerGlyThrAspPheThr65707580LeuThrIleSerArgLeuGluProGluAspPheAlaValTyrTyrCys859095GlnGlnTyrGlyArgSerProThrPheGlyGlyGlyThrLysValGlu100105110IleLysArgThrSerSerGlyGlyGlyGlySerGlyGlyGlyGlyGly115120125GlySerSerArgSerSerLeuGluGlnSerGlyAlaGluValLysLys130135140ProGlySerSerValLysValSerCysLysAlaSerGlyGlySerPhe145150155160SerSerTyrAlaIleAsnTrpValArgGlnAlaGlnGlyGlnGlyLeu165170175GluTrpMetGlyGlyLeuMetProIlePheGlyThrThrAsnTyrAla180185190GlnLysPheGlnAspArgLeuThrIleThrAlaAspValSerThrSer195200205ThrAlaTyrMetGlnLeuSerGlyLeuThrTyrGluAspThrAlaMet210215220TyrTyrCysAlaArgValAlaTyrMetLeuGluProThrValThrAla225230235240GlyGlyLeuAspValTrpGlyLysGlyThrThrValThrValSerAsp245250255TyrLysAspHisAspGlyAspTyrLysAspHisAspIleAspTyrLys260265270AspAspAspAspLys27521044211681212PRT213哈維氏弧菌(Vibrioharveyi)40044MetLysPheGlyAsnPheLeuLeuThrTyrGlnProProGluLeuSer151015GlnThrGluValMetLysArgLeuValAsnLeuGlyLysAlaSerGlu202530GlyCysGlyPheAspThrValTrpLeuLeuGluHisHisPheThrGlu354045PheGlyLeuLeuGlyAsnProTyrValAlaAlaAlaHisLeuLeuGly505560ThrThrGluThrLeuAsnValGlyThrAlaAlaIleValLeuProThr65707580AlaHisProValArgGlnAlaGluAspValAsnLeuLeuAspGlnMet859095SerLysGlyArgPheArgPheGlyIleCysArgGlyLeuTyrAspLys100105110AspPheArgValPheGlyThrAspMetAspAsnSerArgAlaLeuMet115120125AspCysTrpTyrAspLeuMetLysGluGlyPheAsnGluGlyTyrIle130135140AlaAlaAspAsnGluHisIleLysPheProLysIleGlnLeuAsnPro145150155160SerAlaTyrThrGlnGlyGlyAlaProValTyrValValAlaGluSer165170175AlaSerThrThrGluTrpAlaAlaGluArgGlyLeuProMetIleLeu180185190SerTrpIleIleAsnThrHisGluLysLysAlaGlnLeuAspLeuTyr195200205AsnGluValAlaThrGluHisGlyTyrAspValThrLysIleAspHis210215220CysLeuSerTyrIleThrSerValAspHisAspSerAsnArgAlaLys225230235240AspIleCysArgAsnPheLeuGlyHisTrpTyrAspSerTyrValAsn245250255AlaThrLysIlePheAspAspSerAspGlnThrLysGlyTyrAspPhe260265270AsnLysGlyGlnTrpArgAspPheValLeuLysGlyHisLysAspThr275280285AsnArgArgIleAspTyrSerTyrGluIleAsnProValGlyThrPro290295300GluGluCysIleAlaIleIleGlnGlnAspIleAspAlaThrGlyIle305310315320AspAsnIleCysCysGlyPheGluAlaAsnGlySerGluGluGluIle325330335IleAlaSerMetLysLeuPheGlnSerAspValMetProTyrLeuLys340345350GluLysGlnGlxMetLysPheGlyLeuPhePheLeuAsnPheMetAsn355360365SerLysArgSerSerAspGlnValIleGluGluIleLeuAspThrAla370375380HisTyrValAspGlnLeuLysPheAspThrLeuAlaValTyrGluAsn385390395400HisPheSerAsnAsnGlyValValGlyAlaProLeuThrValAlaGly405410415PheLeuLeuGlyMetThrLysAsnAlaLysValAlaSerLeuAsnHis420425430ValIleThrThrHisHisProValArgValAlaGluGluAlaCysLeu435440445LeuAspGlnMetSerGluGlyArgPheAlaPheGlyPheSerAspCys450455460GluLysSerAlaAspMetArgPhePheAsnArgProThrAspSerGln465470475480PheGlnLeuPheSerGluCysHisLysIleIleAsnAspAlaPheThr485490495ThrGlyTyrCysHisProAsnAsnAspPheTyrSerPheProLysIle500505510SerValAsnProHisAlaPheThrGluGlyGlyProAlaGlnPheVal515520525AsnAlaThrSerLysGluValValGluTrpAlaAlaLysLeuGlyLeu530535540ProLeuValPheArgTrpAspAspSerAsnAlaGlnArgLysGluTyr545550555560AlaGlyLeuTyrHisGluValAlaGlnAlaHisGlyValAspValSer565570575GlnValArgHisLysLeuThrLeuLeuValAsnGlnAsnValAspGly580585590GluAlaAlaArgAlaGluAlaArgValTyrLeuGluGluPheValArg595600605GluSerTyrSerAsnThrAspPheGluGlnLysMetGlyGluLeuLeu610615620SerGluAsnAlaIleGlyThrTyrGluGluSerThrGlnAlaAlaArg625630635640ValAlaIleGluCysCysGlyAlaAlaAspLeuLeuMetSerPheGlu645650655SerMetGluAspLysAlaGlnGlnArgAlaValIleAspValValAsn660665670AlaAsnIleValLysTyrHisSerGlx675680210452112094212DNA213人工序列220223使用葉綠體偏好的密碼子的luxAB基因40045catatgaaatttggtaacttccttttaacttatcaaccacctgaactatctcaaacagaa60gttatgaaacgtttagttaatttaggtaaagcttctgaaggttgtggtttcgacacagtt120tggttattagaacatcactttactgaatttggtttattaggtaacccttatgttgctgct180gcacatctattaggtgctacagaaaaattaaatgttggtactgctgctattgtattacct240actgctcaccctgttcgtcaagcagaagacgtaaatttattagatcaaatgtcaaaagga300cgttttcgttttggtatttgtcgtggtttatacgacaaagatttccgtgtttttggtaca360gacatggataatagtcgtgctttaatggactgttggtatgacttaatgaaagaaggtttt420aacgaaggttatattgctgcagataatgaacatattaaattccctaaaattcaattaaat480ccatcagcttacacacaaggtggtgctcctgtttatgttgttgctgaatcagcatcaaca540acagaatgggctgctgaacgtggtttaccaatgattctaagttggattattaatactcac600gaaaaaaaagcacaacttgatctttataatgaagttgctactgaacacggttacgatgta660actaaaattgaccattgtttatcttatattacttcagttgatcacgattcaaacaaagct720aaagatatttgtcgtaattttttaggtcattggtatgactcatacgtaaatgctacaaaa780atttttgatgactctgatcaaacaaaaggttatgactttaataaaggtcaatggcgtgat840tttgttttaaaaggtcacaaagatactaaccgtcgtattgattatagttacgaaattaat900ccagtaggtacacctgaagaatgtatcgcaattattcaacaagatatcgatgctacaggt960attaataatatttgttgtggttttgaagctaacggttctgaagaagaaattatcgcttct1020atgaaattatttcaatctgatgtaatgccatatcttaaagaaaaacaatctggtggtgga1080ggttcttcaggtggtggaggcggtggttcttcaatgaaatttggattatttttccttaat1140tttatgaattcaaaacgttcttctgatcaagttattgaagaaatgttagatactgcacat1200tatgtagatcaattaaaatttgacacattagctgtttacgaaaatcacttttcaaacaat1260ggtgtagttggtgctccattaacagtagctggttttttacttggtatgacaaaaaacgct1320aaagtagcttcattaaatcatgttattactacacaccatccagtacgtgtagctgaagaa1380gcatgtttacttgatcaaatgagtgaaggtcgttttgtttttggttttagtgattgtgaa1440aaaagtgctgatatgcgtttttttaatcgtccaacagattctcaatttcaattattcagt1500gaatgtcacaaaattatcaatgatgcatttactactggttattgtcatccaaataatgat1560ttttacagttttcctaaaatttctgttaacccacacgcttatactgaaggtggtcctgca1620caatttgtaaatgctacaagtaaagaagtagttgaatgggcagctaaattaggtcttcca1680cttgtatttaaatgggacgattcaaatgctcaacgtaaagaatatgctggtttataccat1740gaagttgctcaagcacacggtgttgatgttagtcaagttcgtcataaattaacactatta1800gttaatcaaaacgtagatggtgaagcagctcgtgcagaagctcgtgtttatttagaagaa1860tttgttcgtgaatcttatcctaatactgacttcgaacaaaaaatggtagaattattatca1920gaaaacgctattggtacttacgaagaaagtactcaagcagctcgtgttgcaattgaatgt1980tgtggtgctgcagacttattaatgtcttttgaatcaatggaagataaagctcacgaacgt2040gcagttattgatgtagtaaatgctaacattgttaaatatcattcataatctaga209421046211698212PRT213人工序列220223LuxAB融合蛋白40046HisMetLysPheGlyAsnPheLeuLeuThrTyrGlnProProGluLeu151015SerGlnThrGluValMetLysArgLeuValAsnLeuGlyLysAlaSer202530GluGlyCysGlyPheAspThrValTrpLeuLeuGluHisHisPheThr354045GluPheGlyLeuLeuGlyAsnProTyrValAlaAlaAlaHisLeuLeu505560GlyAlaThrGluLysLeuAsnValGlyThrAlaAlaIleValLeuPro65707580ThrAlaHisProValArgGlnAlaGluAspValAsnLeuLeuAspGln859095MetSerLysGlyArgPheArgPheGlyIleCysArgGlyLeuTyrAsp100105110LysAspPheArgValPheGlyThrAspMetAspAsnSerArgAlaLeu115120125MetAspCysTrpTyrAspLeuMetLysGluGlyPheAsnGluGlyTyr130135140IleAlaAlaAspAsnGluHisIleLysPheProLysIleGlnLeuAsn145150155160ProSerAlaTyrThrGlnGlyGlyAlaProValTyrValValAlaGlu165170175SerAlaSerThrThrGluTrpAlaAlaGluArgGlyLeuProMetIle180185190LeuSerTrpIleIleAsnThrHisGluLysLysAlaGlnLeuAspLeu195200205TyrAsnGluValAlaThrGluHisGlyTyrAspValThrLysIleAsp210215220HisCysLeuSerTyrIleThrSerValAspHisAspSerAsnLysAla225230235240LysAspIleCysArgAsnPheLeuGlyHisTrpTyrAspSerTyrVal245250255AsnAlaThrLysIlePheAspAspSerAspGlnThrLysGlyTyrAsp260265270PheAsnLysGlyGlnTrpArgAspPheValLeuLysGlyHisLysAsp275280285ThrAsnArgArgIleAspTyrSerTyrGluIleAsnProValGlyThr290295300ProGluGluCysIleAlaIleIleGlnGlnAspIleAspAlaThrGly305310315320IleAsnAsnIleCysCysGlyPheGluAlaAsnGlySerGluGluGlu325330335IleIleAlaSerMetLysLeuPheGlnSerAspValMetProTyrLeu340345350LysGluLysGlnSerGlyGlyGlyGlySerSerGlyGlyGlyGlyGly355360365GlySerSerMetLysPheGlyLeuPhePheLeuAsnPheMetAsnSer370375380LysArgSerSerAspGlnValIleGluGluMetLeuAspThrAlaHis385390395400TyrValAspGlnLeuLysPheAspThrLeuAlaValTyrGluAsnHis405410415PheSerAsnAsnGlyValValGlyAlaProLeuThrValAlaGlyPhe420425430LeuLeuGlyMetThrLysAsnAlaLysValAlaSerLeuAsnHisVal435440445IleThrThrHisHisProValArgValAlaGluGluAlaCysLeuLeu450455460AspGlnMetSerGluGlyArgPheValPheGlyPheSerAspCysGlu465470475480LysSerAlaAspMetArgPhePheAsnArgProThrAspSerGlnPhe485490495GlnLeuPheSerGluCysHisLysIleIleAsnAspAlaPheThrThr500505510GlyTyrCysHisProAsnAsnAspPheTyrSerPheProLysIleSer515520525ValAsnProHisAlaTyrThrGluGlyGlyProAlaGlnPheValAsn530535540AlaThrSerLysGluValValGluTrpAlaAlaLysLeuGlyLeuPro545550555560LeuValPheLysTrpAspAspSerAsnAlaGlnArgLysGluTyrAla565570575GlyLeuTyrHisGluValAlaGlnAlaHisGlyValAspValSerGln580585590ValArgHisLysLeuThrLeuLeuValAsnGlnAsnValAspGlyGlu595600605AlaAlaArgAlaGluAlaArgValTyrLeuGluGluPheValArgGlu610615620SerTyrProAsnThrAspPheGluGlnLysMetValGluLeuLeuSer625630635640GluAsnAlaIleGlyThrTyrGluGluSerThrGlnAlaAlaArgVal645650655AlaIleGluCysCysGlyAlaAlaAspLeuLeuMetSerPheGluSer660665670MetGluAspLysAlaHisGluArgAlaValIleAspValValAsnAla675680685AsnIleValLysTyrHisSerGlxSerArg690695210472111893212DNA213人工序列220223單鏈抗體40047atggttgctcaagctgcttcatcagaattaacgcaatcaccaggtaccttatcattatca60ccaggtgaacgtgctaccttatcatgtcgtgcttcacaatcagtttcatcagcttactta120gcttggtaccaacaaaaaccaggtcaagctccacgtttattaatttacggtgcttcatca180cgtgctactggtattccagatcgtttctcaggttcaggttcaggtacagatttcacttta240accatttcacgtttagaaccagaagatttcgctgtttactactgtcaacaatacggtcgt300tcaccaactttcggtggtggtaccaaagttgaaattaaacgtacttcatcaggtggtggt360ggttcaggtggtggtggtggtggttcatcacgttcatcattagaacaatcaggtgctgaa420gttaaaaaaccaggttcatcagttaaagtttcatgtaaagcttcaggtggttcattctca480tcatacgctattaactgggttcgtcaagctcaaggtcaaggtttagaatggatgggtggt540ttaatgccaattttcggtacaacaaactacgctcaaaaattccaagatcgtttaacgatt600accgctgatgtttcaacgtcaacagcttacatgcaattatcaggtttaacatacgaagat660acggctatgtactactgtgctcgtgttgcttacatgttagaaccaaccgttactgctggt720ggtttagatgtttggggtaaaggtaccacggttaccgtttcaccagcttcaccaacctca780ccaaaagttttcccattatcattatgttcaacccaaccagatggtaacgttgttattgct840tgtttagttcaaggtttcttcccacaagaaccattatcagttacctggtcagaatcaggt900caaggtgttaccgctcgtaacttcccaccatcacaagatgcttcaggtgatttatacacc960acgtcatcacaattaaccttaccagctacacaatgtttagctggtaaatcagttacatgt1020cacgttaaacactacacgaacccatcacaagatgttactgttccatgtccagttccatca1080actccaccaaccccatcaccatcaactccaccaaccccatcaccatcatgttgtcaccca1140cgtttatcattacaccgtccagctttagaagatttattattaggttcagaagctaactta1200acgtgtacattaaccggtttacgtgatgcttcaggtgttaccttcacctggacgccatca1260tcaggtaaatcagctgttcaaggtccaccagaacgtgatttatgtggttgttactcagtt1320tcatcagttttaccaggttgtgctgaaccatggaaccacggtaaaaccttcacttgtact1380gctgcttacccagaatcaaaaaccccattaaccgctaccttatcaaaatcaggtaacaca1440ttccgtccagaagttcacttattaccaccaccatcagaagaattagctttaaacgaatta1500gttacgttaacgtgtttagctcgtggtttctcaccaaaagatgttttagttcgttggtta1560caaggttcacaagaattaccacgtgaaaaatacttaacttgggcttcacgtcaagaacca1620tcacaaggtaccaccaccttcgctgttacctcaattttacgtgttgctgctgaagattgg1680aaaaaaggtgataccttctcatgtatggttggtcacgaagctttaccattagctttcaca1740caaaaaaccattgatcgtttagctggtaaaccaacccacgttaacgtttcagttgttatg1800gctgaagttgatggtacctgttacgattataaagatcacgatggtgattacaaagatcac1860gatattgattataaagatgatgatgataaataa189321048211630212PRT213人工序列220223單鏈抗體40048MetValAlaGlnAlaAlaSerSerGluLeuThrGlnSerProGlyThr151015LeuSerLeuSerProGlyGluArgAlaThrLeuSerCysArgAlaSer202530GlnSerValSerSerAlaTyrLeuAlaTrpTyrGlnGlnLysProGly354045GlnAlaProArgLeuLeuIleTyrGlyAlaSerSerArgAlaThrGly505560IleProAspArgPheSerGlySerGlySerGlyThrAspPheThrLeu65707580ThrIleSerArgLeuGluProGluAspPheAlaValTyrTyrCysGln859095GlnTyrGlyArgSerProThrPheGlyGlyGlyThrLysValGluIle100105110LysArgThrSerSerGlyGlyGlyGlySerGlyGlyGlyGlyGlyGly115120125SerSerArgSerSerLeuGluGlnSerGlyAlaGluValLysLysPro130135140GlySerSerValLysValSerCysLysAlaSerGlyGlySerPheSer145150155160SerTyrAlaIleAsnTrpValArgGlnAlaGlnGlyGlnGlyLeuGlu165170175TrpMetGlyGlyLeuMetProIlePheGlyThrThrAsnTyrAlaGln180185190LysPheGlnAspArgLeuThrIleThrAlaAspValSerThrSerThr195200205AlaTyrMetGlnLeuSerGlyLeuThrTyrGluAspThrAlaMetTyr210215220TyrCysAlaArgValAlaTyrMetLeuGluProThrValThrAlaGly225230235240GlyLeuAspValTrpGlyLysGlyThrThrValThrValSerProAla245250255SerProThrSerProLysValPheProLeuSerLeuCysSerThrGln260265270ProAspGlyAsnValValIleAlaCysLeuValGlnGlyPhePhePro275280285GlnGluProLeuSerValThrTrpSerGluSerGlyGlnGlyValThr290295300AlaArgAsnPheProProSerGlnAspAlaSerGlyAspLeuTyrThr305310315320ThrSerSerGlnLeuThrLeuProAlaThrGlnCysLeuAlaGlyLys325330335SerValThrCysHisValLysHisTyrThrAsnProSerGlnAspVal340345350ThrValProCysProValProSerThrProProThrProSerProSer355360365ThrProProThrProSerProSerCysCysHisProArgLeuSerLeu370375380HisArgProAlaLeuGluAspLeuLeuLeuGlySerGluAlaAsnLeu385390395400ThrCysThrLeuThrGlyLeuArgAspAlaSerGlyValThrPheThr405410415TrpThrProSerSerGlyLysSerAlaValGlnGlyProProGluArg420425430AspLeuCysGlyCysTyrSerValSerSerValLeuProGlyCysAla435440445GluProTrpAsnHisGlyLysThrPheThrCysThrAlaAlaTyrPro450455460GluSerLysThrProLeuThrAlaThrLeuSerLysSerGlyAsnThr465470475480PheArgProGluValHisLeuLeuProProProSerGluGluLeuAla485490495LeuAsnGluLeuValThrLeuThrCysLeuAlaArgGlyPheSerPro500505510LysAspValLeuValArgTrpLeuGlnGlySerGlnGluLeuProArg515520525GluLysTyrLeuThrTrpAlaSerArgGlnGluProSerGlnGlyThr530535540ThrThrPheAlaValThrSerIleLeuArgValAlaAlaGluAspTrp545550555560LysLysGlyAspThrPheSerCysMetValGlyHisGluAlaLeuPro565570575LeuAlaPheThrGlnLysThrIleAspArgLeuAlaGlyLysProThr580585590HisValAsnValSerValValMetAlaGluValAspGlyThrCysTyr595600605AspTyrLysAspHisAspGlyAspTyrLysAspHisAspIleAspTyr610615620LysAspAspAspAspLys625630權利要求1.一種在質體中生產多肽的方法,所述方法包括向質體導入第一重組核酸分子,其中第一重組核酸分子包含第一多聚核苷酸,其編碼至少一種多肽,與之有效連接的第二多聚核苷酸,其包括編碼第一核糖體結合序列(RBS)的第一核苷酸序列,以及與之有效連接的編碼第二RBS的第二核苷酸序列,其中第一RBS可以指導多肽在原核生物中的翻譯,第二RBS可以指導多肽在質體中的翻譯,在允許所述的至少一種多肽表達的條件下,從而在質體中生產所述多肽。2.權利要求1的方法,其中第一多聚核苷酸編碼一種第一多肽和至少一種第二多肽。3.權利要求2的方法,其中所述的第一多肽和至少第二多肽構成融合蛋白。4.權利要求3的方法,其中融合蛋白包括單鏈抗體。5.權利要求4的方法,其中第一多聚核苷酸包括SEQIDNO13或者編碼SEQIDNO14的核苷酸序列。6.權利要求1的方法,其中質體是葉綠體。7.權利要求6的方法,其中第一多聚核苷酸的密碼子被傾向於表現出葉綠體的密碼子使用。8.權利要求7的方法,其中第一多聚核苷酸編碼報告蛋白或者其突變體或變異體。9.權利要求8的方法,其中報告蛋白是一種綠色螢光蛋白。10.權利要求9的方法,其中第一多聚核苷酸包括SEQIDNO15,編碼SEQIDNO1的核苷酸序列或者編碼SEQIDNO2的核苷酸序列。11.權利要求7的方法,其中第一多聚核苷酸序列編碼一種第一多肽和至少一種第二多肽。12.權利要求11的方法,其中所述第一多肽和至少第二多肽構成融合蛋白。13.權利要求11的方法,其起所述第一多肽和第二多肽包括蛋白複合物的亞基。14.權利要求13的方法,其中蛋白複合物是異源二聚體。15.權利要求13的方法,其中蛋白複合物包括報告蛋白。16.權利要求15的方法,其中報告蛋白包括螢光素酶或者其突變體或變異體。17.權利要求16的方法,其中螢光素酶包括細菌luxAB基因的產物。18.權利要求17的方法,其中第一多聚核苷酸包括SEQIDNO45或者編碼SEQIDNO46的核苷酸序列。19.權利要求11的方法,其中第一多肽包括免疫球蛋白的重鏈或者其可變區,第二多肽包括免疫球蛋白的輕鏈或者其可變區。20.權利要求19的方法,其中第一多肽和第二多肽構成融合蛋白,由此可以生產出單鏈抗體。21.權利要求20的方法,其中第一多聚核苷酸包括SEQIDNO15;編碼SEQIDNO16的核苷酸序列;SEQIDNO42;編碼SEQIDNO43的核苷酸序列;SEQIDNO47;或者編碼SEQIDNO48的核苷酸序列。22.權利要求1的方法,進一步包括向質體中導入至少一種第二重組核酸分子。23.權利要求22的方法,其中質體是葉綠體。24.權利要求23的方法,其中第二重組核酸分子包括第一多聚核苷酸和與之有效連接的第二多聚核苷酸,第一多聚核苷酸編碼至少一種多肽,第二多聚核苷酸包括有效連接的編碼第一核糖體結合序列(RBS)的第一核苷酸序列和編碼第二RBS的第二核苷酸序列,其中第一RBS可以指導所述多肽在原核生物中的翻譯,第二RBS可以指導所述多肽在葉綠體中的翻譯。25.權利要求24的方法,其中第一重組核酸分子和第二重組核酸分子在葉綠體中共表達。26.權利要求1的方法,其中第一重組核酸分子被包含在載體中。27.權利要求26的方法,其中質體是葉綠體。28.權利要求27的方法,其中載體是一種葉綠體載體,這種載體含有葉綠體基因組脫氧核糖核酸(DNA)的一段核苷酸序列,它可以與葉綠體基因組DNA發生同源重組。29.權利要求28的方法,其中載體進一步包括原核生物的複製原點。30.權利要求1的方法,進一步包括從質體中分離出多肽。31.根據權利要求30的方法獲得的分離的多肽。32.權利要求31的分離的多肽,包括SEQIDNO2,SEQIDNO16,SEQIDNO43,SEQIDNO46,或者SEQIDNO48。33.一種分離出的核糖核苷酸序列,包括第一核糖體結合序列(RBS)和與之有效連接的第二RBS,其中第一RBS和第二RBS被大約5到25個核苷酸分隔開來。34.權利要求33的這種核糖核苷酸序列,其中第一RBS和第二RBS被大約10到20個核苷酸分隔開來。35.權利要求33的這種核糖核苷酸序列,其中第一RBS和第二RBS被大約15個核苷酸分隔開來。36.權利要求33的這種核糖核苷酸序列,其中第一RBS和第二RBS中的每一個都是獨立地由3到9個核苷酸組成。37.權利要求33的這種核糖核苷酸序列,其中第一RBS和第二RBS中的每一個都是獨立地由4到7個核苷酸組成。38.權利要求33的核糖核苷酸序列,其中第一RBS或者第二RBS或者二者都含有GGAG。39.權利要求33的核糖核苷酸序列,其中第二RBS進一步包括一種葉綠體基因的5』端非翻譯區(5』UTR)。40.權利要求39的核糖核苷酸序列,其中5』UTR由SEQIDNO4到8中的任意一個所列的核苷酸序列編碼。41.權利要求39的核糖核苷酸序列,其中葉綠體基因編碼可溶性蛋白。42.權利要求33的核糖核苷酸序列,其與起始AUG密碼子有效連接。43.權利要求42的核糖核苷酸序列,其中起始AUG密碼子進一步包含Kozak序列。44.權利要求43的核糖核苷酸序列,其中進一步包含Kozak序列的起始AUG密碼子是ACCAUGG。45.權利要求33的核糖核苷酸序列,它與編碼多肽的多聚核苷酸有效連接。46.權利要求45的核糖核苷酸序列,其中多聚核苷酸包括起始AUG密碼子。47.權利要求33的核糖核苷酸序列,其由大約11到50個核糖核苷酸組成。48.權利要求33的核糖核苷酸序列,其由大約15到40個核糖核苷酸組成。49.權利要求33的核糖核苷酸序列,其由大約20到30個核糖核苷酸組成。50.權利要求33的核糖核苷酸,進一步包括有效連接的編碼一種多肽的多聚核苷酸,由此第一RBS可以指導所述多肽在原核生物中的翻譯,第二RBS可以指導所述多肽在葉綠體中的翻譯。51.編碼權利要求33中的核糖核苷酸序列的多聚核苷酸。52.權利要求51的多聚核苷酸,其包括有效連接到編碼第一RBS和第二RBS的核苷酸序列上的起始ATG密碼子。53.權利要求51的多聚核苷酸,其包括克隆位點,所述位點的定位使得可表達的多聚核苷酸與第一RBS和第二RBS可以有效連接。54.權利要求53的多聚核苷酸,其中克隆位點包括至少一個限制性內切酶識別位點,或者至少一個重組酶識別位點,或者二者的組合。55.權利要求51的多聚核苷酸,其兩側分別有第一克隆位點和第二克隆位點。56.權利要求55的多聚核苷酸,其中第一克隆位點和第二克隆位點是不同的。57.權利要求51的多聚核苷酸,其與可表達的多聚核苷酸有效連接。58.權利要求57的多聚核苷酸,其中可表達的多聚核苷酸編碼至少第一多肽。59.權利要求58的多聚核苷酸,其中可表達的多聚核苷酸編碼第一多肽和至少一種第二多肽。60.權利要求59的多聚核苷酸,其中可表達的多聚核苷酸編碼第一多肽和一種第二多肽。61.權利要求60的多聚核苷酸,其中第一多肽和第二多肽是不同的。62.權利要求60的多聚核苷酸,其中第一多肽和第二多肽構成融合蛋白。63.權利要求62的多聚核苷酸,其中可表達的多聚核苷酸包括在SEQIDNO13,SEQIDNO15,SEQIDNO42,SEQIDNO45,或者SEQIDNO47中所列的核苷酸序列。64.權利要求60的多聚核苷酸,進一步包括編碼內在核糖體進入位點的核苷酸序列,它有效連接於第一多肽的編碼序列和第二多肽的編碼序列之間。65.權利要求51的多聚核苷酸,其是雙鏈分子。66.權利要求65的多聚核苷酸,它包括編碼第二RBS的核苷酸序列,編碼第一RBS的核苷酸序列,和起始ATG密碼子,這些序列以5』到3』的方向有效連接;或者是與所述多聚核苷酸互補的核苷酸序列。67.權利要求66的多聚核苷酸,進一步包括定位在起始ATG密碼子的3』端的至少一個克隆位點。68.權利要求65的多聚核苷酸,它包括編碼第二RBS的核苷酸序列,編碼第一RBS的核苷酸序列,和定位在編碼第一RBS的核苷酸序列3』端大約3到10個核苷酸位置的至少一個克隆位點,這些序列以5』到3』的方向連接;或者與所述多聚核苷酸互補的核苷酸序列。69.權利要求65的多聚核苷酸,其在每一側有至少一個克隆位點。70.載體,包含權利要求51的多聚核苷酸和葉綠體基因組脫氧核糖核酸(DNA)的一段核苷酸序列,其中所述核苷酸序列可以與葉綠體基因組DNA之間發生同源重組。71.權利要求70的載體,進一步包括克隆位點,所述位點的定位允許至少一種異源多聚核苷酸與第一RBS和第二RBS有效連接。72.權利要求70的載體,進一步包括原核生物的複製原點。73.權利要求72的載體,其中複製原點是大腸桿菌的複製原點。74.權利要求70的載體,其中葉綠體基因組DNA的核苷酸序列包含第一末端和第二末端。75.權利要求74的載體,其中第一末端或第二末端或者二者都包括至少一個克隆位點,或者其剪切產物。76.權利要求70的載體,其是環化的分子。77.權利要求70的載體,進一步包括與第一RBS和第二RBS有效連接的起始ATG密碼子。78.權利要求77的載體,進一步包括克隆位點,其定位允許至少一種異源多聚核苷酸與ATG密碼子有效連接。79.權利要求72的載體,進一步包括與第一RBS和第二RBS有效連接的可表達的多聚核苷酸。80.權利要求79的載體,其中可表達的多聚核苷酸包括SEQIDNO1,編碼SEQIDNO2的核苷酸序列,SEQIDNO45,編碼SEQIDNO46的核苷酸序列,或者其組合。81.細胞,含有權利要求51中的多聚核苷酸。82.權利要求81的細胞,其是一種植物細胞。83.權利要求82的植物細胞,其中所述多聚核苷酸是在葉綠體中。84.權利要求83的植物細胞,其中所述多聚核苷酸與可表達的多聚核苷酸有效連接。85.權利要求83的植物細胞,其中可表達的多聚核苷酸編碼至少第一多肽。86.權利要求85的植物細胞,其中可表達的多聚核苷酸編碼第一多肽和至少一種第二多肽。87.權利要求85的植物細胞,其中可表達的多聚核苷酸編碼第一多肽和一種第二多肽。88.權利要求87的植物細胞,其中第一多肽和第二多肽是不同的。89.權利要求87的植物細胞,其中第一多肽和第二多肽構成融合蛋白。90.權利要求84的植物細胞,其中可表達的多聚核苷酸包括SEQIDNO13,SEQIDNO15,SEQIDNO43,SEQIDNO45,SEQIDNO47或者其組合所表示的核苷酸序列。91.轉基因植物,包含權利要求83中的植物細胞。92.由權利要求81的轉基因植物獲得的植物細胞或者組織。93.權利要求92的轉基因植物的一個插接部分。94.權利要求92的轉基因植物產生的種子。95.由權利要求91的轉基因植物,或者由來自於所述轉基因植物的植物細胞或者植物組織製備出的cDNA或者葉綠體基因組DNA文庫。96.權利要求91的轉基因植物,其中所述植物是屬於藻類。97.權利要求91的轉基因植物,其中所述植物是被子植物。98.權利要求97的轉基因植物,其中所述被子植物是穀類植物,豆類植物,含油種子植物,或者硬木樹。99.權利要求91的轉基因植物,其中所述植物是觀賞類植物。100.組合物,包括從權利要求91的轉基因植物中獲得的植物材料。101.權利要求100的組合物,其中葉綠體中的多聚核苷酸與可表達的多聚核苷酸有效連接。102.權利要求101的組合物,其中可表達的多聚核苷酸被傾向於葉綠體的密碼子使用。103.權利要求101的組合物,其中可表達的多聚核苷酸編碼抗體,或者其抗原結合片斷。104.權利要求103的組合物,其是以一種適於施用給個體的形式存在。105.權利要求104的組合物,其中所述個體是哺乳動物。106.權利要求104的組合物,其中所述個體是人。107.葉綠體/原核生物穿梭載體,葉綠體基因組DNA的一段核苷酸序列,它可以與葉綠體基因組DNA發生同源重組;原核生物原點;和與第二RBS有效連接的第一核糖體結合序列(RBS),其中第一RBS可以指導有效連接的可表達的多聚核苷酸在葉綠體中的翻譯,第二RBS可以指導有效連接的可表達的多聚核苷酸在原核生物中的翻譯。108.權利要求107的穿梭載體,進一步包含克隆位點,其中所述克隆位點的定位使得異源多聚核苷酸可以插入到載體中,並與第一RBS和第二RBS有效連接。109.權利要求107的穿梭載體,進一步包含有效連接的可表達的多聚核苷酸。110.權利要求109的穿梭載體,其中可表達的多聚核苷酸包含具有葉綠體密碼子偏向的多聚核苷酸。111.編碼一種蛋白或者其突變體或變異體的分離出的多聚核苷酸,其中所述多聚核苷酸的密碼子被傾向於表現出葉綠體的密碼子使用。112.權利要求111的多聚核苷酸,它包括脫氧核糖核苷酸序列。113.權利要求111的多聚核苷酸,其中所述密碼子被傾向於在第三個核苷酸位置含有腺嘌呤或者胸腺嘧啶。114.權利要求111的多聚核苷酸,其兩側分別有第一克隆位點和第二克隆位點。115.權利要求111的多聚核苷酸,其中所述蛋白包括融合蛋白。116.權利要求111的多聚核苷酸,其中所述蛋白是報告蛋白。117.權利要求116的多聚核苷酸,其中報告蛋白是綠色螢光蛋白或者螢光素酶。118.權利要求117的多聚核苷酸,包括SEQIDNO1,編碼SEQIDNO2的核苷酸序列,SEQIDNO45,或者編碼SEQIDNO46的核苷酸序列。119.權利要求111的多聚核苷酸,其中所述蛋白包括抗體或者抗體的抗原結合片斷。120.權利要求119的多聚核苷酸,包括SEQIDNO15,編碼SEQIDNO16的核苷酸序列,SEQIDNO42,編碼SEQIDNO43的核苷酸序列,SEQIDNO47,編碼SEQIDNO48的核苷酸序列。121.權利要求111的多聚核苷酸,其與編碼第一核糖體結合序列(RBS)和第二RBS的多聚核苷酸有效連接,其中第一RBS和第二RBS被大約5到25個核苷酸分隔開,其中第一RBS指導螢光蛋白在原核生物中的翻譯,第二RBS指導螢光蛋白在葉綠體中的翻譯。122.由權利要求111的多聚核苷酸編碼的多肽。123.重組核酸分子,包括編碼至少一種多肽的第一多聚核苷酸,其中第一多聚核苷酸的密碼子被傾向於表現出葉綠體的密碼子使用;和第二多聚核苷酸,其包含編碼第一核糖體結合序列(RBS)的核苷酸序列和有效連接的編碼第二RBS的核苷酸序列,其中第一RBS可以指導所述多肽在原核生物中的翻譯,第二RBS可以指導所述多肽在葉綠體中的翻譯。124.權利要求123的重組核酸分子,其中第一多聚核苷酸包含編碼第一多肽的第一核苷酸序列,該序列接著有與之有效連接的編碼第二多肽的第二核苷酸序列。125.權利要求124的重組核酸分子,其中編碼內在核糖體進入位點的核苷酸序列有效連接到編碼第二多肽的第二核苷酸序列上。126.權利要求123的重組核酸分子,進一步包括與第一多聚核苷酸和第二多聚核苷酸有效連接的第三多聚核苷酸。127.權利要求126的重組核酸分子,其中第三多聚核苷酸編碼至少一種多肽。128.一種製備葉綠體/原核生物穿梭表達載體的方法,所述方法包括向足以與葉綠體基因組DNA發生同源重組的一段葉綠體基因組脫氧核糖核酸(DNA)的核苷酸序列導入包含有原核生物複製原點的核苷酸序列,編碼第一核糖體結合序列(RBS)的核苷酸序列,和編碼第二RBS的核苷酸序列,其中第一RBS和第二RBS被大約5到25個核苷酸分隔開,以及克隆位點,其中所述克隆位點的定位允許編碼多肽的多聚核苷酸有效連接到第一RBS和第二RBS上,由此第一RBS可以指導多肽在原核生物中的翻譯,第二RBS可以指導多肽在葉綠體中的翻譯。129.通過權利要求128的方法製備出來的葉綠體/原核生物穿梭表達載體。130.一種製備葉綠體/原核生物穿梭表達載體的方法,所述方法包括對足以與葉綠體基因組DNA發生同源重組的一段葉綠體基因組脫氧核糖核酸(DNA)的核苷酸序列進行遺傳學修飾,以使之含有原核生物複製原點,編碼第一核糖體結合序列(RBS)的核苷酸序列,和編碼第二RBS的核苷酸序列,第一RBS和第二RBS被大約5到25個核苷酸分隔開,以及克隆位點,其中所述克隆位點的定位允許編碼多肽的多聚核苷酸有效連接到第一RBS和第二RBS上,由此第一RBS可以指導多肽在原核生物中的翻譯,第二RBS可以指導多肽在葉綠體中的翻譯。131.通過權利要求130的方法製備出來的葉綠體/原核生物穿梭表達載體。132.重組多聚核苷酸,包括編碼葉綠體核糖體結合序列(RBS)的第一核苷酸序列,以及與之有效連接的編碼多肽的第二核苷酸序列,其中第一核苷酸序列與第二核苷酸序列是相對異源的。133.權利要求132的重組多聚核苷酸,其中葉綠體RBS定位在起始ATG密碼子5』端20到40個核苷酸的位置,起始密碼子與編碼多肽的核苷酸序列有效連接。134.權利要求132的重組多聚核苷酸,其中第一核苷酸序列包括定位在RBS的3』端大約20到40個核苷酸位置的ATG密碼子。135.載體,其包含編碼定位在克隆位點5』端大約20到40個核苷酸位置的核糖體結合序列(RBS)的核苷酸序列。136.權利要求135的載體,其中克隆位點包括至少一個限制性內切酶識別位點或者至少一個重組酶識別位點,或者其組合。137.權利要求135的載體,其中克隆位點包括多克隆位點,所述多克隆位點由多個限制性內切酶識別位點或者多個重組酶識別位點組成,或者由至少一個限制性內切酶識別位點和至少一個重組酶識別位點的組合組成。138.權利要求134的載體,進一步包括起始ATG密碼子或者其一部分,其位於克隆位點的5』端並與克隆位點相鄰。139.權利要求135的載體,進一步包括定位在克隆位點3』端的葉綠體基因3』端非翻譯區。140.一種在質體中生產多肽的方法,包括向質體中導入至少第一重組核酸分子,所述第一重組核酸分子包括編碼至少一個核糖體結合序列(RBS)的第一核苷酸序列,以及與之有效連接的編碼至少一種多肽的至少一種異源多聚核苷酸,其中所述RBS指導所述多肽在質體中的翻譯,在允許所述的至少一種多肽表達的條件下,由此在質體中生產多肽。141.權利要求140的方法,其中質體是葉綠體。142.權利要求141的方法,其中第一多聚核苷酸的密碼子被傾向於表現出葉綠體的密碼子使用。143.權利要求140的方法,其中第一多聚核苷酸編碼抗體,或者抗體的亞基。144.權利要求143的方法,其中抗體特異性地結合破傷風毒素或者單純皰疹病毒。145.權利要求140的方法,其中第一多聚核苷酸編碼第一多肽,以及可以選擇的第二多肽。146.權利要求145的方法,其中第一多聚核苷酸被傾向於葉綠體的密碼子使用。147.權利要求146的方法,其中第一多肽包括免疫球蛋白重鏈或者其可變區,第二多肽包括免疫球蛋白輕鏈或者其可變區。148.權利要求147的方法,其中抗體包括在SEQIDNO16,SEQIDNO43,或者SEQIDNO48中所列的胺基酸序列。149.權利要求147的方法,其中第一多聚核苷酸包括在SEQIDNO15,SEQIDNO42,或者SEQIDNO47中所列的核苷酸序列。150.權利要求146的方法,其中異源多聚核苷酸編碼報告蛋白。151.權利要求150的方法,其中報告蛋白包括綠色螢光蛋白或者螢光素酶。152.權利要求151的方法,其中異源多聚核苷酸包括SEQIDNO1,編碼SEQIDNO2的核苷酸序列,SEQIDNO45,或者編碼SEQIDNO46的核苷酸序列。153.權利要求150的方法,其中第一多聚核苷酸編碼第一多肽和至少一種第二多肽。154.權利要求153的方法,其中第一多肽和第二多肽包括蛋白複合物的亞基。155.權利要求154的方法,其中蛋白複合物是異源二聚體。156.權利要求150的方法,進一步包括向質體中導入至少一種第二重組核酸分子。157.權利要求156的方法,其中第二重組核酸分子包括有效連接的編碼至少第一RBS的第一核苷酸序列和編碼至少一種第二多肽的第二異源多聚核苷酸,其中第一RBS可以指導所述多肽在葉綠體中的翻譯。158.權利要求157的方法,其中第一重組核酸分子和第二重組核酸分子在葉綠體中共表達。159.權利要求140的方法,其中第一重組核酸分子被包含在載體中。160.權利要求159的方法,其中載體是葉綠體載體,其包括一段葉綠體基因組脫氧核糖核酸(DNA)的核苷酸序列,這段序列可以與葉綠體基因組DNA發生同源重組。161.權利要求160的方法,其中載體進一步包括原核生物複製原點。162.權利要求140的方法,進一步包括從質體中分離所述多肽。163.通過權利要求162的方法獲得的分離出的多肽。164.權利要求163的分離出的多肽,其是一種抗體或者報告蛋白。165.合成的多聚核苷酸,包括編碼至少第一多肽的至少第一核苷酸序列,其中第一核苷酸序列中至少有一個密碼子被傾向於表現出葉綠體的密碼子使用。166.權利要求165的多聚核苷酸,其中第一核苷酸序列的每一個密碼子都被傾向於表現出葉綠體的密碼子使用。167.權利要求165的多聚核苷酸,其中多聚核苷酸進一步包括編碼第二多肽的至少第二核苷酸序列。168.權利要求167的多聚核苷酸,其中第二核苷酸序列的至少一個密碼子被傾向於表現出葉綠體的密碼子使用。169.權利要求167的多聚核苷酸,其中第一核苷酸序列與第二核苷酸序列有效連接。170.權利要求169的多聚核苷酸,其編碼包括第一多肽和第二多肽的融合蛋白。171.權利要求169的多聚核苷酸,其中第一核苷酸序列通過第三核苷酸序列與第二核苷酸序列有效連接。172.權利要求171的多聚核苷酸,其中第三核苷酸序列編碼一種連接肽。173.權利要求172的多聚核苷酸,其編碼包括通過連接肽與第二多肽連接的第一多肽的融合蛋白。174.權利要求165的多聚核苷酸,其中第一多肽包括免疫球蛋白可變區,免疫球蛋白恆定區,或者二者的組合。175.權利要求167的多聚核苷酸,其編碼單鏈抗體,所述抗體包含有效連接的重鏈可變區和輕鏈可變區。176.權利要求175的多聚核苷酸,其中單鏈抗體具有在SEQIDNO16,SEQIDNO43,或者SEQIDNO48中所列的胺基酸序列。177.權利要求175的多聚核苷酸,其具有在SEQIDNO15,SEQIDNO42,或者SEQIDNO47中所列的核苷酸序列。178.權利要求165的多聚核苷酸,其編碼報告多肽。179.權利要求178的多聚核苷酸,其中報告多肽是螢光素酶。180.權利要求179的多聚核苷酸,其中螢光素酶具有在SEQIDNO46所列的胺基酸序列。181.權利要求180的多聚核苷酸,其具有在SEQIDNO45中所列的核苷酸序列。182.多肽,其包含在SEQIDNO16,SEQIDNO43,SEQIDNO46,或者SEQIDNO48中所列的胺基酸序列。183.一種在質體中生產異源多肽的方法,所述方法包括在允許至少第一多肽在質體中表達的條件下向質體導入權利要求165的合成的多聚核苷酸。184.權利要求183的方法,其中合成的多聚核苷酸與編碼至少一種核糖體結合序列(RBS)的核酸序列有效連接。185.權利要求184的方法,其中RBS可以指導所述多肽在質體中的翻譯。186.權利要求184的方法,其中所述多聚核苷酸進一步包含編碼第二多肽的至少第二核苷酸序列。187.權利要求186的方法,其中第一核苷酸序列與第二核苷酸序列有效連接。188.權利要求187的方法,其中異源多肽包括融合蛋白,所述融合多肽包括第一多肽和第二多肽。189.權利要求187的方法,其中第一核苷酸序列通過第三核苷酸序列與第二核苷酸序列有效連接。190.權利要求189的方法,其中第三核苷酸序列編碼一種連接肽。191.權利要求190的方法,其中異源多肽包括含有通過連接肽連接的第一多肽和第二多肽的融合蛋白。192.權利要求183的方法,其中異源多肽包括免疫球蛋白可變區,免疫球蛋白恆定區,或者二者的組合。193.權利要求183的方法,其中異源多肽包括含有有效連接在一起的重鏈可變區和輕鏈可變區的單鏈抗體。194.權利要求193的方法,其中單鏈抗體具有在SEQIDNO16,SEQIDNO43,或者SEQIDNO48中所列的胺基酸序列。195.權利要求193的方法,其中單鏈抗體是由SEQIDNO15,SEQIDNO42,或者SEQIDNO47所列的核苷酸序列編碼。196.權利要求183的方法,其中異源多肽包括報告多肽。197.權利要求196的方法,其中報告多肽是螢光素酶。198.權利要求197的方法,其中螢光素酶具有在SEQIDNO46中所列的胺基酸序列。199.權利要求198的方法,其中報告多肽是由在SEQIDNO45中所列的核苷酸序列編碼。200.權利要求183的方法,其中質體是葉綠體。201.權利要求200的方法,其中葉綠體是在一種藻中。202.權利要求201的方法,其中藻是一種微藻。203.通過權利要求183的方法生產的異源多肽。204.一種檢測植物細胞的方法,包括在允許報告多肽在葉綠體中表達的條件下向植物細胞葉綠體中導入權利要求178的多聚核苷酸,以及檢測所述報告多肽的表達。205.權利要求204的方法,其中報告多肽是螢光素酶。206.權利要求205的方法,其中螢光素酶具有在SEQIDNO46中所列的胺基酸序列。207.權利要求204的方法,其中所述多聚核苷酸具有在SEQIDNO45中所列的核苷酸序列。全文摘要提供了在植物葉綠體中表達一種或者多種多肽的方法,包括表達能夠在植物葉綠體中特異地聯合以形成功能性的蛋白複合物的多肽的方法。還提供了含有(或者編碼)第一核糖體結合序列(RBS)和與之有效連接的第二RBS的分離的多聚核苷酸,這樣所述的第一RBS指導多肽在原核生物中的翻譯,第二RBS指導所述多肽在葉綠體中的翻譯,還提供了含有這樣的多聚核苷酸的載體,尤其是這樣的葉綠體載體和葉綠體/原核生物穿梭載體。還提供了合成的多聚核苷酸,其具有葉綠體密碼子偏好性。提供了經遺傳修飾而含有上述的多聚核苷酸或者載體的植物細胞,以及含有或者源於這樣的遺傳修飾的細胞的轉基因植物。還提供了由上述合成的多聚核苷酸編碼的多肽。文檔編號C12N15/82GK1886512SQ03812392公開日2006年12月27日申請日期2003年4月23日優先權日2002年4月23日發明者S·P·梅菲爾德,S·富蘭克林申請人:斯克裡普斯研究所