一種多抗複合型Bt基因及其在植物中的應用的製作方法
2023-07-31 07:55:31
專利名稱:一種多抗複合型Bt基因及其在植物中的應用的製作方法
技術領域:
本發明涉及分子生物學、酶學、生理學以及基因工程等領域。具體地,本發明涉及一種首次根據植物偏愛密碼子設計人工合成的的Bt基因核酸序列。本發明還涉及Bt基因在植物中的表達。
本發明中,我們用化學合成法,首次根據植物偏愛密碼子設計了可以在植物中特別是在液泡中能夠高效表達的具有持久生物活性(整個植物生長季節)的Bt蛋白及其編碼序列。
在本發明被公布之前,尚未有任何公開或報導過本專利申請中所提及的在植物液泡中高效表達的複合型Bt基因編碼序列。
本發明的第二目的是提供一種在植物中持久表達的Bt基因晶體蛋白。
本發明的第三目的是提供一種在植物中表達的Bt晶體蛋白,該蛋白不但可以具有特異毒殺鱗翅目、而且具有特異毒殺鞘翅目等昆蟲能力。
本發明的第四目的是提供一種利用重組技術在生產利用上述技術表達Bt蛋白及核酸序列的方法。
本發明還提供了這種新的Bt基因和編碼序列在轉基因植物上的應用。
在本發明的一個方面,提供了一種人工設計併合成的含有液泡定位系統的新的Bt基因的克隆載體pGEM-5zf-CryIIIA/Cry I A(c),該載體包括A.根據蛋白酶抑制劑基因和幾丁質酶基因的表達特點設計的異端具有液泡定位表達作用的信號肽序列,該序列位於SEQ ID NO.5中的25-79位。B.根據植物偏愛密碼子設計的具有多個與野生型Bt基因保守區段類似的核酸序列,所述的核酸序列與SEQ ID NO.5中從核苷酸第25-1871位DNA分子的核苷酸序列有至少75%的同源性;或者所述的核苷酸序列能在中度嚴緊條件下與SEQ ID NO.5中從核苷酸第25-1871位的核苷酸序列雜交。較佳地,所述的序列編碼具有SEQ ID NO.6所示的胺基酸序列的多肽。更佳地,所述的序列具有SEQ ID NO.5中從核苷酸第25-1050位的核苷酸序列。
在本發明的另一方面,提供了一種在植物中表達的Bt基因晶體蛋白,它包括具有SEQ ID NO.6胺基酸序列的多肽、或其保守性變異多肽、或其活性片段,或其活性衍生物。較佳地,該多肽是具有SEQ ID NO.6序列中1-588位的多肽,更佳地,該多肽是具有SEQ ID NO.6中從18-588位的多肽。
在本發明的另一方面,還提供了幾種表達載體,它包含上述的DNA分子。
在本發明的另一方面,還提供了一種用上述載體轉化的宿主細胞。在實例中該宿主細胞是菸草和番茄。
在本發明的另一方面,還提供了一種在植物中產生和表達具有活性的Bt基因晶體蛋白的方法,其步驟如下(1)將人工合成的編碼具有Bt基因核苷酸序列可操作地連於表達調控序列,形成Bt基因表達載體,所述的核苷酸序列與SEQ ID NO.5中從核苷酸第25-1871位的核苷酸序列有至少75%的同源性;(2)將步驟(1)中的表達載體轉入宿主細胞,形成Bt基因的重組細胞;(3)在適合表達Bt晶體蛋白的條件下,培養步驟(2)中的重組細胞;(4)再生重組細胞,獲得表達Bt基因的轉基因植物及其後代,包括植物種子及植物組織。
較佳地,在該方法中使用的核酸序列具有SEQ ID NO.5中第25-1871位的序列。
在本發明中,術語「Bt基因」指編碼具有與不同野生型蘇雲金桿菌芽孢分泌的晶體蛋白(CryIIIA或者Cry I A(c))相同殺蟲活性的的複合型核苷酸序列,如SEQID NO.5中第25-1871位核苷酸序列及其簡併序列。該簡併序列是指,位於SEQ ID NO.5序列的編碼框第25-1871位核苷酸中,有一個或多個密碼子被編碼相同胺基酸的簡併密碼子所取代後而產生的序列。由於密碼子的簡併性,所以與SEQ ID NO.5中第25-1871位核苷酸序列同源性低至約75%的簡併序列也能編碼出SEQ ID NO.6所述的序列。該術語還包括能在中度嚴緊條件下,更佳的在高度嚴緊條件下與SEQ IDNO.5中從核苷酸第25-1871位的核苷酸序列雜交的核苷酸序列。該術語還包括與SEQ ID NO.5中從核苷酸第25-1871位的核苷酸序列的同源性至少75%,較佳地至少80%,更佳地至少90%,最佳地至少95%的核苷酸序列。
該術語還包括能編碼具有與天然的Bt基因相同功能的蛋白的SEQ ID NO.5中開放閱讀框序列的變異形式。這些變異形式包括(但並不限於)若干個(通常為1-90個,較佳地1-60個,更佳地1-20個,最佳地1-10個)核苷酸的缺失、插入和/或取代,以及在5』和/或3』端添加數個(通常為60個以內,較佳地為30個以內,更佳地為10個以內,最佳地為5個以內)核苷酸。
在本發明中,術語「Bt晶體蛋白」指具有與多個野生型蘇雲金桿菌晶體蛋白(CryIIIA或者Cry I A(c))相同活性的SEQ ID NO.6序列的多肽。該術語還包括具有與Bt晶體蛋白在植物中表達相同功能的SEQ ID NO.6序列的變異形式。這些變異形式包括(但並不限於)若干個(通常為1-20個,較佳地1-15個,更佳地1-10個,最佳地1-5個)胺基酸的缺失、插入和/或取代,以及在C末端和/或N末端添加一個或數個(通常為15個以內,較佳地為10個以內,更佳地為5個以內)胺基酸。例如,在本領域中,用性能相近或相似的在植物中偏愛的胺基酸進行取代時,通常不會改變蛋白質的功能。又比如,在C末端和/或N末端添加一個或數個植物偏愛密碼子所表達的胺基酸通常也不會改變蛋白質的功能。該術語還包括在植物中的表達的Bt基因的活性片段和活性衍生物。
本發明的Bt基因的變異形式包括同源序列、保守性變異體、等位變異體、天然突變體、誘導突變體、在高或低的嚴緊條件下能與Bt基因DNA雜交的DNA所編碼的蛋白、以及利用Bt晶體蛋白的抗血清獲得的多肽或蛋白。
在本發明中,「Bt晶體蛋白保守性變異多肽」是指與SEQ ID NO.6的胺基酸序列相比,有至多10個,較佳地至多8個,更佳地至多5個胺基酸被性質相似或相近的胺基酸所替換而形成多肽。這些保守性變異多肽最好根據表1進行替換而產生。
表1
發明還包括人工合成的在植物中表達的Bt晶體蛋白或多肽的類似物。這些類似物與Bt晶體蛋白的差別可以是胺基酸序列上的差異,也可以是不影響序列的修飾形式上的差異,或者兼而有之。這些多肽包括天然或誘導的遺傳變異體。誘導變異體可以通過各種技術得到,如通過輻射或暴露於誘變劑而產生隨機誘變,還可通過定點誘變法或其他已知分子生物學的技術。類似物還包括具有不同於天然L-胺基酸的殘基(如D-胺基酸)的類似物,以及具有非天然存在的或合成的胺基酸(如β、γ-胺基酸)的類似物。應理解,本發明的多肽並不限於上述例舉的代表性的多肽。
修飾(通常不改變一級結構)形式包括體內或體外的多肽的化學衍生形式如乙醯化或羧基化。修飾還包括糖基化,如那些在多肽的合成和加工中或進一步加工步驟中進行糖基化修飾而產生的多肽。這種修飾可以通過將多肽暴露於進行糖基化的酶(如哺乳動物的糖基化酶或去糖基化酶)而完成。修飾形式還包括具有磷酸化胺基酸殘基(如磷酸酪氨酸,磷酸絲氨酸,磷酸蘇氨酸)的序列。還包括被修飾從而提高了其抗蛋白水解性能或優化了溶解性能的多肽。
在本發明中,可選用本領域已知的各種載體,如市售的載體,包括質粒,粘粒等。在生產本發明的在植物中表達的Bt基因時,可以將Bt基因編碼序列可操作地連於表達調控序列,從而形成Bt基因表達載體。
如本文所用,「可操作地連於」指這樣一種狀況,即線性DNA序列的某些部分能夠影響同一線性DNA序列其他部分的活性。例如,如果信號肽DNA作為前體表達並參與多肽的分泌,那麼信號肽(分泌前導序列)DNA就是可操作地連於多肽DNA;如果啟動子控制序列的轉錄,那麼它是可操作地連於編碼序列;如果核糖體結合位點被置於能使其翻譯的位置時,那麼它是可操作地連於編碼序列。一般,「可操作地連於」意味著相鄰,而對於分泌前導序列則意味著在閱讀框中相鄰。
在本發明中,術語「宿主細胞」為真核細胞。常用的真核宿主細胞包括酵母細胞、菸草細胞、番茄細胞及其它植物細胞。
還可用Nothem印跡法技術分析Bt基因產物的表達,即分析Bt基因的RNA轉錄物在細胞中的存在與否和數量。
Bt基因RNA的Nothem印跡分析和特異抗體的Bt晶體蛋白Western印跡分析可以聯合使用,以證實Bt基因在生物樣本中的表達。
此外,本發明還提供了一種可用作探針的核酸分子,該分子通常具有Bt基因編碼序列從25-1871位連續核苷酸,較佳地具有從901-1401位連續核苷酸。該探針可用於檢測樣品中是否存在編碼的核酸分子。
本發明還提供了檢測樣品中是否存在核苷酸序列的Bt基因方法,它包括用上述的探針與樣品進行雜交,然後檢測探針是否發生了結合。較佳地,該樣品是PCR擴增後的產物,其中PCR擴增引物對應於Bt基因的編碼序列,並可位於該編碼序列的兩側或中間。引物長度一般為15-50個核苷酸。
本發明的Bt基因核苷酸編碼序列通常可以用人工合成的方法獲得。
一旦獲得了有關的序列,就可以用重組法來大批量地獲得有關序列。這通常是將其克隆入載體,再轉入細胞,然後通過常規方法從增殖後的宿主細胞中分離得到有關序列。
表2、表3分別為本發明的按植物偏愛密碼子設計人工合成的Bt基因分別與野生型的CryIIIA、Cry I A(c)核苷酸序列(GenBank Accession No.M84650.1,GenBankAccession No.AF177675.1)的同源比較(GAP)表。相同的核苷酸在兩個序列之間用豎線符標出。
表4、表5分別為本發明的按植物偏愛密碼子設計的複合型Bt基因與野生型的CryIIIA、Cry I A(c)(GenPept Accession No.CAB41411.1,GenPept Accession No.AAD55947.1)的同源比較(FASTA)表。其中,相同的胺基酸在兩個序列之間用胺基酸的縮寫代碼標出。
實施例1Bt基因的合成1.基因合成(gene synthesis)Bt基因由本實驗室根據植物偏愛密碼子設計並委託上海生工生物工程服務有限公司合成之後連入pGEM-5zf載體。
2.酶切(restriction enzyme cutting)將含合成基因的質粒載體用BamHI及SacI雙酶切,切下合成的Bt基因;3.連接(ligation)將切下的基因連入已經用BamHI及SacI切好的質粒pBI121和改造的pCAMBIA2301植物表達載體大片段中,用藍白篩選檢測轉化的大腸桿菌陽性克隆。
4.基因的PCR檢測用以下序列為引物,用合成的基因為模板進行PCR檢測BtF1CTAAGGATCC CATTGCCGGC CGCCATGAGA(即SEQ ID No.1)BtR1GATGTCGATG AACTCAAGCT CGGTTCCTGG(即SEQ ID No.2)PCR條件為94℃5分鐘,隨之以94℃1分鐘、56℃1分鐘和72℃1分鐘進行35個循環,最後以72℃延伸10分鐘。電泳檢測PCR擴增產物,獲得擴增片段長度為1844bp。
將基因轉入表達載體後用以下引物對所含基因進行PCR檢測BtF2ATGACCGCTG ACAACAACAC GGAGGCCCTC(即SEQ ID No.3)BtR2CCAAGCATAG GATCAAACGA TATTATCACC(即SEQ ID No.4)PCR條件為94℃5分鐘,隨之以94℃1分鐘、60℃1分鐘和72℃1分鐘進行35個循環,最後以72℃延伸10分鐘。電泳檢測PCR擴增產物,獲得擴增片段長度為1764bp。
實施例2基因的序列信息與同源性分析本發明的Bt基因的全長為1871bp(含接頭),詳細序列見SEQ ID NO.5,其中開放讀框位於25-1871位核苷酸。根據推導出的全長Bt基因的胺基酸序列,共606個胺基酸殘基,分子量為60KD,pI為7.5,詳細序列見SEQ ID NO.6。
將按植物偏愛密碼子設計合成的Bt基因全長序列及其編碼蛋白質用BLAST程序在Non-redundant+GenBank+EMBL+DDBJ+PDB和Non-redundant GenBank CDStranslations+PDB+SwissProt+Superdate+PIR資料庫中進行核苷酸和蛋白質同源性檢索,結果發現它與存在一定的同源性。在核苷酸水平上,它與野生型的CryIIIA、Cry I A(c)核苷酸序列(GenBank Accession No.M84650.1,GenBank Accession No.AF177675.1)的全編碼序列分別有54.3%,41.2%的相同性(見表2),在胺基酸水平上,它與CryIIIA、Cry I A(c)的胺基酸殘基分別有63.8%,56.8%的相似性(GenPeptAccession No.CAB41411.1,GenPept Accession No.AAD55947.1)(見表3)。由上可見,在植物中表達的野生型的CryIIIA、Cry I A(c)無論從核酸還是蛋白水平上都存在較高的同源性,可以認為兩者在功能上也有很高相似性。
實施例3在菸草和番茄細胞中進行真核細胞表達含目的基因(Bt基因)表達載體的構建將含Bt基因的中間載體PGEM-5zf進一步克隆到植物雙元表達載體(如pBI121、pCAMBIA2301)中,在保證閱讀框架正確的前提下鑑定好的表達載體,再將其轉入農桿菌(如EHA105)中,利用葉盤法技術轉化模式植物菸草和番茄。利用葉盤法轉化菸草1.用無菌牙籤挑取YEB選擇平板上的陽性菌落,接種於2ml YEB液體(Sm+,Kan+),28度,200rpm振蕩培養24-36小時;2.室溫下4,000g離心10min;3.棄上清,菌體用1/2MS液體培養基懸浮,稀釋到原體積的5-20倍,使菌液的OD600=0.5左右;4.取生長兩周左右的菸草的無菌葉片,去掉其主葉脈,將其剪成約1平方釐米見方的小葉片;5.將葉片放入製備好的菌液中,浸泡2-5min,在無菌濾紙上吸乾菌液;6.把經侵染的葉片放於MS培養基上,28℃暗培養48小時;7.將葉片轉到含卡那黴素(Kan)的篩選培養基(MS+6-BA1.0mg/L+NAA0.1mg/L+Kan50mg/L+cb250mg/L)上,25-28℃光照下培養,7-15天可見抗性愈傷組織的形成;8.約20天後可見分化芽長出,待芽長大後,切下,置於生根培養基(1/2MS+NAA0.5mg/L+Kan25mg/L)上進行生根培養,2-7天左右生根;9.等根系發達後,將植株取出,用無菌水洗淨附著的固體培養基,移入土壤中,剛開始用玻璃罩罩幾天,待植株健壯後再取下玻璃罩,溫室中培養。
轉化番茄1、將番茄種子滅菌後播於1/2MS培養基上,約10天左右長出子葉;2、農桿菌培養過夜,OD為0.8-1.5,室溫下4,000g離心10min;3、棄上清,菌體用1/2MS液體培養基懸浮,加入子葉浸泡10分鐘;4、在無菌濾紙上吸乾菌液;將子葉放在MS1培養基上,共培養兩天;5、將葉片轉到含Kan的愈傷和分化培養基(MS+ZT1.0mg/L+IAA1.0mg/L+Kan50mg/L+cb250mg/L)上,25-28℃光照下培養,7-15天可見抗性愈傷組織的形成和植株再生;6、待芽長大後約1-2釐米的時將幼芽移植在生根培養基中(1/2MS)上進行生根培養,2-7天左右生根;7、根系發達後,將植株取出,用無菌水洗淨附著的固體培養基,在珍珠巖中馴化一周,用1%的MS澆灌,移入土中。利用western blot檢測在轉基因菸草和番茄植株中的表達1.蛋白的提取a)取50mg葉片,加入100ul 1*PBS(KH2PO40.2g/l,Na2HPO41.15g/l,KCl0.2g/l,NaCl8g/l)於1.5ml離心管中研磨;b)13000,4℃離心10分鐘;c)取上清,備用。注以上過程於冰上進行。
2.蛋白的定量參考Bradford法(Bradford,1976)。取2ul蛋白樣品,加入1ml Bradford試劑,混勻後,分光光度計測OD595。
3.SDS-PAGE分離蛋白SDS-PAGE的製備參考《分子克隆》(Sambrook等,1989);a)加樣前,將樣品置於含50mmol/L DTT的加樣緩衝液(2*加樣緩衝液甘油2.4g,1M Tris-HCl pH6.81ml;溴酚蘭0.01%,H2O定容至20ml),煮沸10分鐘;b)室溫100V電壓下聚丙烯醯胺凝膠電泳,直到指示劑(溴酚蘭)前沿達到凝膠底部。
4.蛋白質向硝酸纖維膜上轉移a)轉移之前,用轉移緩衝液(39mmol甘氨酸,48mmol Tris Base,0.037%SDS,20%甲醇)平衡凝膠和硝酸纖維膜30分鐘;b)室溫下用半乾式電轉儀轉移1h,凝膠兩側各墊3層Whatman濾紙;5.膜上蛋白的檢測a)將硝酸纖維膜浸在封閉液中,37℃緩慢搖動、封閉60分鐘(封閉液取5g脫脂奶粉溶於100ml 1*PBS(含0.5g疊氮鈉));b)再將濾膜浸泡在洗滌緩衝液中,37℃洗滌兩次,每次15分鐘;c)加入第一抗體(抗Bt基因的抗體),37℃溫育30分鐘;同步驟b),洗滌三次;d)加入第二抗體(親和素-鹼性磷酸酶複合物),37℃溫育30分鐘;同步驟b),洗滌兩次;e)加入底物顯色觀察蛋白條帶。
本發明涉及的序列及記號分列如下(1)SEQ ID NO.1的信息(i)序列特徵(A)長度30bp(B)類型核苷酸(C)鏈性單鏈(D)拓撲結構線性(ii).分子類型寡核苷酸(iii).序列描述SEQ ID NO.1CTAAGGATCCCATTGCCGGCCGCCATGAGA(2)SEQ ID NO.2的信息(i)序列特徵(A)長度30bp(B)類型核苷酸(C)鏈性單鏈(D)拓撲結構線性(ii).分子類型寡核苷酸(iii).序列描述SEQ ID NO.2GATGTCGATGAACTCAAGCTCGGTTCCTGG(3)SEQ ID NO.3的信息(i)序列特徵(A)長度30bp(B)類型核苷酸(C)鏈性單鏈(D)拓撲結構線性(ii).分子類型寡核苷酸(iii).序列描述SEQ ID NO.3ATGACCGCTGACAACAACACGGAGGCCCTC(4)SEQ ID NO.4的信息(i)序列特徵(A)長度30bp(B)類型核苷酸
(C)鏈性單鏈(D)拓撲結構線性(ii).分子類型寡核苷酸(iii).序列描述SEQ ID NO.4CCAAGCATAG GATCAAACGA TATTATCACC(5)SEQ ID NO.5的信息(i)序列特徵(A)長度1910bp(B)類型核苷酸(C)鏈性單鏈(D)拓撲結構線性(ii).分子類型核苷酸(iii).序列描述SEQ ID NO.51CTAAGGATCC CATTGCCGGC CGCCATGAGA GCTCTCGCTC TCGCGGTGGT51 GGCCCTGGCG GTGGTGGCCG TGCGCGGCAT GACTGCCGAA AACAACACGG101 AGGCACTAGA CAGCTCCACC ACCAAGGATG TCATTCACAA GGGCATATCC151 GTGGTGGGTG ATCTCCTTGG CGTCGTTGGA TTCCCCTTCG GTGGAGCCCT201 TGTTTCCTTC TACACCAACT TCCTCAACAC TATTTGGCCA AGCGAGGACC251 CCTGGAAGGC CTTCATGGAG CAAGTGGAGG CACTGATGGA TCAGAAGATT301 GCCGATTACG CAAAGAACAA GGCCCTTGCA GAGCTGCAAG GCCTTCAAAA351 CAATGTCGAG GATTATGTTA GCGCACTCAG CTCATGGCAA AAGAACCCTG401 TGAGCTCAGT AACCCACACA GCCAGGGTCG TATTAGAGAG CTGTTCTCTC451 AAGCAGAGAG CCATTTCCGT AACTCAATGC CTTCCTTTGC AATTTCTGGA501 TACGAGGTTC TCTTCCTCAC CACTTACGCA CAAGCTGCCA ACACGCACCT551 CTTCTTGCTT AAGGACGCAC AAATCTACGG AGAGGAGTGG GGATACGAGA601 AGGAGGATAT TGCCGAGTTC TACAAGAGAC AACTTAAACT TACGCAAGAG651 TACACTGATC ACTGTGTCAA GTGGTACAAC GTTGGACTTG ATAAACTCAG701 AGGTTCATCT TACGAGTCTT GGGTGAACTT CAACCGTTAT CGCAGAGAGA751 TGACCCTTAC CGTGCTAGAT CTCATCGCAC TGTTCCCACT GTACGATGTT801 CGTCTTTACC CAAAGGAGGT TAAGACCGAG CTTACCAGAG ACGTTCTCAC851 CGATCCAATT GTCGGAGTCA ACAACCTTAG AGGCTACGGA ACCACCTTCT901 CTAATATTGA GAACTACATT CGCAAGCCAC ACCTGTTTGA CTACCTGCAC951 AGAATCCAAT TCCACACGCG TTTCCAACCA GGATACTACG GTAACGACTC1001 TTTCAACTAC TGGTCCGGAA ACTACGTTTC AACTAGACCA AGCATAGGAT1051 CAAACGATAT TAACACCTCT CCATTCTACG GAAACAAGTC CAGCGAGTAC1101 AGAAGGCCAT TCAATATCGG TATCAACAAC CAGCAACTTT CCGTTCTCGA1151 TGGAACAGAG TTCGCCTATG GAACCTCTTC TAACTTGCCA TCCGCTGTTT1201 ACAGAAAGTC CGGAACCGTT GATAGCTTGG ACGAAATTCC ACCACAGAAC1251 AACAATGTGC CACCCAGGCA AGGATTCAGC CACAGGTTGA GCCATGTGTC1301 CATGTTCCGT TCCGGTTCTA GCAACAGTAG CGTGAGCATC ATCAGAGCTC1351 CTATGTTCTC TTGGATACAT CGTAGTGCTG AGTTCAACAA TATCATTGCA1401 TCCGATAGCA TCACTCAAAT TCCTGCAGTT AAGGGAAACT TTCTCTTCAA1451 TGGTTCAGTC ATTTCAGGAC CAGGATTCAC AGGAGGAGAC CTCGTTAGAC1501 TCAACAGCAG TGGAAATAAC ATCCAGAATA GAGGGTATAT TGAAGTTCCA1551 ATTCATTTCC CTTCCACATC TACCAGATAT AGAGTTCGTG TGAGGTATGC1601 TTCTGTAACT CCTATTCATC TCAACGTTAA TTGGGGTAAT TCATCTATCT1651 TCAGCAACAC AGTTCCAGCT ACAGCTACCT CCTTGGATAA CCTCCAATCC1701 AGCGACTTCG GATACTTTGA GAGCGCCAAT GCTTTCACAT CTTCACTCGG1751 CAACATAGTG GGTGTTAGAA ACTTTAGTGG AACTGCAGGT GTGATCATAG1801 ACAGATTTGA GTTCATTCCA GTTACTGCAA CACTCGAATA ATAACGAGCT1851 CCAAGCTTGG GAGCTCAAAA A(6)SEQ ID NO.6的信息(i)序列特徵(A)長度606個胺基酸(B)類型胺基酸(C)鏈性單鏈(D)拓撲結構2個α螺旋-β摺疊(ii).分子類型多肽(iii).序列描述SEQ ID NO.61 MRALA LAVAM LAVVA VRGMT ADNNT EALDS STTKD VIQKG41 ISVVG DLLGV VGFPF GGALV SFYTN FLNTI WPSED PWKAF81 MEQVE ALMDQ KIADY AKNKA LAELQ GLQNN VEDYV SALSS121 WQKNP VSSRN PHSQG RIREL FSQAE SHFRN SMPSF AISGY161 EVLFL TTYAQ AANTH LFLLK DAQIY GEEWG YEKED IAEFY201 KRQLK LTQEY TDHCV KWYNV GLDKL RGSSY ESWVN FNRYR241 REMTL TVLDL IALFP LYDVR LYPKE VKTEL TRDVL TDPIV281 GVNNL RGYGT TFSNI ENYIR KPHLF DYLHR IQFHT RFQPG321 YYGND SFNYW SGNYV STRPS IGSND IITSP FYGNK SSELY361 RRPFN IGINN QQLSV LDGTE FAYGT SSNLP SAVYR KSGTV401 DSLDE IPPQN NNVPP RQGFS HRLSH VSMFR SGSSN SSVSI441 IRAPM FSWIH RSAEF NNIIA SDSIT QIPAV KGNFL FNGSV481 ISGPG FTGGD LVRLN SSGNN IQNRG YIEVP IHFPS TSTRY521 RVRVR YASVT PIHLN VNWGN SSIFS NTVPA TATSL DNLQS561 SDFGY FESAN AFTSS LGNIV GVRNF SGTAG VIIDR FEFIP601 VTATL E表2上列本發明的按植物偏愛密碼子設計的Bt基因的核酸序列下列野生型的CryIIIA的核酸序列(GenBank Accession No.M84650.1)Identities=1011/1871(54.3%)Query79 atgactgccgaaaacaacacggaggcactagacagctccaccaccaaggatgtcattcac138||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||Sbjct1atgactgctgataacaacacggaggcacttgatagctctaccaccaaggatgtcattcaa60Query139 aagggcatatccgtggtgggtgatctccttggcgtcgttggattccccttcggtggagcc198||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||Sbjct61 aagggcatttccgtggtgggtgatctccttggcgtcgttggattccccttcggtggagcc120Query199 cttgtttccttctacaccaacttcctcaacactatttggccaagcgaggacccctggaag258||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||Sbjct121 cttgtttccttctacaccaacttcctcaacactatttggccaagcgaggacccctggaag180Query259 gccttcatggagcaagtggaggcactgatggatcagaagattgccgattacgcaaagaac318||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||Sbjct181 gccttcatggagcaagtggaggcactgatggatcagaagattgccgattacgcaaagaac240Query319 aaggcccttgcagagctgcaaggccttcaaaacaatgtcgaggattatgttagcgcactc378||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||Sbjct241 aaggcccttgcagagctgcaaggccttcaaaacaatgtcgaggattatgttagcgcactc300Query379 agctcatggcaaaagaaccctgtgagctca-gtaacccacacagccagggtcgtattaga437||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||Sbjct301 agctcatggcaaaagaaccctgtgagctcacgtaacccacacagccagggtcgtattaga360Query438 gagctgttctctcaagcagagagccatttccgtaactcaatgccttcctttgcaatttct 497||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||Sbjct361 gagctgttctctcaagcagagagccatttccgtaactcaatgccttcctttgcaatttct 420Query498 ggatacgaggttctcttcctcaccacttacgcacaagctgccaacacgcacctcttcttg 557||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||Sbjct421 ggatacgaggttctcttcctcaccacttacgcacaagctgccaacacgcacctcttcttg 480Query558 cttaaggacgcacaaatctacggagaggagtggggatacgagaaggaggatattgccgag 617||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||Sbjct481 cttaaggacgcacaaatctacggagaggagtggggatacgagaaggaggatattgccgag 540Query618 ttctacaagagacaacttaaacttacgcaagagtacactgatcactgtgtcaagtggtac 677||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||Sbjct541 ttctacaagagacaacttaaacttacgcaagagtacactgatcactgtgtcaagtggtac 600Query678 aacgttggacttgataaactcagaggttcatcttacgagtcttgggtgaacttcaaccgt 737||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||Sbjct601 aacgttggacttgataaactcagaggttcatcttacgagtcttgggtgaacttcaaccgt 660Query738 tatcgcagagagatgacccttaccgtgctagatctcatcgcactgttcccactgtacgat 797||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||Sbjct661 tatcgcagagagatgacccttaccgtgctagatctcatcgcactgttcccactgtacgat 720Query798 gttcgtctttacccaaaggaggttaagaccgagcttaccagagacgttctcaccgatcca 857||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||Sbjct721 gttcgtctttacccaaaggaggttaagaccgagcttaccagagacgttctcaccgatcca 780Query858 attgtcggagtcaacaaccttagaggctacggaaccaccttctctaatattgagaactac 917||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||Sbjct781 attgtcggagtcaacaaccttagaggctacggaaccaccttctctaatattgagaactac 840Query918 attcgcaagccacacctgtttgactacctgcacagaatccaattccacacgcgtttccaa 977||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||Sbjct841 attcgcaagccacacctgtttgactacctgcacagaatccaattccacacgcgtttccaa 900Query978 ccaggatactacggtaacgactctttcaactactggtccggaaactacgtttcaactaga 1037||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||Sbjct901 ccaggatactacggtaacgactctttcaactactggtccggaaactacgtttcaactaga 960Query1038 ccaagcataggatcaaacgatattaacacctctccattctacggaaacaagtccagcgag 1097||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||Sbjct961 ccaagcataggatcaaacgatattatcacctctccattctacggaaacaagtccagcgag 1020
表3上列本發明的按植物偏愛密碼子設計的Bt基因的核酸序列下列野生型的Cry 1Ac的核酸序列(GenBank Accession No.AF177675.1)Score=1477bits(745),Expect=0.0Identities=745/1871(41.2%)Query1097 gtacagaaggccattcaatatcggtatcaacaaccagcaactttccgttctcgatggaac 1156||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||Sbjct1020 gtacagaaggccattcaatatcggtatcaacaaccagcaactttccgttctcgatggaac 1079Query1157 agagttcgcctatggaacctcttctaacttgccatccgctgtttacagaaagtccggaac 1216||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||Sbjct1080 agagttcgcctatggaacctcttctaacttgccatccgctgtttacagaaagtccggaac 1139Query1217 cgttgatagcttggacgaaattccaccacagaacaacaatgtgccacccaggcaaggatt 1276||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||Sbjct1140 cgttgatagcttggacgaaattccaccacagaacaacaatgtgccacccaggcaaggatt 1199Query1277 cagccacaggttgagccatgtgtccatgttccgttccggttctagcaacagtagcgtgag 1336||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||Sbjct1200 cagccacaggttgagccatgtgtccatgttccgttccggttctagcaacagtagcgtgag 1259Query1337 catcatcagagctcctatgttctcttggatacatcgtagtgctgagttcaacaatatcat 1396||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||Sbjct1260 catcatcagagctcctatgttctcttggatacatcgtagtgctgagttcaacaatatcat 1319Query1397 tgcatccgatagcatcactcaaattcctgcagttaagggaaactttctcttcaatggttc 1456||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||Sbjct1320 tgcatccgatagcatcactcaaattcctgcagttaagggaaactttctcttcaatggttc 1379Query1457 agtcatttcaggaccaggattcacaggaggagacctcgttagactcaacagcagtggaaa 1516||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||Sbjct1380 agtcatttcaggaccaggattcacaggaggagacctcgttagactcaacagcagtggaaa 1439Query1517 taacatccagaatagagggtatattgaagttccaattcatttcccttccacatctaccag 1576||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||Sbjct1440 taacatccagaatagagggtatattgaagttccaattcatttcccttccacatctaccag 1499Query1577 atatagagttcgtgtgaggtatgcttctgtaactcctattcatctcaacgttaattgggg 1636||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||Sbjct1500 atatagagttcgtgtgaggtatgcttctgtaactcctattcatctcaacgttaattgggg 1559Query1637 taattcatctatcttcagcaacacagttccagctacagctacctccttggataacctcca 1696||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||Sbjct1560 taattcatctatcttcagcaacacagttccagctacagctacctccttggataacctcca 1619Query1697 atccagcgacttcggatactttgagagcgccaatgctttcacatcttcactcggcaacat 1756||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||Sbjct1620 atccagcgacttcggatactttgagagcgccaatgctttcacatcttcactcggcaacat 1679Query1757 agtgggtgttagaaactttagtggaactgcaggtgtgatcatagacagatttgagttcat 1816||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||Sbjct1680 agtgggtgttagaaactttagtggaactgcaggtgtgatcatagacagatttgagttcat 1739Query1817 tccagttactgcaacactcgaataa 1841|||||||||||||||||||||||||Sbjct1740 tccagttactgcaacactcgaataa 1764表4上列本發明的按植物偏愛密碼子設計的Bt基因編碼蛋白質的胺基酸序列下列野生型的CryIIIA蛋白質的胺基酸序列(GenBank Accession No.CAB41411.1)Identities=417/606(63.2%)Query79 MTADNNTEALDSSTTKDVIQKGISVVGDLLGVVGFPFGGALVSFYTNFLNTIWPSEDPWK 258MTADNNTEALDSSTTKDVIQKGISVVGDLLGVVGFPFGGALVSFYTNFLNTIWPSEDPWKSbjct56 MTADNNTEALDSSTTKDVIQKGISVVGDLLGVVGFPFGGALVSFYTNFLNTIWPSEDPWK 115Query259 AFMEQVEALMDQKIADYAKNKALAELQGLQNNVEDYVSALSSWQKNPVSSRNPHSQGRIR 438AFMEQVEALMDQKIADYAKNKALAELQGLQNNVEDYVSALSSWQKNPVSSRNPHSQGRIRSbjct116 AFMEQVEALMDQKIADYAKNKALAELQGLQNNVEDYVSALSSWQKNPVSSRNPHSQGRIR 175Query439 ELFSQAESHFRNSMPSFAISGYEVLFLTTYAQAANTHLFLLKDAQIYGEEWGYEKEDIAE 618ELFSQAESHFRNSMPSFAISGYEVLFLTTYAQAANTHLFLLKDAQIYGEEWGYEKEDIAESbjct176 ELFSQAESHFRNSMPSFAISGYEVLFLTTYAQAANTHLFLLKDAQIYGEEWGYEKEDIAE 235Query619 FYKRQLKLTQEYTDHCVKWYNVGLDKLRGSSYESWVNFNRYRREMTLTVLDLIALFPLYD 798FYKRQLKLTQEYTDHCVKWYNVGLDKLRGSSYESWVNFNRYRREMTLTVLDLIALFPLYDSbjct236 FYKRQLKLTQEYTDHCVKWYNVGLDKLRGSSYESWVNFNRYRREMTLTVLDLIALFPLYD 295Query799 VRLYPKEVKTELTRDVLTDPIVGVNNLRGYGTTFSNIENYIRKPHLFDYLHRIQFHTRFQ 978VRLYPKEVKTELTRDVLTDPIVGVNNLRGYGTTFSNIENYIRKPHLFDYLHRIQFHTRFQSbjct296 VRLYPKEVKTELTRDVLTDPIVGVNNLRGYGTTFSNIENYIRKPHLFDYLHRIQFHTRFQ 355Query979 PGYYGNDSFNYWSGNYVSTRPSIGSNDIITSPFYGNKSSE------------YRRPFNIG 1122PGYYGNDSFNYWSGNYVSTRPSIGSNDIITSPFYGNKSSEYR NSbjct356 PGYYGNDSFNYWSGNYVSTRPSIGSNDIITSPFYGNKSSEPVQNLEFNGEKVYRAVANTN 415Query1123 INNQQLSVLDG---TEFA-YGTSSNLPSA----VYRKSGTV--DSLDEIPPQNNNVPPRQ 1272+ +V GEF+ Y ++ S R G V DS+D++PP+ + P +Sbjct416 LAVWPSAVYSGVTKVEFSQYNDQTDEASTQTYDSKRNVGAVSWDSIDQLPPETTDEPLEK 475Query1273 GFSHRLSHVXXXXXXXXXXXXXIIRAPMFSWIHRSAEFNNIIASDSITQIPAVKGNFLFN 1452G+SH+L++V P+ +W H+S +F N+I S ITQ+P VK L +Sbjct476 GYSHQLNYVMCFLMQGSRGT-----IPVLTWTHKSVDFFNMIDSKKITQLPLVKAYKLQS 530Query1453 G-SVISGPGFTGGDLVRLNSSGNNIQNRGYIEVPIHFPSTSTRYRVRVRYASVTPIHLNV 1629G SV++GP FTGGD+++ +G+ Y+ + S S +YR R+ YAS + I +Sbjct531 GASVVAGPRFTGGDIIQCTENGSAATI--YVTPDV---SYSQKYRARIHYASTSQITFTL 585Query1630 NWGNSSIFSNTVPATATSLDNLQSSDFGYFESANAFTSSLGNI-VGVRNFSGTAGVIIDR 1806+ + TD L + F + F S N+ +GV SV ID+Sbjct586 SLDGAPFNQYYFDKTINKGDTLTYNSFNLASFSTPFELSGNNLQIGVTGLSAGDKVYIDK 645Query1807 FEFIPV 1824EFIPVSbjct646 IEFIPV 651表5上列本發明的按植物偏愛密碼子設計的Bt基因編碼蛋白質的胺基酸序列下列野生型的CryIC蛋白質的胺基酸序列(GenBank Accession No.AAD55947.1)Identities=345/606(56.8%)Query208 FYTNFLNTIWPSEDP--WKAFMEQVEALMDQKIADYAKNKALAELQGLQNNVEDYVSALS 381F++ IWP W AF+ Q+E L++Q+I ++A+N+A++ L+GL N + Y +Sbjct30 FVLGLVDIIWGIFGPSQWDAFLVQIEQLINQRIEEFARNQAISRLEGLSNLYQIYAESFR 89Query382 SWQKNPVSSRNPHSQGRIRELFSQAESHFRNSMPSFAISGYEVLFLTTYAQAANTHLFLL 561W+ +PNP + +R F+ S++P FA+ Y+V L+ Y QAAN HL +LSbjct90 EWEADPT---NPALREEMRIQFNDMNSALTTAIPLFAVQNYQVPLLSVYVQAANLHLSVL 146Query562 KDAQIYGEEWGYEKEDIAEFYKRQLKLTQEYTDHCVKWYNVGLDKLRGSSYESWVNFNRY 741+D ++G+ WG++ I Y+L YTD+ V+WYN GL+++ G WV +N++Sbjct147 RDVSVFGQRWGFDAATINSRYNDLTRLIGNYTDYAVRWYNTGLERVWGPDSRDWVRYNQF 206Query742 RREMTLTVLDLIALFPLYDVRLYPKEVKTELTRDVLTDPIVGVNNLRG-YGTTESNIENY 918RRE+TLTVLD++ALFP YD R YP++LTR++ T+P++ N G + + IESbjct207 RRELTLTVLDIVALFPNYDSRRYPIRTVSQLTREIYTNPVL--ENFDGSFRGSAQGIERS 264Query919 IRKPHLFDYLHRIQFHTRFQPGYYGNDSFNYWSGNYVSTRPSIGSNDIITSPFYGN---- 1086IR PHL D L+ I +TGYY YWSG+ + P ST P YGSbjct265 IRSPHLMDILNSITIYTDAHRGYY------YWSGHQIMASPVGFSGPEFTFPLYGTMGNA 318Query1087 ------------------KSSEYRRPFNIGINNQQLSVLDGTEFAYGTSSNLPSAVYRKS 1212S+ YRRPFNIGINNQQLSVLDGTEFAYGTSSNLPSAVYRKSSbjct319 APQQRIVAQLGQGVYRTLSSTLYRRPFNIGINNQQLSVLDGTEFAYGTSSNLPSAVYRKS 378Query1213 GTVDSLDEIPPQNNNVPPRQGFSHRLSHVXXXXXXXXXXXXXIIRAPMFSWIHRSAEFNN 1392GTVDSLDEIPPQNNNVPPRQGFSHRLSHV IIRAPMFSWIHRSAEFNNSbjct379 GTVDSLDEIPPQNNNVPPRQGFSHRLSHVSMFRSGSSNSSVSIIRAPMFSWIHRSAEFNN 438Query1393 IIASDSITQIPAVKGNFLFNGSVISGPGFTGGDLVRLNSSGNNIQNRGYIEVPIHFPSTS 1572IIASDSITQIPAVKGNFLFNGSVISGPGFTGGDLVRLNSSGNNIQNRGYIEVPIHFPSTSSbjct439 IIASDSITQIPAVKGNFLFNGSVISGPGFTGGDLVRLNSSGNNIQNRGYIEVPIHFPSTS 498Query1573 TRYRVRVRYASVTPIHLNVNWGNSSIFSNTVPATATSLDNLQSSDFGYFESANAFTSSLG 1752TRYRVRVRYASVTPIHLNVNWGNSSIFSNTVPATATSLDNLQSSDFGYFESANAFTSSLGSbjct499 TRYRVRVRYASVTPIHLNVNWGNSSIFSNTVPATATSLDNLQSSDFGYFESANAFTSSLG 558Query1753 NIVGVRNFSGTAGVIIDRFEFIPVTATLE 1839NIVGVRNFSGTAGVIIDRFEFIPVTATLESbjct559 NIVGVRNFSGTAGVIIDRFEFIPVTATLE 58權利要求
1.一種人工合成的DNA分子,其特徵在於,它包括根據植物偏愛密碼子設計的編碼具有Bt晶體蛋白活性的多肽的核苷酸序列,而且所述的核苷酸序列與SEQID NO.5中從核苷酸第25-1871位的核苷酸序列有至少75%的同源性;或者所述的核苷酸序列能在中度嚴緊條件下與SEQ ID NO.5中從核苷酸第25-1871位的核苷酸序列雜交。
2.如權利要求1所述的DNA分子,其特徵在於,所述的序列編碼具有SEQ ID NO.6所示的胺基酸序列的多肽。
3.如權利要求1所述的DNA分子,其特徵在於,該序列具有SEQ ID NO.5中從核苷酸第25-1871位的核苷酸序列。
4.一種在植物中表達的Bt晶體蛋白,其特徵在於,它包括具有SEQ ID NO.6胺基酸序列的多肽、或其保守性變異多肽、或其活性片段,或其活性衍生物。
5.如權利要求4所述的多肽,其特徵在於,該多肽是在植物中表達的具有SEQ IDNO.6序列的多肽。
6.一種載體,其特徵在於,它包含權利要求1所述的DNA。
7.一種用權利要求6所述載體轉化的宿主細胞,其特徵在於它是真核細胞。
8.一種在植物中產生和表達具有Bt晶體蛋白活性的多肽的方法,特徵在於其步驟如下(1)將人工合成的編碼具有Bt晶體蛋白活性多肽的核苷酸序列可操作地連於表達調控序列,形成Bt晶體蛋白蛋白表達載體,所述的核苷酸序列與SEQ ID NO.5中從核苷酸第25-1871位的核苷酸序列有至少75%的同源性;(2)將步驟(1)中的表達載體轉入宿主細胞,形成Bt晶體蛋白的重組細胞;(3)在適合表達Bt晶體蛋白的條件下,培養步驟(2)中的重組細胞;(4)再生重組細胞,獲得表達Bt晶體蛋白的轉基因植物及其後代,包括植物種子及植物組織。
9.一種核酸分子,其特徵在於,它包含權利要求1所述的DNA分子中25-1871個連續核苷酸。
10.一種用於檢測樣品中是否存在Bt基因核苷酸序列的方法,其特徵在於它包括用權利要求9所述探針與樣品進行雜交,然後檢測探針是否發生了結合,該樣品是PCR擴增後的產物,其中PCR擴增引物對應於Bt基因核苷酸編碼序列,並可位於該編碼序列的兩側或中間,引物長度為15~50個核苷酸。
全文摘要
本發明提供了一種按植物偏愛密碼子設計合成的具有在液泡中高效表達的複合型Bt(Bacillus thuringiensis)基因。涉及包含所說基因的融合基因構建體,攜帶該構建體的新的重組表達載體。該表達載體具有在普通植物中(包括水稻、小麥、玉米、油菜、棉花等)特別是在液泡中高效表達的特性。還涉及被所說的表達載體轉化的植物細胞,以及由所說的Bt基因轉化細胞產生的表達的轉基因植物及其後代,包括植物種子及植物組織。本發明還提供了在樣品中檢測Bt基因核酸序列和多肽的方法。
文檔編號C12N15/63GK1417330SQ0113217
公開日2003年5月14日 申請日期2001年11月9日 優先權日2001年11月9日
發明者左開井, 唐克軒, 孫小芬, 龐永珍 申請人:復旦大學