新四季網

對大腸桿菌o172型的o-抗原特異的核苷酸的製作方法

2023-06-07 15:35:16

專利名稱:對大腸桿菌o172型的o-抗原特異的核苷酸的製作方法
技術領域:
本發明涉及大腸桿菌O172型(Escherichia coli O172)中控制O-抗原合成的基因簇的核苷酸全序列,特別是涉及大腸桿菌O172型中控制O-抗原合成的基因簇中的寡核苷酸,可利用這些對O-抗原特異的寡核苷酸快速、準確地檢測人體及環境中的大腸桿菌O172型並鑑定這些致病菌中的O-抗原。
因為O-抗原是極強的抗原,是大腸桿菌重要的致病因素之一,同時它又具有極強的多樣性,這啟示我們能研究一種快速、準確地檢測志大腸桿菌及其O-抗原的特異性好、靈敏度高的方法。以表面多糖為目標的血清學免疫反應自上世紀30年代以來一直被用於對細菌的分型和鑑定,是鑑定致病菌的唯一的手段。這種診斷方法需要大量的抗血清,而抗血清一般種類不全,數量不足,大量的抗血清在製備和儲存中也存在一些困難。另一方面此法耗時長、靈敏度低、漏檢率高、準確性差,所以,現在普遍認為這種傳統的血清學檢測方法將為現代分子生物學方法取代。1993年,Luk,J.M.C et.al用沙門氏菌(S.enterica)O-抗原基因簇的特異核苷酸序列通過PCR方法鑑定了沙門氏菌的O-抗原[Luk,J.M.C.et.al.(1993)「Selective amplification ofabequose andparatose synthase genes(rfb)by polymerase chain reaction for identification ofS.enterica major serogroups(A,B,C2,andD)」,J.Clin.Microbiol.312118-2123]。Luk,et.al的方法是將相應於沙門氏菌血清型E1,D1,A,B和C2的O-抗原內的CDP-阿比可糖和CDP-泰威糖的合成基因的核苷酸序列排列後得到對不同血清型的沙門氏菌特異的寡核苷酸。1996年,Paton,A.W et.al用對E.coli O111的O-抗原特異的源於wbdI基因的寡核苷酸鑑定了一株產毒素的E.coli O111的血清型[「Molecular microbiological investigation ofan outbreak of Hemolytic-Uremic Syndrome caused by dry fermented sausage contaminated with Shiga-liketoxin producing Escherichia coli」.J.Clin.Microbiol.341622-1627],但是後來的研究表明Paton,A.W et.al的用源於wbdI基因的寡核苷酸鑑定E.coli O111的血清型的方法有假陽性結果出現。Bastin D.A.and Reeves,P.R.認為,這是由於wbdI基因是一個推測的糖合成路徑基因[Bastin D.A.andReeves,P.R.(1995)Sequence and analysis of the O antigen gene(rfb)cluster ofEscherichia coli O111.Gene 16417-23],而在其它細菌的O-抗原的結構中也可能有這個糖,所以糖合成路徑基因對於O-抗原並不是高度特異的志賀氏菌有46種血清型,但只有33種不同的O-抗原,大腸桿菌有166種不同的O-抗原[Reeves,P.R(1992)「Variation in O antigens,niche specificselection and bacterial populations」.FEMS Microbiol.Lett,100509-516],二者親緣關係非常近,並且有12種是大腸桿菌和志賀氏菌共有的[Ewing,W.H.(1986)「Edwards and Ewing’s identification ofthe Enterobacteriaceae」.Elsevier SciencePublishers,Amsterdam,The Netherlands;T.cheasty,et al.(1983)「Antigenicrelationships between the enteroinvasive Escherichia coli antigensO28ac,O112ac,O124,O136,O143,O144,O152 and and Shigella O antigens」J.clinMicrobiol,17(4)681-684]
本發明的次一目的是提供了大腸桿菌O172型的O-抗原基因簇的全長核苷酸序列。
本發明的另一目的是提供了構成大腸桿菌O172型的O-抗原基因簇的基因轉運酶的基因即wzx基因或與wzx有相似功能的基因;聚合酶基因即wzy基因或與wzy有相似功能的基因;糖基轉移酶基因,包括orf3,orf4,orf5,orf9基因。
本發明的又一目的是提供了寡核苷酸,它們分別源於大腸桿菌O172型的O-抗原基因簇中編碼糖基轉移酶的基因包括orf3,orf4,orf5,orf9基因;源於編碼轉運酶的基因即wzx基因或與wzx有相似功能的基因、源於編碼聚合酶的基因即wzy基因或與wzy有相似功能的基因;它們是上述基因內的寡核苷酸,長度在10-20nt;它們對大腸桿菌O172型的O-抗原是特異的;尤其是表1中列出的寡核苷酸,它們對大腸桿菌O172型的O-抗原是高度特異的,而且這些寡核苷酸還可重新組合,組合後的寡核苷酸對大腸桿菌O172型的O-抗原也是高度特異的。
本發明的再一目的是提供的上述寡核苷酸可作為引物用於核酸擴增反應,或者作為探針用於雜交反應,或者用於製造基因晶片或微陣列,從而通過這些方法檢測和鑑定大腸桿菌O172型的O-抗原及檢測和鑑定大腸桿菌O172型。
本發明的還一目的是提供了分離大腸桿菌O172型的O-抗原基因簇的全序列的方法。按照本方法操作可以獲得其他細菌的O-抗原基因簇的全序列,也可以獲得編碼其他多糖抗原的細菌的基因簇的全序列。
本發明的目的是由以下技術方案實現的。
本發明對大腸桿菌O172型的O-抗原特異的核苷酸,其是如SEQ ID NO1所示的分離的核苷酸,全長12850個鹼基;或者具有一個或多個插入、缺失或取代的鹼基,同時保持所述分離的核苷酸功能的SEQ ID NO1的核苷酸。
前述的對大腸桿菌O172型的O-抗原特異的核苷酸,其由10個基因組成,都位於galF基因和gnd基因之間。
前述的對大腸桿菌O172型的O-抗原特異的核苷酸,其中所述的基因是轉運酶的基因,包括wzx基因或與wzx有相似功能的基因;聚合酶基因wzy基因或與wzy有相似功能的基因;糖基轉移酶基因,包括orf3、orf4、orf5、orf9基因;其中所述的基因wzx是SEQ ID NO1中的1120至2388鹼基的核苷酸;wzy是SEQ ID NO1中的2381至3556鹼基的核苷酸;orf3是SEQ IDNO1中的3553至4335鹼基的核苷酸;orf4是SEQ ID NO1中的4335至5423鹼基的核苷酸;orf5是SEQ ID NO1中的5420至6499鹼基的核苷酸;orf9是SEQ ID NO1中的9795至11003鹼基的核苷酸。
前述的對大腸桿菌O172型的O-抗原特異的核苷酸,其中它是源於所述的wzx基因、wzy基因或糖基轉移酶基因orf3、orf4、orf5、orf9基因;以及它們的混合或它們的重組。
前述的對大腸桿菌O172型的O-抗原特異的核苷酸,其中所述的所述的源於wzx基因的寡核苷酸對是SEQ ID NO1中的1166至1182鹼基的核苷酸和1854至1870鹼基的核苷酸;SEQ ID NO1中的1415至1434鹼基的核苷酸和2286至2303鹼基的核苷酸;SEQ ID NO1中的1157至1174鹼基的核苷酸和1934至1951鹼基的核苷酸;源於wzy基因的寡核苷酸對是SEQ IDNO1中的2610至2627鹼基的核苷酸和3452至3470鹼基的核苷酸;SEQ IDNO1中的2711至2728鹼基的核苷酸和3460至3477鹼基的核苷酸;SEQ IDNO1中的2742至2759鹼基的核苷酸和3480至3496鹼基的核苷酸;源於orf3基因的寡核苷酸對是SEQ ID NO1中的3660至3677鹼基的核苷酸和4255至4274鹼基的核苷酸;SEQ ID NO1中的3728至3745鹼基的核苷酸和4296至4313鹼基的核苷酸;SEQ ID NO1中的3752至3769鹼基的核苷酸和4308至4325鹼基的核苷酸;源於orf4基因的寡核苷酸對是SEQ ID NO1中的4391至4410鹼基的核苷酸和5211至5228鹼基的核苷酸;SEQ ID NO1中的4463至4470鹼基的核苷酸和5271至5289鹼基的核苷酸;SEQ ID NO1中的4515至4530鹼基的核苷酸和5396至5418鹼基的核苷酸;源於orf5基因的寡核苷酸對是SEQ ID NO1中的5435至5452鹼基的核苷酸和5992至6009鹼基的核苷酸;SEQ ID NO1中的5687至5704鹼基的核苷酸和6230至6247鹼基的核苷酸;SEQ ID NO1中的5724至5741鹼基的核苷酸和6319至6336鹼基的核苷酸;源於orf9基因的寡核苷酸對是SEQ ID NO1中的9825至9842鹼基的核苷酸和10687至10704鹼基的核苷酸;SEQ ID NO1中的10001至10017鹼基的核苷酸和10682至10699鹼基的核苷酸;SEQ ID NO1中的10201至10218鹼基的核苷酸和10954至10971鹼基的核苷酸。
前述的對大腸桿菌O172型的O-抗原特異的核苷酸在檢測表達O-抗原的細菌、在診斷中鑑定細菌的O-抗原和細菌的其它多糖抗原的應用。
前述的對大腸桿菌O172型的O-抗原特異的核苷酸的重組分子,而且通過插入表達可提供表達大腸桿菌O172型的O-抗原,並成為細菌疫苗。
前述的對大腸桿菌O172型的O-抗原特異的核苷酸的應用,其中它作為引物用於PCR、作為探針用於雜交反應與螢光檢測、或者用於製造基因晶片或微陣列,檢測人體和環境中的細菌。
前述的對大腸桿菌O172型的O-抗原特異的核苷酸的分離方法,其特徵在於,其包括下述步驟(1)基因組的提取在5mL的LB培養基中37℃過夜培養大腸桿菌O172型,離心收集細胞。用500ul 50mM Tris-HCl(pH8.0)和10ul 0.4M EDTA重懸細胞,37℃溫育20分鐘,然後加入10ul 10mg/ml的溶菌酶繼續保溫20分鐘。之後加入3ul 20mg/ml的蛋白酶K、15ul 10%SDS,50℃溫育2小時,再加入3ul 10mg/ml的RNase,65℃溫育30分鐘,加等體積酚抽提混合物,取上清再用等體積的酚∶氯仿∶異戊醇(25∶24∶1)混合溶液抽提兩次,取上清再用等體積的乙醚抽提以除去殘餘的酚。上清用2倍體積乙醇沉澱DNA,用玻璃絲卷出DNA並用70%乙醇洗DNA,將DNA重懸於30ul TE中;基因組DNA通過0.4%的瓊脂糖凝膠電泳檢測;(2)通過PCR擴增大腸桿菌O172型中的O-抗原基因簇以大腸桿菌O172型的基因組為模板通過Long PCR擴增其O-抗原基因簇,首先根據經常發現於O-抗原基因簇啟動子區的JumpStart序列設計上遊引物(#1523-ATT GTGGCT GCA GGG ATC AAA GAA AT),再根據O-抗原基因簇下遊的gnd基因設計下遊引物(#1524-TAG TCG CGT GNG CCT GGA TTA AGT TCG C);用Boehringer Mannheim公司的Expand Long Template PCR方法擴增O-抗原基因簇,PCR反應程序如下在94℃預變性2分鐘;然後94℃變性10秒,60℃退火30秒,68℃延伸15分鐘,這樣進行30個循環,最後,在68℃繼續延伸7分鐘,得到PCR產物,用0.8%的瓊脂糖凝膠電泳檢測PCR產物的大小及其特異性,合併6管long PCR產物,並用Promega公司的Wizard PCR Preps純化試劑盒純化PCR產物;(3)構建O-抗原基因簇文庫用被修改的Novagen DNaseI shot gun法構建O-抗原基因簇文庫,反應體系是300ngPCR純化產物,0.9ul 0.1M MnCl2,1ul 1∶2000稀釋的1mg/ml的DNaseI,反應在室溫中進行,酶切10分鐘使DNA片段大小集中在1kb-3kb之間,而後加入2ul 0.1M EDTA終止反應。合併4管同樣的反應體系,用等體積的酚抽提一次,用等體積的酚∶氯仿∶異戊醇(25∶24∶1)混合溶液抽提一次,再用等體積的乙醚抽提一次後,用2.5倍體積的無水乙醇沉澱DNA,並用70%乙醇洗沉澱,最後重懸於18ul水中,隨後在此混合物中加入2.5ul dNTP(1mMdCTP,1mMdGTP,1mMdTTP,10mMdATP),1.25ul 100mM DTT和5單位的T4DNA聚合酶,11℃ 30分鐘,將酶切產物補成平端,75℃終止反應後,加入5單位的Tth DNA聚合酶及其相應的緩衝液並將體系擴大為80ul,70℃反應20分鐘,使DNA的3′端加dA尾。此混合物經等體積氯仿∶異戊醇(24∶1)混合溶液抽提和等體積乙醚抽提後與Promega公司的3×10-3的pGEM-T-Easy載體於16℃連接24小時,總體積為90ul。其中有9ul的10×buffer和25單位的T4DNA連接酶,最後用1/10體積的3M NaAc(pH5.2)和2倍體積的無水乙醇沉澱連接混合物,再用70%乙醇洗沉澱,乾燥後溶於30ul水中得到連接產物;用BiO-Rad公司的電轉化感受態細胞的製備方法製備感受態大腸桿菌DH5 a細胞,取2-3ul連接產物與50ul感受態大腸桿菌DH5a混合後,轉到BiO-Rad公司的0.2cm的電擊杯中電擊,電壓為2.5千伏,時間為5.0毫秒至6.0毫秒,電擊後立即在杯中加入1ml的SOC培養基使菌復甦,然後將菌塗在含有氨苄青黴素、X-Gal和IPTG的LB固體培養基上,在37℃過夜培養,次日得到藍白菌落,將得到的白色菌落即白色克隆轉到含有氨卞青黴素的LB固體培養基上培養,同時從每個克隆中提取質粒,並用EcoRI酶切鑑定其中的插入片段的大小,得到的白色克隆群構成了大腸桿菌O172型的O-抗原基因簇文庫;(4)對文庫中的克隆測序從文庫中挑選插入片段在700bp以上的120個克隆由上海生物工程有限公司用ABI377型DNA自動測序儀對克隆中的插入片段單向進行測序,使序列達到90%的覆蓋率,剩餘10%的序列再通過將部分序列反向測序,從而獲得O-抗原基因簇的所有序列;(5)核苷酸序列的拼接及分析用英國劍橋MRC(Medical Research Council)分子生物學實驗室出版的Staden package軟體包的Pregap4和Gap4軟體拼接和編輯所有的序列,從而得到大腸桿菌O172型的O-抗原基因簇的核苷酸全長序列;序列的質量主要由兩個方面來保證1)對大腸桿菌O172型的基因組作6個Long PCR反應,然後混合這些產物以產生文庫,2)對每個鹼基,保證3個以上高質量的覆蓋率,在得到大腸桿菌O172型O-抗原基因簇的核苷酸序列後,用美國國家生物技術信息學中心(The National Center forBiotechnology Information,NCBI)的orffinder發現基因,找到10個開放的閱讀框,用blast系列軟體與GenBank中的基因比較以發現這些開放的閱讀框的功能並確定它們是什麼基因,再用英國sanger中心的Artemis軟體完成基因注釋,用Clustral W軟體做DNA和蛋白質序列間的精確比對,最後得到大腸桿菌O172型的O-抗原基因簇的結構;(6)特異基因篩選針對痢大腸桿菌O172型的O-抗原基因簇中的wzx、wzy、orf3、orf4、orf5、orf9基因設計引物;在每個基因內各設計了三對引物,每對引物分布在相應基因內的不同地方,以確保其特異性;用這些引物以166株大腸桿菌和43株志賀氏菌的基因組為模板進行PCR,除源自orf9的的三對在O12、O25、O26中得到大小正確的帶外,在其他組中都沒有擴增到任何大小正確的帶,即在大多數組中沒有得到任何PCR產物帶,雖然在少數組中得到PDR產物帶,但其大小不符合預期大小,所以wzx、wzy、orf3、orf4、orf5基因對大腸桿菌O172型的O-抗原都是高度特異的。
也就是,本發明的第一個方面,提供了大腸桿菌O172型的O-抗原基因簇的全長核苷酸序列,它的全序列如SEQ ID NO1所示,全長12850個鹼基;或者具有一個或多個插入、缺失或取代的鹼基,同時保持所述分離的核苷酸功能的SEQ ID NO1的核苷酸。通過本發明的方法得到了大腸桿菌O172型的O-抗原基因簇的結構,如表3所示,它總共由10個基因組成,都位於galF基因和gnd基因之間。
本發明的第二個方面,提供了大腸桿菌O172型的O-抗原基因簇中的基因,即轉運酶基因(wzx基因或與wzx有相似功能的基因);聚合酶基因(wzy基因或與wzy有相似功能的基因);糖基轉移酶基因,包括orf3、orf4、orf5、orf9基因;細菌多糖抗原中特殊的糖合成路徑基因,包括gne基因。它們在O-抗原基因簇中的起始位置和終止位置及核苷酸序列都列在表4中;本發明尤其涉及到糖基轉移酶基因、轉運酶基因和聚合酶基因,因為糖合成路徑基因即合成核苷二磷酸單糖的基因現在被預示對較多胞外多糖是常見的、共同的,對細菌的O-抗原並不是很特異的,而本發明涉及到的糖基轉移酶基因、轉運酶基因和聚合酶基因對大腸桿菌O172型的O-抗原是高度特異的。
本發明的第三個方面,提供了源於大腸桿菌O172型的O-抗原基因簇中的wzx基因或與wzx有相似功能的基因、wzy基因或與wzy有相似功能的基因和糖基轉移酶基因,包括orf3、orf4、orf5、orf9基因的寡核苷酸,它們是這些基因中的任何一段寡核苷酸。但是,優先被用的是列於表1中的寡核苷酸對,在表1中也列出了這些寡核苷酸對在O-抗原基因簇中的位置及以這些寡核苷酸對為引物所做的PCR反應的產物的大小,這些PCR反應可用表中的退火溫度進行。這些引物在以大腸桿菌O172型為模板進行的PCR擴增中得到預期大小的產物,而除源自orf9的三對在O12、O25、O26中得到大小正確的帶外,在以表2所列的其它菌為模板進行的PCR擴增中都未得到預期大小的產物。更詳細地說,以這些寡核苷酸對為引物所做的PCR反應在大多數細菌中均未得到任何產物。所以,可以確定除源自orf9的的三對這些引物即表1所列的寡核苷酸對大腸桿菌O172型的O-抗原是高度特異的。
所述的對大腸桿菌O172型的O-抗原特異的核苷酸的分離方法包括下述步驟1)基因組的提取;2)PCR擴增大腸桿菌O172型中的O-抗原基因簇;3)構建O-抗原基因簇文庫;4)對文庫中的克隆測序;5)核苷酸序列的拼接及分析;6)特異基因的篩選。
本發明的其他方面由於本文的技術的公開,對本領域的技術人員而言是顯而易見的。
如本發明所用,「寡核苷酸」主要指來源於O-抗原基因簇中的編碼糖基轉移酶的基因、編碼轉運酶的基因和編碼聚合酶的基因內的一段核苷酸分子,它們在長度上可改變,一般在10到20個核苷酸範圍內改變;更確切說這些寡核苷酸是源於wzx基因(核苷酸位置是從SEQ ID NO1中的1120至2388鹼基的核苷酸);wzy基因(核苷酸位置是從SEQ ID NO1中的2381至3556鹼基的核苷酸);orf3基因(核苷酸位置是從SEQ ID NO1中的3553至4335鹼基的核苷酸);orf4基因(核苷酸位置是從SEQ ID NO1中的4335至5423鹼基的核苷酸);orf5基因(核苷酸位置是從SEQ ID NO1中的5420至6499鹼基的核苷酸);orf9基因(核苷酸位置是從SEQ ID NO1中的9795至11003鹼基的核苷酸);源於以上基因內的寡核苷酸對大腸桿菌O172型是高度特異的。
此外,有時兩個遺傳相似的編碼不同O-抗原的基因簇通過基因重組或突變產生新的O-抗原,從而產生新的細菌類型,新的突變株。在這種環境中,需要篩選出多對寡核苷酸同重組基因雜交以提高檢測的特異性。因此,本發明提供了一整套多對寡核苷酸的混合物,它們源於糖基轉移酶基因;源於轉運酶和聚合酶基因,包括wzx基因或與wzx有相似功能的基因、wzy基因或與wzy有相似功能的基因。這些基因的混合物對一個特殊的細菌多糖抗原來說是特異的,從而使這套寡核苷酸對這個細菌的多糖抗原是特異的。更具體地說,這些寡核苷酸的混合物是源於糖基轉移酶基因、wzx基因或與wzx有相似功能的基因、wzy基因或與wzy有相似功能的基因中的寡核苷酸的組合。
在另一方面,本發明涉及寡核苷酸的鑑定,它們可以用於檢測表達O-抗原的細菌和在診斷中鑑定細菌的O-抗原。
本發明涉及到一種檢測食品中的一個或多個細菌多糖抗原的方法,這些抗原可以使樣品能與以下至少一個基因的寡核苷酸特異性雜交,這些基因是(i)編碼糖基轉移酶的基因(ii)編碼轉運酶和聚合酶的基因,包括wzx基因或與wzx有相似功能的基因、wzy基因或與wzy有相似功能的基因。在條件許可的情況下至少一個寡核苷酸能與至少一個表達特殊的O-抗原的細菌的一個以上的那樣的基因特異性雜交,這些細菌是大腸桿菌O172型。可用PCR方法檢測,更可以將本發明方法中的核苷酸標記後作為探針通過雜交反應如southern-blot或螢光檢測,或者通過基因晶片或微陣列檢測樣品中的抗原及細菌。
本發明設計者考慮到以下情況當單個的特異的寡核苷酸檢測無效時,寡核苷酸的混合物能與靶區域特異性雜交以檢測樣品。因此本發明提供了一套寡核苷酸用於本發明所述的檢測方法。這裡所說的寡核苷酸是指源於編碼糖基轉移酶的基因、編碼轉運酶的基因和聚合酶的基因,包括wzx基因或與wzx有相似功能的基因、wzy基因或與wzy有相似功能的基因的寡核苷酸。這套寡核苷酸對一個特殊的細菌的O-抗原來說是特異的,這一特殊的細菌O-抗原是由大腸桿菌O172型表達的。
另一方面,本發明涉及到一種檢測排洩物中的一個或多個細菌多糖抗原的方法,這些抗原可以使樣品能與以下至少一個基因的寡核苷酸特異性雜交,這些基因是(i)編碼糖基轉移酶的基因(ii)編碼轉運酶和聚合酶的基因,包括wzx基因或與wzx有相似功能的基因、wzy基因或與wzy有相似功能的基因。在條件許可的情況下至少一個寡核苷酸能與至少一個表達特殊的O-抗原的細菌的一個以上的那樣的基因特異性雜交。這些細菌是大腸桿菌O172型。可用本發明中的寡核苷酸作引物通過PCR的方法檢測樣品,也可將本發明中的寡核苷酸分子標記後作為探針通過雜交反應如southern-blot或螢光檢測,或者通過基因晶片或微陣列檢測樣品中的抗原及細菌。
一般一對寡核苷酸可能與同樣的基因雜交也可與不同的基因雜交,但它們中必須有一個寡核苷酸能特異性雜交到特殊抗原型的特異序列上,另一個寡核苷酸可雜交於非特異性區域。因此,當特殊的多糖抗原基因簇中的寡核苷酸被重新組合時,至少能選出一對寡核苷酸與多糖抗原基因簇中特異基因混合物雜交,或者選出多對寡核苷酸與特異基因的混合物雜交。甚至即使當一個特殊的基因簇中所有基因都獨一無二時,此方法也能應用於識別此基因簇內的基因混合物的核苷酸分子。因此本發明提供了一整套用於檢測本發明方法的多對寡核苷酸,在這裡多對寡核苷酸是源於編碼糖基轉移酶的基因、編碼轉運酶和聚合酶的基因包括wzx基因或與wzx有相似功能的基因、wzy基因或與wzy有相似功能的基因,這套寡核苷酸對一個特殊的細菌多糖來說是特異的,這套寡核苷酸可能是糖合成中必須基因的核苷酸。
另一方面,本發明也涉及到一種檢測源於病人的樣品中的一個或多個細菌多糖抗原的方法。樣品中的一個或多個細菌多糖抗原可以使樣品能與以下至少一個基因中的一對寡核苷酸中的一個特異性雜交,這些基因是(i)編碼糖基轉移酶的基因(ii)編碼轉運酶和聚合酶的基因,包括wzx基因或與wzx有相似功能的基因、wzy基因或與wzy有相似功能的基因。在條件許可的情況下至少一個寡核苷酸能與樣品中的至少一個表達特殊的O-抗原的細菌的一個以上的那樣的基因特異性雜交,這些細菌是大腸桿菌O172型。可用本發明中的寡核苷酸作引物通過PCR的方法檢測樣品,也可將本發明中的寡核苷酸標記後作為探針通過雜交反應,或者通過基因晶片或微陣列檢測樣品中的抗原及細菌。
更詳細地說,以上描述的方法可以理解為當寡核苷酸對被使用時,其中的一個寡核苷酸分子能雜交到一個並不是來源於糖基轉移酶基因、wzx基因或與wzx有相似功能的基因、wzy基因或與wzy有相似功能的基因的序列上。此外,當兩個寡核苷酸都能雜交上時,它們可能雜交於同一基因也可能雜交到不同基因上。也即,當交叉反應出現問題時,可選擇寡核苷酸的混合物來檢測混合的基因以提供檢測的特異性。
本發明者相信本發明不必限於以上所提的核苷酸序列編碼的特定的O-抗原,而且廣泛應用於檢測所有表達O-抗原和鑑定O-抗原的細菌。而且,由於O-抗原合成和其他多糖抗原(如細菌胞外抗原)合成之間的相似性,本發明的方法和分子也應用於這些其他的多糖抗原。
本發明首次公開了大腸桿菌O172型的O-抗原基因簇的全長序列,而且可從這個未被克隆的全長基因簇的序列中產生重組分子,通過插入表達可產生表達大腸桿菌O172型的O-抗原,並成為有用的疫苗。
其次是感受態細胞的製備參照Bio-Rad公司提供的方法製備感受態細胞大腸桿菌DH5□。取一環大腸桿菌DH5□單菌落於5ml的LB培養基中,180rpm培養10小時後,取2ml培養物轉接到200ml的LB培養基中,37℃250rpm劇烈振蕩培養到OD600 0.5左右,然後冰浴冷卻20分鐘,於4℃4000rpm離心15分鐘。傾盡上清,用冷的冰預冷的去離子滅菌水200ml吹散菌體,於4℃4000rpm離心15分鐘。再用冷的冰預冷的去離子滅菌水100ml吹散菌體,於4℃4000rpm離心15分鐘。用冷的冰預冷的10%的甘油懸浮細胞,4℃6000rpm離心10分鐘,棄上清,最後沉澱用1ml冰預冷的10%的甘油懸浮細胞,即為感受態細胞。將製得的感受態細胞分裝為50ul一管,-70℃保存。
最後是電轉化感受態細胞取2-3ul連接產物與50ul感受態大腸桿菌DH5□混合後,轉到Bio-Rad公司的0.2cm的電擊杯中電擊,電壓為2.5幹伏,時間為5.0毫秒-6.0毫秒。電擊後立即在杯中加入1ml的SOC培養基使菌復甦。然後立即將菌塗在含有氨苄青黴素、X-Gal和IPTG的LB固體培養基上37℃倒置過夜培養,次日得到藍白菌落。將得到的白色菌落即白色克隆轉到含有氨苄青黴素的LB固體培養基上培養,同時從每個克隆中提取質粒並用EcoRI酶切鑑定其中的插入片段的大小,得到白色克隆群構成了大腸桿菌O172型的O-抗原基因簇文庫。實施例4對文庫中的克隆測序從文庫中挑選插入片段在700bp以上的120個克隆由上海生物工程有限公司用ABI377型DNA自動測序儀對克隆中的插入片段單向進行測序,使序列達到90%的覆蓋率。剩餘10%的序列再通過將部分序列反向測序,從而獲得O-抗原基因簇的所有序列。實施例5核苷酸序列的拼接及分析用英國劍橋MRC(Medical Research Council)分子生物學實驗室出版的Staden package軟體包的Pregap4和Gap4軟體拼接和編輯所有的序列,從而得到大腸桿菌O172型的O-抗原基因簇的核苷酸全長序列(見序列列表)。序列的質量主要由兩個方面來保證1)對大腸桿菌O172型的基因組作6個Long PCR反應,然後混合這些產物以產生文庫。2)對每個鹼基,保證3個以上高質量的覆蓋率。在得到大腸桿菌O172型O-抗原基因簇的核苷酸序列後,用美國國家生物技術信息學中心(The National Center for BiotechnologyInformation,NCBI)的orffinder發現基因,找到10個開放的閱讀框,用blast系列軟體與GenBank中的基因比較以發現這些開放的閱讀框的功能並確定它們是什麼基因,再用英國sanger中心的Artemis軟體完成基因注釋,用ClustralW軟體做DNA和蛋白質序列間的精確比對,最後得到大腸桿菌O172型的O-抗原基因簇的結構,如表3所示。
通過檢索和比較,發現orf1編碼的蛋白含有11個潛在跨膜片段,而且與許多Wzx蛋白相似,例如,和Y.pseudotuberculosis的Wzx在224個胺基酸中有25%的相同性,47%的相似性,所以可以確定orf1是wzx基因,命名為wzx。orf2含有9個潛在跨膜片段,它的內膜的拓撲結構具有眾所周知的O-抗原聚合酶(Wzy)的典型特徵。此外,它與S.enterica subsp.Enterica serovarVellore編碼O-抗原聚合酶的Wzy在164個胺基酸中有26%的相同性,45%的相似性,說明它們之間有一定的同源性,所以命名orf2為wzy基因。orf3通過blast比較,與E.ictaluri的糖基轉移酶在255個胺基酸中有25%的相同性,50%的相似性,說明它們之間有高度的同源性,可以推測orf3也為糖基轉移酶基因,暫命名為orf3。orf4通過blast比較,與B.subtilis的糖基轉移酶在121個胺基酸中26%的相同性,48%的相似性,說明它們之間有高度的同源性,可以推測orf4也為糖基轉移酶基因,暫命名為orf4。orf5與E.coli的糖基轉移酶基因在339個胺基酸中有27%的相同性,48%的相似性,所以推測orf5是一個糖基轉移酶基因,暫命名為orf5。orf9與P.aeruginose的糖基轉移酶基因在218個胺基酸中有27%的相同性,46%的相似性,所以推測orf9是一個糖基轉移酶基因,暫命名為orf10。實施例6特異基因的篩選針對大腸桿菌O172型的O-抗原基因簇中的wzx、wzy、orf3、orf4、orr5、orf9基因設計引物,這些基因在核苷酸序列中的位置見表1。
表1列出了大腸桿菌O172型的O抗原基因簇中糖基轉移酶基因和寡糖單位處理基因及基因內的引物及PCR數據。在表中列出了大腸桿菌O172型的0抗原基因簇的糖基轉移酶基因、轉運酶基因和聚合酶基因及它們的相應的功能和大小。在每個基因內,我們各設計了三對引物,每對引物分布在相應基因內的不同地方以確保其特異性。在表中還列出了每個引物在SEQ IDNO1中的位置和大小。以每對引物用表中所列的相應的退火溫度以表2中的所有菌的基因組為模板進行PCR,得到了相應的PCR產物,其大小也列於表中。
mdh(malate dehydrogenase)基因是存在於所有的大腸桿菌的基因組中且高度保守的一個基因,所以我們根據mdh基因設計了引物#101(-TTC ATC CTAAAC TCC TTA TT)和#102(-TAA TCG CAG GGG AAA GCA GG),然後從166株大腸桿菌中提取基因組,方法如前所述。用這對引物從166株大腸桿菌的基因組中PCR以鑑定大腸桿菌並檢測其基因組的質量。
表2是用於篩選特異基因的166株大腸桿菌和43株志賀氏菌及它們的來源,為了檢測的方便,我們將它們每8-10個菌分為一組,總共27組,它們的來源都列於表中。
在第24組中含有大腸桿菌O172型的基因組DNA作為陽性對照。以每組菌做模板,用表1中的每對引物按如下條件做PCR在94℃預變性2分鐘後,94℃變性15秒,退火溫度因引物的不同而不同(參照表1),退火時間是50秒,72℃延伸2分鐘,這樣進行30個循環。最後在72℃繼續延伸10分鐘,反應體系是25ul。反應完畢後,取10ulPCR產物通過0.8%瓊脂糖凝膠電泳檢測擴增出的片段。
對於wzx、wzy、orf3、orf4、orf5基因,每個基因都有三對引物被檢測,每對引物除了在第24組中做PCR後得到了預期大小的正確的一條帶外,在其他組中都沒有擴增到任何大小正確的帶,也就是說,在大多數組中沒有得到任何PCR產物帶,所以wzx、wzy、orf3、orf4、orf5基因對大腸桿菌O172型及其O-抗原是高度特異的。orf9的三對引物在O12、O25、O26中得到大小正確的帶外,在以表2所列的其它菌為模板進行的PCR擴增中都未得到預期大小的產物。
最後,通過PCR從大腸桿菌O172型中篩選到對大腸桿菌O172型的O-抗原高度特異的基因wzx、wzy和三個糖基轉移酶基因。而這些基因內的任何一段10-20nt的寡核苷酸對大腸桿菌O172型的O-抗原是特異的,尤其是上述每個基因中的引物即寡核苷酸對經PCR檢測後證實對大腸桿菌O172型是高度特異的。所有的這些寡核苷酸都可用於快速準確地檢測人體和環境中的大腸桿菌O172型,並能鑑定它們的O-抗原。
表3是大腸桿菌O172型的O-抗原基因簇的結構表,在表中列出了大腸桿菌O172型的O-抗原基因簇的結構,共由10個基因組成,每個基因用方框表示,並在方框內寫入基因的名稱,數字表示的是O-抗原基因簇中的開放閱讀框(orf)的順序。在O-抗原基因簇的兩端是galF基因和gnd基因,它們不屬於O-抗原基因簇,我們只是用它們的一段序列設計引物來擴增O-抗原基因簇的全長序列。
表4是大腸桿菌O172型的O-抗原基因簇中的基因的位置圖,在圖中列出了大腸桿菌O172型的O-抗原基因簇中的所有開放閱讀框在全序列中的準確位置,在每個開放閱讀框的起始密碼子和終止密碼子的下面劃線。在大腸桿菌中開放閱讀框的起始密碼子有兩個ATG和GTG。序列列表110南開大學120對大腸桿菌O172型的O-抗原特異的核苷酸130對大腸桿菌O172型的O-抗原特異的核苷酸1601170PatentIn version 3.1210121112850212DNA213Escherichia coli4001attgtggctg cagggaatca aagaaatcct cctggtaact cacgcgtcca agaacgcggt 60cgaaaaccac ttcgacacct cttatgaatt agaatctctc cttgaacagc gcgtgaagcg120tcagctgctg gcggaagtgc agtccatctg tccgccgggc gtgaccatta tgaacgtgcg180tcagggcgaa cctttaggtt tgggccactc cattttatgt gcacgacccg ccattggtga240caacccattt gtcgtggtgc tgccagacgt tgtgatcgat gacgccagcg ccgacccgct300gcgctacaac cttgctgcca tgattgcgcg cttcaacgaa acgggtcgta gccaggtgct360ggcaaaacgt atgccgggcg atctctctga atactccgtc attcagacca aagagccgct420ggaccgtgaa ggcaaagtca gccgcattgt tgaatttatc gaaaaaccgg atcagccgca480gacgctggac tcagacatca tggccgttgg tcgctatgtg ctttctgcag atatttggcc540ggaacttgaa cgcactcagc ctggtgcatg ggggcgtatt cagctgactg atgccatcgc600tgaactggcg aaaaaacagt ccgttgacgc catgctgatg actggagaca gctacgactg660tggtaaaaaa atgggctata tgcaagcgtt cgtgaagtat gggctgcgca acctgaaaga720aggggcgaag ttccgtaaag gcattgagaa gctgttaagc gaataatgaa aatctgaccg780gatgtaacgg ttgataagaa aattataacg gcagtgaaga ttcgtggcga aagtaatttg840ttgcgaatat tcctgccgtt gttttatata aacaatcaga ataacaacga gttagcaata900ggattttagt caaagttttc caggattttc cttgtttcca gagcggattg gtaagacaat960tagcgtttga atttttcggg tttagcgcga gtgggtaacg ctcgtcacat cgtaggcatg 1020catgcagtgc tctggtagct gtaaagccag gggcggtagc gtacctttta tatagagctt 1080acaattgtga ataataaaac gaatgagcta ataggtggaa tgttattcaa agggttatac 1140atctttataa cctcactgaa cgccctgttg atggttaaaa tactatcacc gaaagatctg 1200ggggtgtggt atgtttttat gactcttcaa actttaatat ttacacttaa taatgcgata 1260atacctaaca ttgctcggca atatacattg ggtagcctca gtaaagaatt aaactttaat 1320tgttatattt ttcatcgctc aactcaaaag acatttatat atcttatatt attgatatta 1380atcatatgtg caattgcaac atttacatat ttgagctctg ttttagcgat cttggaatca 1440caaaataaaa tagtcttagt ttcttggctt ataatcgtat tctctttgtg tttggaagtt 1500tattattctt catatgactg tgcttttaat gggatgggca aatttaaaaa tgtaaataaa 1560attaatttta tatcgcgggc atgtttgttt ttgataagta ttggcatgat agcatatgat 1620attgatggta gaaatgcatt attatatttt tgcattggtt attttattag taatttaata 1680aaaagatttt ttatatacag gctatttata tccaattatc ataatctatg ttttaatagt 1740gaatctgata ctgaatcttt ttataaaaaa aatgaaaaaa taatactcaa tttgtcatgt 1800atgtccttta tatcatcaat tggcgggatg ttaattgtga gaggtgggat gcttattcta 1860ccttattatg tatctatcga agaagttggt aaatatggtc taacttatca attgtttgag 1920attgctttta atttgctatt cactgcgtca gcaataaaaa cgcctagttg gatttttttg 1980tataaagaaa ataagtgtga gctaaaaaaa tcatatttaa aaataaaata tgtaagttta 2040attgtgatgg caataggggg gggggtgatc agtttttatg gggggcagat actgtcactg 2100tttggactgc atgcaacatt attaactaca aatttgtgtt tacttctgac attaattttt 2160attttacaat tgaatcatag tatatcaggg cagttgttaa ctattcagaa taaaatacct 2220tatgcatatg cttctcttta tacaggaatt ggggttgttt tactgtcgat gatttttata 2280ccgataacag gattcaaggg agcattggtt gcgattttta tttcccaatt agcatataat 2340aactggaaat ggccgttaga ggctaggaag aaaataataa atgtataata tgagcgttaa 2400taaaaaaatc acaaagatgt ttgtcttttg tgagttttta tgtggattgt atattttatt 2460ttatggtgaa tatgtctctg actatctcaa tgttgaaaca aatgttaagc atatttacat 2520aatatgtttt cttatttgta tcgtattttt tcattatttg tttttatata gttggtgtat 2580attaagtgtt ttgtttttcc gcaaaagcaa actaacaaca tcagtaaata ttaattctat 2640atttttgttg ttagttataa tatactttat ttttcttctc aaaaccggaa gtggaaaagt 2700atatgcggac ggcggtagca taggtgaatt aagtagtttt gataagttgt tatttttccc 2760aataataatt cttaaactta attttctaat atacatatat gcagcgggtt gtaaaaaaaa 2820ggataatata tattatcttg tgctatttat atttttaatt tgtgaacttt atagaggtgt 2880ttcattttca atattactga tcgctctaat tgaaattgag aaaataaaaa ggtgttttag 2940gattaaatgt ttgttaatat cactgcctct ttttgtctta tttgttaata tagtatataa 3000tattaaattt atggtaaggt taggggagca ttatgattat cttgatatat tccaaacctt 3060aataatgtta cttggtaggt taagtataat ttcaaatgtt ttgtataatt atgagcatta 3120ttactcagtt agcaactttg tagaaggttt tggttatagt gcgataaatg agtttttaga 3180aaaattgacg ccaatgccgt cattatttgg aataactgaa aaaacgacag aaatagggaa 3240gttgatattt tatcattcat atggaagatg ggatagtgca attgcaatct ctgtgttagg 3300tatattaagt attgtgcctg gacaactatt agagatatgt gcaattttaa ttattagttt 3360tgtttttatt caattaatta taaatatgct tgacaatact gagcagcaaa atacggttgc 3420atttttcttc attatattaa ctctttatca ggggttttgg gggttgctgg ctaattatgt 3480ctatgcgcta ttcatttatt taattattat agcatcttgt aatttaatga tgtctaaaag 3540taaaggacgg ttatgaataa tctagaaatt cgagtgttgt ctttgcctga cgcgtatgcg 3600cgaaggacga aatttcagga aagattttct ttagtctcca aattgaaatt tcaatttttc 3660gatggcgtgt atgggaagaa tattccagac gagattttga aaagtatata tgatgataaa 3720aaggctaagt tgaagattaa ccgaagtatg acagtaggtg aaattggggc aacatattca 3780cattacttaa tatataaaga cgcatatgaa aaaaaacttg attatctaat tgtactcgag 3840gatgactctt ttgtagatga aaattttgat gatgtaatta ataggttact tgtaaaaata 3900acaccagatg atgatgctat tatatttata caaaagcata cccttgactc taaagtgatt 3960tttagtcgaa aaaaagatat attgaaaaac ggttttgagt tggtaaaaat gttaggaagt 4020tcacaatatt ttgttgggtc atatggctat attctaacta aaaaatcaat taacaaaata 4080atacagaact atttgccaat atattgtgtt tgcgaccatt ggttctttat taaaaaagat 4140agtaagatag agtcatttta ttgtgtgagc ccaagtttag tatatactaa tgatgaagat 4200attagactgg ttgatagttt tatcaatgaa gaaaggaaaa atgttctgaa aaatcgaggt 4260gtatcacgta ttgggagaat aaaaataatt ataaaacgtg tagtgctgag attgttaaat 4320aaggattggg aatagtgttt tatatttgta aggtaatcac cgttttaatc aaggttataa 4380tttcattctt ggtgtttcca ttgtgtaagc catttagtaa taaaaataaa aaagtggttg 4440taataggaac tcgaaatgga aatcaaggta atgataatgg tgaggttttt tattcatatt 4500taaatgacaa taatgacaat gacgatcttc tggtttattt aatacggaga agtaagaata 4560aggagaaata taaaaatatc ctaataaaaa actccatcag agctaacatt aagattttaa 4620gtgcggacat attatatata acacattcag aatcagattt aattgacttc tggtggcgat 4680tcgttactta taaaaaaata gtttttattc agcatggtgt tataggaata aaaagacttc 4740ctgagtacga aaagaaaaaa ttctctcttt ttgtttcaag caacaattat gaatatgaga 4800ttttgattaa atattataat atatgtagcg aaagaatagt taaatcagga atacctaggt 4860ttgataatta tactatattg aacgaagccc cacagaaaat aaaaaaatgc ctagtcatgt 4920ttacatggcg aaaattttat aaagatgaac aatcaatcag attgaagcgt gttattagta 4980caataattag aaatgagcct tcaataaaga tatacgttgc atcgcacgaa ttatctgatt 5040attcactgtc agaatttgaa ttttataata tcaattatgt ggaatcaata ggtatacaga 5100atgcaattaa agagtgtgat ctattaataa ctgattattc aagtattgct tgggattttt 5160tatatcaaaa taaattgatt tgctttatac aaactgatta tttagaatat gttttcaatg 5220agggtgtcta tttccattgt gatgattttt ttggttatat tatcagggat ctaagtgata 5280ttaatgatgc ctttatttcg gaaattttaa gagttaataa gttaaataat caagaattct 5340taaaaagata ccctttttat ataaactata agaaaaagca ctctgagtta ttatttctag 5400agacaatgga atataatcga tgaaaattat tatatatgcg acagcagcag ttgatggtgg 5460cgctctttcg cttttaaatg atttgctgga atatgcgaat gatgatattg ataatgaata 5520tactgtttgc gttaatgaaa aattaaataa cgaagtgtct gtttacaata atttgacatt 5580tttatttgtt gatactaaag cttggcataa aagggtttat tttgacttta tagggtttaa 5640aaaaaacttt gataataaag attattgctt ggtaataaat ttgcaaaata taccagttcg 5700gacacaatta aaacaaatat tgtacttgca tcagcctttg cctttttcgg atattaagtt 5760aaatattttg gagaagcgta atagaaaatt gatattctat aaatacttat atggattaat 5820aataaaattt aattcatgtt ttattgatca ttgcttagtg caaactgagt ggatgagaaa 5880agctgttatt gataaactaa acctgtctga gaaaaaaata agtataatta gaccagtaat 5940agatattgat ttgaacaaaa ttttaaaaaa tgaaaatgaa aatgaaaata cattcatcta 6000tcccgcagca tcttatagtt ataaaaatca tataatattg gttgaatcat taaatatgat 6060tggtgtggat tttttgtttc agaataagat aactgttata tttacattag atcgtgatga 6120aaattcgaag ttgtttgatc ggataaaaaa atataatctt caagagatta ttaaatttac 6180aggaaatatc ccaagatatg atgttttaaa ttacatttat aatgctaaag ccttactgtt 6240tccatcaaga ctagaaacat ttggtatacc attgatagaa gctgtaaaat ttaattctaa 6300cataattgta agtgatctac cttatgcgca cgacgtattg gatggttatg aaaatgtcaa 6360atactgtaat cctgattctc cagaggattg gtctgaagca atcaaatttg ctatcaatct 6420aaaagagaat aaattaaatc agggctttga attaaattca gggtggagag agttgagttc 6480gattatttca actctttaat taggctagat ataaaaaggt gtggtatgtt taaagataaa 6540gttttattaa taaccggtgg gactggttct tttggaaatg ctgtattgcg gcgatttctt 6600gacacagata ttaaagaaat tcgtgttttt tcgcgtgatg aaaagaaaca agatgatatg 6660cgaaaaaaat acaataatga taaattgaaa ttctatattg gtgatgtcag agattataga 6720agtattttaa atgctacacg aggtgttgat tatatttatc atgcagctgc attaaaacaa 6780gttccttcgt gtgaattcca tcctatggag gcagttaaga ccaacgtgtt aggtactgag 6840aatgtgttgg aggctgcaat ttctaatgga gttaaacgag tagtttgttt gagtactgat 6900aaagccgtgt accccattaa tgtaatgggg atttccaaag caatgatgga aaaagtaatt 6960gtagcgaaat cgcgtaattt ggatagttct aaaactgtca tttgtggaac tcgctatggc 7020aacgttatgg catcgcgtgg ctcagttatt cctctgtttg tggatttgat taaagcagga 7080aaaccgctaa cagtgacgaa ccctgatatg acaaggttta tgatgacgct tgaagatgcg 7140gtagacctag ttctttatgc atttgaacat ggtaataatg gcgatatttt cgtacaaaaa 7200gcaccagcag ctaccattga aactttagca attgcactca aggaactatt gggtgctaat 7260gaacatccgg tcaaaattat aggtaccaga cacggcgaaa aattatatga ggcgttattg 7320agtcgtgaag agatgatcgc agcaatcgat atgggagaat attactgtgt tccgccagac 7380ttgcgtgacc ttaactatag taaatatgtt gagcatggtg attgtcgaat ttcagaaatt 7440gaagactata attcacacaa tacagtaagg ctggatgtta aaggaatgaa ggaattattg 7500cttaaactac cgtttgttcg agctttgata gctggtgaag cttttgaatt ggattcataa 7560tatgaaaata ctaattactg gttctaaagg ttttattgct cgtaatttaa tctatcgcct 7620gcaggaagca ggctttaaag atttaattac gatcgaccgt gaatcacctt tgcaagagtt 7680agaacaggga ctcaaaattg ctgattttat ttatcatctt gctggtgtaa ataggccaaa 7740ggaagaacat gagtttcagg agggaaatac tgatcttaca aaattaattg ttgactatct 7800gctttgtaat gcaaaaaaga ctcctattat gcttagttcc tccattcagg ctgaatgtga 7860taacgcgtat ggaaaaagca aggcatcggc ggaaaaaatc attcaacatt atggtcatgt 7920tagtggcgca gaatattata tctatcgatt accaaatgtg ttcggtaagt ggtgtcgacc 7980aaattacaac tcctttgttg caactttttg tcataggata gcaaacgatc aagatattat 8040cattcatgac ccgacagcag aggtcgagct tgtttatatt gatgattttt gtactgatgc 8100tatcaactta ttaaataaca agtacgcgtc aggttttaaa aatataaagc cgacgtattc 8160aataacagtg ggtgaggtag caaatctaat ttataaattt aaagaaagta gacatactct 8220tattacggaa aatgttggtc agggtttttc acgagcgtta tattcaactt ggcttagtta 8280cttgcaacca gagcagttcg tgtatgcagt gccttcctat agtgatgaaa gaggagtgtt 8340ctgcgaggtc ttaaaaaccc attcctctgg acaattttca ttttttaccg cacttccagg 8400agtaacgcgt ggagggcact atcatcatac aaagaatgaa aaatttatcg ttattcgtgg 8460aacagcatgt tttaggttta aaaatgtttt aacaggagaa cgatatgaga ttaatgttgc 8520gtcagatgaa tataaaattg tagaaactgt gccaggttgg tcccatgata ttactaatac 8580cggtcatgat gaattaatcg taatgttgtg ggcgaatgaa atatttaatc gtgatcaacc 8640tgatactata gcgagcgttt tatcatgaaa aaattgaaag tcatgtcggt tgttgggact 8700cgtccagaaa ttattcgact ttcgcgtgtc cttgcaaaat tagatgaata ttgtgaccac 8760cttattgttc atactggaca aaactacgat tatgaattga atgaagtttt tttcaaagat 8820ttgggtgttc gcaaacctga ttattttctt aatgccgcag gtaaaaatgc agcagagact 8880attggacaag ttattattaa agttgatgag gtccttgaac aggaaaaacc agaagccatg 8940ttagttcttg gtgatactaa ctcctgtatt tcagcaatac cagcaaagcg tcgaagaatt 9000ccgatcttcc atatggaggc tgggaatcgt tgttttgacc aacgcgtacc ggaagaaact 9060aacagaaaaa tagttgacca taccgctgat atcaatatga catatagtga tatcgcgcgt 9120gaatatcttc tggctgaagg tgtaccagcc gatagaatta ttaaaactgg tagcccaatg 9180tttgaagtac tcacgcatta tatgccgcag attgatggtt ccgatgtact ttctcgcctg 9240aatttaacac ctgggaattt ctttgtggta agtgcccaca gagaagaaaa tgttgatacc 9300cctaaacagc ttgcgaaact ggcgaatata cttaataccg tagctgaaaa atatgatgtc 9360ccggtagtcg tttctactca tcctcgcact cgtaaccgca tcaacgaaaa cggtattcaa 9420ttccataaaa atatcttgct tcttaagcca ttaggatttc acgattacaa ccatctgcaa 9480aaaaatgcgc gtgctgtttt atcggatagt gggactatta cagaagagtc ctccattatg 9540aacttccctg cactcaatat acgagaagcg cacgaacgcc cggaaggctt cgaagaaggg 9600gcagtaatga tggtcggcct tgaatctgag cgcgttttac aggcattaga aattatcgca 9660acacagcctc gtggagaagt acgcttactc cgtcaggtca gtgactatag catgccaaat 9720gtttcagata aagttgtgcg tattatccat tcatacactg actacgttaa acgggttgtc 9780tggaagcaat actaatgaaa cttgcattaa tcattgatga ttatttgccc catagcacac 9840gtgttggggc taaaatgttt catgagttag gccttgaatt gctgagcaga ggccatgatg 9900taactgtaat tacgcctgac atcacattac aagtaatcta ttctgttagt atgattgatg 9960gtataaaggt ttggcgtttc aaaagtggcc ctttaaagga tgtaggtaag gctaaacgtg 10020ccataaatga aactctttta tcttttcgtg catggcgcgc atttaagcac ctcattcagc 10080atgatacatt tgatggtatt gtttattatt ccccctctat tttttgggga gacttggtta 10140aaaaaataaa acagcgatgc cagtgcccaa gctatctggt cctgagggat atgtttccac 10200agtgggttat tgatgcaggt atgttgaaag ccggttcacc aattgaaaaa tatttcaggt 10260attttgaaaa aaaatcatat cagcaggctg accggatagg gttaatgtct gataagaatc 10320ttgagatatt tcgtcaggcc aataaaaatt atccgtgtga agttttacgt aattgggcct 10380caatgactcc tgtgtctgcc agcgatgatt atcattcact tcgtcaaaaa tacgatctaa 10440aagataaagt tatttttttc tatggcggaa atattgggca tgctcaagat atggcaaact 10500taatgcgcct tgcgcgtgat atgatgcgtt atcatgatgc tcatttcctg tttatagggc 10560agggtgatga agttgacctg ataaaatctc ttgctgtaga atggaattta actaatttca 10620ttcatctacc ttcagtgacc caagaagagt tcaaattaat tttatctgaa gttgatgtcg 10680gcctattctc cctttcatct cgccattctt cacataattt ccccgggaaa ttactcgggt 10740atatggttca ttcaatcccg attcttggga gtgtgaatga cggcaatgat ttgatggata 10800taattaacaa gcacagggcc ggttttattc atgttaatgg tgaagatgat aaactgtttg 10860aatctgcaca attgcttctt agtgattcag ttttaagaaa acagttaggt cagaacgcta 10920atgtgttgtt aaagtctcaa ttttcggttg aatcggcggc acatactatc gaagtccgac 10980tggaggcagg agaatgcatt tagttgatga caatattctg gatgaacttt ttcgcactgc 11040agtaaattct gaacgtttgc gcgctcatta tttattgcac gcatctcatc aggagaaagt 11100tcaacgttta cttattgcat ttgtacgcga cagctatgtt gaaccccatt ggcatgagtt 11160accgcatcag tgggaaatgt ttgtcgtcat gcaagggcaa ttagaagttt gtttgtatga 11220gcaaaatggt gagatccaaa aaaagtttgt tgttggagac ggtacgggaa taagcgtcgt 11280ggaattttcc ccaggagata tacatagtgt caaatgcctg tcaccaaaag cccttatgtt 11340agagataaag gaggggccat ttgacccact gaaagctaag gttttttcta agtggttata 11400gggcgataca tcaccgttta ttcttctatc ttattctata catgctgggt taccatctta 11460gcttcttcaa gccgcacacc cgcagcgaac acccctgaca ggagtaaaca atgtcaaagc 11520aacagatcgg cgtcgtcggt atggcagtaa tggggcgcaa ccttgcgctc aacatcgaaa 11580gccgtggtta taccgtctct attttcaacc gttcccgtga gaagacggaa gaagtgattg 11640ccgaaaatcc gggcaagaaa ctggttcctt actatacggt gaaagagttt gttgaatctc 11700tggaaacgcc tcgtcgcatc ctgttaatgg tgaaagcagg tgcaggcacg gatgctgcta 11760ttgattctct caagccatac ctcgataaag gcgacatcat cattgatggt ggtaacacct 11820tcttccagga caccatccgt cgtaaccgtg agctttctgc agaaggcttt aacttcatcg 11880gtaccggtgt ctccggcggt gaagaaggtg cgctgaaagg tccttccatt atgcctggtg 11940ggcagaaaga agcctatgaa ctggttgcgc cgatcctgac caaaatcgcc gcagtggctg 12000aagatggcga accgtgcgtt acctatattg gtgccgatgg tgcaggtcat tatgtgaaga 12060tggttcacaa cggtattgaa tacggtgata tgcagctgat tgccgaagcc tattctctgc 12120taaaaggtgg cctgaacctt accaacgaag aacttgcaca gacctttacc gaatggaata 12180acggtgaact gagcagctac ctgatcgaca tcaccaaaga tatcttcacc aaaaaagatg 12240aagacggtaa ctacctggtt gatgtgattc tggatgaagc agcaaacaaa ggtacgggta 12300aatggaccag ccagagtgcg ctggatctcg gtgaaccgct gtcgctaatt accgagtctg 12360tgtttgcacg ttatgtctct tctctgaaag atcagcgtgt tgccgcatct aaagttctct 12420ctggcccgca agcgcagcca gctggcgaca aggctgagtt catcgaaaaa gttcgtcgtg 12480cgctgtatct gggcaaaatc gtttcttacg cccagggctt ctctcagctg cgtgctgcgt 12540ctgaagagta caactgggat ctgaactacg gcgaaatcgc gaagattttc cgtgctggct 12600gcatcatccg tgcgcagttc ctgcagaaaa tcaccgatgc ttatgccgaa aatccacaga 12660tcactaacct gctgctggct ccgtacttca agcaaattgc cgatgactac cagcaggcgc 12720tgcgcgatgt cgtcgcatat gcagtacaga acggtatccc ggttccgacc ttcgccgctg 12780cggttgccta ttatgacagc taccgtgccg ctgttctgcc tgcgaacctg atccaggcac 12840agcgcgacta 12850表1大腸桿菌O172型的O抗原基因簇中的糖基轉移酶基因和寡糖單位處理基因及其中的引物及PCR數據

*只在大腸桿菌O172型中得到正確的一條帶**在O12、O25、O26中得到大小正確的帶表2 166株大腸桿菌和43株志賀氏菌及它們的來源組號 該組中含有的菌株來源1野生型大腸桿菌O1,O2,O3,O4,O10,O16,O18,O39 IMVSa2野生型大腸桿菌O40,O41,O48,O49,O71,O73,O88,O100 IMVS3野生型大腸桿菌O102,O109,O119,O120,O121,O125,O126,O137 IMVS4 野生型大腸桿菌O138,O139,O149,O7,O5,O6,O11,O12 IMVS5 野生型大腸桿菌O13,O14,O15,O17,O19ab,O20,O21,O22 IMVS6 野生型大腸桿菌O23,O24,O25,O26,O27,O28,O29,O30 IMVS7 野生型大腸桿菌O32,O33,O34,O35,O36,O37,O38,O42 IMVS8 野生型大腸桿菌O43,O44,O45,O46,O50,O51,O52,O53 IMVS9 野生型大腸桿菌O54,O55,O56,O57,O58,O59,O60,O61 IMVS10野生型大腸桿菌O62,O63,O64,O65,O66,O68,O69,O70 IMVS11野生型大腸桿菌O74,O75,O76,O77,O78,O79,O80,O81 IMVS12野生型大腸桿菌O82,O83,O84,O85,O86,O87,O89,O90 IMVS13野生型大腸桿菌O91,O92,O95,O96,O97,O98,O99,O101 IMVS14野生型大腸桿菌O112,O162,O113,O114,O115,O116,O117,O118 IMVS15野生型大腸桿菌O123,O165,O166,O167,O168,O169,O170,O171 See b16野生型大腸桿菌O172,O173,O127,O128,O129,O130,O131,O132, See c17野生型大腸桿菌O133,O134,O135,O136,O140,O141,O142,O143 IMVS18野生型大腸桿菌O144,O145,O146,O147,O148,O150,O151,O152 IMVS19野生型大腸桿菌O153,0154,O155,O156,O157,O158,O159, IMVS20野生型大腸桿菌O160,O161,O163,O8,O9,O124,O111 IMVS21野生型大腸桿菌O103,O104,O105,O106,O107,O108,O110 IMVS22鮑氏志賀氏菌血清型B4,B5,B6,B8,B9,B11,B12,B14See d23鮑氏志賀氏菌血清型B1,B3,B7,B8,B10,B13,B15,B16,B17,B18 See d24痢疾志賀氏菌血清型D1,D2,D3,D4,D5,D6,D7,D8 See d25痢疾志賀氏菌血清D9,D10,D11,D12,D13 See d26弗氏志賀氏菌F6a,F1a,F1b,F2a,F2b,F3,F4a,F4b,F5(v7)F5(v4)See d27宋內氏志賀氏菌D5,DR See da. Institude of Medical and Veterinary Science,Anelaide,Australiab. O123 from IMVS;the rest from Statens Serum Institut,Copenhagen,Denmarkc. 172 and 173 from Statens Serum Institut,Copenhagen,Denmark,the rest from IMVSd. 中國預防醫學科學院流行病學研究所表3大腸桿菌O172型O抗原基因結構圖 表4大腸桿菌O172型O抗原基因簇基因位置1 ATTGTGGCTG CAGGGAATCA AAGAAATCCT CCTGGTAACT CACGCGTCCA AGAACGCGGT61 CGAAAACCAC TTCGACACCT CTTATGAATT AGAATCTCTC CTTGAACAGC GCGTGAAGCG121 TCAGCTGCTG GCGGAAGTGC AGTCCATCTG TCCGCCGGGC GTGACCATTA TGAACGTGCG181 TCAGGGCGAA CCTTTAGGTT TGGGCCACTC CATTTTATGT GCACGACCCG CCATTGGTGA241 CAACCCATTT GTCGTGGTGC TGCCAGACGT TGTGATCGAT GACGCCAGCG CCGACCCGCT301 GCGCTACAAC CTTGCTGCCA TGATTGCGCG CTTCAACGAA ACGGGTCGTA GCCAGGTGCT361 GGCAAAACGT ATGCCGGGCG ATCTCTCTGA ATACTCCGTC ATTCAGACCA AAGAGCCGCT421 GGACCGTGAA GGCAAAGTCA GCCGCATTGT TGAATTTATC GAAAAACCGG ATCAGCCGCA481 GACGCTGGAC TCAGACATCA TGGCCGTTGG TCGCTATGTG CTTTCTGCAG ATATTTGGCC541 GGAACTTGAA CGCACTCAGC CTGGTGCATG GGGGCGTATT CAGCTGACTG ATGCCATCGC601 TGAACTGGCG AAAAAACAGT CCGTTGACGC CATGCTGATG ACTGGAGACA GCTACGACTG661 TGGTAAAAAA ATGGGCTATA TGCAAGCGTT CGTGAAGTAT GGGCTGCGCA ACCTGAAAGA721 AGGGGCGAAG TTCCGTAAAG GCATTGAGAA GCTGTTAAGC GAATAATGAA AATCTGACCG781 GATGTAACGG TTGATAAGAA AATTATAACG GCAGTGAAGA TTCGTGGCGA AAGTAATTTG841 TTGCGAATAT TCCTGCCGTT GTTTTATATA AACAATCAGA ATAACAACGA GTTAGCAATA901 GGATTTTAGT CAAAGTTTTC CAGGATTTTC CTTGTTTCCA GAGCGGATTG GTAAGACAAT961 TAGCGTTTGA ATTTTTCGGG TTTAGCGCGA GTGGGTAACG CTCGTCACAT CGTAGGCATG1021 CATGCAGTGC TCTGGTAGCT GTAAAGCCAG GGGCGGTAGC GTACCTTTTA TATAGAGCTT SDorf1的起始1141 ATCTTTATAA CCTCACTGAA CGCCCTGTTG ATGGTTAAAA TACTATCACC GAAAGATCTG1201 GGGGTGTGGT ATGTTTTTAT GACTCTTCAA ACTTTAATAT TTACACTTAA TAATGCGATA1261 ATACCTAACA TTGCTCGGCA ATATACATTG GGTAGCCTCA GTAAAGAATT AAACTTTAAT1321 TGTTATATTT TTCATCGCTC AACTCAAAAG ACATTTATAT ATCTTATATT ATTGATATTA1381 ATCATATGTG CAATTGCAAC ATTTACATAT TTGAGCTCTG TTTTAGCGAT CTTGGAATCA1441 CAAAATAAAA TAGTCTTAGT TTCTTGGCTT ATAATCGTAT TCTCTTTGTG TTTGGAAGTT1501 TATTATTCTT CATATGACTG TGCTTTTAAT GGGATGGGCA AATTTAAAAA TGTAAATAAA1561 ATTAATTTTA TATCGCGGGC ATGTTTGTTT TTGATAAGTA TTGGCATGAT AGCATATGAT1621 ATTGATGGTA GAAATGCATT ATTATATTTT TGCATTGGTT ATTTTATTAG TAATTTAATA1681 AAAAGATTTT TTATATACAG GCTATTTATA TCCAATTATC ATAATCTATG TTTTAATAGT1741 GAATCTGATA CTGAATCTTT TTATAAAAAA AATGAAAAAA TAATACTCAA TTTGTCATGT1801 ATGTCCTTTA TATCATCAAT TGGCGGGATG TTAATTGTGA GAGGTGGGAT GCTTATTCTA1861 CCTTATTATG TATCTATCGA AGAAGTTGGT AAATATGGTC TAACTTATCA ATTGTTTGAG1921 ATTGCTTTTA ATTTGCTATT CACTGCGTCA GCAATAAAAA CGCCTAGTTG GATTTTTTTG1981 TATAAAGAAA ATAAGTGTGA GCTAAAAAAA TCATATTTAA AAATAAAATA TGTAAGTTTA2041 ATTGTGATGG CAATAGGGGG GGGGGTGATC AGTTTTTATG GGGGGCAGAT ACTGTCACTG2101 TTTGGACTGC ATGCAACATT ATTAACTACA AATTTGTGTT TACTTCTGAC ATTAATTTTT2161 ATTTTACAAT TGAATCATAG TATATCAGGG CAGTTGTTAA CTATTCAGAA TAAAATACCT2221 TATGCATATG CTTCTCTTTA TACAGGAATT GGGGTTGTTT TACTGTCGAT GATTTTTATA2281 CCGATAACAG GATTCAAGGG AGCATTGGTT GCGATTTTTA TTTCCCAATT AGCATATAAT SDorf2的起始,orf1的終止2401 TAAAAAAATC ACAAAGATGT TTGTCTTTTG TGAGTTTTTA TGTGGATTGT ATATTTTATT2461 TTATGGTGAA TATGTCTCTG ACTATCTCAA TGTTGAAACA AATGTTAAGC ATATTTACAT2521 AATATGTTTT CTTATTTGTA TCGTATTTTT TCATTATTTG TTTTTATATA GTTGGTGTAT2581 ATTAAGTGTT TTGTTTTTCC GCAAAAGCAA ACTAACAACA TCAGTAAATA TTAATTCTAT2641 ATTTTTGTTG TTAGTTATAA TATACTTTAT TTTTCTTCTC AAAACCGGAA GTGGAAAAGT2701 ATATGCGGAC GGCGGTAGCA TAGGTGAATT AAGTAGTTTT GATAAGTTGT TATTTTTCCC2761 AATAATAATT CTTAAACTTA ATTTTCTAAT ATACATATAT GCAGCGGGTT GTAAAAAAAA2821 GGATAATATA TATTATCTTG TGCTATTTAT ATTTTTAATT TGTGAACTTT ATAGAGGTGT2881 TTCATTTTCA ATATTACTGA TCGCTCTAAT TGAAATTGAG AAAATAAAAA GGTGTTTTAG2941 GATTAAATGT TTGTTAATAT CACTGCCTCT TTTTGTCTTA TTTGTTAATA TAGTATATAA3001 TATTAAATTT ATGGTAAGGT TAGGGGAGCA TTATGATTAT CTTGATATAT TCCAAACCTT3061 AATAATGTTA CTTGGTAGGT TAAGTATAAT TTCAAATGTT TTGTATAATT ATGAGCATTT3121 TTACTCAGTT AGCAACTTTG TAGAAGGTTT TGGTTATAGT GCGATAAATG AGTTTTTAGA3181 AAAATTGACG CCAATGCCGT CATTATTTGG AATAACTGAA AAAACGACAG AAATAGGGAA3241 GTTGATATTT TATCATTCAT ATGGAAGATG GGATAGTGCA ATTGCAATCT CTGTGTTAGG3301 TATATTAAGT ATTGTGCCTG GACAACTATT AGAGATATGT GCAATTTTAA TTATTAGTTT3361 TGTTTTTATT CAATTAATTA TAAATATGCT TGACAATACT GAGCAGCAAA ATACGGTTGC3421 ATTTTTCTTC ATTATATTAA CTCTTTATCA GGGGTTTTGG GGGTTGCTGG CTAATTATGT3481 CTATGCGCTA TTCATTTATT TAATTATTAT AGCATCTTGT AATTTAATGA TGTCTAAAAG SD orf3的起始,orf2的終止3601 CGAAGGACGA AATTTCAGGA AAGATTTTCT TTAGTCTCCA AATTGAAATT TCAATTTTTC3661 GATGGCGTGT ATGGGAAGAA TATTCCAGAC GAGATTTTGA AAAGTATATA TGATGATAAA3721 AAGGCTAAGT TGAAGATTAA CCGAAGTATG ACAGTAGGTG AAATTGGGGC AACATATTCA3781 CATTACTTAA TATATAAAGA CGCATATGAA AAAAAACTTG ATTATCTAAT TGTACTCGAG3841 GATGACTCTT TTGTAGATGA AAATTTTGAT GATGTAATTA ATAGGTTACT TGTAAAAATA3901 ACACCAGATG ATGATGCTAT TATATTTATA CAAAAGCATA CCCTTGACTC TAAAGTGATT3961 TTTAGTCGAA AAAAAGATAT ATTGAAAAAC GGTTTTGAGT TGGTAAAAAT GTTAGGAAGT4021 TCACAATATT TTGTTGGGTC ATATGGCTAT ATTCTAACTA AAAAATCAAT TAACAAAATA4081 ATACAGAACT ATTTGCCAAT ATATTGTGTT TGCGACCATT GGTTCTTTAT TAAAAAAGAT4141 AGTAAGATAG AGTCATTTTA TTGTGTGAGC CCAAGTTTAG TATATACTAA TGATGAAGAT4201 ATTAGACTGG TTGATAGTTT TATCAATGAA GAAAGGAAAA ATGTTCTGAA AAATCGAGGT SD4321 AAGGATTGGG AATAGTGTTT TATATTTGTA AGGTAATCAC CGTTTTAATC AAGGTTATAAorf3的終止;orf4的起始4381 TTTCATTCTT GGTGTTTCCA TTGTGTAAGC CATTTAGTAA TAAAAATAAA AAAGTGGTTG4441 TAATAGGAAC TCGAAATGGA AATCAAGGTA ATGATAATGG TGAGGTTTTT TATTCATATT4501 TAAATGACAA TAATGACAAT GACGATCTTC TGGTTTATTT AATACGGAGA AGTAAGAATA4561 AGGAGAAATA TAAAAATATC CTAATAAAAA ACTCCATCAG AGCTAACATT AAGATTTTAA4621 GTGCGGACAT ATTATATATA ACACATTCAG AATCAGATTT AATTGACTTC TGGTGGCGAT4681 TCGTTACTTA TAAAAAAATA GTTTTTATTC AGCATGGTGT TATAGGAATA AAAAGACTTC4741 CTGAGTACGA AAAGAAAAAA TTCTCTCTTT TTGTTTCAAG CAACAATTAT GAATATGAGA4801 TTTTGATTAA ATATTATAAT ATATGTAGCG AAAGAATAGT TAAATCAGGA ATACCTAGGT4861 TTGATAATTA TACTATATTG AACGAAGCCC CACAGAAAAT AAAAAAATGC CTAGTCATGT4921 TTACATGGCG AAAATTTTAT AAAGATGAAC AATCAATCAG ATTGAAGCGT GTTATTAGTA4981 CAATAATTAG AAATGAGCCT TCAATAAAGA TATACGTTGC ATCGCACGAA TTATCTGATT5041 ATTCACTGTC AGAATTTGAA TTTTATAATA TCAATTATGT GGAATCAATA GGTATACAGA5101 ATGCAATTAA AGAGTGTGAT CTATTAATAA CTGATTTTTC AAGTATTGCT TGGGATTTTT5161 TATATCAAAA TAAATTGATT TGCTTTATAC AAACTGATTA TTTAGAATAT GTTTTCAATG5221 AGGGTGTCTA TTTCCATTGT GATGATTTTT TTGGTTATAT TATCAGGGAT CTAAGTGATA5281 TTAATGATGC CTTTATTTCG GAAATTTTAA GAGTTAATAA GTTAAATAAT CAAGAATTCT5341 TAAAAAGATA CCCTTTTTAT ATAAACTATA AGAAAAAGCA CTCTGAGTTA TTATTTCTAG SD orf5的起始,orf4的終止5461 CGCTCTTTCG CTTTTAAATG ATTTGCTGGA ATATGCGAAT GATGATATTG ATAATGAATA5521 TACTGTTTGC GTTAATGAAA AATTAAATAA CGAAGTGTCT GTTTACAATA ATTTGACATT5581 TTTATTTGTT GATACTAAAG CTTGGCATAA AAGGGTTTAT TTTGACTTTA TAGGGTTTAA5641 AAAAAACTTT GATAATAAAG ATTATTGCTT GGTAATAAAT TTGCAAAATA TACCAGTTCG5701 GACACAATTA AAACAAATAT TGTACTTGCA TCAGCCTTTG CCTTTTTCGG ATATTAAGTT5761 AAAATTTTTG GAGAAGCGTA ATAGAAAATT GATATTCTAT AATAACTTAT ATGGATTAAT5821 AATAAAATTT AATTCATGTT TTATTGATCA TTGCTTAGTG CAAACTGAGT GGATGAGAAA5881 AGCTGTTATT GATAAACTAA ACCTGTCTGA GAAAAAAATA AGTATAATTA GACCAGTAAT5941 AGATATTGAT TTGAACAAAA TTTTAAAAAA TGAAAATGAA AATGAAAATA CATTCATCTA6001 TCCCGCAGCA TCTTATAGTT ATAAAAATCA TATAATATTG GTTGAATCAT TAAATATGAT6061 TGGTGTGGAT TTTTTGTTTC AGAATAAGAT AACTGTTATA TTTACATTAG ATCGTGATGA6121 AAATTCGAAG TTGTTTGATC GGATAAAAAA ATATAATCTT CAAGAGATTA TTAAATTTAC6181 AGGAAATATC CCAAGATATG ATGTTTTAAA TTACATTTAT AATGCTAAAG CCTTACTGTT6241 TCCATCAAGA CTAGAAACAT TTGGTATACC ATTGATAGAA GCTGTAAAAT TTAATTCTAA6301 CATAATTGTA AGTGATCTAC CTTATGCGCA CGACGTATTG GATGGTTATG AAAATGTCAA6361 ATACTGTAAT CCTGATTCTC CAGAGGATTG GTCTGAAGCA ATCAAATTTG CTATCAATCT6421 AAAAGAGAAT AAATTAAATC AGGGCTTTGA ATTAAATTCA GGGTGGAGAG AGTTGAGTTC orf5的終止SD orf6的起始6541 GTTTTATTAA TAACCGGTGG GACTGGTTCT TTTGGAAATG CTGTATTGCG GCGATTTCTT6601 GACACAGATA TTAAAGAAAT TCGTGTTTTT TCGCGTGATG AAAAGAAACA AGATGATATG6661 CGAAAAAAAT ACAATAATGA TAAATTGAAA TTCTATATTG GTGATGTCAG AGATTATAGA6721 AGTATTTTAA ATGCTACACG AGGTGTTGAT TATATTTATC ATGCAGCTGC ATTAAAACAA6781 GTTCCTTCGT GTGAATTCCA TCCTATGGAG GCAGTTAAGA CCAACGTGTT AGGTACTGAG6841 AATGTGTTGG AGGCTGCAAT TTCTAATGGA GTTAAACGAG TAGTTTGTTT GAGTACTGAT6901 AAAGCCGTGT ACCCCATTAA TGTAATGGGG ATTTCCAAAG CAATGATGGA AAAAGTAATT6961 GTAGCGAAAT CGCGTAATTT GGATAGTTCT AAAACTGTCA TTTGTGGAAC TCGCTATGGC7021 AACGTTATGG CATCGCGTGG CTCAGTTATT CCTCTGTTTG TGGATTTGAT TAAAGCAGGA7081 AAACCGCTAA CAGTGACGAA CCCTGATATG ACAAGGTTTA TGATGACGCT TGAAGATGCG7141 GTAGACCTAG TTCTTTATGC ATTTGAACAT GGTAATAATG GCGATATTTT CGTACAAAAA7201 GCACCAGCAG CTACCATTGA AACTTTAGCA ATTGCACTCA AGGAACTATT GGGTGCTAAT7261 GAACATCCGG TCAAAATTAT AGGTACCAGA CACGGCGAAA AATTATATGA GGCGTTATTG7321 AGTCGTGAAG AGATGATCGC AGCAATCGAT ATGGGAGAAT ATTACTGTGT TCCGCCAGAC7381 TTGCGTGACC TTAACTATAG TAAATATGTT GAGCATGGTG ATTGTCGAAT TTCAGAAATT7441 GAAGACTATA ATTCACACAA TACAGTAAGG CTGGATGTTA AAGGAATGAA GGAATTATTG SD orf6的終止7561 TATGAAAATA CTAATTACTG GTTCTAAAGG TTTTATTGCT CGTAATTTAA TCTATCGCCTorf7的起始7621 GCAGGAAGCA GGCTTTAAAG ATTTAATTAC GATCGACCGT GAATCACCTT TGCAAGAGTT7681 AGAACAGGGA CTCAAAATTG CTGATTTTAT TTATCATCTT GCTGGTGTAA ATAGGCCAAA7741 GGAAGAACAT GAGTTTCAGG AGGGAAATAC TGATCTTACA AAATTAATTG TTGACTATCT7801 GCTTTGTAAT GCAAAAAAGA CTCCTATTAT GCTTAGTTCC TCCATTCAGG CTGAATGTGA7861 TAACGCGTAT GGAAAAAGCA AGGCATCGGC GGAAAAAATC ATTCAACATT ATGGTCATGT7921 TAGTGGCGCA GAATATTATA TCTATCGATT ACCAAATGTG TTCGGTAAGT GGTGTCGACC7981 AAATTACAAC TCCTTTGTTG CAACTTTTTG TCATAGGATA GCAAACGATC AAGATATTAT8041 CATTCATGAC CCGACAGCAG AGGTCGAGCT TGTTTATATT GATGATTTTT GTACTGATGC8101 TATCAACTTA TTAAATAACA AGTACGCGTC AGGTTTTAAA AATATAAAGC CGACGTATTC8161 AATAACAGTG GGTGAGGTAG CAAATCTAAT TTATAAATTT AAAGAAAGTA GACATACTCT8221 TATTACGGAA AATGTTGGTC AGGGTTTTTC ACGAGCGTTA TATTCAACTT GGCTTAGTTA8281 CTTGCAACCA GAGCAGTTCG TGTATGCAGT GCCTTCCTAT AGTGATGAAA GAGGAGTGTT8341 CTGCGAGGTC TTAAAAACCC ATTCCTCTGG ACAATTTTCA TTTTTTACCG CACTTCCAGG8401 AGTAACGCGT GGAGGGCACT ATCATCATAC AAAGAATGAA AAATTTATCG TTATTCGTGG8461 AACAGCATGT TTTAGGTTTA AAAATGTTTT AACAGGAGAA CGATATGAGA TTAATGTTGC8521 GTCAGATGAA TATAAAATTG TAGAAACTGT GCCAGGTTGG TCCCATGATA TTACTAATAC8581 CGGTCATGAT GAATTAATCG TAATGTTGTG GGCGAATGAA ATATTTAATC GTGATCAACC SD orf8的起始,orf7的終止8701 CGTCCAGAAA TTATTCGACT TTCGCGTGTC CTTGCAAAAT TAGATGAATA TTGTGACCAC8761 CTTATTGTTC ATACTGGACA AAACTACGAT TATGAATTGA ATGAAGTTTT TTTCAAAGAT8821 TTGGGTGTTC GCAAACCTGA TTATTTTCTT AATGCCGCAG GTAAAAATGC AGCAGAGACT8881 ATTGGACAAG TTATTATTAA AGTTGATGAG GTCCTTGAAC AGGAAAAACC AGAAGCCATG8941 TTAGTTCTTG GTGATACTAA CTCCTGTATT TCAGCAATAC CAGCAAAGCG TCGAAGAATT9001 CCGATCTTCC ATATGGAGGC TGGGAATCGT TGTTTTGACC AACGCGTACC GGAAGAAACT9061 AACAGAAAAA TAGTTGACCA TACCGCTGAT ATCAATATGA CATATAGTGA TATCGCGCGT9121 GAATATCTTC TGGCTGAAGG TGTACCAGCC GATAGAATTA TTAAAACTGG TAGCCCAATG9181 TTTGAAGTAC TCACGCATTA TATGCCGCAG ATTGATGGTT CCGATGTACT TTCTCGCCTG9241 AATTTAACAC CTGGGAATTT CTTTGTGGTA AGTGCCCACA GAGAAGAAAA TGTTGATACC9301 CCTAAACAGC TTGCGAAACT GGCGAATATA CTTAATACCG TAGCTGAAAA ATATGATGTC9361 CCGGTAGTCG TTTCTACTCA TCCTCGCACT CGTAACCGCA TCAACGAAAA CGGTATTCAA9421 TTCCATAAAA ATATCTTGCT TCTTAAGCCA TTAGGATTTC ACGATTACAA CCATCTGCAA9481 AAAAATGCGC GTGCTGTTTT ATCGGATAGT GGGACTATTA CAGAAGAGTC CTCCATTATG9541 AACTTCCCTG CACTCAATAT ACGAGAAGCG CACGAACGCC CGGAAGGCTT CGAAGAAGGG9601 GCAGTAATGA TGGTCGGCCT TGAATCTGAG CGCGTTTTAC AGGCATTAGA AATTATCGCA9661 ACACAGCCTC GTGGAGAAGT ACGCTTACTC CGTCAGGTCA GTGACTATAG CATGCCAAAT9721 GTTTCAGATA AAGTTGTGCG TATTATCCAT TCATACACTG ACTACGTTAA ACGGGTTGTC SD orf8的終止,orf9的起始9841 GTGTTGGGGC TAAAATGTTT CATGAGTTAG GCCTTGAATT GCTGAGCAGA GGCCATGATG9901 TAACTGTAAT TACGCCTGAC ATCACATTAC AAGTAATCTA TTCTGTTAGT ATGATTGATG9961 GTATAAAGGT TTGGCGTTTC AAAAGTGGCC CTTTAAAGGA TGTAGGTAAG GCTAAACGTG10021 CCATAAATGA AACTCTTTTA TCTTTTCGTG CATGGCGCGC ATTTAAGCAC CTCATTCAGC10081 ATGATACATT TGATGGTATT GTTTATTATT CCCCCTCTAT TTTTTGGGGA GACTTGGTTA10141 AAAAAATAAA ACAGCGATGC CAGTGCCCAA GCTATCTGGT CCTGAGGGAT ATGTTTCCAC10201 AGTGGGTTAT TGATGCAGGT ATGTTGAAAG CCGGTTCACC AATTGAAAAA TATTTCAGGT10261 ATTTTGAAAA AAAATCATAT CAGCAGGCTG ACCGGATAGG GTTAATGTCT GATAAGAATC10321 TTGAGATATT TCGTCAGGCC AATAAAAATT ATCCGTGTGA AGTTTTACGT AATTGGGCCT10381 CAATGACTCC TGTGTCTGCC AGCGATGATT ATCATTCACT TCGTCAAAAA TACGATCTAA10441 AAGATAAAGT TATTTTTTTC TATGGCGGAA ATATTGGGCA TGCTCAAGAT ATGGCAAACT10501 TAATGCGCCT TGCGCGTGAT ATGATGCGTT ATCATGATGC TCATTTCCTG TTTATAGGGC10561 AGGGTGATGA AGTTGACCTG ATAAAATCTC TTGCTGTAGA ATGGAATTTA ACTAATTTCA10621 TTCATCTACC TTCAGTGACC CAAGAAGAGT TCAAATTAAT TTTATCTGAA GTTGATGTCG10681 GCCTATTCTC CCTTTCATCT CGCCATTCTT CACATAATTT CCCCGGGAAA TTACTCGGGT10741 ATATGGTTCA TTCAATCCCG ATTCTTGGGA GTGTGAATGA CGGCAATGAT TTGATGGATA10801 TAATTAACAA GCACAGGGCC GGTTTTATTC ATGTTAATGG TGAAGATGAT AAACTGTTTG10861 AATCTGCACA ATTGCTTCTT AGTGATTCAG TTTTAAGAAA ACAGTTAGGT CAGAACGCTA10921 ATGTGTTGTT AAAGTCTCAA TTTTCGGTTG AATCGGCGGC ACATACTATC GAAGTCCGAC SD orf10的起始orf9的終止11041 AGTAAATTCT GAACGTTTGC GCGCTCATTA TTTATTGCAC GCATCTCATC AGGAGAAAGT11101 TCAACGTTTA CTTATTGCAT TTGTACGCGA CAGCTATGTT GAACCCCATT GGCATGAGTT11161 ACCGCATCAG TGGGAAATGT TTGTCGTCAT GCAAGGGCAA TTAGAAGTTT GTTTGTATGA11221 GCAAAATGGT GAGATCCAAA AAAAGTTTGT TGTTGGAGAC GGTACGGGAA TAAGCGTCGT11281 GGAATTTTCC CCAGGAGATA TACATAGTGT CAAATGCCTG TCACCAAAAG CCCTTATGTT11341 AGAGATAAAG GAGGGGCCAT TTGACCCACT GAAAGCTAAG GTTTTTTCTA AGTGGTTATA11401 GGGCGATACA TCACCGTTTA TTCTTCTATC TTATTCTATA CATGCTGGGT TACCATCTTAorfl0的終止
11461 GCTTCTTCAA GCCGCACACC CGCAGCGAAC ACCCCTGACA GGAGTAAACA ATGTCAAAGC11521 AACAGATCGG CGTCGTCGGT ATGGCAGTAA TGGGGCGCAA CCTTGCGCTC AACATCGAAA11581 GCCGTGGTTA TACCGTCTCT ATTTTCAACC GTTCCCGTGA GAAGACGGAA GAAGTGATTG11641 CCGAAAATCC GGGCAAGAAA CTGGTTCCTT ACTATACGGT GAAAGAGTTT GTTGAATCTC11701 TGGAAACGCC TCGTCGCATC CTGTTAATGG TGAAAGCAGG TGCAGGCACG GATGCTGCTA11761 TTGATTCTCT CAAGCCATAC CTCGATAAAG GCGACATCAT CATTGATGGT GGTAACACCT11821 TCTTCCAGGA CACCATCCGT CGTAACCGTG AGCTTTCTGC AGAAGGCTTT AACTTCATCG11881 GTACCGGTGT CTCCGGCGGT GAAGAAGGTG CGCTGAAAGG TCCTTCCATT ATGCCTGGTG11941 GGCAGAAAGA AGCCTATGAA CTGGTTGCGC CGATCCTGAC CAAAATCGCC GCAGTGGCTG12001 AAGATGGCGA ACCGTGCGTT ACCTATATTG GTGCCGATGG TGCAGGTCAT TATGTGAAGA12061 TGGTTCACAA CGGTATTGAA TACGGTGATA TGCAGCTGAT TGCCGAAGCC TATTCTCTGC12121 TAAAAGGTGG CCTGAACCTT ACCAACGAAG AACTGTCACA GACCTTTACC GAATGGAATA12181 ACGGTGAACT GAGCAGCTAC CTGATCGACA TCACCAAAGA TATCTTCACC AAAAAAGATG12241 AAGACGGTAA CTACCTGGTT GATGTGATTC TGGATGAAGC AGCAAACAAA GGTACGGGTA12301 AATGGACCAG CCAGAGTGCG CTGGATCTCG GTGAACCGCT GTCGCTAATT ACCGAGTCTG12361 TGTTTGCACG TTATGTCTCT TCTCTGAAAG ATCAGCGTGT TGCCGCATCT AAAGTTCTCT12421 CTGGCCCGCA AGCGCAGCCA GCTGGCGACA AGGCTGAGTT CATCGAAAAA GTTCGTCGTG12481 CGCTGTATCT GGGCAAAATC GTTTCTTACG CCCAGGGCTT CTCTCAGCTG CGTGCTGCGT12541 CTGAAGAGTA CAACTGGGAT CTGAACTACG GCGAAATCGC GAAGATTTTC CGTGCTGGCT12601 GCATCATCCG TGCGCAGTTC CTGCAGAAAA TCACCGATGC TTATGCCGAA AATCCACAGA12661 TCACTAACCT GCTGCTGGCT CCGTACTTCA AGCAAATTGC CGATGACTAC CAGCAGGCGC12721 TGCGCGATGT CGTCGCATAT GCAGTACAGA ACGGTATCCC GGTTCCGACC TTCGCCGCTG12781 CGGTTGCCTA TTATGACAGC TACCGTGCCG CTGTTCTGCC TGCGAACCTG ATCCAGGCAC12841 AGCGCGACTA以上所述,僅是本發明的較佳實施例而已,並非對本發明作任何形式上的限制,凡是依據本發明的技術實質對以上實施例所作的任何簡單修改、等同變化與修飾,均仍屬於本發明技術方案的範圍內。
權利要求
1.一種對大腸桿菌O172型的O-抗原特異的核苷酸,其特徵在於,其是如SEQ ID NO1所示的分離的核苷酸,全長12850個鹼基;或者具有一個或多個插入、缺失或取代的鹼基,同時保持所述分離的核苷酸功能的SEQ IDNO1的核苷酸。
2.按照權利要求1所述的對大腸桿菌O172型的O-抗原特異的核苷酸,其特徵在於,其是由10個基因組成,都位於galF基因和gnd基因之間。
3.按照權利要求2所述的對大腸桿菌O172型的O-抗原特異的核苷酸,其特徵在於,所述的基因是轉運酶的基因,包括wzx基因或與wzx有相似功能的基因;聚合酶基因wzy基因或與wzy有相似功能的基因;糖基轉移酶基因,包括orf3、orf4、orf5、orf9基因;其中所述的基因wzx是SEQ ID NO1中的1120至2388鹼基的核苷酸;wzy是SEQ ID NO1中的2381至3556鹼基的核苷酸;orf3是SEQ ID NO1中的3553至4335鹼基的核苷酸;orf4是SEQ ID NO1中的4335至5423鹼基的核苷酸;orf5是SEQ ID NO1中的5420至6499鹼基的核苷酸;orf9是SEQ ID NO1中的9795至11003鹼基的核苷酸。
4.按照權利要求1或2所述的對大腸桿菌O172型的O-抗原特異的核苷酸,其特徵在於,它是源於所述的wzx基因、wzy基因或糖基轉移酶基因orf3、orf4、orf5、orf9基因;以及它們的混合或它們的重組。
5.按照權利要求4所述的對大腸桿菌O172型的O-抗原特異的核苷酸,其特徵在於,所述的源於wzx基因的寡核苷酸對是SEQ ID NO1中的1166至1182鹼基的核苷酸和1854至1870鹼基的核苷酸;SEQ ID NO1中的1415至1434鹼基的核苷酸和2286至2303鹼基的核苷酸;SEQ ID NO1中的1157至1174鹼基的核苷酸和1934至1951鹼基的核苷酸;源於wzy基因的寡核苷酸對是SEQ ID NO1中的2610至2627鹼基的核苷酸和3452至3470鹼基的核苷酸;SEQ ID NO1中的2711至2728鹼基的核苷酸和3460至3477鹼基的核苷酸;SEQ ID NO1中的2742至2759鹼基的核苷酸和3480至3496鹼基的核苷酸;源於orf3基因的寡核苷酸對是SEQ ID NO1中的3660至3677鹼基的核苷酸和4255至4274鹼基的核苷酸;SEQ ID NO1中的3728至3745鹼基的核苷酸和4296至4313鹼基的核苷酸;SEQ ID NO1中的3752至3769鹼基的核苷酸和4308至4325鹼基的核苷酸;源於orf4基因的寡核苷酸對是SEQ ID NO1中的4391至4410鹼基的核苷酸和5211至5228鹼基的核苷酸;SEQ ID NO1中的4463至4470鹼基的核苷酸和5271至5289鹼基的核苷酸;SEQ ID NO1中的4515至4530鹼基的核苷酸和5396至5418鹼基的核苷酸;源於orf5基因的寡核苷酸對是SEQ ID NO1中的5435至5452鹼基的核苷酸和5992至6009鹼基的核苷酸;SEQ ID NO1中的5687至5704鹼基的核苷酸和6230至6247鹼基的核苷酸;SEQ ID NO1中的5724至5741鹼基的核苷酸和6319至6336鹼基的核苷酸;源於orf9基因的寡核苷酸對是SEQ IDNO1中的9825至9842鹼基的核苷酸和10687至10704鹼基的核苷酸;SEQ IDNO1中的10001至10017鹼基的核苷酸和10682至10699鹼基的核苷酸;SEQID NO1中的10201至10218鹼基的核苷酸和10954至10971鹼基的核苷酸。
6.權利要求1所述的對大腸桿菌O172型的O-抗原特異的核苷酸在檢測表達O-抗原的細菌、在診斷中鑑定細菌的O-抗原和細菌的其它多糖抗原的應用。
7.權利要求1所述的對大腸桿菌O172型的O-抗原特異的核苷酸的重組分子,而且通過插入表達可提供表達大腸桿菌O172型的O-抗原,並成為細菌疫苗。
8.按照權利要求1所述的對大腸桿菌O172型的O-抗原特異的核苷酸的應用,其特徵在於它作為引物用於PCR、作為探針用於雜交反應與螢光檢測、或者用於製造基因晶片或微陣列,檢測人體和環境中的細菌。
9.權利要求1所述的對大腸桿菌O172型的O-抗原特異的核苷酸的分離方法,其特徵在於,其包括下述步驟(1)基因組的提取在5mL的LB培養基中37℃過夜培養大腸桿菌O172型,離心收集細胞。用500ul 50mM Tris-HCl(pH8.0)和10ul 0.4M EDTA重懸細胞,37℃溫育20分鐘,然後加入10ul 10mg/ml的溶菌酶繼續保溫20分鐘,之後加入3ul 20rng/ml的蛋白酶K、15ul 10%SDS,50℃溫育2小時,再加入3ul 10mg/ml的RNase,65℃溫育30分鐘。加等體積酚抽提混合物,取上清再用等體積的酚∶氯仿∶異戊醇(25∶24∶1)混合溶液抽提兩次,取上清再用等體積的乙醚抽提以除去殘餘的酚,上清用2倍體積乙醇沉澱DNA,用玻璃絲卷出DNA並用70%乙醇洗DNA,將DNA重懸於30ul TE中;基因組DNA通過0.4%的瓊脂糖凝膠電泳檢測;(2)通過PCR擴增大腸桿菌O172型中的O-抗原基因簇以大腸桿菌O172型的基因組為模板通過Long PCR擴增其O-抗原基因簇,首先根據經常發現於O-抗原基因簇啟動子區的JumpStart序列設計上遊引物(5』-ATT GTG GCTGCA GGG ATC AAA GAA AT-3』),再根據O-抗原基因簇下遊的gnd基因設計下遊引物(5』-TAG TCG CGT GNG CCT GGA TTA AGT TCG C-3』);用Boehringer Mannheim公司的Expand Long Template PCR方法擴增O-抗原基因簇,PCR反應程序如下在94℃預變性2分鐘;然後94℃變性10秒,60℃退火30秒,68℃延伸15分鐘,這樣進行30個循環,最後,在68℃繼續延伸7分鐘,得到PCR產物,用0.8%的瓊脂糖凝膠電泳檢測PCR產物的大小及其特異性,合併6管long PCR產物,並用Promega公司的Wizard PCR Preps純化試劑盒純化PCR產物;(3)構建O-抗原基因簇文庫用被修改的Novagen DNaseI shot gun法構建O-抗原基因簇文庫,反應體系是300ngPCR純化產物,0.9ul 0.1M MnCl2,1ul 1∶2000稀釋的1mg/ml的DNaseI,反應在室溫中進行,酶切10分鐘使DNA片段大小集中在1kb-3kb之間,而後加入2ul 0.1M EDTA終止反應,合併4管同樣的反應體系,用等體積的酚抽提一次,用等體積的酚∶氯仿∶異戊醇(25∶24∶1)混合溶液抽提一次,再用等體積的乙醚抽提一次後,用2.5倍體積的無水乙醇沉澱DNA,並用70%乙醇洗沉澱,最後重懸於18ul水中,隨後在此混合物中加入2.5ul dNTP(1mMdCTP,1mMdGTP,1mMdTTP,10mMdATP),1.25ul 100mMDTT和5單位的T4DNA聚合酶,11℃ 30分鐘,將酶切產物補成平端,75℃終止反應後,加入5單位的Tth DNA聚合酶及其相應的緩衝液並將體系擴大為80ul,70℃反應20分鐘,使DNA的3′端加dA尾,此混合物經等體積氯仿∶異戊醇(24∶1)混合溶液抽提和等體積乙醚抽提後與Promega公司的3×10-3的pGEM-T-Easy載體於16℃連接24小時,總體積為90ul,其中有9ul的10×buffer和25單位的T4DNA連接酶。最後用1/10體積的3M NaAc(pH5.2)和2倍體積的無水乙醇沉澱連接混合物,再用70%乙醇洗沉澱,乾燥後溶於30ul水中得到連接產物;用Bi0-Rad公司的電轉化感受態細胞的製備方法製備感受態大腸桿菌DH5a細胞,取2-3ul連接產物與50ul感受態大腸桿菌DH5a混合後,轉到BiO-Rad公司的0.2cm的電擊杯中電擊,電壓為2.5千伏,時間為5.0毫秒至6.0毫秒,電擊後立即在杯中加入1ml的SOC培養基使菌復甦,然後將菌塗在含有氨苄青黴素、X-Gal和IPTG的LB固體培養基上,在37℃過夜培養,次日得到藍白菌落,將得到的白色菌落即白色克隆轉到含有氨卞青黴素的LB固體培養基上培養,同時從每個克隆中提取質粒,並用EcoRI酶切鑑定其中的插入片段的大小,得到的白色克隆群構成了大腸桿菌O172型的O-抗原基因簇文庫;(4)對文庫中的克隆測序從文庫中挑選插入片段在700bp以上的120個克隆由上海生物工程有限公司用ABI377型DNA自動測序儀對克隆中的插入片段單向進行測序,使序列達到90%的覆蓋率,剩餘10%的序列再通過將部分序列反向測序,從而獲得O-抗原基因簇的所有序列;(5)核苷酸序列的拼接及分析用英國劍橋MRC(Medical Research Council)分子生物學實驗室出版的Staden package軟體包的Pregap4和Gap4軟體拼接和編輯所有的序列,從而得到大腸桿菌O172型的O-抗原基因簇的核苷酸全長序列;序列的質量主要由兩個方面來保證1)對大腸桿菌O172型的基因組作6個Long PCR反應,然後混合這些產物以產生文庫,2)對每個鹼基,保證3個以上高質量的覆蓋率,在得到大腸桿菌O172型O-抗原基因簇的核苷酸序列後,用美國國家生物技術信息學中心(The National Center forBiotechnology Information,NCBI)的orffinder發現基因,找到10個開放的閱讀框,用blast系列軟體與GenBank中的基因比較以發現這些開放的閱讀框的功能並確定它們是什麼基因,再用英國sanger中心的Artemis軟體完成基因注釋,用Clustral W軟體做DNA和蛋白質序列間的精確比對,最後得到大腸桿菌O172型的O-抗原基因簇的結構;(6)特異基因的篩選針對痢大腸桿菌O172型的O-抗原基因簇中的wzx、wzy、orf3、orf4、orf5、orf9基因設計引物;在每個基因內各設計了三對引物,每對引物分布在相應基因內的不同地方,以確保其特異性;用這些引物以166株大腸桿菌和43株志賀氏菌的基因組為模板進行PCR,除源自orf9的的三對在O12、O25、O26中得到大小正確的帶外,在其他組中都沒有擴增到任何大小正確的帶,即在大多數組中沒有得到任何PCR產物帶,雖然在少數組中得到PDR產物帶,但其大小不符合預期大小,所以wzx、wzy、orf3、orf4、orf5基因對大腸桿菌O172型的O-抗原都是高度特異的。
全文摘要
本發明提供一種對大腸桿菌O172型(Escherichiacoli O172)的O-抗原特異的核苷酸,它是大腸桿菌O172型中控制O-抗原合成的基因簇的核苷酸全序列,如SEQ ID NO1所示的分離的核苷酸,全長12850個鹼基;或者具有一個或多個插入、缺失或取代的鹼基,同時保持所述分離的核苷酸功能的SEQ ID NO1的核苷酸;還包括源於大腸桿菌O172型的O-抗原基因簇中的糖基轉移酶基因和寡糖單位處理基因的寡核苷酸;本發明通過PCR證實寡核苷酸對大腸桿菌O172型的O-抗原都有高度的特異性;本發明還公開了用本發明的寡核苷酸檢測和鑑定人體及環境中的大腸桿菌O172型的方法。
文檔編號C07H21/00GK1442424SQ03109589
公開日2003年9月17日 申請日期2003年4月15日 優先權日2003年4月15日
發明者王磊, 郭宏傑, 馮露 申請人:南開大學

同类文章

一種新型多功能組合攝影箱的製作方法

一種新型多功能組合攝影箱的製作方法【專利摘要】本實用新型公開了一種新型多功能組合攝影箱,包括敞開式箱體和前攝影蓋,在箱體頂部設有移動式光源盒,在箱體底部設有LED脫影板,LED脫影板放置在底板上;移動式光源盒包括上蓋,上蓋內設有光源,上蓋部設有磨沙透光片,磨沙透光片將光源封閉在上蓋內;所述LED脫影

壓縮模式圖樣重疊檢測方法與裝置與流程

本發明涉及通信領域,特別涉及一種壓縮模式圖樣重疊檢測方法與裝置。背景技術:在寬帶碼分多址(WCDMA,WidebandCodeDivisionMultipleAccess)系統頻分復用(FDD,FrequencyDivisionDuplex)模式下,為了進行異頻硬切換、FDD到時分復用(TDD,Ti

個性化檯曆的製作方法

專利名稱::個性化檯曆的製作方法技術領域::本實用新型涉及一種檯曆,尤其涉及一種既顯示月曆、又能插入照片的個性化檯曆,屬於生活文化藝術用品領域。背景技術::公知的立式檯曆每頁皆由月曆和畫面兩部分構成,這兩部分都是事先印刷好,固定而不能更換的。畫面或為風景,或為模特、明星。功能單一局限性較大。特別是畫

一種實現縮放的視頻解碼方法

專利名稱:一種實現縮放的視頻解碼方法技術領域:本發明涉及視頻信號處理領域,特別是一種實現縮放的視頻解碼方法。背景技術: Mpeg標準是由運動圖像專家組(Moving Picture Expert Group,MPEG)開發的用於視頻和音頻壓縮的一系列演進的標準。按照Mpeg標準,視頻圖像壓縮編碼後包

基於加熱模壓的纖維增強PBT複合材料成型工藝的製作方法

本發明涉及一種基於加熱模壓的纖維增強pbt複合材料成型工藝。背景技術:熱塑性複合材料與傳統熱固性複合材料相比其具有較好的韌性和抗衝擊性能,此外其還具有可回收利用等優點。熱塑性塑料在液態時流動能力差,使得其與纖維結合浸潤困難。環狀對苯二甲酸丁二醇酯(cbt)是一種環狀預聚物,該材料力學性能差不適合做纖

一種pe滾塑儲槽的製作方法

專利名稱:一種pe滾塑儲槽的製作方法技術領域:一種PE滾塑儲槽一、 技術領域 本實用新型涉及一種PE滾塑儲槽,主要用於化工、染料、醫藥、農藥、冶金、稀土、機械、電子、電力、環保、紡織、釀造、釀造、食品、給水、排水等行業儲存液體使用。二、 背景技術 目前,化工液體耐腐蝕貯運設備,普遍使用傳統的玻璃鋼容

釘的製作方法

專利名稱:釘的製作方法技術領域:本實用新型涉及一種釘,尤其涉及一種可提供方便拔除的鐵(鋼)釘。背景技術:考慮到廢木材回收後再加工利用作業的方便性與安全性,根據環保規定,廢木材的回收是必須將釘於廢木材上的鐵(鋼)釘拔除。如圖1、圖2所示,目前用以釘入木材的鐵(鋼)釘10主要是在一釘體11的一端形成一尖

直流氧噴裝置的製作方法

專利名稱:直流氧噴裝置的製作方法技術領域:本實用新型涉及ー種醫療器械,具體地說是ー種直流氧噴裝置。背景技術:臨床上的放療過程極易造成患者的局部皮膚損傷和炎症,被稱為「放射性皮炎」。目前對於放射性皮炎的主要治療措施是塗抹藥膏,而放射性皮炎患者多伴有局部疼痛,對於止痛,多是通過ロ服或靜脈注射進行止痛治療

新型熱網閥門操作手輪的製作方法

專利名稱:新型熱網閥門操作手輪的製作方法技術領域:新型熱網閥門操作手輪技術領域:本實用新型涉及一種新型熱網閥門操作手輪,屬於機械領域。背景技術::閥門作為流體控制裝置應用廣泛,手輪傳動的閥門使用比例佔90%以上。國家標準中提及手輪所起作用為傳動功能,不作為閥門的運輸、起吊裝置,不承受軸向力。現有閥門

用來自動讀取管狀容器所載識別碼的裝置的製作方法

專利名稱:用來自動讀取管狀容器所載識別碼的裝置的製作方法背景技術:1-本發明所屬領域本發明涉及一種用來自動讀取管狀容器所載識別碼的裝置,其中的管狀容器被放在循環於配送鏈上的文檔匣或託架裝置中。本發明特別適用於,然而並非僅僅專用於,對引入自動分析系統的血液樣本試管之類的自動識別。本發明還涉及專為實現讀