新四季網

對鮑氏志賀氏菌10型的o-抗原特異的核苷酸的製作方法

2023-07-16 08:59:01 1

專利名稱:對鮑氏志賀氏菌10型的o-抗原特異的核苷酸的製作方法
技術領域:
本發明涉及鮑氏志賀氏菌10型(Escherichia coli O54)中控制O-抗原合成的基因簇的核苷酸全序列,特別是涉及鮑氏志賀氏菌10型中控制O-抗原合成的基因簇中的寡核苷酸,可利用這些對O-抗原特異的寡核苷酸快速、準確地檢測人體及環境中的鮑氏志賀氏菌10型並鑑定這些致病菌中的O-抗原。
背景技術:
鮑氏志賀氏菌10型是一種致病菌。志賀氏菌是隨著人類進化而發展起來的致病菌,能侵襲結腸膜上皮細胞,導致自限性化膿性感染病灶,引起人類的細菌性痢疾。人類對志賀氏菌有較高的敏感性,只需要少於十個菌就可以引起人的感染,兒童和成人易感染,特別是兒童,易引起急性中毒性痢疾,而志賀氏菌的O-抗原是志賀氏菌引起疾病的主要原因之一。
位於大腸桿菌表面的脂多糖是大腸桿菌致病的誘因,而O-抗原是脂多糖最外層結構,是免疫系統識別的目標和噬菌體吸附的位點。O-抗原的缺失會造成許多病原體的血清敏感,或者嚴重削弱病原體的毒力[Frank et al(1987)「The function of ant ibody and complement in the lysis of bacteria」.RevInfect Dis 1771750-1753.Pluschke G et al「Role of the capsule andthe O-antigen in resistance of O18K1Escherichia coli tocomplement-mediated king.J Bacteriol 42907-913]。大腸桿菌是一個種,種內的菌株一般通過O-抗原和H-抗原(有時通過K-抗原)來鑑定。其中O-抗原具有高度多樣性,大腸桿菌有166種不同的O-抗原,O-抗原的變化可能是大腸桿菌的起源和維持其多樣性的主要原因[Reeves,P.R(1992)「Variation in antigens,niche specific selection and bacterialpopulations」.FEMS Microbiol.Lett,100509-516]。
O-抗原是革蘭氏陰性細菌脂多糖中的O特異性多糖成分,它由許多重複的寡糖單位組成。O-抗原的合成過程研究得較清楚先由糖基轉移酶將核苷二磷酸單糖轉移到一個固定在細胞內膜的脂分子上,然後在內膜的內側合成寡糖單位,O-抗原的寡糖單位再通過o-抗原轉運酶被轉移到內膜外側,而後通過聚合酶聚合成多糖,再被連接到一個糖脂分子上形成脂多糖分子[Whitfield,C.(1995)「Biosynthesis of lipopolysaccharide Oantigens」.Trends in Microbiology.3178-178;Schnaitman,C.A.andJ.D.Klena.(1993)「Genetics of lipopolysaccharide biosynthesis inentericbacteria」.Microbiological Reviews,57(3)655-682]。編碼負責O-抗原合成的所有酶分子的基因一般在染色體上相鄰排列,形成一個基因簇[Reeves,P.R.,et al.(1996)「Bacterial polysaccharide synthesis and genenomenclature」Trends in Microbiology,4495-503]。在大腸桿菌、志賀氏菌和沙門氏菌中,O-抗原基因簇位於galf和gnd基因之間[Lei Wang.et al(2001)「Sequence analysis of four Shigella boydii O-antigen lociimplicationfor Escherichia coli and Shigella relationships」.Infection andImmunity,116923-6930;Lei Wang and Peter Reeves(2000)「The Escherichiacoli O111 and Salmonella enterica O35 gene clustersgene clusters encodingthe same colitose-containing O antigen are highly.conserved」.Journal ofBacteriology.1825256-5261]。O-抗原基因簇含有三類基因糖合成路徑基因,糖基轉移酶基因,寡糖單位處理基因,其中糖合成路徑基因編碼的酶合成O-抗原所需的核苷二磷酸單糖;糖基轉移酶基因編碼的酶將核苷二磷酸單糖及其它分子轉到單糖上從而使單糖聚合成寡糖單位;寡糖單位處理基因包括o-抗原轉運酶基因和聚合酶基因,它們將寡糖單位轉移到細菌內膜外側,再聚合成多糖。糖基轉移酶基因和寡糖單位處理基因只存在於攜帶這些基因的基因簇裡。O-抗原中單糖的不同,單糖間聯結鍵的不同和寡糖單位之間聯結鍵的不同構成了O-抗原的多樣性,而單糖的組成、單糖間的聯結鍵及寡糖單位之間的聯結鍵是由O-抗原基因簇中的基因控制著,所以O-抗原基因簇決定了O-抗原的合成,也決定了O-抗原的多樣性。
因為O-抗原是極強的抗原,是大腸桿菌重要的致病因素之一,同時它又具有極強的多樣性,這啟示我們能研究一種快速、準確地檢測大腸桿菌及其O-抗原的特異性好、靈敏度高的方法。以表面多糖為目標的血清學免疫反應自上世紀30年代以來一直被用於對細菌的分型和鑑定,是鑑定致病菌的唯一的手段。這種診斷方法需要大量的抗血清,而抗血清一般種類不全,數量不足,大量的抗血清在製備和儲存中也存在一些困難。另一方面此法耗時長、靈敏度低、漏檢率高、準確性差,所以,現在普遍認為這種傳統的血清學檢測方法將為現代分子生物學方法取代。1993年,Luk,J.M.C et.al用沙門氏菌(S.enterica)O-抗原基因簇的特異核苷酸序列通過PCR方法鑑定了沙門氏菌的O-抗原[Luk,J.M.C.et.al.(1993)「Selective amplification ofabequose and paratose synthase genes(rfb)by polymerase chain reactionfor identification of S.enterica major serogroups(A,B,C2,andD)」,J.Clin.Microbiol.312118-2123]。Luk,et.al的方法是將相應於沙門氏菌血清型E1,D1,A,B和C2的O-抗原內的CDP-阿比可糖和CDP-泰威糖的合成基因的核苷酸序列排列後得到對不同血清型的沙門氏菌特異的寡核苷酸。1996年,Paton,A.W et.al用對E.coli O111的O-抗原特異的源於wbdI基因的寡核苷酸鑑定了一株產毒素的E.coli O111的血清型[「Molecularmicrobiological investigation of an outbreak of Hemolytic-UremicSyndrome caused by dry fermented sausage contaminated with Shiga-liketoxin producing Escherichia coli」.J.Clin.Microbiol.341622-1627],但是後來的研究表明Paton,A.W et.al的用源於wbdI基因的寡核苷酸鑑定E.coli O111的血清型的方法有假陽性結果出現。Bastin D.A.and Reeves,P.R.認為,這是由於wbdI基因是一個推測的糖合成路徑基因[Bastin D.A.andReeves,P.R.(1995)「Sequence and analysis of the O antigen gene(rfb)cluster of Escherichia coli O111」.Gene 16417-23],而在其它細菌的O-抗原的結構中也可能有這個糖,所以糖合成路徑基因對於O-抗原並不是高度特異的。

發明內容
本發明的目的是提供了一種對鮑氏志賀氏菌10型的O-抗原特異的核苷酸。它是鮑氏志賀氏菌10型的O-抗原基因簇中的核苷酸,是源於o-抗原轉運酶基因、聚合酶基因、糖基轉移酶基因及orf8基因的特異的核苷酸。
本發明的一個目的是提供了鮑氏志賀氏菌10型的O-抗原基因簇的全長核苷酸序列。
本發明的次一目的是提供了構成鮑氏志賀氏菌10型的O-抗原基因簇的基因轉運酶基因即wzx基因或與wzx有相似功能的基因;聚合酶基因即wzy基因或與wzy有相似功能的基因;糖基轉移酶基因,包括orf1、orf2、orf4、orf5基因;糖合成路徑基因,包括manB、manC;未知功能的orf8基因。它們在O-抗原基因簇中的起始位置和終止位置及核苷酸序列都列在表4中。
本發明的又一目的是提供了寡核苷酸,它們分別源於鮑氏志賀氏菌10型的O-抗原基因簇中編碼轉運酶的基因即wzx基因或與wzx有相似功能的基因;源於編碼聚合酶的基因即wzy基因或與wzy有相似功能的基因;源於編碼糖基轉移酶的基因,包括orf1、orf2、orf4、orf5基因和未知功能的orf8基因。它們是上述基因內的寡核苷酸,長度在10-20nt;它們對鮑氏志賀氏菌10型的O-抗原是特異的;尤其是表1中列出的寡核苷酸,它們對鮑氏志賀氏菌10型的O-抗原是高度特異的,而且這些寡核苷酸還可重新組合,組合後的寡核苷酸對鮑氏志賀氏菌10型的O-抗原也是高度特異的。
本發明的另一目的是提供的上述寡核苷酸可作為引物用於核酸擴增反應,或者作為探針用於雜交反應,或者用於製造基因晶片或微陣列,從而通過這些方法來檢測和鑑定鮑氏志賀氏菌10型的O-抗原及檢測和鑑定鮑氏志賀氏菌10型。
本發明的再一目的是提供了分離鮑氏志賀氏菌10型的O-抗原基因簇的全序列的方法。按照本方法操作可以獲得其他細菌的O-抗原基因簇的全序列,也可以獲得編碼其他多糖抗原的細菌的基因簇的全序列。
本發明的目的是由以下技術方案實現的。
本發明對鮑氏志賀氏菌10型的O-抗原特異的核苷酸,其特徵在於,其是如SEQ ID NO1所示的分離的核苷酸,全長13402個鹼基;或者具有一個或多個插入、缺失或取代的鹼基,同時保持所述分離的核苷酸功能的SEQ IDNO1的核苷酸。
前述的對鮑氏志賀氏菌10型的O-抗原特異的核苷酸,其特徵在於,其由9個基因組成,都位於galF基因和gnd基因之間。
前述的對鮑氏志賀氏菌10型的O-抗原特異的核苷酸,其特徵在於,所述基因包括轉運酶基因即wzx基因或與wzx有相似功能的基因;聚合酶基因即wzy基因或與wzy有相似功能的基因;糖基轉移酶基因,包括orf1、orf2、orf4、orf5基因;功能未知的orf8基因;其中所述的轉運酶基因是SEQID NO1中的10458至11870鹼基的核苷酸;所述的聚合酶基因是SEQ ID NO1中的3195至4247鹼基的核苷酸;所述的orf1基因是SEQ ID NO1中的1098至2066鹼基的核苷酸;所述的orf2基因是SEQ ID NO1中的2059至3168鹼基的核苷酸;所述的orf4基因是SEQ ID NO1中的4240至5331鹼基的核苷酸;所述的off5基因是SEQ ID NO1中的5306至6424鹼基的核苷酸;所述的orf8基因是SEQ ID NO1中的9468至10424鹼基的核苷酸。
前述的對鮑氏志賀氏菌10型的O-抗原特異的核苷酸,其特徵在於,其還包括源於所述的wzx基因或wzy基因或糖基轉移酶基因或orf8基因的寡核苷酸;以及它們的混合或它們的重組。
前述的對鮑氏志賀氏菌10型的O-抗原高度特異的核苷酸,其特徵在於,所述的源於wzx基因的寡核苷酸對是SEQ ID NO1中的10757至10774鹼基的核苷酸和11648至11665鹼基的核苷酸;SEQ ID NO1中的10889至10906鹼基的核苷酸和11915至11932鹼基的核苷酸;源於wzy基因的寡核苷酸對是SEQ ID NO1中的3538至3555鹼基的核苷酸和4039至4056鹼基的核苷酸;SEQ ID NO1中的3418至3435鹼基的核苷酸和3711至3728鹼基的核苷酸;源於orf8基因的寡核苷酸對是SEQ ID NO1中的9524至9541鹼基的核苷酸和10154至10171鹼基的核苷酸;SEQ ID NO1中的9581至9598鹼基的核苷酸和10378至10395鹼基的核苷酸。
前述的對鮑氏志賀氏菌10型的O-抗原特異的核苷酸在檢測表達O-抗原的細菌、在診斷中鑑定細菌的O-抗原和細菌的其它多糖抗原的應用。
前述的對鮑氏志賀氏菌10型的O-抗原特異的核苷酸的重組分子,而且通過插入表達可提供表達鮑氏志賀氏菌10型的O-抗原,並成為細菌疫苗。
前述的對鮑氏志賀氏菌10型的O-抗原特異的核苷酸的應用,其特徵在於它作為引物用於PCR、作為探針用於雜交反應與螢光檢測、或者用於製造基因晶片或微陣列,可用這些方法檢測人體和環境中的細菌。
前述的對鮑氏志賀氏菌10型的O-抗原特異的核苷酸的分離方法,其特徵在於,包括下述步驟(1)基因組的提取在5mL的LB培養基中37℃過夜培養鮑氏志賀氏菌10型,離心收集細胞。用500ul 50mM Tris-HCl(pH8.0)和10ul 0.4M EDTA重懸細胞,37℃溫育20分鐘,然後加入10ul 10mg/ml的溶菌酶繼續保溫20分鐘;之後加入3ul 20mg/ml的蛋白酶K、15ul 10%SDS,50℃溫育2小時,再加入3ul 10mg/ml的RNase,65℃溫育30分鐘。加等體積酚抽提混合物,取上清液再用等體積的酚∶氯仿∶異戊醇(25∶24∶1)混合溶液抽提兩次,取上清液,再用等體積的乙醚抽提以除去殘餘的酚,上清液用2倍體積乙醇沉澱DNA,用玻璃絲卷出DNA並用70%乙醇洗DNA,最後將DNA重懸於30ul TE中,基因組DNA通過0.4%的瓊脂糖凝膠電泳檢測;(2)通過PCR擴增鮑氏志賀氏菌10型中的O-抗原基因簇以鮑氏志賀氏菌10型的基因組為模板通過Long PCR擴增其O-抗原基因簇;首先根據經常發現於O-抗原基因簇啟動子區的JumpStart序列設計上遊引物(5』-ATT GTGGCT GCA GGG ATC AAA GAA ATC-3』),再根據O-抗原基因簇下遊的gnd基因設計下遊引物(5』-TAG TCG CGC TGN GCC TGG ATT AAG TTC GC-3』);用BoehringerMannheim公司的Expand Long Template PCR方法擴增O-抗原基因簇,PCR反應程序如下在94℃預變性2分鐘,然後94℃變性10秒,61℃退火30秒,68℃延伸15分鐘,這樣進行30個循環;最後,在68℃繼續延伸7分鐘,得到PCR產物,用0.8%的瓊脂糖凝膠電泳檢測PCR產物的大小及其特異性;合併6管long PCR產物,並用Promega公司的Wizard PCR Preps純化試劑盒純化PCR產物;(3)構建O-抗原基因簇文庫用被修改的Novagen DNaseI shot gun法構建O-抗原基因簇文庫。反應體系是300ng PCR純化產物,0.9ul 0.1M MnCl2,1ul 1∶2000稀釋的1mg/ml的DNaseI,反應在室溫中進行;酶切10分鐘使DNA片段大小集中在1kb-3kb之間,而後加入2ul 0.1M EDTA終止反應;合併4管同樣的反應體系,用等體積的酚抽提一次,用等體積的酚∶氯仿∶異戊醇(25∶24∶1)混合溶液抽提一次,再用等體積的乙醚抽提一次後,用2.5倍體積的無水乙醇沉澱DNA,並用70%乙醇洗沉澱,最後重懸於18ul水中;隨後在此混合物中加入2.5ul dNTP(1mMdCTP,1mMdGTP,1mMdTTP,10mMdATP),1.25ul 100mM DTT和5單位的T4DNA聚合酶,11℃反應30分鐘,將酶切產物補成平端,75℃終止反應後,加入5單位的Tth DNA聚合酶及其相應的緩衝液並將體系擴大為80ul,70℃反應20分鐘,使DNA的3′端加dA尾,此混合物經等體積氯仿∶異戊醇(24∶1)混合溶液抽提和等體積乙醚抽提後與Promega公司的3×10-3的pGEM-T-Easy載體於16℃連接24小時,總體積為90ul,其中有9ul的10×buffer和25單位的T4DNA連接酶;最後用1/10體積的3M NaAc(pH5.2)和2倍體積的無水乙醇沉澱連接混合物,再用70%乙醇洗沉澱,乾燥後溶於30ul水中得到連接產物。用Bio-Rad公司的電轉化感受態細胞的製備方法製備感受態大腸桿菌DH5□細胞,取2-3ul連接產物與50ul感受態大腸桿菌DH5□混合後,轉到Bio-Rad公司的0.2cm的電擊杯中電擊,電壓為2.5千伏,時間為5.0毫秒-6.0毫秒,電擊後立即在杯中加入1ml的SOC培養基使菌復甦,然後將菌塗在含有氨苄青黴素、X-Gal和IPTG的LB固體培養基上37℃過夜培養,次日得到藍白菌落,將得到的白色菌落即白色克隆轉到含有氨苄青黴素的LB固體培養基上培養,同時從每個克隆中提取質粒並用EcoRI酶切鑑定其中的插入片段的大小,得到的白色克隆群構成了鮑氏志賀氏菌10型的O-抗原基因簇文庫;(4)對文庫中的克隆測序從文庫中挑選插入片段在1000bp以上的100個克隆由上海生物工程有限公司用ABI377型DNA自動測序儀對克隆中的插入片段單向進行測序,使序列達到80%的覆蓋率,再通過將相聯繫的序列進行反向測序及測通得到剩餘20%的序列,從而獲得O-抗原基因簇的所有序列;(5)核苷酸序列的拼接及分析用英國劍橋MRC(Medical ResearchCouncil)分子生物學實驗室出版的Staden package軟體包的Pregap4和Gap4軟體拼接和編輯所有的序列,從而得到鮑氏志賀氏菌10型的O-抗原基因簇的核苷酸全長序列,序列的質量主要由兩個方面來保證1)對鮑氏志賀氏菌10型的基因組作6個Long PCR反應,然後混合這些產物以產生文庫。2)對每個鹼基,保證3個以上高質量的覆蓋率;在得到鮑氏志賀氏菌10型的O-抗原基因簇的核苷酸序列後,用美國國家生物技術信息學中心(The NationalCenter for Biotechnology Information,NCBI)的orffinder發現基因,找到11個開放的閱讀框,用blast系列軟體與GenBank中的基因比較以發現這些開放的閱讀框的功能並確定它們是什麼基因,再用英國sanger中心的Artemis軟體完成基因注釋,用Clustral W軟體做DNA和蛋白質序列間的精確比對,最後得到鮑氏志賀氏菌10型的O-抗原基因簇的結構。
(6)特異基因篩選針對鮑氏志賀氏菌10型的O-抗原基因簇中wzx、wzy、orf8基因設計引物;在每個基因內各設計兩對引物,每對引物分布在相應基因內的不同地方以確保其特異性;用這些引物以166株大腸桿菌和43株志賀氏菌基因組為模板進行PCR,源於wzx、wzy基因的所有引物都在鮑氏志賀氏菌10型和鮑氏志賀氏菌6型中得到陽性結果,而源於orf8基因的兩對引物只在鮑氏志賀氏菌10型中得到陽性結果,在其他組中沒有擴增到任何大小正確的帶,也就是,在大多數組中沒有得到任何PCR產物帶,雖然在少數組中得到PCR產物帶,但其大小不符合預期大小。所以wzx、wzy基因對鮑氏志賀氏菌10型和鮑氏志賀氏菌6型及其O-抗原都是高度特異的,而orf8基因對鮑氏志賀氏菌10型及其O-抗原是高度特異的。
也就是,本發明的第一個方面,提供了鮑氏志賀氏菌10型的O-抗原基因簇的全長核苷酸序列,它的全序列如SEQ ID NO1所示,全長13402個鹼基;或者具有一個或多個插入、缺失或取代的鹼基,同時保持所述分離的核苷酸功能的SEQ ID NO1的核苷酸。通過本發明的方法得到了鮑氏志賀氏菌10型的O-抗原基因簇的結構,如表3所述,它的9個基因都位於galF基因和gnd基因之間。
本發明的第二個方面,提供了鮑氏志賀氏菌10型的O-抗原基因簇中的基因,即轉運酶基因(wzx基因或與wzx有相似功能的基因);聚合酶基因(wzy基因或與wzy有相似功能的基因);糖基轉移酶基因,包括orf1、orf2、orf4、orf5;細菌多糖抗原中特殊的糖合成路徑基因,包括manB、manC基因;未知功能的orf8基因。它們在O-抗原基因簇中的起始位置和終止位置及核苷酸序列都列在表4中。本發明尤其涉及到o-抗原轉運酶基因、聚合酶基因和糖基轉移酶基因和orf8基因,因為糖合成路徑基因即合成核苷二磷酸單糖的基因現在被預示對較多胞外多糖是常見的、共同的,對細菌的O-抗原並不是很特異的,而本發明涉及到的o-抗原轉運酶基因、聚合酶基因、糖基轉移酶基因和orf8基因對鮑氏志賀氏菌10型的O-抗原是特異的。
本發明的第三個方面,提供了源於鮑氏志賀氏菌10型的O-抗原基因簇中的wzy基因或與wzy有相似功能的基因和wzx基因或與wzx有相似功能的基因和糖基轉移酶基因,包括orf1、orf2、orf4、orf5及orf8基因的寡核苷酸,它們是這些基因中的任何一段寡核苷酸。但是,優先被用的是列於表1中的源於鮑氏志賀氏菌10型的O-抗原基因簇中的wzy基因或與wzy有相似功能的基因、wzx基因或與wzx有相似功能的基因及orf8基因的寡核苷酸對。在表1中也列出了這些寡核苷酸對在O-抗原基因簇中的位置及以這些寡核苷酸對為引物所做的PCR反應的產物的大小,這些PCR反應可用表1中的退火溫度進行。源於wzy基因或與wzy有相似功能的基因和wzx基因或與wzx有相似功能的基因的寡核苷酸對在以鮑氏志賀氏菌10型和鮑氏志賀氏菌6型為模板進行的PCR擴增中得到預期大小的產物,而在以表2所列的其它菌為模板進行的PCR擴增中都未得到預期大小的產物。源於orf8基因的寡核苷酸對只在鮑氏志賀氏菌10型中得到預期大小的產物。更詳細地說,源於orf8基因的寡核苷酸對在鮑氏志賀氏菌6型中得到的PCR產物都比在鮑氏志賀氏菌10型中得到的PCR產物大得多,因此可通過PCR產物的大小區分開這兩個菌,所以orf8基因內的兩對寡核苷酸對鮑氏志賀氏菌10型及其O-抗原都是高度特異的。所以,可以確定表1所列的寡核苷酸對鮑氏志賀氏菌10型及它們的O-抗原是高度特異的。
所述的對鮑氏志賀氏菌10型的O-抗原特異的核苷酸的分離方法包括下述步驟1)基因組的提取;2)PCR擴增鮑氏志賀氏菌10型中的O-抗原基因簇;3)O-抗原基因簇文庫的構建;4)對文庫中的克隆測序;5)核苷酸序列的拼接及分析,最終獲得O-抗原基因簇的結構;6)特異基因的篩選。
本發明的其他方面由於本文的技術的公開,對本領域的技術人員而言是顯而易見的。
如本發明所述,「寡核苷酸」主要是指來源於O-抗原基因簇中的編碼轉運酶基因、編碼聚合酶基因、編碼糖基轉移酶基因及orf8基因內的一段核苷酸分子,它們在長度上可改變,一般在10到20個核苷酸範圍內改變。尤其是源於wzx基因(核苷酸位置是從SEQ ID NO1的10458至11870鹼基),wzy基因(核苷酸位置是從SEQ ID NO1的3195至4247鹼基)和orf8基因(核苷酸位置是從SEQ ID NO1中的9468至10424鹼基)的寡核苷酸對鮑氏志賀氏菌10型都是高度特異的。
此外,有時兩個遺傳相似的編碼不同O-抗原的基因簇通過基因重組或突變產生新的O-抗原,從而產生新的細菌類型,新的突變株。在這種環境中,需要篩選出多對寡核苷酸同重組基因雜交以提高檢測的特異性。因此,本發明提供了一整套多對寡核苷酸的混合物,它們源於轉運酶基因,包括wzx基因或與wzx有相似功能的基因;源於聚合酶基因,包括wzy基因或與wzy有相似功能的基因;源於糖基轉移酶基因,包括orf1、orf2、orf4、orf5;源於orf8基因。這些基因的混合物對一個特殊的細菌多糖抗原來說是特異的,從而使這套寡核苷酸對這個細菌的多糖抗原是特異的。更具體地說,這些寡核苷酸的混合物是源於轉運酶基因、聚合酶基因和糖基轉移酶基因及orf8基因中的寡核苷酸的組合。
在另一方面,本發明涉及寡核苷酸的鑑定,它們可以用於檢測表達O-抗原的細菌和在診斷中鑑定細菌的O-抗原。
本發明涉及到一種檢測食品中的一個或多個細菌多糖抗原的方法,這些抗原可以使樣品能與以下至少一個基因的寡核苷酸特異性雜交,這些基因是(i)編碼轉運酶基因,包括wzx基因或與wzx有相似功能的基因(ii)編碼聚合酶的基因,包括wzy基因或與wzy有相似功能的基因(iii)編碼糖基轉移酶基因,包括orf1、orf2、orf4、orf5及未知功能的orf8基因。在條件許可的情況下至少一個寡核苷酸能與至少一個表達特殊的O-抗原的細菌的一個以上的那樣的基因特異性雜交,這些細菌是鮑氏志賀氏菌10型。可用PCR方法檢測,更可以將本發明方法中的核苷酸標記後作為探針通過雜交反應如southern-blot或螢光檢測,或者通過基因晶片或微陣列檢測樣品中的抗原及細菌。
本發明者考慮到以下情況當單個的特異的寡核苷酸檢測無效時,寡核苷酸的混合物能與靶區域特異性雜交以檢測樣品。因此本發明提供了一套寡核苷酸用於本發明所述的檢測方法。這裡所說的寡核苷酸是指源於編碼轉運酶基因包括wzx基因或與wzx有相似功能的基因,編碼聚合酶的基因包括wzy基因或與wzy有相似功能的基因和編碼糖基轉移酶基因包括orf1、orf2、orf4、orf5及未知功能的orf8基因的寡核苷酸。這套寡核苷酸對一個特殊的細菌的O-抗原來說是特異的,這一特殊的細菌O-抗原是由鮑氏志賀氏菌10型表達的。
另一方面,本發明涉及到一種檢測排洩物中的一個或多個細菌多糖抗原的方法,這些抗原可以使樣品能與以下至少一個基因的寡核苷酸特異性雜交,這些基因是(i)編碼轉運酶的基因,包括wzx基因或與wzx有相似功能的基因(ii)編碼聚合酶的基因,包括wzy基因或與wzy有相似功能的基因(iii)編碼糖基轉移酶基因,包括orf1、orf2、orf4、orf5及未知功能的orf8基因。在條件許可的情況下至少一個寡核苷酸能與至少一個表達特殊的O-抗原的細菌的一個以上的那樣的基因特異性雜交。這些細菌是鮑氏志賀氏菌10型。可用本發明中的寡核苷酸作引物通過PCR的方法檢測樣品,也可將本發明中的寡核苷酸分子標記後作為探針通過雜交反應如southern-blot或螢光檢測,或者通過基因晶片或微陣列檢測樣品中的抗原及細菌。一般一對寡核苷酸可能與同樣的基因雜交也可與不同的基因雜交,但它們中必須有一個寡核苷酸能特異性雜交到特殊抗原型的特異序列上,另一個寡核苷酸可雜交於非特異性區域。因此,當特殊的多糖抗原基因簇中的寡核苷酸被重新組合時,至少能選出一對寡核苷酸與多糖抗原基因簇中特異基因混合物雜交,或者選出多對寡核苷酸與特異基因的混合物雜交。甚至即使當一個特殊的基因簇中所有基因都獨一無二時,此方法也能應用於識別此基因簇內的基因混合物的核苷酸分子。因此本發明提供了一整套用於檢測本發明方法的多對寡核苷酸,在這裡多對寡核苷酸是源於編碼轉運酶的基因包括wzx基因或與wzx有相似功能的基因;源於編碼聚合酶的基因包括wzy基因或與wzy有相似功能的基因,源於編碼糖基轉移酶基因包括orf1、orf2、orf4、orf5及未知功能的orf8基因。這套寡核苷酸對一個特殊的細菌多糖來說是特異的,這套寡核苷酸可能是糖合成中必須基因的核苷酸。
另一方面,本發明也涉及到一種檢測源於病人的樣品中的一個或多個細菌多糖抗原的方法。樣品中的一個或多個細菌多糖抗原可以使樣品能與以下至少一個基因中的一對寡核苷酸中的一個特異性雜交,這些基因是(i)編碼轉運酶的基因,包括wzx基因或與wzx有相似功能的基因(ii)編碼聚合酶的基因,包括wzy基因或與wzy有相似功能的基因,(iii)編碼糖基轉移酶基因,包括orf1、orf2、orf4、orf5及未知功能的orf8基因。在條件許可的情況下至少一個寡核苷酸能與樣品中的至少一個表達特殊的O-抗原的細菌的一個以上的那樣的基因特異性雜交,這些細菌是鮑氏志賀氏菌10型。可用本發明中的寡核苷酸作引物通過PCR的方法檢測樣品,也可將本發明中的寡核苷酸標記後作為探針通過雜交反應,或者通過基因晶片或微陣列檢測樣品中的抗原及細菌。
更詳細地說,以上描述的方法可以理解為當寡核苷酸對被使用時,其中的一個寡核苷酸分子能雜交到一個並不是來源於wzx基因或與wzx有相似功能的基因及wzy基因或與wzy有相似功能的基因及糖基轉移酶基因包括orf1、orf2、orf4、orf5及未知功能的orf8基因的序列上。此外,當兩個寡核苷酸都能雜交上時,它們可能雜交於同一基因也可能雜交到不同基因上。也即,當交叉反應出現問題時,可選擇寡核苷酸的混合物來檢測混合的基因以提供檢測的特異性。
本發明者相信本發明不必限於以上所提的核苷酸序列編碼的特定的O-抗原,而且廣泛應用於檢測所有表達O-抗原和鑑定O-抗原的細菌。由於O-抗原合成和其他多糖抗原(如細菌胞外抗原)合成之間的相似性,本發明的方法和分子也應用於這些其他的多糖抗原。
本發明首次公開了鮑氏志賀氏菌10型的O-抗原基因簇的全長序列,而且可從這個未被克隆的全長基因簇的序列中產生重組分子,通過插入表達可產生表達鮑氏志賀氏菌10型的O-抗原,並成為有用的疫苗。
具體實施例方式下面結合具體實施例,進一步闡述本發明。應理解這些實施例僅用於說明本發明而不用於限制本發明的範圍。下列實施例中未註明具體條件的實驗方法,通常按照常規條件如Sambrook等人,分子克隆實驗室手冊(NewYorkCold Spring Harbor Laboratory Press,1989)中所述的條件。
實施例1基因組的提取。
在5mL的LB培養基中37℃過夜培養鮑氏志賀氏菌10型,離心收集細胞。用500ul 50mM Tris-HCl(pH8.0)和10ul 0.4M EDTA重懸細胞,37℃溫育20分鐘,然後加入10ul 10mg/ml的溶菌酶繼續保溫20分鐘。之後加入3ul20mg/ml的蛋白酶K、15ul 10%SDS,50℃溫育2小時,再加入3ul 10mg/ml的RNase,65℃溫育30分鐘。加等體積酚抽提混合物,取上清液,再用等體積的酚∶氯仿∶異戊醇(25∶24∶1)溶液抽提兩次,取上清液,再用等體積的乙醚抽提以除去殘餘的酚。上清液用2倍體積乙醇沉澱DNA,用玻璃絲卷出DNA並用70%乙醇洗DNA,最後將DNA重懸於30ul TE中。基因組DNA通過0.4%的瓊脂糖凝膠電泳檢測。
實施例2通過PCR擴增鮑氏志賀氏菌10型中的O-抗原基因簇以鮑氏志賀氏菌10型的基因組為模板通過Long PCR擴增其O-抗原基因簇。首先根據經常發現於O-抗原基因簇啟動子區的JumpStart序列設計上遊引物(5』-ATT GTG GCT GCA GGG ATC AAA GAA ATC-3』),再根據O-抗原基因簇下遊的gnd基因設計下遊引物(5』-TAG TCG CGC TGN GCC TGG ATT AAG TTCGC-3』)。用Boehringer Mannheim公司的Expand Long Template PCR方法擴增O-抗原基因簇,PCR反應程序如下在94℃預變性2分鐘;然後94℃變性10秒,61℃退火30秒,68℃延伸15分鐘,這樣進行30個循環;最後,在68℃繼續延伸7分鐘,得到PCR產物,用0.8%的瓊脂糖凝膠電泳檢測PCR產物的大小及其特異性。合併6管long PCR產物,並用Promega公司的WizardPCR Preps純化試劑盒純化PCR產物。
實施例3構建O-抗原基因簇文庫。
首先是連接產物的獲得用被修改的Novagen DNaseI shot gun法構建O-抗原基因簇文庫。反應體系是300ng PCR純化產物,0.9ul 0.1M MnCl2,1ul 1∶2000稀釋的1mg/ml的DNaseI,反應在室溫中進行。酶切10分鐘使DNA片段大小集中在1kb-3kb之間,而後加入2ul 0.1M EDTA終止反應。合併4管同樣的反應體系,用等體積的酚抽提一次,用等體積的酚∶氯仿∶異戊醇(25∶24∶1)混合溶液抽提一次,再用等體積的乙醚抽提一次後,用2.5倍體積的無水乙醇沉澱DNA,並用70%乙醇洗沉澱,最後重懸於18ul水中。隨後在此混合物中加入2.5ul dNTP(1mMdCTP,1mMdGTP,1mMdTTP,10mMdATP),1.25ul 100mM DTT和5單位的T4DNA聚合酶,11℃反應30分鐘,將酶切產物補成平端,75℃終止反應後,加入5單位的Tth DNA聚合酶及其相應的緩衝液並將體系擴大為80ul,70℃反應20分鐘,使DNA的3′端加dA尾。此混合物經等體積氯仿∶異戊醇(24∶1)混合溶液抽提和等體積乙醚抽提後與Promega公司的3×10-3的pGEM-T-Easy載體於16℃連接24小時,總體積為90ul。其中有9ul的10×buffer和25單位的T4DNA連接酶。最後用1/10體積的3M NaAc(pH5.2)和2倍體積的無水乙醇沉澱連接混合物,再用70%乙醇洗沉澱,乾燥後溶於30ul水中得到連接產物。
其次是感受態細胞的製備參照Bio-Rad公司提供的方法製備感受態細胞大腸桿菌DH5□。取一環大腸桿菌DH5□單菌落於5ml的LB培養基中,180rpm培養10小時後,取2ml培養物轉接到200ml的LB培養基中,37℃ 250rpm劇烈振蕩培養到OD600 0.5左右,然後冰浴冷卻20分鐘,於4℃ 4000rpm離心15分鐘。傾盡上清液,用冷的冰預冷的去離子滅菌水200ml吹散菌體,於4℃ 4000rpm離心15分鐘。再用冷的冰預冷的去離子滅菌水100ml吹散菌體,於4℃ 4000rpm離心15分鐘。用冷的冰預冷的10%的甘油懸浮細胞,4℃ 6000rpm離心10分鐘,棄上清液,最後沉澱用1ml冰預冷的10%的甘油懸浮細胞,即為感受態細胞。將製得的感受態細胞分裝為50ul一管,-70℃保存。
最後是電轉化感受態細胞取2-3ul連接產物與50ul感受態大腸桿菌DH5□混合後,轉到Bio-Rad公司的0.2cm的電擊杯中電擊,電壓為2.5千伏,時間為5.0毫秒-6.0毫秒。電擊後立即在杯中加入1ml的SOC培養基使菌復甦。然後立即將菌塗在含有氨苄青黴素、X-Gal和IPTG的LB固體培養基上37℃倒置過夜培養,次日得到藍白菌落。將得到的白色菌落即白色克隆轉到含有氨苄青黴素的LB固體培養基上培養,同時從每個克隆中提取質粒並用EcoRI酶切鑑定其中的插入片段的大小,得到白色克隆群構成了鮑氏志賀氏菌10型的O-抗原基因簇文庫。
實施例4對文庫中的克隆測序。
從文庫中挑選插入片段在1000bp以上的100個克隆由上海生物工程有限公司用ABI377型DNA自動測序儀對克隆中的插入片段單向進行測序,使序列達到80%的覆蓋率。剩餘20%的序列再通過反向測序及將有些序列測通得到,最後獲得O-抗原基因簇的所有序列。
實施例5核苷酸序列的拼接及分析。
用英國劍橋MRC(Medical Research Council)分子生物學實驗室出版的Staden package軟體包的Pregap4和Gap4軟體拼接和編輯所有的序列,從而得到鮑氏志賀氏菌10型的O-抗原基因簇的核苷酸全長序列(見序列列表)。序列的質量主要由兩個方面來保證1)對鮑氏志賀氏菌10型的基因組作6個Long PCR反應,然後混合這些產物以產生文庫。2)對每個鹼基,保證3個以上高質量的覆蓋率。在得到鮑氏志賀氏菌10型的O-抗原基因簇的核苷酸序列後,用美國國家生物技術信息學中心(The National Center forBiotechnology Information,NCBI)的orffinder發現基因,找到11個開放的閱讀框,用blast系列軟體與GenBank中的基因比較以發現這些開放的閱讀框的功能並確定它們是什麼基因,再用英國sanger中心的Artemis軟體完成基因注釋,用Clustral W軟體做DNA和蛋白質序列間的精確比對,最後得到鮑氏志賀氏菌10型的O-抗原基因簇的結構,如表3所示。
通過檢索和比較,發現orf1與鮑氏志賀氏菌6型(Shigella boydii6)的WbaS在322個胺基酸中有100%的相同性,100%的相似性,而WbaS是一個糖基轉移酶,所以可以確定orf1也是一個糖基轉移酶基因,命名為orf1。orf2與鮑氏志賀氏菌6型的WbaT在369個胺基酸中有100%的相同性,100%的相似性,而WbaT是一個糖基轉移酶,所以可以確定orf2也是一個糖基轉移酶基因,命名為orf2。orf3與鮑氏志賀氏菌6型的Wzy在360個胺基酸中有100%的相同性,100%的相似性,而Wzy是O-抗原聚合酶。用TMHMM2.0和SMART軟體分析都表明orf3編碼的蛋白中含有10個跨膜片段,具有O-抗原聚合酶(Wzy)的典型特徵。所以可以確定orf3就是wzy基因,命名為wzy。Orf4與鮑氏志賀氏菌6型的WbaX在363個胺基酸中有100%的相同性,100%的相似性,而WbaX是一個糖基轉移酶,所以可以確定orf4也是一個糖基轉移酶基因,命名為orf4。Orf5與鮑氏志賀氏菌6型的WbaY在372個胺基酸中有99%的相同性,99%的相似性,而WbaY是一個糖基轉移酶,所以可以確定orf5也是一個糖基轉移酶基因,命名為orf5。orf6與鮑氏志賀氏菌6型的ManC在478個胺基酸序列中有99%的相同性,100%的相似性,所以orf6被命名為manC。Orf7與鮑氏志賀氏菌6型的ManB在456個胺基酸序列中有99%的相同性,99%的相似性,所以orf7被命名為manB。Orf8與Azotobactervinelandii的一個未知功能的蛋白在314個胺基酸中有40%的相同性,58%的相似性,orf8的功能也未知,所以被命名為orf8。Orf9與鮑氏志賀氏菌6型的Wzx在470個胺基酸中有99%的相同性,99%的相似性,而Wzx是O-抗原轉運酶,而且通過Eisenberg等人的算法[Eisenberg,D,Schwarz,E.etal(1984).Analysis of membrane and surfaceprotein sequences with the hydrophobic moment plot.J.Mol.Biol.179125-142]發現orf9有10個潛在的穿膜區,它與許多wzx蛋白相似,而且在wzx蛋白的氨基端有一個大約50個胺基酸的保守基序,所以可以確定orf9是wzx基因,命名為wzx。另外,在鮑氏志賀氏菌10型的O-抗原基因簇中,orf9位於負鏈上。分析表明,除了Orf8外,鮑氏志賀氏菌10型的O-抗原基因簇與鮑氏志賀氏菌6型的O-抗原基因簇幾乎是一樣的。在鮑氏志賀氏菌6型的O-抗原基因簇中,orf8的內部有一個插入序列,使orf8失去了功能[Wang L.,W Qu and P.R.Reeves(2001)Sequence analysis of four Shigella boydiiO-antigen lociimplication for Escherichia coli and Shigellarelationships.Infection and Immunity.696923-6930.]。
實施例6特異基因的篩選針對鮑氏志賀氏菌10型的O-抗原基因簇中的wzy、wzx、orf8基因設計引物,這些基因在核苷酸序列中的位置見表1。
在表1中列出了鮑氏志賀氏菌10型的O抗原基因簇的轉運酶基因、聚合酶基因和orf8基因及它們的相應的功能和大小。在每個基因內,我們各設計了兩對引物,每對引物分布在相應基因內的不同地方以確保其特異性。在表中還列出了每個引物在SEQ ID NO1中的位置和大小。以每對引物用表中所列的相應的退火溫度以表2中的所有菌的基因組為模板進行PCR,得到了相應的PCR產物,其大小也列於表中。
mdh(malate dehydrogenase)基因是存在於所有的大腸桿菌的基因組中且高度保守的一個基因,所以我們根據mdh基因設計了引物(5′-TTC ATC CTA AACTCC TTA TT-3′)和(5′-TAA TCG CAG GGG AAA GCA GG-3′),然後從166株大腸桿菌中提取基因組,方法如前所述。用這對引物從166株大腸桿菌的基因組中PCR以鑑定大腸桿菌並檢測其基因組的質量。
表2是用於篩選特異基因的166株大腸桿菌和43株志賀氏菌及它們的來源,為了檢測的方便,我們將它們每8-10個菌分為一組,總共27組,它們的來源都列於表中。
在第23組中含有鮑氏志賀氏菌10型的基因組DNA作為陽性對照。以每組菌做模板,用表1中的每對引物按如下條件做PCR在94℃預變性2分鐘後,94℃變性15秒,退火溫度因引物的不同而不同(參照表1),退火時間是50秒,72℃延伸2分鐘,這樣進行30個循環。最後在7 2℃繼續延伸10分鐘,反應體系是25ul。反應完畢後,取10ulPCR產物通過0.8%瓊脂糖凝膠電泳檢測擴增出的片段。
對於wzx、wzy基因,每個基因都有兩對引物被檢測,每對引物除了在第22、23組中做PCR後得到了預期大小的正確的一條帶外,在其他組中都沒有擴增到任何大小正確的帶。將第22、23組中的每個菌做PCR後發現,每對引物都在鮑氏志賀氏菌10型和鮑氏志賀氏菌6型中得到預期大小的正確的一條帶。所以wzx、wzy基因及其內的寡核苷酸對鮑氏志賀氏菌10型和鮑氏志賀氏菌6型及其O-抗原都是高度特異的。為了用PCR的方法鑑別出鮑氏志賀氏菌10型和鮑氏志賀氏菌6型,我們在orf8基因內設計了兩對引物,每對引物除了在第23組中做PCR後得到了預期大小的正確的一條帶外,在其他組中都沒有擴增到任何大小正確的帶。更確切的說,這兩對引物在鮑氏志賀氏菌6型中得到的PCR產物都比在鮑氏志賀氏菌10型中得到的PCR產物大得多,因此可通過PCR產物的大小區分開這兩個菌,所以orf8基因內的這兩對引物對鮑氏志賀氏菌10型及其O-抗原都是高度特異的。
最後,通過PCR從鮑氏志賀氏菌10型中篩選到對鮑氏志賀氏菌10型和鮑氏志賀氏菌6型的O-抗原高度特異的基因wzx、wzy、orf8基因。而這些基因內的任何一段10-20nt的寡核苷酸對鮑氏志賀氏菌10型和鮑氏志賀氏菌6型的O-抗原是特異的,尤其是源於上述wzx、wzy基因中的引物即寡核苷酸對經PCR檢測後證實對鮑氏志賀氏菌10型和鮑氏志賀氏菌6型是高度特異的。所有的這些寡核苷酸都可用於快速準確地檢測人體和環境中的鮑氏志賀氏菌10型和鮑氏志賀氏菌6型,並能鑑定它們的O-抗原。而源於orf8基因內的兩對引物經PCR檢測後證實對鮑氏志賀氏菌10型是高度特異的,可以區分開鮑氏志賀氏菌10型和鮑氏志賀氏菌6型,它們可用於快速準確地檢測人體和環境中的鮑氏志賀氏菌10型,並能鑑定它的O-抗原。
表3是鮑氏志賀氏菌10型的O-抗原基因簇的結構表,在表中列出了鮑氏志賀氏菌10型的O-抗原基因簇的結構,共由9個基因組成,每個基因用方框表示,並在方框內寫入基因的名稱。在O-抗原基因簇的兩端是galF基因和gnd基因,它們不屬於O-抗原基因簇,我們只是用它們的一段序列設計引物來擴增O-抗原基因簇的全長序列。
表4是鮑氏志賀氏菌10型的O-抗原基因簇中的基因的位置表,在表中列出了鮑氏志賀氏菌10型的O-抗原基因簇中的所有開放閱讀框在全序列中的準確位置,在每個開放閱讀框的起始密碼子和終止密碼子的下面劃線。在細菌中開放閱讀框的起始密碼子有兩個ATG和GTG。
序列列表SEQUENCE LISTING
110南開大學120對鮑氏志賀氏菌10型的O-抗原特異的核苷酸1601170PatentIn version 3.2210121113402212DNA213Shigella boydii4001attgtggctg cagggatcaa agaaatcctc ctggtaactc acgcgtccaa gaacgcggtc60gaaaaccact tcgacacctc ttatgaatta gaatctctcc ttgaacagcg cgtgaagcgt 120caactgctgg cggaagtgca gtctatctgt ccgcctggcg tgaccattat gaacgtgcgt 180cagggcgaac ctttaggttt gggccactcc attttatgtg cgcgacctgc cattggtgac 240aatccatttg tcgtggtgct gccagacgtt gtgatcgacg acgccagcgc cgacccgcta 300cgctacaacc ttgctgccat gattgcgcgc ttcaatgaaa cgggccgtag ccaggtgctg 360gcaaaacgta tgccgggtga cctctctgaa tactccgtca ttcagacaaa agaaccactg 420gattgtgaag gtaaagtcag ccgcattgtt gaatttatcg aaaaaccgga tcagccgcag 480acgctggact cagacatcat ggccgttggt cgctatgtgc tttctgccga tatttggccg 540gaacttgaac gcactcaacc tggtgcatgg gggcgtattc agctgactga tgccattgct 600gaactggcga aaaaacagtc cgttgatgca atgctgatga ctggtgacag ctacgactgc 660ggtaaaaaaa tgggctatat gcaggcgttt gtgaagtatg gactgcgcaa cctgaaagaa 720ggggctaaat tccgtaaagg gattgagaag ctgttaagtg aataatgaaa atctgaccgg 780atgtaacggt tgataagaaa attataacgg cagtgaagat tcgtggtgaa agtaatttgt 840tgcgaatatt cctgccgttg ttttatataa acaatcagaa taacaatgag ttagcaatag 900gattttagtc aaagttttcc aggattttcc ttgtttccag agcggattgg taagacaatt 960agcgtctgaa ttttatgaat tactttggct ggtgccagag ttgacaaaga catgtagaat 1020aaaaagtgca ctggtagctt taagccaggg gcggtagcgt gtcaaatata tattttatta 1080ttgagtggct tacatatatg gatgattcgg tttctgtcgt tataccttat tacaatgatt 1140cccctcgtat tgaaaagtgt ttggatagta tatgttcaca aaccagacaa gctattgaag 1200ttataatagt tgatgattgt tcaaaagata gtgcattact actaaaaatc attgataaat 1260ttaaaaataa aataaatata cgatatttga gaaatgatga aaataaaaat ggggcatatt 1320ccagaaacgt agggatgaga gaagcaaggg gaggaattgt tgcttttctc gatgctgacg 1380actattgggc cacagatcat ctcgaggaaa gtgtaaatgc tttgttgtta aatggggtgg 1440aatttgtttt ttcaaatgta atagaggttg attgttgtgg ttgtgagagt cgaagaaaag 1500ttactaatcc ccaatatttg gataataaat acgatataat actgctttct cctcctcaaa 1560ctaattcatt cctatttagg aaaaaaatat ttgacactaa agagattttt tttgatgaaa 1620acttacgtag acatcaagat tatcaatttc ttactttaat attagaaaaa aatatttcat 1680atcaatatat tgataaatat acttcatatt atgtgcaatc acatcgtcct catactgaaa 1740gaatggatta taaatctgtt tttttatttt gggaaaaata taattcttat gtttctggga 1800gattactaaa aaaatttatt accggtttag ttcttgaggt ggttcttgtg tatgggaaaa 1860ataaaacaaa gagttttatt gattcgcatg aacttgtcaa gataaacgca tcgaaactat 1920ttctttatct tgtgttaaaa acaaattttg gtgttaatgc taatagggtg atttatcctt 1980ttttttatta tattttattc agccccaaaa gcatattaaa aaagatatca caaaggatta 2040atagaaagtt ggtacataat gcgtaataag atatctatag ttactacaaa tattactaat 2100aatggtggta ctgagcgagt aatagcaaat gttgctaatt ctctttcaga aatttatgat 2160
attcgtattt atagcctatc tactactgaa ggcgaatgtt tttatcccct aaacgaacgt2220atacatataa aacatatggg gatgatgtgt tatgagcatg aaaaatcagt tttaaaaaaa2280acattcaaaa agttaataaa tgttttctat tcaataaatg aatttaaaaa aataaggtca2340aattatataa ttggagtcaa caagaacata aatatacttc tagttctatc gtttttgtta2400aattataaaa gaaagagaga ttataaactg attgggtggg aacattttgc acataatgct2460cctatgtcac tatttaccag aattttacgt gagctattat ataaatactt agatgattta2520attgttctaa ctaaatttga tgaggagtat tataaagcta agaaaataaa aacaacagtg2580attgaaaatg cgtatacagc aatggatgta gataatctca agactgttag taaaggaaat2640gttattctat caattggaag acatacgtct caaaagcggt ttgataagtt gttacatatc2700tggaaagaaa tagttaaaaa gaatgatggg ttaaaactgc ggattgttgg ggatggtcct2760ctattggatg agaacaaaaa attagcccaa aaattgaatc tgtccgactc agtagtgttt2820gctccgccaa ctaaaaaaat taatgaggaa tatcaaaatg catctttatt tttaatgaca2880tctgactatg aagcatttcc aatggttttg ttggaagctt tgaaaaatgg tcttccttgc2940attgcgtttg actgtgatac tggacctaga gatattatcg ttaatggagt tgatggattt3000gttataccaa taaatgatag tttgaaattt gtagaaaaaa cgatagatgt catgaataat3060gaaaacttaa gataccaact aagctcgaat gcaaaggtta atgtcgaaag gtttaatgaa3120gaacatattt caaaaaaatg gttgattaag ttaaaacaat tgcaataaca tcgacgttaa3180aatcaaggta taagatgatt ataataacat cattcatggt tctgttgttt ttatttacag3240ataatttaaa attaaaaaac tttagaataa tattgtttta ttttttttct ctttgtttca3300gtgtgttagt ttattttaga cctgaataca tgttgaatac tgattacaaa gaatattata3360actattttaa atggattaat tttgataata tttataactt atcggacaca attggtttcg3420aatacggctt cggctatata gtcacgttaa taaaatattt ttttgaatct gaacgtgctt3480gtttttcagg tattgctttt ttatcggtgt ttattagtta taaagctata ttaagattaa3540accccaaaac gaccgcattt tctttttcat tatttttatt atcattttgt gtttatattt3600ttttaggcca aataagacaa ggcatatcac tttcgttagg cttactggct atatcttatt3660tgttggagga taagcgaaaa cagtttttat taaccgttat catagcttca agcattcatg3720tgacggccct aatactaata ttagctccat tcgttaaata ttttaggata aagtatattt3780tttattcctt actactatcg tttgcttttg tttttataga tgtaataaaa ccactgatta3840taaccctagc gcagtttatt ccgtttggta gttttataac tggaaaaata atagcttatg3900gaaatagcga attttcaacc aaagtgggtt tttcttttat tcaagtgtat tatgttttac3960tttctacagt tttatatatc ctagtaaaaa aatatgaata taaaaataat tatatcctca4020cattatgtaa gatttttatg gtcggagtga ttcttaattt tacatttaat tcattttctg4080ttttacttag acttacttat tactatttag cattagattg cattttgatg ggctatctct4140tgaatatggc aaaaaatgga tatacgaaaa tattaatata ttgcccaaca ctaatgctat4200ttatattaag gttttatatg caatggagcg aacatatcaa tggttgaaca ttgtagtaaa4260aataaaaaaa tactcgttga ttgtagaatg attaatgcct ctggaatagg tgtttatact4320cgtgaaatta tcaaagagtt aaaaaaatat agatacttgc agatcgagtt attgcttcaa4380gaagaacaac agttaccaat tgatgttgaa gatattggat ttaaaatcca ctatataaat4440ttttctcgct atagtattaa aaacatcggt ggtatgaagc atttactgaa tggctttgat4500gtctatttta tgccatcatt atcgatacca cctctattaa aaaaaggctg tttgataatc4560acaacagtac atgatctgtg tcctgttgca ttacggaaat tatttggatc caaaaaagct4620gtagcttatt gggctttgct attaatacaa cttgtttgtt ctaataagat aatttccatt4680tcaagattca ctgctaaaga aataaataag tattactttg gtttatttaa aagtaaatta4740tatgtcattg gcaatggtat aagaaatatt tttaatttgg aattaaatag tgaaacagaa4800aattcccatg aagaatatgg tatttgcgtg ggcaatatta agcctcataa aaatgttgta4860ccactaattg attaccttaa gacaaacatc attaacaaaa aaatatattt tataggtgaa4920
ataaatgggt tttcaacgaa aataaataaa agtttgctta acgatttgcc tgaaaatata4980gtttttacag ggagagtaag tgatcaagaa ttacataatt attaccgtaa tgccagtttt5040tttatattcc cctcattata cgaaggcttt ggtttgcctt tgctagaggc tatgaattat5100aggttgccta tttttgcatc aaatattgat gtatttaagg aagttgctgg tgaaacaatt5160aattattttg atccatatac atttgatgct cttgcagata gaattaacaa attaaaaaag5220aacaagaaat ctattgaatc ttatgcacga gttttgcagt tatatagttg ggataataat5280gttgcaagtc tattaaggat tatgaatgaa gaagatattg ctcgtaaata aatactatca5340tccagacatt ggtggcgtag aaactgttgt acaacagcat gctcaattat tgaagtatga5400atatagtgta acagtgttgt gtattagcaa agaattctca tggtatacaa aaaatgaatt5460cattaatgga gttaaagtaa tacgctgttc tccattggga acttattttt ctatgccgtt5520atcaattact ttttttttgc attacttcat taattattta aaatcagacg tgattattaa5580tcacattccg tttccattaa tggatttagc attttttatc attgatagat tagtcaaaag5640aaaaaatata ttattttggc acagtgatat agtaaagcaa aaagcattaa aaaaaatatt5700acgtccgttc attataaata ctattaatcg aagcactcag attttaacta catctccaaa5760tctcaaagct aattcagaag acatcggtga atatcagaaa aaaacagatg tgttaccatt5820atttattaat tcaaatgtta taaatggtta tattaaaaat ttaaacgcag aaaaaaaata5880tgactttata ttttttggaa gattatgtta ttataaagga gttgatattc ttttagatgc5940agtaaaaatt ttgaaaaata aaggagctga acctgaaatt tttatggcag gtgatggtga6000tttagttaat tatatcgaaa atgaaattat tgaaaataaa attaaaaata taacttttat6060taaacggttt ttaacagagg aggaaaaata tcattatctt tcaatttcaa aatgttttct6120tttcccatcc gttgctgcat ccgaagcatt tggtatcact cagcttgagg caatgtctct6180tgggctccct gtaataaaca caaaccttaa tactggcgtt ccttttgtca gtttaaatgg6240agttacgggg ataacagtaa ctgcaggtaa tcctgatgat ttagctaatg caatgctgtc6300tttgttgcgc gatgatgaaa aatatgaatc gttcaagaca aattgtaaag ttagggtttc6360tgagttgttt gaggaaaatg ttgtgaaaaa taaactattc aaagtaattg aagaattaaa6420ctgagaagtt gaattttcac tcatactata ttcattaatt atacgtattt atatacttaa6480cttatgtcaa ataatattat ctgtcctgtg attatggctg gtggttctgg tagccgtcta6540tggcctcttt ctcgtctttt ttatccaaag caatttctaa aattagtaga tgattcaagt6600atgctacaag aaacaattag tcgccttgga gatcttcctt gtagcttacc tgttgttata6660tgtaatgaac agcatagatt tattgttgct gaacagcttc gaatgattaa taagttaacg6720aataacatta tattagaacc tgtagggcgc aatacagccc cagcaatagc tttagcagca6780atgatctctg agtctttttc ttctttagaa gatcccttac ttttagtatt agctgctgat6840catgatatta aaaatcataa atcatttcgt gatgctgtaa ggaaagctat tccttttgca6900gaacaaggta aattagttac ttttggtatt gttccaagta tggctgaaac aggatatggc6960tatattaagc gtggacatga aatttctttg gaaaatgatg aagtcgcgta tactgtttcg7020aagttttatg aaaaacctaa tataagtgat gcccaaaaat tcctcgcttc tggaaaattt7080tattggaata gtggtatgtt tttatttaga gcttctcgtt atttgagtga gttaaataaa7140tttagaccag atatatactt agcatgcgca tcttctacta aaaatataaa taccgatctt7200gattttattc gtgttgatga aaattcattt tctaactgcc cagatgaatc catagactat7260gcagtcatgg aacaaacttc tgatgcagtg gttgttccta tgaatgcagg ttggagtgat7320gttggatcat ggtcttccct atgggagatt agtaaaaaaa atgaacaagg gaacgttagt7380catggtgatg ttattaatca caatactgag aatagttatg tctatgccga gtctggtttg7440gtgactacca ttggggtaaa agacttggtt gttgtacaaa ccaaagatgc cgttcttgtt7500gcagatcgca attctgtgca ggatgtgaaa aaagtagtgg agcagattaa agcccatggt7560cgttccgaac atcagatgca tagagaagtt tatcgtccat ggggtaaata tgactctatc7620gacgcaggcg agcgctacca ggtgaaacgc ataaccgtga aaccgggcga ggggttgtca7680
gtacagatgc attaccaccg ttcggaacac tgggtagtgg tagcgggaac ggcaaaagtc 7740actattgatg gggttatcaa acttcttggc gaaaacgagt ccctctatat tccgcaaggg 7800gcgaagcatt gcctggaaaa tccggggaaa ataccgcttg agttaataga agttcgctcc 7860gggtcttatc tcgaagagga tgatgtggtg cgttttgcag atcgttatgg aagagtctag 7920ttttgtacaa ctttcatttt ccctaatgat tctcgacctg aaataattct gccctgttca 7980tgtaaattat ttgaatacca ctctaatttg agtgttgaaa atgagtgttt aaaatgaaaa 8040aattaaactg ctttaaagcc tatgatattc gcgggaaatt aggcgaagaa ctgaatgaag 8100atattgcctg gcgtattggg cgtgcctatg gcgaatttct caaaccgaaa accattgtat 8160taggcggtga tgtccgcctc accagcgaaa ccttaaaact ggcgctggca aaaggtttac 8220aggatgcggg cgtcgatgtg ctggatattg gtatgtccgg caccgaagag atctatttcg 8280ccacgttcca tctcggcgtg gatggcggca ttgaagttac tgccagccat aatccgatgg 8340attacaacgg catgaaactg gtgcgcgaag gggctcgtcc gatcagcggt gataccggac 8400tgcgcgatgt ccagcgcctg gcagaagcca acgacttccc tcccgtcgat gaaacaaaac 8460gcggtcgcta tcagcaaatc aatctgcgtg acgct acgt tgatcatctg ttcagttata 8520tcaacgccaa aaacctcacg ccgctcaagc tggtgatcaa ctccgggaac ggcgcagcgg 8580gtccggtggt ggacgctatc gaagcccgct ttaaagccct cggcgcacct gtggaattaa 8640tcaaagtgca caacacgccg gacggcaatt tccccaacgg tattcctaac ccgctgctgc 8700cggaatgccg tgacgacacc cgcaatgcgg tcatcaaaca cggcgcggat atgggcattg 8760cctttgacgg cgattttgac cgctgtttcc tgtttgacga aaaagggcag tttatcgagg 8820gctactacat tgtcggtctg ctggcagaag cgttcctcga aaaaaatccc ggcgcgaaga 8880tcatccacga tccacgtctc tcctggaaca ccgttgatgt ggtgactgcc gcaggcggca 8940ccccggtaat gtcgaaaacc ggacacgcct ttattaaaga acgtatgcgc aaggaagacg 9000ccatctacgg tggcgaaatg agcgcccacc attacttccg tgatttcgct tactgcgaca 9060gcggcatgat cccgtggctg ctggtcgccg aactggtgtg cctgaaagga aaaacgctgg 9120gcgaactggt gcgcgaccgg atggcggcgt ttccggcaag cggtgagatc aacagcaaac 9180tggcacaacc tgttgaggcg attaaccgcg tcgaacagca ttttagccgt gaggcgctgg 9240cggtggatcg caccgatggc atcagcatga cctttgccga ctggcgcttt aacctgcgct 9300cctccaacac cgaaccggtg gtgcggttga atgttgaatc aaaagccaac gttgagttac 9360tcgaaagcag ggtttctata atattaaata ttctaaatat gtgactaatt taattgtgtg 9420cttaaaatta ggagttcaat gtgaattata tttctttaga aaccttgatg aatgatatta 9480gagactcaat aaatctattg agtaaacata attttgattt agttgtaggc attccaagaa 9540gtggtatgat accagcctat ctgatcagtc tttatttgaa tattgacgta accgatgtta 9600attcttttat cctaaataca ccaattcaaa gaggatcgac tagaacatca ggaaaacgca 9660tatataaccc acatgatgca caaaggattc tcttagtcga tgatagcttt tcaacaggta 9720aatcgatgag gaatatttta gattctatac cagtggattt aaaaaaaaat attaaaacaa 9780tggttgccta tacatctgat gtaaatggcg ctggattaga tatttatata cgtcatgttt 9840ctcaccccag attgtttgaa tggaatatac tcaatcacag catcattagc aatagctgtt 9900tcgatattga tggtgtttta tgtgtcgatc ctaatgagct tcagaatgac gatggtgaaa 9960actatataaa atttatatgc gaggcagaac ctaagtttat acctaagttt aagataaaat10020acttggttac aaaccgtctt gaaaaataca gagacataac tgaagcatgg ttgttaaaaa10080ataacataca atatgagaaa ttaatcatgt taaatatggc gacaaaagaa gaaaggcaat10140ctgcaggaat tcattccaga cataaagccg aattttataa acgttccggt tgtgatttat10200ttgttgaaag tgatattaat caggcgattg aaattatgaa atataccggg aagtatgtat10260attgtataga taataataga atgtactctc ctagcgccat acaatattta tctaaaaggc10320cgcttgactt tatgaatgat ataattcttt atttgccacg aattttatat cgtagattac10380ccttagaaac aaagatggct ataaaaaaaa ggttaaaacc ttaaaaagca tttcaacctt10440
tttcaattta cttattttta tttaattaac cgattaatga agtttttgac ttctttagtc10500ggtaataatg aaactataaa cacgacgaaa catataatag tcaaaataac tagtgataag10560aaactatggt ccaagtgttt ttttaatata tatattatat aatagctaat gaagcctgct10620ataaataaag gataagtttt caaaataagt ttgtaaaagt ttgattttat cacatacatg10680gttaaagcca tacatggaaa aaaatgaact aaattagcta tgaaataata ttttgcgagt10740gaaatgatat tgtcattaac gccaatcaca aatgcaatac ctgtcaagat ggctccttgt10800accccaagta agacaaggat accagtacgg ccttgggaca taaatattat acctgtggtg10860ctcaaaatgc tttgaatgat agctgtaggc gctaaccata caagaattga tgaagataaa10920tgccattttt ctccaaaaat tatatttatt accatttcat ttaaaccaag tagagatata10980ataagaggaa tggttataaa ccaaatcgta tatactgtat ttaaatatat tttttctacc11040tcagcatgct tgtgtttatt tttacttaat atagggaata acgaacggtt tacaataaac11100gttattgaag taagtgggaa aagcataatt ctatatgcta gattatatgc acctaatata11160gttgctgaca tgtacttacc tatgaggaaa ctatctaaat tacgagcaaa gtaattaatg11220aaattaaaaa gagatagctg atagctgaaa gaaaatattg atttggtatt tttaaatata11280ttctcaattt tgattctagg actccatgaa cttaaatacc aaaacaaacc tgaagataac11340aacgtgctaa caatagattg agtgactaaa ctatataccc caaagttgag atatgccatt11400gctatagcaa tgattaaagc agagccaaaa gaaaaaattt ctatttttga gatggtttca11460aattttgact ctctttcaag aagtgataag tgaacagatg ttgccccaag taagaaaaaa11520ttaatagata gcaatgataa aacaggtttt aatttaggta cgtcgtataa ttcagaaaaa11580taagatgagc taaataaaat tgcagttcct actattatgc ctaataataa atttagccaa11640aagatagcag atttgagact ttcgtcgatc gaatctctct ggactatagc agctgatgtt11700cctaagtcac gaaaaaggat tgcgaaattg gttaccacgg tggccatagc cataatacca11760taatcttctg gtgcaattaa tctggcaaga taaatcatac ttataagctg tgttgctatt11820ttaaataatt gtgatatagc gttccacttt aagttgttaa aaatgctcat tattagttct11880ctagagtgac ctataaaaag taaaaataaa aatccaacac ccttagtatt cttacataaa11940ataaaaaact agaaaagcta attatactga aaggtaacat gagttatagt ttattatttt12000ttaaaataag taaacttgaa tctcgcatac atcgcgatga acatcccctg acaggagaaa12060acaatgtcaa agcaacagat cgggcgtcgt cgtatggcag taatgggcgc aaccttgcgc12120tcaacatcga aagccgtggt tataccgtct ctattttcaa ccgctcccgt gaaaagacgg12180aagaagtgat tgccgagaat ccaggcaaga aactggttcc ttactatacg gtgaaagagt12240ttgttgaatc tctggaaacg cctcgtcgca tcctgttaat ggtgaaagca ggtgcaggca12300cggatgctgc tattgattcc ctcaaaccat atctcgataa aggcgacatc atcattgatg12360gtggtaacac cttcttccag gacaccattc gtcgtaatcg tgagctttct gccgaaggct12420ttaacttcat tggtaccggt gtttccggtg gtgaagaagg tgcgctgaaa ggtccttcca12480ttatgcctgg tgggcagaaa gaagcctatg aactggttgc accgatcctc accaaaatcg12540ccgcagtggc tgaagacggt gagccatgcg ttacctatat tggtgccgat ggcgcgggtc12600actatgtaaa aatggttcac aacggtattg aatacggtga tatgcagctg attgctgaag12660cctactcttt gcttaaaggt ggcttgaacc tttccaacga agaactggcg cagaccttta12720ccgagtggaa taacggtgaa ctgagcagct acctgatcga catcaccaaa gatatcttca12780ccaaaaaaga tgaagacggt aactacctgg ttgatgtgat cctggatgaa gcggctaaca12840aaggtaccgg taaatggacc agccagagcg cactggatct cggcgaaccg ctgtcgctga12900ttaccgagtc tgtgtttgca cgttacatct cttctctgaa agatcagcgt gttgccgcat12960ctaaagttct ctctggcccg caagcacagc cagcaggcga caaggctgag ttcatcgaaa13020aagttcgtcg tgcgctgtat ctgggcaaaa tcgtttctta cgctcagggc ttctctcagc13080tgcgtgctgc gtctgaagag tacaactggg atctgaacta cggcgaaatc gcgaagattt13140tccgtgctgg ttgcatcatc cgtgcgcagt tcctgcagaa aatcaccgat gcatacgccg13200
aaaatccgca gatcgctaac ctgctgctgg ctccgtactt caagcaaatt gccgatgact 13260accagcaggc gctgcgcgat gtcgtcgctt atgcggtaca gaacggtatc ccggttccga 13320ccttcgccgc tgcggttgcc tattatgaca gctaccgcgc cgcagttctg cctgcgaacc 13380taatccaggc tcagcgcgac ta 13402表1鮑氏志賀氏菌10型的O抗原基因簇中wzx基因和wzy基因及其中的引物及PCR數據產生正 PCR的PCR產基基因的 正向引物位置反向引物位置確大小 退火溫功能 物電泳帶因 鹼基位置度長度的組數(℃)wzx O-抗原 10458-11870 #351(10757-10774) #352(11648-11665) 909bp 1*58轉運酶#353(10889-10906) #354(11915-11932) 1044bp1*58wzy O-抗原3195-4247 #347(3538-3555) #348(4039-4056)519bp 1*56聚合酶#349(3418-3435) #350(3711-3728)311bp 1*58orf8 功能 9468-10424 #355(9524-9541) #356(10154-648bp 0 58未知 10171)#357(9581-9598) #358(10378-814bp 0 6010395)*除了正對照外,在第22組有正確大小的帶表2 166株大腸桿菌和43株志賀氏菌及它們的來源組號 該組中含有的菌株 來源1 野生型大腸桿菌O1,O2,O3,O4,O10,O16,O18,O39IMVSa2 野生型大腸桿菌O40,O41,O48,O49,O71,O73,O88,O100 IMVS3 野生型大腸桿菌O102,O109,O119,O120,O121,O125,O126,O137IMVS4 野生型大腸桿菌O138,O139,O149,O7,O5,O6,O11,O12IMVS5 野生型大腸桿菌O13,O14,O15,O17,O19ab,O20,O21,O22 IMVS6 野生型大腸桿菌O23,O24,O25,O26,O27,O28,O29,O30IMVS7 野生型大腸桿菌O32,O33,O34,O35,O36,O37,O38,O42IMVS8 野生型大腸桿菌O43,O44,O45,O46,O50,O51,O52,O53IMVS9 野生型鮑氏志賀氏菌10型,O55,O56,O57,O58,O54,O60,O61 IMVS10野生型大腸桿菌O62,O63,O64,O65,O66,O68,O69,O70IMVS11野生型大腸桿菌O74,O75,O76,O77,O78,O79,O80,O81IMVS12野生型大腸桿菌O82,O83,O84,O85,O86,O87,O89,O90IMVS13野生型大腸桿菌O91,O92,O95,O96,O97,O98,O99,O101 IMVS14野生型大腸桿菌O112,O162,O113,O114,O115,O116,O117,O118IMVS15野生型大腸桿菌O123,O165,O166,O167,O168,O169,O170,O171See b16野生型大腸桿菌O172,O173,O127,O128,O129,O130,O131,O132, See c17野生型大腸桿菌O133,O134,O135,O136,O140,O141,O142,O143IMVS18野生型大腸桿菌O114,O145,O146,O147,O148,O150,O151,O152IMVS19野生型大腸桿菌O153,O154,O155,O156,O157,O158,O159,O164IMVS20野生型大腸桿菌O160,O161,O163,O8,O9,O124,O111 IMVS
21 野生型大腸桿菌O103,O104,O105,O106,O107,O108,O110 IMVS22 鮑氏志賀氏菌血清型B4,B5,B6,B8,B9,B11,B12,B14See d23 鮑氏志賀氏菌血清型B1,B3,B7,B8,B10,B13,B15,B16,B17,B18 See d24 痢疾志賀氏菌血清型D1,D2,D3,D4,D5,D6,D7,D8 See d25 痢疾志賀氏菌血清D9,D10,D11,D12,D13 See d26 弗氏志賀氏菌F6a,F1a,F1b,F2a,F2b,F3,F4a,F4b,F5(v7)F5(v4)See d27 宋內氏志賀氏菌D5,DR See da.Institude of Medical and Veterinary Science,Anelaide,Australiab.O123 from IMVS;the rest from Statens Serum Institut,Copenhagen,Denmarkc.172 and 173 from Statens Serum Institut,Copenhagen,Denmark,the rest from IMVSd.中國預防醫學科學院流行病學研究所表3是鮑氏志賀氏菌10型的O-抗原基因簇的結構表 表4是鮑氏志賀氏菌10型的O-抗原基因簇中的基因的位置表ATTGTGGCTG CAGGGATCAA AGAAATCCTC CTGGTAACTC ACGCGTCCAA GAACGCGGTC 60GAAAACCACT TCGACACCTC TTATGAATTA GAATCTCTCC TTGAACAGCG CGTGAAGCGT 120CAACTGCTGG CGGAAGTGCA GTCTATCTGT CCGCCTGGCG TGACCATTAT GAACGTGCGT 180CAGGGCGAAC CTTTAGGTTT GGGCCACTCC ATTTTATGTG CGCGACCTGC CATTGGTGAC 240AATCCATTTG TCGTGGTGCT GCCAGACGTT GTGATCGACG ACGCCAGCGC CGACCCGCTA 300CGCTACAACC TTGCTGCCAT GATTGCGCGC TTCAATGAAA CGGGCCGTAG CCAGGTGCTG 360GCAAAACGTA TGCCGGGTGA CCTCTCTGAA TACTCCGTCA TTCAGACAAA AGAACCACTG 420GATTGTGAAG GTAAAGTCAG CCGCATTGTT GAATTTATCG AAAAACCGGA TCAGCCGCAG 480ACGCTGGACT CAGACATCAT GGCCGTTGGT CGCTATGTGC TTTCTGCCGA TATTTGGCCG 540GAACTTGAAC GCACTCAACC TGGTGCATGG GGGCGTATTC AGCTGACTGA TGCCATTGCT 600GAACTGGCGA AAAAACAGTC CGTTGATGCA ATGCTGATGA CTGGTGACAG CTACGACTGC 660GGTAAAAAAA TGGGCTATAT GCAGGCGTTT GTGAAGTATG GACTGCGCAA CCTGAAAGAA 720GGGGCTAAAT TCCGTAAAGG GATTGAGAAG CTGTTAAGTG AATAATGAAA ATCTGACCGG 780ATGTAACGGT TGATAAGAAA ATTATAACGG CAGTGAAGAT TCGTGGTGAA AGTAATTTGT 840TGCGAATATT CCTGCCGTTG TTTTATATAA ACAATCAGAA TAACAATGAG TTAGCAATAG 900GATTTTAGTC AAAGTTTTCC AGGATTTTCC TTGTTTCCAG AGCGGATTGG TAAGACAATT 960AGCGTCTGAA TTTTATGAAT TACTTTGGCT GGTGCCAGAG TTGACAAAGA CATGTAGAAT1020AAAAAGTGCA CTGGTAGCTT TAAGCCAGGG GCGGTAGCGT GTCAAATATA TATTTTATTA1080orf1的起始TTGAGTGGCT TACATATATGGATGATTCGG TTTCTGTCGT TATACCTTAT TACAATGATT1140CCCCTCGTAT TGAAAAGTGT TTGGATAGTA TATGTTCACA AACCAGACAA GCTATTGAAG1200TTATAATAGT TGATGATTGT TCAAAAGATA GTGCATTACT ACTAAAAATC ATTGATAAAT1260TTAAAAATAA AATAAATATA CGATATTTGA GAAATGATGA AAATAAAAAT GGGGCATATT1320CCAGAAACGT AGGGATGAGA GAAGCAAGGG GAGGAATTGT TGCTTTTCTC GATGCTGACG1380ACTATTGGGC CACAGATCAT CTCGAGGAAA GTGTAAATGC TTTGTTGTTA AATGGGGTGG1440AATTTGTTTT TTCAAATGTA ATAGAGGTTG ATTGTTGTGG TTGTGAGAGT CGAAGAAAAG1500
TTACTAATCC CCAATATTTGGATAATAAATACGATATAAT ACTGCTTTCT CCTCCTCAAA1560CTAATTCATT CCTATTTAGGAAAAAAATATTTGACACTAA AGAGATTTTT TTTGATGAAA1620ACTTACGTAG ACATCAAGATTATCAATTTCTTACTTTAAT ATTAGAAAAA AATATTTCAT1680ATCAATATAT TGATAAATATACTTCATATTATGTGCAATC ACATCGTCCT CATACTGAAA1740GAATGGATTA TAAATCTGTTTTTTTATTTTGGGAAAAATA TAATTCTTAT GTTTCTGGGA1800GATTACTAAA AAAATTTATTACCGGTTTAGTTCTTGAGGT GGTTCTTGTG TATGGGAAAA1860ATAAAACAAA GAGTTTTATTGATTCGCATGAACTTGTCAA GATAAACGCA TCGAAACTAT1920TTCTTTATCT TGTGTTAAAAACAAATTTTGGTGTTAATGC TAATAGGGTG ATTTATCCTT1980TTTTTTATTA TATTTTATTCAGCCCCAAAAGCATATTAAA AAAGATATCA CAAAGGATTA2040Orf2的起始 orf1的終止ATAGAAAGTT GGTACATAAT GCGTAATAAG ATATCTATAG TTACTACAAA TATTACTAAT2100AATGGTGGTA CTGAGCGAGTAATAGCAAATGTTGCTAATT CTCTTTCAGA AATTTATGAT2160ATTCGTATTT ATAGCCTATCTACTACTGAAGGCGAATGTT TTTATCCCCT AAACGAACGT2220ATACATATAA AACATATGGGGATGATGTGTTATGAGCATG AAAAATCAGT TTTAAAAAAA2280ACATTCAAAA AGTTAATAAATGTTTTCTATTCAATAAATG AATTTAAAAA AATAAGGTCA2340AATTATATAA TTGGAGTCAACAAGAACATAAATATACTTC TAGTTCTATC GTTTTTGTTA2400AATTATAAAA GAAAGAGAGATTATAAACTGATTGGGTGGG AACATTTTGC ACATAATGCT2460CCTATGTCAC TATTTACCAGAATTTTACGTGAGCTATTAT ATAAATACTT AGATGATTTA2520ATTGTTCTAA CTAAATTTGATGAGGAGTATTATAAAGCTA AGAAAATAAA AACAACAGTG2580ATTGAAAATG CGTATACAGCAATGGATGTAGATAATCTCA AGACTGTTAG TAAAGGAAAT2640GTTATTCTAT CAATTGGAAGACATACGTCTCAAAAGCGGT TTGATAAGTT GTTACATATC2700TGGAAAGAAA TAGTTAAAAAGAATGATGGGTTAAAACTGC GGATTGTTGG GGATGGTCCT2760CTATTGGATG AGAACAAAAAATTAGCCCAAAAATTGAATC TGTCCGACTC AGTAGTGTTT2820GCTCCGCCAA CTAAAAAAATTAATGAGGAATATCAAAATG CATCTTTATT TTTAATGACA2880TCTGACTATG AAGCATTTCCAATGGTTTTGTTGGAAGCTT TGAAAAATGG TCTTCCTTGC2940ATTGCGTTTG ACTGTGATACTGGACCTAGAGATATTATCG TTAATGGAGT TGATGGATTT3000GTTATACCAA TAAATGATAGTTTGAAATTTGTAGAAAAAA CGATAGATGT CATGAATAAT3060GAAAACTTAA GATACCAACTAAGCTCGAATGCAAAGGTTA ATGTCGAAAG GTTTAATGAA3120Orf2的終止GAACATATTT CAAAAAAATGGTTGATTAAGTTAAAACAAT TGCAATAACA TCGACGTTAA3180Orf3的起始AATCAAGGTA TAAGATGATT ATAATAACATCATTCATGGT TCTGTTGTTT TTATTTACAG3240ATAATTTAAA ATTAAAAAACTTTAGAATAATATTGTTTTA TTTTTTTTCT CTTTGTTTCA3300GTGTGTTAGT TTATTTTAGACCTGAATACATGTTGAATAC TGATTACAAA GAATATTATA3360ACTATTTTAA ATGGATTAATTTTGATAATATTTATAACTT ATCGGACACA ATTGGTTTCG3420AATACGGCTT CGGCTATATAGTCACGTTAATAAAATATTT TTTTGAATCT GAACGTGCTT3480GTTTTTCAGG TATTGCTTTTTTATCGGTGTTTATTAGTTA TAAAGCTATA TTAAGATTAA3540ACCCCAAAAC GACCGCATTTTCTTTTTCATTATTTTTATT ATCATTTTGT GTTTATATTT3600TTTTAGGCCA AATAAGACAAGGCATATCACTTTCGTTAGG CTTACTGGCT ATATCTTATT3660TGTTGGAGGA TAAGCGAAAACAGTTTTTATTAACCGTTAT CATAGCTTCA AGCATTCATG3720TGACGGCCCT AATACTAATATTAGCTCCATTCGTTAAATA TTTTAGGATA AAGTATATTT3780TTTATTCCTT ACTACTATCGTTTGCTTTTGTTTTTATAGA TGTAATAAAA CCACTGATTA3840TAACCCTAGC GCAGTTTATTCCGTTTGGTAGTTTTATAAC TGGAAAAATA ATAGCTTATG3900GAAATAGCGA ATTTTCAACCAAAGTGGGTTTTTCTTTTAT TCAAGTGTAT TATGTTTTAC3960TTTCTACAGT TTTATATATCCTAGTAAAAAAATATGAATA TAAAAATAAT TATATCCTCA4020CATTATGTAA GATTTTTATGGTCGGAGTGATTCTTAATTT TACATTTAAT TCATTTTCTG4080
TTTTACTTAG ACTTACTTAT TACTATTTAG CATTAGATTG CATTTTGATGGGCTATCTCT4140TGAATATGGC AAAAAATGGA TATACGAAAA TATTAATATA TTGCCCAACACTAATGCTAT4200Orf4的起始 Orf3的終止TTATATTAAG GTTTTATATG CAATGGAGCG AACATATCAA TGGTTGAACA TTGTAGTAAA4260AATAAAAAAA TACTCGTTGA TTGTAGAATG ATTAATGCCT CTGGAATAGGTGTTTATACT4320CGTGAAATTA TCAAAGAGTT AAAAAAATAT AGATACTTGC AGATCGAGTTATTGCTTCAA4380GAAGAACAAC AGTTACCAAT TGATGTTGAA GATATTGGAT TTAAAATCCACTATATAAAT4440TTTTCTCGCT ATAGTATTAA AAACATCGGT GGTATGAAGC ATTTACTGAATGGCTTTGAT4500GTCTATTTTA TGCCATCATT ATCGATACCA CCTCTATTAA AAAAAGGCTGTTTGATAATC4560ACAACAGTAC ATGATCTGTG TCCTGTTGCA TTACGGAAAT TATTTGGATCCAAAAAAGCT4620GTAGCTTATT GGGCTTTGCT ATTAATACAA CTTGTTTGTT CTAATAAGATAATTTCCATT4680TCAAGATTCA CTGCTAAAGA AATAAATAAG TATTACTTTG GTTTATTTAAAAGTAAATTA4740TATGTCATTG GCAATGGTAT AAGAAATATT TTTAATTTGG AATTAAATAGTGAAACAGAA4800AATTCCCATG AAGAATATGG TATTTGCGTG GGCAATATTA AGCCTCATAAAAATGTTGTA4860CCACTAATTG ATTACCTTAA GACAAACATC ATTAACAAAA AAATATATTTTATAGGTGAA4920ATAAATGGGT TTTCAACGAA AATAAATAAA AGTTTGCTTA ACGATTTGCCTGAAAATATA4980GTTTTTACAG GGAGAGTAAG TGATCAAGAA TTACATAATT ATTACCGTAATGCCAGTTTT5040TTTATATTCC CCTCATTATA CGAAGGCTTT GGTTTGCCTT TGCTAGAGGCTATGAATTAT5100AGGTTGCCTA TTTTTGCATC AAATATTGAT GTATTTAAGG AAGTTGCTGGTGAAACAATT5160AATTATTTTG ATCCATATAC ATTTGATGCT CTTGCAGATA GAATTAACAAATTAAAAAAG5220AACAAGAAAT CTATTGAATC TTATGCACGA GTTTTGCAGT TATATAGTTGGGATAATAAT5280Orf5的起始Orf4的終止GTTGCAAGTC TATTAAGGAT TATGAATGAA GAAGATATTG CTCGTAAATA AATACTATCA 5340TCCAGACATT GGTGGCGTAG AAACTGTTGT ACAACAGCAT GCTCAATTATTGAAGTATGA5400ATATAGTGTA ACAGTGTTGT GTATTAGCAA AGAATTCTCA TGGTATACAAAAAATGAATT5460CATTAATGGA GTTAAAGTAA TACGCTGTTC TCCATTGGGA ACTTATTTTTCTATGCCGTT5520ATCAATTACT TTTTTTTTGC ATTACTTCAT TAATTATTTA AAATCAGACGTGATTATTAA5580TCACATTCCG TTTCCATTAA TGGATTTAGC ATTTTTTATC ATTGATAGATTAGTCAAAAG5640AAAAAATATA TTATTTTGGC ACAGTGATAT AGTAAAGCAA AAAGCATTAAAAAAAATATT5700ACGTCCGTTC ATTATAAATA CTATTAATCG AAGCACTCAG ATTTTAACTACATCTCCAAA5760TCTCAAAGCT AATTCAGAAG ACATCGGTGA ATATCAGAAA AAAACAGATGTGTTACCATT5820ATTTATTAAT TCAAATGTTA TAAATGGTTA TATTAAAAAT TTAAACGCAGAAAAAAAATA5880TGACTTTATA TTTTTTGGAA GATTATGTTA TTATAAAGGA GTTGATATTCTTTTAGATGC5940AGTAAAAATT TTGAAAAATA AAGGAGCTGA ACCTGAAATT TTTATGGCAGGTGATGGTGA6000TTTAGTTAAT TATATCGAAA ATGAAATTAT TGAAAATAAA ATTAAAAATATAACTTTTAT6060TAAACGGTTT TTAACAGAGG AGGAAAAATA TCATTATCTT TCAATTTCAAAATGTTTTCT6120TTTCCCATCC GTTGCTGCAT CCGAAGCATT TGGTATCACT CAGCTTGAGGCAATGTCTCT6180TGGGCTCCCT GTAATAAACA CAAACCTTAA TACTGGCGTT CCTTTTGTCAGTTTAAATGG6240AGTTACGGGG ATAACAGTAA CTGCAGGTAA TCCTGATGAT TTAGCTAATGCAATGCTGTC6300TTTGTTGCGC GATGATGAAA AATATGAATC GTTCAAGACA AATTGTAAAGTTAGGGTTTC6360TGAGTTGTTT GAGGAAAATG TTGTGAAAAA TAAACTATTC AAAGTAATTGAAGAATTAAA6420Orf5的終止CTGAGAAGTT GAATTTTCAC TCATACTATA TTCATTAATT ATACGTATTTATATACTTAA6480Orf6的起始CTTATGTCAA ATAATATTAT CTGTCCTGTG ATTATGGCTG GTGGTTCTGGTAGCCGTCTA6540TGGCCTCTTT CTCGTCTTTT TTATCCAAAG CAATTTCTAA AATTAGTAGATGATTCAAGT6600
ATGCTACAAG AAACAATTAG TCGCCTTGGA GATCTTCCTT GTAGCTTACC TGTTGTTATA 6660TGTAATGAAC AGCATAGATT TATTGTTGCT GAACAGCTTC GAATGATTAA TAAGTTAACG 6720AATAACATTA TATTAGAACC TGTAGGGCGC AATACAGCCC CAGCAATAGC TTTAGCAGCA 6780ATGATCTCTG AGTCTTTTTC TTCTTTAGAA GATCCCTTAC TTTTAGTATT AGCTGCTGAT 6840CATGATATTA AAAATCATAA ATCATTTCGT GATGCTGTAA GGAAAGCTAT TCCTTTTGCA 6900GAACAAGGTA AATTAGTTAC TTTTGGTATT GTTCCAAGTA TGGCTGAAAC AGGATATGGC 6960TATATTAAGC GTGGACATGA AATTTCTTTG GAAAATGATG AAGTCGCGTA TACTGTTTCG 7020AAGTTTTATG AAAAACCTAA TATAAGTGAT GCCCAAAAAT TCCTCGCTTC TGGAAAATTT 7080TATTGGAATA GTGGTATGTT TTTATTTAGA GCTTCTCGTT ATTTGAGTGA GTTAAATAAA 7140TTTAGACCAG ATATATACTT AGCATGCGCA TCTTCTACTA AAAATATAAA TACCGATCTT 7200GATTTTATTC GTGTTGATGA AAATTCATTT TCTAACTGCC CAGATGAATC CATAGACTAT 7260GCAGTCATGG AACAAACTTC TGATGCAGTG GTTGTTCCTA TGAATGCAGG TTGGAGTGAT 7320GTTGGATCAT GGTCTTCCCT ATGGGAGATT AGTAAAAAAA ATGAACAAGG GAACGTTAGT 7380CATGGTGATG TTATTAATCA CAATACTGAG AATAGTTATG TCTATGCCGA GTCTGGTTTG 7440GTGACTACCA TTGGGGTAAA AGACTTGGTT GTTGTACAAA CCAAAGATGC CGTTCTTGTT 7500GCAGATCGCA ATTCTGTGCA GGATGTGAAA AAAGTAGTGG AGCAGATTAA AGCCCATGGT 7560CGTTCCGAAC ATCAGATGCA TAGAGAAGTT TATCGTCCAT GGGGTAAATA TGACTCTATC 7620GACGCAGGCG AGCGCTACCA GGTGAAACGC ATAACCGTGA AACCGGGCGA GGGGTTGTCA 7680GTACAGATGC ATTACCACCG TTCGGAACAC TGGGTAGTGG TAGCGGGAAC GGCAAAAGTC 7740ACTATTGATG GGGTTATCAA ACTTCTTGGC GAAAACGAGT CCCTCTATAT TCCGCAAGGG 7800GCGAAGCATT GCCTGGAAAA TCCGGGGAAA ATACCGCTTG AGTTAATAGA AGTTCGCTCC 7860Orf6的終止GGGTCTTATC TCGAAGAGGA TGATGTGGTG CGTTTTGCAG ATCGTTATGG AAGAGTCTAG7920TTTTGTACAA CTTTCATTTT CCCTAATGAT TCTCGACCTG AAATAATTCT GCCCTGTTCA 7980Orf7的起始TGTAAATTAT TTGAATACCA CTCTAATTTG AGTGTTGAAA ATGAGTGTTT AAAATGAAAA8040AATTAAACTG CTTTAAAGCC TATGATATTC GCGGGAAATT AGGCGAAGAA CTGAATGAAG 8100ATATTGCCTG GCGTATTGGG CGTGCCTATG GCGAATTTCT CAAACCGAAA ACCATTGTAT 8160TAGGCGGTGA TGTCCGCCTC ACCAGCGAAA CCTTAAAACT GGCGCTGGCA AAAGGTTTAC 8220AGGATGCGGG CGTCGATGTG CTGGATATTG GTATGTCCGG CACCGAAGAG ATCTATTTCG 8280CCACGTTCCA TCTCGGCGTG GATGGCGGCA TTGAAGTTAC TGCCAGCCAT AATCCGATGG 8340ATTACAACGG CATGAAACTG GTGCGCGAAG GGGCTCGTCC GATCAGCGGT GATACCGGAC 8400TGCGCGATGT CCAGCGCCTG GCAGAAGCCA ACGACTTCCC TCCCGTCGAT GAAACAAAAC 8460GCGGTCGCTA TCAGCAAATC AATCTGCGTG ACGCTTACGT TGATCATCTG TTCAGTTATA 8520TCAACGCCAA AAACCTCACG CCGCTCAAGC TGGTGATCAA CTCCGGGAAC GGCGCAGCGG 8580GTCCGGTGGT GGACGCTATC GAAGCCCGCT TTAAAGCCCT CGGCGCACCT GTGGAATTAA 8640TCAAAGTGCA CAACACGCCG GACGGCAATT TCCCCAACGG TATTCCTAAC CCGCTGCTGC 8700CGGAATGCCG TGACGACACC CGCAATGCGG TCATCAAACA CGGCGCGGAT ATGGGCATTG 8760CCTTTGACGG CGATTTTGAC CGCTGTTTCC TGTTTGACGA AAAAGGGCAG TTTATCGAGG 8820GCTACTACAT TGTCGGTCTG CTGGCAGAAG CGTTCCTCGA AAAAAATCCC GGCGCGAAGA 8880TCATCCACGA TCCACGTCTC TCCTGGAACA CCGTTGATGT GGTGACTGCC GCAGGCGGCA 8940CCCCGGTAAT GTCGAAAACC GGACACGCCT TTATTAAAGA ACGTATGCGC AAGGAAGACG 9000CCATCTACGG TGGCGAAATG AGCGCCCACC ATTACTTCCG TGATTTCGCT TACTGCGACA 9060GCGGCATGAT CCCGTGGCTG CTGGTCGCCG AACTGGTGTG CCTGAAAGGA AAAACGCTGG 9120GCGAACTGGT GCGCGACCGG ATGGCGGCGT TTCCGGCAAG CGGTGAGATC AACAGCAAAC 9180TGGCACAACC TGTTGAGGCG ATTAACCGCG TCGAACAGCA TTTTAGCCGT GAGGCGCTGG 9240
CGGTGGATCG CACCGATGGC ATCAGCATGA CCTTTGCCGA CTGGCGCTTT AACCTGCGCT 9300CCTCCAACAC CGAACCGGTG GTGCGGTTGA ATGTTGAATC AAAAGCCAAC GTTGAGTTAC 9360Orf7的終止TCGAAAGCAG GGTTTCTATA ATATTAAATA TTCTAAATAT GTGACTAATT TAATTGTGTG 9420Orf8的起始CTTAAAATTA GGAGTTCAAT GTGAATTATA TTTCTTTAGA AACCTTGATGAATGATATTA 9480GAGACTCAAT AAATCTATTG AGTAAACATA ATTTTGATTT AGTTGTAGGC ATTCCAAGAA 9540GTGGTATGAT ACCAGCCTAT CTGATCAGTC TTTATTTGAA TATTGACGTA ACCGATGTTA 9600ATTCTTTTAT CCTAAATACA CCAATTCAAA GAGGATCGAC TAGAACATCA GGAAAACGCA 9660TATATAACCC ACATGATGCA CAAAGGATTC TCTTAGTCGA TGATAGCTTT TCAACAGGTA 9720AATCGATGAG GAATATTTTA GATTCTATAC CAGTGGATTT AAAAAAAAAT ATTAAAACAA 9780TGGTTGCCTA TACATCTGAT GTAAATGGCG CTGGATTAGA TATTTATATA CGTCATGTTT 9840CTCACCCCAG ATTGTTTGAA TGGAATATAC TCAATCACAG CATCATTAGC AATAGCTGTT 9900TCGATATTGA TGGTGTTTTA TGTGTCGATC CTAATGAGCT TCAGAATGAC GATGGTGAAA 9960ACTATATAAA ATTTATATGC GAGGCAGAAC CTAAGTTTAT ACCTAAGTTT AAGATAAAAT 10020ACTTGGTTAC AAACCGTCTT GAAAAATACA GAGACATAAC TGAAGCATGG TTGTTAAAAA 10080ATAACATACA ATATGAGAAA TTAATCATGT TAAATATGGC GACAAAAGAA GAAAGGCAAT 10140CTGCAGGAAT TCATTCCAGA CATAAAGCCG AATTTTATAA ACGTTCCGGT TGTGATTTAT 10200TTGTTGAAAG TGATATTAAT CAGGCGATTG AAATTATGAA ATATACCGGG AAGTATGTAT 10260ATTGTATAGA TAATAATAGA ATGTACTCTC CTAGCGCCAT ACAATATTTA TCTAAAAGGC 10320CGCTTGACTT TATGAATGAT ATAATTCTTT ATTTGCCACG AATTTTATAT CGTAGATTAC 10380Orf8的終止CCTTAGAAAC AAAGATGGCT ATAAAAAAAA GGTTAAAACC TTAAAAAGCA TTTCAACCTT 10440(基因在負鏈上)Orf9的起始TTTCAATTTA CTTATTTTTA TTTAATTAAC CGATTAATGA AGTTTTTGAC TTCTTTAGTC 10500GGTAATAATG AAACTATAAA CACGACGAAA CATATAATAG TCAAAATAAC TAGTGATAAG 10560AAACTATGGT CCAAGTGTTT TTTTAATATA TATATTATAT AATAGCTAAT GAAGCCTGCT 10620ATAAATAAAG GATAAGTTTT CAAAATAAGT TTGTAAAAGT TTGATTTTAT CACATACATG 10680GTTAAAGCCA TACATGGAAA AAAATGAACT AAATTAGCTA TGAAATAATA TTTTGCGAGT 10740GAAATGATAT TGTCATTAAC GCCAATCACA AATGCAATAC CTGTCAAGAT GGCTCCTTGT 10800ACCCCAAGTA AGACAAGGAT ACCAGTACGG CCTTGGGACA TAAATATTAT ACCTGTGGTG 10860CTCAAAATGC TTTGAATGAT AGCTGTAGGC GCTAACCATA CAAGAATTGA TGAAGATAAA 10920TGCCATTTTT CTCCAAAAAT TATATTTATT ACCATTTCAT TTAAACCAAG TAGAGATATA 10980ATAAGAGGAA TGGTTATAAA CCAAATCGTA TATACTGTAT TTAAATATAT TTTTTCTACC 11040TCAGCATGCT TGTGTTTATT TTTACTTAAT ATAGGGAATA ACGAACGGTT TACAATAAAC 11100GTTATTGAAG TAAGTGGGAA AAGCATAATT CTATATGCTA GATTATATGC ACCTAATATA 11160GTTGCTGACA TGTACTTACC TATGAGGAAA CTATCTAAAT TACGAGCAAA GTAATTAATG 11220AAATTAAAAA GAGATAGCTG ATAGCTGAAA GAAAATATTG ATTTGGTATT TTTAAATATA 11280TTCTCAATTT TGATTCTAGG ACTCCATGAA CTTAAATACC AAAACAAACC TGAAGATAAC 11340AACGTGCTAA CAATAGATTG AGTGACTAAA CTATATACCC CAAAGTTGAG ATATGCCATT 11400GCTATAGCAA TGATTAAAGC AGAGCCAAAA GAAAAAATTT CTATTTTTGA GATGGTTTCA 11460AATTTTGACT CTCTTTCAAG AAGTGATAAG TGAACAGATG TTGCCCCAAG TAAGAAAAAA 11520TTAATAGATA GCAATGATAA AACAGGTTTT AATTTAGGTA CGTCGTATAA TTCAGAAAAA 11580TAAGATGAGC TAAATAAAAT TGCAGTTCCT ACTATTATGC CTAATAATAA ATTTAGCCAA 11640AAGATAGCAG ATTTGAGACT TTCGTCGATC GAATCTCTCT GGACTATAGC AGCTGATGTT 11700CCTAAGTCAC GAAAAAGGAT TGCGAAATTG GTTACCACGG TGGCCATAGC CATAATACCA 11760
TAATCTTCTG GTGCAATTAA TCTGGCAAGA TAAATCATAC TTATAAGCTG TGTTGCTATT11820(基因在負鏈上)Orf9的終止TTAAATAATT GTGATATAGC GTTCCACTTT AAGTTGTTAA AAATGCTCAT TATTAGTTCT 11880CTAGAGTGAC CTATAAAAAG TAAAAATAAA AATCCAACAC CCTTAGTATT CTTACATAAA11940ATAAAAAACT AGAAAAGCTA ATTATACTGA AAGGTAACAT GAGTTATAGT TTATTATTTT12000TTAAAATAAG TAAACTTGAA TCTCGCATAC ATCGCGATGA ACATCCCCTG ACAGGAGAAA12060ACAATGTCAA AGCAACAGAT CGGGCGTCGT CGTATGGCAG TAATGGGCGC AACCTTGCGC12120TCAACATCGA AAGCCGTGGT TATACCGTCT CTATTTTCAA CCGCTCCCGT GAAAAGACGG12180AAGAAGTGAT TGCCGAGAAT CCAGGCAAGA AACTGGTTCC TTACTATACG GTGAAAGAGT12240TTGTTGAATC TCTGGAAACG CCTCGTCGCA TCCTGTTAAT GGTGAAAGCA GGTGCAGGCA12300CGGATGCTGC TATTGATTCC CTCAAACCAT ATCTCGATAA AGGCGACATC ATCATTGATG12360GTGGTAACAC CTTCTTCCAG GACACCATTC GTCGTAATCG TGAGCTTTCT GCCGAAGGCT12420TTAACTTCAT TGGTACCGGT GTTTCCGGTG GTGAAGAAGG TGCGCTGAAA GGTCCTTCCA12480TTATGCCTGG TGGGCAGAAA GAAGCCTATG AACTGGTTGC ACCGATCCTC ACCAAAATCG12540CCGCAGTGGC TGAAGACGGT GAGCCATGCG TTACCTATAT TGGTGCCGAT GGCGCGGGTC12600ACTATGTAAA AATGGTTCAC AACGGTATTG AATACGGTGA TATGCAGCTG ATTGCTGAAG12660CCTACTCTTT GCTTAAAGGT GGCTTGAACC TTTCCAACGA AGAACTGGCG CAGACCTTTA12720CCGAGTGGAA TAACGGTGAA CTGAGCAGCT ACCTGATCGA CATCACCAAA GATATCTTCA12780CCAAAAAAGA TGAAGACGGT AACTACCTGG TTGATGTGAT CCTGGATGAA GCGGCTAACA12840AAGGTACCGG TAAATGGACC AGCCAGAGCG CACTGGATCT CGGCGAACCG CTGTCGCTGA12900TTACCGAGTC TGTGTTTGCA CGTTACATCT CTTCTCTGAA AGATCAGCGT GTTGCCGCAT12960CTAAAGTTCT CTCTGGCCCG CAAGCACAGC CAGCAGGCGA CAAGGCTGAG TTCATCGAAA13020AAGTTCGTCG TGCGCTGTAT CTGGGCAAAA TCGTTTCTTA CGCTCAGGGC TTCTCTCAGC13080TGCGTGCTGC GTCTGAAGAG TACAACTGGG ATCTGAACTA CGGCGAAATC GCGAAGATTT13140TCCGTGCTGG TTGCATCATC CGTGCGCAGT TCCTGCAGAA AATCACCGAT GCATACGCCG13200AAAATCCGCA GATCGCTAAC CTGCTGCTGG CTCCGTACTT CAAGCAAATT GCCGATGACT13260ACCAGCAGGC GCTGCGCGAT GTCGTCGCTT ATGCGGTACA GAACGGTATC CCGGTTCCGA13320CCTTCGCCGC TGCGGTTGCC TATTATGACA GCTACCGCGC CGCAGTTCTG CCTGCGAACC13380TAATCCAGGC TCAGCGCGAC TA 13402以上僅是本發明較佳實施例,並非對本發明作任何限制,凡依本發明技術實質對以上實施例作修改、等同變化與修飾,均屬本發明技術方案的範圍內。
權利要求
1.一種對鮑氏志賀氏菌10型的O-抗原特異的核苷酸,其特徵在於,其是如SEQ ID NO1所示的分離的核苷酸,全長13402個鹼基;或者具有一個或多個插入、缺失或取代的鹼基,同時保持所述分離的核苷酸功能的SEQ IDNO1的核苷酸。
2.按照權利要求1所述的對鮑氏志賀氏菌10型的O-抗原特異的核苷酸,其特徵在於,其由9個基因組成,都位於galF基因和gnd基因之間。
3.按照權利要求2所述的對鮑氏志賀氏菌10型的O-抗原特異的核苷酸,其特徵在於,所述的基因包括轉運酶基因,包括wzx基因或與wzx有相似功能的基因;聚合酶基因,包括wzy基因或與wzy有相似功能的基因;糖基轉移酶基因,包括orf1、orf2、orf4、orf5基因;功能未知的orf8基因;其中所述的轉運酶基因是SEQ ID NO1中的10458至11870鹼基的核苷酸;所述的聚合酶基因是SEQ ID NO1中的3195至4247鹼基的核苷酸;所述的orf1基因是SEQ ID NO1中的1098至2066鹼基的核苷酸;所述的orf2基因是SEQ ID NO1中的2059至3168鹼基的核苷酸;所述的orf4基因是SEQ IDNO1中的4240至5331鹼基的核苷酸;所述的orf5基因是SEQ ID NO1中的5306至6424鹼基的核苷酸;所述的orf8基因是SEQ ID NO1中的9468至10424鹼基的核苷酸。
4.按照權利要求1或2所述的對鮑氏志賀氏菌10型的O-抗原特異的核苷酸,其特徵在於,其還包括源於所述的wzx基因、wzy基因、糖基轉移酶基因或orf8基因中的寡核苷酸;或糖合成路徑基因中的寡核苷酸;以及它們的混合或它們的重組。
5.按照權利要求4所述的對鮑氏志賀氏菌10型的O-抗原高度特異的核苷酸,其特徵在於,所述的源於wzx基因的寡核苷酸對是SEQ ID NO1中的10757至10774鹼基的核苷酸和11648至11665鹼基的核苷酸;SEQ ID NO1中的10889至10906鹼基的核苷酸和11915至11932鹼基的核苷酸;源於wzy基因的寡核苷酸對是;SEQ ID NO1中的3538至3555鹼基的核苷酸和4039至4056鹼基的核苷酸;SEQ ID NO1中的3418至3435鹼基的核苷酸和3711至3728鹼基的核苷酸;源於orf8基因的寡核苷酸對是SEQ ID NO1中的9524至9541鹼基的核苷酸和10154至10171鹼基的核苷酸;SEQ ID NO1中的9581至9598鹼基的核苷酸和10378至10395鹼基的核苷酸。
6.權利要求1所述的對鮑氏志賀氏菌10型的O-抗原特異的核苷酸在檢測表達O-抗原的細菌、在診斷中鑑定細菌的O-抗原和細菌的其它多糖抗原的應用。
7.權利要求1所述的對鮑氏志賀氏菌10型的O-抗原特異的核苷酸的重組分子,而且通過插入表達可提供表達鮑氏志賀氏菌10型的O-抗原,並成為細菌疫苗。
8.權利要求1所述的對鮑氏志賀氏菌10型的O-抗原特異的核苷酸的應用,其特徵在於,它作為引物用於PCR、作為探針用於雜交反應與螢光檢測、或者用於製造基因晶片或微陣列,檢測人體和環境中的細菌。
9.權利要求1所述的對鮑氏志賀氏菌10型的O-抗原特異的核苷酸的分離方法,其特徵在於,包括下述步驟(1)基因組的提取在5mL的LB培養基中37℃過夜培養鮑氏志賀氏菌10型,離心收集細胞。用500ul 50mM Tris-HCl(pH8.0)和10ul 0.4M EDTA重懸細胞,37℃溫育20分鐘,然後加入10ul 10mg/ml的溶菌酶繼續保溫20分鐘;之後加入3ul 20mg/ml的蛋白酶K、15ul 10%SDS,50℃溫育2小時,再加入3ul 10mg/ml的RNase,65℃溫育30分鐘;加等體積酚抽提混合物,取上清液,再用等體積的酚∶氯仿∶異戊醇(25∶24∶1)的溶液抽提兩次,取上清液再用等體積的乙醚抽提以除去殘餘的酚,上清液用2倍體積乙醇沉澱DNA,用玻璃絲卷出DNA並用70%乙醇洗DNA,最後將DNA重懸於30ul TE中,基因組DNA通過0.4%的瓊脂糖凝膠電泳檢測;(2)通過PCR擴增鮑氏志賀氏菌10型中的O-抗原基因簇以鮑氏志賀氏菌10型的基因組為模板通過Long PCR擴增其O-抗原基因簇;首先根據經常發現於O-抗原基因簇啟動子區的JumpStart序列設計上遊引物(5』-ATT GTGGCT GCA GGG ATC AAA GAA ATC-3』),再根據O-抗原基因簇下遊的gnd基因設計下遊引物(5』-TAG TCG CGC TGN GCC TGG ATT AAG TTC GC-3』)。用BoehringerMannheim公司的Expand Long Template PCR方法擴增O-抗原基因簇,PCR反應程序如下在94℃預變性2分鐘,然後94℃變性10秒,61℃退火30秒,68℃延伸15分鐘,這樣進行30個循環;最後,在68℃繼續延伸7分鐘,得到PCR產物,用0.8%的瓊脂糖凝膠電泳檢測PCR產物的大小及其特異性;合併6管long PCR產物,並用Promega公司的Wizard PCR Preps純化試劑盒純化PCR產物;(3)構建O-抗原基因簇文庫用被修改的Novagen DNaseI shot gun法構建O-抗原基因簇文庫;反應體系是300ng PCR純化產物,0.9ul 0.1MMnCl2,1ul 1∶2000稀釋的1mg/ml的DNaseI,反應在室溫中進行;酶切10分鐘使DNA片段大小集中在1kb-3kb之間,而後加入2ul 0.1M EDTA終止反應;合併4管同樣的反應體系,用等體積的酚抽提一次,用等體積的酚∶氯仿∶異戊醇(25∶24∶1)溶液抽提一次,再用等體積的乙醚抽提一次後,用2.5倍體積的無水乙醇沉澱DNA,並用70%乙醇洗沉澱,最後重懸於18ul水中;隨後在此混合物中加入2.5ul dNTP(1mMdCTP,1mMdGTP,1mMdTTP,10mMdATP),1.25ul 100mM DTT和5單位的T4DNA聚合酶,11℃反應30分鐘,將酶切產物補成平端,75℃終止反應後,加入5單位的Tth DNA聚合酶及其相應的緩衝液並將體系擴大為80ul,70℃反應20分鐘,使DNA的3′端加dA尾;此混合物經等體積氯仿∶異戊醇(24∶1)溶液抽提和等體積乙醚抽提後與Promega公司的3×10-3的pGEM-T-Easy載體於16℃連接24小時,總體積為90ul,其中有9ul的10×buffer和25單位的T4DNA連接酶;最後用1/10體積的3M NaAc(pH5.2)和2倍體積的無水乙醇沉澱連接混合物,再用70%乙醇洗沉澱,乾燥後溶於30ul水中得到連接產物;用Bio-Rad公司的電轉化感受態細胞的製備方法製備感受態大腸桿菌DH5□細胞,取2-3ul連接產物與50ul感受態大腸桿菌DH5□混合後,轉到Bio-Rad公司的0.2cm的電擊杯中電擊,電壓為2.5千伏,時間為5.0毫秒-6.0毫秒,電擊後立即在杯中加入1ml的SOC培養基使菌復甦,然後將菌塗在含有氨苄青黴素、X-Gal和IPTG的LB固體培養基上37℃過夜培養,次日得到藍白菌落,將得到的白色菌落即白色克隆轉到含有氨苄青黴素的LB固體培養基上培養,同時從每個克隆中提取質粒並用EcoRI酶切鑑定其中的插入片段的大小,得到的白色克隆群構成了鮑氏志賀氏菌10型的O-抗原基因簇文庫;(4)對文庫中的克隆測序從文庫中挑選插入片段在1000bp以上的100個克隆由上海生物工程有限公司用ABI377型DNA自動測序儀對克隆中的插入片段單向進行測序,使序列達到80%的覆蓋率,再通過將相聯繫的序列進行反向測序及測通得到剩餘20%的序列,從而獲得O-抗原基因簇的所有序列;(5)核苷酸序列的拼接及分析用英國劍橋MRC(Medical ResearchCouncil)分子生物學實驗室出版的Staden package軟體包的Pregap4和Gap4軟體拼接和編輯所有的序列,從而得到鮑氏志賀氏菌10型的O-抗原基因簇的核苷酸全長序列,序列的質量主要由兩個方面來保證1)對鮑氏志賀氏菌10型的基因組作6個Long PCR反應,然後混合這些產物以產生文庫。2)對每個鹼基,保證3個以上高質量的覆蓋率;在得到鮑氏志賀氏菌10型的O-抗原基因簇的核苷酸序列後,用美國國家生物技術信息學中心(The NationalCenter for Biotechnology Information,NCBI)的orffinder發現基因,找到11個開放的閱讀框,用blast系列軟體與GenBank中的基因比較以發現這些開放的閱讀框的功能並確定它們是什麼基因,再用英國sanger中心的Artemis軟體完成基因注釋,用Clustral W軟體做DNA和蛋白質序列間的精確比對,最後得到鮑氏志賀氏菌10型的O-抗原基因簇的結構;(6)特異基因篩選針對鮑氏志賀氏菌10型的O-抗原基因簇中wzx、wzy、orf8基因設計引物;在每個基因內各設計兩對引物,每對引物分布在相應基因內的不同地方以確保其特異性;用這些引物以166株大腸桿菌和43株志賀氏菌基因組為模板進行PCR,源於wzx、wzy基因的所有引物都在鮑氏志賀氏菌10型和鮑氏志賀氏菌6型中得到陽性結果,而源於orf8基因的兩對引物只在鮑氏志賀氏菌10型中得到陽性結果,在其他組中沒有擴增到任何大小正確的帶,也就是,在大多數組中沒有得到任何PCR產物帶,雖然在少數組中得到PCR產物帶,但其大小不符合預期大小。所以wzx、wzy基因對鮑氏志賀氏菌10型和鮑氏志賀氏菌6型及其O-抗原都是高度特異的,而orf8基因對鮑氏志賀氏菌10型及其O-抗原是高度特異的。
全文摘要
本發明提供一種對鮑氏志賀氏菌10型(Shigellabodyii 10)的O-抗原特異的核苷酸,它是鮑氏志賀氏菌10型中控制O-抗原合成的基因簇的核苷酸全序列,如SEQ ID NO1所示的分離的核苷酸,全長13402個鹼基;或者具有一個或多個插入、缺失或取代的鹼基,同時保持所述分離的核苷酸功能的SEQ ID NO1的核苷酸;還包括源於鮑氏志賀氏菌10型的O-抗原基因簇中的wzx基因或與wzx有相似功能的基因和wzy基因或與wzy有相似功能的基因及未知功能的orf8基因的寡核苷酸,本發明通過PCR證實寡核苷酸對鮑氏志賀氏菌10型的O-抗原都有高度的特異性,本發明還公開了用本發明的寡核苷酸檢測和鑑定人體及環境中的鮑氏志賀氏菌10型的方法。
文檔編號A61P31/04GK1546510SQ200310107160
公開日2004年11月17日 申請日期2003年12月3日 優先權日2003年12月3日
發明者馮露, 楊靜華, 彭霞, 王磊, 馮 露 申請人:南開大學

同类文章

一種新型多功能組合攝影箱的製作方法

一種新型多功能組合攝影箱的製作方法【專利摘要】本實用新型公開了一種新型多功能組合攝影箱,包括敞開式箱體和前攝影蓋,在箱體頂部設有移動式光源盒,在箱體底部設有LED脫影板,LED脫影板放置在底板上;移動式光源盒包括上蓋,上蓋內設有光源,上蓋部設有磨沙透光片,磨沙透光片將光源封閉在上蓋內;所述LED脫影

壓縮模式圖樣重疊檢測方法與裝置與流程

本發明涉及通信領域,特別涉及一種壓縮模式圖樣重疊檢測方法與裝置。背景技術:在寬帶碼分多址(WCDMA,WidebandCodeDivisionMultipleAccess)系統頻分復用(FDD,FrequencyDivisionDuplex)模式下,為了進行異頻硬切換、FDD到時分復用(TDD,Ti

個性化檯曆的製作方法

專利名稱::個性化檯曆的製作方法技術領域::本實用新型涉及一種檯曆,尤其涉及一種既顯示月曆、又能插入照片的個性化檯曆,屬於生活文化藝術用品領域。背景技術::公知的立式檯曆每頁皆由月曆和畫面兩部分構成,這兩部分都是事先印刷好,固定而不能更換的。畫面或為風景,或為模特、明星。功能單一局限性較大。特別是畫

一種實現縮放的視頻解碼方法

專利名稱:一種實現縮放的視頻解碼方法技術領域:本發明涉及視頻信號處理領域,特別是一種實現縮放的視頻解碼方法。背景技術: Mpeg標準是由運動圖像專家組(Moving Picture Expert Group,MPEG)開發的用於視頻和音頻壓縮的一系列演進的標準。按照Mpeg標準,視頻圖像壓縮編碼後包

基於加熱模壓的纖維增強PBT複合材料成型工藝的製作方法

本發明涉及一種基於加熱模壓的纖維增強pbt複合材料成型工藝。背景技術:熱塑性複合材料與傳統熱固性複合材料相比其具有較好的韌性和抗衝擊性能,此外其還具有可回收利用等優點。熱塑性塑料在液態時流動能力差,使得其與纖維結合浸潤困難。環狀對苯二甲酸丁二醇酯(cbt)是一種環狀預聚物,該材料力學性能差不適合做纖

一種pe滾塑儲槽的製作方法

專利名稱:一種pe滾塑儲槽的製作方法技術領域:一種PE滾塑儲槽一、 技術領域 本實用新型涉及一種PE滾塑儲槽,主要用於化工、染料、醫藥、農藥、冶金、稀土、機械、電子、電力、環保、紡織、釀造、釀造、食品、給水、排水等行業儲存液體使用。二、 背景技術 目前,化工液體耐腐蝕貯運設備,普遍使用傳統的玻璃鋼容

釘的製作方法

專利名稱:釘的製作方法技術領域:本實用新型涉及一種釘,尤其涉及一種可提供方便拔除的鐵(鋼)釘。背景技術:考慮到廢木材回收後再加工利用作業的方便性與安全性,根據環保規定,廢木材的回收是必須將釘於廢木材上的鐵(鋼)釘拔除。如圖1、圖2所示,目前用以釘入木材的鐵(鋼)釘10主要是在一釘體11的一端形成一尖

直流氧噴裝置的製作方法

專利名稱:直流氧噴裝置的製作方法技術領域:本實用新型涉及ー種醫療器械,具體地說是ー種直流氧噴裝置。背景技術:臨床上的放療過程極易造成患者的局部皮膚損傷和炎症,被稱為「放射性皮炎」。目前對於放射性皮炎的主要治療措施是塗抹藥膏,而放射性皮炎患者多伴有局部疼痛,對於止痛,多是通過ロ服或靜脈注射進行止痛治療

新型熱網閥門操作手輪的製作方法

專利名稱:新型熱網閥門操作手輪的製作方法技術領域:新型熱網閥門操作手輪技術領域:本實用新型涉及一種新型熱網閥門操作手輪,屬於機械領域。背景技術::閥門作為流體控制裝置應用廣泛,手輪傳動的閥門使用比例佔90%以上。國家標準中提及手輪所起作用為傳動功能,不作為閥門的運輸、起吊裝置,不承受軸向力。現有閥門

用來自動讀取管狀容器所載識別碼的裝置的製作方法

專利名稱:用來自動讀取管狀容器所載識別碼的裝置的製作方法背景技術:1-本發明所屬領域本發明涉及一種用來自動讀取管狀容器所載識別碼的裝置,其中的管狀容器被放在循環於配送鏈上的文檔匣或託架裝置中。本發明特別適用於,然而並非僅僅專用於,對引入自動分析系統的血液樣本試管之類的自動識別。本發明還涉及專為實現讀