新四季網

炎症性腸病的診斷方法

2023-06-04 18:51:41 2

專利名稱:炎症性腸病的診斷方法
技術領域:
炎症性腸病是^-種病因不明的慢性疾病,其特徵在於胃腸道不同水平的持久性黏膜炎症。潰瘍性結腸炎和克羅恩氏病是炎症性腸疾病的兩種主要類型。潰瘍性結腸炎導致限制在結腸的持續性黏膜炎症,而克羅恩氏病導致在整個胃腸道的任意位置非持續性穿壁性炎症(transmural inflammation),儘管其最通常地影響迴腸末端(terminal i leum)。最常見的腸道病變由黏膜潰瘍、腸壁腫脹和腸腔狹窄(stricturing)組成。這些慢性炎症病變可導致症狀比如腹瀉、便急(faecal urgency)、腹痛和發熱、以及不同嚴重程度的併發症 包括出血、腸梗阻、敗血症和營養不良。
背景技術:
流行病學研究證明在上個世紀自1950年以來,在西歐和北美這種疾病的發病率(incidence)穩步上升。二十年後在南歐和日本發病率上升,但如今發病率(incidencerate)與北歐和北美同樣的顯著。最近的數據表明東歐國家以及南亞和東亞的發病率越來越高。發病率的變化似乎與西化的生活方式有關,包括飲食習慣的變化和環境的變化比如改善的衛生條件和產業化。如今,合併的患病率(prevalence)數字(潰瘍性結腸炎加上克羅恩氏病)表明炎症性腸病影響了高達O. 5%的發達社會的群體。炎症性腸病對社會的影響是非成比例的高,作為表現常發生在年輕的時候,並且有可能造成終身的健康狀況不佳。目前,還沒有炎症性腸疾病的治癒或根除療法。通常,潰瘍性結腸炎和克羅恩氏病均呈現起伏的活動(activity),具有不受控的、慢性黏膜炎症發作(bouts),隨後是緩解期間發生的重塑過程。主要治療方法通常是藥物療法來減輕炎症活動的發作並防止緩解時未來的復發。可以用各種藥物治療患者,包括5-ASAs (如美沙拉嗪)、類固醇(如潑尼松龍)、和免疫抑制劑(如硫唑嘌呤)。此外,當標準藥物治療失敗時,患者也可以接受新的生物藥物如單克隆抗體(如抗TNF-α抗體英夫利昔單抗)。儘管它們一般有效,但這種藥物可以具有重大的負擔。它們不僅貴,副作用還是常見的,對於免疫抑制劑發生率為28%,對於類固醇上升到50%。有些患者可出現嚴重的副作用,如全身性感染或瘤形成,因此目前的療法需要密切的監視。此外,約30%患有潰瘍性結腸炎的患者和50%患有克羅恩氏病的患者,在他們生活中的某些時候需要手術。可用的藥物療法不能達到這種疾病的根除或永久治癒,這主要是由於這樣的事實,潰瘍性結腸炎和克羅恩氏病的確切病因仍有待澄清。然而,至少在過去幾年中,導致黏膜炎症性病變的病理生理機制已被部分揭示。有令人信服的證據表明,炎症性腸病中觀察到的炎症是腸道(gut)微生物群落和黏膜免疫系統之間的異常反應引起的。黏膜免疫系統的T輔助性淋巴細胞(Th)對病原體的防禦反應與旨在清楚病原體的炎症過程有關,但同時這些過程也破壞了宿主組織。在正常情況下,一些共生的腸道微生物在腸道淋巴濾泡中對於誘導調節性T淋巴細胞(Tregs)似乎發揮了重要作用。調節性T淋巴細胞是被稱為「免疫耐受」現象的關鍵作用者(player),因為這些淋巴細胞在對被識別為非致病性的微生物抗原反應時不誘導炎症。調節性T淋巴細胞介導的免疫耐受是必要的自我平衡機制,通過這種機制宿主可以承受腸道當中或其它身體表面無害抗原的巨大負擔,而不通過炎症進行反應。一些證據表明,在具有遺傳易感性的個體中,Th淋巴細胞介導的對抗腔細菌的免疫是驅動產生腸病變和/或損害病變消除的炎症過程中的關鍵事件。腸道微生物群(microbiota)與黏膜免疫部分間的缺陷相互作用可導致引起慢性腸炎症的異常。^-些研究已經表明糞便微生物群的組成在患有炎症性腸疾病的受試者與健康對照之間是不同的。報導的差異是多樣的,且各項研究之間並不總是一致的。因此,不可能使用公開的差異來區分患有炎症性腸疾病的患者和健康人。然而,如上面所解釋的,將確定特定環境下在炎症性腸病特別是克羅恩氏病的發作和維持中的固有的(indigenous)腸道微生物。因此仍然需要--種新的、可靠的方法來允許一致性的炎症性腸病診斷。 大多數腸共生體無法培養。已經開發出基因組策略來克服這種限制(Hamady和Knight, Genome Res, 19:1141-1152,2009)。這些策略允許將微生物組定義為微生物群基因組中包含的基因的集合(Turnbaugh.等人,Nature, 449:804-8010,2007 ;Hainady 和 Knight, GenomeRes. , 19:1141-1152,2009)。已證明,所有個體共有的少數物種的存在構成了人腸微生物群系統發育的核心(Tap 等人』 Environ Microbiol.,11(10) :2574-2584,2009)。近期,宏基因組學(metagenomic)分析已導致對330萬個非冗餘人腸道微生物基因廣泛目錄的鑑定,這對應著576. 7千兆個鹼基的序列(Qin等人,Nature, 2010,doi : 10. 1038/nature08821)

發明內容
本發明人已使用基於在不同個體中來自人糞便DNA片段的分離和測序的方法。由於來自腸道的微生物基因的廣泛目錄現已可獲得(Qin等人,Nature, 2010,doi : 10. 1038/nature08821),可以計算在特定群體中(如,患炎症性腸病的患者)特定序列的拷貝數和頻率。因此有可能鑑定特定基因的存在或缺失與特定病理存在或缺失之間的任何相關性。此夕卜,可以確定個體中特定基因的拷貝數。克羅恩氏病和潰瘍性結腸炎是消化道慢性免疫炎症性疾病,統稱為炎症性腸病。本發明人能夠鑑定一組患有克羅恩氏病或潰瘍性結腸炎的患者和健康人對照之間顯著不同的基因。這些基因列於表I (克羅恩氏病)和表2 (潰瘍性結腸炎)中。所述基因在健康個體中比在患者中更眾多。這種觀察在統計學上是顯著的,因為微生物基因的總數在兩個群體中沒有不同。因此,在患炎症性腸病的個體中特定人腸道微生物基因存在丟失。本發明的第一方面是一種用於診斷炎症性腸病的方法,所述方法包括確定是否至少一個基因從個體腸道微生物組中缺失的步驟。通過「個體腸道微生物組」,此處理解為構成所述個體微生物群的所有基因。術語「個體腸道微生物組」因此對應著所述個體腸道中存在的所有細菌的所有基因。當基因在微生物組中的拷貝數在一定的閾值以下時,基因從微生物組中缺失。根據本發明,「閾值」意圖表示這樣的值,其允許對樣本進行區分,在樣本中興趣基因的拷貝數對應著個體微生物組中低或高的拷貝數。特別是,如果一些拷貝小於或等於閾值,那麼該基因在微生物組中的拷貝數被認為是低的,而如果拷貝數超過閾值,那麼該基因在微生物組中的拷貝數被認為是高的。低拷貝數是指基因從微生物組中缺失,而大量拷貝是指基因存在於微生物組中。對於每個基因,最佳閾值可能根據測量基因拷貝數所使用的方法而不同。然而,其可容易地由技術人員基於若干個體的微生物組分析,在其中對於特定基因的拷貝數(低或高)是已知的,以及基於和對照基因的拷貝數的比較而確定。 本發明的方法從而允許技術人員僅僅基於來自個體腸道微生物組的基因的存在或缺失來診斷病理。特定基因的拷貝數和攜帶該基因的細菌細胞數目有直接的相關性。本發明的方法從而允許技術人員通過微生物組分析來檢測生態失調,即微生物的不平衡。並非腸道中的所有物種已被鑑定,因為大多數無法培養,並且很難鑑定。此外,在給定個體腸道中發現的大多數物種是罕見的,這使得它們很難檢測(Hamady和Knight, GenomeRes, 1.9:11.41-1.152,2009)。在本發明的這一方面,不需要先鑑定所述基因所屬的細菌物種。因此本發明的診斷方法不限於確定已知的腸道細菌物種的群體變化,還包括尚未分類學上描述的細菌。有多種方式獲得所述個體腸道微生物DNA樣本(Sokol等人,Inflamm. BowelDis.,14(6) :858-867,2008)。例如,有可能製備通過結腸鏡獲得的黏膜標本、或活檢。然而,結腸鏡是^-種侵入性程序,不同研究之間在收集程序方面是不確定的。同樣地,有可能通過手術獲得活檢。然而,和結腸鏡相比,手術是更加侵入性的程序,其對微生物群體的作用是未知的。優選的是糞便分析,其為一種已經被可靠地用在本領域中的程序(Bullock 等人,Curr Issues Intest Microbiol. ;5(2):59-64, 2004;Manichanh 等人·,Gut., 55:205-211,2006;Bakir等人,Int J Syst Evol Microbiol, 56(5) :931-935,2006; Manichanh 等人,Nucl. AcidsRes. , 36 (16) : 5180-5188, 2008; Sokol 等人,Inflamm. BowelDis. , 14(6) :858-867, 2008)。在實驗實施例的方法部分描述了這種程序的一個實例。糞便含有約IO11個細菌細胞每克(溼重)以及細菌細胞包括約糞便質量的約50%。糞便的微生物群主要代表遠端大腸的微生物學。因此有可能從個體糞便中分離和分析大量微生物DNA。通過「微生物DNA」,此處應理解為來自人腸道任何定居細菌群落的DNA。術語「微生物DNA」包括編碼和非編碼序列;尤其不限於完整基因,還包括編碼序列的片段。糞便分析因此是非侵入性的程序,其產生從患者到患者一致性的且直接可比較的結果。因此,在^-個優選的實施方案中,本發明的方法包括從所述個體糞便獲得微生物DNA的步驟。在另一個優選的實施方式中,收集來自所述個體的糞便,提取DNA,並確定至少一個基因在個體腸道微生物組中的存在或缺失。通過技術人員已知的所有方法可確定基因的存在或缺失。例如,所述個體的整體微生物組可能被測序,並且在生物信息學方法的幫助下搜索所述基因的存在或缺失。在實驗實施例的方法部分描述了這樣的策略的--個實例。或者,用特異性探針通過雜交如Southern雜交在微生物組中尋找興趣基因。在這個特定的實施方式中,儘管Southern雜交是完全合適的,無論如何使用微陣列更方便和更敏感,這對於本領域技術人員而言是非常顯而易見的。在另一個實施方式中,通過擴增,特別是通過定量PCR (qPCR),可檢測到興趣基因的存在。這些技術(Southern、微陣列、qPCR等)目前是本領域技術人員常規使用的,因此不需要在此處詳述。在另一個優選的實施方式中,炎症性腸病選自克羅恩氏病和潰瘍性結腸炎。在另一個優選實施方式中,所述疾病是克羅恩氏病;在另一個優選實施方式中,所述疾病是潰瘍性結腸炎。在另一個優選的實施方式中,確定在個體腸道微生物組中缺失或存在的基因選自表I和2中列出的基因的組中。在另一個優選的實施方式中,基因選自表I中列出的基因的組中;在另一個優選的實施方式中,基因選自表2中列出的基因的組中。本領域技術人員將不會有任何困難認識到測試的基因越多,結果可信度越高。根據另一個優選實施方式,本發明的方法包括確定列於表I中的至少50%的基因,更優選,表I中至少75%的基因,甚至更優選,表I的至少90%的基因的存在或缺失。根據另一個優選實施方式,本發明的方法包括確定列於表2中的至少50%的基因,更優選,表2中至少75%的基因,甚至更優選,表2的至少90%的基因的存在或缺失。儘管微生物菌叢(flora)中發現的大量細菌物種沒有被鑑定,已知大多數細菌屬於擬桿菌屬(Bact.eroides)、梭菌屬(Clostridium),梭桿菌屬(Fusobacterium),真細菌屬(Eubacterium),瘤胃球菌屬(Ruminococcus),消化球菌屬(Peptococcus),消化鏈球菌屬(Peptostreptococcus)和雙歧桿菌屬(Bifidobacterium)。其它屬比如大腸樸菌屬 (Escherichia)和乳桿菌屬(Lactobacillus)以更小的範圍存在。屬於這些屬的一些個體物種已被鑑定,並且這些物種的一些基因是已知的。已導致330萬個非冗餘微生物基因的鑑定的廣泛宏基因組學研究還允許大多數新序列的指定(assignment)。屬於給定物種的基因以和所述物種的所有其它基因相同的頻率存在於個體中。因此有可能在各種個體中針對每個通過本發明方法鑑定的基因來確定所述基因的存在或缺失與已知屬於特定細菌物種的一組基因的存在或缺失之間是否有相關性。這種相關性表明未知基因屬於所述特定細菌物種。本發明人因此已經表明--些細菌物種與炎症性腸病表型相關,而其它細菌物種與健康表型相關。通過所述物種的線性組合可以預測炎症性腸病表型,即個體腸道中存在的炎症性腸病表型相關的細菌物種越多,與所述個體腸道中健康表型相關的物種越少,所述個體患炎症性疾病的可能性越高。例如,人腸道中普拉梭菌(Faecal ibacteriumprausni t.zi i )和Roseburia inulinivorans (無對應譯文)的缺失,以及Clostridium boItae (無對應譯文)、多枝梭菌(Clostridium ramosum)和活潑瘤胃球菌(Ruminococcus gnavus)的存在表示這個人患有克羅恩氏病。同樣地,人腸道中Akkermansia muciniphila (無對應譯文)的缺失以及多毛擬桿菌(Bacteroides capilIosus)和柔嫩梭菌(Clostridium Iepturn)的存在表示這個人患有潰瘍性結腸炎。本領域技術人員清楚本發明的基因可以用作生物標誌物,例如在患炎症性腸病的患者治療過程中。因此,在另一實施方式中,本發明包括一種用於監測炎症性腸病治療療效的方法。當對炎症性腸病的治療有效時,最初觀察到的生態失調逐漸消失。然而,當所述個體患病時,一些特定的基因從個體腸道缺失(如,當疾病是克羅恩氏病時,表I的基因,或者當個體患有潰瘍性結腸炎時,表2的基因),這些基因在治療過程中重新出現。在本實施方式中,本發明的方法因此包括以下步驟首先確定是否至少一個基因從所述患者的微生物組中缺失,施用治療,確定是否所述至少一個基因存在於患者的微生物組中。在一個優選的實施方式中,本發明的方法包括以下步驟在治療之前和之後,從所述個體的糞便中獲得微生物DNA。在另一個優選的實施方式中,在治療之前和之後,從所述個體收集糞便,提取DNA,並確定至少一個基因從個體腸道微生物組中的存在或缺失。在另一個優選的實施方式中,炎症性腸病選自克羅恩氏病和潰瘍性結腸炎。在另--個優選實施方式中,所述疾病是克羅恩氏病;在另一個優選實施方式中,所述疾病是潰瘍性結腸炎。在另一個優選的實施方式中,確定在個體腸道微生物組中缺失或存在的基因選自表I和2中列出的基因的組中。在另一個優選的實施方式中,基因選自表I中列出的基因的組中;在另一個優選的實施方式中,基因選自表2中列出的基因的組中。在本發明方法的一個具體實施方式
中,表I和/或表2中至少50%、75%或90%的基因在治療前從所述個體腸道微生物組中缺失。因此,根據優選的實施方式,本發明的方法包括確定列於表I中的至少50%的基因,更優選,表I中至少75%的基因,甚至更優選,表I的至少90%的基因的存在或缺失。根據另一個優選的實施方式,本發明的方法包括確定列於表2中的至少50%的基因,更優選,表2中至少75%的基因,甚至更優選,表2的至少90%的基因的存在或缺失。 本發明還包括專門用於實施本發明方法的試劑盒,其包括在患有炎症性腸病的患者中缺失,而在健康人當中存在的所有基因。尤其是,本發明涉及專門用於實施本發明方法的微陣列,其包括與在患有炎症性腸病的患者中缺失而在健康人當中存在的所有基因結合的探針。在一個優選的實施方式中,所述微陣列是核酸微陣列。根據本發明,「核微陣列」由附著至基底(substrate)上的不同核酸探針組成,該基底可以是微晶片、玻璃載片或微球尺寸的珠。微晶片可以由聚合物、塑料、樹脂、多糖、二氧化矽或基於二氧化矽的材料、碳、金屬、無機玻璃或硝酸纖維素構成。探針可以是核酸比如cDNA (「cDNA微陣列」)或寡核苷酸(「寡核苷酸微陣列」,為長度大約25至大約60個鹼基對或更少的寡核苷酸)。作為核酸技術的替代,可以使用定量PCR,並且因此特異於待測基因的擴增引物對於進行根據本發明的方法也是非常有用的。因此本發明進一步涉及用於在患者中診斷炎症性腸病的試劑盒,包括如上所述的專門的微陣列或在患有炎症性腸病的患者中缺失而在健康人當中存在的基因的特異性擴增引物。然而這些試劑盒可允許技術人員檢測10%、25%、50%或75%的所述基因,當它們允許檢測90%、95%、97. 5%或甚至99%的所述基因時,它們是最有用的。因此,根據本發明的微陣列將包括與至少10%、25%、50%或75%,以及優選90%、95%、97. 5%,和甚至更優選至少99%的所述基因結合的探針。同樣地,用於定量PCR的試劑盒將含有允許至少10%、25%,50%或75%,以及優選90%、95%、97. 5%,和甚至更優選至少99%的所述基因的擴增。在一個優選的實施方式中,炎症性腸病選自克羅恩氏病和潰瘍性結腸炎。在另一個優選實施方式中,所述疾病是克羅恩氏病;在另一個優選實施方式中,所述疾病是潰瘍性結腸炎。在另一個實施方式中,在患有克羅恩氏病的患者中缺失而在健康人中存在的基因是表I中列出的基因;在另一個實施方式中,它們在表2中列出。


圖I :CD相關基因和UC相關基因的整體分析。A)在健康個體中更多的CD相關基因。每個個體基因數目相對於CD相關基因的函數的圖,其表明該基因在健康個體中比患者中更多。B)在健康個體中更多的UC相關基因。每個個體基因數目相對於UC相關基因的函數的圖,表明該基因在健康個體中比患者中更多。圖2 :A)針對處於所定義的水平(至少50%的基因)的群體的部分,5個物種的線性組合很好地區分克羅恩氏病表型;B) 3個物種區分潰瘍性結腸炎。
具體實施例方式方法人糞便樣本收集。西班牙個體是健康對照或處於臨床緩解中的患有慢性炎症性腸病的患者(克羅恩氏病或潰瘍性結腸炎)。要求患者和健康對照提供冷凍的大便樣本。在家裡獲得新鮮的大便樣本,並且通過將它們儲存在他們的家用冰箱中立即冷凍樣本。使用封閉的聚苯乙烯泡沫容器將冷凍樣本交付給醫院,然後它們被保存在-80°C直到分析。DKA提取。各糞便樣本的冷凍等份(200mg)懸浮在250 μ I的異硫氰酸胍、O. IMTris (ρΗ7· 5)和40 μ 110%Ν_月桂醯基肌氨酸中。然後,如先前所述(Manichanh等人,Gut, 55:205 - 211,2006)進行 DNA 提取。通過 NanoDrop (Thermo Scientific)和瓊脂糖凝膠電泳估計DNA的濃度及其分子大小。DNA文庫的構建和測序。按照製造商的說明書(Illumina)製備DNA文庫。我們使用了如其它地方所述的相同工作流程來進行集群(cluster)生成、模板雜交、等溫擴增、線性化、封閉和變性以及測序引物的雜交。鹼基識別途徑(base-calling pipeline)(版本 IlluminaPipeline-O. 3)用於處理原始的突光圖像並識別(call)序列。我們為最先的15個樣本的每個構建一個文庫(克隆插入大小200bp),為其餘109個樣本的每個構建具有不同克隆插入大小(135bp和400bp)的兩個文庫用來驗證實驗的重複性。為了估計新序列生成和測序深度之間的最佳回報(return ),我們使用短寡核苷酸比對程序(SOAP )將來自樣本皿110006和如10012的Illumina GA讀取與產生自相同的兩個樣本的總共311. 7Mb的468,335桑格(Sanger)讀取(分別 156. 9 和 154. 7Mb)進行比對(Li 等人,Bioinformatics, 25:1966 - 1967, 2009)並且95%序列同一性的匹配要求。用約4Gb的Illumina序列,覆蓋94%和89%的桑格讀取(分別對於MH0006和MH0012)。對於MH0006和MHOO12分別進一步廣泛測序至12. 6和16. 6Gb只帶來了有限的(moderate)覆蓋率增加至大約95%。桑格讀取的90%以上被Illumina序列覆蓋到一個非常高且統一的水平,這表明在Illumina GA序列中有很少或沒有偏倚(bias)。正如所預期的,大比例的Illumina序列(對於M0006和M0012分別為57%和74%)是新的且不能被描繪到(mapped onto)桑格讀取上。在4和12_16Gb測序水平上,該部分(fraction)是相似的,這證實大部分的新序列(novelty)在4Gb時已經被捕
-M-犾。我們為其餘122個樣本產生35. 4-97. 6百萬個讀取,平均62. 5百萬個讀取。第一批15個樣本的測序讀取長度為44bp且第二批為75bp。所用的公共數據存放於GenBank的測序的細菌基因組(共806個基因組)於2009 年 I 月 10 日從 KCBI 資料庫(http://www. ncbi. nlm. nih. rov/)下載。從 HMP 資料庫(http://www. hmpdacc-resources. org/cRi-bin/hmp catalog/main. cRi)、GenBank(67個基因組)、聖路易斯的華盛頓大學(85個基因組,2009年4月版本,http://genome.WUstI. edu/pub/orgginlsm/Microbes/Human Gut Microbiome/)下載已知的人腸道細菌基因組序列,並且通過MetaHIT計劃(17個基因組,2009年9月版本,http://www. sanRer.ac. uk/pathogens/metahit/)進行測序。在這個計劃中使用的其它腸道宏基因組學數據包括(O從美國個體測序的人腸道宏基因組學數據(Zhang等人,Proc. Natl Acad. Sci.USA, 106:23652370, 2009),用登錄號SRA002775從NCBI下載;(2)來自日本個體的人腸道宏基因組學數據(Kurokawa 等人,DNA Res. 14:169 - 181, 2007),在 EMBL 上(htt.u: //www.bork. embl. de)從P. Bork的小組下載。本研究中我們構建的整合NR資料庫包括NCBI-NR資料庫(2009年4月版本)以及來自已知人腸道細菌基因組的所有基因。Illumina GA短讀取的從頭拼接。每個DNA樣本的高品質短讀取通過SOAP從頭彙編程序(assembler)進行拼接(Li.和 Zhu, GenomeRes. , 20 (2) : 265-272,2010)。簡單而言,我們首先根據17-mer的頻率從拼接中過濾低豐度序列。在拼接的前面篩選深度低於5的17-mers,對於 這些低頻率序列不太可能進行拼接,而刪除它們會顯著降低對內存的要求,並且使得在普通超級計算機(在我們的研究所中512GB的內存)上進行拼接變得可行。然後--個^-個地處理序列,de Bruijn圖的數據格式被用來存儲序列之間的重疊信息。由單一讀取支持的重疊路徑是不可信的並刪除。由測序錯誤或微生物株之間的遺傳變異引起的短的低深度tips (無對應譯文)和bubbles (無對應譯文)分別進行修剪(trim)和合併。讀取路徑被用來解決微小的重複。最後,我們在重複邊界處打破連接,輸出以明確連接作為重疊群(contig)的連續序列。選擇宏基因組學的特殊模式,並且參數「-K21」和「-K23」分別用於44bp和75bp的讀取來指示所需的最小序列重疊。對各樣本獨立地進行從頭拼接之後,我們將所有未拼接的讀取合併到一起,並針對它們進行拼接,以便使數據的利用最大化,並且通過將所有樣本的數據放在一起來拼接在各讀取集合(set)中具有低的頻率但是對於拼接具有足夠序列深度的微生物基因組。使用桑格讀取驗證Illumina重疊群。我們使用BLASTN (WUBLAST2. O)從樣本MH0006和MHOO12 (分別156. 9Mb和154. 7Mb)到來自相同樣本的Illumina重疊群(單個最佳命中在75bp以上且超過95%同一性)來繪製桑格讀取。各比對掃描共線性的斷裂(breakage),其中兩條序列在比對的一端具有至少50個鹼基未比對。每一個這樣的斷裂被認為是在共線性斷裂位置的Illumina重疊群的拼接錯誤。彼此30bp以內的錯誤進行合併。如果在錯誤兩側存在與重疊群結構有60bp —致的桑格讀取,則丟棄該錯誤。為了比較,我們在來自MH0006的454Titanium讀取(550Mb讀取)的Newb:[er2拼接上重複這種操作。對於Illumina拼接我們估計14. 12個錯誤每Mb重疊群,這與454拼接(20. 73每Mb)是可媲美的。描繪至少一個桑格讀取的Illumina重疊群的98. 7%在繪製(mapped)區域的99. 55%上是共線性的,這可媲美於這種454重疊群的97. 86%在繪製區域的99. 48%上是共線性的。人腸道微生物組覆蓋率的評價。使用SOAP,通過允許在第一 35-bp區域中至多兩個錯配以及讀取序列上90%的同·_一性,將Illumina GA讀取比對至拼接的重疊群以及已知的細菌基因組。使用BLASTN,以IX 10_8、超過IOObp的比對長度和最小90%同一性截止值,將Roche/454和桑格測序讀取比對至相同的參考。當通過SOAP比對至MII0006和MH0012的GA讀取、比對至來自相同樣本的桑格讀取時,允許兩個錯配並且同一性設置為讀取序列的 95%。非冗餘基因集合的基因預測和構建。我們使用MetaGene (Noguchi等人,NucleicAcids Res,. 34, 5623 - 5630,2006)——其使用通過給定序列的GC含量估計的雙連密碼子(di-codon)頻率,並基於匿名基因組序列預測ORF的整個範圍一從各124個樣本的重疊群中以及從合併拼接的重疊群中找到0RF。然後使用BLAT將預測的ORF彼此比對(Kent等人,Genome Res.,12:656 - 664,2002)。具有大於95%同一性以及比對長度覆蓋較短基因的90%以上的一對基因被分組在一起。共有基因的組然後進行合併,各合併的組中最長的ORF用於代表該組,組的其它成員作為冗餘。因此,我們通過排除冗餘從所有預測基因中組織了非冗餘基因集合。最後,過濾長度小於IOObp的ORF。我們使用NCBI的遺傳代碼將ORF翻譯成蛋白質序列(Ley 等人,Nature Rev. Microbiol, . 6:776 - 788, 2008)。基因的鑑定。
為了使鑑定低豐度基因和降低鑑定錯誤率之間建立平衡,我們探索了閾值設置對在個體微生物組中鑑定基因所需的讀取覆蓋率的影響。當鑑定所需的讀取數目從2增加至6時,基因的數目降低約兩倍,此後緩慢變化。無論如何,為了將罕見基因納入分析中,我們選擇了 2個讀取的閾值。基因分類指定(Gene taxonomic assignment)。使用針對整合NR資料庫的BLASTP比對進行預測的基因的分類指定。對具有大於1X10_5的e-值的BLASTP比對命中進行過濾,針對各基因由e-值< IOX最佳(top)命中的e-值所定義的顯著匹配被保留,用來區分分類的組。然後我們通過在MEGAN中實施的基於最低共同祖先(LCA)的算法確定了各個基因分類學上的水平(Huson等人,GenomeRes., 17:377 - 386, 2007)。以指定的分類單元(taxon)的分類學水平體現基因的保守水平的方式,基於LCA的算法將基因指定至分類群(taxa)。例如,如果一個基因在許多物種中是保守的,則它被指定到LCA,而不是一個物種。基因功能分類。 我們使用BLASTP 在 eggNOG 資料庫(Jensen 等人,NucleicAcidsRes. , 36:D250D254, 2008)和 KEGG 資料庫(Kanehisa 等人,NucleicAcidsRes. ,32:D277D280, 2004)中用e值0. 5,計算chao2(經典)和ICE豐富度估計量,且使用較大的兩個(ICE)的估計。對這種樣本大小的估計為
3,621, 646 個基因(ICE),而 Sijbs (Mao Tau)為 3,090, 575 個基因或 85. 3%。ICE 估計量曲線沒有完全飽和,表明需要添加額外的樣本來實現最終的決定性估計。常見的細菌核心。為了消除非常相似的株的影響,並評估群體的個體當中已知微生物物種的存在,我們使用650個測序的細菌和古細菌的基因組作為參照集合。集合由932個公眾可獲得的基因組組成,使用90%同一性截止值和在至少80%長度的相似性,通過相似性對該基因組進行分組。從各組中僅使用最大的基因組。將來自124個個體的Illumina讀取繪製到集合上用於物種譜(profiling)分析,並且當序列可獲得時,通過手工檢查和通過使用基於16S的集群監管(curated)源自相同物種(由大小上>20%區分)的基因組。個體之間微生物基因組的相對豐度。我們通過獨特的繪圖Illumina讀取計算了基因組覆蓋率並將其標準化至IGb的序列,以修正不同個體中不同的測序水平。針對每個個體在所有非冗餘細菌基因組集合的物種上匯總覆蓋率,並計算各物種相對於總和的比例。物種共存網絡。針對在至少一個個體中具有Illumina讀取彡1%的基因組覆蓋率的155個物種,我們計算了 124個個體的整個群體當中測序深度(豐度)之間的配對物種間Pearson相關性。來自獲得的11,175物種間相關性,使用Cytoscape對小於-O. 4或在O. 4以上的相關性(n=342)在圖中進行可視化(Shannon等人,Genome Res. 13:24982504, 2003)。作為在圖中的節點大小顯示每個物種的平均基因組覆蓋率。結果所用群體和方法的概述。對於克羅恩氏病,群體的大小是8位患者和13位健康對照;對於潰瘍性結腸炎,是12位患者和12位健康對照。對於各疾病,通過ranksum搜索330萬個基因的整個基因目錄來搜尋兩組之間顯著差異的那些。通過基因大小(較大的基因是較大的目標並且更頻繁地遇到)和不同個體測序程度上的差異對基因頻率進行標準化。顯著差異的基因的數目受閾值的影響,並分組。簡言之,在p〈3X10_4處發現3802個「⑶(克羅恩氏病)-相關基因」以及在P〈10 3處發現4841個「UC (潰瘍性結腸炎)-相關基因」。BMI基因的整體分析。顯著差異的基因,即CD相關基因(圖1A)或UC相關基因(圖1B),按個體進行繪製。在健康個體中CD相關基因的中位數是3038,在克羅恩氏病患者中只有643。在2組當中中位基因數目是非常顯著差異的(p〈2X10_13,單尾t檢驗)。同樣地,在健康個體中UC相關基因的中位數是3402,在患有潰瘍性結腸炎的患者中是1212。差異是 非常顯著差異的(P〈6. 7 X ΚΓ5,單尾t檢驗)。比較所有基因和CD相關基因或UC相關基因的分布。微生物組的所有基因和CD相關基因或UC相關基因的分布進行了比較。兩組之間所有基因的數目和頻率比CD相關基因或UC相關基因有更少的差異。CD相關基因分布並不簡單地反映所有基因分布;相似地,UC相關基因分布並不簡單地反映基因分布中的一般傾向。克羅恩氏病患者和潰瘍性疾病患者中基因的丟失因此是顯著的。CD相關和UC相關物種。使用指定到330萬目錄中的基因的分類學指定將CD相關基因和UC相關基因分配到物種(Qin等人,Nature,2010,出版中,doi :10. 1038/nature08821)。發現68%的CD相關基因,但只有32. 8%的所有基因,來自厚壁菌門(firmicut.es)。另一方面,擬桿菌門(bacteroidet.es)的頻率對於CD相關基因是22%和對於微生物組的所有基因是18. 4%。同樣地,70%的UC相關基因來自厚壁菌門,而只有15%來自擬桿菌門。因此,炎症性腸病,比如克羅恩氏病和潰瘍性疾病,與厚壁菌門的變化相關。物種首先通過指定到CD相關基因和UC相關基因當中基因數目進行鑑定。然後來自相同物種的其它基因從目錄中抽出,並且對各物種在不同個體中評估50個代表性基因(這非常有利地與使用單一 16S基因進行了比較,目前進行16S基因來鑑定物種)的存在。在個體中如果發現至少一半的標誌物基因,則認為存在物種。使用Chi2檢驗通過與所有群體分布(對於克羅恩氏病,13相對於8 ;對於潰瘍性結腸炎,12相對於12)進行比較來評估健康者和患者之間分布的顯著性。對於克羅恩氏病,普拉梭菌(Faecalibacterium prausnitzii)和Roseburia inulinivorans (無對應譯文)與健康人群有關(分別p=2. 4X 10 2和ρ=9· 3Χ 1(Γ3),即它們傾向於從患者中缺失。另一方面,Clostridium boltae(無對應譯文)、多枝梭菌(Clostridium ramosum)和活潑瘤胃球菌(Ruminococcus gnavus)與患者群體有關(ρ=4Χ 10_3,ρ=1· 8X 10_3和ρ=6. 4Χ 10_3)。在物種鑑定的基礎上,表明這5個物種的線性組合完全預測克羅 恩氏病表型(圖2Α)。健康個體和患者分別顯示為藍色和紅色的點。物種存在(縱坐標)對應著「好物種」基因(與克羅恩氏病負相關(anti-associated))減去「壞物種」的基因(與克羅恩氏病相關)的總和。個體按物種存在(橫坐標)進行排序。如果個體有過多的「好物種」基因,他或她將位於排名的前面並且傾向於是健康的,而如果有過多的「壞物種」基因,他或她將位於排名的右面並且傾向於是病態的。對於潰瘍性結腸炎,Akkermansiamuciniphi Ia (無對應譯文)與健康表型有關,而多毛擬桿菌(Bacteroides capi I Iosus)和柔嫩梭菌(Clostridium lept.um)與患者群體有關。如圖2B中所示,3種物種的線性組合預測潰瘍性結腸炎表型。表I :CD相關基因
權利要求
1.一種用於診斷炎症性腸病的方法,所述方法包括確定是否來自表I和/或表2的至少一個基因從個體腸道微生物組中缺失的步驟。
2.根據權利要求I所述的方法,其中所述炎症性腸病是克羅恩氏病或潰瘍性結腸炎。
3.根據權利要求I所述的方法,其中表I和/或表2的至少50%、75%或90%的基因從所述個體腸道微生物組中缺失。
4.根據權利要求I所述的方法,所述方法包括從所述個體糞便獲得微生物DNA的步驟。
5.一種用於監測炎症性腸病治療療效的方法,所述方法包括步驟首先確定是否至少一個基因從所述患者的微生物組中缺失,施用治療,確定是否所述至少一個基因存在於患者的微生物組中。
6.根據權利要求5所述的方法,其中所述炎症性腸病是克羅恩氏病或潰瘍性結腸炎。
7.根據權利要求5所述的方法,其中在治療之前表I和/或表2的至少50%、75%或90%的基因從所述個體腸道微生物組中缺失。
8.根據權利要求5所述的方法,所述方法包括至少一個從所述個體糞便獲得微生物DNA的步驟。
9.一種微陣列,其包括與表I和/或表2的至少10%、25%、50%、75%、90%、95%、97· 5%或99%的基因雜交的探針。
10.—種用於診斷炎症性腸病的試劑盒,其包括權利要求9所述的微陣列或特異於表I和/或表2的至少10%、25%、50%、75%、90%、95%、97. 5%或99%的基因的擴增引物。
全文摘要
此處描述了一種用於診斷炎症性腸病的新方法,該方法基於確定來自人腸道微生物組的至少一個基因的缺失。
文檔編號C12Q1/68GK102939391SQ201180019469
公開日2013年2月20日 申請日期2011年3月1日 優先權日2010年3月1日
發明者S·埃利克 申請人:國家農藝研究院

同类文章

一種新型多功能組合攝影箱的製作方法

一種新型多功能組合攝影箱的製作方法【專利摘要】本實用新型公開了一種新型多功能組合攝影箱,包括敞開式箱體和前攝影蓋,在箱體頂部設有移動式光源盒,在箱體底部設有LED脫影板,LED脫影板放置在底板上;移動式光源盒包括上蓋,上蓋內設有光源,上蓋部設有磨沙透光片,磨沙透光片將光源封閉在上蓋內;所述LED脫影

壓縮模式圖樣重疊檢測方法與裝置與流程

本發明涉及通信領域,特別涉及一種壓縮模式圖樣重疊檢測方法與裝置。背景技術:在寬帶碼分多址(WCDMA,WidebandCodeDivisionMultipleAccess)系統頻分復用(FDD,FrequencyDivisionDuplex)模式下,為了進行異頻硬切換、FDD到時分復用(TDD,Ti

個性化檯曆的製作方法

專利名稱::個性化檯曆的製作方法技術領域::本實用新型涉及一種檯曆,尤其涉及一種既顯示月曆、又能插入照片的個性化檯曆,屬於生活文化藝術用品領域。背景技術::公知的立式檯曆每頁皆由月曆和畫面兩部分構成,這兩部分都是事先印刷好,固定而不能更換的。畫面或為風景,或為模特、明星。功能單一局限性較大。特別是畫

一種實現縮放的視頻解碼方法

專利名稱:一種實現縮放的視頻解碼方法技術領域:本發明涉及視頻信號處理領域,特別是一種實現縮放的視頻解碼方法。背景技術: Mpeg標準是由運動圖像專家組(Moving Picture Expert Group,MPEG)開發的用於視頻和音頻壓縮的一系列演進的標準。按照Mpeg標準,視頻圖像壓縮編碼後包

基於加熱模壓的纖維增強PBT複合材料成型工藝的製作方法

本發明涉及一種基於加熱模壓的纖維增強pbt複合材料成型工藝。背景技術:熱塑性複合材料與傳統熱固性複合材料相比其具有較好的韌性和抗衝擊性能,此外其還具有可回收利用等優點。熱塑性塑料在液態時流動能力差,使得其與纖維結合浸潤困難。環狀對苯二甲酸丁二醇酯(cbt)是一種環狀預聚物,該材料力學性能差不適合做纖

一種pe滾塑儲槽的製作方法

專利名稱:一種pe滾塑儲槽的製作方法技術領域:一種PE滾塑儲槽一、 技術領域 本實用新型涉及一種PE滾塑儲槽,主要用於化工、染料、醫藥、農藥、冶金、稀土、機械、電子、電力、環保、紡織、釀造、釀造、食品、給水、排水等行業儲存液體使用。二、 背景技術 目前,化工液體耐腐蝕貯運設備,普遍使用傳統的玻璃鋼容

釘的製作方法

專利名稱:釘的製作方法技術領域:本實用新型涉及一種釘,尤其涉及一種可提供方便拔除的鐵(鋼)釘。背景技術:考慮到廢木材回收後再加工利用作業的方便性與安全性,根據環保規定,廢木材的回收是必須將釘於廢木材上的鐵(鋼)釘拔除。如圖1、圖2所示,目前用以釘入木材的鐵(鋼)釘10主要是在一釘體11的一端形成一尖

直流氧噴裝置的製作方法

專利名稱:直流氧噴裝置的製作方法技術領域:本實用新型涉及ー種醫療器械,具體地說是ー種直流氧噴裝置。背景技術:臨床上的放療過程極易造成患者的局部皮膚損傷和炎症,被稱為「放射性皮炎」。目前對於放射性皮炎的主要治療措施是塗抹藥膏,而放射性皮炎患者多伴有局部疼痛,對於止痛,多是通過ロ服或靜脈注射進行止痛治療

新型熱網閥門操作手輪的製作方法

專利名稱:新型熱網閥門操作手輪的製作方法技術領域:新型熱網閥門操作手輪技術領域:本實用新型涉及一種新型熱網閥門操作手輪,屬於機械領域。背景技術::閥門作為流體控制裝置應用廣泛,手輪傳動的閥門使用比例佔90%以上。國家標準中提及手輪所起作用為傳動功能,不作為閥門的運輸、起吊裝置,不承受軸向力。現有閥門

用來自動讀取管狀容器所載識別碼的裝置的製作方法

專利名稱:用來自動讀取管狀容器所載識別碼的裝置的製作方法背景技術:1-本發明所屬領域本發明涉及一種用來自動讀取管狀容器所載識別碼的裝置,其中的管狀容器被放在循環於配送鏈上的文檔匣或託架裝置中。本發明特別適用於,然而並非僅僅專用於,對引入自動分析系統的血液樣本試管之類的自動識別。本發明還涉及專為實現讀