診斷和治療非胰島素依賴性糖尿病的方法
2023-07-03 06:05:56
專利名稱:診斷和治療非胰島素依賴性糖尿病的方法
診斷和治療非胰島素依賴性糖尿病的方法政府支持聲明本發明由美國政府支持在國家衛生研究院的資助下完成。政府對本發明具有一定權利。
背景技術:
糖尿病是一種代謝疾病,其出現在胰腺不能產生足夠的激素胰島素來調節血糖(「I型糖尿病」)時,或者,出現在身體不能有效利用所產生的胰島素(「2型糖尿病」)時。根據世界衛生組織最近的估計,全球超過2億人患有糖尿病,其中90%患2型糖尿病。典型地長期併發症包括神經病、視網膜病、腎病的發生、大的或小的血管的普 遍退行性變化以及對感染的易感性增加。由於患有2型糖尿病的個體相對於完全缺乏胰島素的產生的I型糖尿病個體還具有可用的殘餘量的胰島素,2型糖尿病僅逐漸顯露出來並且通常在發病幾年之後被診斷出來,併發症已經出現。胰島素抵抗發生在25%的非糖尿病、非肥胖的、明顯健康的個體身上,並使得他們容易患上糖尿病和冠狀動脈疾病。II型糖尿病的高血糖症是在肌肉和其他關鍵胰島素靶組織中對胰島素抵抗以及β細胞胰島素分泌減少的結果。對有糖尿病家族史的個體的縱向研究表明,胰島素抵抗先於分泌異常。在發展成糖尿病之前,這些個體通過分泌額外的胰島素來補償其胰島素抵抗。代償性高胰島素血症衰退時發生糖尿病。胰腺β細胞分泌不足對糖尿病的嚴重程度起重要作用。Reaven(1988)Diabetes 37 :1595-607第一個調查了來自非肥胖的普通人群的胰島素抵抗、非糖尿病的健康個體。引人注目的是,他們觀察到,這些人中25%有胰島素抵抗,與在II型糖尿病患者中所見的具有類似的量級。這些個體通過高於正常3至4倍的胰島素水平來進行補償。這些升高的胰島素水平足以保持血糖濃度正常。其他人也證實了,大部分非糖尿病人群是胰島素抵抗的。這些胰島素抵抗、非糖尿病個體患II型糖尿病的風險大大高於胰島素敏感的對象。但是,即使沒有發展成高血糖症和糖尿病,這些胰島素抵抗的個體的健康也付出了極大的代價。胰島素抵抗帶來下列風險的增加升高的血漿甘油三酯(TG)、降低的高密度脂蛋白(HDL)和高血壓,一組被不同研究者稱為X症候群、胰島素抵抗症候群或代謝症候群的異常情況。人們認為高胰島素血症、胰島素抵抗、或兩者都是引起這些異常情況的直接原因。來自種族、家族和縱向研究的數據暗示抵抗的主要構成因素是遺傳的。2型糖尿病是一種多基因疾病;它在全球成人已經很高的發病率以及在成人和兒童中不斷上升的發病率表明急需在儘可能的生命早期評價這種疾病的遺傳易感性和確定幹預治療,以便防止2型糖尿病的發作和治療這種疾病。
發明內容
本發明提供用於治療和診斷與高血糖症相關的疾病的方法和組合物,所述疾病包括糖尿病、胰島素抵抗等疾病。基因多態性顯示與疾病易感性相關,且它們的檢測被用於診斷這些病症的誘因。受關注多態性包括單核苷酸多態性、剪接變體、缺失、插入等。如本文所示,CD44基因座和CD44配體(SPP1,骨橋蛋白)以及HDC基因座中的多態性對個體發展成2型糖尿病的易感性是預測性的。CD44的血清水平也是胰島素抵抗的診斷依據。治療方法靶向這些基因的產物,尤其靶向CD44和/或骨橋蛋白。在本發明的一些實施方案中,通過向個體施用CD44活性的抑制劑,提供用於預防或治療2型糖尿病的方法。⑶44抑制劑任選地對在例如脂肪組織巨噬細胞等的、與2型糖尿病發展相關的細胞中表達的CD44剪接變體是選擇性的。受關注抑制劑可以靶向例如脂肪組織巨噬細胞的受關注細胞。受關注抑制劑包括但不限於,CD44受體和骨橋蛋白之間相互作用的抑制劑、以及CD44和透明質酸之間相互作用的抑制劑。這些抑制劑包括但不限於,抗體、核酸抑制劑例如反義寡核苷酸、RNAi分子等;抑制骨橋蛋白肽、小分子抑制劑等。在一些實施方案中,在開始治療之前,例如使用本發明的預測方法評價個體產生疾病的易感性。在本發明的另一些實施方案中,通過確定在編碼⑶44、SPPl和HDC中一個或更多 個的遺傳序列中與疾病相關的多態性的存在,提供用於確定個體對2型糖尿病(T2D)的易感性的方法。在某些實施方案中,分析多個基因座。單獨地或與其他T2D變體組合地描述和應用CD44、SPPl和HDC中的多態性,預測個體對2型糖尿病的易感性。在一些實施方案中,多態性是SNP。在另一些實施方案中,多態性是剪接變體。在本發明的另一些實施方案中,提供用於鑑定用在預防或治療T2D中的化合物,例如小分子抑制劑和其他藥物候選物的方法。在這些方法中,確定抑制CD44活性的候選劑的作用。隨後任選地進一步測試T2D模型中的化合物,所述模型可能是細胞培養模型、動物模型等。包括在這些模型中的是表達⑶44並在培養模型中已經顯示具有抗成脂作用的分離的脂肪組織巨噬細胞。在另一些實施方案中,提供用於評價人類個體中對2型糖尿病易感性的試劑盒,所述試劑盒包括用於選擇性確定一種或更多種如本文限定的疾病相關的多態性的存在與否的試劑。上述綜述不旨在包括本發明的所有特徵和方面,也不暗示本發明必須包括這個綜述中討論的所有特徵和方面。本說明書中提及的所有出版物和專利申請在相同程度上通過引用併入本文,特別地和單獨地指示每個單獨出版物或專利申請通過弓I用併入。
附圖舉例說明了本發明的實施方案,並與說明書一起用於闡明本發明。這些附圖通過舉例方式而不是限制方式提供;應強調附圖的各種特徵是不按比例的。圖I :T2D微陣列實驗資料庫的驗證。(A)通過在一組69個微陣列研究中表達顯著差異的次數來表示已知的T2D-相關基因(菱形( ),事先通過GWAS檢測的20個基因;正方形(■),從NIH基因相關聯資料庫GAD提取的170個基因),相對於基因組中所有其他基因(三角形(A))。大多數實驗中牽涉的已知的T2D-相關基因是瘦素受體(LEPR),在69個微陣列實驗的35個實驗中是陽性的(表3)。任意基因的陽性微陣列實驗的最大值是46。(B和C)R0C曲線,通過利用所有69個微陣列數據在曲線圖中繪製20個GWAS(B)和170個GAD(C)基因的重現中的敏感性和特異性畫出所述ROC曲線。在閾值彡14個陽性微陣列實驗的20個GWAS基因的重新發現中,最佳的敏感性和特異性分別是55%和81 % (B),在閾值> 11個陽性微陣列實驗的170個GAD基因的重新發現中,最佳的敏感性和特異性分別是 83%和 73% (C)。圖2 :連鎖不平衡圖中的顯著SNP。在⑶44和OPN的LD圖中用空心圓/實心圓表示我們的靶向的相關聯研究(階段I和II)中基因分型的SNP (黑色實心圓;P < O. 05,紅色實心圓;P < Bonferroni閾值)。使用GOLD軟體基於階段I中192個隨機的日本人(JP)對照對象的SNP數據來繪製LD結構。用距離標示器(kb)按比例繪製軸線。縱軸上顯示外顯子和內含子。(A)CD44 ;三個標籤SNP(rs353647、rsll2762和rs7930724),選自在初始研究中⑶44的23個經篩選的標籤SNP (P < O. 05 ;階段I)(表5),並且在第二群中進一步基因分型(階段II)。當對研究進行Meta分析時,SNP rs353647和rsll2762與T2D標稱地相關聯,rs7930724 與 T2D 顯著相關聯(rs7930724 ;0R = I. 23,P = 2. OXlO-3)(表 I)。通過對包括這3個標籤SNP的中等LD區塊間(外顯子2-13)直接測序來鑑定編碼的SNPrsl071695 (外顯子3),並且利用相同的群(rsl071695 ;0R = I. 43,P = 3. 9 X 10』來證實其與T2D的顯著相關。(見表6的單倍型分析)(B)OPN ;3個標籤SNP(rs4754、rs9138(3』UTR)和rsl0012150(3』 UTR)),選自OPN的10個經篩選的標籤SNP(P < O. 05 ;階段I)(附加表7)。進一步測試3個標籤SNP (階段II)。Meta分析時,SNP rs9138與T2D標稱地相關聯,rsl0012150 與 T2D 顯著相關聯(rsl0012150 ;0R = I. 15,P=L 5X 1(Γ3)。在這 3 個標籤SNP的LD區塊間中鑑定出另一個3』UTR SNP (rs1126772),並且也證實了其與T2D顯著相關聯(rsll26772 ;0R = I. 14,P = 4. 4X 1(Γ3)(表 I)。圖3 :人類對象中的⑶44功能實驗。(A)在年齡、性別、BMI-匹配的對象之間比較⑶44mRNA表達,所述對象具有兩個rsl071695的風險等位基因(TT,η = 13)和一個(TC,η=12)或沒有rsl071695的風險等位基因(CC,η = I)。為了美容的目的實施皮下脂肪移除。所有患者都是非糖尿病對象(年齡(歲)59.5±15.3,性別(男/女)2/24,BMI (kg/m2)22. 9±2. 3,HbAlc(%)5. 1±0. 57)。(B和C)通過使用利用非糖尿病對象(η = 55 :年齡(歲);60.3±15,性別(男/女);36/19,BMI (kg/m2) ;23· 2±4· 3)的最小二乘法估計的線性回歸模型來確定標準可溶性CD44(sCD44std)的血清水平和胰島素抵抗指標之間的相關性,HbAlc (B)和 HOMA-IR(C)。圖4 :小鼠模型中的CD44功能實驗。(A和B)將從糖尿病傾向WT(A)和CD44_K0(B)小鼠分離的內臟(附睪的)脂肪組織用抗Mac-2 (巨噬細胞標誌物)抗體然後用DAB(褐色)染色,並用蘇木精(藍色)復染色。箭頭顯示圍繞脂肪細胞的巨噬細胞集群。塊(Bar)=20ymo (C-I)⑶44-Κ0小鼠的糖代謝的改善。在進行實驗之前測量體重(C)。14小時的過夜禁食之後測量⑶44-Κ0小鼠(η = 7)和年齡匹配的WT (η = 16 ;糖尿病傾向)的血糖(D)、血清胰島素(E)和血清脂聯素(F)。*Ρ < O. 05,對WT。(G和H) 14小時的過夜禁食之後對CD44-K0小鼠(η = 7)和年齡匹配的WT(η = 15)實施葡萄糖耐受性測定(在腹膜內,用葡萄糖(2g/kg體重))。在指示的時間點測量血糖(G)和血清胰島素(H)。(1)4小時的禁食之後對⑶44-K0小鼠(η = 7)和年齡匹配的WT (η = 16)實施胰島素耐受性測定(在腹膜內,用胰島素(1.0單位/1^體重))。所有對小鼠的實驗都對14至20周齡的小鼠實施。*Ρ < O. 05,對每個時間點的WT。§Ρ < O. 05,對們^此值)。所有數據以平均值土 SD來表示。圖5 :日本人人群中⑶44和OPN風險等位基因對T2D的累積作用。用彩條指出具有增加數目的CD44和OPN風險等位基因的參與者比例(紅色對照;藍色T2D病例)。用黃色三角表示攜帶增加數目的風險等位基因的參與者與沒有或只有一個風險等位基因的那些參與者相比較的T2D優勢比。攜帶4個風險等位基因的參與者的OR為3. 21 [I. 39-7. 39](總體P = 7· 5X10-3)。每個附加的風險等位基因增加I. 21 [I. 07-1. 37] (P = 2. 1X10-3)倍的疾病機率。圖6 :全長CD44 mRNA轉錄本的最佳二級結構。具有或不具有相關同義SNP(rsl071695 ;His[CAC]/[CAT] nt 689)的 CD44mRNA 全長序列(NM_001001391 ;5』 UTR-編碼序列-3』 UTR)被用於利用M摺疊構建最佳二級摺疊結構。在[CA£]和[CAI]⑶44 mRNA之間的蛋白質編碼區(nt 435-1517)觀察到摺疊模式的明顯改變。
圖7 :所有69個組合的微陣列數據和每組小鼠、人和大鼠的微陣列實驗的ROC曲線。(A和B)通過利用下列數據繪製20個GWAS(A)和170個GAD(B)黃金標準基因的重新發現中的敏感性和特異性畫出ROC曲線,其使用所有69個(人、小鼠和大鼠)微陣列數據(黑線)、僅48個小鼠實驗(紅線)、僅13個人實驗(藍線)和僅8個大鼠實驗(綠線)。在所有69個微陣列數據中獲得最好的敏感性和特異性(黑色)。小鼠微陣列的組(紅色)比人(藍色)和大鼠微陣列(綠色)顯示出更好的性能。這些調查結果論證了更多的微陣列實驗在再發現(recall)黃金標準基因中得到更好的性能,不依賴於物種。圖8 :CD44和OPN的連鎖不平衡圖中的顯著SNP。在CD44和OPN的LD圖(JP和CEU)中用空心圓/實心圓表示在我們的靶向的相關聯研究和WTCCC GWAS中基因分型的SNP。利用GOLD軟體通過繪製在我們的階段I中日本人(JP)對照或HapMap歐裔(CEU)人群的配對的SNP r2值,畫出基因區的LD結構的圖示。用距離標記(kb)作為刻度繪製軸線。縱軸上示出⑶44(NM_000610)和OPN(ΝΜ_001040058)的外顯子(水平條)和內含子(垂直線)。通過黑色實心圓(P < O. 05)或紅色實心圓(P < Bonferroni閾值;0. 05除以所分析的 SNP 的總數)來指示顯著的 SNP。a,CD44 ;標籤 SNP、rs353647、rsll2762 和 rs7930724 在我們的研究中是顯著的(rs353647和112762黑色實心圓);P < O. 05,rs7930724(紅色實心圓);P = 2.0X10-3 ;階段I+II)。通過搜索包括顯著的標籤SNP的中等的LD區塊(外顯子2-13)來鑑定rsl071695(編碼SNP;紅色實心圓),並且用相同的群(OR= I. 43 [95%C. I. I. 17-1. 74],P = 3. 9X 10_4 ;階段I+II)證實了其與T2D的強相關性。包括外顯子3的區域在任意最近的T2D的GWAS中還沒有被基因分型。b,OPN ;標籤SNP在3』 UTR、rs4754、rs9138和rsl0012150在我們的研究中是顯著的(rs4754和rs9138 (黑色實心圓);P<0.05,rsl0012150(紅色實心圓);P = I. 5X 10_3 ;階段I+II)。通過搜索包括顯著的標籤SNP的LD區塊來鑑定rsll26772(3』 UTR SNP ;紅色實心圓),並證實了其與T2D的顯著相關性(P = 4. 4X 10_3 ;階段I+II)。3』 UTR在最近的T2D的GWAS中還沒有被基因分型。
具體實施方案提供了診斷和治療對2型糖尿病的增加的易感性的方法。通過評估在⑶44、SPP1和HDC的一個或多個中多態性存在情況的個體基因型,可以預測T2D發生的易感性。在一些實施方案中,所述分析與確定其他風險等位基因的存在相結合,所述其他風險等位基因包括但不限於TCF7L2、KCNQ1等。還可以通過確定可溶性⑶44的血清水平來進行診斷。在一些實施方案中,通過向個體施用CD44活性的抑制劑,提供降低2型糖尿病風險或治療2型糖尿病的方法。在本發明的特定實施方案中,通過向個體施用CD44活性的抑制劑,提供預防或治療2型糖尿病的方法。通過局部化的藥物遞送或通過受關注的CD44剪接變體的選擇性,憑藉靶部分任選地靶向受關注的抑制劑。受關注的抑制劑包括但不限於,CD44受體和一個或多個其配體之間相互作用的抑制劑,所述抑制劑包括骨橋蛋白、透明質酸、硫酸皮膚素蛋白聚糖雙鏈蛋白聚糖、絲甘蛋白聚糖等。在一些實施方案中,抑制劑是CD44配體的片段或衍生物,例如骨橋蛋白肽、可溶性透明質酸(hyaluranan)等。在另一些實施方案中,在開始治療之前通過本發明的方法評價個體疾病發展的易感性。有關賦予2型糖尿病疾病風險的遺傳變體的知識為進行遺傳測試來區分具有增加的患病風險的個體和具有平均的患病風險的個體提供了機會。遺傳測試的核心價值是能夠在早期診斷疾病的可能性,以及向臨床醫生提供關於疾病的預知/攻擊性的信息,以便 能夠施加最適合的治療。例如,2型糖尿病的遺傳試驗的應用可以提供早期檢測疾病的機會,這可能帶來治療性措施的早期應用,並因此可以將2型糖尿病所致的症狀的有害作用和嚴重健康後果降至最低。定義CD44的「活性」表示該蛋白質所實施的任意信號或結合功能。CD44蛋白質是細胞-細胞相互作用、細胞粘著和細胞遷移涉及的細胞表面的糖蛋白。它是透明質酸的受體,並且還可以與其他配體相互作用,所述配體例如是骨橋蛋白、硫酸皮膚素蛋白聚糖雙鏈蛋白聚糖、絲甘蛋白聚糖、膠原和基質金屬蛋白酶(MMP)。⑶44參與很多細胞功能,包括淋巴細胞活化、再循環和歸巢、造血作用和腫瘤轉移。該基因的轉錄本經過複雜的選擇性剪接,所述剪接產生很多功能上獨特的同種型。選擇性剪接是該蛋白質的結構和功能多樣性的基礎。⑶44基因轉錄至少部分由β連環蛋白和Wnt信號激活。⑶44基因包含分布在50kb基因組DNA中的19個外顯子。帶注釋基因組序列可從GenBank以登錄號NG_008937獲取。⑶44基因在胞外結構域內具有10個選擇性剪接的外顯子。除了包含或排除整個外顯子之外,通過在兩個外顯子內利用內部剪接供體和受體位點產生額外的多樣性。已經顯示,由2個外顯子的選擇性剪接造成胞質結構域中的變異。因此,⑶44的基因組結構是複雜的,且選擇性剪接是其機構和功能多樣性的基礎。「⑶44」表示通過GenBank登錄號NG_008937所示基因序列編碼的人蛋白質、包括剪接變體及其同源物的其所有天然變體,以及在本文中適用時,所有抗原片段。分泌的磷蛋白I (SPPl),也被稱為骨涎蛋白I (BSP-I),早期T-淋巴細胞活化(ETA-I)和最常見的骨橋蛋白(OPN)是分子量約為32600的單鏈多肽。其是糖基化的(在大鼠OPN中5至6個O-連接和I個N-連接的寡糖)、高度但可變地磷酸化(在大鼠中12個磷酸化-Ser和I個磷酸化-Thr)和硫酸化的。可以以登錄號NM_001040060、NM_001040058和NM_000582從Genbank獲取編碼人骨橋蛋白轉錄本的mRNA序列。所述基因具有全長5kb的7個外顯子,且在人中位於4號染色體長臂上。組氨酸脫羧酶(HDC)是同型二聚酶,它是磷酸吡哆醛(PLP)依賴型脫羧酶,並且對其組氨酸底物是高度特異性的。推定的662個胺基酸的蛋白的分子質量為74148Da。在大鼠、小鼠和人的HDC和多巴脫羧酶(DDC;107930)中發現高度的同源性。在人中,所述基因位於15q21_q22 ;且!111 ^的序列從Genbank以登錄號NM_002112獲取。所述基因包含分布在約24kb上的12個外顯子。基因組DNA印跡分析表明,HDC是由單拷貝基因編碼的。結構分析顯示,所觀察到的HDC mRNA的異質性是由於選擇性剪接造成的。本文中使用的多態性指的是基因序列中的變體。此類變體可以包括單核苷酸多態性、剪接變體、插入、缺失和轉座/易位。多態性可以是通常在個體或不同種族和不同地理位置之間發現的儘管具有不同序列但產生功能上相當的基因產物的那些變體(DNA序列差異)。多態性還包括可以被分類為下述的變體,即被分類為可產生可能具有改變的功能之基因產物的等位基因和/或突變(即可以產生功能上不相當的基因產物的序列中的變體)。多態性還包括可以被分類為不產生基因產物、產生無活性基因產物或產生增加的基因產物的等位基因和/或突變體的變體。另外,根據需要,該術語還與等位基因互換地使用。多態性位點在長度上是單核苷酸的情況下,所述位點指的是單核苷酸多態性 (「SNP」)。如本文使用的,術語「核苷酸探針」指的是能夠與核酸序列特異性雜交的分子,並且包括本領域公知的核酸的類似物如DNA、RNA、肽核酸等,並且可以是雙鏈或單鏈的。核酸可以與標記序列融合,所述標記序列例如是編碼多肽以輔助多肽分離或純化的序列。該序列包括但不限於,編碼穀胱甘肽-5-轉移酶(GST)融合蛋白的那些序列和編碼來自流感的血凝素A(HA)多肽標記的那些序列。本發明的核酸分子的其他改變可以包括但不限於,例如進行標記、甲基化、核苷酸間修飾如不帶電連接(例如甲基膦酸酯、磷酸三酯、磷酸醯胺化物、氨基甲酸酯)、帶電連接(例如硫代磷酸酯、二硫代磷酸酯)、懸垂部分(例如多肽)、嵌入劑(例如吖啶、補骨脂素)、螯合劑、烷化劑(alkylator)和經修飾連接(例如α異頭核酸)。還包括在內的是能夠經由氫鍵和其他化學相互作用結合指定的序列的合成分子。此類分子包括例如其中肽連接取代了分子骨架中磷酸酯連接的那些。如本文使用的,「特異性雜交」指的是第一核酸與第二核酸雜交的能力,所述雜交以第一核酸不與除了第二核酸之外的其他核酸雜交的方式進行。雜交的「嚴格度」是涉及例如溫度和緩衝劑濃度的孵育和衝洗條件的專門名詞,所述條件允許特定核酸與第二核酸雜交;第一核酸可以完美地(即100% )與第二核酸互補,或者第一核酸和第二核酸可以具有低於完美(例如70^^75^^85^^90^^95% )的一定程度的互補。兩種核酸或胺基酸序列的同源性或同一性的百分比可以通過以最優比較目的(例如可以在用於優化對準的第一序列的序列中引入缺口)對序列進行比對來確定。然後比較相應位置的核苷酸或胺基酸,兩個序列之間的同一性百分比是所述序列具有一致位置的數目的函數(即同一性% =一致位置的數目/位置數目X 100)。當一個序列中的位置在其他序列的相應位置上被相同的核苷酸或胺基酸殘基佔據時,那麼所述分子在那個位置是同源的。如本文使用的核酸或胺基酸「同源性」相當於核酸或胺基酸「同一性」。該數學算法的優選的非限制性實例在Karlin 等人,roc. Natl. Acad. Sci. USA 90:5873-5877(1993)中有所描述。該算法被併入Altschul 等人,nucleic Acids Res. 25 :389-3402(1997)中描述的 NBLAST 和 XBLAST 程序(2. O版)中。利用BLAST和Gapped BLAST程序時,可以使用各個程序(例如NBLAST)的默認參數。在一個方面,用於序列比對的參數可以設定為得分=100、字長=12,或者可以變化(例如W = 5或W = 20)。
作為探針受關注的核酸分子至少是約15個,優選至少約18、20、23或25個核苷酸,以及可以為30、40、50、100、200或更多個核苷酸長,且包括本文描述的SNP標誌物的多態性殘基。探針或引物包括核苷酸序列區域,所述核苷酸序列與核酸分子的至少約15個,例如約20至25個,在特定方面與約40、50或75個連續的核苷酸雜交,所述核酸分子包括⑶44、SPP1或HDC或其多態性變體的鄰近核苷酸序列。在另一些方面,探針或引物包括100個更少的核苷酸,在某些方面包括6至50個核苷酸,例如12至30個核苷酸。在另一些方面,探針或引物與鄰近的核苷酸序列具有至少70%同一性,或者與鄰近的核苷酸序列的補體具有至少70%同一性,例如至少80%同一性,在某些方面至少90%同一性,在另一些方面至少95%同一性,或者甚至能夠與鄰近的核苷酸序列或鄰近的核苷酸序列的互補序列選擇性地雜交。所述探針或引物通常還包含標籤,例如放射性同位素、螢光化合物、酶或輔酶因子。
如本文所述的「標誌物」指的是在多態性位點上的特定等位基因的基因組序列特徵。本文報導的SNP命名指的是國家生物信息中心(NCBI)分配給每個獨特的SNP的官方參考SNP (rs) ID身份標記。如本文所述的「單倍型」指以沿著區段布置的遺傳標誌物(「等位基因」)的特異性組合為特徵的基因組DNA鏈的區段。在一個特定實施方案中,單倍型可以包括一個或更多個等位基因、兩個或更多個等位基因、三個或更多個等位基因、四個或更多個等位基因、或者五個或更多個等位基因。如本文所述的術語「易感性」主要表示增加的易感性。因此本發明的特定標誌物和/或單倍型可以具有2型糖尿病的易感性增加的特徵,如相對風險較高所表徵的。使得2型糖尿病的易感性增加的標誌物和/或單倍型另外被認為是「處於風險中」,因為它們帶來增加的疾病風險。「相當的細胞」表示其類型與進行比較的其他細胞的類型一致的細胞。相當的細胞的實例是來自相同細胞系的細胞。「抑制」疾病發作表示減少疾病發作的可能性,或者徹底防止疾病發作。在優選的實施方案中,抑制疾病若發作表示徹底防止其發作。「治療」疾病表示使疾病的進展減慢、停止或逆轉。在優選的實施方案中,治療疾病使疾病的進展逆轉,理想地逆轉至消除疾病自身的點。如本文使用的,減輕疾病或治療疾病是相當的。「抑制」基因在細胞中的表達表示,減慢基因被表達的程度,或者徹底防止這種基因表達。「特異性抑制」蛋白質的表達應表示,抑制蛋白質的表達(a)超過任意其他蛋白質的表達,或者(b)超過差不多10個或更少的其他蛋白質的表達。「抗體」包括,例如天然抗體和非天然抗體。特別地,該術語包括多克隆和單克隆抗體,以及它們的片段。另外,該術語包括嵌合抗體和完全合成抗體,以及它們的片段。「反義核酸」表示,在導入細胞中時與細胞中編碼蛋白質(「靶蛋白質」)的mRNA的至少一部分特異性雜交的任意核酸,所述蛋白質的表達被抑制,並從而抑制靶蛋白質的表達。與核酸的「特異性雜交」表示,就第一核酸而言,第一核酸與第二核酸雜交的親合性大於與任意其他核酸雜交的親合性。「對象」或「患者」表示任意動物,例如人、非人的靈長類、小鼠、大鼠、豚鼠或兔。「合適條件」具有依賴於該術語使用的上下文的意義。也就是說,在與抗體相關使用時,該術語應表示允許抗體與其對應的抗原結合的條件。該術語與核酸雜交相關使用時,該術語應表示允許長度為至少15個核苷酸的核酸與具有與其互補的序列的核酸雜交的條件。該術語與試劑與細胞接觸相關使用時,該術語應表示允許能夠完成所述接觸進入細胞並實施其預定的功能的條件。在一種實施方案中,如本文使用的術語「合適條件」表示生理條件。除非從上下文中顯而易見,本發明的所有要素、步驟或特徵可以與其他要素、步驟或特徵任意組合使用。在下列如分子克隆標準教材中可以發現分子和細胞生物化學的一般方法:ALaboratory Manual, 3rd Ed. (Sambrook 等人,Harbor Laboratory Press 2001) ;ShortProtocols in Molecular Biology, 4th Ed. (Ausubel 等人eds. , John ffiley&Sons 199 9);Protein Methods (Bollag 等人,John ffiley&Sons 1996) ;Nonviral Vectors for GeneTherapy(Wagner 等人 eds., Academic Press 1999) ;Viral Vectors(Kaplift&Loewyeds. , Academic Press 1995) ; Immunology Methods Manual (I. Lefkovits ed.,Academic Pressl997);和 Cell and Tissue Culture Laboratory Procedures inBiotechnology(Doyle&Griffiths, John ffiley&Sons 1998)。本公開文本中涉及的試劑、克隆載體和遺傳操作的試劑盒是從商業供應商例如BioRad、Stratagene> Invitrogen、Sigma-Aldrich 和 ClonTech 處可獲得的。依據通過本發明人發現或提出的特定實施方案來描述本發明,以便包括用於本發明實踐的優選方式。本領域技術人員應理解,按照本公開內容,在不偏離本發明的預定範圍的情況下,可以對示例性的特定實施方案進行很多修改和變化。例如,由於密碼子冗餘,在不影響蛋白質序列的情況下可以對相關DNA序列進行改變。另外,出於生物功能相當的考慮,在不影響生物作用的種類或數量的情況下可以對蛋白質結構進行改變。所有這些修改都包括在所附的權利要求的範圍內。列出下列實施例,以便為本領域普通技術人員提供如何實施和使用本發明的完整的公開和描述,並不意在限制發明人的發明範圍,也不意在表明下面的實驗是全部或者只是所實施的實驗。已經做出努力來確保所用數目(例如量、溫度等)的準確性,但一些實驗性錯誤和偏差應不包括在內。除非另外指出,份是重量份,分子量是平均分子量,溫度是攝氏度,和壓力是大氣壓或接近大氣壓。本說明書中引用的所有出版物和專利申請通過引用併入本文,特別地和單獨地指出每個單獨出版物或專利申請通過引用併入。使用CD44特異性抑制劑的治療方法本發明的方法包括向患有2型糖尿病,或診斷為易患2型糖尿病(例如通過本文所述的本發明的方法)的個體施用CD44活性的抑制劑。所述抑制劑可以對CD44的剪接變體是選擇性的,例如剪接變體包括CD44的外顯子3,或者靶向CD44的外顯子3。施用可以是全身的或局部的,施用的劑量和時機如本文所述的來確定。抑制劑可以通過很多不同的機制來抑制CD44的活性。在某些實施方案中,抑制劑是結合至CD44胞外結構域,並且在實施過程中抑制其配體結合活性。在另一些實施方案中,抑制劑防止CD44的表達或分泌。在另一些實施方案中,抑制劑與CD44的胞質結構域結合,並幹擾⑶44介導的信號通路。代表性CD44抑制劑包括但不限於反義寡核苷酸、抗體、CD44配體的片段,尤其是可溶性片段、小分子等。受關注的天然或合成的小分子化合物包括很多化學種類,儘管典型地是有機分子,優選分子量50道爾頓以上和約2500道爾頓以下的小的有機化合物。候選的物質包括對與蛋白質的結構性相互作用必要的官能團,特別是氫鍵,並且典型地包括至少胺、羰基、羥基或羧基基團,優選至少兩個官能性化學基團。候選的物質通常包括碳環或雜環結構和/或芳香族結構或多環芳香族結構,它們被一個或更多個上述官能團取代。候選的物質也存在於包括肽類、糖類、脂肪酸類、類固醇類、嘌呤類、嘧啶類、其衍生物、結構類似物或組合的生物分子中。可通過使用適合的篩選方案等來鑑定此類分子。抑制劑可以作用在⑶44 mRNA上,以便通過減少被靶向的細胞中存在的⑶44 RNA的量來抑制靶CD44的活性。「減少……的量」表示,將靶細胞中靶標CD44 mRNA的水平或數 量與對照相比較減少至少約兩倍,通常減少至少約5倍,例如10倍、15倍、20倍、50倍、100倍或更多,即根據對象方法不處理一致的靶細胞。該抑制劑包括RNAi和反義寡核苷酸,其可以對受關注的特異性CD44剪接變體是選擇性的。反義試劑可以是反義寡核苷酸(ODN),尤其是具有來自天然核酸的化學修飾的合成0DN,或表達該反義分子如RNA的核酸構建物。反義序列與靶向的mRNA是互補的,並且抑制其表達。可以施用一種反義分子或反義分子的組合,其中組合可包括多種不同的序列。反義分子可以通過所有或部分靶CD44序列在適合的載體中的表達來產生,在載體中轉錄起始的方向使得產生作為RNA分子的反義鏈。或者,反義分子是合成的寡核苷酸。反義寡核苷酸的長度通常為至少約7個核苷酸、常見為至少約12個核苷酸、更常見為至少約20個核苷酸,並且長度不超過約25個核苷酸,常見不超過約23-22個核苷酸,其中長度由抑制劑的效率、特異性、包括交叉反應性等所支配。反義寡核苷酸可以是通過本領域已知的方法(見Wagner等人,(1993)和見Milligan等人)化學合成的。優選的寡核苷酸是由天然磷酸二酯結構出發進行了化學修飾的,以便增加它們的胞內穩定性和結合親合性。文獻中已經描述了許多這樣的修飾,其改變了骨架、糖類或雜環鹼基的化學結構。在骨架化學結構的有用的變化中有硫代磷酸酯、兩個非橋連的氧都被硫所替代的二硫代磷酸酯、磷酸醯胺酯(phosphoroamidites)、燒基磷酸三酯和硼燒磷酸酯(boranophosphates)。非手性磷酸酯衍生物包括3 ' -O ' -5 ' -S-硫代磷酸酯、3' -S-5' -O-硫代磷酸酯、3' -CH2-5' _0_磷酸酯和3' -NH-5' _0_磷酸醯胺酯。肽核酸用肽連接代替了整個核糖磷酸二酯骨架。也可使用糖修飾來增強穩定性和親合性。可使用鹼基相對天然β_異頭物反轉的脫氧核糖α-異頭物。核糖的2' -OH可以變化以形成2' -O-甲基或2' -O-烯丙基糖類,這提供了抗降解能力而不包括親合性。雜環鹼基的修飾必須保持正確的鹼基配對。一些有用的取代包括對於脫氧胸苷的脫氧尿苷、對於脫氧胞苷的5-甲基-2'-脫氧胞苷和5-溴-2'-脫氧胞苷。在分別代替脫氧胸苷和脫氧胞苷時,已經顯示5-丙炔基-2'-脫氧尿苷和5-丙炔基-2'-脫氧胞苷增強親合性和生物活性。
受關注的反義分子包括antagomir RNA,例如如見Krutzfeldt等人描述的,在此特別地通過引用併入。經改造具有某些「藥物樣」特性(例如對穩定性的化學修飾和用於遞送的膽固醇綴合)的小幹擾雙鏈RNA(SiRNA),已經顯示其達到了內源性基因在體內的治療性沉默。為了開發沉默mRNA的在體內的藥理方法,開發了與mRNA互補的化學修飾的、膽固醇綴合的單鏈RNA類似物,稱為「antagomir」。Antagomir RNA可以利用標準固相寡核苷酸合成方案來合成。RNA與膽固醇綴合,並且可以進一步在一個或更多個位置包括硫代磷酸酯骨架。在某些實施方案中也受關注的是RNAi物質。RNAi物質表示通過RNA幹擾機制來調節mRNA表達的物質。在本發明的一個實施方案中使用的RNAi物質是小核糖核酸分子(本文中也稱為幹擾核糖核酸),即以雙鏈體結構存在的寡核糖核苷酸,例如兩個分開的寡核糖核苷酸互相雜交或者與一個假設小髮夾構造的核糖寡核苷酸(ribooligonucleotide)雜交以產生雙鏈結構。寡核糖核苷酸表示長度不超過約lOOnt,典型地不超過約75nt的核糖核酸,在特定的實施方案中長度低於約70nt的核糖核酸。RNA物質是兩個分開的核糖核酸互相雜交的雙鏈體結構,例如siRNA,雙鏈體結構的長度典型地為約15至30bp,通常為15 至29bp,在某些實施方案中長度在約20和約29bp之間,例如21bp、22bp尤其受關注。RNA物質是以髮夾構造存在的單個核糖核酸的雙鏈結構,即shRNA,髮夾的雜交部分的長度典型地與上面提供的siRNA型物質長度相同,或者比其長4至8個核苷酸。本實施方案的RNAi物質的重量典型地為約5000道爾頓至約35000道爾頓,在很多實施方案中為至少約10000道爾頓和低於約27500道爾頓,通常低於約25000道爾頓。dsRNA可以根據很多本領域已知的方法來製備,包括體外和體內方法,以及通過合成化學方法來製備。所述方法的實例包括但不限於,Sadher等人(Biochem. Int. 14 :1015,1987) ;Bhattacharyya (Nature 343:484,1990) JPLivache 等人(美國專利 5,795,715)描述的方法,每種方法的全部內容都通過引用併入本文。單鏈RNA還可以使用酶促合成和有機合成的組合或者通過完全有機合成來製造。合成的化學方法的使用可以將期望的修飾的核苷酸或核苷酸類似物引入dsRNA。dsRNA還可以根據很多已知方法體內製備(例如見Sambrook等人(1989)Molecular Cloning A Laboratory Manual,2nd ed. !Transcriptionand Translation (B. D. Hames 和 S. J. Higgins, Eds.,1984) ;DNA Cloning, I 和 II 卷(D. N. Glover, Ed.,1985);以及 Oligonucleotide Synthesis (M. J. Gait, Ed.,1984,每種方法的全部內容都通過引用併入本文)。在某些實施方案中,RNAi不是作為幹擾核糖核酸,例如如上文所述的siRNA或shRNA,而是RNAi物質可以編碼幹擾核糖核酸,例如如上文所述的shRNA。換句話說,RNAi劑可以是幹擾核糖核酸的轉錄模板。在這些實施方案中,轉錄模板典型地是編碼幹擾核糖核酸的DNA。DNA可以存在於載體中,本領域已知的有各種不同的載體,例如質粒載體、病毒載體等。在另一種實施方案中,CD44抑制劑是抗體。術語「抗體」或「抗體部分」意在包括任何包含多肽鏈的、具有適合於和鑑定抗原決定部位的特異性形狀的分子結構,一個或更多個非共價結合相互作用穩定分子結構和抗原決定部位之間的複合物。該術語包括單克隆抗體、多特異性抗體(包括超過一個結構域特異性的抗體)、人抗體、人源化抗體和具有期望的生物活性的抗體片段。
多克隆抗體可以通過向生產動物注射如上所述配製的抗原組合物通過標準方案來生產。例如見 Harlow 和 Lane, Antibodies :A Laboratory Manual, Cold Spring HarborLaboratory, 1988。在一種這類技術中,最初將包括多肽的抗原部分的II類祀抗原注射到很多種哺乳動物中的任意一種(例如小鼠、大鼠、兔子、綿羊或山羊)。利用整個蛋白質,或蛋白質的較大區段(section)時,可以通過用蛋白質和適合的佐劑(例如弗氏佐劑、弗氏完全佐劑、水包油乳劑等)免疫生產動物來生產抗體。或者,對於單克隆抗體來說,可以通過分離例如來自被接種動物的脾的被刺激的免疫細胞形成雜交瘤。這些細胞隨後融合至永生化細胞,例如骨髓瘤細胞或轉化細胞,它們能夠在細胞培養物中無限複製,從而產生永生的、分泌免疫球蛋白的細胞系。 另外,抗體或抗原結合片段可以通過遺傳工程來生產。在這種技術中,正如標準雜交瘤過程,使生產抗體的細胞針對所需的抗原或免疫原致敏。從免疫脾細胞或雜交瘤分離的信使RNA被用作模板,以便使用PCR擴增來製造cDNA。通過將經擴增的免疫球蛋白cDNA的適當區段插入表達載體中來生成載體庫,其中每個載體包含保留初始抗原特異性的一個重鏈基因和一個輕鏈基因。通過將重鏈基因庫與輕鏈基因庫組合來構建組合文庫。這產生 共同表達重鏈和輕鏈的克隆庫(組裝Fab片段或抗體分子的抗原結合片段)。攜帶這些基因的載體被共轉染至宿主(例如細菌、昆蟲細胞、哺乳動物細胞或其他適合的蛋白質生產宿主細胞)。在被轉染的宿主中誘導抗體基因合成時,重鏈和輕鏈蛋白質自組裝,以便生產可以通過用抗原或免疫原篩選檢測的活性抗體。下述抗體優選用於本發明,即誘導人的強烈或有害免疫應答(例如過敏性休克)之傾向降低,並且還顯示出對引發阻止抗體治療劑重複給藥的傾向降低的抗體。因此,在施用給人時產生較少免疫應答的、人源化的、單鏈、嵌合或人抗體,在本發明中優選使用。本發明中還包括多結構域抗體。嵌合抗體是其中不同部分來源於不同動物種類的分子,例如具有來源於鼠科mAb的可變區和人免疫球蛋白恆定區的那些分子。本文獻中描述了開發嵌合抗體的技術。例如參見 Morrison 等人,(1984) Proc. Natl. Acad. Sci. 81 :6851-6855 ;Neuberger 等人,(1984)Nature 312 :604-608 ;Takeda 等人,(1985)Nature 314:452-454。經由胺基酸橋通過連接Fv區的重鏈片段和輕鏈片段來形成單鏈抗體,產生單鏈多肽。例如參見Huston等人,Science 242 :423-426 ;Proc.Natl. Acad. Sci. 85 :5879-5883 ;和 Ward 等人,Nature341 544-546 ο識別特異性抗原決定表位的抗體片段可以通過本領域已知的技術產生。這些片段包括但不限於,可以通過抗體分子的胃蛋白酶消化產生的F(ab' )2片段,和可以通過還原Fiah1 ) 2片段的二硫鍵產生的Fab片段。或者,單鏈抗體(如下面描述的Fv)可以由包含人可變區的噬菌體文庫產生。參見美國專利6,174,708。單鏈免疫毒素LMB-7[B3 (Fv)-PE38]的鞘內施用被證實治癒了大鼠模型中的癌性腦膜炎。Proc Natl. Acad. Sci USA 92,2765-9,其全部都通過引用以整體併入本文。除了整個免疫球蛋白(或它們的重組對應物)之外,包括抗原決定部位結合位點的免疫球蛋白片段(例如Fab』、F(ab』)2或其他片段)在本發明中可用作抗體部分。該抗體片段可以通過無花果蛋白酶、胃蛋白酶、木瓜蛋白酶或其他蛋白酶切割由整個免疫球蛋白產生。利用重組免疫球蛋白技術可以設計「片段」或最小免疫球蛋白。例如用在本發明中的「Fv」免疫球蛋白可以經由肽接頭(例如聚甘氨酸或不形成α螺旋或β片層基序的其他序列)通過連接可變輕鏈區與可變重鏈區產生。候選抗體可以通過任意適合的標準手段,例如ELISA測定等進行測試。作為第一篩選,可以測試抗體對免疫原的結合。在建立選擇性結合之後,可以在體內模型中測試抗體的合適活性。在一個優選的實施方案中,可以使用多種體外和體內方法篩選抗體化合物。這些方法包括但不限於,測量與祀標的結合親合力的方法、測量在動物或細胞內化合物的生物分布的方法、或測量化合物介導的細胞毒性的方法。本領域已知的這些方法和其他篩選方法提供關於化合物結合、調節特異性靶標或者以其他方式與特異性靶標相互作用的信息,並且測量化合物的效力。抗-CD44抗體可以每天施用、每半周施用、每周施用、每半月施用、每月施用等,全身施用時劑量從每千克體重約O. Olmg起、約O. Img起、約Img起、約5mg起、約IOmg起、約IOOmg起或更多。小劑量可以在局部施用時使用,例如直接施用到眼運動神經等。人源化抗體、嵌合人抗體或人抗體優選施用給人類患者。 在本發明的另一些實施方案中,抑制劑是CD44配體的衍生物,它用於阻斷例如可溶性配體、配體類似物、配體片段的活性。受關注的分子包括五肽GRGDS、無內毒素的低分子量透明質酸、和用丁酸殘基酯化的透明質酸。抑制劑F-19848A抑制⑶44和HA的結合,其在基於細胞的測定中 IC50 值為 23. 5yM(Hirota-Takahata(2007)J Antibiot 60(10)633-9)。在另一些實施方案中,抑制劑是抑制CD44活性的藥物,尤其是小分子藥物。這種化合物可以是本領域已知的那些,或者可以使用本文描述的篩選方法來開發。可以使用常規計算方法基於動物數據來確定CD44抑制劑組合物的治療有效量或預防有效量。在一個實施方案中,如果適用的話,治療有效量或預防有效量包括約O. Olmg至約Ig的抑制劑,例如核酸、蛋白質或肽等。在另一個實施方案中,如果適用的話,有效量包括約Img至約IOOmg的抑制劑。在又一個實施方案中,如果適用的話,有效量包括約IOmg至約50mg的抑制劑。可以使用本領域技術人員已知的多種方法和遞送體系中的任意種來實現或實施相關組合物的施用。例如可以靜脈內、口服、經由植入、經黏膜、經皮膚、肌肉內、鞘內和皮下實施所述施用。利用了大量常規使用的藥物載體的下列遞送體系只是設想用於施用相關組合物的很多實施方案中的代表。可注射的藥物遞送體系包括溶液、混懸液、凝膠、微球和聚合物注射劑,並且可以包括賦形劑例如溶解性改變劑(例如乙醇、丙二醇和蔗糖)和聚合物(例如聚己內酯和PLGA)。可植入的體系包括棒狀物和盤狀物,並且可以包括賦形劑例如PLGA和聚己內酯。本發明的核酸還可以附著至顆粒使用基因槍來施用。口服遞送體系包括片劑和膠囊。它們可以包含賦形劑例如粘合劑(例如羥丙基甲基纖維素、聚乙烯吡咯烷酮、其他纖維素材料和澱粉),稀釋劑(例如乳糖和其他糖類、澱粉、磷酸二鈣和纖維素材料),崩解劑(例如澱粉聚合物和纖維素材料)以及潤滑劑(例如硬脂酸鹽和滑石)。經黏膜遞送體系包括貼劑、片劑、栓劑、陰道栓劑、凝膠劑和霜劑,並且可以包括賦形劑例如增溶劑和增強劑(例如丙二醇、膽汁鹽和胺基酸),其他載體(例如乙二醇、脂肪酸酯和衍生物、以及親水聚合物例如羥丙基甲基纖維素和透明質酸)。皮膚遞送體系包括例如水性和非水性凝膠、霜劑、複合乳劑、微乳劑、脂質體、軟膏、水性和非水性溶液、乳液、氣溶膠、碳氫化合物基質和粉末,並且可以包括賦形劑例如增溶劑、滲透增強劑(例如脂肪酸、脂肪酸酯、脂肪醇和胺基酸),以及親水聚合物(例如聚卡波非和聚乙烯吡咯烷酮)。在一種實施方案中,藥學上可接受的載體是脂質體或透皮增強劑。用於可重構遞送體系的溶液、混懸液和粉末包括載體例如助懸劑(例如膠質、黃原膠、纖維素質和糖類),保溼劑(例如山梨糖醇),增溶劑(例如乙醇、水、PEG和聚丙二醇),表面活性劑(例如月桂醇硫酸鈉、Span、Tween和十六烷基吡啶),防腐劑和200年6月2日抗氧化劑(例如苯甲酸酯類、維生素E和C以及抗壞血酸),抗結塊劑和螯合劑(例如 EDTA)。
診斷方法本發明描述了⑶44、SPP1和HDC基因的遺傳變體,它們是用於對2型糖尿病(T2D)的個體易感性的遺傳標誌物。在本發明的診斷方法中,可以評估個體的CD44、SPPl和HDC的一個或更多個中多態性的存在,並且可以進一步評估這些遺傳基因座的每一個中的一種或更多種多態性。因此,可以針對如本文所述一個、兩個、三個、四個、五個或更多個不同的多態性基因座中一個或兩個等位基因的存在,對個體進行基因分型。在一些實施方案中,多態性是單核苷酸多態性(SNP)。風險評價還可以包括對與本文所述的遺傳多態性鄰接的基因組區域的分析。DNA的大區域通常作為區塊(block)遺傳,由此,含有相鄰的構成原因的以及不構成原因的多態性。因此,多態性可以作為「連鎖不平衡區塊」或「LD區塊」連同很多其他多態性遺傳。在本發明的一個實施方案中,通過檢測⑶44、SPPl和HDC基因座的一個或更多個中的成因性多態性,進行2型糖尿病易感性的診斷。CD44、SPP1和/或HDC核酸中,多態性可以被改變,例如插入或缺失單個核苷酸,或超過一個核苷酸,導致移碼;改變至少一個核苷酸,導致所編碼的胺基酸的改變;改變至少一個核苷酸,導致過早的終止密碼子的產生; 幾個核苷酸的缺失,導致通過所述核苷酸編碼的一個或更多個胺基酸的缺失;插入一個或數個核苷酸,例如通過不等重組或基因轉換,導致基因編碼序列的中斷;所有或部分基因的重複;所有或部分基因的轉座/易位;選擇性剪接、或者所有或部分基因的重排。單個基因中可以存在超過一個的這種改變。這種序列改變可以引起由⑶44、SPPl或HDC核酸編碼的多肽中的差異。例如,如果差異是移碼改變,移碼可以導致所編碼的胺基酸的改變,和/或可以導致過早終止密碼子的產生,引起截短多肽的產生。或者,與CD44、SPP1或HDC核酸相關疾病或病症或者對疾病或病症的易感性相關的多態性,可以是一種或更多種核苷酸中的同義改變(即,所述改變不會導致CD44、SPP1或HDC核酸編碼的多肽中的改變)。這樣的多態性可以改變剪接位點,影響mRNA的穩定性或轉運,或者以其他方式影響基因的轉錄或翻譯。具有前面描述的任意的變化或改變的CD44、SPPl或HDC核酸本文中指的是「改變的核酸」。受關注的特定多態性包括存在於⑶44基因座的SNP中的那些,例如⑶44多態性的附表。在本發明的一些實施方案中,通過一個或更多個CD44SNP序列對個體進行基因分型,所述 CD44SNP 序列選自 rs353647、rsll2762、rs7930724、rsl071695。位於 CD44 外顯子3中的SNP rsl071695是受關注的,並在日本族裔個體的基因分型中特別有用。多態性位點
的序列如下,風險等位基因標註了下劃線
SEQ ID N〇:1 rs353647 CAATGTCATCCAAGTGGGAAAGTCAG [C/G] attctaacctctatgctatgt
TGCC
SEQ ID N〇:2 rs112762 GCCTAAAATAGAGCCTGGCATATACA [C/T]T^ATGAATGCACAATAAATATT
AGCC SEQ ID N〇:3 rs1071695 TACAGGTATGGGTTCATAGAAGGGCA[C/T] GTGGTGATTCCCCGGATCCAC
CCCA
SEQ ID NO:4 rs7930724 ATTTACTCAACAATTCCTTTGTTTTT [a/g] gtccaaggaagcatatctgga
AGAGSPPl (骨橋蛋白)的特定多態性包括但不限於,SNP rs4754、rs9138、rsl0012150、rsll26616和rsll26772。多態性位點的序列如下,風險等位基因標註了下劃線
SEQ ID NO5 rs4754GATGATATGGATGATGAAGATGATGA [C/T] GACCATGTGGACAGCCAGGAC
TCCA
SEQ ID NO6 rs9138CTCTCATGAATAGAAATTTATGTAGA [A/C ] GCAAACAAAATACTTTTACCC
ACTT
SEQ ID NO7 rs10012150 AGCTAGAAAAGTGGATCACATAGAGA [ C/T j AGACTGTAAATTGGTGGTTCT
ACAA
SEQ ID NO8 rs1126616 CAGTCCAGATTATATAAGCGGAAAGC [C/T] AAT G ATG AG AG C AATG AG C AT
TCCG
SEQ ID N〇:9 rs1126772 GTATCTATTTGAGTCTGGAAATAACT [A/G] ATGTGTTTGATAATTAGTTTA
GTTTHDC的特定多態性包括但不限於,SNP rs854150、rs2853766、和rs2238292。多態
性位點的序列如下,風險等位基因標註了下劃線
SEQ ID N010 rs854150 CTCAAGGTAAAGAAGAGCCCTGTCAG [C7G] CTTTATACGTCCAGATTTT
TTGATC
SEQ ID NO:11 rs2853766 TGCCCTAGCTTACACAGCTGATAAGC [A/G] GAAGAACGAGGATTCAAAC
TGATGC
SEQ ID NO: 12 rs2238292 CTGCCCACTCAGCTCCTCCTTACATC [A/C] ggttttgattgtgggctca
GGGCTT為了確定2型糖尿病的易感性,可以使用雜交方法例如Southern分析、Northern分析、或原位雜交(見 Current Protocols in Molecular Biology, Ausubel,F.等人,eds,John Wiley&Sons,包括貫穿1990的所有附錄)。例如,從個體(RNA和cDNA只可以用於外顯子標誌物)獲得來自基因組DNA、RNA或cDNA的測試對象(「測試個體」)的生物樣品(「測試樣品」),所述個體例如疑似患有2型糖尿病、對2型糖尿病易感或者易於患2型糖尿病、或攜帶2型糖尿病缺陷。個體可以是成人、兒童或胎兒。測試樣品可以來自包括基因組DNA的任意來源,例如血液樣品、羊水樣品、腦脊液樣品、或者來自皮膚、肌肉、口腔或結膜黏膜、胎盤、胃腸道或其他器官的組織樣品。
隨後檢驗DNA、RNA或cDNA樣品,以便確定CD44、SPP1和/或HDC核酸中存在哪種多態性的等位基因。通過基因組DNA、RNA或cDNA中基因與核酸探針的雜交可以指示受關注等位基因的存在。如本文使用的,「核酸探針」可以是DNA探針或RNA探針;核酸探針可以包括例如在⑶44、SPP1和/或HDC核酸中的至少一個多態性殘基。探針可以是任意上述核酸分子(例如基因或核酸、片段、包括基因或核酸的載體、探針或引物等)。用於檢測mRNA或基因組DNA的優選探針是能夠與本文所述的mRNA或基因組DNA序列雜交的帶標記核酸探針。核酸探針例如可以是全長核酸分子,或者其一部分,例如長度為至少15、30、50、100、250或500個核苷酸的寡核苷酸,並足以在嚴格條件下與適合的1111 ^或基因組DNA序列特異性雜交,以及足以區分風險等位基因和保護性等位基因。雜交樣品保持在足以允許核酸探針與CD44、SPP1和/或HDC核酸特異性雜交的條件下。如本文使用的,「特異性雜交」表示嚴格雜交(例如無錯配)。特異性雜交可以在例如如上所述的高嚴格度或中等嚴格度下實施。在一個特別優選的方面中,特異性雜交的雜交條件是對探針長度適合的高度嚴格。 使用標準方法檢測特異性雜交(如果存在的話)。在所述方法中還可以同時使用超過一種核酸探針。任意一種核酸探針與本文中所述為易感性等位基因的等位基因的特異性雜交是2型糖尿病易感性的診斷依據。在本發明的另一種方法中,如果基因中的改變(突變)或多態性導致限制性位點的產生或消除,則可以使用通過限制性消化的替代分析來檢測基因中的改變。從個體獲得包含基因組DNA的測試樣品。可以使用聚合酶鏈反應(PCR)來擴增來自測試個體的基因組DNA的測試樣品中CD44、SPPl或HDC核酸(如果必要的話,和側翼序列)。如所述的實行RFLP 分析,見 Current Protocols in Molecular Biology。相關 DNA 片段的消化模式指不是否存在本文所述作為CD44、SPPl或HDC核酸中易感性等位基因的等位基因,並因此指示是否存在對2型糖尿病的易感性。序列分析還可以被用於檢測CD44、SPP1或HDC核酸中的特異性多態性。從測試個體獲得DNA或RNA的測試樣品。可以使用PCR或其他適合的方法來擴增基因或核酸,和/或其側翼序列(如果需要的話)。使用標準方法確定CD44、SPPl或HDC核酸序列、或核酸片段序列、或cDNA序列、或cDNA片段序列、或mRNA序列、或mRNA片段序列。視情況而定,將核酸、核酸片段、cDNA、cDNA片段、mRNA或mRNA片段的序列與基因或cDNA或mRNA的已知核酸序列進行比較。本文所述作為CD44、SPP1或HDC基因中易感性等位基因的多態性的存在指示個體具有對2型糖尿病的易感性。等位基因特異性寡核苷酸還可以用於檢測CD44、SPPl或HDC核酸中多態性的存在,通過使用經擴增的寡核苷酸與等位基因特異性寡核苷酸(ASO)探針的點印跡雜交(例如見Saiki,R.等人,Nature 324 163-166 (1986)) 0 「等位基因特異性寡核苷酸」,也稱為「等位基因特異性寡核苷酸探針」是約10至50個鹼基對的寡核苷酸,它與CD44、SPPl或HDC核酸特異性雜交,並包括與對2型糖尿病的易感性相關聯的多態性。使用標準方法(見Current Protocols in Molecular Biology)可以製備對 CD44、SPP1 或 HDC 核酸中特定多態性特異性的等位基因特異性寡核苷酸探針。本發明進一步提供了等位基因特異性寡核苷酸,它與包括多態性的基因或核酸的參考或變體等位基因雜交,或與它們的互補序列雜交。這些寡核苷酸可以是探針或引物。由於作為鎖核酸(LNA)的這種類似物的添加,可以將引物和探針的尺寸降至少到8個鹼基。從個體獲得DNA的測試樣品。可以使用PCR來擴增⑶44、SPP1或HDC核酸的全部或片段以及其側翼序列。使用標準方法(見Current Protocols in Molecular Biology)對含有經擴增的CD44、SPPl或HDC核酸(或基因或核酸的片段)的DNA進行點印跡,將所述印跡與各個寡核苷酸探針接觸。隨後檢測探針與經擴增的CD44、SPP1或HDC核酸的特異性雜交的存在。等位基因特異性寡核苷酸探針與來自個體的DNA的雜交,指示了本文所述作為CD44、SPPl或HDC基因中易感性等位基因的等位基因的存在,因此指示對2型糖尿病的易感性。等位基因特異性引物與重疊多態性的靶DNA上的位點雜交,且只引發等位基因型(allelic form)的擴增,引物對所述等位基因型顯示出完美的互補性。見Gibbs, NucleicAcid Res. 17,2427-2448(1989)。該引物與第二引物一起使用,第二引物在遠端位置雜交。擴增從兩個引物開始,產生可檢測的產物,該產物指示存在特定的等位基因型。通常用第二對引物實施對照,所述第二對引物之一示出在多態性位點的單個鹼基錯配,另一個示出與 遠端位點的完美互補性。單個鹼基錯配阻止了擴增,並且不形成可檢測的產物。當所述錯配與多態性相比包含在所述寡核苷酸的3'-末端位置(most position)時,所述方法的效果最好,因為這個位置與來自引物的延長部最不穩定(例如見WO 93/22456)。在另一方面中,與來自個體的靶核酸序列區段互補的寡核苷酸探針的陣列可以用來鑑定CD44、SPPl或HDC核酸中多態性等位基因的存在。例如,在一個方面中,可以使用寡核苷酸陣列。寡核苷酸陣列典型地包括多種不同的寡核苷酸探針,所述探針與在不同的已知位置與襯底的表面相連接。這些寡核苷酸陣列,也描述為「基因晶片」,其已經在本領域一般性地描述,例如在美國專利5,143,854和PCT專利出版物WO 90/15070和92/10092中。這些陣列一般可以使用機械合成方法方法生產,或使用引入了光蝕刻方法和固相寡核苷酸合成方法的組合的光導向合成方法來生產。見Fodor等人,Science251 :767-777 (1991),Pirrung等人,美國專利5,143,854 (還參見PCT申請WO 90/15070)和Fodor等人,PCT公開TO 92/10092和美國專利5,424,186,其全部教導通過引用併入本文。在例如美國專利5,384,261中描述了使用機械合成方法合成這些陣列的技術,其全部教導通過引用併入本文。在另一個實例中,可以利用線型陣列。一旦製備了寡核苷酸陣列,受關注的核酸就與該陣列雜交,並篩選多態性。雜交和篩選一般通過本文描述的方法,還有例如公開的PCT申請WO 92/10092和WO 95/11995以及美國專利5,424,186中描述的方法來實施,其全部教導通過引用併入本文。簡言之,通過眾所周知的擴增技術例如PCR來擴增包括一種或更多種之前鑑定的多態性標誌物的靶核酸序列。典型地,這涉及引物序列的使用,所述引物序列與來自多態性的上遊和下遊靶序列的兩個鏈是互補性的。還可以使用不對稱的PCR技術。隨後,一般引入了標記的經擴增靶標與陣列在適當條件下雜交。陣列的雜交和衝洗完成時,掃描所述陣列以便確定陣列上靶序列合成的位置。通常,由掃描獲得的雜交數據是作為陣列上位置之函數的螢光強度的形式。用於多態性檢測的寡核苷酸陣列的其他用途可見於例如美國專利5,858,659和5,837,832中,其全部教導通過引用併入本文。可以使用其他核酸分析方法來檢測2型糖尿病基因中的多態性等位基因,或由2型糖尿病基因編碼的變體。代表性方法包括直接手動測序(Church 和 Gilbert, Proc. Natl. Acad. Sci. USA 81 1991-1995 (1988) ;Sanger, F.等人,Proc. Natl. Acad. Sci. USA 74:5463-5467(1977) ;Beavis 等人,美國專利 5,288,644);自動突光測序;單鏈構象多態性測定(SSCP);夾變性凝膠電泳(clamped denatured gelelectrophoresis, CDGE);變性梯度凝膠電泳(DGGE) (Sheffield, V. C.等人,Proc. Natl.Acad. Sci. USA 86 :232-236(1989));遷移率變動分析(Orita, M.等人,Proc. Natl. Acad.Sci.USA 86 :2766-2770(1989));限制性內切酶分析(Flavell 等人,Cell 15 :25(1978);Geever,等人,Proc. Natl. Acad. Sci. USA 78:5081(1981));異源雙鏈體分析;化學錯配切割(CMC) (Cotton 等人,Proc. Natl. Acad. Sci. USA 85 :4397-4401 (1985)) ;RNA 酶保護測定(Myers, R. M.等人,Science 230 :1242(1985));使用多肽來識別核苷酸錯配,例如大腸桿菌mutS蛋白質;例如等位基因特異性PCR。在本發明的一個方面中,還可以通過定量PCR (動態熱循環) 的表達分析進行對2型糖尿病的易感性的診斷。這種利用TaqMan 測定的方法可以評價⑶44、SPP1或HDC核酸或者由⑶44、SPP1或HDC核酸編碼的剪接變體的表達或組合中改變的存在。TaqMan.⑧探針還可以用於允許多態性的鑑定,以及患者是純合體還是雜合體的鑑定。另外,可以將變體的表達定量為身體上或功能上的不同。在本發明的另一個方面中,通過檢驗⑶44、SPPI或HDC多肽的表達和/或組成,可以進行對2型糖尿病的易感性的診斷,所述檢驗通過各種包括酶聯免疫吸附測定(ELISA)、Western印跡、免疫沉澱和免疫螢光方法來進行。評價來自個體的測試樣品,評價由CD44、SPPl或HDC核酸編碼的多肽的表達和/或組成中改變的存在,或者評價由CD44、SPPl或HDC核酸編碼的特定變體的存在。由CD44、SPP1或HDC核酸編碼的多肽的表達中的改變可以是,例如定量多肽表達(即所產生的多肽的量)中的改變;由CD44、SPPI或HDC核酸編碼的多肽的組成中的改變是定性多肽表達,例如改變的CD44、SPPl或HDC多肽的表達或不同剪接變體的表達)。在優選的方面中,通過檢測由⑶44、SPPl或HDC核酸編碼的特定剪接變體、或剪接變體的特定模式,可以進行對2型糖尿病的易感性的診斷。還可以存在兩種改變(定量和定性)。如本文中使用的,多肽表達或組成中的術語「改變」指的是,與對照樣品中由⑶44、SPPl或HDC核酸編碼的多肽的表達或組成相比較,測試樣品中表達或組成中的改變。對照樣品是對應測試樣品的樣品(例如來自相同類型的細胞),其來自不受II型糖尿病易感性影響的個體。與對照樣品相比較,測試樣品中多肽的表達或組成中的改變是對2型糖尿病的易感性的指示。類似地,與對照樣品相比較,測試樣品中一種或更多種不同的剪接變體的存在,或測試樣品中顯著不同量的不同剪接變體的存在,是對2型糖尿病的易感性的指示。可以使用檢驗由⑶44、SPPl或HDC核酸編碼的多肽的表達或組成的多種手段,其包括光譜、色譜、電泳、等電聚焦和免疫測定(例如David等人,美國專利4,376,110),例如免疫印跡(也參見Current Protocols in Molecular Biology)。例如,在一個方面中,可以使用例如如上所述的能夠結合多肽的抗體,優選具有可檢測的標籤的抗體。抗體可以是多克隆的,或更優選是單克隆的。可以使用完整的抗體或其片段(例如Fab或F(ab' ) 2)。對於探針或抗體,術語「標記的」意在包括通過將可檢測的物質與探針或抗體相連接(即物理性連接)來直接標記探針或抗體,以及通過與其他直接標記的試劑的反應性來間接標記探針或抗體。間接標記的實例包括,使用螢光標記的第二抗體檢測第一抗體,和用生物素末端標記DNA探針以便可以用螢光標記的鏈黴親和素檢測到它。使用與改變的CD44、SPPl或HDC核酸所編碼的多肽特異性結合的抗體、或與未改變的核酸所編碼的多肽特異性結合的抗體、或與核酸編碼的特定剪接變體特異性結合的抗體,Western印跡分析可以用於鑑定測試樣品中特定的剪接變體的存在,或者由多態性或改變的CD44、SPPl或HDC核酸編碼的多肽的存在;或者用於鑑定測試樣品中不存在特定的剪接變體,或者不存在由非多態性或未改變的核酸編碼的多肽。由多態性或改變的核酸編碼的多肽的存在,或者不存在由非多態性或未改變的核酸編碼的多肽,是2型糖尿病易感性的診斷依據,由CD44、SPPl或HDC核酸編碼的特定剪接變體的存在(或不存在)亦如此。在該方法的一個方面中,測試樣品中CD44、SPPl或HDC核酸所編碼的多肽的水平或量,與對照樣品中CD44、SPPl或HDC核酸所編碼的多肽的水平或量相比較較。測試樣品中多肽的水平或量,比對照樣品中多肽的水平或量高,或者比對照樣品中多肽的水平或量低,從而在統計學上的差異是顯著的,這是CD44、SPP1或HDC核酸所編碼的多肽的表達中的改變的指示,並且是2型糖尿病易感性的診斷依據。或者,測試樣品中CD44、SPP1或HDC核 酸所編碼的多肽的組成,與對照樣品中⑶44、SPPl或HDC核酸所編碼的多肽的組成相比較(例如不同剪接變體的存在)。與對照樣品中多肽的組成相比,測試樣品中多肽組成中的差異,是2型糖尿病易感性的診斷依據。在另一些方面中,可以評價測試樣品和對照樣品兩者中多肽的水平或量以及多肽的組成。測試樣品中多肽的量或水平與對照樣品中多肽的量或水平相比較的差異;測試樣品中組成與對照樣品中組成相比較的差異;或者量或水平的差異以及組成的差異,指示了 2型糖尿病的易感性。標誌物和單倍型的評估個體的基因組顯示出基因組中很多位置上的序列可變性。在一些情況下,提到多態性位點處的替代性等位基因,而不選擇參考等位基因。或者,對於特定的多態性位點,可提到參考序列。所述參考等位基因有時指的是「野生型」等位基因,其通常被選為第一測序等位基因或作為來自「未受到影響的」個體的等位基因,例如沒有出現疾病或異常表型的個體。不同於所述參考的等位基因指的是「變體」等位基因。單倍型是在多態性位點處具有特定等位基因的各種遺傳標誌物的組合。單倍型可以包括各種遺傳標誌物的組合,因此,可以通過本領域已知的用於檢測多態性位點的序列的方法來實現單倍型的檢測。鑑定相關標誌物和SNP的某些方法包括連鎖不平衡(LD)和/或LOD得分的使用。在本文所述的特定方法中,處於2型糖尿病風險中的個體是在其中鑑定出至少一種風險標誌物或單倍型的個體。在一個方面中,風險標誌物或單倍型是使得2型糖尿病(或易感性)風險顯著增加的標誌物或單倍型。在一個實施方案中,通過相對風險來測量與標誌物或單倍型相關聯的顯著性。在另一個實施方案中,通過百分比測量顯著性。在一個實施方案中,顯著性增加的風險測量為至少約I. 2的相對風險,包括但不限於1. 2,1. 3,1. 4、1.5、1.6、1.7、1.8和1.9。在另一個實施方案中,至少I. 2的相對風險是顯著性。在另一個實施方案中,至少I. 5的相對風險是顯著性。在另一個實施方案中,風險的顯著性增加至少約I. 7是顯著性。在另一個實施方案中,風險的顯著性增加至少約20%,包括但不限於約25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95% 和98%。在另一個實施方案中,風險的顯著性增加至少約50%,並可以用處於風險中的標誌物的組合來增加。在⑶44、SPPl或HDC基因中或包含其一部分的風險標誌物或單倍型,是下述標誌物或單倍型,即與其在健康個體(對照)中存在的頻率相比較,更頻繁地存在於處於2型糖尿病風險中的個體(受到影響的),其中該標誌物或單倍型的存在是對2型糖尿病的易感性的指示。作為相關性簡單測試的實例的是對二乘二表的Fisher精確檢驗。考慮到染色體的組,二乘二表由包括兩種標誌物或單倍型的、包括一種標誌物或單倍型但不包括另一種的和兩種標誌物或單倍型均不包括的染色體的數目構建。在本發明的某些方面中,風險標誌物或單倍型是與2型糖尿病顯著關聯的CD44、SPPl或HDC內或接近⑶44、SPPl或HDC的風險標誌物或單倍型。在另一些方面中,風險標誌物或單倍型包括與對2型糖尿病易感性顯著關聯的⑶44、SPPI或HDC內或接近⑶44、SPPl或HDC的風險標誌物或單倍型。在本發明的一些特定實施方案中,所述標誌物或單倍型是與本文所述的CD44、SPPl或HDC的LD區塊相關聯的。
可以使用最大期望算法來估計在患者中和對照組中單倍型的頻率(Dempster等 人,J. R. Stat. Soc. B,39 :1-38(1977))。可執行該算法,其可處理缺失的基因型以及與相有關的不確定性。在一個優選的實施方案中,P值< 0. 05是標誌物和/或單倍型顯著相關性的指示。對於與疾病相關聯的單個標誌物來說,可以使用Fisher精確檢驗來計算每個單獨等位基因的雙側P值。除非特別指出,所有P值均未調整地給出,用於多重比較。存在的頻率(對於微衛星、SNP和單倍型)是與載體頻率相反的等位基因頻率。為了將由於被招募作為連鎖分析的家族的患者的親屬關係帶來的任何偏見降至最低,可以從患者名單上排除一級未屬和_■級未屬。另外,可以重複檢驗,以針對患者間任意剩餘的未屬關係進行相關性校正,通過 Risch,N.&Teng,J. (Genome Res.,8 :1273-1288 (1998))中描述的擴展方差調整方法,合併親緣關係的DNA(ibid),以便可以應用於一般家族關係,且存在經調整的和未經調整的P值以用於比較。如預期的,差異一般來說非常小。為了評價多重檢驗校正的單個標誌物相關顯著性,可以進行使用相同基因型數據的隨機測試。患者和對照的群可以是隨機的,並可以多次(例如高達500000次)重複相關性分析,p值是產生一些標誌物等位基因的P值的複製的一小部分,低於或等於在初始患者和對照群中觀察到的P值。對於單一標誌物和單倍型分析來說,可以假設相乘模型(單倍型相對風險模型)來計算相對風險(RR)和人群歸因風險(PAR) (Terwilliger, J. D. &0tt, J.,Hum. Hered. 42 337-46(1992)和 Falk, C. T. &Rubinstein, P, Ann. Hum. Genet. 51(Pt 3) :227-33(1987)),即,將人攜帶的兩種等位基因/單倍型的風險相乘。例如,如果RR是A相對於a的風險,則人純合體的風險AA將是雜合體Aa的風險的RR倍,和純合體aa的風險的RR2倍。相乘模型具有簡化分析和單倍型計算獨立的良好特性,即在哈迪-溫伯格平衡中,在受到影響的人群中以及在對照人群中。結果是,受到影響的和對照的單倍型計數,每個具有多項分布,但是在備擇假設中具有不同的單倍型頻率。特別地,對於兩種單倍型hi和hj來說風險(hi)/風險(hj) = (fi/pi/(f j/pj),其中f和p分別指稱受到影響的人群和對照人群中的頻率。而如果真實模型是不相乘的,則存在效力損失,因此除了極端情況外損失趨於輕微。最重要的是,由於相對於零假設計算,P值一直有效。標誌物對之間的LD可以使用D '和R2的標準定義來計算(Lewontin,R. , Genetics49 :49-67 (1964) ;Hi11, ff. G. &Robertson, A. Theor. Appl. Genet.22 226-231 (1968))。使用NEMO,通過最大似然估計的兩種標誌物等位基因組合的頻率,和通過似然比檢驗估計相對於連鎖平衡的偏差。D'和R2的定義延伸至包括對求平均值的微衛星位點,所述值用於通過邊際等位基因概率加權的兩種標誌物的所有可能的等位基因組合。當繪製所有標誌物組合來闡明特定區域中的LD結構時,將D'繪製在左上角,p值在右下角。如果期望的話,在LD圖中,標誌物可以等距繪製,而不是根據其物理位置。在某些實施方案中,標誌物和單倍型的分析涉及對基於「單倍型區塊」(也稱為「LD區塊」)的候選易感性基因座進行定義。已經報導,人基因組的一部分可以斷裂成一系列包括少數常見的單倍型的不連續的單倍型區塊;對於這些區塊,連鎖不平衡數據幾乎沒有提供指示重組的證據(例如見Wall.,J. D.和Pritchard, J. K.,NatureReviews Genetics4 :587-597 (2003) ;Daly, M.等人,Nature Genet. 29 :229-232 (2001);Gabriel, S. B.等人,Science 296:2225-2229(2002) ;Patil, N.等人,Science 294 1719-1723(2001) ;Dawson, E.等人,Nature 418 :544-548(2002) ;Phillips, M.S.等人,Nature Genet. 33 :382-387 (2003))。有兩種主要的方法來定義這些單倍型區塊區塊可以被定義為具有有限的單倍型多樣性的DNA區域(例如見Daly,M.等人,Nature Genet. 29 229-232(2001) ;Patil,N.等人,Science 294:1719-1723(2001) ;Dawson, E.等人,Nature418 :544-548(2002) ; Zhang, K.等人,Proc. Natl. Acad. Sci.USA 99 :7335-7339 (2002)),或者被定義為具有大量歷史重組的過渡區之間的區域,使用連鎖不平衡來鑑定(例如見 Gabriel, S. B.等人,Science 296 :2225-2229(2002) ;Phillips, M.S.等人,NatureGenet. 33 :382-387(2003) ;ffang,N.等人,Am. J. Hum. Genet. 71 :1227-1234(2002) ;Stumpf,M. P.,和 Goldstein,D. B.,Curr. Biol. 13 :1-8(2003))。如本文使用的,術語「單倍型區塊」或「LD區塊」包括由任一特徵定義的區塊。用於鑑定單倍型區塊的代表性方法,例如在美國公開的專利申請20030099964、20030170665,20040023237和20040146870中列出。單倍型區塊可以容易地用於對表型和單倍型狀態之間的相關性進行作圖。可以在每個單倍型區塊中鑑定出主要單倍型,隨後可以鑑定出一組「帶標籤的」SNP或標誌物(區分單倍型所需的最小的SNP或標誌物組)。這些帶標籤的SNP或標誌物可以接著被用於評估來自個體組的樣品,從而鑑定表型和單倍型之間的相關性。如果需要,可以同時評估相鄰的單倍型區塊,因為那裡也可能存在單倍型區塊間的連鎖不平衡。在一些特定的實施方案中,與⑶44、SPP1或HDC的LD區塊相關的標誌物或單倍型是,其中與其在健康個體(對照)中存在的頻率相比較,更頻繁地存在於處於2型糖尿病風險中的個體(受到影響的)中的標誌物或單倍型,其中該標誌物或單倍型的存在是2型糖尿病或對2型糖尿病的易感性的指示。在另一些實施方案中,與一種或更多種CD44、SPPl或HDC的LD區塊相關標誌物處於連鎖不平衡的帶標籤風險標誌物是與其在健康個體(對照)中存在的頻率相比較,更頻繁地存在於處於2型糖尿病風險中的個體(受到影響的)中的標誌物,其中該標誌物的存在是2型糖尿病或對2型糖尿病的易感性的指示。在另一個實施方案中,與一種或更多種⑶44、SPP1或HDC的LD區塊相關標誌物處於連鎖不平衡的風險標誌物,是與其在健康個體(對照)中存在的頻率相比較,更頻繁地存在於處於2型糖尿病風險中的個體中的標誌物,其中該標誌物的存在是對2型糖尿病的易感性的指示。
篩選方法本發明還提供用於鑑定物質(例如融合蛋白、多肽、類肽物、前藥、受體、結合劑、抗體、小分子藥物或其他藥物、或核酶)的方法,所述物質是改變(例如增強或降低)CD44或CD44配體(例如否則與CD44相互作用骨橋蛋白、透明質酸)的活性,或者以其他方式與CD44相互作用骨橋蛋白。例如,在某些實施方案中,所述物質可以是結合至CD44的物質;其對例如CD44的活性具有抑制作用;或者抑制CD44與其同源配體相互作用的能力。在一個實施方案中,本發明提供用於篩選候選或測試物質的測定,以及通過該測定可鑑定的物質,所述候選或測試物質結合或介導CD44蛋白質的活性(或其生物活性部分)或CD44配體。優選地,候選物質在用於2型糖尿病的模型中進一步接受測試,所述模型例如是 Chen 和 Wang(2005)Diabetes Obes Metab. 7 (4) :307-17 中列出的任一種動物模型,本文特別地通過引用併入了關於藥物篩選中使用的動物模型的公開內容。可以使用本領域已知的組合文庫方法中的多種方法獲得測試物質,所述方法包 括生物文庫、空間可尋址的平行固相或液相文庫、要求去卷積的合成庫方法、「一珠一化合物方法」文庫方法、和使用親合性色譜選擇的合成庫方法。在一個實施方案中,為了鑑定改變⑶44活性的物質,可以將包含或表達⑶44或者其片段或衍生物或CD44配體的細胞、細胞裂解物、或者溶液與待測試的物質相接觸;或者,可以將蛋白質直接與待測試的物質接觸。或者直接或者間接地評價活性水平(量),並且與對照(例如不存在待測試的物質)中的活性水平進行比較。如果所述物質存在下的活性水平以統計學上顯著的量不同於不存在所述物質的情況,那麼該物質是改變活性的物質。本發明還涉及一個測定,所述測定用於鑑定改變⑶44基因或其配體之表達的物質(例如反義核酸、融合蛋白質、多肽、類肽物、前藥、受體、結合劑、抗體、小分子藥物或其他藥物,或核酶),所述物質改變基因的表達(例如轉錄或翻譯)。例如,編碼CD44的核酸可以與待測試的物質接觸。溶液可以包括例如含有核酸的細胞或含有核酸的細胞裂解物;或者,溶液可以是包括核酸轉錄/翻譯必需的要素的其他溶液。如果需要的話,還可以使用沒有懸浮在溶液中的細胞。評價⑶44表達的水平和/或模式,並與對照中表達的水平和/或模式進行比對。如果存在所述物質的情況下,水平和/或模式以統計學上顯著的量或方式不同於不存在所述物質的情況下的水平和/或模式,那麼該物質是改變表達的物質。在本發明的另一個實施方案中,使用含有與報告基因可操作地連接的編碼基因或核酸啟動子區的核酸的細胞、細胞裂解物、或者包含核酸的溶液,可以鑑定改變CD44或其配體的表達的物質。在與待測試的物質接觸之後,評價報告基因的表達水平,並與對照中的表達水平進行比對。如果存在所述物質的情況下,該水平以統計學上顯著的量或方式不同於不存在所述物質的情況下的水平,那麼該物質是改變⑶44表達的物質,如通過改變與CD44基因啟動子可操作地連接的基因表達的能力所顯示的。改變由CD44編碼的不同剪接變體的量的物質,例如增強第一剪接變體的表達的物質,和抑制第二剪接變體的表達的物質,以及拮抗第一剪接變體的活性的物質和拮抗第二剪接變體的活性的物質,使用上述這些方法可以容易地鑑定。在本發明的另一些實施方案中,測定可以用於評價測試物質對CD44配體相關多肽之活性的影響。例如,將表達CD44配體的細胞在存在待測試的物質的情況與CD44接觸,確定待測試的物質改變⑶44和⑶44結合物之間相互作用的能力。或者,可以使用包含⑶44配體的細胞裂解物或溶液。可以如下所述確定測試物質結合至CD44或CD44配體的能力,例如通過將測試物質與放射性同位素或酶標籤耦合,以便通過直接或間接地檢測125i、35s、14C或3H標記,並通過直接計數放射性發射(radioemmission)或通過閃爍計數,確定測試物質與多肽的結合。或者,測試物質可以被酶促標記,例如用辣根過氧化物酶、鹼性磷酸酶或螢光素酶,以及通過診斷適當底物向產物的轉化來檢測酶標籤。在不對任何反應物(interactant)進行標記的情況下確定測試物質與多肽相互作用的能力也在本發明範圍內。例如,可以使用微生理計(microphysiometer)來檢測測試物質與0)44或0)44配體的相互作用,而不標記測試物質、CD44 或 CD44 配體。McConnell, H. M.等人,Science 257:1906-1912(1992)。如本文使用的,「微生理計」是使用光尋址電位傳感器(LAPS)測量細胞酸化其環境的速率的分析裝置。該酸化速率的變化可以被用作配體和多肽之間相互作用的指示劑。在本發明的上述測定方法的超過一個的實施方案中,使⑶44基因、⑶44蛋白質、CD44配體或該測定的其他組分固定在固體支持物上可能是理想的,從而促進一種或兩種蛋 白質的複合形式與非複合形式分離,以及適應測定的自動化。測試物質與蛋白質的結合,或者在存在和不存在測試物質條件下蛋白質與結合劑的相互作用,可以在適用於容納反應物的任意容器中完成。該容器的實例包括微量滴定板、試管、和微離心管。在一個實施方案中,可以提供融合蛋白質(例如穀胱甘肽-S-轉移酶融合蛋白),其添加允許CD44、CD44蛋白質或CD44配體結合至襯底或其他固體支持物的結構域。本發明還涉及通過上述篩選測定來鑑定的新型物質。因此,進一步在如本文所述的治療方法中使用如上所述鑑定的物質在本發明範圍內。例如,如上所述鑑定的物質可以用於改變由CD44基因編碼的蛋白質的活性,或者用於通過使蛋白質或核酸與如本文所述鑑定的物質相接觸(或者使包括多肽或核酸的細胞與其相接觸)來改變CD44的表達。可用於診斷方法中的試劑盒(例如試劑盒)包括用在任意本文所述方法中的組分,例如包括如本文所述的雜交探針或引物(例如經標記的探針或引物)、用於檢測經標記的分子的試劑、限制性酶(例如用於RFLP分析)、等位基因特異性寡核苷酸、結合至改變的或未改變的(天然的)⑶44、SPPI或HDC多肽的抗體、用於擴增包括⑶44、SPPI或HDC核酸的裝置或用於分配⑶44、SPPl或HDC的裝置/物質、或用於分析⑶44、SPPl或HDC核酸的核酸序列的裝置/物質或用於分析如本文所述的CD44、SPP1或HDC多肽的胺基酸序列的裝置/物質等。在一個方面中,用於診斷對2型糖尿病易感性的試劑盒可以包括,用於CD44、SPPl或HDC核酸中區域的核酸擴增的引物,其包括SEQ ID NO 1至SEQ ID NO 12中列出的SNP序列,或更頻繁存在於患2型糖尿病的個體或對2型糖尿病易感的個體中的風險單倍型。可以使用指示2型糖尿病的核酸側翼SNP的部分來設計引物。實驗下列方法用於後面描述的實施例中,以便舉例說明本發明的實施方案。在進一步描述本發明之前,應理解本發明不局限於下面描述的本發明的特定實施方案,特定實施方案可以變化並仍落入所附權利要求的範圍內。還應理解,所用的術語是以描述特定實施方案為目的的,不是旨在限制。或者,本發明的範圍應通過所附的權利要求來構建。在本說明書和所附權利要求中,除非另有指明,否則沒有數量詞指代的名詞包括複數形式。除非另外定義,本文使用的所有技術和科技術語具有與本發明所述技術領域的普通技術人員通常理解的相同含義。本說明書中引用的所有出版物和專利申請通過引用併入本文,特別地和單獨地指出每個單獨出版物或專利申請通過引用併入。對任意出版物的引用是為了引用其在提交日期之前的公開本文,而不應解釋為承認本發明不必在憑藉在先發明的這些出版物之前。儘管出於清楚理解的目的已經通過舉例說明和實例詳細描述了前面的發明,對本領域的普通技術人員來說仍然顯而易見的是,藉助本發明的教導,在不偏離所附的權利要求的精神或範圍情況下可以對其作出特定的變化和修改。實施例I2型糖尿病(T2D)全基因組微陣列實驗資料庫的建立。通過收集和對所有在進行研究時公共可用的T2D相關的微陣列研究(69個實驗,共計518個微陣列)進行再分析,來建立T2D全基因組功能實驗資料庫。微陣列實驗包括多種類型的組織(肌肉、肝臟、脂肪和 胰島)和物種(人、小鼠和大鼠)。該資料庫中20994個基因中的每一個都基於來自69個微陣列研究組的其中每個基因顯著失調(dysregulated)的微陣列實驗的數目來計數和分類。從三個來源收集來自T2D相關的全基因組微陣列實驗的所有69個公共可用的數據(表2)。首先,從Gene Expression Omnibus (GEO)用關鍵詞搜索「糖尿病」或「糖尿病患者」或「NIDDM」或「非胰島素依賴」來選擇和下載微陣列的原始定量數據。手動排除涉及I型糖尿病、藥物誘導的糖尿病、妊娠期糖尿病和糖尿病併發症的實驗。使用來自人和嚙齒類動物模型的數據。該查詢的執行產生了包括共計262個樣品的35個獨立數據組。第二,另外從糖尿病基因組剖析項目(DiabetesGenome Anatomy Project,DGAP)下載原始定量數據。特別地,下載涉及T2D和糖耐量受損的數據組。有32個相關的獨立數據組可用,包括共計248個樣品。使用來自人和嚙齒類動物模型的數據。第三,還從核受體信號數據集(Nuclear Receptor Signaling Atlas, NURSA)下載原始定量數據。特別地。下載涉及T2D和糖耐量受損的數據組。有兩個相關的獨立數據組可用,包括共計8個樣品。表2.用於開發T2D資料庫的69個微陣列實驗的列表。
權利要求
1.治療或預防個體中2型糖尿病發作的方法,所述方法包括 向所述個體施用CD44的抑制劑。
2.根據權利要求I的方法,其中⑶44在脂肪組織巨噬細胞或脂肪細胞上表達。
3.根據權利要求I的方法,其中所述抑制劑抑制CD44與一種或更多種同源配體的結八口 ο
4.根據權利要求3的方法,其中所述配體是骨橋蛋白。
5.根據權利要求3的方法,其中所述配體是透明質酸。
6.根據權利要求3的方法,其中所述抑制劑是抗體或其片段。
7.根據權利要求3的方法,其中所述抑制劑是CD44配體的類似物。
8.根據權利要求I的方法,其中所述抑制劑降低CD44的表達。
9.根據權利要求8的方法,其中所述抑制劑是反義寡核苷酸。
10.根據權利要求8的方法,其中所述抑制劑是RNAi核酸。
11.根據權利要求I的方法,其中所述抑制劑降低CD44的信號傳導活性。
12.診斷個體中2型糖尿病(T2D)易感性的方法,所述方法包括確定來自所述個體的生物樣品中是否存在多態性等位基因,其中所述至少的多態性等位基因與CD44、SPPl和HDC基因座中的一個或多個遺傳相關聯,且其中等位基因的存在指示對2型糖尿病的易感性。
13.根據權利要求12的方法,其中所述多態性等位基因包括單核苷酸多態性。
14.根據權利要求13的方法,其中所述單核苷酸多態性在CD44、SPP1或HDC基因座的內含子或外顯子內。
15.根據權利要求13的方法,其中所述單核苷酸多態性在與CD44、SPP1或HDC基因座相關的調控區內。
16.根據權利要求13的方法,其中所述SNP選自SEQID NO :1_12中所示的多態性。
17.根據權利要求12的方法,所述方法還包括用權利要求I至11中任一項所述方法治療所述個體。
18.根據權利要求12的方法,其中增加的易感性具有至少I.2的相對風險(RR)或優勢比(OR)的特徵。
19.根據權利要求12的方法,其中所述生物樣品是遺傳樣品。
20.根據權利要求19的方法,其中所述遺傳樣品包括mRNA或由其衍生的cDNA。
21.診斷個體中胰島素抵抗的方法,所述方法包括對所述個體中CD44的血清水平進行定量。
22.評價個體中對2型糖尿病易感性的試劑盒,所述試劑盒包含用於選擇性確定來自所述個體的生物樣品中是否存在至少一個多態性等位基因的試劑,其中所述多態性等位基因選自SEQ ID NO :1-12中所示的多態性,且其中至少一個SNP的存在指示對2型糖尿病的易感性。
23.根據權利要求22的試劑盒,所述試劑盒包含特異性結合SEQID N0:l_12中所示至少一個序列的探針。
24.根據權利要求22的試劑盒,所述試劑盒還包含用於選擇性確定是否存在其他與2型糖尿病的誘因相關的其他多態性等位基因的試劑。
25.根據權利要求23的試劑盒,所述試劑盒包含選擇性結合與2型糖尿病易感性相關的多態性等位基因的探針 陣列。
全文摘要
本發明提供治療和診斷與高血糖症相關的疾病,包括糖尿病、胰島素抵抗等疾病的方法和組合物。基因多態性顯示與疾病易感性相關,且它們的檢測被用於診斷這些病症的誘因。相應的蛋白質用作介入治療的靶。
文檔編號A61K31/7088GK102781517SQ201180007910
公開日2012年11月14日 申請日期2011年2月1日 優先權日2010年2月1日
發明者児玉桂一, 阿圖爾·J.·布特 申請人:小利蘭·史丹福大學託管委員會