用於前列腺癌檢測的聯合診斷組合物及檢測試劑盒
2024-04-16 01:18:05 2
1.本發明屬於醫學檢測領域,涉及一種前列腺癌相關基因,具體來說是用於前列腺癌檢測的聯合診斷組合物及檢測試劑盒。
背景技術:
2.前列腺癌是全球範圍內男性第二位常見的惡性腫瘤,死亡率排名第五。據報導,中國的前列腺癌發病率為15.6/10萬,且呈逐年遞增趨勢。在我國,初診前列腺癌中高達67%處於中晚期,5年生存率僅66.4%(2012-2015年的統計數據),相當於美國1975年的水平
[1-2]
。目前,去勢敏感性前列腺癌(mcspc)患者近70%使用cab(全雄激素阻斷)或adt(去勢)治療,1-2年後,約一半的患者將不可避免的進展為轉移去勢抵抗性前列腺癌(mcrpc)。
[0003]
儘管存在眾多的藥物(如新型內分泌治療藥物、化療、parp抑制劑等),mcrpc仍然不可治癒。已有國外的研究報導,ddr基因變異、ar擴增等與治療及預後相關,但由於中西方差異,專門針對中國前列腺癌患者疾病進展和藥物療效預測的分子機制仍待闡明。
[0004]
研究報導,crpc患者的病情變化與多種信號異常相關,包括雄激素信號、細胞周期信號、dna損傷修復等,前期的研究[3]結果表明,中國mcrpc患者中cdk12變異頻率(15.4%)顯著高於西方人群(5%
–
7%),cdk12缺失的患者pfs更短,在阿比特龍治療後快速進展,但對多西他賽的治療結果沒有影響。ar擴增、tp53和/或rb1變異與阿比特龍或多西他賽耐藥相關。brca2缺失的患者對parp抑制劑和鉑類化療具有很強的敏感性。因此,選擇合適的分子標誌物,篩選不同治療方案下的優勢人群顯得格外重要。
[0005]
[1]hongmei zeng,wanqing chen,rongshou zheng,et al.changing cancer survival in china during 2003-15:a pooled analysis of 17 population-based cancer registries.lancet glob health.2018 may;6(5):e555-e567.doi:10.1016/s2214-109x(18)30127-x.
[0006]
[2]葉定偉,朱耀.中國前列腺癌的流行病學概述和啟示.中華外科雜誌,2015,53(4):249-252.
[0007]
[3]baijun dong,liancheng fan,bin yang,et al.use of circulating tumor dna for the clinical management of metastatic castration-resistant prostate cancer:a multicenter,real-world study.j natl comprcancnetw.2021may14;19(8):905-914.doi:10.6004/jnccn.2020.7663。
技術實現要素:
[0008]
本發明的目的在於提供一種用於前列腺癌檢測的聯合診斷組合物及檢測試劑盒,所述的這種用於前列腺癌檢測的聯合診斷組合物及檢測試劑盒要解決現有技術單基因檢測前列腺癌價格昂貴,耗時長,操作繁瑣的技術問題。
[0009]
本發明提供一種基於靶向捕獲檢測結果用於指導轉移性激素抵抗型前列腺癌術後預後評分模型以及其研究方法的建立。
[0010]
本發明基於中國多中心前列腺癌數據及國外研究公開的前列腺癌數據,結合相關臨床研究結果的解讀進行基因集篩選,並根據機器學習方法建立前列腺癌治療預後風險評估模型pcars。此模型仍使用生存分析進行驗證,pcars可對患者的預後進行分層。
[0011]
本發明對其中可以作為激素抵抗型前列腺癌的治療預後根據選擇的關鍵基因標誌物進行預後風險評分,通過pcars評分的分層,預測臨床激素抵抗型前列腺癌治療的預後。
[0012]
本發明提供了一種用於前列腺癌檢測的聯合診斷組合物,由如下的基因組合:
[0013]
ar、foxa1、spop、pten、pik3ca、akt1、tp53、rb1、brca2、cdk12、atm、fanca、rad51b、brca1、palb2、atr。
[0014]
[0015]
[0016]
[0017][0018]
本發明還提供了檢測上述診斷組合物的試劑在用於製備前列腺癌診斷的試劑盒中的應用。
[0019]
進一步的,所述的前列腺癌是指轉移性激素抵抗型患者的前列腺癌。
[0020]
進一步的,所述的診斷試劑盒是指區分激素治療、化療或parp抑制劑治療用藥獲益人群的試劑。
[0021]
進一步的,所述的激素治療用藥是指新型雄激素生物合成抑制劑阿比特龍的治療。
[0022]
進一步的,所述的化療是指紫杉醇類藥物多西他賽、鉑類的化療。
[0023]
進一步的,所述的parp抑制劑治療是指奧拉帕利的化療。
[0024]
本發明還提供了一種試劑盒,含有檢測權利要求1所述的診斷組合物的試劑。
[0025]
本發明還提供了上述試劑盒的使用方法,包括如下的步驟:
[0026]
(1)根據ar、foxa1、spop、pten、pik3ca、akt1、tp53、rb1、brca2、cdk12、atm、fanca、rad51b、brca1、palb2、atr 16個基因的靶向測序檢測的結果,獲得ar、tp53、rb1、foxa1、spop、pi3k、ddr五個基因加兩個通路共計七個變量的變異結果;所述的pi3k通路由pik3ca、akt1、pten三個基因數據構成,所述的ddr通路由brca2、brca1、cdk12、fanca、atm、atr、rad51b、palb2八個基因數據構成;
[0027]
基因發生了變異是指基因發生了外顯子或剪接位點區域非同義突變或拷貝數變異;
[0028]
通路發生了變異是指通路中任意一個基因發生了變異;
[0029]
(2)上述七個變量帶入pcars模型,計算pcars得分;
[0030]
pcars的算法為:
[0031]
1)
[0032]
2)
[0033]
3)
[0034]
4)
[0035]
5)
[0036]
上述五步具體解釋為:
[0037]
1)mut matrix為突變矩陣,mutation為變異,wild type為基因未發生變異,maf為一行一個變異的記錄,spread為展開即把變異從行轉為矩陣,即根據maf記錄的一批患者的基因變異狀態轉換成一個維度為n
×
7的[0-1]矩陣,其中行數n為患者數,列數7為該模型的5個基因+2個通路的變量,矩陣的每一行記錄一個患者的7變量狀態;
[0038]
2)model fit為建立起的模型,brnn fit為使用貝葉斯神經網絡來建立模型,p為概率,gi為模型基因發生了變異,response為該患者治療後六月的復發情況,即根據基因變異條件下復發的概率建立起貝葉斯網絡模型;
[0039]
3)threshold為閾值,max為最大值,youden index為尤登指數即靈敏度與特異度的加和,fit為帶入模型,mut為步驟1中的變異矩陣,即把步驟1的矩陣帶入步驟2的模型後得到每個患者的評分,以靈敏度+特異度最大值的點作為模型區分高低風險的閾值;
[0040]
4)gene vector為待檢樣本16基因的7狀態變量的二元向量,maf為以此樣本所有變異的記錄,即以16個基因的變異狀態轉換為0-1的二元變量的向量;
[0041]
5)score為待檢樣本的模型評分,把步驟4中待檢樣本的基因向量帶入步驟2的模型得到的評分,predict為預測:評分大於步驟3中的閾值則此樣本預測為有效(預後較好)、小於等於步驟3中的閾值則預測為無效(預後較差);
[0042]
6)當pcars大於0.42141時,診斷為轉移性激素抵抗型前列腺癌預後良好的人群;當pcars小於或等於0.42141時診斷為轉移性激素抵抗型前列腺癌預後較差的人群。
[0043]
具體的,上述步驟補充如下:
[0044]
進一步的,所述的使用方法還包括如下的步驟:
[0045]
(a)ar、tp53、rb1、foxa1、spop五個基因,若發生變異自身記為1,否則記為0;
[0046]
(b)pik3ca、akt1、pten三個基因,若任意一個發生變異,pi3k記為1,否則記為0;
[0047]
(b)brca2、brca1、cdk12、fanca、atm、atr、rad51b、palb2八個基因,若任意一個發生變異,ddr記為1,否則記為0。
[0048]
上述變異包含突變(外顯子、剪接位點的非同義突變)及拷貝數變異;
[0049]
上述三類共計7個自變量,以6月內是否進展為因變量,輸入給貝葉斯神經網絡模型進行訓練;
[0050]
數據集按70%、30%拆分為訓練集和驗證集,並使用k=10的交叉驗證(隨機將數據集切割為十份,k為數據份數,依次取其中九份訓練餘下一份進行測試)來訓練模型;
[0051]
模型預測的分值pcars為預後風險評分,閾值根據約登指數即模型預測結果的靈敏度+特異度值最大的點定為0.42141;
[0052]
pcars得分越高在轉移性激素抵抗型前列腺癌患者中越容易傾向治療無效、無進展生存期更短。
[0053]
本發明提供一種前列腺癌相關16基因靶向捕獲測序panel,所述的探針覆蓋前列腺癌相關16基因的全長編碼區。本發明的靶向捕獲測序基於illumina、華大等二代測序平臺。該panel可同時對前列腺癌不同病程包括激素敏感型前列腺癌、激素抵抗型前列腺癌等疾病、用藥、預後等相關16基因進行高通量檢測。此靶向基因集合可明顯提高人群突變陽性檢測覆蓋效率,改變傳統單基因檢測方法價格昂貴,耗時長,操作繁瑣等劣勢。本專利還公開了前列腺癌相關16基因靶向捕獲檢測在基於二代測序平臺分析突變結果在轉移性激素抵抗型前列腺癌患者治療、預後的應用。
[0054]
本發明能夠預測轉移性激素抵抗型前列腺癌在使用激素治療、化療或靶向治療後的獲益情況以及對患者人群的復發風險加以區分。本發明篩選基因集時使用了中國多中心數據及非亞洲人群主要佔比的國外公開數據,首先篩選出確保陽性覆蓋率足夠且穩定的基因組合,進而使用機器學習的方法,採用多個基因標誌物聯合的評分模型來提高預測的敏
感性與特異性,應用該評分除了可以預測預後,還可以對前列腺癌患者的療效(psa下降超過50%)進行預測。
附圖說明
[0055]
圖1是篩選基因累計覆蓋前列腺癌人群頻率遞增折線圖;
[0056]
圖2是pcars模型在預測轉移性激素抵抗型患者預後的性能(roc);
[0057]
圖3是最優判定閾值下,pcars高、低風險組的生存圖。
[0058]
圖4是最優判定閾值下,psa下降與pcars的關係圖。
具體實施方式
[0059]
名詞和術語:
[0060]
本發明中所述的「突變」包含以下兩種情況:
[0061]
單核苷酸變異(snv):單個鹼基置換引起,導致編碼胺基酸發生變化,如foxa1基因h247y。
[0062]
插入缺失突變(indel):多個鹼基插入或缺失導致編碼胺基酸的增加/減少。這些類型的突變可能是「框內的」,導致蛋白質中胺基酸的加入或減少;或可導致「移碼」,通常導致蛋白質的過早截短。如pik3ca基因的h419_l422del。
[0063]
基因的篩選步驟:
[0064]
(1)本發明中所述的內分泌治療是指阿比特龍藥物治療。
[0065]
本發明中所述的化療輔助治療是指紫杉醇類化療即多西他賽藥物治療或鉑類藥物化療。
[0066]
本發明中所述的parp抑制劑治療為奧拉帕利藥物治療。
[0067]
本方法的樣本來源一為發表在jccn研究(dong b,fan l,yang b,et al.use of circulating tumor dna for the clinical management of metastatic castration-resistant prostate cancer:a multicenter,real-world study.j natl comprcancnetw.2021;19(8):905-914.doi:10.6004/jnccn.2020.7663)中306例轉移性激素抵抗型前列腺癌患者的血液樣本。其中58人手術後接受了阿比特龍激素治療,82人術後接受了化療輔助治療,22人接受了奧拉帕利治療。從研究對象的血液中提取dna,使用由642/620/66/50個基因構成的靶向測序panel建立了富集文庫(見前引文),對dna進行ngs測序,並對ngs檢測產生的數據進行基因突變及拷貝數變化分析,得到每例患者的腫瘤特有變異。
[0068]
本方法的樣本來源二為the cancer genome atlas(tcga)公布並收錄在cbioportal資料庫中228例t2及以上分期的前列腺癌數據,此數據集均使用全外顯子檢測(whole exome sequencing,wes)來檢測患者的基因組變異。
[0069]
(2)基因根據通路及藥物靶點可以分為ar(雄激素受體通路)、hrr(同源重組修復通路)、mmr(錯配修復通路)、其它通路;
[0070]
(3)本發明篩選的基因變異發生頻率需大於3%或為有明確藥物靶點的基因,滿足此條件的基因在中國人群及tcga前列腺癌人群中發生頻率如下:
[0071][0072][0073]
(4)上述基因表中發生頻率低於3%基因brca1、rad51b、palb2皆屬於dna修復通路,且臨床研究表明此類基因突變易從parp抑制劑治療中獲益。此基因集合已基本穩定覆蓋變異陽性的前列腺癌人群,圖1所示可以看出在tcga人群中可穩定覆蓋約41.2%的患者,在中國多中心隊列人群中可穩定覆蓋約66.4%的患者。其中中國多中心為轉移性晚期患者故變異基因較多、陽性率較高。
[0074]
(5)鑑於部分基因變異發生頻率較低,為了應對多種基因標誌物同時出現或同時不出現所帶來的波動影響,並考慮同一通路中的基因共同發揮作用,最終組合起來的變量有pi3k通路(pik3ca、akt1、pten),ddr通路(brca2、brca1、cdk12、fanca、atm、atr、rad51b、palb2),餘下五個基因單獨為一個變量。
[0075]
單基因的變量取值方法為:發生變異為1,否則為0;
[0076]
通路的變量取值方法為:任意一個基因變異為1,否則為0。
[0077]
(6)本發明在中國人群數據集中使用無進展生存期(progress free survival,pfs),來進行標誌物的預後分析。對於組合後的基因變異標誌物,使用貝葉斯神經網絡(bayesian regularization for feed-forward neural networks,brnn)的機器學習模型進行訓練和建模;
[0078]
貝葉斯神經網絡是一個性能優異的非參數模型,優點是可以根據較少的數據得到較為穩健的模型,而且得到的是各層參數的分布(假設各層參數wi、bi服從高斯分布,訓練時可計算得出wi、bi的均值和方差,從而得到p(w|x,y))。貝葉斯神經網絡可以有效的解決過擬合的問題,不僅可以對結果進行預測,還可以對結果的誤差進行有效預測。
[0079]
為了降低模型的方差,在模型訓練時採用k折交叉驗證法進行訓練。本方法將訓練數據分成五組即cv=5,將每個子集數據分別做一次驗證集,剩餘的k-1組子集數據作為訓練集,循環交叉驗證評估模型效果,最後的誤差mse(mean squared error)加和平均就得到交叉驗證誤差。交叉驗證有效利用了有限的數據,並且評估結果能夠儘可能接近模型在測試集上的表現,可做為模型優化的指標使用。
[0080]
建模完成後,帶入驗證集樣本對應的七個變量即可得到該患者的pcars評分。
[0081]
pcars的算法為:
[0082]
1)
[0083]
2)
[0084]
3)
[0085]
4)
[0086]
5)
[0087]
上述五步具體解釋為:
[0088]
1)mut matrix為突變矩陣,mutation為變異,wild type為基因未發生變異,maf為一行一個變異的記錄,spread為展開即把變異從行轉為矩陣,即根據maf記錄的一批患者的基因變異狀態轉換成一個維度為n
×
7的[0-1]矩陣,其中行數n為患者數,列數7為該模型的5個基因+2個通路的變量,矩陣的每一行記錄一個患者的7變量狀態;
[0089]
2)model fit為建立起的模型,brnn fit為使用貝葉斯神經網絡來建立模型,p為概率,gi為模型基因發生了變異,response為該患者治療後六月的復發情況,即根據基因變異條件下復發的概率建立起貝葉斯網絡模型;
[0090]
3)threshold為閾值,max為最大值,youden index為尤登指數即靈敏度與特異度的加和,fit為帶入模型,mut為步驟1中的變異矩陣,即把步驟1的矩陣帶入步驟2的模型後得到每個患者的評分,以靈敏度+特異度最大值的點作為模型區分高低風險的閾值;
[0091]
4)gene vector為待檢樣本16基因的7狀態變量的二元向量,maf為以此樣本所有變異的記錄,即以16個基因的變異狀態轉換為0-1的二元變量的向量;
[0092]
5)score為待檢樣本的模型評分,把步驟4中待檢樣本的基因向量帶入步驟2的模
型得到的評分,predict為預測:評分大於步驟3中的閾值則此樣本預測為有效(預後較好)、小於等於步驟3中的閾值則預測為無效(預後較差);
[0093]
6)當pcars大於0.42141時,診斷為轉移性激素抵抗型前列腺癌預後良好的人群;當pcars小於或等於0.42141時診斷為轉移性激素抵抗型前列腺癌預後較差的人群。
[0094]
一個具體的例子為:一個待檢樣本使用此專利小panel測序後經過比對、變異檢測得到的基因變異檢測結果為16個基因中ar基因發生擴增、foxa1發生錯義突變、brca2發生無義突變,剩餘13個基因未發生變異。那麼基因的二元向量為(ar=1,tp53=0,rb1=0,foxa1=1,spop=0,pi3k=0,ddr=1),帶入模型進行預測,分數為0.79098,高於閾值0.42141,則認為此患者可能從治療中獲益且預後較好。
[0095]
(7)在驗證集中患者的pcars評分與6個月內進展關係的roc曲線如圖2所示,該曲線上的點橫軸和縱軸分別代表模型預測的結果在該點截斷值下對應的靈敏度和特異度。曲線下面積auc(area under curve)為0.934,95%置信區間為0.882~0.9858。auc的計算方法同時考慮了分類器對於正例和負例的分類能力,auc值越接近於1模型性能越好,可以看出pcars模型性能的優異。
[0096]
(8)使用約登指數即模型靈敏度與特異度加和最大值的點作為pcars的閾值0.42141,以此閾值劃分患者pcars得分的高低。患者的pcars分組做生存分析,如圖3所示可以看出pcars高的組再次被印證進展快、進展時間短,再次說明pcars模型的合理性。
[0097]
(9)psa(前列腺特異抗原)下降是各期前列腺癌治療療效評估的重要指標,psa相比基線下降超過50%是常用的治療有效標準。pcars的分組和psa治療後下降的關係如圖4所示,可以看出psa上升或下降不足50%的患者富集pcars高風險組人群。pcars高風險組與低風險組psa下降比例的均值分別為64.43%、-65.76%,wilcox秩和檢驗的p值小於2.2e-16。這一結果說明pcars模型可以關聯治療的療效。
[0098]
(10)至此,pcars評分模型在轉移性激素抵抗型前列腺癌患者中多角度均能有效地進行預後評估。且模型評分區分預測多組的治療的療效。pcars得分大於0.42141為高風險組,否則為低風險組。pcars高風險組不易從治療中獲益且進展風險更高。