全面的基因組覆蓋范圍:檢測>853,307個CpG位點,全面覆蓋CpG島、啟動子、編碼區(qū)及增強子
高質量的數(shù)據(jù):沿用了450k芯片的Infinium技術,同時采用Infinium I及II探針設計,使檢測范圍最大化
分辨率高:單堿基分辨率,可以直接檢測到發(fā)生甲基化的準確位點
可重復性高:自身技術重復間的相關性以及與450K相同探針間的相關性R2 >0.98
起始模板量低: 僅需 250ng,大大節(jié)約了樣品量
適用于FFPE樣品
樣本類型
動、植物組織、細胞等
每個樣品總量不少于2ug,最低濃度不低于50ng/ul,OD 260/280值應在1.7~1.9 之間,
基因組完整、無降解、無RNA污染。
A:進入亞硫酸氫鹽轉化,手動方案至少需要500 ng,自動化方案至少需要1000 ng。
A:這是一種雙色測定。對于基于Infinium I Assay設計的Infinium HumanMethyation27 BeadChip測定,摻入的顏色取決于被查詢的CpG基因座之前的堿基。這可以是綠色或紅色。Infinium HumanMethylation450 BeadChip測定包括Infinium I和Infinium II研究設計。在后一種情況下,從探針序列的3'末端(其是查詢堿基上游的一個堿基)的單個堿基延伸將導致紅色或綠色信號,這取決于查詢位點是否未甲基化或甲基化。
為了探索I期非小細胞肺癌(NSCLC)可利用的生物標志物,本案例采用 Illumina 450K甲基化芯片對444例非小細胞肺癌樣本進行研究,發(fā)現(xiàn)了10000個甲基化差異位點?;谶@些位點進行非監(jiān)督層次聚類分析,可以將患者明顯區(qū)分為預后好壞兩類。
圖1. 非小細胞肺癌樣本的非監(jiān)督層次聚類分析
本案例利用Illumina 450K甲基化芯片研究了多發(fā)性硬化影響的腦組織與正常腦組織的DNA甲基化差異,結果發(fā)現(xiàn)甲基化差異細微,但是差異是普遍存在的并且具有可重復性。通過RNA-seq研究發(fā)現(xiàn),多發(fā)性硬化影響的腦組織相比正常腦組織,調節(jié)少突膠質細胞存活的基因,如BCL2L2和NDRG1是高甲基化的并且基因表達水平較低;而與蛋白水解加工相關的基因,如LGMN和CTSZ則是低甲基化并且基因表達水平較高。這些結果表明基因甲基化程度的改變會影響腦組織對于損傷的敏感性。
圖2. mRNA表達水平與啟動子甲基化相關性分析
[1] Sandoval J, Mendez-Gonzalez J, Nadal E, et al. A Prognostic DNA Methylation Signature for Stage I Non–Small-Cell Lung Cancer. Journal of Clinical Oncology, 2013; 31(32): 4140-4147.
[2] Huynh J, Garg P, Thin T, et al. Epigenome-wide differences in pathology-free regions of multiple sclerosis- affected brains. Nature neuroscience, 2014; 17(1): 121-130.
在全世界分范圍內,每年因肝癌死亡的病例超過50萬人,是主要的因癌死亡病因之一。在過去的十年中,隨著影像學的進步以及健康體檢的普及,越來越多的肝癌病人在患病早期被發(fā)現(xiàn)。但由于肝臟捐贈者的短缺,外科肝臟切除術仍然是治療早期肝癌病人的最主要方法。本研究建立了一種預測早期肝癌病人術后復發(fā)的模型。
1. CpG位點選擇
研究者首先采用焦磷酸測序技術驗證了450k芯片數(shù)據(jù)的再現(xiàn)性。通過分析66例病人的FFPE樣本和新鮮冷凍組織樣本發(fā)現(xiàn),隨機選擇的兩個CpG位點甲基化水平呈現(xiàn)出高度的一致性。采用△β>0.15,F(xiàn)DR<0.01和p value<0.01這一標準,過濾450K芯片結果,得到2550個差異CpG位點。隨后,研究者為了區(qū)分高風險和低風險的病人,采用LASSO和SVM-RFE算法分別得到了30個差異最顯著的CpG位點。
2. 探究可預測的標簽
通過比較兩種算法得到的CpG位點,發(fā)現(xiàn)有14種是同時被鑒定出的,46種是不同的。通過分析46種不同CpG位點,把66例樣本分成復發(fā)和不復發(fā)兩個亞類。研究者隨后采用Cox回歸模型在訓練組中進一步縮小了E-HCC病人的甲基化檢測位點。結果發(fā)現(xiàn),cg20657849(SCAND3), cg19406367(SGIP1), 和 cg19931348(PI3)三個甲基化位點與E-HCC病人復發(fā)高度相關。
隨后研究者采用焦磷酸測序技術,分別在訓練組和鑒定組中量化這一發(fā)現(xiàn)。為了更好的研究這三個CpG位點用來預測E-HCC復發(fā)的準確性,在訓練組中設定了一種危險系數(shù)評分。(risk score = (0.104 ×SGIP1甲基化水平) + (-1.125 ×SCAND3甲基化水平) + (-0.085 × PI3甲基化水平))研究發(fā)現(xiàn),-0.401為risk score閾值。
3. 證實這一標簽
為了證實這一模型的穩(wěn)定性,研究者分別在一組內部樣本和兩組外部樣本進行了檢測。在內部樣本中,該模型成功的分類了68例復發(fā)高風險病人,73例低復發(fā)風險病人。在外部樣本中,同樣成功分類了高風險和低風險病人。ROC分析發(fā)現(xiàn),MSEH預測早期肝癌病人復發(fā)比三個CpG位點單獨檢測更有效。
4. 建立可預測的諾模圖
為了建立臨床上適用的用來預測個體復發(fā)的模型,綜合考慮了協(xié)變量后,研究者用諾模圖建立了可以用來預測的模型?;赗FS的多變量分析,研究者生成了一個諾模圖預測患者的5年生存率,通過三個校正點的檢測均得到理想結果。
本文通過分析早期肝癌患者甲基化芯片結果,得到三個與早期肝癌患者復發(fā)相關的CpG位點,并通過訓練組和驗證組優(yōu)化了這一預測模式。最終,研究者建立了一種諾模圖,用來預測早期肝癌患者的術后復發(fā)風險。
案例四:甲基化研究揭示鼻咽癌治療新靶點
在中國華南地區(qū),鼻咽癌有較高的發(fā)病率。目前,鼻咽癌病人的治療方案主要取決于病人的TNM分期。但是,約30%的鼻咽癌
甲基化高級分析A. 甲基化與表達譜相關性熱圖,此類型的圖也可展示其他不同組學的相關性。B. 基因組、轉錄組與甲基化組變異通路圖,可在同一張圖上展示通路中的基因組、轉錄組與甲基化組等不同組學上的變異,以及多組學的變異對通路的影響。C. 關鍵基因的多組學相關性圖,以相關性圖的形式,同時展示關鍵基因在基因組、轉錄組與甲基化等多組學層面上的相關性,共變異或甲基化狀態(tài)。
HYBRIDIZATION 雜交圖中橫軸是log2(信號值),縱軸是樣本名稱。紅色熒光表示未甲基化位點的log2(信號值),綠色熒光表示甲基化位點的log2(信號值)。結論:紅色熒光和綠色熒光的差值一般是2個數(shù)量級。陽性參照中綠色探針產生的log2(信號值) >12,標記實驗成功。
樣本質控圖橫軸是log2(甲基化中位數(shù)值), 縱軸是(非甲基化中位數(shù)值),每個樣本的整體甲基化程度一個圓點表示,其在虛線右上角分布則表示達到質控的標準。結論: 本研究全部樣本達到質控的標準。