外顯子組(Exome)是一個物種基因組中全部外顯子(Exon)區(qū)域的總和,該區(qū)域包含著合成蛋白質(zhì)所需要的信息,涵蓋了與個體表型相關(guān)的大部分的功能性變異。外顯子組測序&目標(biāo)區(qū)域測序是指利用特制的探針對感興趣的蛋白編碼區(qū)域DNA或某段特定序列進(jìn)行富集,隨后通過高通量測序技術(shù)對該目標(biāo)區(qū)域進(jìn)行深度測序,發(fā)現(xiàn)特定遺傳信息,極大提高了基因組中外顯子&目標(biāo)區(qū)域的研究效率,顯著降低了研究成本。該技術(shù)可用于鑒定和研究孟德爾疾病,復(fù)雜疾病如癌癥、糖尿病、肥胖癥等的致病基因和易感基因,進(jìn)行群體研究,如人類罕見遺傳變異,腫瘤突變基因研究等,幫助研究人員更好地解釋這些疑難雜癥的致病機理。
高捕獲效率:采用捕獲效率更優(yōu)異的Agilent Human SureSelect V6 kit(58M)進(jìn)行外顯子組捕獲。
可靠的基因突變鑒定方案:采用不同的針對性方案進(jìn)行遺傳病與腫瘤突變基因的可靠鑒定。
權(quán)威的突變鑒定軟件:采用權(quán)威的GATK,muTect,VarScan2等軟件更準(zhǔn)確鑒定突變。
人的細(xì)胞,組織,全血,總DNA等
建議總DNA起始量:5 μg,最低1 μg,濃度≥50 ng/μL(Qubit定量)
A:基因組拷貝數(shù)變異是基因組變異的一種形式,通常使基因組中大片段的DNA形成非正常的拷貝數(shù)量。例如人類正常染色體拷貝數(shù)是2,有些染色體區(qū)域拷貝數(shù)變成1或3,這樣,該區(qū)域發(fā)生拷貝數(shù)缺失或增加,位于該區(qū)域內(nèi)的基因表達(dá)量也會受到影響。如果把一條染色體分成A-B-C-D四個區(qū)域,則A-B-C-C-D/A-C-B-C-D/A-C-C-B-C-D/A-B-D分別發(fā)生了C區(qū)域的擴增及缺失,擴增的位置可以是連續(xù)擴增如A-B-C-C-D也可以是在其他位置的擴增,如A-C-B-C-D。
A:相對于遺傳病而言,腫瘤組織樣品中突變位點的等位基因頻率較低,一方面由于腫瘤細(xì)胞在腫瘤組織中的占比偏低,另一方面則由于癌癥發(fā)展后期產(chǎn)生的突變僅存在于極少量的腫瘤細(xì)胞中,采用高深度測序可以盡可能全面的檢測到與癌癥發(fā)生發(fā)展相關(guān)的變異。通常推薦的外顯子測序深度為,癌組織大于150x,癌旁組織/血液大于50x。
A:建議有效測序深度在100x以上。有文獻(xiàn)顯示外顯子組測序深度會影響變異檢出率,隨著測序深度的升高,變異檢出率增大,且達(dá)到一定深度時,變異檢出達(dá)到平穩(wěn)狀態(tài)。
心肌梗塞(Myocardial infarction,MI)是一種在全世界范圍內(nèi)致人死亡的常見原因,表現(xiàn)為一種復(fù)雜的遺傳模式。當(dāng)MI發(fā)生于人生早期(男性≤50歲發(fā)病,女性≤60歲發(fā)?。?,遺傳因素是主要的風(fēng)險因素。之前的研究發(fā)現(xiàn),LDL(low-density lipoprotein)基因上的罕見變異增加單個家庭中的成員發(fā)生MI風(fēng)險,而其常見變異與人群中的MI風(fēng)險相關(guān)。該研究關(guān)注LDL基因上的罕見變異是否會增加人群在早期發(fā)生MI的風(fēng)險。
研究人員通過結(jié)合外顯子組測序、基因芯片、靶向測序在大量疾病和對照樣本的篩選與MI相關(guān)的罕見變異(需要至少10000樣本量才能達(dá)到80%的統(tǒng)計功效)。研究人員再對篩選到的罕見變異(MAF<1%)進(jìn)行分組,包括Nonsynonymous、Deleterious(PolyPhen)、Deleterious(broad)、Deleterious(strict)和Disruptive組,采用Burden檢驗法對這些罕見變異集合進(jìn)行關(guān)聯(lián)性分析找出與MI顯著相關(guān)的罕見變異,最后通過計算OR值判斷這些罕見變異導(dǎo)致MI的風(fēng)險。經(jīng)過分析發(fā)現(xiàn)MI患者的2個基因含有罕見變異的頻率顯著高于正常人。攜帶LDLR(low-density lipoprotein receptor)罕見非同義突變患MI風(fēng)險比正常人高4.2倍,攜帶LDLR 無義突變患MI的風(fēng)險高13倍。大約2%的早期MI患者LDLR基因含有罕見致病突變。攜帶APOA5基因罕見非同義突變患MI的風(fēng)險增加2.2倍。與非攜帶者相比,LDLR突變攜帶者的血漿LDL膽固醇較高,APOA5突變攜帶者的血漿甘油三酯較高??偨Y(jié)其它研究結(jié)果來看,脂蛋白甘油三酯以及LDL膽固醇代謝紊亂會增加MI患病風(fēng)險。
圖1 (a)通過對9793例樣本進(jìn)行測序發(fā)現(xiàn)位于LDLR的罕見變異(包括MAF<1%的包括無義變異、可變剪切變異、移碼變異)。(b) 在不同罕見變異分組中患者的LDL膽固醇水平。
Do, R., et al., Exome sequencing identifies rare LDLR and APOA5 alleles conferring risk for myocardial infarction. Nature, 2015. 518(7537): p. 102-6.
與基因組比對(覆蓋度、測序深度)樣品比對率是指比對到參考基因組上的數(shù)據(jù)量占有效測序數(shù)據(jù)量的比值,反映樣本與參考基因組的相似性。測序深度是指比對到參考基因組的堿基總數(shù)占基因組的比值;覆蓋度是指被測到的該物種基因組堿基總數(shù)占該物種基因組長度的百分比。
SNP分析SNP全稱Single Nucleotide Polymorphisms,是指在基因組上單個核苷酸的變異,形成的遺傳標(biāo)記,其數(shù)量很多,多態(tài)性豐富?;蚪M上單 個核苷酸的變異包括置換,缺失和插入。采用FreeBayes對各樣品比對 結(jié)果進(jìn)行個體SNP的檢測。
InDel分析InDel (Insertion-Deletion) 是指相對于參考基因組,樣本中發(fā)生的小片段的插入缺失,該插入缺失可能含一個或多個堿基。根據(jù)InDel在基因組中的位置,可以分為編碼區(qū)序列的InDel和非編碼區(qū)序列的InDel。編碼序列中的InDel發(fā)生與編碼蛋白質(zhì)的功能和氨基酸位點在結(jié)構(gòu)和功能上的重要性有關(guān)。采用FreeBayes對各樣品比對結(jié)果進(jìn)行個體InDel的檢測。