外顯子組(Exome)是一個(gè)物種基因組中全部外顯子(Exon)區(qū)域的總和,該區(qū)域包含著合成蛋白質(zhì)所需要的信息,涵蓋了與個(gè)體表型相關(guān)的大部分的功能性變異。外顯子組測(cè)序&目標(biāo)區(qū)域測(cè)序是指利用特制的探針對(duì)感興趣的蛋白編碼區(qū)域DNA或某段特定序列進(jìn)行富集,隨后通過高通量測(cè)序技術(shù)對(duì)該目標(biāo)區(qū)域進(jìn)行深度測(cè)序,發(fā)現(xiàn)特定遺傳信息,極大提高了基因組中外顯子&目標(biāo)區(qū)域的研究效率,顯著降低了研究成本。該技術(shù)可用于鑒定和研究孟德爾疾病,復(fù)雜疾病如癌癥、糖尿病、肥胖癥等的致病基因和易感基因,進(jìn)行群體研究,如人類罕見遺傳變異,腫瘤突變基因研究等,幫助研究人員更好地解釋這些疑難雜癥的致病機(jī)理。
高捕獲效率:采用捕獲效率更優(yōu)異的Agilent Human SureSelect V6 kit(58M)進(jìn)行外顯子組捕獲。
可靠的基因突變鑒定方案:采用不同的針對(duì)性方案進(jìn)行遺傳病與腫瘤突變基因的可靠鑒定。
權(quán)威的突變鑒定軟件:采用權(quán)威的GATK,muTect,VarScan2等軟件更準(zhǔn)確鑒定突變。
人的細(xì)胞,組織,全血,總DNA等
建議總DNA起始量:5 μg,最低1 μg,濃度≥50 ng/μL(Qubit定量)
A:基因組拷貝數(shù)變異是基因組變異的一種形式,通常使基因組中大片段的DNA形成非正常的拷貝數(shù)量。例如人類正常染色體拷貝數(shù)是2,有些染色體區(qū)域拷貝數(shù)變成1或3,這樣,該區(qū)域發(fā)生拷貝數(shù)缺失或增加,位于該區(qū)域內(nèi)的基因表達(dá)量也會(huì)受到影響。如果把一條染色體分成A-B-C-D四個(gè)區(qū)域,則A-B-C-C-D/A-C-B-C-D/A-C-C-B-C-D/A-B-D分別發(fā)生了C區(qū)域的擴(kuò)增及缺失,擴(kuò)增的位置可以是連續(xù)擴(kuò)增如A-B-C-C-D也可以是在其他位置的擴(kuò)增,如A-C-B-C-D。
A:相對(duì)于遺傳病而言,腫瘤組織樣品中突變位點(diǎn)的等位基因頻率較低,一方面由于腫瘤細(xì)胞在腫瘤組織中的占比偏低,另一方面則由于癌癥發(fā)展后期產(chǎn)生的突變僅存在于極少量的腫瘤細(xì)胞中,采用高深度測(cè)序可以盡可能全面的檢測(cè)到與癌癥發(fā)生發(fā)展相關(guān)的變異。通常推薦的外顯子測(cè)序深度為,癌組織大于150x,癌旁組織/血液大于50x。
A:建議有效測(cè)序深度在100x以上。有文獻(xiàn)顯示外顯子組測(cè)序深度會(huì)影響變異檢出率,隨著測(cè)序深度的升高,變異檢出率增大,且達(dá)到一定深度時(shí),變異檢出達(dá)到平穩(wěn)狀態(tài)。
心肌梗塞(Myocardial infarction,MI)是一種在全世界范圍內(nèi)致人死亡的常見原因,表現(xiàn)為一種復(fù)雜的遺傳模式。當(dāng)MI發(fā)生于人生早期(男性≤50歲發(fā)病,女性≤60歲發(fā)病),遺傳因素是主要的風(fēng)險(xiǎn)因素。之前的研究發(fā)現(xiàn),LDL(low-density lipoprotein)基因上的罕見變異增加單個(gè)家庭中的成員發(fā)生MI風(fēng)險(xiǎn),而其常見變異與人群中的MI風(fēng)險(xiǎn)相關(guān)。該研究關(guān)注LDL基因上的罕見變異是否會(huì)增加人群在早期發(fā)生MI的風(fēng)險(xiǎn)。
研究人員通過結(jié)合外顯子組測(cè)序、基因芯片、靶向測(cè)序在大量疾病和對(duì)照樣本的篩選與MI相關(guān)的罕見變異(需要至少10000樣本量才能達(dá)到80%的統(tǒng)計(jì)功效)。研究人員再對(duì)篩選到的罕見變異(MAF<1%)進(jìn)行分組,包括Nonsynonymous、Deleterious(PolyPhen)、Deleterious(broad)、Deleterious(strict)和Disruptive組,采用Burden檢驗(yàn)法對(duì)這些罕見變異集合進(jìn)行關(guān)聯(lián)性分析找出與MI顯著相關(guān)的罕見變異,最后通過計(jì)算OR值判斷這些罕見變異導(dǎo)致MI的風(fēng)險(xiǎn)。經(jīng)過分析發(fā)現(xiàn)MI患者的2個(gè)基因含有罕見變異的頻率顯著高于正常人。攜帶LDLR(low-density lipoprotein receptor)罕見非同義突變患MI風(fēng)險(xiǎn)比正常人高4.2倍,攜帶LDLR 無義突變患MI的風(fēng)險(xiǎn)高13倍。大約2%的早期MI患者LDLR基因含有罕見致病突變。攜帶APOA5基因罕見非同義突變患MI的風(fēng)險(xiǎn)增加2.2倍。與非攜帶者相比,LDLR突變攜帶者的血漿LDL膽固醇較高,APOA5突變攜帶者的血漿甘油三酯較高??偨Y(jié)其它研究結(jié)果來看,脂蛋白甘油三酯以及LDL膽固醇代謝紊亂會(huì)增加MI患病風(fēng)險(xiǎn)。
圖1 (a)通過對(duì)9793例樣本進(jìn)行測(cè)序發(fā)現(xiàn)位于LDLR的罕見變異(包括MAF<1%的包括無義變異、可變剪切變異、移碼變異)。(b) 在不同罕見變異分組中患者的LDL膽固醇水平。
Do, R., et al., Exome sequencing identifies rare LDLR and APOA5 alleles conferring risk for myocardial infarction. Nature, 2015. 518(7537): p. 102-6.
與基因組比對(duì)(覆蓋度、測(cè)序深度)樣品比對(duì)率是指比對(duì)到參考基因組上的數(shù)據(jù)量占有效測(cè)序數(shù)據(jù)量的比值,反映樣本與參考基因組的相似性。測(cè)序深度是指比對(duì)到參考基因組的堿基總數(shù)占基因組的比值;覆蓋度是指被測(cè)到的該物種基因組堿基總數(shù)占該物種基因組長(zhǎng)度的百分比。
SNP分析SNP全稱Single Nucleotide Polymorphisms,是指在基因組上單個(gè)核苷酸的變異,形成的遺傳標(biāo)記,其數(shù)量很多,多態(tài)性豐富?;蚪M上單 個(gè)核苷酸的變異包括置換,缺失和插入。采用FreeBayes對(duì)各樣品比對(duì) 結(jié)果進(jìn)行個(gè)體SNP的檢測(cè)。
InDel分析InDel (Insertion-Deletion) 是指相對(duì)于參考基因組,樣本中發(fā)生的小片段的插入缺失,該插入缺失可能含一個(gè)或多個(gè)堿基。根據(jù)InDel在基因組中的位置,可以分為編碼區(qū)序列的InDel和非編碼區(qū)序列的InDel。編碼序列中的InDel發(fā)生與編碼蛋白質(zhì)的功能和氨基酸位點(diǎn)在結(jié)構(gòu)和功能上的重要性有關(guān)。采用FreeBayes對(duì)各樣品比對(duì)結(jié)果進(jìn)行個(gè)體InDel的檢測(cè)。