背景簡(jiǎn)介
細(xì)菌基因組重測(cè)序是指對(duì)基因組序列已知的細(xì)菌個(gè)體進(jìn)行基因組測(cè)序,通過(guò)與已知的參考基因組比對(duì),獲得該細(xì)菌個(gè)體或者群體的差異的測(cè)序方法,這些差異主要包括SNP,InDel和SV。目前微生物基因組重測(cè)序被廣泛應(yīng)用于病原微生物的檢測(cè)及鑒定、病原菌演變及起源、致病菌種群結(jié)構(gòu)及種群結(jié)構(gòu)的進(jìn)化等眾多方面。
技術(shù)優(yōu)勢(shì)
細(xì)菌基因組重測(cè)序能夠發(fā)現(xiàn)未知的遺傳變異信息。
憑借二代測(cè)序,細(xì)菌基因組重測(cè)序獲得數(shù)據(jù)通量更高,速度更快,成本更低。
細(xì)菌基因組重測(cè)序可以更全面的檢測(cè)SNP、InDel、SV等多種遺傳變異類型。
技術(shù)路線
分析內(nèi)容
樣本類型
細(xì)菌菌體,環(huán)境樣品,總DNA等
建議總DNA起始量:≥5 μg,最低起始量:0.5ug,濃度≥30 ng/μl(Qubit定量)
Q1:細(xì)菌基因組完成圖是否可以組裝出質(zhì)粒?
A:細(xì)菌細(xì)胞內(nèi)一般會(huì)存在部分質(zhì)粒,細(xì)菌基因組完成圖可以組裝出部分質(zhì)粒信息,但是由于建庫(kù)的長(zhǎng)度以及質(zhì)粒的數(shù)量限制,不保證完全組裝出所有質(zhì)粒。
Q 2:細(xì)菌基因組測(cè)序中比較基因組分析是什么?
A:細(xì)菌基因組比較基因組分析,主要是分析有親緣關(guān)系的細(xì)菌基因之間的差別,通過(guò)比較基因組分析親緣遠(yuǎn)近關(guān)系,特有和共有基因以及共線性分析等,找到差異基因,對(duì)差異基因進(jìn)行功能注釋,解析近緣關(guān)系細(xì)菌間生理或形態(tài)差別的原因。
Q3:在重測(cè)序中,為什么只能得到插入/缺失了堿基的數(shù)目,卻得不到插入/缺失的具體位置和序列信息?如何能夠獲得具體的序列信息呢?
A:在重測(cè)序中,SV檢測(cè)分析是可以得到樣本相對(duì)于參考基因組的一個(gè)大概的DEL序列的。由于重測(cè)序中只是對(duì)于文庫(kù)片段的兩端進(jìn)行測(cè)序,所以中間的INS序列暫時(shí)無(wú)法檢測(cè)到;理論上,可以對(duì)插入位置附件設(shè)計(jì)引物,通過(guò)PCR擴(kuò)增出具體的序列,此外,也可以通過(guò)局部組裝附近的reads來(lái)獲取中間的序列信息(主要取決于局部組裝的效果)。
腸外致病性大腸桿菌的大規(guī)?;蚪M測(cè)序
研究背景
大腸桿菌(E. coli)為埃希氏菌屬(Escherichia)代表菌。一般多為條件致病菌,某些血清型菌株的致病性強(qiáng),嚴(yán)重腹瀉和敗血癥,統(tǒng)稱致病性大腸桿菌。其中,致病性大腸桿菌的抗生素耐藥性,是相關(guān)醫(yī)療實(shí)踐中的一個(gè)重要問(wèn)題。
方法流程
取材:1. 5個(gè)月時(shí)間從277個(gè)病人尿液中分離出288株尿源E.coli ;2. 3年時(shí)間從47名病人血液中分離培養(yǎng)出92株血源E.coli
建庫(kù):構(gòu)建小片段文庫(kù)
測(cè)序:Illumina HiSeq 2000
分析:1. 基因組組裝;2. Core-pan基因分析;3. 全基因組關(guān)聯(lián)分析
研究結(jié)果
1. Core-pan基因分析
通過(guò)Core-pan基因分析發(fā)現(xiàn),ExPEC E.coli具有高度遺傳異質(zhì)性,并區(qū)分為不同種系。不同致病因素及抗生素抗性表型對(duì)應(yīng)人體不同部位的感染性。
2. 致病性研究
高分辨率的分子流行病學(xué)研究顯示,經(jīng)由血液傳播的亞種比例較低,僅占全部亞種的28%。
3. 抗性基因挖掘
全基因組關(guān)聯(lián)分析發(fā)現(xiàn)部分抗生素抗性相關(guān)的基因,并成功驗(yàn)證了部分已知抗性的基因。
研究結(jié)論
本文嘗試將大量高通量數(shù)據(jù)應(yīng)用到醫(yī)療機(jī)構(gòu),并從中尋找到菌種分類、進(jìn)化及抗生素抗性等重要基因信息的獲得途徑,為后續(xù)疾病相關(guān)大規(guī)模微生物全基因組測(cè)序提供了范例。
SNP分析SNP全稱Single Nucleotide Polymorphisms,是指在基因組上單個(gè)核苷酸 的變異,形成的遺傳標(biāo)記,其數(shù)量很多,多態(tài)性豐富。基因組上單個(gè)核 苷酸的變異包括置換,缺失和插入。采用FreeBayes對(duì)各樣品比對(duì)結(jié)果進(jìn)行個(gè)體SNP的檢測(cè)。
InDel分析InDel (Insertion-Deletion) 是指相對(duì)于參考基因組,樣本中發(fā)生的小片段的 插入缺失,該插入缺失可能含一個(gè)或多個(gè)堿基。根據(jù)InDel在基因組中的位 置,可以分為編碼區(qū)序列的InDel和非編碼區(qū)序列的InDel。編碼序列中的 InDel發(fā)生與編碼蛋白質(zhì)的功能和氨基酸位點(diǎn)在結(jié)構(gòu)和功能上的重要性有關(guān)。 采用FreeBayes對(duì)各樣品比對(duì)結(jié)果進(jìn)行個(gè)體InDel的檢測(cè)。
SNP進(jìn)化樹(shù)分析在生物學(xué)中,進(jìn)化分析是指根據(jù)遺傳或者表型的差異研究推斷不同物種或者個(gè)體間的進(jìn)化關(guān)系的一門(mén)學(xué)科。進(jìn)化分析的結(jié)果通常用進(jìn)化樹(shù)的形式展示,在進(jìn)化樹(shù)上每個(gè)結(jié)點(diǎn)代表一個(gè)物種或個(gè)體,那么兩個(gè)結(jié)點(diǎn)之間的最短距離就表示相應(yīng)的兩個(gè)物種之間的差異程度。根據(jù)每個(gè)個(gè)體檢測(cè)到的SNP位點(diǎn),過(guò)濾掉彼此距離較近的SNP位點(diǎn)(<20bp) ,因?yàn)檫@些位點(diǎn)可能是由基因組重組產(chǎn)生,并不能真正反映物種間的進(jìn)化關(guān)系。將每個(gè)個(gè)體非重組的SNP位點(diǎn)堿基串聯(lián)成一條序列,得到個(gè)體多序列比對(duì)的結(jié)果,最后構(gòu)建最大似然進(jìn)化樹(shù)。