背景簡介
細菌基因組重測序是指對基因組序列已知的細菌個體進行基因組測序,通過與已知的參考基因組比對,獲得該細菌個體或者群體的差異的測序方法,這些差異主要包括SNP,InDel和SV。目前微生物基因組重測序被廣泛應用于病原微生物的檢測及鑒定、病原菌演變及起源、致病菌種群結(jié)構及種群結(jié)構的進化等眾多方面。
技術優(yōu)勢
細菌基因組重測序能夠發(fā)現(xiàn)未知的遺傳變異信息。
憑借二代測序,細菌基因組重測序獲得數(shù)據(jù)通量更高,速度更快,成本更低。
細菌基因組重測序可以更全面的檢測SNP、InDel、SV等多種遺傳變異類型。
技術路線
分析內(nèi)容
樣本類型
細菌菌體,環(huán)境樣品,總DNA等
建議總DNA起始量:≥5 μg,最低起始量:0.5ug,濃度≥30 ng/μl(Qubit定量)
Q1:細菌基因組完成圖是否可以組裝出質(zhì)粒?
A:細菌細胞內(nèi)一般會存在部分質(zhì)粒,細菌基因組完成圖可以組裝出部分質(zhì)粒信息,但是由于建庫的長度以及質(zhì)粒的數(shù)量限制,不保證完全組裝出所有質(zhì)粒。
Q 2:細菌基因組測序中比較基因組分析是什么?
A:細菌基因組比較基因組分析,主要是分析有親緣關系的細菌基因之間的差別,通過比較基因組分析親緣遠近關系,特有和共有基因以及共線性分析等,找到差異基因,對差異基因進行功能注釋,解析近緣關系細菌間生理或形態(tài)差別的原因。
Q3:在重測序中,為什么只能得到插入/缺失了堿基的數(shù)目,卻得不到插入/缺失的具體位置和序列信息?如何能夠獲得具體的序列信息呢?
A:在重測序中,SV檢測分析是可以得到樣本相對于參考基因組的一個大概的DEL序列的。由于重測序中只是對于文庫片段的兩端進行測序,所以中間的INS序列暫時無法檢測到;理論上,可以對插入位置附件設計引物,通過PCR擴增出具體的序列,此外,也可以通過局部組裝附近的reads來獲取中間的序列信息(主要取決于局部組裝的效果)。
腸外致病性大腸桿菌的大規(guī)?;蚪M測序
研究背景
大腸桿菌(E. coli)為埃希氏菌屬(Escherichia)代表菌。一般多為條件致病菌,某些血清型菌株的致病性強,嚴重腹瀉和敗血癥,統(tǒng)稱致病性大腸桿菌。其中,致病性大腸桿菌的抗生素耐藥性,是相關醫(yī)療實踐中的一個重要問題。
方法流程
取材:1. 5個月時間從277個病人尿液中分離出288株尿源E.coli ;2. 3年時間從47名病人血液中分離培養(yǎng)出92株血源E.coli
建庫:構建小片段文庫
測序:Illumina HiSeq 2000
分析:1. 基因組組裝;2. Core-pan基因分析;3. 全基因組關聯(lián)分析
研究結(jié)果
1. Core-pan基因分析
通過Core-pan基因分析發(fā)現(xiàn),ExPEC E.coli具有高度遺傳異質(zhì)性,并區(qū)分為不同種系。不同致病因素及抗生素抗性表型對應人體不同部位的感染性。
2. 致病性研究
高分辨率的分子流行病學研究顯示,經(jīng)由血液傳播的亞種比例較低,僅占全部亞種的28%。
3. 抗性基因挖掘
全基因組關聯(lián)分析發(fā)現(xiàn)部分抗生素抗性相關的基因,并成功驗證了部分已知抗性的基因。
研究結(jié)論
本文嘗試將大量高通量數(shù)據(jù)應用到醫(yī)療機構,并從中尋找到菌種分類、進化及抗生素抗性等重要基因信息的獲得途徑,為后續(xù)疾病相關大規(guī)模微生物全基因組測序提供了范例。
SNP分析SNP全稱Single Nucleotide Polymorphisms,是指在基因組上單個核苷酸 的變異,形成的遺傳標記,其數(shù)量很多,多態(tài)性豐富?;蚪M上單個核 苷酸的變異包括置換,缺失和插入。采用FreeBayes對各樣品比對結(jié)果進行個體SNP的檢測。
InDel分析InDel (Insertion-Deletion) 是指相對于參考基因組,樣本中發(fā)生的小片段的 插入缺失,該插入缺失可能含一個或多個堿基。根據(jù)InDel在基因組中的位 置,可以分為編碼區(qū)序列的InDel和非編碼區(qū)序列的InDel。編碼序列中的 InDel發(fā)生與編碼蛋白質(zhì)的功能和氨基酸位點在結(jié)構和功能上的重要性有關。 采用FreeBayes對各樣品比對結(jié)果進行個體InDel的檢測。
SNP進化樹分析在生物學中,進化分析是指根據(jù)遺傳或者表型的差異研究推斷不同物種或者個體間的進化關系的一門學科。進化分析的結(jié)果通常用進化樹的形式展示,在進化樹上每個結(jié)點代表一個物種或個體,那么兩個結(jié)點之間的最短距離就表示相應的兩個物種之間的差異程度。根據(jù)每個個體檢測到的SNP位點,過濾掉彼此距離較近的SNP位點(<20bp) ,因為這些位點可能是由基因組重組產(chǎn)生,并不能真正反映物種間的進化關系。將每個個體非重組的SNP位點堿基串聯(lián)成一條序列,得到個體多序列比對的結(jié)果,最后構建最大似然進化樹。