第三代測序-單分子實時測序
一, PacBio RS II 測序平臺介紹
二, PacBio RS II 測序系統服務領域
1, 動植物復雜基因組測序
2, 真菌基因組完成圖
3, 細菌基因組完成圖
4, BAC克隆完成圖
5, 從頭組裝(DE Novo Assembly)6,甲基化檢定
三, 天津生物芯片提供的Pacbio RS II系統測序方案
四, PacBio RS II測序系統收樣要求
五, PacBio RS II 測序系統優勢
六, PacBio RS II 測序系統原理
七,Pacbio平臺實際案例
一,PacBio RS II 測序平臺介紹
PacBio RS測序儀系統是太平洋生物技術公司(Pacific Biosciences)基于單分子實時(SMRT)測序技術的第三代測序平臺,可以在一天內完成從樣品制備到測序和讀取序列的全過程。天津生物芯片利用PacBio RS測序儀系統全面解決了二代測序幾大困擾:海量數據拼接難,變異檢測假陽性高,稀有突變被淹沒,高GC含量區域無法跨越,高度片段無法準確測定等,得到高質量,完整的數據信息,為合作伙伴提供優質的基因組組裝,目標區域測序,堿基修飾檢測等技術服務。
二,PacBio RS II 測序系統服務領域
1, 動植物復雜基因組測序
(1)雜合基因組:雜合基因組主要指雜合率高于0.5%的二倍體基因組,如大部分水產類和昆蟲等;
(2)高重復基因組:主要指重復序列比例高于50%的二倍體基因組,大部分林木;
(3)超大基因組:基因組大小大于3G,甚至是10G以上的物種,如兩棲類,部分林木;
(4)多倍體基因組:如四倍體、六倍體植物等。
圖1 主要技術策略示意圖
2, 真菌基因組完成圖
(1) 適用于所有真菌菌株;
(2) 尤其適合超高GC/超低GC真菌;
(3) 其它用傳統方法測序比較困難真菌;
(4) 真菌基因組草圖或精細圖補洞。
3, 細菌基因組完成圖
(1) 普通細菌快速完成圖構建;
(2) 尤其適合超高GC/超低GC細菌;
(3) 其它用傳統方法測序比較困難細菌菌株
通過采用第三代測序技術,直接進行細菌基因組的完成圖繪制。
4, BAC克隆完成圖
通過PacBio RS平臺進行單分子實時測序,可以快速得到超長讀長。再加大測序深度,PacBio序列可以產生非常均一覆蓋度,在大部分目標區域內,可以接近100%的覆蓋度。
這種方式對于有超高GC含量、超低堿基復雜度等BAC克隆非常具有優勢。根據PacBio公司提供的Poster,由1Pacific Biosciences公司和University of Washington, Seattle對人類基因組一個約1.6Mb的片段,總共8個BAC克隆進行了PacBio測序,對比了Illmina測序,總體上得到了非常好的效果。(見下圖)
5, 從頭組裝(DE Novo Assembly)
該平臺可以用PacBio數據獨立完成微生物基因組的完整拼接,也可以將PacBio長讀長數據和二代測序短讀長數據進行混合拼接完成基因組。
6,甲基化檢定
SMRT技術采用的是對DNA聚合酶的工作狀態進行實時監測的方法。DNA聚合酶催化熒光標記的核苷酸摻入到互補的核酸鏈中。核苷酸的摻入被檢測成熒光脈沖,依據其顏色鑒定出核苷酸。當聚合酶切斷連接在核苷酸末端的熒光基團時,脈沖終止。熒光脈沖的到達時間和持續時間產生了關于聚合酶動力學的信息,從而允許直接檢測DNA模板鏈中的修飾核苷酸,包括N6-甲基腺嘌呤、5-甲基胞嘧啶和5-羥甲基胞嘧啶。
三,天津生物芯片提供的Pacbio RS II系統測序方案
PACBIO RS 系統可提供多種SMRT測序方案,如標準測序、環形比對測序、頻閃測序,每種方法都利用了長片段讀取的優勢并結合SMRT bell模板形式(模板處理后形成的一個類似啞鈴的結構)和單DNA 聚合酶原理。
1)標準測序:從插入片段的一端測到另一端,只測一次。適合插入片段在 1-6Kb間。主要應用于再測序和重頭測序。
2)環形比對測序:從插入片段的一端測到另一端后,由于模板是啞鈴狀結構的,因此,繼續測序將得到互補鏈的序列信息,從而可通過對插入片段的反復測序來獲得高準確度的單分子測序結果。適合插入片段在 250-500bp。主要用于發現和確定稀有變異。
3)頻閃測序:由于激光連續照射會對 DNA聚合酶活性造成一定影響,因此,可以通過將激光器按照一定間隔打開和關閉,獲得相對標準測序來說更長時間的聚合酶活性。這樣可獲得一系列分散的讀取序列從而增加對超長插入片段的物理覆蓋率。適合長度高達 10K的插入片段。主要用于結構變異的鑒定或者對復雜重復區域的拼接。
在每一種測序方案中,用戶都可以調整參數,適合多種應用和項目類型。這種靈活性也提供了分多個步驟解決一個問題的能力。
四, PacBio RS II測序系統收樣要求
1, 未經強酸或強堿處理,未進行PCR擴增的高純度全基因組DNA;
2, 基因組DNA不能有RNA或蛋白污染,電泳檢測不能有彌散條帶,要求提供電泳圖結果;
3, 用于技術服務的基因組DNA的總量大于30微克;
五,PacBio RS II 測序系統優勢
采用PacBio RS 平臺,進行單分子實時測序(single molecule, real-time SMRT)主要技術優勢有:
1、超長的測序讀長:平均測序讀長能達到3,000至5,000堿基,最長的序列能達到20,000堿基;
2、極端的準確率:對基因組組裝和基因組變異檢測,可以最多達到99.999%的準確率;選用特殊測序模式,測序準確率可以在達到單個分子99%準確率的條件下,讀長超過經典的Sanger測序法;
3、極度的敏感性:可以檢測頻率在0.1%的 minor variants;
4、直接檢測廣泛的堿基修飾:除了5-methylcytosine修飾以外, 還可以檢測N6-methyladenine, N4-methylcytosine, DNA氧化損傷 以及其它堿基的修飾.
5、最小的GC偏向性(GC bias):在極端高GC和極端低GC區域,可以輕松測定,從而保證序列的均勻覆蓋度;
6、無PCR擴增偏向性:樣本不需要進行PCR擴增,避免了覆蓋度不均一和PCR artifacts.
六,PacBio RS II 測序系統原理
PacBio RS測序儀系統的關鍵優勢是能夠對單個DNA(脫氧核糖核酸)分子進行測序,而目前市場上的主流測序儀只能對分子群體進行平均測序。單分子測序能對DNA中罕見的序列變異進行分析,也不需要在測序之前對DNA樣本進行放大,因為放大過程可能引發錯誤,導致對某個DNA序列檢測失敗。其工作原理是用一種聚合酶將DNA的復制限制在一個微小的間隙中,給各種堿基加上熒光示蹤標記,當堿基合成DNA鏈時,這些熒光標記就會發出不同顏色的閃光,根據閃光顏色就可識別出不同的堿基。
七,Pacbio平臺實際案例
利用PacBio平臺,我們針對分離自土壤的GC含量的高達70%的細菌進行了基因組完成圖測序,僅進行用了2個cell的測序,獲得超過900Mb的測序數據,實現該菌基因組100X以上測序覆蓋。通過PacBio數據De novo拼接獲得該菌的基因組完成圖序列;隨后我們利用Illumina平臺進行了位點校正,最終獲得高準確性的基因組完成圖。