8012了,高通量測序早已非常普遍,走在生命科學(xué)前沿的研究者們幾乎都在談?wù)?/span>Single-Cell Sequencing對于整個(gè)生命科學(xué)研究的意義以及價(jià)值。無論是腫瘤、發(fā)育、神經(jīng)科學(xué),還是血液免疫或者其他領(lǐng)域,生物學(xué)研究似乎進(jìn)入了一個(gè)新的時(shí)代——單細(xì)胞時(shí)代(Single Cell Era),我們的視野越來越精準(zhǔn),從一塊組織轉(zhuǎn)為一塊組織中的每一個(gè)細(xì)胞。就比如,在乳腺癌中,Single-Cell Seq揭示了三陰性乳腺癌患者受到化療后,部分患者反而生存時(shí)間縮短,究其原因,是因?yàn)槟[瘤異質(zhì)性引起的耐藥克隆的存在。
Kim C, Gao R, Sei E, et al. Cell, 2018, 173(4): 879-893. e13.
目前在神經(jīng)膠質(zhì)瘤、頭頸部癌等、多種腫瘤研究中,單細(xì)胞測序都有廣泛的應(yīng)用,涉及腫瘤異質(zhì)性、耐藥、微環(huán)境等各方面的研究,比如下面這篇研究頭頸鱗癌的EMT效應(yīng)的異質(zhì)性的文章。
Puram S V, Tirosh I, Parikh A S, et al. Cell, 2017, 171(7): 1611-1624. e24.
說了這么多關(guān)于Single-Cell測序的應(yīng)用情況,可能很多人還對于Single Cell是什么,它的準(zhǔn)確定義是什么不是特別清楚,可能也會疑惑它和普通的轉(zhuǎn)錄組測序又有什么區(qū)別呢?能得到什么不一樣的結(jié)果呢?也可能會有朋友說,我連PCR產(chǎn)物都擴(kuò)不出來的單細(xì)胞樣本,究竟是如何單個(gè)獲得的呢?這里就簡單給大家說說。
Single Cell測序技術(shù),即利用優(yōu)化后的高通量測序技術(shù)(NGS,Next Generation Sequencing)分析每一個(gè)單個(gè)細(xì)胞的序列信息,從而更高分辨率地揭示細(xì)胞間的細(xì)胞差異以及其在微環(huán)境中的功能情況。
So Why Single Cell?有必要做的這么復(fù)雜么?真的有必要以一個(gè)細(xì)胞為單位進(jìn)行研究么?這里就需要我們從Bulk RNA-Seq和Single Cell RNA-Seq的結(jié)果差異的角度出發(fā)說一些故事了。
眾所周知,任何一個(gè)組織實(shí)際上都是一個(gè)個(gè)細(xì)胞組成的,我們進(jìn)行的所謂Bulk RNA Seq,也就是我們一直說的普通轉(zhuǎn)錄組測序就是基于這個(gè)組織塊的所有的RNA的基因表達(dá)。我們一直用這個(gè)整體的基因表達(dá)來代表這個(gè)組織塊的基因表達(dá),然而從已有的免疫學(xué)、發(fā)育學(xué)以及神經(jīng)學(xué)的研究中,都發(fā)現(xiàn),在一個(gè)組織或者細(xì)胞簇中會存在不同類型的細(xì)胞,它們的基因表達(dá)以及功能也是各不相同的,這就是我們所說的細(xì)胞間異質(zhì)性。就以免疫細(xì)胞為例,我們會發(fā)現(xiàn)里面有T細(xì)胞、B細(xì)胞、巨噬細(xì)胞、嗜酸粒細(xì)胞、自然殺傷細(xì)胞等等,并且T細(xì)胞中還存在T-Reg、T-Na?ve、T-Active等細(xì)胞,而且這些T細(xì)胞上連接的TCR也是各不相同的,這其中存在著錯(cuò)綜復(fù)雜的分類。然而這還只是血細(xì)胞中的情況,胚胎發(fā)育、大腦不同腦區(qū)神經(jīng)發(fā)育等過程中的細(xì)胞轉(zhuǎn)變更是令人難以想象??梢赃@么說,隨著我們對于細(xì)胞的細(xì)分,很多我們曾經(jīng)在教科書上見過的研究結(jié)果已經(jīng)不再是金標(biāo)準(zhǔn)了。
正是在這個(gè)時(shí)代,衍生出了一種替代技術(shù),我們稱之為微量細(xì)胞測序技術(shù),研究者基于T細(xì)胞、B細(xì)胞等這些細(xì)胞的表面抗原,采用FACS技術(shù)或者MACS技術(shù)進(jìn)行捕獲后,將細(xì)胞數(shù)量極微量的樣本的RNA,采用擴(kuò)增技術(shù)擴(kuò)增放大后進(jìn)行測序。這個(gè)技術(shù)一定程度上解決微量細(xì)胞檢測的困難,但是仍然有非常多的問題,比如PCR會產(chǎn)生PCR bias,而這個(gè)問題在ctDNA檢測中也很早就被觀察到了。
為了解決PCR bias干擾基因表達(dá)的問題,unique molecular identifier (UMI)技術(shù)應(yīng)運(yùn)而生。主要原理是擴(kuò)增前每一個(gè)轉(zhuǎn)錄本序列在添加一段獨(dú)有的隨機(jī)序列,長度為6-10個(gè)bp,以此來為一條轉(zhuǎn)錄本進(jìn)行命名。一條UMI下的一條對應(yīng)序列,不管如何進(jìn)行PCR,,不論擴(kuò)增多少次,都只計(jì)算一次。隨著這類概念的提出,可測單細(xì)胞數(shù)量在2014年-2016年之間呈現(xiàn)指數(shù)級增長,單細(xì)胞分選測序技術(shù)也正式進(jìn)入了黃金發(fā)展階段。
隨著MARS-Seq,CytoSeq(后續(xù)發(fā)展為BD Rhapsody®技術(shù))以及Drop-Seq(后續(xù)發(fā)展為10X Genomics®技術(shù))的出現(xiàn),人類正式可以對于一個(gè)組織或者大量細(xì)胞樣本中的細(xì)胞進(jìn)行單個(gè)測定了,進(jìn)入了104的時(shí)代。
隨著單細(xì)胞測序技術(shù)的深入應(yīng)用,它的應(yīng)用從細(xì)胞類樣本,開始轉(zhuǎn)向組織類樣本,從PBMC這類早期通過FACS流式分選技術(shù)/MACS磁珠分選技術(shù)即可獲得分類的組織樣本,轉(zhuǎn)向Solid Tumor Tissue這類固態(tài)的具有大量基質(zhì)細(xì)胞和混合細(xì)胞,并且存在細(xì)胞間連接的樣本,這時(shí)候,單細(xì)胞測序開始遇到數(shù)不清的困難和瓶頸。
實(shí)驗(yàn)過程上來說,也是障礙重重。首先如何將組織解離為細(xì)胞個(gè)體?不同組織的條件完全不同,膠原酶I-V,木瓜蛋白酶,根據(jù)不同組織類型,處理時(shí)間完全不同。其次,如何將組織處理完畢后,保證細(xì)胞大部分存活?死細(xì)胞比率直接決定測序和分析結(jié)果的成功與否。那么又有哪些策略可以快速過濾死細(xì)胞?如何去除無意義的紅細(xì)胞?去紅細(xì)胞是否會導(dǎo)致基因表達(dá)變化?如何保證采樣時(shí)間一致?凍存細(xì)胞是否可以使用?否則無法做前瞻性樣本收集,只能做回顧性樣本收集了。
數(shù)據(jù)分析上來說,不同的技術(shù)不同的barcode設(shè)計(jì)完全不同,如何兼容?如何快速分析150Gb的測序數(shù)據(jù)?如何準(zhǔn)確區(qū)分UMI定量?如何去除死細(xì)胞?如何去除雙細(xì)胞?如何去除批次效應(yīng)?是否需要添加Spike-In?采用什么策略進(jìn)行樣本標(biāo)準(zhǔn)化?如何準(zhǔn)確獲得細(xì)胞數(shù)量?如何評估Hooping?問題一籮筐?。?/span>
而更關(guān)鍵的從實(shí)驗(yàn)設(shè)計(jì)上來說,到底應(yīng)該如何設(shè)計(jì)樣本的分組,如何比較差異,如何找到真正具有生物學(xué)意義的問題,也是迫在眉睫的挑戰(zhàn)。隨著單細(xì)胞技術(shù)的持續(xù)發(fā)展,多組學(xué)、單細(xì)胞轉(zhuǎn)錄組、基因組、CNV、甲基化、表面組都會成為可能,與臨床數(shù)據(jù)間究竟該如何討論?之前的Bulk RNA Sequencing數(shù)據(jù)是從此可以進(jìn)行埋葬,還是有其可以應(yīng)用的方式和策略?
所以,哪怕以今天的角度來看,Single-Cell技術(shù)都還不是一個(gè)完全成熟的技術(shù),而是一個(gè)飛速發(fā)展的技術(shù),有別于lncRNA、circRNA這類新的研究方向的誕生,Single Cell可以說是對于現(xiàn)有樣本和理論的一場新的革新,從宏觀進(jìn)入微觀,如同物理學(xué)以及化學(xué)一樣,必將帶來顛覆性新的結(jié)論,而我們每一個(gè)人都是這個(gè)潛在的嶄新時(shí)代的見證者和親歷者。烈冰也會陸續(xù)分享一些單細(xì)胞測序有關(guān)實(shí)驗(yàn)和數(shù)據(jù)分析的關(guān)鍵技術(shù),歡迎關(guān)注哦^^