單細(xì)胞入門-讀一篇scRNA-seq綜述講解:
1.1. 實(shí)驗(yàn)
簡單回顧測序技術(shù)的發(fā)展,從桑格爾發(fā)明雙脫氧末端終止法(一代測序)到人類基因組計(jì)劃歷時(shí)13年耗費(fèi)30億美元,測序一直很貴,直到高通量的邊合成邊測序技術(shù)(二代測序)出現(xiàn)。隨著測序價(jià)格的不斷下降,2009年開發(fā)出了單細(xì)胞轉(zhuǎn)錄組測序方法(湯富酬)。
經(jīng)過8年多時(shí)間的發(fā)展,如今不同的scRNA-seq流程有了大量改進(jìn),它們一般都分為四步:
1. 單細(xì)胞(核)的分離和裂解
2. 反轉(zhuǎn)錄
3. cDNA擴(kuò)增
4. 測序文庫制備
1.1.1. 單細(xì)胞分離的步驟至關(guān)重要
除游離細(xì)胞外的細(xì)胞分離,有兩條路線:
i. 組織切片 - 激光捕獲顯微切割(LCM)或者 膜片鉗(Patch clamp)
ii. 酶法去除細(xì)胞間質(zhì) - 各種微操技術(shù)分選出單個(gè)細(xì)胞(各有優(yōu)劣)
微吸(Micro-pipetting)適用于細(xì)胞量少或比較珍貴的樣品,通量低。
流式細(xì)胞分選(FACS)和微流控(Microfluidic)設(shè)備適用大量可用細(xì)胞,通量高。
● FACS同樣用于篩選特定標(biāo)記的某類細(xì)胞,它可能分出不止一個(gè)細(xì)胞和造成細(xì)胞損傷。
● 微流控更加溫和,用于高度標(biāo)準(zhǔn)化的自動(dòng)化流程,缺點(diǎn)是假定細(xì)胞損失和細(xì)胞大小偏好,目前的商用設(shè)備包括10X Genomics的Fluidigm C1系統(tǒng)和Illumina的Biorad SureCell系統(tǒng)(含ddSEQ細(xì)胞隔離器)。
微管平臺(tái)(Microwell platforms)能夠消除細(xì)胞大小偏好,也可以通過顯微觀察排除分出多個(gè)細(xì)胞的情況,商用設(shè)備有WaferGen的ICELL8單細(xì)胞系統(tǒng)。
多數(shù)單細(xì)胞收集方法都要求樣品是完好的新鮮組織,因?yàn)槲h(huán)境的改變影響正常細(xì)胞過程;酶促反應(yīng)也可能使細(xì)胞產(chǎn)生應(yīng)激,從而改變基因表達(dá)。有一個(gè)辦法來避免這些問題,那就是只收集細(xì)胞核,細(xì)胞核包含未加工的mRNA和很少的mRNA。細(xì)胞核很黏,目前只有FACS能做到這一點(diǎn)。
1.1.2. 反轉(zhuǎn)錄
大部分公開的流程都是使用oligodT引物,可以捕獲到具有多聚結(jié)構(gòu)的mRNA和少部分lncRNA。
SUPeR-seq使用了混合oligodT和六堿基隨機(jī)引物的方法,然而它沒有去除rRNA卻只檢測到很少的rRNA,猜測是沒有把二級(jí)結(jié)構(gòu)打開。
MATQ-seq近期被報(bào)道比Smart-seq2更靈敏,產(chǎn)量更高。它是基于MALBAC引物設(shè)計(jì)的,能做到全基因覆蓋,檢測總RNA。
1.1.3. cDNA擴(kuò)增
反轉(zhuǎn)錄結(jié)束后,有多種策略合成了第二條cDNA鏈
一種是SMART技術(shù)(switching mechanism at 5' end of RNA template)
這個(gè)系列包括Smart-seq,Smart-seq2,STRT,利用轉(zhuǎn)移酶和小鼠白血病病毒反轉(zhuǎn)錄酶來進(jìn)行鏈置換并加上后續(xù)PCR擴(kuò)增的接頭。
PCR是常用的指數(shù)擴(kuò)增技術(shù),很容易因?yàn)镚C含量的差異造成擴(kuò)增偏倚。
另一種就利用了體外轉(zhuǎn)錄的方式(IVT)進(jìn)行線性擴(kuò)增
這個(gè)系列包括CEL-seq,MARS-seq,CEL-seq2,通過將T7啟動(dòng)子連在oligodT引物上,可以在cDNA合成后啟動(dòng)IVT。IVT取消了對(duì)模板置換的需求。
另外,MALBAC-RNA使用準(zhǔn)線性擴(kuò)增,它的引物能生成末端互補(bǔ)的擴(kuò)增子,形成閉環(huán)來防止指數(shù)復(fù)制。
1.1.4. 方法選擇以及測多少細(xì)胞
不同的技術(shù)流程按照cDNA覆蓋大致可以分為兩類:全長(full-length)和基于標(biāo)簽(tag-based)。
全長的方法試圖得到基因體均勻讀長覆蓋并增加匹配序列數(shù),更適合亞型發(fā)現(xiàn)、剪切事件、SNP鑒定等等分析。一大缺陷是建庫通量較低,難以混樣測序。更重要的是,它不能結(jié)合UMIs(unique molecule identifiers)來進(jìn)行數(shù)字量化。有一個(gè)例外,MATQ-seq可以把barcodes和UMIs整合到MALBAC引物上,從而克服這個(gè)缺陷。
基于標(biāo)簽的方法可以繼續(xù)細(xì)分成5'還是3',主要優(yōu)點(diǎn)是能結(jié)合UMIs,可以混合多個(gè)樣品,允許基因水平的定量優(yōu)化。因?yàn)樽x長被限制在序列一端,相對(duì)而言靈敏度較低,大部分僅用于基因表達(dá)定量。
選擇什么方法取決于要回答的生物學(xué)問題。如果是發(fā)現(xiàn)細(xì)胞類型和鑒別組織成分,兩種方法都可以。基于標(biāo)簽的方法可以在反轉(zhuǎn)錄之后把所有樣品混在一起,價(jià)格更便宜規(guī)模可以更大。如果是等位基因表達(dá)、不同亞型的發(fā)現(xiàn),全長的方法更加合適。這些方法中,Smart-seq2在靈敏度和產(chǎn)量上都表現(xiàn)出眾,不過要用到Tn5,比較貴,如果有很多很多的細(xì)胞要測,比如4000個(gè),那么Drop-seq也是很好的選擇。
關(guān)于靈敏度,需要考慮測序深度。這些方法都有一個(gè)共同點(diǎn),當(dāng)一個(gè)樣品測到1M reads之后,靈敏度開始變得比較穩(wěn)定,從1M reads 測到 4.5M reads,靈敏度只略微提升。
需要多少細(xì)胞的數(shù)據(jù)用來分析,取決于細(xì)胞類型的罕見程度。
Nicholas E. Navin提供了一個(gè)計(jì)算公式 P(d) =1-(1-s)^n
P(d):檢出能力(detection power) s:等同于亞克隆頻率(subclonal frequency) n:要測的細(xì)胞數(shù)
如果感興趣的細(xì)胞亞型占比約為1%,需要測250個(gè)細(xì)胞使檢出能力達(dá)到0.9,需要測500個(gè)細(xì)胞使檢出能力達(dá)到1.0。另外也需要做重復(fù)實(shí)驗(yàn)來評(píng)估假陽性率和假陰性率。
需要的細(xì)胞數(shù)和必要的測序深度同樣依賴于感興趣的細(xì)胞與其他細(xì)胞的差異程度,如果這種細(xì)胞有非常獨(dú)特的轉(zhuǎn)錄特征,那么測的細(xì)胞數(shù)少一點(diǎn),測序深度淺一點(diǎn)也是可以的。
1.1.5. scRNA-seq的技術(shù)挑戰(zhàn)
SingleCell的問題:細(xì)胞與細(xì)胞之間有很強(qiáng)的異質(zhì)性。
只有一個(gè)細(xì)胞,初始數(shù)據(jù)量就小,噪音就大。
RNA捕獲效率不穩(wěn)定,文庫制備的隨機(jī)丟失會(huì)制造技術(shù)噪音。
隨機(jī)基因表達(dá),不同的細(xì)胞狀態(tài)細(xì)胞大小細(xì)胞周期會(huì)產(chǎn)生生物噪音。
批次效應(yīng)使高通量的實(shí)驗(yàn)數(shù)據(jù)存在系統(tǒng)誤差。
認(rèn)真規(guī)劃實(shí)驗(yàn)步驟,作多次生物學(xué)重復(fù)可以降低批次效應(yīng),然而生物樣品的遺傳背景是很難通過實(shí)驗(yàn)步驟來控制的。
鑒定批次效應(yīng)的一個(gè)辦法是通過主成分分析(PCA),看細(xì)胞是否會(huì)按照相應(yīng)的起源進(jìn)行分群。
為了解釋技術(shù)操作帶來的誤差,通常加入外源的RNA進(jìn)行質(zhì)控。不同濃度、長度、GC含量的合成RNA可以起到監(jiān)控作用。
但是外源樣品與內(nèi)源RNA的分子特征并不會(huì)完全相同,對(duì)照作用有限。
怎么減少RNA損失,使信息能夠保真是scRNA-seq的關(guān)鍵性挑戰(zhàn),測序結(jié)果仍需要謹(jǐn)慎對(duì)待,建議做功能性驗(yàn)證。
1.2. 應(yīng)用
過去幾年,scRNA-seq已被應(yīng)用于發(fā)現(xiàn)新的細(xì)胞類型,探索動(dòng)態(tài)發(fā)育過程,鑒定基因調(diào)控機(jī)制,揭示隨機(jī)等位基因表達(dá)。
這篇綜述只著重介紹了胚胎植入前發(fā)育和大腦皮層,在這兩個(gè)方向上scRNA-seq有了巨大的概念性發(fā)展。
1.2.1. 胚胎植入前發(fā)育
生命起源于一個(gè)受精卵,受精卵的分化過程受轉(zhuǎn)錄水平調(diào)控形成三個(gè)主要的細(xì)胞譜系。這個(gè)過程里有幾個(gè)長期存在的問題:1. 單個(gè)卵裂球之間是何時(shí)出現(xiàn)差異的?2. 三個(gè)細(xì)胞譜系如何及時(shí)分離?3. 胚胎基因組是何時(shí)激活的?4. 早期的規(guī)范化事件是否存在物種間差異?
scRNA-seq為這些問題的解答提供了新的思路。早先對(duì)小鼠胚胎的早期卵裂球進(jìn)行實(shí)驗(yàn)操作(包括增、減單個(gè)細(xì)胞),都不會(huì)影響到胚胎發(fā)育,表明早期卵裂球會(huì)經(jīng)歷一個(gè)調(diào)節(jié)發(fā)育(受到感應(yīng)信號(hào)可以變成任何細(xì)胞類型)。然而scRNA-seq的結(jié)果顯示,早在四分體時(shí)期,卵裂球間已經(jīng)存在分子不對(duì)稱了。后來通過比較滋養(yǎng)外胚層(TE)和內(nèi)細(xì)胞團(tuán)(ICM)的細(xì)胞命運(yùn),鑒定出Sox21基因在四分體時(shí)期存在穩(wěn)定的異質(zhì)表達(dá),并且影響后代細(xì)胞的分化路線。在植入前發(fā)育的各個(gè)階段,通過scRNA-seq可以得到一個(gè)全過程的基因動(dòng)態(tài)表達(dá)視圖,跨物種數(shù)據(jù)比較發(fā)現(xiàn)人和小鼠的胚胎發(fā)育存在很多的生物學(xué)差異,如胚胎基因激活時(shí)間,細(xì)胞譜系建立時(shí)期,等位基因特異性表達(dá)情況等等。對(duì)人類胚胎細(xì)胞進(jìn)行具體的功能研究比較困難,后面換成了相近的獼猴細(xì)胞。
1.2.2. 小鼠大腦皮層
在神經(jīng)系統(tǒng)科學(xué)領(lǐng)域,對(duì)所有哺乳動(dòng)物的神經(jīng)細(xì)胞進(jìn)行系統(tǒng)性分類是一個(gè)長期的目標(biāo)。理解大腦的細(xì)胞構(gòu)成有助于破譯它的功能和連接性。不同的研究表明,對(duì)來自小鼠大腦不同區(qū)域的細(xì)胞做scRNA-seq,進(jìn)行細(xì)胞分群,發(fā)現(xiàn)中間神經(jīng)元具有更大的異質(zhì)性,暗示中間神經(jīng)元細(xì)胞具備更加復(fù)雜多樣的功能。通過基因表達(dá)譜得到的細(xì)胞類型分類是否顯著關(guān)聯(lián)不同的功能性質(zhì)還有待進(jìn)一步的研究,這些實(shí)驗(yàn)的方法都顯示有一定的偏好性。
為了讓基因表達(dá)直接關(guān)聯(lián)解剖、形態(tài)、功能的屬性,兩個(gè)實(shí)驗(yàn)室同時(shí)開發(fā)出了Patch-seq,這個(gè)技術(shù)把全細(xì)胞電生理膜片鉗記錄與scRNA-seq相結(jié)合。
其中一個(gè)實(shí)驗(yàn)室結(jié)合膜片鉗和Smart-seq2,在新皮質(zhì)L1外層分析了58個(gè)皮層細(xì)胞,這項(xiàng)研究使用了機(jī)器學(xué)習(xí)以不同的放電模式來進(jìn)行細(xì)胞形態(tài)分類,結(jié)果跟來自基因表達(dá)譜的分群結(jié)果對(duì)應(yīng)的很好。58個(gè)細(xì)胞分出兩種細(xì)胞亞型,eNGCs和SBCs,重要的是,發(fā)現(xiàn)SBCs富集了四個(gè)神經(jīng)精神病相關(guān)的基因。
另一項(xiàng)研究使用膜片鉗和STRT-seq,在軀體感覺皮質(zhì)的1/2層分析了45個(gè)中間神經(jīng)元和38個(gè)椎體神經(jīng)元細(xì)胞,根據(jù)電生理性質(zhì)和形態(tài),分為5個(gè)亞型和3個(gè)亞型。這八個(gè)亞型跟scRNA-seq鑒定到的分群結(jié)果相吻合,從而確認(rèn)了Patch-seq方法的有效性。
Patch-seq的分析適用于離子通道和受體基因研究,可以預(yù)測神經(jīng)生理學(xué)表型。跟鮮活細(xì)胞的scRNA-seq相比,Patch-seq捕獲到的基因顯然更少,通量相對(duì)更低,然而正因?yàn)橛胁煌膯渭?xì)胞測序方法,使得從單細(xì)胞尺度上深入分析分子特征、形態(tài)和異常復(fù)雜組織的功能成為可能。
1.3. 未來展望
1.3.1. 空間轉(zhuǎn)錄組
單分子原位熒光雜交技術(shù)(smFISH)在2008年被開發(fā)出來,用作單細(xì)胞尺度的組織RNA定量,它使用帶熒光基團(tuán)的20bp核酸探針。這項(xiàng)技術(shù)受限于能夠同時(shí)檢測到的轉(zhuǎn)錄本數(shù)量,后來引入分組探針文庫的組合標(biāo)簽克服了這一缺陷。隨著七種光轉(zhuǎn)換染料和空間條碼結(jié)合超分辨顯微技術(shù)的使用,能夠同時(shí)檢測到的基因數(shù)進(jìn)一步增加。高分辨率的顯微鏡能夠識(shí)別結(jié)合了同一種探針實(shí)際序列不同的mRNA。接著,通過使用順序輪的雜交、成像、探針剝離來給mRNA加條碼,繼續(xù)優(yōu)化了該方法。smFISH的一大優(yōu)勢(shì)是雜交效率很高,能夠檢測到95%的mRNA。smFISH適用于剪切變異、染色體位點(diǎn)以及SNP。類似的,熒光原位RNA測序(FISSEQ)也使用基因特異的探針來讀取空間基因表達(dá)。跟smFISH明顯不同的是,F(xiàn)ISSEQ的reads比RNA-seq還少很多,豐度不夠。總體上看,以上這些原位熒光的方法想要覆蓋整個(gè)轉(zhuǎn)錄組,都比較費(fèi)時(shí)費(fèi)力。
使用LCM的單細(xì)胞空間轉(zhuǎn)錄組方法已經(jīng)被開發(fā)出來了。LCM可以從速凍組織切片中仔細(xì)分離出單個(gè)細(xì)胞,分辨率能達(dá)到亞細(xì)胞水平。LCM適用于任何胚胎和成熟時(shí)期,特別是那些難以分離的組織。通過簡單的組織染色或者快速的抗體染色可以鑒定出感興趣的細(xì)胞。LCM是與全轉(zhuǎn)錄組基因芯片結(jié)合,然后是RNA-seq,直到現(xiàn)在,需要的細(xì)胞數(shù)也是數(shù)百上千。結(jié)合scRNA-seq和LCM的LCM-seq,通過直接裂解分離的細(xì)胞,消除通常是在LCM之后的RNA隔離步驟,可以簡化流程,降低技術(shù)噪音,減少費(fèi)用。同時(shí)每個(gè)細(xì)胞的空間信息都保留了下來并且不需要組織分離步驟,從而能夠在單細(xì)胞水平同時(shí)研究細(xì)胞異質(zhì)性和空間差異。保留空間信息的重要性不應(yīng)該被低估它可能是組織內(nèi)細(xì)胞識(shí)別的關(guān)鍵性因素。此外,因?yàn)榧?xì)胞在分離前保留了原有位置的連接信息,比起需要進(jìn)行組織裂解的測序方法,更能夠反映生物體內(nèi)的真實(shí)情況。LCM-seq另一個(gè)優(yōu)勢(shì)是可以用于缺損和部分退化的組織。然而,至今為止的一大缺陷是RNA有一些片段化,即使處理的時(shí)間很短也一樣,所以覆蓋度比起鮮活細(xì)胞要低,不能作RNA剪切的深入分析。LCM染色的后續(xù)優(yōu)化有可能克服這一障礙。
一種叫作”空間轉(zhuǎn)錄組(spatial transcriptomics)“的優(yōu)雅方法近期被開發(fā)出來,能夠不分離細(xì)胞直接使用完整的組織切片進(jìn)行轉(zhuǎn)錄組分析。組織切片被放置在slide上,使用含有獨(dú)特空間條碼標(biāo)記的反轉(zhuǎn)錄引物。 slide上布滿直徑100微米間隔200微米的孔,孔內(nèi)有接近兩億個(gè)寡核苷酸探針。組織經(jīng)過通透性處理后加上反轉(zhuǎn)錄試劑,組織被酶解,留下cDNA與slide上排列的探針結(jié)合。這種方法的分辨率很高,100微米,對(duì)于整體空間信息的接收在時(shí)間上非常高效。但是不容易顯示出細(xì)胞的異質(zhì)性,因?yàn)榧?xì)胞大小的差異,這種方法只能展示出特定二維坐標(biāo)下單一或多個(gè)圖層的空間信息。
1.3.2. 單細(xì)胞多組學(xué)
測序技術(shù)目前已經(jīng)能夠從同一個(gè)細(xì)胞中獲取基因組、表觀組、轉(zhuǎn)錄組和蛋白組的情況。因此,可以整合每個(gè)細(xì)胞的DNA、RNA、蛋白還有表觀修飾的信息得到一個(gè)綜合的理解。為了這個(gè)目的開發(fā)的方法有:DR-seq和G&T-seq,同時(shí)分析基因組和轉(zhuǎn)錄組;scTrio-seq,基因組、轉(zhuǎn)錄組和甲基化譜;scM&T-seq,轉(zhuǎn)錄組和甲基化譜;PEA-qPCR,蛋白和一個(gè)基因panel。同時(shí)研究基因組和轉(zhuǎn)錄組可以在基因表達(dá)水平關(guān)聯(lián)CNV、染色體混合和調(diào)控因子的SNV。還可以揭示克隆結(jié)構(gòu)和細(xì)胞亞型,直接聯(lián)系基因型和表型。另一方面,結(jié)合轉(zhuǎn)錄組和甲基化分析,可以知道單細(xì)胞中基因組不同功能因子的DNA甲基化水平與基因表達(dá)水平的關(guān)系。未來把總RNA,小RNA,染色體重組和結(jié)構(gòu)結(jié)合到單細(xì)胞多組學(xué)里,可以更加詳細(xì)的描述正常細(xì)胞功能和疾病過程。
另一個(gè)新興的前沿研究是結(jié)合系統(tǒng)基因功能分析和scRNA-seq分析。
1.3.3. 人類細(xì)胞圖譜和精準(zhǔn)醫(yī)學(xué)
2016年一群科學(xué)家開啟了人類細(xì)胞圖譜計(jì)劃(Human Cell Atlas),目前已經(jīng)包括了免疫系統(tǒng)、中樞神經(jīng)系統(tǒng)、上皮組織、胚胎細(xì)胞和癌癥。這個(gè)計(jì)劃將會(huì)提供一個(gè)囊括了細(xì)胞類型、標(biāo)記基因、信號(hào)通路和調(diào)控機(jī)制的綜合參考視圖,給不同個(gè)體和疾病的組織帶來更好的生物靶標(biāo)識(shí)別和藥物標(biāo)靶,從而進(jìn)一步發(fā)展精準(zhǔn)醫(yī)學(xué)。
1.3.4. 把轉(zhuǎn)錄水平的差異關(guān)聯(lián)到細(xì)胞類型和功能
scRNA-seq的數(shù)據(jù)已經(jīng)表明,在大腦不同區(qū)域和不同的組織,細(xì)胞間的異質(zhì)性比之前預(yù)計(jì)的還要大。面前更艱巨的任務(wù)是從功能上評(píng)估RNA成分的異質(zhì)性具體在何種程度上影響了相關(guān)細(xì)胞表現(xiàn)出不同的功能。大部分的scRNA-seq研究對(duì)此有所描述,仍未清楚的是,多大程度的轉(zhuǎn)錄組差異會(huì)導(dǎo)致細(xì)胞功能的區(qū)別,使細(xì)胞成為不同的類型而不是同類型細(xì)胞的不同可選狀態(tài)。某(幾)種轉(zhuǎn)錄本的表達(dá)量積累到什么水平能夠看到明顯的細(xì)胞功能改變?這取決于該基因的功能以及其他的基因表達(dá),還取決于特定轉(zhuǎn)錄本的穩(wěn)定性和半衰期。不經(jīng)過功能測試就將功能與轉(zhuǎn)錄水平關(guān)聯(lián)起來不是一個(gè)簡單的任務(wù)。無論如何,細(xì)胞和分子生物、生物化學(xué)、生理學(xué)以及數(shù)學(xué)模型的結(jié)合,將來肯定能夠解答革命性的scRNA-seq技術(shù)還不能回答的問題。單細(xì)胞技術(shù)在未來的生物功能注釋中將會(huì)是不可或缺的工具。
1.4. 分析
這篇綜述沒有提到具體的數(shù)據(jù)分析。
(文章來源: 單細(xì)胞天地 轉(zhuǎn)載僅供參考學(xué)習(xí)及傳遞有用信息,版權(quán)歸原作者所有,如侵犯權(quán)益,請(qǐng)聯(lián)系刪除)