轉(zhuǎn)錄組解釋依賴于高質(zhì)量的參考轉(zhuǎn)錄組,用于基因表達(dá)的準(zhǔn)確定量以及遺傳變體的功能分析。目前對(duì)馬基因組的注釋缺乏評(píng)估基因表達(dá)所需的特異性和敏感性,特別是在同種型水平,并且缺乏對(duì)非翻譯區(qū)(UTR)使用的注釋不足。來自加利福尼亞大學(xué)戴維斯分校的研究人員為馬建立了一個(gè)注釋管道,并用它將來自多個(gè)RNA-seq數(shù)據(jù)集的19億個(gè)讀數(shù)整合到一個(gè)新的精制轉(zhuǎn)錄組中。
該馬轉(zhuǎn)錄組整合了來自59個(gè)個(gè)體的8種不同組織,改善了基因結(jié)構(gòu)和同種型分辨率,同時(shí)提供了大量的組織特異性信息。研究人員在其管道中使用了四個(gè)級(jí)別的轉(zhuǎn)錄本過濾,旨在產(chǎn)生適合不同下游分析的幾種轉(zhuǎn)錄組版本。轉(zhuǎn)錄組包括36,876個(gè)基因和76,125個(gè)同種型,其中6474個(gè)候選轉(zhuǎn)錄基因座對(duì)馬轉(zhuǎn)錄組是新的。
用于生成每個(gè)版本的轉(zhuǎn)錄組的工作流程概述
轉(zhuǎn)錄組產(chǎn)品是橢圓形的。用于執(zhí)行各種步驟的程序在括號(hào)中表示。所有轉(zhuǎn)錄組版本和管道腳本都是公開可用的
這些研究人員采用了各種描述性統(tǒng)計(jì)數(shù)據(jù)和數(shù)據(jù),證明了轉(zhuǎn)錄組的質(zhì)量和內(nèi)容。由該管道提供的馬轉(zhuǎn)錄組顯示迄今為止任何馬轉(zhuǎn)錄組的組織特異性分辨率,并且對(duì)于若干下游分析是靈活的。他們鼓勵(lì)將其他馬轉(zhuǎn)錄組與其注釋管道整合,以繼續(xù)并改進(jìn)馬轉(zhuǎn)錄組。