轉(zhuǎn)錄組解釋依賴于高質(zhì)量的參考轉(zhuǎn)錄組,用于基因表達的準確定量以及遺傳變體的功能分析。目前對馬基因組的注釋缺乏評估基因表達所需的特異性和敏感性,特別是在同種型水平,并且缺乏對非翻譯區(qū)(UTR)使用的注釋不足。來自加利福尼亞大學(xué)戴維斯分校的研究人員為馬建立了一個注釋管道,并用它將來自多個RNA-seq數(shù)據(jù)集的19億個讀數(shù)整合到一個新的精制轉(zhuǎn)錄組中。
該馬轉(zhuǎn)錄組整合了來自59個個體的8種不同組織,改善了基因結(jié)構(gòu)和同種型分辨率,同時提供了大量的組織特異性信息。研究人員在其管道中使用了四個級別的轉(zhuǎn)錄本過濾,旨在產(chǎn)生適合不同下游分析的幾種轉(zhuǎn)錄組版本。轉(zhuǎn)錄組包括36,876個基因和76,125個同種型,其中6474個候選轉(zhuǎn)錄基因座對馬轉(zhuǎn)錄組是新的。
用于生成每個版本的轉(zhuǎn)錄組的工作流程概述
轉(zhuǎn)錄組產(chǎn)品是橢圓形的。用于執(zhí)行各種步驟的程序在括號中表示。所有轉(zhuǎn)錄組版本和管道腳本都是公開可用的
這些研究人員采用了各種描述性統(tǒng)計數(shù)據(jù)和數(shù)據(jù),證明了轉(zhuǎn)錄組的質(zhì)量和內(nèi)容。由該管道提供的馬轉(zhuǎn)錄組顯示迄今為止任何馬轉(zhuǎn)錄組的組織特異性分辨率,并且對于若干下游分析是靈活的。他們鼓勵將其他馬轉(zhuǎn)錄組與其注釋管道整合,以繼續(xù)并改進馬轉(zhuǎn)錄組。