1月15日,國際學(xué)術(shù)期刊Genomics, Proteomics & Bioinformatics在線發(fā)表了中國科學(xué)院-德國馬普計算生物學(xué)伙伴研究所楊力研究組關(guān)于環(huán)形RNA研究的最新進展“CIRCexplorer3: A CLEAR Pipeline for Direct Comparison of Circular and Linear RNA Expression”。該研究發(fā)布了升級版的環(huán)形RNA與線形RNA直接定量比較的分析系統(tǒng)CIRCexplorer3-CLEAR,用于開展環(huán)形RNA的精準定量研究。
真核生物中的反向剪接可以將外顯子序列反向首尾連接形成環(huán)形RNA?;诎l(fā)現(xiàn)定位于反向剪接位點的高通量測序讀序,楊力研究組在2014年建立了高效的環(huán)形RNA計算分析新流程(CIRCexplorer, version 1),并通過合作系統(tǒng)揭示了環(huán)形RNA在體內(nèi)的廣泛存在、揭示了互補序列介導(dǎo)的環(huán)形RNA產(chǎn)生基礎(chǔ)及其調(diào)控的普遍性規(guī)律(Zhang et al., Cell 2014)。開發(fā)的環(huán)形RNA計算分析流程CIRCexplorer被認為是在當時已有的環(huán)形RNA計算分析流程中預(yù)測效率和準確性最適的工具包(Hansen et al., Nucleic Acids Res 2016)。2016年,楊力研究組報道了升級版的CIRCexplorer2開源工具包,通過比較對應(yīng)環(huán)形RNA和線性RNA的表達,全面闡述了環(huán)形RNA可變反向剪接(alternative back-splicing)和可變剪接(alternative splicing)的復(fù)雜性和多樣性,并建立了環(huán)形RNA數(shù)據(jù)庫網(wǎng)站http://www.picb.ac.cn/rnomics/circpedia(Zhang et al., Genome Res 2016;Dong et al., Genomics Proteomics Bioinformatics 2018)。但是,除了反向剪接位點以外,環(huán)形RNA與其對應(yīng)的線形RNA在一級序列上完全重復(fù),因此從轉(zhuǎn)錄組測序數(shù)據(jù)中系統(tǒng)發(fā)現(xiàn)環(huán)形RNA和線形RNA的策略不同。包括CIRCexplorer (version 1 and 2)在內(nèi),現(xiàn)有方法對環(huán)形RNA的全轉(zhuǎn)錄組檢測和定量主要依賴對跨反向剪接位點讀序的分析獲得FPM(fragments per million mapped fragments);而對線形RNA的定量分析則依賴覆蓋外顯子和跨外顯子的讀序以獲得FPKM(fragments per kilobase of transcript per million mapped fragments)。FPM和FPKM定量標準的不一致導(dǎo)致它們無法直接用來比較環(huán)形RNA及其對應(yīng)線形RNA的表達。
在這項最新的研究中,楊力研究組開發(fā)了3.0版本的CIRCexplorer分析新流程用于環(huán)形RNA與線形RNA直接定量比較(https://github.com/YangLab/CLEAR),根據(jù)可被用于環(huán)形RNA與線形RNA直接定量比較的這一特性,這個新流程也被命名為CLEAR(circular and linear RNA expression analysis from ribosomal-RNA depleted RNA-seq)。在該最新的CLEAR流程中,研究人員定義并使用新的定量參數(shù)FPB(fragments per billion mapped bases)計算環(huán)形RNA與線性RNA的表達水平,主要通過計算跨反向剪接位點的讀序獲得環(huán)形RNA的表達(FPBcirc),同時計算跨正常剪接位點的讀序獲得線形RNA的表達(FPBlinear)。進一步,通過直接比較環(huán)形RNA及其對應(yīng)線形RNA的FPB值獲得CIRCscore(FPBcirc vs FPBlinear),用來表征環(huán)形RNA相對于線形RNA的表達水平。相對于原有的FPM,新建立的FPB不受讀序長度與測序策略的影響,因此可以對來源于不同讀序長度、測序策略和測序深度的樣本進行比較;同時,新建立的CIRCscore能進一步去除線形RNA的表達背景對環(huán)形RNA進行相對定量,因此基于FPB和CIRCscore的定量分析將有更廣的適應(yīng)性和更高的魯棒性。利用CIRCexplorer3-CLEAR,研究人員可篩選獲得相對于線形RNA高表達的環(huán)形RNA,并開展后續(xù)環(huán)形RNA功能及作用機制等研究。
楊力研究組長期從事核酸水平的組學(xué)及相關(guān)前沿新技術(shù)研究。在環(huán)形RNA研究領(lǐng)域,近期通過合作系統(tǒng)揭示了反向剪接環(huán)形RNA在生成加工、代謝降解、二級結(jié)構(gòu)和生理功能等水平的調(diào)控及機制(Zhang et al., Cell 2014; Zhang et al., Cell Rep 2016; Zhang et al., Genome Res 2016; Dong et al., RNA Biol 2017; Li et al., Mol Cell 2017; Liu et al., Cell 2019)。該項研究成果在楊力研究員指導(dǎo)下完成,受到了中國科學(xué)院、國家自然科學(xué)基金委和Howard Hughes Medical Institute International Program的基金的支持。楊力研究組2014級碩博連讀研究生馬旭凱為第一作者,研究獲得了生化細胞所陳玲玲研究員及其研究組、康涅狄格大學(xué)Gordon G. Carmichael教授的大力支持。(科技處)
論文網(wǎng)址:https://doi.org/10.1016/j.gpb.2019.11.004

圖1: CIRCexplorer3-CLEAR分析新流程用于環(huán)形RNA與線形RNA直接定量比較