2022年8月17日,中國(guó)科學(xué)院上海營(yíng)養(yǎng)與健康研究所王澤峰研究團(tuán)隊(duì)在學(xué)術(shù)期刊Science Advances正式發(fā)表了題為“A widespread length dependent Splicing regulation in cancer”的研究論文。該研究發(fā)現(xiàn)了一種全新的在癌癥中長(zhǎng)度依賴性的可變剪接調(diào)控模式。人類基因組90%以上的基因都需要經(jīng)歷可變剪接,剪接的錯(cuò)誤調(diào)控會(huì)導(dǎo)致多種人類疾病,尤其是癌癥。越來越多的證據(jù)表明,RNA剪接異常與人類癌癥密切相關(guān),廣泛的剪接失調(diào)是癌癥的分子標(biāo)志之一。因此,系統(tǒng)性的研究癌癥中可變剪接異常調(diào)控將為癌癥治療提供新的思路。
該研究首先通過分析TCGA數(shù)據(jù)庫中大規(guī)模的癌癥轉(zhuǎn)錄組數(shù)據(jù),鑒定出了在癌癥中剪接異常的外顯子,發(fā)現(xiàn)了癌癥中剪接異常的外顯子長(zhǎng)度均偏向于更短,并且這些短外顯子在癌癥中更傾向于被跳躍。該研究共鑒定出了494個(gè)癌癥相關(guān)的短外顯子(cancer-associated short exons, CASE)并進(jìn)行了進(jìn)一步的深入研究。研究人員利用CASE的剪接開發(fā)了一個(gè)用于癌癥預(yù)測(cè)的隨機(jī)森林模型,可以對(duì)癌癥樣本進(jìn)行準(zhǔn)確的預(yù)測(cè),AUC可達(dá)到0.9左右。此外,該研究還提出了一種利用CASE剪接計(jì)算risk factor的方法來預(yù)測(cè)癌癥病人的預(yù)后,在TCGA數(shù)據(jù)集及其他獨(dú)立癌癥數(shù)據(jù)集中均具有很好的預(yù)測(cè)結(jié)果。
在機(jī)制的研究上,該研究提出了兩種影響CASE剪接的機(jī)制。首先,由于癌癥中癌細(xì)胞快速地生長(zhǎng)增殖需要更快的轉(zhuǎn)錄過程,所以癌癥中異常的轉(zhuǎn)錄可能會(huì)對(duì)剪接產(chǎn)生影響。研究人員通過對(duì)具有不同轉(zhuǎn)錄延伸速度的細(xì)胞系中可變剪接的分析發(fā)現(xiàn)短的外顯子對(duì)速度的變化更為敏感,更容易受到轉(zhuǎn)錄速度變化的擾動(dòng)而發(fā)生外顯子的跳躍。轉(zhuǎn)錄對(duì)剪接的影響是廣泛的無選擇性的,該研究進(jìn)一步發(fā)現(xiàn)特定的短外顯子在癌癥中發(fā)生跳躍是受到剪接因子的調(diào)控。通過分析ENCODE數(shù)據(jù)庫中大量RNA結(jié)合蛋白(RBP)的相關(guān)組學(xué)數(shù)據(jù),研究人員建立了RBP對(duì)CASE剪接的直接調(diào)控網(wǎng)絡(luò),并鑒定出了多個(gè)調(diào)控CASE剪接的RBP,包括RBFOX2,AQR,U2AF2和PTBP1等。
中國(guó)科學(xué)院上海營(yíng)養(yǎng)與健康研究所王澤峰研究員和大連醫(yī)科大學(xué)腫瘤干細(xì)胞研究院汪洋教授為文章的共同通訊作者,張思蕊博士為文章的第一作者。該項(xiàng)工作得到了科技部國(guó)家重點(diǎn)研發(fā)計(jì)劃、國(guó)家自然科學(xué)基金等科研項(xiàng)目經(jīng)費(fèi)的支持。
文章鏈接:https://www.science.org/doi/10.1126/sciadv.abn9232

圖注:A.基于TCGA數(shù)據(jù)庫中18種癌癥鑒定癌癥相關(guān)的剪接事件流程。B.所有人類外顯子和每種癌癥類型中異常剪接外顯子的長(zhǎng)度分布圖。C.利用剪接建立隨機(jī)森林模型在每種癌癥類型中的AUC值。D.基于CASE評(píng)估的風(fēng)險(xiǎn)因子進(jìn)行分組的癌癥患者的Kaplan-Meier曲線。