基因組研究結(jié)果顯示,人體內(nèi)超過90%的基因存在選擇性剪接(alternative splicing)。該過程在不同組織以及不同生理階段受到嚴(yán)格的調(diào)控,其失調(diào)會(huì)導(dǎo)致多種疾病的發(fā)生。選擇性剪接的體內(nèi)調(diào)控主要由前體mRNA中的順式元件(cis-elements)招募反式剪接作用因子(trans-acting?splicing?factors)來實(shí)現(xiàn)的。通常情況下,反式剪接作用因子存在一個(gè)模塊化的構(gòu)成,其包括一個(gè)或多個(gè)RNA結(jié)合域以及不同的功能模塊。但目前科學(xué)家對這些功能域的研究還停留在少數(shù)幾種典型的剪接因子上,如SR蛋白家族和hnRNP蛋白家族,對廣大的其他RNA結(jié)合蛋白中的功能模塊卻知之甚少。而深入理解這些功能模塊會(huì)為科學(xué)家進(jìn)一步研究以至從頭合成新型RNA剪接因子提供依據(jù)。
2018年11月7日,中國科學(xué)院計(jì)算生物學(xué)研究所、分子細(xì)胞科學(xué)卓越創(chuàng)新中心、中國科學(xué)院計(jì)算生物學(xué)重點(diǎn)實(shí)驗(yàn)室RNA系統(tǒng)生物學(xué)研究組王澤峰研究團(tuán)隊(duì)在國際知名學(xué)術(shù)期刊Cell Systems在線發(fā)表了題為“Modeling and predicting the activities of trans-acting splicing factors with machine learning”的研究長文。在該項(xiàng)工作中,研究人員首次將機(jī)器學(xué)習(xí)方法用于構(gòu)建RNA結(jié)合蛋白的剪接調(diào)控作用預(yù)測模型,揭示了RNA結(jié)合蛋白的序列組成偏好性對其調(diào)控作用的影響,為研究RNA結(jié)合蛋白的剪接活性提供了重要指導(dǎo)意義,也為人工合成剪接因子提供了可行性。
在之前的研究中,該研究組發(fā)現(xiàn)在RNA結(jié)合蛋白中存在大量的序列低復(fù)雜區(qū)域。本研究在此基礎(chǔ)上對這些序列低復(fù)雜區(qū)域在RNA選擇性剪接中所扮演的功能進(jìn)行了系統(tǒng)性研究。研究人員通過構(gòu)建人工剪接因子的方法檢測了多達(dá)12種代表性序列低復(fù)雜區(qū)域在不同RNA位置的剪接活性,發(fā)現(xiàn)了這些低復(fù)雜區(qū)域在RNA選擇性剪接中具有位置依賴性(context dependent)且相似的序列組成具有相似的剪接活性。
研究人員們進(jìn)而根據(jù)這些功能模塊的序列偏好性與其剪接活性,構(gòu)建了一個(gè)以機(jī)器學(xué)習(xí)方法為核心的多肽剪接活性預(yù)測模型。利用該機(jī)器學(xué)習(xí)模型,他們還發(fā)現(xiàn)了一些此前從未報(bào)道過的具備剪接活性的序列特征。并且以此序列特征為基礎(chǔ),他們在世界上首次從頭合成帶有特定活性的人工剪接因子,取得了極高的成功率(10/11)。該研究的此項(xiàng)發(fā)現(xiàn)也為以后發(fā)展以人工剪接因子為基礎(chǔ)的基因治療方法掃除了障礙。
該研究工作由中國科學(xué)院-馬普學(xué)會(huì)計(jì)算生物學(xué)伙伴研究所、華東理工大學(xué)以及美國國立環(huán)境健康科學(xué)研究所( NIEHS )等機(jī)構(gòu)合作完成。該工作在王澤峰研究員的指導(dǎo)下,由華東理工大學(xué)聯(lián)合培養(yǎng)博士生茅繆偉、計(jì)算生物所胡玥和楊赟副研究員等完成,并得到了華東理工大學(xué)楊弋教授與NIEHS高級(jí)研究員Xiaoling Li的大力支持。
該研究得到了國家基金委、上海市科委和國家留學(xué)基金委等經(jīng)費(fèi)的支持。
原文鏈接:https://doi.org/10.1016/j.cels.2018.09.002

RNA結(jié)合蛋白剪接調(diào)控作用預(yù)測模型流程圖