6月22日,國際學(xué)術(shù)期刊Briefings in Bioinformatics以“Dr AFC: drug repositioning through anti-fibrosis characteristic”為題,在線發(fā)表了基于化合物抗纖維化特征的藥物重定位平臺Dr AFC(https://www.biosino.org/drafc/),為研究人員提供了準(zhǔn)確、方便、快捷的在線藥物重定位預(yù)測工具,助力臨床新藥研發(fā)。
藥物重定位指將已有藥物再利用,將其應(yīng)用于新的疾病。與傳統(tǒng)的藥物研究相比,藥物的重定位具有巨大的優(yōu)勢,其大大縮短藥物研發(fā)周期,降低成本并降低潛在風(fēng)險,現(xiàn)已成為藥物研發(fā)中重要策略之一。然而,如何不斷優(yōu)化藥物重定位方法和模型則成為目前需要攻克的難點。纖維化是許多疾病致病機(jī)制中的關(guān)鍵病理過程,這些涉及到纖維化的疾病具有共同的機(jī)制和治療靶點,具有共同的治療方法和藥物。因此,研究團(tuán)隊開發(fā)了基于化合物抗纖維化特征的藥物重定位預(yù)測算法,在預(yù)測模型中引入抗纖維化的特征,提高重定位的成功率。
該研究系統(tǒng)收集了纖維化相關(guān)的文獻(xiàn)和抗纖維化臨床實驗數(shù)據(jù),經(jīng)過篩選和分析后,最終獲得3096篇纖維化相關(guān)文獻(xiàn),1787個抗纖維化臨床實驗,1067個纖維化相關(guān)靶點,507個抗纖維化化合物-靶點的相互作用和1223個抗纖維化化合物,其中包括386個DrugBank中FDA批準(zhǔn)的上市藥物?;诖耍撗芯渴紫冉⒘丝估w維化藥物知識庫,進(jìn)一步整合DrugBank上市藥物小分子數(shù)據(jù)構(gòu)建了“基于化合物結(jié)構(gòu)譜預(yù)測模型”(Structure Profile Prediction Model, SPPM),和整合小分子刺激基因表達(dá)譜數(shù)據(jù)(CMap, connectivity map)構(gòu)建了“基于化合物生物表達(dá)譜預(yù)測模型”(Biological Profile Prediction Model, BPPM)。在這兩個藥物重定位的模型中,根據(jù)化合物是否與纖維化有關(guān)來定義陽性和陰性數(shù)據(jù),經(jīng)過質(zhì)控和預(yù)處理后用于后續(xù)模型的訓(xùn)練和測試。在評估4種不同的機(jī)器學(xué)習(xí)算法后,發(fā)現(xiàn)梯度提升算法具有最優(yōu)的準(zhǔn)確性和AUC,進(jìn)而通過迭代特征消除(IFE, Iterative feature elimination)算法篩選并確定最優(yōu)的特征(feature)組合,構(gòu)建最終模型。模型在實際數(shù)據(jù)中進(jìn)行了進(jìn)一步測試與驗證,得到了良好的預(yù)測效果。
該研究基于SPPM和BPPM模型開發(fā)了在線藥物重定位平臺Dr AFC,用戶可以分別上傳化合物的結(jié)構(gòu)譜(通常為結(jié)構(gòu)描述符/指紋)或生物表達(dá)譜(通常為化合物刺激的轉(zhuǎn)錄組表達(dá)值)來進(jìn)行重定位分析。此外,Dr AFC平臺中還加入了常用的藥物設(shè)計分析功能,包括類藥性分析、相似性計算、結(jié)構(gòu)匹配等工具,方便研究人員使用。
該工作由同濟(jì)大學(xué)吳頂峰、高文星、黎曉逸等在同濟(jì)大學(xué)朱瑞新教授、中國科學(xué)院上海營養(yǎng)與健康研究所生物醫(yī)學(xué)大數(shù)據(jù)中心張國慶研究員和中山大學(xué)朱立新教授的共同指導(dǎo)下完成。研究得到了科技部國家重點研發(fā)計劃、國家自然科學(xué)基金、上海市自然科學(xué)基金、中國科學(xué)院等多項基金的資助。(科技處)
在線服務(wù)地址: https://www.biosino.org/drafc/
文章鏈接:https://academic.oup.com/bib/article/doi/10.1093/bib/bbaa115/5860688
?
圖:Dr AFC藥物重定位平臺構(gòu)架。平臺實現(xiàn)了基于化合物結(jié)構(gòu)譜(SPPM)和基于化合物生物表達(dá)譜(BPPM)的藥物重定位預(yù)測模型,集成了藥物重定位預(yù)測和重定位機(jī)制分析等多種方便的新藥研發(fā)工具。