2022年12月28日,中國科學(xué)院上海營養(yǎng)與健康研究所李虹研究組在國際學(xué)術(shù)期刊Briefings in Bioinformatics上在線發(fā)表了題為“A systematic assessment of deep learning methods for drug response prediction: from in vitro to clinical applications”的論文。文章從多角度系統(tǒng)地評估了癌癥藥敏預(yù)測深度學(xué)習(xí)算法的性能,為用戶根據(jù)自身需求和數(shù)據(jù)特點(diǎn)選擇恰當(dāng)?shù)念A(yù)測模型提供指導(dǎo),同時為構(gòu)建新的計(jì)算模型指引方向。
基于分子組學(xué)預(yù)測藥物對腫瘤的殺傷效果是癌癥個體化治療中的一個重要方向。近期研究結(jié)果顯示,深度學(xué)習(xí)模型相比經(jīng)典的機(jī)器學(xué)習(xí)模型能提高預(yù)測性能。然而,目前缺乏對不同深度學(xué)習(xí)方法的系統(tǒng)性比較,尤其是從臨床前模型到臨床數(shù)據(jù)的模型遷移能力。研究人員使用九個評估指標(biāo)對六種具有代表性的藥敏預(yù)測深度學(xué)習(xí)方法,在多個應(yīng)用場景中的性能進(jìn)行了評估,包括整體預(yù)測準(zhǔn)確性、單個藥物水平的可預(yù)測性、預(yù)測性能的潛在相關(guān)因素、以及細(xì)胞系模型用于臨床患者的遷移能力等。結(jié)果顯示,大多數(shù)方法在細(xì)胞系數(shù)據(jù)集中有良好的預(yù)測性能,其中基于蛋白質(zhì)-蛋白質(zhì)關(guān)聯(lián)的雙圖神經(jīng)網(wǎng)絡(luò)算法對腫瘤細(xì)胞系組學(xué)特征的捕捉能力更強(qiáng),準(zhǔn)確性更好。由于細(xì)胞系和患者腫瘤樣本之間的差異,細(xì)胞系上訓(xùn)練的模型應(yīng)用于患者時,性能指標(biāo)會出現(xiàn)不同程度的降低,但是幾種單藥模型仍然能在部分藥物上取得可靠的預(yù)測結(jié)果。
中國科學(xué)院上海營養(yǎng)與健康研究所博士研究生沈碧寒和博士后馮方尤敏為本文共同第一作者,李虹研究員為本文通訊作者。特別感謝中國科學(xué)院上海營養(yǎng)與健康研究所李昕研究員和馬良宵工程師、貴州科學(xué)數(shù)據(jù)中心貴安超級計(jì)算中心蔡文舉工程師給予的支持和幫助。該工作獲得了國家自然科學(xué)基金、科技部國家重點(diǎn)研發(fā)計(jì)劃、中科院青年創(chuàng)新促進(jìn)會、上海市自然科學(xué)基金、上海人才發(fā)展資金的資助,同時也得到了中國科學(xué)院上海營養(yǎng)與健康研究所生物醫(yī)學(xué)大數(shù)據(jù)中心技術(shù)平臺的支持。