近日,楊力研究組與上??萍即髮W(xué)生命科學(xué)與技術(shù)學(xué)院陳佳研究組通過合作,系統(tǒng)揭示了一系列具有代表性的基因組堿基編輯器(baseeditor)的效能差異,并進一步構(gòu)建了可利用20種已報道堿基編輯器進行編輯的人類疾病相關(guān)單堿基突變位點的數(shù)據(jù)庫(BEable-GPS, Base Editable prediction of Global Pathogenic SNVs),相關(guān)成果以“Comparison of cytosine base editors and development of the BEable-GPS database for targeting pathogenic SNVs”為題,于10月22日在線發(fā)表在國際知名學(xué)術(shù)期刊Genome Biology上。
由CRISPR/Cas基因編輯酶(如Cas9, Cpf1等)與胞嘧啶脫氨編輯酶(如APOBEC等)整合而成的胞嘧啶堿基編輯系統(tǒng),可在單堿基水平實現(xiàn)高效率的靶向C-to-T編輯。理論上來講,這種堿基編輯效果的實現(xiàn)不依賴于DNA雙鏈切割活性,可避免對基因組造成損傷,因此具有較高的安全性,未來有望運用于人類疾病相關(guān)單堿基突變的定向矯正,在臨床應(yīng)用中擁有巨大的潛力。自胞嘧啶堿基編輯器2016年被首次被報道以來,目前已有數(shù)十種改良版本被開發(fā),它們分別由不同的基因編輯酶(如SpCas9, SaCas9, LbCpf1等)和不同的胞嘧啶脫氨酶(如rat APOBEC1, human APOBEC3A等)組成。但是,由于這些堿基編輯器作用位點的偏好性差異,目前尚未有研究對這些編輯器的效能進行系統(tǒng)性比較,同時,基因編輯領(lǐng)域中對不同堿基編輯器可作用的人類疾病相關(guān)單堿基突變位點也未見整合和總結(jié)。
在這項最新的合作研究中,科研人員首先對五種具有代表性的堿基編輯器(包括BE3,eBE-S3, BE4max, hA3A-eBE-Y130F和dCpf1-eBE)可共同編輯的單堿基位點進行了生物信息學(xué)分析,通過對這5種堿基編輯器在共同靶向位點的編輯效率和編輯產(chǎn)物純度的系統(tǒng)研究,發(fā)現(xiàn)BE4max和hA3A-eBE-Y130F可實現(xiàn)最高的編輯效率;同時,由于hA3A-eBE-Y130F堿基編輯器整合了高催化活性的hA3A胞嘧啶脫氨酶,其在人類疾病相關(guān)突變位點的編輯能力最為突出。另一方面,由于dCpf1-eBE堿基編輯器整合了完全喪失DNA內(nèi)切酶活性的dCpf1(dCas12a)基因編輯酶,其在堿基編輯過程中能產(chǎn)生最少的編輯副產(chǎn)物,因此具有最高的編輯產(chǎn)物純度。為了更好的促進堿基編輯器在人類疾病相關(guān)突變位點的基礎(chǔ)理論和潛在臨床應(yīng)用研究,科研人員收集整合了所有目前已知人類疾病相關(guān)突變位點的信息,并運用生物信息學(xué)算法預(yù)測了約20種堿基編輯器在這些突變位點的作用潛力(圖)。預(yù)測結(jié)果顯示,利用這些堿基編輯器可模擬產(chǎn)生約94.34%的疾病相關(guān)C-to-T單堿基突變,同時可糾正約94.28%的疾病相關(guān)T-to-C單堿基突變,相關(guān)信息以BEable-GPS數(shù)據(jù)庫的形式供研究人員查詢使用(http://www.picb.ac.cn/rnomics/BEable-GPS)。同時,該數(shù)據(jù)庫還整合了對任意序列進行堿基編輯預(yù)測的服務(wù)功能,為堿基編輯器的廣泛應(yīng)用研究提供了計算生物學(xué)理論支持。
楊力研究員長期從事核酸系統(tǒng)生物學(xué)及相關(guān)新技術(shù)拓展研究,近期通過大數(shù)據(jù)整合分析揭示了DNA/RNA堿基編輯及相關(guān)分子機制(Nat Struct Mol Biol 2018; Mol Cell 2018),并利用核酸編輯酶創(chuàng)建多種高效基因組堿基編輯新體系(Cell Res 2017; Nat Biotechnol 2018a; Nat Biotechnol 2018b)。該項研究成果在楊力研究員和陳佳教授的共同指導(dǎo)下完成,受到了國家自然科學(xué)基金委、科技部基金的支持。營養(yǎng)與健康研究院計算生物學(xué)研究所楊力研究組2015級碩博連讀研究生王瀅和上??萍即髮W(xué)生命學(xué)院陳佳研究組2016級碩博連讀研究生高潤澤和研究助理吳晶為同等貢獻共同第一作者。該研究使用的高通量測序數(shù)據(jù)由PICB Omics Core完成,并儲存于PICB大數(shù)據(jù)中心(NODE: OEP000459)和NCBI(GEO: GSE136749)。

圖1. 計算生物學(xué)方法預(yù)測可編輯的致病突變位點及BEable-GPS數(shù)據(jù)庫構(gòu)建。
(a)可編輯的人類疾病相關(guān)單堿基突變位點的篩選流程。(b)判斷人類疾病相關(guān)單堿基突變位點能否被堿基編輯器編輯的流程示意圖。(c)統(tǒng)計20種堿基編輯器可編輯的人類疾病相關(guān)單堿基突變位點的數(shù)目。(d)BEable-GPS分析顯示一個可編輯的人類疾病相關(guān)單堿基突變位點信息及相應(yīng)單堿基編輯器的gRNA設(shè)計結(jié)果。
原文鏈接: https://genomebiology.biomedcentral.com/articles/10.1186/s13059-019-1839-4