DNA編碼庫(DEL)技術是早期藥物發現過程中有效鑒定新化學物質的強大平臺,通過親和選擇和深度測序對大量編碼小分子庫進行平行篩選。雖然DEL選擇為計算藥物發現提供了豐富的數據集,但影響DEL數據的潛在技術因素仍不清楚。近日,猶他大學Raphael M. Franzini綜述研究了影響DEL數據中化學信息的關鍵參數及其對命中分類和機器學習集成的影響。
本文要點:
1) 作者強調了數據處理和解釋的必要性,相應的標準化方法對于基于DEL的方法成功至關重要。主要的挑戰包括序列計數和結合親和力之間的關系、頻繁的攻擊,以及庫組成不均勻、DNA損傷和連接子等因素對結合模式的影響。
2) 實驗偽影,如蛋白質固定和篩選基質效應引起的偽影,使數據解釋更加復雜。此外,作者重點介紹了使用機器學習對DEL數據進行去噪和預測候選藥物的最新進展。
Moreno Wichert et.al Challenges and Prospects of DNA-Encoded Library Data Interpretation Chem. Rev. 2024
DOI: 10.1021/acs.chemrev.4c00284
https://pubs.acs.org/doi/10.1021/acs.chemrev.4c00284