第一作者:George Karageorgis
通訊作者:Herbert Waldmann
通訊單位:馬克斯普朗克分子生理學研究所
核心內容:
1. 討論了利用天然產物(NP)衍生片段的全新組合作為合成新的生物活性化合物的總體策略。這些新型的仿自然產品類保留了NPs的生物相關性,但展示了自然界或通過現有設計策略無法獲得的結構和生物活性。
2. 利用化學信息學工具分析了選定的仿NP庫,以評估它們的分子形態多樣性和性質。為了促進生物相關化學空間的探索,研究者確定了設計原則和連接模式,提供了前所未有的仿NP類,為生物活性小分子的發現提供了新的機會。
研究背景
天然產物(NPs)是發現基于新型分子支架的新型生物活性化合物的重要靈感來源。然而,目前只有少量的指導合成策略可用于生成新的NP衍生的支架,這限制了可獲得化合物的數量和類型。
綜述簡介
最近,馬克斯普朗克分子生理學研究所Herbert Waldmann等研究人員總結了仿天然產品的原理和設計原則。
圖1. 生物相關化合物的設計方法。
要點1:生物相關化合物的設計方法
基于NP結構或更寬松的化學/結構考慮的庫已通過不同的方法得到發展。一方面,NP衍生化合物可以直接從現成的NPs合成,Hergenrother和他的同事首先證明了通過在已有的反應位點上進行衍生化,以及通過環的變形和/或修飾(復雜性到多樣性(CtD))可實現上述過程。例如,通過3-6次轉變過程,包括開環、擴張、縮小等,可以將松香酸轉化為多種多樣的復雜化合物 (圖1a),而生物堿類奎尼丁的環畸變則產生了新的自噬抑制劑。另一種方法是直接合成和扭曲具有NP特性的復雜多環支架。例如,含有托品烷的化合物具有多種NPs內未發現的新支架,其中有幾種被發現是新的溴域結合劑。
另一方面,遵循構建/偶聯/成對策略的多樣性導向合成(DOS),則利用結構單元穩健的非對稱分子間偶聯來誘導立體化學多樣性,接著是互補功能基團的分子內偶聯,從而形成骨架多樣性(圖1b)。DOS并不直接基于NP結構。然而,化學多樣性的DOS化合物類可以被認為是類NP,因為它們的立體化學含量更高,sp3雜化中心的比例也更高。
生物導向合成(BIOS)的靈感來自于NPs,它為基于簡化NP支架的生物相關化合物的合成提供了信息。在BIOS中,NP支架的化學復雜性逐步降低,最終形成更小的中間支架,并作為合成仿NP化合物的起點(圖1c)。BIOS可能受到化學和生物兩方面的限制。利用生物合成技術生產未知的NPs的能力已經得到證明,例如,水平基因轉移技術用于裝配新的人工生物合成通路,以及激活未表達的生物合成通路。
要點2:仿NP化合物的發展
NPs的性質保留在NP衍生的片段中,并且NPs可能已經是片段大小,或者可以轉換成片段大小的環系統。因此,前所未有的NP片段的結合和融合可能為研究者提供了一種新的支架,這種支架既保留了NPs的化學和生物學特性,又超出了自然界探索的與生物學相關的化學空間(圖1c)。這些化合物將構成仿自然產物,因為這些新的仿NP的支架無法通過生物合成獲得。與自然發生的小分子和BIOS集合相比,基于這類分子支架的化合物可能具有不同的性質,并可能表現出前所未有的生物活性。圖2舉例說明了具有代表性的仿NP類的設計和實際合成過程。在最初的設計步驟中,不同NP類的片段特征被識別出來,并以前所未有的方式組合起來(圖2a),然后開發合成路線并執行,以獲得所需的仿NP類物質(圖2b-f)。最后,在不同的生化和生物試驗中確定新的仿NP化合物的生物活性。
Chromopynones1為仿NP化合物的設計和合成提供了一個說明性的例子。它包含一個橋接雙環支架,該支架結合了廣泛存在的具有生物活性的色烷和四氫嘧啶酮NP片段。它們在一鍋法中被高效合成,其中的關鍵步驟是比吉內利反應(圖2b)。
圖2. 仿NP化合物的發展。
要點3:仿NPs的化學信息學分析
為了表征這些先前報道的仿NPs所占用的化學空間,研究者計算了吡咯烷類、吡咯喹諾酮類和吲哚培酮類的NP相似度。研究者將染色質和吲哚醌的這些化合物庫的總NP相似度與ChEMBL 數據集、DrugBank中代表已上市和實驗藥物的批準藥物集以及選定的BIOS庫中的NPs相似度進行了比較。NP相似度衡量的是與商業非NPs相比,片段在NPs中出現的頻率。其范圍從-5到+5變化,數值越高表示NP相似度越高。為了計算NP相似度,相應的分子被分成以原子為中心的片段。通過它們在NPs中出現的相對頻率除以它們在商業非NPs中出現的頻率得到NP相似度。BIOS化合物的NP相似度分布較廣,范圍從0.0到+4.0(圖3a,紅色曲線),并且與ChEMBL數據庫中的NPs基本重合,這與預期一致。仿NPs分布更窄,范圍從-1.0到+1.0(圖3a,黑色曲線),覆蓋了NPs僅稀疏占據的部分化學空間。
通過對仿NP相關分子性質的計算,發現大部分仿NP符合利平斯基5規則 (Ro5)空間(60%為單個庫,86%為對照庫;圖3 b)。因此,新的NP片段組合可能使仿NP支架成為類藥物化合物。相比之下,只有48%的BIOS化合物位于類利平斯基空間(圖3b),但是與目前探索的仿NPs相比,它們的sp3雜交中心的比例更高。通過測定主轉動慣量(PMI)圖來評估仿NPs的分子形態多樣性,發現仿NPs的分子形態從桿盤軸向更三維的分子形態系統地轉移。大多數的合成分子都聚集在桿狀圓盤的軸對稱上,如DrugBank數據庫中已批準藥物的集合所示(圖3c)。
圖3. 仿NPs的化學信息學分析。
要點4:仿NP的結構分析
利用不同的連接方式,可以將NP衍生的片段組合在一起,生成新的仿NP(圖4):
(1)可以使用單峰或線性連接將兩個片段連接起來,如苯基吡咯烷酮(圖4a),這兩個片段之前被認為是雄激素受體拮抗劑。
(2)通過類比,多足連接將是可能的,并且可能受到合成可行性的限制。應優先考慮導致產生立體中心和結構更復雜的支架的模式,以捕獲NPs的高立體化學含量。例如,在吲哚烷、吡咯烷和吡咯喹諾林中,相鄰的兩個片段是邊對邊熔合在一起的,共用兩個原子。兩個片段可以共享三個或更多的公共原子,形成一個橋接的雙環骨架(圖4d),此外,兩個相鄰的碎片可能不共享任何公共原子,但甚至可能有一個或兩個連接原子作為中間連接點(圖4e)。相鄰的片段可以通過不連續的原子連接,從而形成橋接的雙足連接模式。吲哚美酮仿NP類就是這樣一個例子。
圖4. 可能的NP片段連接關系,以指導仿NP的合成和設計。
要點5:仿NP設計原則
給定一組NP片段的可選連接組合可以產生明顯不同的仿NP支架,因此適當設計仿NP結構可以使化學空間的探索更加廣闊。對于這種仿NP類的設計,有以下的通用規則:
(1)由于手性是許多NPs的定義性質,而立體性含量與生物活性相關,NP片段可以在配位反應中結合,從而形成新的三維支架,使其進一步衍生化。
(2)特別是氮(在藥物中比在NPs中更常見)和氧(在NPs中更常見)應與具有互補雜原子含量的NP片段結合。
(3)將來自NPs的NP片段與不同的生物活性相結合,可以最大限度地提高所得到的仿NP支架的生物學相關性。
(4)與生物合成的非活性片段的結合可能有利于新的生物活性,因為生物合成的不同的NPs將由不同的酶合成,編碼不同的結構特征,可能有助于與不同的蛋白質結合。
利用這些規則,研究者調查了吡咯烷酮類22-27和吡咯喹諾啉類28-35的區域同分異構體,作為五個相關但不同的例證(圖5a),并計算了它們的NP分數。研究發現化合物類25-27、34、35在6、43、44之前已經被合成,而其余的化合物類沒有被報道。從這個分析中,出現了三個互補的替代原則(如下a-c),它們從藥物化學的支架跳躍方法中得到了靈感 (圖5b-d):
a)不同連接方式:支架將由不同的框架組成,實現上面列出的連接模式;
b)具有相同連接模式但不同區域異構連接點的片段組合:片段之間的連接模式將被保持,但是生成的支架內的原子隨后是交替的;
c)多個片段可以以幾種不同的連接模式組合:雖然幾個片段的組合會導致高分子量的化合物,但這種仿NPs仍然有價值。
為了驗證這些設計標準,必須合成一套完整的同分異構體支架,并廣泛評估其生物活性。對于圖5所示的同分異構體化合物類,文獻檢索發現,沒有相應的數據。需要進一步創新的設計、合成和實驗方法。
圖5. 區域同分異構體吡咯烷和吡咯喹啉支架的NP相似度。
要點6:仿NPs的生物學評價
仿NPs可能表現出出乎意料的生物活性,這些活性不同于其片段來源的NPs的活性,這就需要在監測廣闊生物空間的分析中對這些化合物進行研究。例如,圖2中描述的仿NPs在細胞基礎上進行了研究,通過不同的信號級聯和表型變化(如脂滴形成、活性氧誘導、自噬)來監測進展。這樣的篩選可以監測整個系統的變化,而不是單個的生物靶標,并且由于它們的無偏性,可以導致識別新的蛋白靶標。除了監測個體表型的建立外,最近開發的多參數高含量圖像篩選技術將大量細胞形態特征的變化量化,將特別適合于探索新的仿NP類的生物學活性。它們將表型設置的無偏性與高含量顯微鏡提供的高信息量相結合,并可用于生成類或復合特異性表型指紋。指紋信息可用于推斷小分子的生物學目標或作用模式,并可促進仿NPs的實現,作為發現生物活性化合物的一種更通用的設計策略。
小結
NPs將繼續指導新的生物相關化合物庫的設計,NP結構為開發NP類化合物庫的不同方法提供了靈感。新的仿NP類化合物將對探索生物相關的化學空間有顯著的提升,并最終對旨在調節疾病的分子的發現產生重要價值。
參考文獻
Karageorgis,G., Foley, D.J., Laraia, L. et al. Principle and design of pseudo-naturalproducts. Nat. Chem. 12, 227–235 (2020).
DOI:10.1038/s41557-019-0411-x
https://doi.org/10.1038/s41557-019-0411-x