Bartosz A. Grzybowski,韓國IBS軟物質(zhì)材料研究中心教授,承擔(dān)了韓國政府特別研究經(jīng)費(fèi)(1000萬美元/年)。他長期專注于計算機(jī)驅(qū)動的新反應(yīng)和催化劑的發(fā)現(xiàn),以及化學(xué)人工智能控制和優(yōu)化實際實驗的機(jī)器人系統(tǒng),為復(fù)雜分子的計算機(jī)逆合成創(chuàng)建了 Chematica/Synthia 平臺,創(chuàng)建了用于發(fā)現(xiàn)新合成方法和新功能分子的軟件Allchemy。2016年,Bartosz A. Grzybowski榮獲費(fèi)曼納米技術(shù)獎,表彰他在計算機(jī)輔助有機(jī)合成研究領(lǐng)域的杰出貢獻(xiàn)。
他的研究,總是充滿奇思妙想,驚為天人,從來沒有讓人失望過!
2020年3月4日,Bartosz A. Grzybowski等人發(fā)現(xiàn)在聚離子液體(PIL,一類聚電解質(zhì)材料)存在的環(huán)境中,不斷地攪拌會讓晶體生長得更快、更大。這項研究打破傳統(tǒng)的結(jié)晶學(xué)理論的認(rèn)知(機(jī)械攪拌和剪切流容易引起二次成核,不利于晶體生長),是對當(dāng)前晶體生長技術(shù)的一個重要補(bǔ)充,有望大幅降低材料加工和制藥業(yè)中晶體生長成本。
2020年9月25日,Bartosz A. Grzybowski等研究人員構(gòu)建了以水、氮?dú)狻⒘蚧瘹洹睔狻⑶杌瘹洹⒓淄樽鳛槠鹗挤磻?yīng)物的自主催化網(wǎng)絡(luò),為尋找生命誕生伊始的早期化學(xué)反應(yīng)網(wǎng)絡(luò)提供了研究線索,被譽(yù)為生命起源研究的里程碑進(jìn)展。
2020年9月30日,Bartosz A. Grzybowski團(tuán)隊靠一臺離心機(jī)登上Nature封面論文。他們開發(fā)了一個類似離心機(jī)的非平衡系統(tǒng),其中不同的反應(yīng)區(qū)自組織成一個幾何形狀,可以決定整個過程序列的進(jìn)展。“無壁”同心液體反應(yīng)堆,將傳統(tǒng)靜態(tài)環(huán)境中的材料和/或化學(xué)系統(tǒng)移植到旋轉(zhuǎn)參照系中,具有明顯優(yōu)勢。這項研究提出了一種非平衡系統(tǒng)-旋轉(zhuǎn)液體堆,將該旋轉(zhuǎn)液體堆應(yīng)用于多步有機(jī)合成、萃取和納米分離等領(lǐng)域。
2020年10月13日,Bartosz A. Grzybowski等研究人員首次實現(xiàn)計算機(jī)設(shè)計合成復(fù)雜天然產(chǎn)物,使得機(jī)器合成不再局限于單步反應(yīng)或者文獻(xiàn)重復(fù),進(jìn)一步解放化學(xué)家的雙手。
近日,他在人工智能驅(qū)動的化學(xué)合成領(lǐng)域,再次取得里程碑式突破。
機(jī)器學(xué)習(xí),解放雙手
2020年作者團(tuán)隊開發(fā)了一款名為Allchemy的化學(xué)合成算法軟件,通過算法繪制出了數(shù)千個反應(yīng)途徑,該算法可以生成一個完整的前生命化學(xué)的反應(yīng)網(wǎng)絡(luò)。作者進(jìn)一步使用Allchemy正向合成平臺從大約200種廢棄化學(xué)品中生成巨大的合成網(wǎng)絡(luò),并從該網(wǎng)絡(luò)組成的大約3億個分子中識別出69種藥物和98種農(nóng)藥,通過實驗驗證了其中幾條路線,用可利用的廢物合成的若干目標(biāo)產(chǎn)物絕大多數(shù)步驟都為綠色路線。進(jìn)一步完善反應(yīng)知識庫、優(yōu)化代碼,專家級的自動合成路徑設(shè)計最終將變得完全可行。
圖 Bartosz Grzybowski教授 圖片來源:UNIST
關(guān)鍵問題
化學(xué)工業(yè)會持續(xù)的產(chǎn)生大量的廢棄化學(xué)品,設(shè)計“循環(huán)化學(xué)”方案以有效地將這些廢棄的材料選擇性的轉(zhuǎn)化為有用的化學(xué)品是至關(guān)重要的。盡管目前已經(jīng)在某些類別的有害化學(xué)品的降解方面取得了重大進(jìn)展,但“關(guān)閉循環(huán)”(將廢棄基質(zhì)轉(zhuǎn)化為有價值的產(chǎn)品)的工作仍然零散并且集中在眾所關(guān)注的領(lǐng)域。綜合分析哪些有價值的產(chǎn)品可以從不同的化學(xué)廢物中合成是困難的,因為即使是很小的一組廢物基質(zhì),也可以在幾個步驟內(nèi)產(chǎn)生數(shù)百萬個假定的產(chǎn)品,每個產(chǎn)品都可以通過形成緊密連接網(wǎng)絡(luò)的多條路徑進(jìn)行合成。追蹤所有這些合成并選擇那些符合“綠色”化學(xué)標(biāo)準(zhǔn)的合成可以說是超越了化學(xué)家的認(rèn)知。
新思路
有鑒于此,韓國蔚山基礎(chǔ)科學(xué)研究所Bartosz A. Grzybowski教授等人展示了具有廣泛綜合知識的計算機(jī)如何幫助設(shè)計化學(xué)廢物制藥這一挑戰(zhàn)。研究團(tuán)隊使用Allchemy正向合成平臺(作者自行設(shè)計的化學(xué)合成算法軟件)從商業(yè)規(guī)模回收的大約200種廢棄化學(xué)品中生成巨大的合成網(wǎng)絡(luò),從這些網(wǎng)絡(luò)中檢索數(shù)萬條大約300種重要藥物和農(nóng)用化學(xué)品的合成路線,并根據(jù)可持續(xù)化學(xué)指標(biāo)進(jìn)行算法排名。實驗驗證了其中幾條路線并在流動化學(xué)平臺上進(jìn)行工業(yè)現(xiàn)實演示。廣泛采用計算機(jī)化的廢物轉(zhuǎn)化為有價值產(chǎn)物的算法可以加快化學(xué)品的生產(chǎn)性再利用,這在很大程度上減少了存儲或處置成本,同時也降低了對環(huán)境的危害。
技術(shù)方案
根據(jù)搜索和分析此網(wǎng)絡(luò)的算法在短時間內(nèi)設(shè)計出合成路線,同時從反應(yīng)類型/類別、允許取代基范圍、典型條件和試劑、建議的溶劑、溫度范圍等多方面對每條路線進(jìn)行評價,最后綜合決策最優(yōu)合成路線。
1)反應(yīng)規(guī)則:Allchemy中的每個轉(zhuǎn)換指定了反應(yīng)類型/類別、允許取代基的范圍、與給定反應(yīng)不兼容的結(jié)構(gòu)基序、典型條件和試劑、建議的溶劑、溫度范圍等。
2)反應(yīng)變換被迭代地應(yīng)用于感興趣的底物:每一代合成的產(chǎn)品只有在它們是小分子量的情況下才會保留用于進(jìn)一步計算。
3)廣度優(yōu)先搜索算法:用于檢索連接廢物和有價值產(chǎn)品的所有合成物,通過不同的需求與相應(yīng)的計算方式對所產(chǎn)生的合成網(wǎng)絡(luò)給與評分,以便評價合成網(wǎng)絡(luò)的優(yōu)劣。
技術(shù)優(yōu)勢
1)該程序計算了一系列分子特性(logP、能量、pKa 值等)。
2)標(biāo)記有問題的試劑(美國環(huán)境保護(hù)署 (EPA) 清單中的試劑)極度危險物質(zhì)、歐盟 REACH 法規(guī)高度關(guān)注物質(zhì)清單,并使用環(huán)境和健康標(biāo)準(zhǔn)建議“更環(huán)保”的替代品,。
3)對于每個反應(yīng),軟件都會計算原子經(jīng)濟(jì)性或反應(yīng)熱等量。
技術(shù)細(xì)節(jié)
反應(yīng)規(guī)則設(shè)置
Allchemy中的每個轉(zhuǎn)換指定了反應(yīng)類型/類別、允許取代基的范圍、與給定反應(yīng)不兼容的結(jié)構(gòu)基序、典型條件和試劑、建議的溶劑、溫度范圍等。重要的是,該程序還計算一系列分子性質(zhì),對有問題的試劑和溶劑進(jìn)行標(biāo)記,并根據(jù)環(huán)境和健康標(biāo)準(zhǔn)建議“更綠色”的替代品。例如,烯烴環(huán)氧化中建議用硫酸氫鉀代替間氯過氧苯甲酸(mCPBA),脫氧氯化用亞硫酰氯代替三苯基膦和四氯甲烷。在溶劑方面用二甲亞砜(DMSO)替代苯酚合成二甲基甲酰胺(DMF),用叔丁基乙醚代替四氫呋喃(THF)將酮還原為醇等。此外,對于每個反應(yīng)該軟件還可以計算原子經(jīng)濟(jì)或反應(yīng)熱等量。此外,在連續(xù)步驟中涉及相同溶劑的反應(yīng)序列得到促進(jìn),而需要很低或很高溫度的反應(yīng)由于能量成本高而受到抑制。
圖1 正向合成網(wǎng)絡(luò)的生成與性質(zhì)
反應(yīng)網(wǎng)絡(luò)構(gòu)建
反應(yīng)變換被迭代地應(yīng)用于感興趣的底物。盡管“化學(xué)廢物”的概念有不同的含義,在這里考慮作為底物的189個小分子確定是大規(guī)模工業(yè)過程的廢物副產(chǎn)品(圖1)。在算法的最基本版本中,每一代合成產(chǎn)物所產(chǎn)生的分子都與前幾代的產(chǎn)物和原始底物相結(jié)合并重復(fù)這個循環(huán),直到達(dá)到用戶定義的合成世代極限(圖2a)。然而,由于這種方法創(chuàng)建的反應(yīng)網(wǎng)絡(luò)(圖 2b)隨著底物數(shù)量和代數(shù)的增加而迅速擴(kuò)展(圖 2c,d),因此將網(wǎng)絡(luò)生成設(shè)置成偏向于高價值分子的合成。在這種方法中,每一代合成的產(chǎn)品只有在它們是小分子量的情況下才會保留用于進(jìn)一步計算,因此可以作為后續(xù)合成的有用構(gòu)建塊。
圖2 從廢棄底物和經(jīng)常使用的簡單輔助分子開始的更高級藥物的高級合成的例子
合成網(wǎng)絡(luò)示例
一旦網(wǎng)絡(luò)生成,廣度優(yōu)先搜索算法將用于檢索連接廢物和有價值產(chǎn)品的所有合成物,因為最短路徑不一定是最優(yōu)的,同時還考慮了長達(dá)兩步的較長的路徑。由于網(wǎng)絡(luò)的高度互聯(lián)性,一個有價值的產(chǎn)品通常有多種合成。在這里旨在減少一些不希望的反應(yīng)條件或性質(zhì)的使用,并評估整個途徑結(jié)構(gòu)。
第一個大規(guī)模網(wǎng)絡(luò)是從189個廢棄底物的基本集傳播而來,在由這個網(wǎng)絡(luò)組成的大約3億個分子中該算法識別出69種藥物和98種農(nóng)藥,表明每個目標(biāo)需要1-2081次合成。然而,單獨(dú)的廢棄物顯然缺乏合成靈活性來構(gòu)建更復(fù)雜的支架。考慮到這一點(diǎn),第二次計算用上述1000種基本和流行的試劑增加了廢物基質(zhì)的集合。使用更集中的寬度參數(shù)和更高的傳播網(wǎng)絡(luò)產(chǎn)生了超過1.6億種可合成化合物的空間,包括71種藥物和20種農(nóng)用化學(xué)品。這些靶點(diǎn)在結(jié)構(gòu)上比第一個網(wǎng)絡(luò)更復(fù)雜,包括一些世界上最常用的處方藥(例如,沙丁胺醇排名第7,卡維地洛排名第33,氯己定排名第286)。圖3顯示了根據(jù)成本函數(shù)排名靠前的一些路線,僅在少數(shù)情況下它們涉及受管制的中間體(例如,合成卡維地洛中的芳基肼,合成比索丙醇中的環(huán)氧乙烷)或程序建議沒有更環(huán)保替代品的溶劑和試劑(例如,纈沙坦合成四唑環(huán)中的疊氮化物,米拉貝隆合成中的重氮甲烷)。最后考慮了一個支持特定商業(yè)操作的網(wǎng)絡(luò),即通過按需制藥(ODP)實現(xiàn)藥品和活性成分的分散和全自動化生產(chǎn)。該網(wǎng)絡(luò)在較寬的探索寬度下產(chǎn)生了大約3.5億個分子的空間,包括額外的27種藥物和11種農(nóng)藥。特別有趣的是,ODP確定了用于COVID-19呼吸機(jī)患者急需的藥物:順阿曲庫銨(一種肌肉松弛劑)、咪達(dá)唑侖(一種鎮(zhèn)靜劑)和異丙酚(一種麻醉劑)。
圖3 在實驗室規(guī)模的合成中對選定的計算機(jī)設(shè)計的路徑進(jìn)行實驗驗證
實驗驗證
利用算法在上述網(wǎng)絡(luò)中追蹤的幾條路徑進(jìn)行了實驗驗證。首先進(jìn)行了如圖4所示的實驗室規(guī)模的綜合,目的僅僅是確認(rèn)計算機(jī)設(shè)計方案的總體正確性。之所以選擇這些例子是因為該軟件提出了一些有趣的轉(zhuǎn)換(例如,氨苯砜合成中的重排)或者是因為所提議的路徑在幾個步驟中缺乏先前的文獻(xiàn)先例。合成通常很簡單,并且在Allchemy建議的條件下以良好的產(chǎn)率進(jìn)行。
接下來使用以廢物流為原料的ODP的流動化學(xué)平臺在更大規(guī)模和實際工業(yè)環(huán)境中測試了計算機(jī)規(guī)劃路線的適用性。具體而言,在順式阿曲庫銨、咪達(dá)唑侖和丙泊酚等中間體的連續(xù)過程中ODP建立了隔離點(diǎn)以確保高產(chǎn)品質(zhì)量(圖 5a-c)。此工藝中在總摩爾數(shù)為5 mol%的香草酸和愈創(chuàng)木酚存在下生成酰氯衍生物,隨后進(jìn)行反應(yīng)和分離,最終允許從工藝流中選擇性提取極性更大的雜質(zhì)。有了這種純化,12小時的生產(chǎn)運(yùn)行產(chǎn)生了超過1 kg的順阿曲庫銨中間體。批量實驗表明,當(dāng)二苯甲酮被10 mol%的硝基苯和氯苯污染時對內(nèi)酰胺轉(zhuǎn)化的影響最小。對于生產(chǎn)運(yùn)行二苯甲酮與溴乙酰氯反應(yīng),經(jīng)過10小時運(yùn)行得到48 g乙酰胺。最后,由 4-羥基苯甲酸在異丙醇中制成了一種脂溶性麻醉劑異丙酚。通過ODP系統(tǒng)運(yùn)行12小時生產(chǎn)了150 g DIHA。額外的凈化單元操作如再結(jié)晶可以提高純度。這些流程都可以滿足當(dāng)?shù)蒯t(yī)院系統(tǒng)的供應(yīng)。
圖4 在自動化、模塊化的ODP平臺上合成COVID-19重癥監(jiān)護(hù)室藥物或其中間體。
展望
總而言之,作者展示了配備了全面的化學(xué)反應(yīng)性規(guī)則的計算機(jī)可以快速追蹤和排序前所未有的循環(huán)合成,建立工業(yè)化學(xué)廢物的新的生產(chǎn)性用途。對特別描述的方案進(jìn)行擴(kuò)展和改進(jìn)可以獲得更準(zhǔn)確的數(shù)據(jù)來估計過程相關(guān)指標(biāo),則要求應(yīng)該對候選合成進(jìn)行排序的成本函數(shù)進(jìn)行更新。對描述足夠廣泛的酶的底物范圍時應(yīng)將這些生物催化轉(zhuǎn)化添加到Allchemy的反應(yīng)知識庫中。Allchemy等應(yīng)用如果在整個化學(xué)工業(yè)中得到采用和共享將是最具影響力的。例如,一些公司輸入希望處理的廢物基質(zhì),一些公司表示希望合成的產(chǎn)品,一些公司投標(biāo)執(zhí)行該機(jī)器計劃的廢物-藥物合成。在執(zhí)行這些任務(wù)時設(shè)想了Allchemy等軟件(引導(dǎo)化學(xué)家找到潛在的增值機(jī)會)和 ODP 等分布式制造網(wǎng)絡(luò)(利用當(dāng)?shù)乜捎玫膹U物流快速且經(jīng)濟(jì)高效地部署多個生產(chǎn)單元)之間的協(xié)同作用。這樣一個全行業(yè)的系統(tǒng)將有助于同步循環(huán)化學(xué)工作。
參考文獻(xiàn):
Bartosz A. Grzybowski et. al. Computer-designed repurposing of chemical wastes into drugs. Nature, 2022, 604:668-676
DOI: 10.1038/s41586-022-04503-9.
https://www.nature.com/articles/s41586-022-04503-9