人工智能(AI)正在臨床診斷、自動駕駛、語音翻譯等各個領域掀起一場革命。然而,現代社會數據量的快速增長對人工智能中使用的電子計算硬件提出了巨大的挑戰,無論是在計算速度還是功耗方面,這些問題已經成為人工智能的一個主要瓶頸。隨著人工智能的興起,傳統的電子計算方法逐漸達到其性能極限,并受限于待處理數據的快速增長。在各種人工智能中,人工神經網絡因其優異的性能被廣泛應用于人工智能任務。這些網絡使用多層互連的人工神經網絡來執行復雜的數學運算,所使用大部分計算資源的基本運算叫做矩陣——向量乘法。研究人員已經做出了各種努力來設計和實現特定的電子計算系統,以加速人工神經網絡中的處理過程。特別是,通過使用被稱為專用集成電路、大腦啟發計算和存儲器內計算的定制芯片,已經取得了相當大的成功,借此利用稱為憶阻器的存儲器設備陣列來執行原位處理。電子是電子計算中信息的載體,但光子長期以來被認為是一種替代選擇。這主要是因為:1)速度更快:光的光譜覆蓋了很寬的波長范圍,許多不同波長的光子可以同時被多路復用(并行傳輸)和調制,而光信號不會相互干擾,這種以光速傳播信息的方式實現了最小的時間延遲。2)功耗更低:無源傳輸(不需要輸入功率)有助于實現超低功耗,而相位調制(光波的量子力學相位會發生變化)可以輕松調制并檢測頻率高于40千兆赫的光。在過去的幾十年里,光纖通信取得了巨大的成功。然而,使用光子進行計算仍然具有挑戰性,尤其是在規模和性能水平上與最先進的電子處理器相當。這一困難源于缺乏合適的并行計算機制、允許人工神經元的高速非線性(復雜)響應的材料以及用于集成到計算硬件中的可擴展光子設備。幸運的是,過去幾年來,光學頻率梳的發展為集成光子處理器帶來了新的機遇。光學頻率梳是一組光源,其發射光譜由數千或數百萬條頻率均勻且間隔緊密的清晰譜線組成。這些器件在光譜學、光學時鐘計量和電信等領域取得了巨大成功,并獲得了2005年諾貝爾物理學獎。光學頻率梳可以集成到計算機芯片中,并用作光學計算的節能能源。該系統非常適合通過波長復用進行數據并行化。人工智能的爆炸性增長,對快速提高計算能力提出了更高的要求。近日,兩種光子處理器可以滿足這些功率要求,并徹底改變人工智能硬件。2020年1月8日,最新一期Nature雜志一天之內連續發表3篇文章,對此進行報道,包括2篇研究論文和1篇述評文章。澳大利亞斯威本科技大學David J. Moss團隊和德國明斯特大學W. H. P . Pernice、英國牛津大學H. Bhaskaran、瑞士洛桑聯邦理工學院T. J. Kippenberg、 IBM歐洲研究中心A. Sebastian團隊分別以“11 TOPS photonic convolutional accelerator for optical neural networks”和“Parallel convolutional processing using an integrated photonic tensor core”報道了光子處理器,研究通過利用光的獨特屬性來加速人工智能處理,這一突破有利于激發光學計算的復興。清華大學Huaqiang Wu和Qionghai Dai為該重要進展撰寫了評論文章。Xu等人利用這種裝置制造了一種多功能的集成光子處理器,執行一種矩陣矢量乘法,稱為圖像處理應用卷積。作者采用了一種巧妙的方法來進行卷積,首先利用色散——即透射光的速度取決于其波長——為波長多路復用的光信號產生不同的時間延遲。然后,他們沿著與光波長相關的維度組合這些信號。通過充分利用光子波長的寬范圍,Xu等人實現了不同卷積運算的內在并行計算。1)使用單個處理內核時,光學計算速度超過每秒10萬億次運算,并且僅受數據吞吐量的限制。2)作者確定了他們的光子卷積處理器在實際應用中的切入點,建議該處理器可用于光電混合框架,如光纖通信過程中的原位計算。Feldmann等人則獨立地制作了一個集成光子處理器,該處理器可以對跨越二維空間的光信號進行卷積。該設備在基于相變材料(一種可以在非晶相和晶相之間切換的材料)的“內存”計算架構中使用光學頻率梳。作者通過波長復用將輸入數據完全并行化,并使用相變材料的集成單元陣列進行模擬矩陣矢量乘法。1)這種高度并行化的框架可以在一個步驟中高速處理整個圖像。2)從理論上來說,在不久的將來該系統可以使用商業制造手段和輔助原位機器學習來大規模擴展。因為卷積過程涉及無源傳輸,所以理論上光子處理核心的計算可以以光速和低功耗來執行。這種能力對于高能耗應用非常有價值,例如云計算。
圖2 使用基于光子芯片的微梳和相變材料的光子存儲器計算。鑒于傳統電子計算方法面臨的挑戰,集成光子學作為未來計算架構實現前所未有的性能,為整個領域帶來了新的希望。然而,建立一個實用的光學計算機將需要廣泛的跨學科努力和材料科學、光子學、電子學等研究人員之間的合作。盡管已報道的光子處理器具有高單位面積計算能力和潛在的可擴展性,但問題依然嚴峻:1)全光學計算規模(光學人工神經元的數量)仍然很小。2)能量效率受到固有吸收光的計算元件的限制,并且因為電信號和光信號經常需要相互轉換。開發先進的非線性集成光子計算架構,而不是一維或二維線性卷積,是一個可能的解決方案。通過將電子電路和數千或數百萬個光子處理器集成到一個合適的架構中,一個同時利用光子和電子處理器的混合光電框架,可以在不久的將來徹底改變人工智能硬件,在通信、數據中心運營和云計算等領域大有可為!通訊作者:W. H. P . Pernice、H. Bhaskaran、T. J. Kippenberg和A. Sebastian通訊單位:德國明斯特大學、英國牛津大學、瑞士洛桑聯邦理工學院、 IBM歐洲研究中心
通訊作者:Huaqiang Wu、Qionghai Dai[1] Xingyuan Xu, et al. 11 TOPS photonic convolutional accelerator for optical neural networks, Nature, 2021, 589: 44-51.DOI: 10.1038/s41586-020-03063-0https://www.nature.com/articles/s41586-020-03063-0[2] J. Feldmann, et al. Parallel convolutional processing using an integrated photonic tensor core, Nature, 2021, 589: 52-58.DOI: 10.1038/s41586-020-03070-1https://www.nature.com/articles/s41586-020-03070-1[3] Huaqiang Wu, et al. Artificial intelligence accelerated by light, Nature, 2021, 589: 25-26.DOI: 10.1038/d41586-020-03572-yhhttps://www.nature.com/articles/d41586-020-03572-y