引言
在4月9日,全球頂級學術期刊《自然》(Nature)刊登了曦智科技在光電混合計算領域的最新成果《超低延遲大規模集成光子加速器》(An integrated large-scale photonic accelerator with ultralow latency)。這一成果標志著曦智科技自八年前創始人沈亦晨博士在《自然·光子學》(Nature Photonics)上發表封面文章《由納米光學回路實現的深度學習》以來,再次登上全球頂級學術期刊,同時也展示了曦智科技在光電混合計算領域的重大突破。
該成果的發布緊接著3月25日曦智科技發布的光電混合計算卡——曦智天樞(Xizi Tianzhu),再一次證明了曦智科技在光電混合計算技術上的領先地位。
曦智科技的此次成功,得到了業界的高度認可,特別是在光電混合計算系統的工程化和商業化應用方面的顯著進展。沈亦晨博士表示:“PACE(光電算術計算引擎)是研究者2021年發布的產品。研究通過在《自然》這樣的頂級期刊上公開研究者的技術細節,研究者希望能夠開放技術路線,吸引更多行業的參與,推動光電混合生態的快速發展。”此次在《自然》期刊上發表的論文,展示了曦智科技基于光電集成技術的創新加速器,并且提供了實測數據,證明了其在計算延遲方面的顯著優勢。
審稿人對曦智科技團隊的努力給予了高度評價,尤其是在光子計算工程化實現方面,認為該研究突破了以往通過小規模演示推測性能的限制,展示了真正的大規模光子矩陣計算系統。
研究背景
光電混合計算是集成光子學的前沿技術,因其在高速計算、低延遲傳輸等方面的潛力,廣泛應用于短程通信、自動駕駛、光子計算等領域。與傳統的電子計算材料相比,光子材料具有更高的計算速度和更低的功耗,特別是在大規模并行計算和光子矩陣運算中展現了獨特的優勢。然而,盡管光子計算技術的前景廣闊,現有技術面臨著光子集成系統規模化、標準化設計、以及復雜電光混合封裝等一系列挑戰。尤其是如何在大規模集成的光子系統中,確保計算延遲和系統穩定性,仍然是技術實現過程中的主要難點。
針對這一挑戰,新加坡曦智科技Lightelligence Pte. Ltd公司的曦智科技創始人沈亦晨博士團隊、Huaiyu Meng、Bo Peng等在“Nature”期刊上發表了題為“An integrated large-scale photonic accelerator with ultralow latency”的最新論文。該團隊設計并制備了一款大規模光電集成加速器,成功實現了超低延遲的光子矩陣計算。該加速器集成了超過16,000個光子組件,并通過創新的2.5D混合封裝技術,成功將光電芯片與電子控制芯片協同工作,形成高效的計算系統。通過該系統,團隊實現了標準線性矩陣乘加(MAC)運算,計算頻率高達1 GHz,單周期延遲低至3 ns,顯著提高了光電混合計算的性能,特別是在處理計算延遲敏感的復雜優化問題(如伊辛問題和最大割問題)時,表現出優異的計算效率。
這一進展不僅展示了曦智科技在光電混合計算產品化方面的技術突破,還通過實測數據驗證了大規模光電集成系統在商用計算場景中的應用潛力。該團隊的成功為光電混合計算技術的商業化落地提供了重要參考,也為未來大規模光電計算系統的工程化推進奠定了基礎。
研究亮點
(1)實驗首次開發了超低延遲的大規模集成光子加速器,整合了超過16,000個光子組件。該系統設計能夠執行標準的線性矩陣乘加(MAC)功能,具備高達1GHz的頻率和極低的延遲,單周期延遲僅為3納秒。
(2)實驗通過創新的2.5D混合封裝技術,成功將光子計算芯片與電子芯片集成,解決了光電混合計算在商業化中的包裝和集成難題。通過這一技術,系統展示了在光子矩陣計算中的顯著優勢,尤其在延遲方面,相較于傳統電子計算方案,延遲性能提高了兩個數量級。
(3)通過該加速器,實驗展示了光電混合計算在求解復雜的組合優化問題中的應用,例如伊辛問題(Ising)和最大割問題(Max-cut),并證明其在處理這些問題時的高效性。實驗結果表明,光電混合計算在大規模計算任務中具有極大的潛力,能夠在低延遲的條件下提供高質量的解決方案。
圖文解讀
圖1:啟發式遞歸算法的延遲比較和原理。
圖2:高性能光子計算處理器Photonic Arithmetic Computing Engine,PACE系統實現。
圖3:光學矩陣乘法精度分析。
圖4:系統中配置的兩個伊辛Ising模型。
圖5:PACE伊辛收斂及其與商用A10 GPU比較。
結論展望
總之,本文成功實現了基于商業硅光子技術的高集成64×64光子加速器系統。光子MAC電路通過將超過16,000個組件集成在單芯片上得以實現。系統達到了7.61位的平均位精度,并演示了在超低延遲下解決最大割問題的應用。研究者將該系統解決相同計算工作負載的性能與商用高性能A10 GPU進行了對比。實驗結果表明,相比商用GPU,PACE系統中的oMAC在延遲和計算時間上實現了超過兩個數量級的改進。研究者相信,這一成果有助于推動基于大規模集成光子電路的新型計算模型、系統架構和應用的探索。
原文詳情:
Hua, S., Divita, E., Yu, S. et al. An integrated large-scale photonic accelerator with ultralow latency. Nature 640, 361–367 (2025).
https://doi.org/10.1038/s41586-025-08786-6