來源:華爾街見聞
AI領(lǐng)域又一重大突破?媒體稱,英特爾(30.54, -0.20, -0.65%)推出首款OCI芯片組,能提高AI基礎(chǔ)設(shè)施的數(shù)據(jù)傳輸速率,并減少延遲和功耗,這對需要高速數(shù)據(jù)傳輸?shù)腁I基建和應(yīng)用至關(guān)重要。
美東時間6月26日,在2024年的光纖通信會議(OFC)上,英特爾的集成光子解決方案(IPS)小組展示了業(yè)界最先進(jìn)的、也是首次完全集成的光計算互連(OCI)芯片組,該芯片組與英特爾CPU共同封裝并運行實時數(shù)據(jù)。
英特爾的OCI芯片組通過在數(shù)據(jù)中心和高性能計算 (HPC) 應(yīng)用的新興AI基礎(chǔ)設(shè)施中實現(xiàn)共同封裝的光輸入/輸出 (I/O),代表了高帶寬互連的一次飛躍。英特爾稱,我們在融合光電科技到高速數(shù)據(jù)傳輸方面實現(xiàn)一個革命性的里程碑。
功能方面,這款首款OCI芯片支持64個獨立通道,每個通道能夠以32千兆位/秒 (Gbps)的速率傳輸數(shù)據(jù),并在長達(dá)100米的光纖上高效傳輸數(shù)據(jù),有望滿足AI基礎(chǔ)設(shè)施對更高帶寬、更低功耗和更長傳輸距離日益增長的需求。它增強了集群中CPU與GPU之間的連接,并支持創(chuàng)新的計算架構(gòu),如一致性內(nèi)存擴(kuò)展和資源解耦。
新一代光學(xué)I/O技術(shù)推動了計算平臺的革新,以適應(yīng)日益增長的AI工作負(fù)載
隨著AI技術(shù)的飛速發(fā)展,自動駕駛、高級數(shù)據(jù)分析和虛擬助手等應(yīng)用在全球范圍內(nèi)日益普及,對計算資源的需求急劇增加。特別是大型語言模型如GPT,以及生成式AI技術(shù)的快速發(fā)展,極大地推動了AI技術(shù)的應(yīng)用。然而,這些先進(jìn)的AI模型需要處理和生成的數(shù)據(jù)量巨大,對計算資源和數(shù)據(jù)傳輸提出了極高的要求。
隨著機(jī)器學(xué)習(xí)模型的規(guī)模不斷擴(kuò)大,它們在AI加速工作中的作用也變得越來越復(fù)雜,需要極高的計算能力和數(shù)據(jù)處理能力才能有效運行。這種對高性能計算平臺的需求正在推動輸入/輸出(I/O)帶寬的指數(shù)級增長和(4.7, 0.10, 2.17%)數(shù)據(jù)傳輸距離的延伸。
為了應(yīng)對這一挑戰(zhàn),數(shù)據(jù)中心正在向更大的處理單元集群,如CPU、GPU和IPU的使用,以及更高效的資源利用架構(gòu),如xPU解耦和內(nèi)存池化方向發(fā)展。這些技術(shù)的實施將提高處理效率,降低系統(tǒng)延遲,并優(yōu)化資源配置,從而支持更廣泛的AI計算和應(yīng)用。
盡管傳統(tǒng)的電子I/O系統(tǒng)在傳輸大量數(shù)據(jù)時表現(xiàn)出高帶寬密度和低功耗的優(yōu)點,但其最大的弱點是傳輸距離短,通常僅限于一米內(nèi)。這嚴(yán)重限制了數(shù)據(jù)中心內(nèi)部的設(shè)備布局,使得組件之間的連接受到嚴(yán)格的空間限制。
為了突破這一限制,數(shù)據(jù)中心和早期AI集群開始采用可插拔光學(xué)模塊技術(shù),這種技術(shù)能夠提供比電子I/O更長的傳輸距離。然而,隨著AI應(yīng)用對資源的不斷增加,光學(xué)模塊在成本和能耗方面的壓力也隨之增大。
為了應(yīng)對這些挑戰(zhàn),新一代光學(xué)I/O技術(shù)應(yīng)運而生。這種技術(shù)將光學(xué)I/O與處理器(如CPU、GPU或IPU等,統(tǒng)稱為xPU)共封裝,不僅大幅提高了帶寬,還優(yōu)化了芯片內(nèi)部的光和電信號傳輸,顯著降低了能量消耗,還大幅減少了數(shù)據(jù)傳輸過程中的延遲,對于需要快速響應(yīng)的AI應(yīng)用來說至關(guān)重要。
更令人興奮的是,這項技術(shù)支持的傳輸距離遠(yuǎn)超以往,為數(shù)據(jù)中心的設(shè)計提供了更大的靈活性,使得系統(tǒng)能夠適應(yīng)更廣泛的擴(kuò)展需求。光學(xué)I/O技術(shù)的推廣不僅解決了數(shù)據(jù)傳輸?shù)耐袋c,也為AI和機(jī)器學(xué)習(xí)的未來發(fā)展鋪平了道路。
打個比方,傳統(tǒng)的電子I/O連接,類似于舊式馬車,在短距離傳輸中效率較高,但面對大量數(shù)據(jù)的長距離傳輸需求時,卻顯得力不從心。而英特爾的OCI芯片等光學(xué)I/O技術(shù),如同現(xiàn)代的汽車和卡車,不僅能在更長的距離上傳輸更多的數(shù)據(jù),而且保持?jǐn)?shù)據(jù)的完整性,大大超越了傳統(tǒng)電子I/O的性能。
隨著AI和ML模型需求的不斷擴(kuò)大,光學(xué)I/O憑借其卓越的傳輸能力和高效能源利用,成為推動未來AI技術(shù)發(fā)展的關(guān)鍵力量。就像汽車和卡車滿足了現(xiàn)代社會對快速、大規(guī)模物流的需求一樣,光學(xué)I/O使得數(shù)據(jù)能夠更快、更高效地在更長的距離上傳輸,這對于擴(kuò)展AI基礎(chǔ)設(shè)施至關(guān)重要。
英特爾在硅光子學(xué)領(lǐng)域處于領(lǐng)導(dǎo)地位
憑借超過25年的深厚研究基礎(chǔ),英特爾實驗室在集成光子學(xué)領(lǐng)域取得了開創(chuàng)性的成就。英特爾不僅是首家成功開發(fā)并大規(guī)模生產(chǎn)硅光子連接產(chǎn)品的企業(yè),更是以其卓越的產(chǎn)品可靠性,贏得了全球主要云服務(wù)提供商的信賴。
英特爾的核心競爭力在于其獨特的混合激光器晶圓上技術(shù)和直接集成工藝,這些技術(shù)不僅提高了產(chǎn)品的可靠性,還降低了成本。這種獨特的方法使得英特爾能夠在保持高效率的同時,提供卓越的性能。到目前為止,英特爾的強大生產(chǎn)平臺已經(jīng)出貨超過800萬片集成電路芯片,這些芯片集成了超過3200萬個芯片級激光器。其激光器的故障率極低(故障率小于0.1),這一指標(biāo)在業(yè)界廣泛認(rèn)可,表明故障率極低。
這些芯片被封裝在可插拔的收發(fā)器模塊中,并在大型數(shù)據(jù)中心網(wǎng)絡(luò)中得到部署,服務(wù)于多家大型云服務(wù)提供商,用于100Gbps、200Gbps和400Gbps的應(yīng)用。目前,英特爾還在開發(fā)下一代200Gbps每通道的芯片,以支持即將到來的800Gbps和1.6Tbps的應(yīng)用。
在制造工藝上,英特爾引入了全新的硅光子制造工藝節(jié)點,這一工藝不僅提升了設(shè)備性能,還實現(xiàn)了更高的集成度和更佳的耦合效率,同時顯著降低了成本。英特爾在芯片激光器和SOA性能、成本控制以及能效優(yōu)化方面不斷取得突破,芯片面積減少了超過40%,能耗降低了超過15%,進(jìn)一步鞏固了其在硅光子技術(shù)領(lǐng)域的領(lǐng)先地位。
英特爾目前的OCI芯片模塊尚處于原型階段。展望未來,英特爾正在與特定客戶合作,將OCI與他們的系統(tǒng)級芯片(SoCs)一起封裝,開發(fā)一種創(chuàng)新的光學(xué)輸入/輸出解決方案。