AI浪潮來襲,算力需求爆發(fā)。國內AI服務器廠商和各類芯片企業(yè)無不積極擁抱這場巨大變革。
“單個GPU已經無法跑Transformer、BERT、GPT這些大模型,需要幾百個甚至上千個GPU連在一起才能跑起來?!眹鴶导?lián)創(chuàng)始人兼首席執(zhí)行官巍騖在接受第一財經采訪時稱,目前內存容量快速增長,GPU性能呈指數級增長,但I/O(輸入/輸出)卻沒有跟上,成為AI算力提升瓶頸,導致GPU等未充分利用,造成資源浪費,業(yè)界正試圖解決這一問題。
中金公司也認為,除了依靠單個GPU性能升級外,還需要高速的芯片互聯(lián)技術、系統(tǒng)互聯(lián)技術作為支撐,從而提升GPU算力的可擴展性,形成強大的集群算力。
(相關資料圖)
互聯(lián)接口芯片市場預計增至250億美元
隨著AIGC浪潮興起,AI服務器需求增長,服務器內部之間或與其他設備的數據傳輸、控制和管理等接口功能的要求也隨之增加。
市場調研機構650 Group報告顯示,從2022年到2027年,全球數據中心的互聯(lián)接口芯片市場規(guī)模將翻番,達到250億美元。主要的驅動力除了AI、機器學習 (ML),還包括數據分析、富媒體應用和其他高性能分布式計算,以及不斷激增的邊緣側和物聯(lián)網設備向云端傳輸數據、使用云端服務。
中金公司表示,在高性能服務器強增長的趨勢下,內存接口芯片和PCIe接口芯片作為核心數據傳輸環(huán)節(jié),有望加速升級迭代,量價齊升推動市場顯著增長。
內存接口芯片是服務器內存模組的核心邏輯器件,其連接CPU和DRAM,集成在內存模組內,能夠提升內存數據訪問的速度及穩(wěn)定性。美光預計到2025年,服務器DRAM需求相較2021年將實現(xiàn)2倍提升,而AI服務器DRAM容量將是普通服務器的8倍。
內存模組市場正在由DDR4世代向DDR5世代迭代升級。目前DDR5內存接口芯片的競爭格局與DDR4世代類似,全球由瀾起科技(688008.SH)、瑞薩電子和Rambus三家供應商提供DDR5第一子代的量產產品。
其中,瀾起科技2022年牽頭制定DDR5第二子代、第三子代內存接口芯片及第一子代高帶寬內存接口芯片MDB等產品的國際標準,并積極參與DDR5第一子代CKD和DDR5內存模組配套芯片標準制定。
PCIe是一種高速串行計算機擴展總線標準,可實現(xiàn)高速串行點對點雙通道高帶寬傳輸。PCIe產業(yè)鏈主要以IP(DPU、GPU)接口、PCIe Retimer/Redriver、PCIe Switch形態(tài)存在,以及各種PCIe Bridge(比如NVME控制器)。
PCIe Switch芯片兼具連接和交換功能,可以提供擴展能力,幫助CPU連接更多設備,實現(xiàn)PCIe設備互聯(lián)。華安證券表示,AI服務器內日益增加的PCIe節(jié)點和復雜的網絡架構需要更多PCIe Switch。市場調研機構Transparency預測,2027年PCIe Switch全球市場規(guī)模將達到92億美元,2019-2027年復合增長率(CAGR)達15% 中金公司認為,在AI大算力需求下,PCIe Switch是數據中心低功耗、高性能解決方案核心一環(huán)。
由于技術壁壘極高,PCIe Switch芯片市場主要由博通、微芯科技和祥碩科技供應,中國大陸在該領域還是空白。不過,除了這些傳統(tǒng)芯片廠商,AI行業(yè)巨頭英偉達,硅谷新興硬科技公司Astera Labs、Enfabrica以及中國大陸的國數集聯(lián)等也都將加入這一近百億美元的市場。據悉,Enfabrica創(chuàng)始團隊主要來自博通、思科和谷歌,國數集聯(lián)創(chuàng)始團隊來自阿里和思科。
下一代芯片互聯(lián)標準CXL或帶來新的可能性
由于AI和高性能計算需求激增,為了突破傳統(tǒng)PCIe帶寬限制造成的通信瓶頸,英偉達首創(chuàng)NVLink + NVSwitch技術,為多GPU系統(tǒng)提供更加快速的系統(tǒng)內互聯(lián)解決方案。
2016年,英偉達發(fā)布了搭載NVLink的第一款產品Pascal GP100 GPU。NVLink主要用于GPU與GPU之間以及GPU與CPU之間的信息傳輸。借助NVSwitch,NVLink連接可在節(jié)點間擴展以創(chuàng)建多節(jié)點GPU集群。通過NVLink + NVSwitch + InfiniBand和GPU,英偉達在高端的互聯(lián)市場筑牢競爭壁壘,并牢牢掌握AI產業(yè)的話語權。
隨著技術迭代升級,CXL(Compute Express Link)的出現(xiàn)讓單一巨頭強大的生態(tài)控制出現(xiàn)了裂痕,芯片廠商、服務器廠商有機會借此進入這一市場,提供擴展性更好、性價比更有優(yōu)勢、功耗更低的硬件產品。
CXL標準2019年初由英特爾公司牽頭,多家國際知名公司共同推出,旨在提供CPU和專用加速器、高性能存儲系統(tǒng)之間的高效、高速、低延時接口,以滿足資源共享、內存池化和高效運算調度的需求。
作為下一代芯片互聯(lián)的標準,CXL主要解決服務器內部芯片間高速互聯(lián)問題。與二十年前PCIe總線標準發(fā)布創(chuàng)立模塊化和分工明確的服務器和個人電腦產業(yè)一樣,CXL標準的頒布將開創(chuàng)連接為中心的異構集群計算時代。
“傳統(tǒng)的PCIe相當于高速公路,在上面走的是小轎車。隨著PCIe標準逐漸升級迭代,路的通道從兩車道到四車道到八車道。然而GPU算力越來越高,小車相當于變成了大卡車。為了更快地運輸,CXL相當于在通道上鋪了國際標準的鐵軌,專門跑高鐵(GPU、內存和其他高速芯片)。高鐵越來越多,就需要引入紅綠燈機制(Switch),防止相撞。如果紅綠燈算法擁有城市大腦能力,交換效率就會很高?!蔽◎\對第一財經解釋稱。
與英偉達采用NVLink專有接口解決方案不同,CXL是行業(yè)共同推出的標準。基于這一“國標鐵軌”,博通、微芯科技躍躍欲試,希望復制“高速公路”時期的成功。Astera Labs、Enfabrica以及國數集聯(lián)也正利用CXL協(xié)議,基于傳統(tǒng)PCIe技術構建下一代“紅綠燈”調度系統(tǒng)。此外,瀾起科技也是CXL聯(lián)盟的成員單位之一。
關鍵詞: