近期,DeepSeek憑借極低的訓練成本實現全球頂尖模型性能,引發市場對AI算力需求的重新評估。興業證券指出,這一技術突破將加速應用端側爆發,推動推理需求成為算力增長的核心引擎,并帶動ASIC芯片、AI服務器及PCB產業鏈的全面升級。
圖片來源:DeepSeek
推理算力
萬億級的主戰場崛起
興業證券的最新研報為我們揭開了AI行業的深層真相。曾幾何時,預訓練成本一直是大模型發展的一大阻礙,不過DeepSeek的開源帶來了轉機,成功將大模型預訓練成本壓縮至總成本的10%以下,看似預訓練降本成為了行業焦點,可實際上這僅僅是“開胃菜”。真正的“吞金獸”藏在應用落地之后,那就是推理算力。
數據最有說服力,以GPT-4為例,單次預訓練成本約6300萬美元,已然是一個天文數字。但上線后每日推理成本更是高達70萬美元,用戶每提問50次,就燒掉1美元。這清晰地表明,隨著用戶規模爆發式增長,推理算力需求將急劇攀升,成為萬億級的主戰場。
從巨頭動向也能看出端倪,Meta最新開源模型Llama 3推理算力需求同比激增3倍;谷歌則被曝正秘密研發“千卡級”推理專用服務器集群。
行業邏輯鏈也因此顛覆了我們的認知:開源降低預訓練門檻,使得更多企業得以入局AI應用開發,進而推動用戶規模指數級擴張。由于推理算力成本與用戶量線性綁定,算力基建自然而然成為了必爭之地。
定制化ASIC芯片
AI算力的“黃金賽道”
英偉達GPU價格飆漲背景下,定制化ASIC芯片成破局關鍵:
1、需求激增:博通預測2027年僅3家客戶(谷歌/微軟/Meta)的ASIC+網絡需求將達600-900億美元,Marvell預計2023-2028年AI推理芯片市場CAGR達45%。
2、國產替代:華為昇騰910B性能追平國際高端GPU,全面適配DeepSeek V3/R1模型。
3、技術突破:谷歌TPU v5推理性能較GPU提升4倍,亞馬遜Trainium芯片推理延遲壓至毫秒級。
行業暗戰邏輯清晰:GPU通用性強但成本高,ASIC芯片通過專用化實現降本增效,云廠商自研芯片正重塑全球半導體格局。
服務器“內卷”升級
PCB廠商的意外之喜
英偉達GB200系列因功率過高導致機架過熱,下一代Rubin架構或采用正交設計+PTFE材料PCB背板,單服務器PCB價值量或增長30%。
從技術升級路徑來看:
首先是層數躍遷:AI服務器主板從12層向20層+邁進,目的是為了支撐CPU/GPU異構架構,滿足日益增長的運算需求;
其次是材料革命:Low Loss高頻基材滲透率超70%,雖然提升了性能,但也使得單板成本提升30%;
再者是散熱升級:3D真空腔均熱板的導入,推動PCB散熱模塊價格翻倍。
市場測算也十分可觀。據Prismark數據,2025年全球AI服務器PCB市場規模將突破82億美元,復合增速達28%,遠遠超過傳統服務器市場。
在產業鏈動態方面,深南電路、滬電股份、廣合科技等廠商產能全線告急,部分高端PCB交期拉長至12周以上。這一系列情況都表明,在AI服務器升級的浪潮中,PCB廠商迎來了難得的發展機遇。
投資邏輯重塑
從“拼卡量”到“拼能效”
當推理算力成本成為AI商業化的生死線時,基礎設施“單位算力性價比”成為了核心競爭力。
先看巨頭布局樣本,微軟Azure部署液體冷卻服務器,成功使推理能耗下降40%;華為推出“AI算力網絡”解決方案,通過存算一體技術降低延遲。這些舉措都在表明,提升能效成為了關鍵。
除了巨頭的動作,長尾機會也不容小覷。邊緣推理設備,如智能汽車、IoT終端等,催生了ASIC+PCB微型化需求,2024年市場規?;蛲黄?20億美元。這為行業帶來了新的投資方向,不再僅僅局限于“拼卡量”,而是轉向“拼能效”,探索更具性價比的解決方案。
結語 :DeepSeek的突破不僅是一場技術進化,更開啟了AI算力從“訓練競賽”向“推理落地”的范式轉移。隨著資本開支向推理側傾斜,定制化芯片與高密度服務器將成為新一輪科技紅利的核心載體。興業證券提示,未來3-5年,率先卡位應用場景與硬科技協同的企業,有望在AI浪潮中占據戰略高地。