發(fā)布時間:2024-12-28 02:35:10 來源:下愚不移網(wǎng) 作者:探索
作者 亞洲視覺科技研發(fā)總監(jiān) 陳經(jīng) 編輯 鄭可君 蘇揚
授權(quán)轉(zhuǎn)載,中國本文首發(fā)于騰訊新聞科技頻道:“中國英偉達”猝死于2024
行業(yè)看到“美國禁令”的英偉大利好之后,感覺機會來了紛紛行動。達猝如今正在經(jīng)歷冰火兩重天。死于
國產(chǎn)芯片設(shè)計公司正在經(jīng)歷冰火兩重天——一些公司風光上市,中國一些公司卻不得不走進ICU。英偉
9月12日,達猝國產(chǎn)GPU獨角獸壁仞科技進入了上市輔導程序,死于IPO在即。中國11月11日,英偉消息稱摩爾線程已完成股份制改造,達猝目標科創(chuàng)板上市。死于作為對比,中國國產(chǎn)廠商象帝先卻被傳出解散的英偉消息。
2020年9月,達猝中科院計算機專家唐志敏牽頭創(chuàng)立象帝先,進入GPU創(chuàng)業(yè)賽道,被外界稱之為“中國英偉達”,同年象帝先拿下天使輪融資,并于2023年完成來自14個投資方的3輪融資,隨后于2024年成為重慶市獨角獸企業(yè),估值150億元。
針對解散傳聞,象帝先發(fā)文回應稱未解散、清算,只是通過人員優(yōu)化降低成本,并且會保留核心研發(fā)團隊,并且正在積極與投資者溝通,尋找外部融資。
象帝先對解散傳聞的回應
一時間,象帝先為什么會突然大舉收縮,國產(chǎn)GPU創(chuàng)業(yè)賽道開始洗牌了嗎?這些也成為了國產(chǎn)GPU乃至整個芯片產(chǎn)業(yè)需要思考的問題。
01 “中國英偉達”的戰(zhàn)略誤判
2014年9月,國家集成電路產(chǎn)業(yè)投資基金(簡稱大基金)成立,一期募資超過1300億元,制造與設(shè)計都是當時重點的投資方向。在此之前的6月份,《國家集成電路產(chǎn)業(yè)發(fā)展推進綱要》就已經(jīng)公布,其中有兩個關(guān)鍵目標:
2020年,“集成電路產(chǎn)業(yè)與國際先進水準的差距逐步縮小,16、14納米制造工藝實現(xiàn)規(guī)模量產(chǎn)”;
2030年“集成電路產(chǎn)業(yè)鏈主要環(huán)節(jié)達到國際先進水準,一批企業(yè)進入國際第一梯隊”
在這一大背景下,國內(nèi)GPU創(chuàng)業(yè)第一波大潮拉開序幕,芯原微、景嘉微、龍芯等在這一階段都開始布局相關(guān)項目。
不同時期成立的國產(chǎn)GPU創(chuàng)業(yè)項目,數(shù)據(jù)來源:企查查
現(xiàn)在回頭來看,當初《綱要》對晶圓代工部分定的KPI其實完成得還不錯。
2020年,中芯國際已能夠以95%的良率實現(xiàn)14納米的量產(chǎn),如今還突破到更先進的節(jié)點,不過我們也要正視問題:先進工藝依舊在不斷往前推進,過去的先進工藝,將來會被劃分到成熟工藝;我們的制造能力進步都建立在進口設(shè)備的基礎(chǔ)之上,距離全產(chǎn)業(yè)鏈的國際先進水平目標仍有差距。
到了2018年,中、美科技競爭加劇,斷供的風險急劇飆升——中興通訊被迫喊出“美國禁令將使公司立即進入休克狀態(tài)”,臺積電被迫停止向華為提供麒麟芯片代工服務,國產(chǎn)GPU創(chuàng)業(yè)進入第二輪投資浪潮,象帝先就是在這一輪創(chuàng)業(yè)大潮下誕生,同期的國產(chǎn)團隊還包括壁仞科技、摩爾線程、沐曦等。
象帝先董事長唐志敏是中國芯片領(lǐng)域罕見的戰(zhàn)略級科學家,我在20多年前就有過了解,曾在多家國產(chǎn)芯片項目當中擔任負責人。
2000年,龍芯董事長胡偉武的熱文《我們的龍芯一號》中,唐志敏就以龍芯項目負責人的身份出現(xiàn)。在創(chuàng)立象帝先之前,唐志敏還領(lǐng)導了海光的CPU、DCU項目,不過相關(guān)項目商業(yè)化都不是很成功,關(guān)鍵問題還是因為過度依賴AMD的Zen1授權(quán),這里不展開討論。
2020年9月成立初期,象帝先完成天使輪融資,2022年完成A輪融資。到2021年,兩年時間公司規(guī)模已超過200人,發(fā)展速度非???,而不久前由哈佛3名00后輟學生組建的AI芯片項目“Etched”團隊僅僅只有35個人,所以不少觀點認為,象帝先在前期擴張?zhí)?,但這種比較略顯絕對,后文再詳細展開。
2022年,象帝先迎來高光時刻,當年基于Imagination的IP核授權(quán),流片并發(fā)布了“天鈞一號”GPU——12納米工藝,2048個計算核,4TFLOPS的FP32算力、16TOPS的AI算力、16GB顯存、256GB/s帶寬。
橫向?qū)Ρ扔布笜耍蟮巯鹊?ldquo;天鈞一號”在帶寬、算力和工藝上與2022年的國產(chǎn)競品有一定差距,其性能勉強追上英偉達2019年的中高端產(chǎn)品RTX 2060(如下表),后者同樣采用12nm工藝,總計1920個計算核心,6.5TFLOPS的FP32算力,51.6TOPS的AI算力,6GB顯存,帶寬336GB/s。
相關(guān)GPU產(chǎn)品硬件指標對比,來源:產(chǎn)品官網(wǎng)及相關(guān)報道
2023年9月,象帝先發(fā)布“天鈞二號”,這代產(chǎn)品定位低端,1024個計算核心、2.6TFLOPS的FP32算力、8GB顯存、128GB/s帶寬,主打低功耗和高性價比。
兩款產(chǎn)品作為敲門磚,幫助象帝先在2023年完成了至少來自14個資方的3輪融資,并于2024年成為重慶市獨角獸企業(yè),估值超過150億元,被諸多媒體稱之為“中國英偉達”。
不過,“中國英偉達”的帽子,對于象帝先來說不一定匹配——它要對標的英偉達,營收構(gòu)成已經(jīng)風格大變,數(shù)據(jù)中心業(yè)務占比接近90%。
英偉達營收構(gòu)成,2023財年Q1,數(shù)據(jù)中心業(yè)務首次超過游戲業(yè)務 來源:App economy insight
而象帝先直到2024年,還停留在桌面顯卡市場,唯一能和AI芯片相關(guān)聯(lián)的產(chǎn)品,是2024世界人工智能大會上亮相的一塊神秘的PCIE版本服務器顯卡XDX X1900。
外界傳過B輪融資滿5億元的對賭協(xié)議是壓垮象帝先的“最后一根稻草”,而對賭牽涉的資本問題,與整個大環(huán)境有關(guān),今年7月份,澎湃新聞在報道中披露,深創(chuàng)投大批量發(fā)起回購訴訟,通過這種方式來退出被投項目,但象帝先的境遇不能說明國產(chǎn)芯片設(shè)計團隊遭遇資本寒冬,壁仞、摩爾線程畢竟還在排隊IPO。
2024年世界人工智能大會上“象帝先”公司展出的產(chǎn)品矩陣
從我的角度來看,問題核心還是戰(zhàn)略誤判,對賭協(xié)議只是象帝先“解散”的導火索,即便沒有這個誘因,也可能會出現(xiàn)其它原因。
對于象帝先目前的資本困局,我嘗試過與其市場部前員工進行求證,但未獲得正面答復,只是表示“我們也都盼著好消息。”
02 其實,GPU廠商是“軟件公司”
國產(chǎn)創(chuàng)業(yè)項目還在追硬件指標,然而GPU競爭已經(jīng)從硬件為主、軟件為輔的比拼,轉(zhuǎn)變?yōu)橛布?軟件的綜合生態(tài)能力較量。
深度學習爆火之前,通用GPU需求數(shù)量最多的應用方向是PC桌面顯卡,英偉達、AMD、英特爾是主要玩家,其中英特爾主要在CPU上集成GPU,2022年又重回獨顯市場。三家提供的產(chǎn)品多,滿足辦公、游戲、圖形等各類需求。
根據(jù)市場研究機構(gòu)JPR的數(shù)據(jù),PC顯卡供應商市占率,英特爾憑借集成顯卡出貨占據(jù)68%份額位列第一
新入局者,想要在這樣的市場上分一杯羹,不僅需要扎實的產(chǎn)品性能,更需要運行多年的成熟供應鏈體系支撐,難度極高。
就拿象帝先的天鈞一號來說,不僅性能無法和同期國產(chǎn)產(chǎn)品抗衡,與國際市場上的對手差距在3年左右,這意味著新晉者連打價格戰(zhàn)的實力都不具備。
更重要的是,桌面顯卡聚焦圖形處理能力,而深度學習興起之后,基于并行計算優(yōu)勢,GPU找到了新的增長空間。
兩個指標可說明GPU通用計算需求“暴增”——其一,“算力頂流們”的數(shù)據(jù)中心業(yè)務急劇膨脹;其二,“硅谷巨頭”算力儲備急劇膨脹。
一方面,截至到今年10月27日的第三財季,過去四年,英偉達的數(shù)據(jù)中心業(yè)務增長了約30倍,財季營收從11億美元(占比25%)暴增到309億美元(占比88%)。
另一方面,研究機構(gòu)Omdia的數(shù)據(jù)顯示,截至2023年第三季度,英偉達H100出貨量達到65萬張,其中Meta和微軟分別拿下15萬張,接近全部訂單的一半。到2024年,微軟的Hopper系列GPU儲備量直接沖到了48.5萬張,其AI數(shù)據(jù)中心支出超過300億美元,位列所有硅谷巨頭之首。
研究機構(gòu)Omdia披露的近兩年美國主要科技公司Hopper架構(gòu)GPU的儲備量
深度學習和人工智能為GPU帶來了潛在的機會和蛋糕,但這不代表初創(chuàng)公司一定就有機會拿下,像AMD這樣的GPU老玩家,一些產(chǎn)品算力指標都超越了英偉達,但在競爭中就是打不贏,以CUDA為代表的軟件生態(tài)扮演了至關(guān)重要的作用。
有一個細節(jié),今年的GTC大會上,黃仁勛說“英偉達是一家軟件公司”,指的就是其GPU產(chǎn)品“統(tǒng)治”AI的關(guān)鍵因素之一,CUDA生態(tài)。這一點我在《沒人能“殺死”1.5萬億美元的英偉達》一文中也解釋過。額外插一句,這才過去半年多時間,英偉達市值已經(jīng)沖破3萬億美元市值。
生態(tài)系統(tǒng)的統(tǒng)治力如何理解?可以類比用戶對操作系統(tǒng)的偏好——蘋果的macOS現(xiàn)在足夠優(yōu)秀了,過去10年其市場份額翻了一倍,但Windows仍然有先發(fā)優(yōu)勢以及用戶的接受度,牢牢占據(jù)著70%的份額,這就是生態(tài)系統(tǒng)的力量。
基于GPU的通用計算,生態(tài)系統(tǒng)的重要性可能比操作系統(tǒng)還要極端——開發(fā)者一旦適應了英偉達的軟件生態(tài),就很難從其中切換出來。
舉個例子,假設(shè)某個企業(yè)要采購國產(chǎn)GPU,首先就要解決代碼兼容性問題,包括不兼容的庫和函數(shù)都要替換或者修改,雖然國產(chǎn)廠商會提供遷移工具,這仍需大量的開發(fā)工作,遷移過程還會引發(fā)應用性能損失的問題,要減少這種損失,就得根據(jù)國產(chǎn)GPU的架構(gòu)來調(diào)整優(yōu)化算法,這又進一步增加開發(fā)工作量。
設(shè)備的穩(wěn)定性也是影響效率的一個關(guān)鍵因素,之前Meta在論文中曾披露過——H100的萬卡集群訓練Llama 3.1,平均3小時故障一次,盡管很多問題都可以自動化處理,但依舊會增加人力和時間成本,最終影響效率。
而這還是H100這樣市占率超高的產(chǎn)品,一些問題還有可能在線上社區(qū)找到解決方案,一旦換成國產(chǎn)設(shè)備,如果支持生態(tài)做得不好,快速定位問題并獲取解決方案都不是一件容易得事情,用比較流行的話說,切換國產(chǎn)GPU的TCO(總擁有成本)太高。
從心理上說,應該有很多企業(yè)愿意支持國產(chǎn)芯片,采購成本不便宜也可以接受,但是從商業(yè)的角度來說,如果開發(fā)特別麻煩、使用出現(xiàn)問題,占用了研發(fā)團隊過多精力,這樣的商業(yè)合作很難維持下去。
拋開市場需不需要這么多英偉達的問題來看GPU、AI芯片創(chuàng)業(yè),現(xiàn)在很多新項目一亮相就是數(shù)十倍的“吊打”英偉達,硬件指標看上去不用擔心了,但除了紙面數(shù)據(jù)要好外,一開始就要想好如何做生態(tài)。而一旦涉及做生態(tài),對于“400人算不算多”這類問題,就會好回答很多——我所知道的是,英偉達這樣的企業(yè),在大客戶那里一般都會安排數(shù)十人的駐場支持團隊。所以,GPU廠商是“軟件公司”這個觀點現(xiàn)在來看非常貼切。
03 只做“替代”很難上牌桌
沒有生態(tài)支持的GPU通用計算項目,開局可以說是機遇與挑戰(zhàn)并存。
由于美國限制高性能AI芯片向大陸出口,客觀上給國產(chǎn)廠商打開了機會之門。當所有企業(yè)都拿不到,或者很難通過正常渠道采購海外先進產(chǎn)品時,能夠穩(wěn)定供貨的國產(chǎn)GPU就會成為爭搶對象,而且現(xiàn)在政策和機構(gòu)也在鼓勵這件事,這也會加速國產(chǎn)半導體生態(tài)的成熟與進化,華為在手機芯片上已經(jīng)驗證這一點。
與手機芯片不同,GPU作為“大芯片”,die size都在500mm?以上,比如RTX 4090是600mm?,H100是800mm?+,如果采用高帶寬內(nèi)存,還要著重考慮先進封裝技術(shù)。
用于通用計算的主流GPU(右側(cè)),die size為826mm,Cerebras WSE-2(左側(cè))專用芯片達到了46225mm
所以,除了前面說的戰(zhàn)略誤判,影響國產(chǎn)GPU成功的因素還包括IP、設(shè)計、制造、銷售等環(huán)節(jié)之中,并且環(huán)環(huán)相扣。
在設(shè)計環(huán)節(jié)首要面對的就是IP授權(quán)和設(shè)計工具的問題,象帝先、摩爾線程都是拿Imagination的IP授權(quán),然后采用海外公司的設(shè)計工具,如果這兩個領(lǐng)域得不到持續(xù)地更新支持,就存在斷供風險。
設(shè)計的下一個環(huán)節(jié)就是制造。很多企業(yè)的產(chǎn)品硬件指標,無論單項還是多項都很優(yōu)秀,但能否流片成功,并且以高良率量產(chǎn)也很關(guān)鍵。
單就流片這個環(huán)節(jié)的單次費用就高達上億元,如果流片失敗就得額外再支付費用,之前英偉達的Blackwell芯片遭遇“跳票事故”,一度帶崩其股價,英偉達可以扛得住這種風險,創(chuàng)業(yè)團隊未必能經(jīng)受住。
好消息是,在制造端,過去幾年在美國的極限施壓之下,國產(chǎn)制造工藝和設(shè)備已經(jīng)有了很大進步。9月份,工信微報披露了國產(chǎn)光刻機的進展,按官方提供的數(shù)據(jù),純國產(chǎn)設(shè)備已經(jīng)可以覆蓋65nm工藝的芯片,這對于中國芯片產(chǎn)業(yè)具有很大的意義。不過,雖然大陸自主晶圓制造技術(shù)進步迅速,但先進產(chǎn)能也相對有限。
所以,現(xiàn)階段大陸的fabless,也還離不開對臺積電的依賴。而且,因為創(chuàng)業(yè)團隊體量與需求量的差異,代工費用會有差別,同等工藝代工費用可能是臺積電的1.5倍左右,這也會影響初創(chuàng)公司的毛利率。
設(shè)計、制造之后,就是如何把產(chǎn)品賣出去,實現(xiàn)正循環(huán)。一些現(xiàn)在還活躍的一些頭部創(chuàng)業(yè)團隊,很多背后都有上市公司的支持,這些上市公司在各地推動構(gòu)建智算中心,對于創(chuàng)業(yè)團隊來說,它們既是投資人,又是客戶。這種邏輯還可以類比云計算廠商——自研AI芯片更容易成功,自己就是自己的客戶,能形成很好的自循環(huán)。
很多人問中國芯片的出路在哪里,從一個外部觀察者的視角,短期的確要實現(xiàn)自主替代,長期則需要參與到對產(chǎn)業(yè)的標準制定當中,這樣才能夠影響到全球產(chǎn)業(yè)。我想舉一個大疆的例子,它也被納入了實體清單,可結(jié)果呢?美國要制裁它,又不得不想辦法來買它的產(chǎn)品。
過去,行業(yè)看到“美國禁令”的大利好之后,感覺機會來了紛紛行動、融資開跑,是可以理解的沖動。但最終,創(chuàng)業(yè)團隊與資本在普及認知、達成共識之后,結(jié)合產(chǎn)業(yè)發(fā)展窗口來攢局,才能更好地準備應對挑戰(zhàn),在未來中國芯片生態(tài)“大成”之時,成為勝利者中的一員。如果上述條件都不具備,更多的“中國英偉達”可能會迎來不確定性。
相關(guān)文章
隨便看看