日前,一則有關(guān)“2美元/小時(shí)出租H100:GPU泡沫破滅前夜”的報(bào)道引發(fā)國(guó)內(nèi)市場(chǎng)高度關(guān)注。相關(guān)文章指出:
英偉達(dá)H100 GPU在2023年3月上市之后,因需求激增供不應(yīng)求,其租賃價(jià)格從最初的每小時(shí)4.7美元一度飆升至每小時(shí)8美元以上。但今年以來,H100開始“供過于求”,每小時(shí)租賃價(jià)格降至2美元左右。
價(jià)格下跌是多方因素導(dǎo)致的:1)有些長(zhǎng)期預(yù)訂H100的公司完成模型訓(xùn)練之后,轉(zhuǎn)售閑置未使用的算力;2)許多公司不再?gòu)念^訓(xùn)練新模型,轉(zhuǎn)而微調(diào)開放模型,算力需求大幅降低;3)專注構(gòu)建大規(guī);A(chǔ)模型的新創(chuàng)公司數(shù)量大幅減少;4)H100的替代品出現(xiàn),如AMD和英特爾GPU,等等。
對(duì)這篇報(bào)道進(jìn)行溯源后可以發(fā)現(xiàn),海外主流媒體及主要科技媒體暫未進(jìn)行相關(guān)報(bào)道,原報(bào)道標(biāo)題為《$2 H100s:How the GPU Bubble Burst》(2美元H100:GPU泡沫是如何破滅的),來自一個(gè)名為L(zhǎng)atent Space的網(wǎng)站,原文作者為Eugene Cheah。
根據(jù)網(wǎng)站介紹,Latent Space主要聚焦于AI,形式集內(nèi)容訊息、博客、社區(qū)為一體,由swyx及Alessio Fanelli共同主持,前者的社交平臺(tái)賬號(hào)并未給出帶有具體身份自我介紹,后者則為早期風(fēng)投公司Decibel VC的合伙人和CTO。
據(jù)Cheah在“GPU泡沫”一文原文末尾的介紹,F(xiàn)eatherless.Ai目前托管著全球最大的開源AI模型,“每月10美元起,可立即訪問,無限制請(qǐng)求,價(jià)格固定;可通過無服務(wù)器方式即時(shí)推理,無需昂貴的專用GPU”。
“GPU泡沫”一文原文中有張配圖,那是法國(guó)藝術(shù)家讓-萊昂·熱羅姆在1882年創(chuàng)作的油畫《郁金香狂熱》(Le Duelàla tulipe)。
這幅畫描繪了有記錄以來的歷史上第一次投機(jī)泡沫——17世紀(jì)荷蘭的“郁金香狂熱”,郁金香的價(jià)格在1634年持續(xù)攀升,并于1637年2月崩盤,投機(jī)者手中只剩下最初投資額的5%。
三百多年前的投機(jī)泡沫會(huì)否再次上演?這個(gè)問題牽動(dòng)著每一位AI投資者的神經(jīng),或許也是這一次“H100租賃價(jià)格下跌”一文引發(fā)高度關(guān)注的原因。
從算力租賃商Vast.ai網(wǎng)站報(bào)價(jià)可以看到,1x H100的一小時(shí)租賃報(bào)價(jià)確實(shí)已經(jīng)在2~3美元的區(qū)間內(nèi)。
一方面,從Eugene Cheah的文章來看,“H100價(jià)格下跌”可能用“分化”來形容更為合適——持續(xù)下降的主要是小規(guī)模集群的租賃價(jià)格,相較之下,大規(guī)模算力集群的價(jià)格則可能依然維持在較高水平。
而這些大規(guī)模算力集群的背后,多是諸如特斯拉、微軟、OpenAI一類的科技巨頭。Omidia數(shù)據(jù)顯示,H100發(fā)布之后的那個(gè)2023年第三季度,其出貨量達(dá)到65萬(wàn)張,其中,僅Meta和微軟就分別拿下了15萬(wàn)張,占比接近一半。
另一方面,電子產(chǎn)品都有更新迭代周期,GPU芯片同樣如此。之前英偉達(dá)下一代GPU Blackwell系列傳出設(shè)計(jì)存在缺陷,可能延遲出貨。但摩根士丹利上周發(fā)布報(bào)告稱,Blackwell的生產(chǎn)正在“按計(jì)劃進(jìn)行”,且未來12個(gè)月左右的供應(yīng)已經(jīng)售罄,這意味著現(xiàn)在下訂單的客戶要到2025年底才能收到貨,“這將繼續(xù)推動(dòng)對(duì)現(xiàn)有Hopper架構(gòu)產(chǎn)品的強(qiáng)勁短期需求”。
H100租賃價(jià)格并非驟然暴跌,波動(dòng)已有時(shí)日。從A100到H100,從H100到H200,再到未來的Blackwell,新品出世勢(shì)必帶來前代產(chǎn)品的沒落,更不用說,Blackwell的算力成本有望比Hopper進(jìn)一步降低。
黃仁勛這位英偉達(dá)“掌舵人”也在日前現(xiàn)身說法。在接受Altimeter Capital采訪時(shí),他強(qiáng)調(diào),對(duì)英偉達(dá)的持續(xù)看漲與互聯(lián)網(wǎng)泡沫頂峰時(shí)期圍繞思科的狂熱完全不同。英偉達(dá)正在“重塑計(jì)算”,未來將是“高度機(jī)器學(xué)習(xí)”的時(shí)代。
“摩爾定律已經(jīng)基本宣告終結(jié)”,他表示,為了提供必要的算力以跟上未來計(jì)算密集型軟件的步伐,未來4~5年內(nèi),現(xiàn)有數(shù)據(jù)中心將需要價(jià)值約1萬(wàn)億美元的GPU來實(shí)現(xiàn)升級(jí)。
必須承認(rèn)的是,“AI泡沫”論的警鐘敲了又敲,“AI投資回報(bào)難達(dá)預(yù)期”的質(zhì)疑聲音一浪高過一浪,一邊是OpenAI抱怨算力上線不及時(shí)不夠用、英偉達(dá)新品售罄,另一邊是算力租賃價(jià)格不斷下降,還有公司“甩賣”GPU。
但局部、短期的算力過;蚨倘,似乎已難以代表AI的全盤局面,對(duì)于供需兩方、多空兩邊來回博弈的AI領(lǐng)域來說,在硬件端之外,或許亟待更多新故事。