AI和大模型的快速發展,讓算力需求暴增。
據行業數據統計,到2030年,全球通用計算(FP32)總量將達到3.3ZFLOPS,這一數據對比2020年,總量增長近10倍。而AI計算(FP16)總量更是來到105ZFLOPS,是2020年的近500倍。
算力作為AI產業增長的底層基礎,需求激增使其整體資源面臨短缺。針對這一問題,大型互聯網企業往往有更好的高性能GPU采購渠道和算力儲備,而中小企業就無法獨善其身。
要知道8卡英偉達A100-NVLink(80GB顯存)的GPU服務器的月租金約為13.34萬元,對應全年租金約為160萬元。設備投入成本的高昂,讓他們不得不將目光紛紛投向別處。
算力租賃,也許是諸多方案中更好的選擇。
對于中小企業而言,算力租賃可以有效減少AI大模型的訓練成本,降低AI更高領域的研究門檻。要知道目前的AI機器人并不是簡單的執行代碼,而是通過每一次算法模型迭代去完成深度學習。選擇算力租賃支撐算力支持,至少能夠讓中小企業以較低成本探索AI領域。
并且業內認為,時間是大模型廠商極為稀缺的資源,率先完成AI領域相關技術開發,可以比競爭對手獲得更多先發優勢,實現資源配置的最優效率。加上服務器的等待、調試以及運維等,都要算在AI研發的成本當中,選擇租賃似乎是一條不得不走的路。
既然算力租賃市場存在大量需求,當下選擇進軍算力租賃,是好生意嗎?
首先要了解一點,算力租賃的本質并不是算力,而是租賃,核心資源在于資金、客戶以及運維能力。資金方面,要想滿足如此龐大的市場需求,組建龐大算力中心并且購買大量固定資產,這對于投資者的資金籌集能力有極高要求。
即使跨過資金問題,客戶在選擇服務商時,也會考慮主營業務的匹配度。很多跨界從事AI算力租賃的企業,看中的是這一業務的低門檻。然而站在客戶角度,他們更愿意選擇研發實力雄厚,且主營通信和網絡的企業。
運維能力更不用說,目前中國大部分進軍算力租賃的企業,并不能拿到穩定的GPU貨源,更不談組成服務器甚至集群了。這些企業一旦面臨設備老化和更新換代,所謂的維護就只剩下空架子。甚至以玩笑話說,和英偉達的合作關系的好壞,才是AI領域掌握話語權的關鍵。
故而在多數情況下,算力租賃仍存有大量懸而未決的問題。算力短缺的根本原因是算力基礎設施的匱乏,租賃本身并不能作為長久之計使用。很多國內企業很早就認識到了這一點,并投入大量人力物力研發芯片和服務器,目的就是想要從根本上排除算力短缺隱患。
從大型互聯網企業潛心研發的態度,反觀目前算力租賃的熱度空前的現狀,就知道這其中很可能含有概念炒作的成分。從供需角度看,算力供不應求,算力租賃廠商在此時擁有較強的議價能力。而一旦出現供過于求的情況,算力租賃概念將會整個淪為炒作的犧牲品,最終導致這些廠商失去議價權,成為頭部資本的待宰羔羊。
綜上,算力租賃數百億美元潛力的市場,加上作為新藍海的吸引力,在當下而言確實是AI高速發展時代下的當紅產業。但極有可能,僅是當下。
編輯/王沖