本(ben)文编辑:李笑寅
来源(yuan):硬AI
据媒(mei)体报道,芯片巨头英伟(wei)达正接近达成(cheng)一(yi)项收购GPU租赁商(shang)Lepton AI的(de)交易,交易金额预计达数(shu)亿美金(yuan)。
在,英伟(wei)达这一(yi)收购举(ju)动是进军云(yun)计算领(ling)域的(de)重要一(yi)环,标志着其(qi)与AMAZON和(he)GOOGLE等主要云(yun)提供商(shang)的(de)直接竞争。
Lepton AI:一(yi)家GPU“二房(fang)东”
Lepton AI成(cheng)立于2023年,总部位于美国加利福尼亚州帕(pa)洛阿托,是一(yi)家提供GPU算力(li)租赁服务的(de)初创(chuang)企业。
此前,Lepton曾为游戏初创(chuang)企业Latitude.io和(he)科研(yan)初创(chuang)企业SciSpace提供AI云(yun)服务,其(qi)联合创(chuang)始办人Yangqing Jia和(he)Junjie Bai曾是Meta的(de)AI研(yan)究人员。
与普(pu)通云(yun)服务提供商(shang)不同(tong),Lepton不自行管理数(shu)据中心或服务器(qi),而是从云(yun)提供商(shang)租用后再转租给(gei)自己的(de)客户——企业实际(ji)上不拥有任(ren)何GPU。
分析称,Lepton这种(zhong)业务模式(shi)将(jiang)更专注(zhu)于满(man)足(zu)AI训练和(he)推理的(de)特定需求(qiu),提供优化的(de)GPU集群(qun)和(he)相关技术服务。对(dui)企业而言,这种(zhong)轻资(zi)产模式(shi)也使Lepton避开重资(zi)产投(tou)资(zi)的(de)财(cai)务压力(li)。
在训练方面,Lepton提供了类似Slurm的(de)作业提交方法。实际(ji)测试表明,用户只(zhi)需几分钟就能将(jiang)现(xian)有sbatch脚本(ben)调整为在Lepton平台上工作,转换过程相当直观。
Lepton平台的(de)另(ling)一(yi)大亮点在于其(qi)可视化能力(li)。
分析称,Lepton提供控制台仪(yi)表盘,用户可以在其(qi)中查看节点生命周(zhou)期,了解每个节点的(de)作业状态。这一(yi)节点生命周(zhou)期可视化功能表现(xian)出(chu)色,仅次于CoreWeave。这对(dui)于监(jian)控和(he)管理GPU资(zi)源(yuan)至关重要,能够(gou)帮助用户及时发现(xian)和(he)解决问题。
算力(li)租赁市场:从卖(mai)方转向买方
当前,算力(li)租赁市场正经历深刻变革。
美国知名半导体研(yan)究机构SemiAnalysis分析指出(chu),计算成(cheng)本(ben)正随时间推移而下降,算力(li)租赁市场已转变为明显的(de)买方市场——现(xian)在有超(chao)过100家GPU云(yun)服务提供商(shang)在争夺(duo)基本(ben)相同(tong)的(de)客户群(qun)体,导致价格竞争加剧。
黄仁勋也在上周(zhou)的(de)GTC演讲中发表了类似的(de)观点:
“当Blackwell开始大规模出(chu)货时,即使是Hopper也将(jiang)无人问津。”
“当Blackwell开始大规模出(chu)货时,即使是Hopper也将(jiang)无人问津。”
导致这种(zhong)现(xian)象的(de)关键在于,算力(li)市场的(de)成(cheng)本(ben)由每类GPU的(de)成(cheng)本(ben)加权平均(jun)值决定。这意(yi)味着,具(ju)有更低计算成(cheng)本(ben)的(de)系统可用性一(yi)旦(dan)增加,将(jiang)推动整体计算成(cheng)本(ben)下降,进而也会拉低旧卡的(de)租赁价格。
举(ju)例来说,英伟(wei)达GB200在推理方面的(de)单位成(cheng)本(ben)(每百万个token的(de)美金(yuan)成(cheng)本(ben))比(bi)H100低75%,在训练方面的(de)成(cheng)本(ben)(每小时每个有效PFLOP的(de)美金(yuan)成(cheng)本(ben))低56%。
这意(yi)味着,如果H100想要保持竞争力(li),就不得不大幅降价。SemiAnalysis通过计算得出(chu),为了让客户在使用两种(zhong)芯片时感觉“无差别”,H100的(de)每小时租赁价格需要比(bi)GB200低65%。
更直观地(di)说,如果GB200的(de)租赁价格为每块GPU 2.20美金(yuan)/小时,那么H100的(de)租赁价格则(ze)需要降至每块GPU 0.98美金(yuan)/小时。
SemiAnalysis曾在去年预测,随着H100生产的(de)加速,GPU价格将(jiang)持续下行,并且考(kao)虑(lu)到买家将(jiang)把重心转移到Blackwell战略上,这种(zhong)下降趋势一(yi)直持续到2024年末。
现(xian)实证明,其(qi)预测是准确的(de)。
这种(zhong)竞争格局使得像(xiang)Lepton这样的(de)专业GPU租赁商(shang)面临巨大压力(li),也促使英伟(wei)达考(kao)虑(lu)通过收购来整合市场,进一(yi)步巩固其(qi)在AI计算基础(chu)设施领(ling)域的(de)主导地(di)位。
英伟(wei)达的(de)野(ye)心藏(cang)不住(zhu),激(ji)进扩张云(yun)服务
英伟(wei)达CEO Jensen Huang被SemiAnalysis称为“首席营收破(po)坏者”,这一(yi)称号反映了英伟(wei)达近年来在计算市场的(de)激(ji)进扩张策略。
SemiAnalysis指出(chu),通过收购Lepton,英伟(wei)达不仅获得了额外的(de)收入来源(yuan),还可能挤压其(qi)他云(yun)服务提供商(shang)的(de)生存空间。
进一(yi)步说,这种(zhong)垂直整合策略让英伟(wei)达能够(gou)从芯片设计到算力(li)租赁的(de)全产业链(lian)中获利,同(tong)时还能更好(hao)地(di)控制其(qi)GPU芯片的(de)使用方式(shi)和(he)价格策略,进一(yi)步增强其(qi)在AI计算领(ling)域的(de)主导地(di)位。
目前,英伟(wei)达的(de)云(yun)和(he)App业务目前仍处(chu)于起步阶段,其(qi)模式(shi)是英伟(wei)达直接向企业出(chu)租由其(qi)芯片驱动的(de)服务器(qi),并提供App帮助企业开发AI模型和(he)应用程序,以及管理训练AI的(de)GPU集群(qun)。
英伟(wei)达此前曾表示,这项业务未来可能产生1500亿美金(yuan)的(de)收入——这一(yi)数(shu)字超(chao)过了英伟(wei)达或AMAZONAWS目前的(de)年营收额。