周末,DeepSeek又放大招,首次披(pi)露大模型的盈利情况,引爆投资圈。
理论利润率达(da)545%
3月1日,DeepSeek发文披(pi)露了大规模V3、R1部署的成本和收益,成为了第一个详细披(pi)露了自己成本结构的大模型企业。
据DeepSeek计算(suan),运营一天V3和R1的算(suan)力(li)成本为87072美金,而以R1定价来看,收入理论上为562027美金,利润率为545%。
据先容,DeepSeek V3和R1的所有服(fu)务均使用H800 GPU,使用和训练一致的精度。
由于(yu)白天的服(fu)务负(fu)荷高,晚上的服(fu)务负(fu)荷低,因此DeepSeek实现了一套机制。在白天负(fu)荷高的时候,用所有节点部署推理服(fu)务。晚上负(fu)荷低的时候,减少推理节点,以用来做研究(jiu)和训练。
在2025年02月27日12:00至2025年02月28日12:00,DeepSeek V3和R1推理服(fu)务占用节点总(zong)和,峰值(zhi)占用为278个节点,平均占用226.75个节点(每个节点为8个H800 GPU)。假定 GPU 租赁(lin)成本为2美金/小时,总(zong)成本为87,072美金/天。
在24小时统计时段内,DeepSeek V3和 R1的网页、APP和API的所有负(fu)载(zai)如(ru)下:
输入token总(zong)数为608B,其中 342B tokens(56.3%)命(ming)中KVCache硬盘缓存。输出 token总(zong)数为168B。平均输出速率为20~22tps,平均每输出一个token的KVCache长度是(shi)4989。
平均每台H800的吞吐量(liang)为:对于(yu)prefill任务,输入吞吐约73.7k tokens/s(含缓存命(ming)中);对于(yu)decode任务,输出吞吐约14.8k tokens/s。
输出 token总(zong)数为168B。平均输出速率为20~22tps,平均每输出一个token的KVCache长度是(shi)4989。
平均每台H800的吞吐量(liang)为:对于(yu)prefill任务,输入吞吐约73.7k tokens/s(含缓存命(ming)中);对于(yu)decode任务,输出吞吐约14.8k tokens/s。
如(ru)果所有tokens全部按照DeepSeek R1的定价计算(suan),理论上一天的总(zong)收入为562,027美金(折(she)合人民币409.36万元),成本利润率545%。
以此计算(suan),DeepSeek理论上最高每天可盈利47. 5万美金(折(she)合人民币约346万元)。
不过,DeepSeek也(ye)表示,实际上没有这么多收入,因为V3的定价更低,同时收费服(fu)务只占了一部分,另外夜间(jian)还会有折(she)扣。
巨大的盈利下,有投资人开始按计算(suan)器,称(cheng)其在美国应该是(shi)一家估值(zhi)超百亿美金的企业。
MenloVentures投资人Deedy表示:“理论ARR(年收入)2亿美金、利润率超过500%,这样的商业(ye)效率理应是(shi)一家值(zhi)100亿美金的企业。”
有网友评论,DeepSeek掀起了行业(ye)新(xin)一轮卷Infra热潮。
DeepSeek官方直接披(pi)露内部的成本利润细节,这下所有做Infra的兄弟(di)都(dou)要被老板(ban)上压力(li)了——如(ru)果利润率达(da)不到DeepSeek的水平,就说明自家的Infra团队菜。
上周,DeepSeek进行了开源周,连续放了5天Infra相关的库。
第一天,开源项目 FlashMLA 正式发布,专为Hopper GPU优化的高效MLA解码内核,支撑变长序列处理。
第二天,DeepEP发布,DeepEP是(shi)一个专为混合专家系统(MoE)和专家并(bing)行(EP)设计的通信库。
第三天,DeepGEMM发布,DeepGEMM 是(shi)一个专为简洁高效的FP8通用矩(ju)阵乘法(GEMM)设计的库,具有细粒度缩放功能。
第四天,DualPipe与EPLB发布,DualPipe是(shi)一种创(chuang)新(xin)的双向管道并(bing)行算(suan)法。EPLB即专家并(bing)行负(fu)载(zai)均衡器,自动平衡GPU负(fu)载(zai),避免部分显卡(ka)过载(zai)或闲(xian)置。
最后(hou)一天,3FS文件系统发布,并(bing)行文件系统Fire-Flyer File System,利用SSD和RDMA网络技(ji)术,显著加速数据处理。
周六,DeepSeek又披(pi)露了盈利情况,算(suan)是(shi)为开源周做了一个很好的收尾。