国(guo)内AI大模型企业DeepSeek官方账号在知乎首次发(fa)布《DeepSeek-V3/R1推理系统概览》技(ji)术文章,不仅公开了其推理系统的核(he)心优化方案,更是(shi) 首次披(pi)露了成本利润率等(deng)关键数据,引发(fa)行业震(zhen)动。
据DeepSeek官方披(pi)露,DeepSeek-V3和R1的所有服务均使用H800 GPU。由于服务负(fu)荷白天高、晚上(shang)低(di),DeepSeek实现一套机制,在白天负(fu)荷高的时候用所有节点部署推理服务,晚上(shang)负(fu)荷低(di)的时候减少推理节点。
2月27日至2月28日的24个小时内,DeepSeek-V3和R1推理服务占用节点总和,峰(feng)值(zhi)占用为278个节点,平均占用226.75个节点(每个节点为8个H800 GPU)。假定GPU租(zu)赁成本为2美金/小时,总成本为87072美金/天。
来源:DeepSeek知乎官方账号
2月26日,DeepSeek在官网宣(xuan)布,北京时间每日00:30至08:30的夜间空闲时段,DeepSeek开放平台推出(chu)错峰(feng)优惠活动。在此期间,API调用价(jia)格大幅下(xia)调:DeepSeek-V3降至原价(jia)的50%,DeepSeek-R1更是(shi)低(di)至25%。DeepSeek称,鼓励用户充(chong)分利用这(zhe)一时段享受更经济(ji)更流畅的服务体(ti)验。
“DeepSeek开源周”自2月24日启动,期间DeepSeek陆续开源了众(zhong)多最新技(ji)术进展,包括FlashMLA、DeepEP、DeepGEMM和3FS四个开源项目以及DualPipe、EPLB等(deng)代码库。这(zhe)些开源成果在业内引发(fa)了热烈讨论。
业内分析指出(chu), DeepSeek的开源策略与成本控制能力正(zheng)在打破(po)AI领域的资源垄断。DeepSeek此次“透明化”披(pi)露,不仅展示了其技(ji)术实力与商业潜力,更向行业传递(di)明确信号:AI大模型的盈(ying)利闭环已从理想照进现实,标志着AI技(ji)术从实验室迈向产业化的关键转折。
据外国媒体(mei)透露,DeepSeek正(zheng)在加速研发(fa)DeepSeek-R2推理模型,这(zhe)一模型原计划今年5月发(fa)布,但或许会(hui)提前,新模型有望可以生(sheng)成更好的代码,并且使用英语之外的语言进行推理。
来源:中(zhong)国(guo)经济(ji)网微信综合(he) DeepSeek知乎官方账号、券商中(zhong)国(guo)等(deng)
监制:韩霁(ji) 审核(he):王玥(yue)
编辑(ji):张萌(meng) 校对:李翱(见习)