央广网北(bei)京3月26日(ri)消息(xi) 近日(ri),DeepSeek发布了模型更新——DeepSeek-V3-0324,此次升级不仅延续了DeepSeek系列“低(di)成(cheng)本、高性能”的基(ji)因,更凭(ping)借 MLA(多头潜在注意(yi)力)和 MTP(多Token预测)两大创新技术,将(jiang)推理速度显(xian)著提升。京东云DeepSeek一体机第一时间(jian)完成(cheng)适配,相比开源版本性能大幅提升50%。
单机支撑超千并发:单机支撑1000+并发请求,总吞吐突破7200 Token/s,可同时服务(wu)超大规模企业级AI应用。
极(ji)致数据(ju)吞吐保障:500并发时仍保持11.03 Token/s,平衡性能与用户体验。
据(ju)悉,此次DeepSeek模型更新,通过MLA技术通过将(jiang)高维(wei)特征压缩至低(di)维(wei)潜在空间(jian),显(xian)著减少(shao)计算资源消耗;MTP技术则提升数据(ju)利用效率,实现时间(jian)维(wei)度的资源优化。二者的结合,使(shi)得DeepSeek-V3-0324在复杂任务(wu)处理中展(zhan)现出更快(kuai)的响应速度与更高的稳定性。
京东云DeepSeek一体机通过融合MLA+MTP双技术,为企业提供无缝(feng)适配的推理加速方案。此次支撑的DeepSeek-V3-0324版本,延续了“单机即可部署满血版模型”的特性,用户无需复杂配置即可运行完整版大模型,满足千人规模企业的并发需求。
同时,京东云DeepSeek一体机还支撑华(hua)为昇腾、海光(guang)等国产AI芯片,兼(jian)顾性能与安全(quan)自主可控。并通过采用自研(yan)算力池化与智能推理加速引擎,软硬协同下推理速度较开源方案提升高达50%。
当前,京东云DeepSeek一体机已广泛应用于(yu)政务(wu)、金融、科(ke)研(yan)、能源、医疗、工业、科(ke)研(yan)等领域。以“推理加速+算力池化”的双重策略,实现同等硬件规格下、同等参数规格下更高效的推理能力和资源利用率,通过将(jiang)复杂的AI工程化过程封装为标(biao)准化产品,让(rang)企业无需纠结于(yu)“造轮子(zi)”,而是聚焦于(yu)“用AI创造价值”,更好(hao)地进(jin)行AI智能化转型。