京东云全面适配最新版DeepSeek模型，推理速度提升50%,技术,支撑,Token20250328-业界动态-pqbbw.com

京东云全面适配最新版DeepSeek模型，推理速度提升50%,技术,支撑,Token

2025-03-28 05:38:14

京东云全面适配最新版DeepSeek模型，推理速度提升50%,技术,支撑,Token

央广网北(bei)京3月26日(ri)消息(xi) 近日(ri)，DeepSeek发布了模型更新——DeepSeek-V3-0324，此次升级不仅延续了DeepSeek系列“低(di)成(cheng)本、高性能”的基(ji)因，更凭(ping)借 MLA（多头潜在注意(yi)力）和 MTP（多Token预测）两大创新技术，将(jiang)推理速度显(xian)著提升。京东云DeepSeek一体机第一时间(jian)完成(cheng)适配，相比开源版本性能大幅提升50%。

单机支撑超千并发：单机支撑1000+并发请求，总吞吐突破7200 Token/s，可同时服务(wu)超大规模企业级AI应用。

极(ji)致数据(ju)吞吐保障：500并发时仍保持11.03 Token/s，平衡性能与用户体验。

据(ju)悉，此次DeepSeek模型更新，通过MLA技术通过将(jiang)高维(wei)特征压缩至低(di)维(wei)潜在空间(jian)，显(xian)著减少(shao)计算资源消耗；MTP技术则提升数据(ju)利用效率，实现时间(jian)维(wei)度的资源优化。二者的结合，使(shi)得DeepSeek-V3-0324在复杂任务(wu)处理中展(zhan)现出更快(kuai)的响应速度与更高的稳定性。

展(zhan)开剩余 41 %

京东云DeepSeek一体机通过融合MLA+MTP双技术，为企业提供无缝(feng)适配的推理加速方案。此次支撑的DeepSeek-V3-0324版本，延续了“单机即可部署满血版模型”的特性，用户无需复杂配置即可运行完整版大模型，满足千人规模企业的并发需求。

同时，京东云DeepSeek一体机还支撑华(hua)为昇腾、海光(guang)等国产AI芯片，兼(jian)顾性能与安全(quan)自主可控。并通过采用自研(yan)算力池化与智能推理加速引擎，软硬协同下推理速度较开源方案提升高达50%。

当前，京东云DeepSeek一体机已广泛应用于(yu)政务(wu)、金融、科(ke)研(yan)、能源、医疗、工业、科(ke)研(yan)等领域。以“推理加速+算力池化”的双重策略，实现同等硬件规格下、同等参数规格下更高效的推理能力和资源利用率，通过将(jiang)复杂的AI工程化过程封装为标(biao)准化产品，让(rang)企业无需纠结于(yu)“造轮子(zi)”，而是聚焦于(yu)“用AI创造价值”，更好(hao)地进(jin)行AI智能化转型。

必一运动·(B-sports)官方网站