DeepSeek宣布V3 模型更新，各项能力全面升级,推理,任务,相关20250326-业界动态-pqbbw.com

DeepSeek宣布V3 模型更新，各项能力全面升级,推理,任务,相关

2025-03-26 07:46:13

DeepSeek宣布V3 模型更新，各项能力全面升级,推理,任务,相关

新(xin)浪科技讯 3月25日晚间消息(xi)，DeepSeek宣布(bu)V3 模型已完成小版(ban)本升级，目(mu)前版(ban)本号(hao) DeepSeek-V3-0324，用户(hu)登录官方网页(ye)、APP、小程序进入对话界面后，关闭深度思考(kao)即可体验。

据悉(xi)，DeepSeek-V3-0324 API 接口和使(shi)用方式保持不变。如非复杂推理(li)任务，建议使(shi)用新(xin)版(ban)本 V3 模型，即刻享受速(su)度更加流畅、效果全(quan)面提升的对话体验。

模型推理(li)任务表现提高，新(xin)版(ban) V3 模型借鉴 DeepSeek-R1 模型训练过程中所使(shi)用的强化(hua)学习(xi)技术，大幅提高了在推理(li)类任务上(shang)的表现水平，在数学、代码类相关评测集上(shang)取得(de)了超过 GPT-4.5 的得(de)分成绩。

DeepSeek-V3-0324 与之前的 DeepSeek-V3 使(shi)用同样的 base 模型，仅改进了后训练方法。私有化(hua)部署时只需要更新(xin) checkpoint 和 tokenizer_config.json（tool calls 相关变动）。模型参数约 660B，开源版(ban)本上(shang)下文长度为 128K（网页(ye)端、App 和 API 提供 64K 上(shang)下文）。（文猛）

【免责声明】本文仅代表编辑本人观点，与和讯网无关。和讯网站(zhan)对文中陈述、观点判断保持中立，不对所包含内容的准确性、可靠性或(huo)完整性提供任何明示或(huo)暗示的保证。请读者仅作参考(kao)，并请自行承担全(quan)部责任。邮箱：news_center@staff.hexun.com

必一运动·(B-sports)官方网站