新(xin)浪科技讯 3月25日晚间消息(xi),DeepSeek宣布(bu)V3 模型已完成小版(ban)本升级,目(mu)前版(ban)本号(hao) DeepSeek-V3-0324,用户(hu)登录官方网页(ye)、APP、小程序进入对话界面后,关闭深度思考(kao)即可体验。
据悉(xi),DeepSeek-V3-0324 API 接口和使(shi)用方式保持不变。如非复杂推理(li)任务,建议使(shi)用新(xin)版(ban)本 V3 模型,即刻享受速(su)度更加流畅、效果全(quan)面提升的对话体验。
模型推理(li)任务表现提高,新(xin)版(ban) V3 模型借鉴 DeepSeek-R1 模型训练过程中所使(shi)用的强化(hua)学习(xi)技术,大幅提高了在推理(li)类任务上(shang)的表现水平,在数学、代码类相关评测集上(shang)取得(de)了超过 GPT-4.5 的得(de)分成绩。
DeepSeek-V3-0324 与之前的 DeepSeek-V3 使(shi)用同样的 base 模型,仅改进了后训练方法。私有化(hua)部署时只需要更新(xin) checkpoint 和 tokenizer_config.json(tool calls 相关变动)。模型参数约 660B,开源版(ban)本上(shang)下文长度为 128K(网页(ye)端、App 和 API 提供 64K 上(shang)下文)。(文猛)
【免责声明】本文仅代表编辑本人观点,与和讯网无关。和讯网站(zhan)对文中陈述、观点判断保持中立,不对所包含内容的准确性、可靠性或(huo)完整性提供任何明示或(huo)暗示的保证。请读者仅作参考(kao),并请自行承担全(quan)部责任。邮箱:news_center@staff.hexun.com