2月11日,知名音视频服务平台七牛云(七牛智能02567.HK)宣布上线(xian) DeepSeek-R1 蒸馏版模型。结合发布于2月7日的消息,七牛云业已推出适配(pei) DeepSeek-V3/R1 全系列模型的专属 GPU 云主机和 Token API 推理服务。据悉,七牛云希翼其一站式AI 推理解(jie)决方(fang)案能满足客户日益增长的生成式AI 需求,并提供了两种(zhong)模型部署方(fang)式:一种(zhong)是借(jie)助API 接口快(kuai)速集成,另一种(zhong)是高性(xing)能GPU 云服务器一键(jian)部署。
为了缩(suo)短从想法(fa)到产品之间的距离,七牛云希翼开发者在自己的应用中集成媲(bi)美官方(fang)版 DeepSeek-R1 的顶尖推理能力,首先推出了满血(xue)版的DeepSeek-R1 671b 全参(can)模型。作为开源模型,DeepSeek-R1 效(xiao)果比(bi)肩(jian)海(hai)外巨头的闭源模型,在推理效(xiao)率、场景(jing)适配(pei)等多(duo)个维度上树立了新的标杆(gan)。据此,七牛云提供了效(xiao)果最完整和最具(ju)性(xing)价比(bi)的 1.73bit 量化 DeepSeek-R1 671b 全参(can)版本,让显(xian)存需求大幅(fu)度降低至 158GB, 在 A100、V100、A10 等高性(xing)价比(bi)类型 GPU 服务器上均能实现快(kuai)速推理。
同时,为了满足不同开发者的差异化需求,七牛云迅速上线(xian)了 DeepSeek-R1 蒸馏版模型。该系列模型经过优化,具(ju)备轻量化和高效(xiao)推理的特点(dian),可以(yi)在计算资源有限的设备上运行,特别适合中小企业和开发者进行部署,低成本应用到实际业务中。为了便利开发者,七牛云给出了与不同蒸馏模型相适配(pei)的 GPU 主机配(pei)置推荐,并提供了一键(jian)部署方(fang)式,确(que)保(bao)开发者可以(yi)根据自身需求快(kuai)速选择配(pei)置,启动和运行模型。