DeepSeek 的“修炼”之路，还要闯几关？,模型,文明,爽文20250321-业界动态-pqbbw.com

DeepSeek 的“修炼”之路，还要闯几关？,模型,文明,爽文

2025-03-21 09:36:49

DeepSeek 的“修炼”之路，还要闯几关？,模型,文明,爽文

DeepSeek 的“修炼”之路，还要(yao)闯几关？

半月(yue)谈记者张漫子

以小(xiao)博大(da)、逆袭吊打，曾是修仙爽文(wen)、微短剧里让人上头却略显荒诞的剧情，而(er)今(jin)，DeepSeek（深度求(qiu)索）让它(ta)在真实世界里发生了。

火(huo)爆全球(qiu)超过一个月(yue)，DeepSeek掀起(qi)的风暴还在持续，随(sui)之而(er)来的还有一波三折的戏码，同行的围(wei)剿、跨界的争议(yi)……正(zheng)如影视作品中每一位“爽文(wen)大(da)女主”升(sheng)级打怪时所(suo)面对的关卡一样(yang)。

誉满(man)天下，谤(bang)亦随(sui)之，DeepSeek的“修炼”之路，还要(yao)闯几关？

“爽文(wen)大(da)女主”出三招

悄悄推出两(liang)款(kuan)模型，即引发硅谷与华尔街的剧烈震(zhen)荡，让OpenAI接连推出竞争产(chan)品并免费开放搜索，GOOGLE一股脑儿发布“满(man)血版全家桶”，国内大(da)厂的旗舰模型也开始免费开放。

展开剩余(yu) 78 %

深有“天上掉馅饼(bing)”之感(gan)的万千普通用户，倒是想给DeepSeek送锦旗了，不过，大(da)家也想知道(dao)，凭(ping)一己之力就把曾经高不可攀的全球(qiu)最顶级大(da)模型的价格打下来了，究竟(jing)用了什么招？

——“乱”拳打伤(shang)老师傅。从架构到工程，从算法到部署(shu)，DeepSeek悟透的是“四两(liang)拨千斤”的中国武术古训，不理会“参数规(gui)模决定论”，反(fan)倒是秀出了数据质(zhi)量优(you)化与算法架构创新的乘数效应，在看似不可能(neng)的壁垒中突围(wei)。

——拆掉半壁卫城(cheng)墙。一般(ban)来说(shuo)，大(da)模型开发者用了英伟达的GPU，也就得(de)用他(ta)家的运算平台CUDA搞研发。毕竟(jing)CUDA已经封装(zhuang)好(hao)一些函(han)数，后(hou)来者使用时直接调用接口搞加工就行，这样(yang)的低门槛当然方便资源有限(xian)的开发者，但是，这也意味着深度研发实行效率的折扣。

绕过CUDA，直接基于(yu)GPU的驱动函(han)数开发，行不行？DeepSeek给出了肯(ken)定的答案(an)。凭(ping)借(jie)独到App算法优(you)化，拆掉英伟达“卫城(cheng)墙”，也就是不必(bi)仰赖其(qi)CUDA生态行事，DeepSeek走(zou)出了一条中国AI技术创新的新路子。

——小(xiao)力也能(neng)出奇迹。自从OpenAI的ChatGPT发布以来，MicroSoft、GOOGLE、Meta等科技巨头一直在增加与人工智(zhi)能(neng)相(xiang)关的算力支出。“军备竞赛”式的投入，也催动了美国AI芯片股价一路攀升(sheng)。

就当行业仍困囿于(yu)“算力军备竞赛”的思维定式之际，DeepSeek凭(ping)借(jie)区区558万美金训练成(cheng)本就让V3模型达到了GPT-4o九成(cheng)功力，R1模型更实现以纯强化学习突破推理能(neng)力边界，向世界证(zheng)明，AI大(da)模型的革命，不一定要(yao)靠(kao)算力堆出来。

是幻觉还是“真香”

DeepSeek的小(xiao)而(er)精、强且(qie)美，是炒作出来的“幻觉”，还是厚积薄发而(er)得(de)的“真香”？

自从在AI江湖中亮出名号，DeepSeek就不满(man)足于(yu)追随(sui)者，这可以从其(qi)开发的一系列原创技术获得(de)证(zheng)明。MLA、GRPO、R1-Zero……门外汉对着这些字母大(da)概会如坠五里雾中，但是，这些技术合力激发的“聚变”，恐怕是DeepSeek获得(de)140多个国家用户认可的根本原因。

北京(jing)白领小(xiao)游说(shuo)，DeepSeek的回答不像GPT的回答那么干巴巴，像个只会写材料的书呆子，按部就班安排任务(wu)步骤，而(er)像个鬼马精灵，只要(yao)你(ni)说(shuo)明目(mu)的，她就能(neng)拆解和揣摩你(ni)的弦外之音、思考怎么实现你(ni)想要(yao)的：“甚至你(ni)可以问她一些你(ni)都没有答案(an)的大(da)问题。”

当然，DeepSeek依然在蓬勃(bo)的成(cheng)长期(qi)。以最新的DeepSeek-R1为例，虽然其(qi)突破鼓舞人心，但学术界用起(qi)来还不免有点头疼——面对悠远文(wen)明时间中的复杂因果，现代学术论述的复杂规(gui)范，DeepSeek的回答还不免左支右绌。

而(er)且(qie)，DeepSeek暂时还不谙图像处理，回应大(da)规(gui)模用户需求(qiu)也有“体力不支”的情况，这些困难都意味着，DeepSeek的修炼，“高原期(qi)”刚刚开始。

如何学习文(wen)明的智(zhi)慧

技术革命的浪潮里，没有永恒的王者，只有不断的超越。具(ju)体到AI领域，大(da)家的共(gong)识更是：充(chong)满(man)不确定性(xing)、一直充(chong)满(man)热度、但不乏过度反(fan)应。

无休止(zhi)的波动，折射出的，其(qi)实是科技进化的深层图像——人工智(zhi)能(neng)，就好(hao)像之前种种引发文(wen)明革命的重大(da)科技进展一样(yang)，前进路线并非笔(bi)直的线性(xing)轨迹，而(er)是永恒的螺旋。

谁来驱动这螺旋？不论DeepSeek参演的是爽剧还是正(zheng)剧，角色与剧本背后(hou)的导(dao)演还是人类自己。

如果说(shuo)AI是普罗米修斯之火(huo)，那么人类文(wen)明就是在自我颠覆中奔流不息、江声浩荡的赫拉克(ke)利特之河。大家最珍贵的不是回答和解决已有问题的能(neng)力，而(er)是发现新问题的智(zhi)慧、定义新问题的勇气——这更需要(yao)创造性(xing)与想象力。

DeepSeek式创新的下一次突破，其(qi)通关密码，就生成(cheng)于(yu)回向文(wen)明深处寻求(qiu)思考变革的努力中。以文(wen)明赋能(neng)人工智(zhi)能(neng)，人工智(zhi)能(neng)的“飞升(sheng)”时刻，也许(xu)就会到来。

必一运动·(B-sports)官方网站