马斯克成了最危险的人,Grok,模型,DeepSeek20250329-业界动态-pqbbw.com

马斯克成了最危险的人,Grok,模型,DeepSeek

2025-03-29 08:12:31

马斯克成了最危险的人,Grok,模型,DeepSeek

马斯克吹牛，从来(lai)都是先(xian)打草稿。

2月18日(ri)，xAI重磅(pang)发布号称“地表最强”的Grok 3 系列模型。

从官(guan)方(fang)丢出的数据来(lai)看，Grok 3基础模型超过DeepSeek V3、GPT-4o等(deng)SOTA模型；Grok 3推理模型同样超过o3-mini high、DeepSeek R1、Gemini 2 Flash Thinking等(deng)模型。

除此之外(wai)，在人工盲评的Chatbot Arena上，Grok 3全(quan)类型都排行第一。

虽然评分只比第二(er)高十几分……但(dan)高就是高。

“地表最强”，确实没什么争(zheng)议。

牛皮再一次成(cheng)真，马斯克壕气地宣布：开放Grok 3供(gong)用户免费使用，直至服务器崩溃。

最强、不要钱，这两(liang)个标签摆在一起，结果显而易(yi)见。

2月20日(ri)，Grok应用超越ChatGPT APP，迅速升(sheng)至美国(guo)区(qu)App Store免费APP榜首。

展开剩余 91 %

不过有一说一，这个“地表最强”，其实并没有给人多少震撼。

最近的舆论，也明显反映了这一点，远没有想象中的爆炸性效果。

毕竟，这可是拿20万张GPU，历时214天硬生生堆出来(lai)的首个Elo评分破1400的模型，消耗(hao)的能源足以维持一个中型城市(shi)运(yun)转。

结果是，除了基座测试分数亮眼外(wai)，比如推理效率之类，并没有实质性的突破。

一定程度上，只是个单纯的数值怪。正确的叫(jiao)法，是“全(quan)球最大(da)的H100连(lian)集群(qun)”。

换句话说，只要肯烧钱，这个“地表最强”的称号，对手随时可以拿走。

表面上看，这性价比，实在是有点低。

尤其是最近被DeepSeek极端的低成(cheng)本震惊后，吃瓜群(qun)众不免发出疑问：Gork 3耗(hao)费了这么多资(zi)源，性能仅比当前的SOTA提升(sheng)了一点而已(yi)，意义很大(da)吗？

值不值得，取(qu)决于(yu)你怎么看待(dai)这个事(shi)。

至少马斯克本人，并不认为不值。

甚至，后续计(ji)划还要扩大(da)规模，功率至少是目前的5倍，一心在堆卡这条道上走到黑……

简(jian)直就是无脑烧钱的举动，已(yi)经不能完全(quan)用商业逻辑来(lai)说明了。

01到底值不值?

马斯克至少向世界证明了一件(jian)事(shi)：更强大(da)的算力，确实能训练出更强大(da)的模型。

问题在于(yu)，目前大(da)家能想到的测试方(fang)式，基本都是对标人类的各种考试之类的，最前沿的几个大(da)模型都已(yi)经取(qu)得很高分了。

换句话说，最优秀的几个大(da)模型，其能力都已(yi)经接近人类能理解的上限(xian)。

Grok 3的尴尬之处在于(yu)，在目前的认知框架中，它没办法证明自(zi)己的优势究竟在哪。

这就好比，一门考试，学(xue)霸们都能考90分以上。

学(xue)渣不觉得有什么，只有他们自(zi)己知道，90分和95分区(qu)别(bie)有多大(da)。

60分到90分，你要付(fu)出1的努(nu)力；90到95分，虽然看起来(lai)区(qu)别(bie)不大(da)，但(dan)所(suo)需付(fu)出的精力却是成(cheng)倍的提升(sheng)。

对绝大(da)多数人而言，两(liang)者其实没什么区(qu)别(bie)，只有头部几个争(zheng)排名的人会为了1分的差距而努(nu)力。

这种桥段，也可以套(tao)入大家看的修(xiu)真小(xiao)说情节当中。

人间界的天花板之所(suo)以是化(hua)神(shen)期，一方(fang)面是天地规则的压制，另一方(fang)面，是这个世界的资(zi)源等(deng)级只够修(xiu)士练到这个境界。

想要继续升(sheng)级，最直接的办法就是飞升(sheng)灵界获取(qu)高级资(zi)源；但(dan)正常的化(hua)神(shen)期修(xiu)士根(gen)本抗不过天劫，压根(gen)去不了灵界。

想升(sheng)级就要飞升(sheng)，但(dan)不升(sheng)级又没能力飞升(sheng)……这就是矛(mao)盾的，所(suo)以亘古以来(lai)，登顶者如过江之鲫(ji)，飞升(sheng)者却寥(liao)寥(liao)无几。

再回到现(xian)实。

现(xian)在所(suo)有的AI，包括Gork 3，不管(guan)看起来(lai)多强，其实仍然处于(yu)最初(chu)级的阶段。

为什么初(chu)级？因为没有人知道下一步究竟该怎么去突破，突破后究竟是什么？是不是就是AGI？

大(da)模型的根(gen)本是连(lian)接主(zhu)义，模仿的是人脑。

人为什么拥有智(zhi)慧？并不是因为脑子“大(da)”。

论大(da)脑重量(liang)，人类不如大(da)象；论脑重占比，不如黑猩(xing)猩(xing)；论神(shen)经元规模，不如蓝鲸(jing)；论视觉信息规模，不如大(da)部分鸟类……

在算力这方(fang)面，人脑并不比其他动物更有优势。真让让人脱颖而出的，可能是“算法”。

模仿人脑的大(da)模型，往上堆算力可以提高运(yun)转效率，但(dan)并不一定能量(liang)变(bian)产生质变(bian)。

前者还能靠(kao)钱堆，后者就很难说了。

所(suo)谓的技术奇点大(da)概就是这样，你不仅不知道它什么时候来(lai)，更不知道它究竟是什么。

如果以这种角(jiao)度看，Gork 3与DeepSeek V3和GPT-4o的区(qu)别(bie)，可能并不是95分和90分，而是0.95和0.9分，实际上都没有完成(cheng)1的突破。

满分100分。

不是说这没有意义，越接近1突破的概率自(zi)然越大(da)。

但(dan)在实际的使用场景(jing)中，对大(da)多数人而言，不管(guan)你是0.95还是0.9，甚至更弱一点的0.8，其实区(qu)别(bie)都不大(da)。

更关键的是，0.95所(suo)需的成(cheng)本更高，收费理所(suo)当然更贵，大(da)多数用户用不起、也压根(gen)用不到。

所(suo)以从商业化(hua)的角(jiao)度来(lai)看，马斯克烧了这么多钱训练出暂时领(ling)先(xian)的大(da)模型，虽然确实是地表最强，但(dan)边际收益属实是有点低。

马斯克是个商人，做任何项目都要考虑回报(bao)率。

但(dan)这次，可能不太(tai)一样。

就算短期亏钱，也一定要做；因为长期的回报(bao)，可能远远超出想象。

这份回报(bao)，甚至不能仅仅用金钱去衡量(liang)。

02权(quan)力的游戏

对马斯克本人而言，急需一个掌控在自(zi)己手中的、足够强力的AI大(da)模型。

不论花多少钱，不论它是不是划时代的，总之是必须要有一个。

否则他现(xian)在要做的事(shi)，没办法展开。

他现(xian)在的第一目标是什么？

最近，乃至未来(lai)4年，全(quan)球舆论的核心，毫无疑问是马斯克主(zhu)导的“政府效率部”，简(jian)称DOGE。

DOGE部门满打满算不过20余人，核心成(cheng)员更是仅有6人，全(quan)都是真正的天才，年纪最大(da)的25岁，最小(xiao)的才19岁。

有一说一，这6人虽然是天才，但(dan)除了最年长者，其余有3人还是学(xue)生、1人辍学(xue)，甚至还有黑历史。

这种背景(jing)别(bie)说进入机(ji)密(mi)机(ji)构，不论在哪个国(guo)家，都是过不了政审的。

但(dan)他们确实成(cheng)了世界上权(quan)力最大(da)的几个青年之一，拥有美国(guo)最高级别(bie)的安全(quan)许可，不受(shou)任何人监督：

Gavin Kliger，25岁，加州伯克利计(ji)算机(ji)专业，前推特(te)数据工程师，清扫对象是美国(guo)开发署，并向五角(jiao)大(da)楼植入去中心化(hua)审计(ji)程序(xu)。

Gautier Cole Killian，24岁，来(lai)自(zi)加拿大(da)麦吉尔大(da)学(xue)，是6人中最神(shen)秘的一位，负责(ze)通过AI分析、确保政府资(zi)金被最高效使用。

Luke Farritor，23岁，内部拉(la)斯加大(da)学(xue)辍学(xue)，任务是监督医保系统和能源部，后者包括监督核武器的使用。

Ethan Shaotran，22岁，职(zhi)业黑客，哈佛大(da)学(xue)在读生，xAI黑马马拉(la)松(song)比赛亚军，致力于(yu)用算法取(qu)代政府的传统人力模式。

简(jian)单来(lai)说，预算评估、行政审批乃至国(guo)会报(bao)告，全(quan)部交给AI去做。

bobba，21岁，印度裔，加州伯克利大(da)学(xue)在读生，主(zhu)导财政支出实事(shi)监管(guan)系统，有权(quan)直接冻结联(lian)邦支出。

Edward Coristine，19岁，职(zhi)业黑客，美国(guo)东北(bei)大(da)学(xue)在读生，曾为俄罗(luo)斯提供(gong)AI服务，现(xian)为美国(guo)国(guo)土安全(quan)部高级顾问，负责(ze)国(guo)家边境安全(quan)。

6位年轻人，每一位都有潜(qian)力成(cheng)为未来(lai)科技行业的引领(ling)者，现(xian)在却甘愿不拿工资(zi)，每周工作时间长达120个小(xiao)时，不顾安危卷(juan)进政治斗争(zheng)中。

马斯克称他们是地球上最优秀的6位App(jian)工程师，外(wai)界人称“DOGE六君子”。（暗示他们的下场可能如戊(wu)戌六君子，不太(tai)好。）

马斯克和DOGE六君子

按照计(ji)划，他们将在美国(guo)建国(guo)250周年、即2026年7月4日(ri)前，彻底推翻美国(guo)运(yun)转了两(liang)个多世纪的体制。

第一个挨刀(dao)的，是拥有1.2万名员工的美国(guo)国(guo)际开发署，被裁得只剩294人。

目前为止，这个小(xiao)团队日(ri)均砍掉美国(guo)政府1.26亿美金的预算。

看起来(lai)夸张，但(dan)按这个速度，预计(ji)到明年7月，只能砍掉670亿美金，远远低于(yu)特(te)朗普最终(zhong)削减2万亿美金预算的目标。

所(suo)以还得加大(da)马力，真正的大(da)动作，或许还没有来(lai)。

后续，甚至还要动奥(ao)巴马医改下的Medicaid和Medicare等(deng)项目。

这个可以说是众望所(suo)谓，奥(ao)巴马医改的年度预算高达26%，甚至比美国(guo)国(guo)防开支的13.3%还要高一倍……

粗略计(ji)算，至少200万美国(guo)公务员将被要求主(zhu)动辞职(zhi)。你要是不自(zi)己走，到时候一毛钱补偿(chang)都不给。

再加上那两(liang)千多万还在领(ling)社(she)保的“幽灵”，影响的人难以测算。

总而言之，裁人这块，目前的DOGE完全(quan)可以做到。

但(dan)有一件(jian)事(shi)更危险的事(shi)，仅凭几个人和现(xian)有的AI技术可能无法做到：查账。

美国(guo)政府过去这么多年的账，绝对波及到全(quan)世界。就这么几个人，无论怎么天才，就算各部门把账本送(song)到案前让你查……

查到特(te)朗普下台(tai)，这账都不可能理得清。

别(bie)说6个人，就是6万人，三五年之内也很难查阅完。

就算真请这么多会计(ji)来(lai)查，人多鱼龙混杂，根(gen)本就没办法保证公正性。

人不可能办到，只有更强大(da)AI可以。它将光速整合所(suo)有单位的所(suo)有数据，钱去哪了、经谁的手、效果如何，全(quan)都给你安排得明明白白。

具体怎么做？至少有4个方(fang)向。

第一，锁定资(zi)金流向。

AI通过分析资(zi)金的流通路径，追溯(su)到资(zi)金末段，判断这笔(bi)钱的合理性。

第二(er)，扫描(miao)财务数据。

通过自(zi)然语言处理，对比数据和政策，快速发现(xian)资(zi)金是否存在利用法律漏洞套(tao)利的可能性。

第三，自(zi)动处理。

AI不间断分析海量(liang)的政府文件(jian)，自(zi)动筛(shai)选可疑的数据，极大(da)缩短效率部发现(xian)问题的时间成(cheng)本。

第四，自(zi)我升(sheng)级。

AI也会犯错(cuo)，但(dan)“对抗训练”机(ji)制可以将AI错(cuo)判的数据重新编(bian)码为新的训练数据，不断提高准确率。

……

Gork 3之前的AI，也可以做到这些事(shi)。

尤其是凭借(jie)第四点，自(zi)我升(sheng)级的能力，效率会越来(lai)越高。

但(dan)是，能不能在2026年7月4日(ri)前完成(cheng)目标？

Gork 3之前，毫无疑问不能，否则马斯克没必要烧钱做吃力不讨好的事(shi)。

Gork 3可以吗？毫无疑问也不能，否则同样没必要以公认收益低的方(fang)法，继续烧钱。

马斯克现(xian)在最缺的，不是钱，是时间。

当然，若能实现(xian)突破、真的大(da)力出奇迹了，那更好。

但(dan)这不是第一优先(xian)级。

不论能不能实现(xian)技术上的突破，只要能缩短达成(cheng)目标的时间，至少对马斯克本人和效率部的几人而言，就是赚的。

03时代旋涡

很明显可以看到，马斯克的改革并不是循序(xu)渐进的。

而是直接利用科技，试图用一年时间就完成(cheng)对沿用两(liang)百(bai)年的体系进行降维打击。

这与历史上任何国(guo)家的改革，底层逻辑和外(wai)在表现(xian)是类似的。

总体上都是直接用暴力手段，打破旧的体制。

不一样的地方(fang)在于(yu)四个新的变(bian)量(liang)。

第一个是体量(liang)。

综合所(suo)有层面，美国(guo)是人类历史上体量(liang)最大(da)的国(guo)家。

船大(da)难掉头，过去体量(liang)不足其百(bai)分之一的国(guo)家想要变(bian)革都无比艰难，何况是这尊巨(ju)无霸。

第二(er)个是时间节点。

当下毫无疑问正处于(yu)新一轮科技革命的前夕。同前三次科技革命一样，生产力的飞跃将带来(lai)巨(ju)大(da)的财富增量(liang)，这些新的财富可以一定程度上弥补利益受(shou)损的群(qun)体。

打不过你，但(dan)只要还有好处，也不是不能跟你混。

这实际上减少了很多矛(mao)盾，还是那句经典台(tai)词：谁赢，他们跟谁。

第三个变(bian)量(liang)，是马斯克本人。

马斯克被称为美国(guo)版张居正，和DOGE六君子一样，这个称呼同样暗示了不好的结局(ju)。

他动的不仅仅是美国(guo)官(guan)僚体系的蛋糕，届时这场改革很可能将扩散(san)至全(quan)球每一个角(jiao)落(luo)，人类社(she)会所(suo)有的政治游戏规则都将被改写。

这不是选择(ze)题，AI技术对治理逻辑的重构，正如工业时代的到来(lai)推翻了君主(zhu)制，没有任何人可以阻挡大(da)趋势。（比如最近深圳引入AI公务员，或许就是一次很好的尝试。）

如此大(da)的漩涡中，改革能成(cheng)功就罢了，马斯克的地位没有人可以动摇；若半路折戟，旧体系的反扑也不是他可以承受(shou)的。

只有前一种情况，第四个变(bian)量(liang)才有意义。

最后一个变(bian)量(liang)是速度。

这次虽然算得上是不流血的革命，但(dan)仅仅想用一年多就完成(cheng)变(bian)革，这是前无仅有的疯(feng)狂，也有可能对社(she)会造成(cheng)难以预料的破坏。

数以亿计(ji)的普通人，能否跟得上？有没有必要这么急？

乐观点看，马斯克不是政客，他的DOGE并不是正规部门、权(quan)力的保质期只有4年。

他改革的目的并不是成(cheng)为新的掌权(quan)者，而是为自(zi)己移民火星的终(zhong)极理想服务。

所(suo)以这种急迫，同样表现(xian)在太(tai)空事(shi)业上。

大(da)多数人都很费解，为啥马斯克那么频繁发射火箭(jian)，好像非得赶着这几年上太(tai)空。

必一运动·(B-sports)官方网站