马斯克吹牛,从来(lai)都是先(xian)打草稿。
2月18日(ri),xAI重磅(pang)发布号称“地表最强”的Grok 3 系列模型。
从官(guan)方(fang)丢出的数据来(lai)看,Grok 3基础模型超过DeepSeek V3、GPT-4o等(deng)SOTA模型;Grok 3推理模型同样超过o3-mini high、DeepSeek R1、Gemini 2 Flash Thinking等(deng)模型。
除此之外(wai),在人工盲评的Chatbot Arena上,Grok 3全(quan)类型都排行第一。
虽然评分只比第二(er)高十几分……但(dan)高就是高。
“地表最强”,确实没什么争(zheng)议。
牛皮再一次成(cheng)真,马斯克壕气地宣布:开放Grok 3供(gong)用户免费使用,直至服务器崩溃。
最强、不要钱,这两(liang)个标签摆在一起,结果显而易(yi)见。
2月20日(ri),Grok应用超越ChatGPT APP,迅速升(sheng)至美国(guo)区(qu)App Store免费APP榜首。
不过有一说一,这个“地表最强”,其实并没有给人多少震撼。
最近的舆论,也明显反映了这一点,远没有想象中的爆炸性效果。
毕竟,这可是拿20万张GPU,历时214天硬生生堆出来(lai)的首个Elo评分破1400的模型,消耗(hao)的能源足以维持一个中型城市(shi)运(yun)转。
结果是,除了基座测试分数亮眼外(wai),比如推理效率之类,并没有实质性的突破。
一定程度上,只是个单纯的数值怪。正确的叫(jiao)法,是“全(quan)球最大(da)的H100连(lian)集群(qun)”。
换句话说,只要肯烧钱,这个“地表最强”的称号,对手随时可以拿走。
表面上看,这性价比,实在是有点低。
尤其是最近被DeepSeek极端的低成(cheng)本震惊后,吃瓜群(qun)众不免发出疑问:Gork 3耗(hao)费了这么多资(zi)源,性能仅比当前的SOTA提升(sheng)了一点而已(yi),意义很大(da)吗?
值不值得,取(qu)决于(yu)你怎么看待(dai)这个事(shi)。
至少马斯克本人,并不认为不值。
甚至,后续计(ji)划还要扩大(da)规模,功率至少是目前的5倍,一心在堆卡这条道上走到黑……
简(jian)直就是无脑烧钱的举动,已(yi)经不能完全(quan)用商业逻辑来(lai)说明了。
01到底值不值?
马斯克至少向世界证明了一件(jian)事(shi):更强大(da)的算力,确实能训练出更强大(da)的模型。
问题在于(yu),目前大(da)家能想到的测试方(fang)式,基本都是对标人类的各种考试之类的,最前沿的几个大(da)模型都已(yi)经取(qu)得很高分了。
换句话说,最优秀的几个大(da)模型,其能力都已(yi)经接近人类能理解的上限(xian)。
Grok 3的尴尬之处在于(yu),在目前的认知框架中,它没办法证明自(zi)己的优势究竟在哪。
这就好比,一门考试,学(xue)霸们都能考90分以上。
学(xue)渣不觉得有什么,只有他们自(zi)己知道,90分和95分区(qu)别(bie)有多大(da)。
60分到90分,你要付(fu)出1的努(nu)力;90到95分,虽然看起来(lai)区(qu)别(bie)不大(da),但(dan)所(suo)需付(fu)出的精力却是成(cheng)倍的提升(sheng)。
对绝大(da)多数人而言,两(liang)者其实没什么区(qu)别(bie),只有头部几个争(zheng)排名的人会为了1分的差距而努(nu)力。
这种桥段,也可以套(tao)入大家看的修(xiu)真小(xiao)说情节当中。
人间界的天花板之所(suo)以是化(hua)神(shen)期,一方(fang)面是天地规则的压制,另一方(fang)面,是这个世界的资(zi)源等(deng)级只够修(xiu)士练到这个境界。
想要继续升(sheng)级,最直接的办法就是飞升(sheng)灵界获取(qu)高级资(zi)源;但(dan)正常的化(hua)神(shen)期修(xiu)士根(gen)本抗不过天劫,压根(gen)去不了灵界。
想升(sheng)级就要飞升(sheng),但(dan)不升(sheng)级又没能力飞升(sheng)……这就是矛(mao)盾的,所(suo)以亘古以来(lai),登顶者如过江之鲫(ji),飞升(sheng)者却寥(liao)寥(liao)无几。
再回到现(xian)实。
现(xian)在所(suo)有的AI,包括Gork 3,不管(guan)看起来(lai)多强,其实仍然处于(yu)最初(chu)级的阶段。
为什么初(chu)级?因为没有人知道下一步究竟该怎么去突破,突破后究竟是什么?是不是就是AGI?
大(da)模型的根(gen)本是连(lian)接主(zhu)义,模仿的是人脑。
人为什么拥有智(zhi)慧?并不是因为脑子“大(da)”。
论大(da)脑重量(liang),人类不如大(da)象;论脑重占比,不如黑猩(xing)猩(xing);论神(shen)经元规模,不如蓝鲸(jing);论视觉信息规模,不如大(da)部分鸟类……
在算力这方(fang)面,人脑并不比其他动物更有优势。真让让人脱颖而出的,可能是“算法”。
模仿人脑的大(da)模型,往上堆算力可以提高运(yun)转效率,但(dan)并不一定能量(liang)变(bian)产生质变(bian)。
前者还能靠(kao)钱堆,后者就很难说了。
所(suo)谓的技术奇点大(da)概就是这样,你不仅不知道它什么时候来(lai),更不知道它究竟是什么。
如果以这种角(jiao)度看,Gork 3与DeepSeek V3和GPT-4o的区(qu)别(bie),可能并不是95分和90分,而是0.95和0.9分,实际上都没有完成(cheng)1的突破。
满分100分。
不是说这没有意义,越接近1突破的概率自(zi)然越大(da)。
但(dan)在实际的使用场景(jing)中,对大(da)多数人而言,不管(guan)你是0.95还是0.9,甚至更弱一点的0.8,其实区(qu)别(bie)都不大(da)。
更关键的是,0.95所(suo)需的成(cheng)本更高,收费理所(suo)当然更贵,大(da)多数用户用不起、也压根(gen)用不到。
所(suo)以从商业化(hua)的角(jiao)度来(lai)看,马斯克烧了这么多钱训练出暂时领(ling)先(xian)的大(da)模型,虽然确实是地表最强,但(dan)边际收益属实是有点低。
马斯克是个商人,做任何项目都要考虑回报(bao)率。
但(dan)这次,可能不太(tai)一样。
就算短期亏钱,也一定要做;因为长期的回报(bao),可能远远超出想象。
这份回报(bao),甚至不能仅仅用金钱去衡量(liang)。
02权(quan)力的游戏
对马斯克本人而言,急需一个掌控在自(zi)己手中的、足够强力的AI大(da)模型。
不论花多少钱,不论它是不是划时代的,总之是必须要有一个。
否则他现(xian)在要做的事(shi),没办法展开。
他现(xian)在的第一目标是什么?
最近,乃至未来(lai)4年,全(quan)球舆论的核心,毫无疑问是马斯克主(zhu)导的“政府效率部”,简(jian)称DOGE。
DOGE部门满打满算不过20余人,核心成(cheng)员更是仅有6人,全(quan)都是真正的天才,年纪最大(da)的25岁,最小(xiao)的才19岁。
有一说一,这6人虽然是天才,但(dan)除了最年长者,其余有3人还是学(xue)生、1人辍学(xue),甚至还有黑历史。
这种背景(jing)别(bie)说进入机(ji)密(mi)机(ji)构,不论在哪个国(guo)家,都是过不了政审的。
但(dan)他们确实成(cheng)了世界上权(quan)力最大(da)的几个青年之一,拥有美国(guo)最高级别(bie)的安全(quan)许可,不受(shou)任何人监督:
Gavin Kliger,25岁,加州伯克利计(ji)算机(ji)专业,前推特(te)数据工程师,清扫对象是美国(guo)开发署,并向五角(jiao)大(da)楼植入去中心化(hua)审计(ji)程序(xu)。
Gautier Cole Killian,24岁,来(lai)自(zi)加拿大(da)麦吉尔大(da)学(xue),是6人中最神(shen)秘的一位,负责(ze)通过AI分析、确保政府资(zi)金被最高效使用。
Luke Farritor,23岁,内部拉(la)斯加大(da)学(xue)辍学(xue),任务是监督医保系统和能源部,后者包括监督核武器的使用。
Ethan Shaotran,22岁,职(zhi)业黑客,哈佛大(da)学(xue)在读生,xAI黑马马拉(la)松(song)比赛亚军,致力于(yu)用算法取(qu)代政府的传统人力模式。
简(jian)单来(lai)说,预算评估、行政审批乃至国(guo)会报(bao)告,全(quan)部交给AI去做。
bobba,21岁,印度裔,加州伯克利大(da)学(xue)在读生,主(zhu)导财政支出实事(shi)监管(guan)系统,有权(quan)直接冻结联(lian)邦支出。
Edward Coristine,19岁,职(zhi)业黑客,美国(guo)东北(bei)大(da)学(xue)在读生,曾为俄罗(luo)斯提供(gong)AI服务,现(xian)为美国(guo)国(guo)土安全(quan)部高级顾问,负责(ze)国(guo)家边境安全(quan)。
6位年轻人,每一位都有潜(qian)力成(cheng)为未来(lai)科技行业的引领(ling)者,现(xian)在却甘愿不拿工资(zi),每周工作时间长达120个小(xiao)时,不顾安危卷(juan)进政治斗争(zheng)中。
马斯克称他们是地球上最优秀的6位App(jian)工程师,外(wai)界人称“DOGE六君子”。(暗示他们的下场可能如戊(wu)戌六君子,不太(tai)好。)
马斯克和DOGE六君子
按照计(ji)划,他们将在美国(guo)建国(guo)250周年、即2026年7月4日(ri)前,彻底推翻美国(guo)运(yun)转了两(liang)个多世纪的体制。
第一个挨刀(dao)的,是拥有1.2万名员工的美国(guo)国(guo)际开发署,被裁得只剩294人。
目前为止,这个小(xiao)团队日(ri)均砍掉美国(guo)政府1.26亿美金的预算。
看起来(lai)夸张,但(dan)按这个速度,预计(ji)到明年7月,只能砍掉670亿美金,远远低于(yu)特(te)朗普最终(zhong)削减2万亿美金预算的目标。
所(suo)以还得加大(da)马力,真正的大(da)动作,或许还没有来(lai)。
后续,甚至还要动奥(ao)巴马医改下的Medicaid和Medicare等(deng)项目。
这个可以说是众望所(suo)谓,奥(ao)巴马医改的年度预算高达26%,甚至比美国(guo)国(guo)防开支的13.3%还要高一倍……
粗略计(ji)算,至少200万美国(guo)公务员将被要求主(zhu)动辞职(zhi)。你要是不自(zi)己走,到时候一毛钱补偿(chang)都不给。
再加上那两(liang)千多万还在领(ling)社(she)保的“幽灵”,影响的人难以测算。
总而言之,裁人这块,目前的DOGE完全(quan)可以做到。
但(dan)有一件(jian)事(shi)更危险的事(shi),仅凭几个人和现(xian)有的AI技术可能无法做到:查账。
美国(guo)政府过去这么多年的账,绝对波及到全(quan)世界。就这么几个人,无论怎么天才,就算各部门把账本送(song)到案前让你查……
查到特(te)朗普下台(tai),这账都不可能理得清。
别(bie)说6个人,就是6万人,三五年之内也很难查阅完。
就算真请这么多会计(ji)来(lai)查,人多鱼龙混杂,根(gen)本就没办法保证公正性。
人不可能办到,只有更强大(da)AI可以。它将光速整合所(suo)有单位的所(suo)有数据,钱去哪了、经谁的手、效果如何,全(quan)都给你安排得明明白白。
具体怎么做?至少有4个方(fang)向。
第一,锁定资(zi)金流向。
AI通过分析资(zi)金的流通路径,追溯(su)到资(zi)金末段,判断这笔(bi)钱的合理性。
第二(er),扫描(miao)财务数据。
通过自(zi)然语言处理,对比数据和政策,快速发现(xian)资(zi)金是否存在利用法律漏洞套(tao)利的可能性。
第三,自(zi)动处理。
AI不间断分析海量(liang)的政府文件(jian),自(zi)动筛(shai)选可疑的数据,极大(da)缩短效率部发现(xian)问题的时间成(cheng)本。
第四,自(zi)我升(sheng)级。
AI也会犯错(cuo),但(dan)“对抗训练”机(ji)制可以将AI错(cuo)判的数据重新编(bian)码为新的训练数据,不断提高准确率。
……
Gork 3之前的AI,也可以做到这些事(shi)。
尤其是凭借(jie)第四点,自(zi)我升(sheng)级的能力,效率会越来(lai)越高。
但(dan)是,能不能在2026年7月4日(ri)前完成(cheng)目标?
Gork 3之前,毫无疑问不能,否则马斯克没必要烧钱做吃力不讨好的事(shi)。
Gork 3可以吗?毫无疑问也不能,否则同样没必要以公认收益低的方(fang)法,继续烧钱。
马斯克现(xian)在最缺的,不是钱,是时间。
当然,若能实现(xian)突破、真的大(da)力出奇迹了,那更好。
但(dan)这不是第一优先(xian)级。
不论能不能实现(xian)技术上的突破,只要能缩短达成(cheng)目标的时间,至少对马斯克本人和效率部的几人而言,就是赚的。
03时代旋涡
很明显可以看到,马斯克的改革并不是循序(xu)渐进的。
而是直接利用科技,试图用一年时间就完成(cheng)对沿用两(liang)百(bai)年的体系进行降维打击。
这与历史上任何国(guo)家的改革,底层逻辑和外(wai)在表现(xian)是类似的。
总体上都是直接用暴力手段,打破旧的体制。
不一样的地方(fang)在于(yu)四个新的变(bian)量(liang)。
第一个是体量(liang)。
综合所(suo)有层面,美国(guo)是人类历史上体量(liang)最大(da)的国(guo)家。
船大(da)难掉头,过去体量(liang)不足其百(bai)分之一的国(guo)家想要变(bian)革都无比艰难,何况是这尊巨(ju)无霸。
第二(er)个是时间节点。
当下毫无疑问正处于(yu)新一轮科技革命的前夕。同前三次科技革命一样,生产力的飞跃将带来(lai)巨(ju)大(da)的财富增量(liang),这些新的财富可以一定程度上弥补利益受(shou)损的群(qun)体。
打不过你,但(dan)只要还有好处,也不是不能跟你混。
这实际上减少了很多矛(mao)盾,还是那句经典台(tai)词:谁赢,他们跟谁。
第三个变(bian)量(liang),是马斯克本人。
马斯克被称为美国(guo)版张居正,和DOGE六君子一样,这个称呼同样暗示了不好的结局(ju)。
他动的不仅仅是美国(guo)官(guan)僚体系的蛋糕,届时这场改革很可能将扩散(san)至全(quan)球每一个角(jiao)落(luo),人类社(she)会所(suo)有的政治游戏规则都将被改写。
这不是选择(ze)题,AI技术对治理逻辑的重构,正如工业时代的到来(lai)推翻了君主(zhu)制,没有任何人可以阻挡大(da)趋势。(比如最近深圳引入AI公务员,或许就是一次很好的尝试。)
如此大(da)的漩涡中,改革能成(cheng)功就罢了,马斯克的地位没有人可以动摇;若半路折戟,旧体系的反扑也不是他可以承受(shou)的。
只有前一种情况,第四个变(bian)量(liang)才有意义。
最后一个变(bian)量(liang)是速度。
这次虽然算得上是不流血的革命,但(dan)仅仅想用一年多就完成(cheng)变(bian)革,这是前无仅有的疯(feng)狂,也有可能对社(she)会造成(cheng)难以预料的破坏。
数以亿计(ji)的普通人,能否跟得上?有没有必要这么急?
乐观点看,马斯克不是政客,他的DOGE并不是正规部门、权(quan)力的保质期只有4年。
他改革的目的并不是成(cheng)为新的掌权(quan)者,而是为自(zi)己移民火星的终(zhong)极理想服务。
所(suo)以这种急迫,同样表现(xian)在太(tai)空事(shi)业上。
大(da)多数人都很费解,为啥马斯克那么频繁发射火箭(jian),好像非得赶着这几年上太(tai)空。