? 文 观察者(zhe)网 张广凯
2025年,是百(bai)度(du)证明自己的关键一年。
年初DeepSeek掀(xian)起的开源热潮,以及(ji)推理模型(xing)的范式变革,都把大模型(xing)竞赛推向了一个全新维度(du)。每(mei)一轮技术(shu)迭代往往也伴(ban)随着行业格局重新洗牌,历史积累(lei)的优势,稍有倦怠就会(hui)被颠覆一空。
百(bai)度(du)是国内大模型(xing)行业的先发者(zhe)。2023年,百(bai)度(du)率先推出的文心大模型(xing),证明了中(zhong)国企业完(wan)全有能力跟(gen)OpenAI掰一掰手腕;2024年,百(bai)度(du)又把精力更(geng)多投(tou)入在AI落地,助推中(zhong)国繁荣的应用生态。
应用为王,固然是结硬(ying)寨、打呆仗的稳健之(zhi)举,但在2025这个变革之(zhi)年,外界对百(bai)度(du)更(geng)大的期待,是进攻,是重新拿出SOTA级(ji)别的模型(xing)能力。
好在2025年刚开年,百(bai)度(du)进取的步伐重新快了起来。3月(yue)16日,百(bai)度(du)时(shi)隔一年多,终于发布了大版本升级(ji)的文心4.5,以及(ji)文心大模型(xing)X1;而刚过了一个多月(yue),在今天的百(bai)度(du)create大会(hui)上,百(bai)度(du)就将两个模型(xing)双双升级(ji)到Turbo版。
与此同时(shi),还有应用向的进展。伴(ban)随着今天高说服力数字人、通用超级(ji)智(zhi)能体(ti)心响APP、内容(rong)操作系统沧舟OS等(deng)多款AI应用集中(zhong)发布,百(bai)度(du)找回了激情,用模型(xing)和应用的双击(ji),再一次向外界展示(shi)了自己技能库之(zhi)全面。
放眼中(zhong)国AI江湖,百(bai)度(du)是少有的在芯片(pian)、框架、模型(xing)、应用四层架构都有强大能力的玩家,如果未来AI时(shi)代要诞生一个超级(ji)入口(kou),这样的全面性势必(bi)让百(bai)度(du)成为一个不容(rong)忽(hu)视的候选人。
最强+最便宜,百(bai)度(du)迭代加速
“当(dang)下大部分主流大模型(xing)的API调用价格,都已经(jing)比满血版DeepSeek更(geng)低,速度(du)也更(geng)快。”
4月(yue)25日的百(bai)度(du)create开发者(zhe)大会(hui)上,百(bai)度(du)创始人李彦宏开场就做出上述判断。
这个判断背后,是如今全球大模型(xing)竞赛中(zhong)“速度(du)为王”的鲜(xian)明趋(qu)势。
这既是指迭代速度(du):2025年第一季(ji)度(du),新发布的大模型(xing)数量已经(jing)达到55个,较过去两年明显提升。
另一方面,低成本、快速调用的能力,也成为AI应用落地中(zhong)最关键的竞争力。
在这两个维度(du)上,百(bai)度(du)都在提速。
百(bai)度(du)文心一言4.0发布于2023年10月(yue),2024年8月(yue)更(geng)新至4.0 Turbo。
直到今年3月(yue),百(bai)度(du)在宣布开源的同时(shi),一下子就带来了文心4.5和X1两个全新模型(xing)。今天的开发者(zhe)大会(hui)上,又迅速迭代至更(geng)强大、成本更(geng)低的文心4.5Turbo和文心X1Turbo。
其中(zhong),文心4.5 Turbo每(mei)百(bai)万token的输(shu)入价格仅为0.8元(yuan),输(shu)出价格3.2元(yuan),相比文心4.5,价格下降80%,仅为DeepSeek-V3的40%。
文心大模型(xing)X1 Turbo,输(shu)入价格为每(mei)百(bai)万token1元(yuan),输(shu)出价格4元(yuan),相比文心X1,性能提升的同时(shi)价格再降50%,仅为DeepSeek-R1的25%。
李彦宏认为,当(dang)前开发者(zhe)做AI应用的一大阻碍,就是大模型(xing)成本高、用不起。成本降低后,开发者(zhe)和创业者(zhe)们才可以放心大胆地做开发,企业才能够低成本地部署大模型(xing),最终推动各(ge)行各(ge)业应用的爆发。
此外,百(bai)度(du)把多模态作为了自己独特的竞争优势之(zhi)一,基于RAG、iRAG技术(shu),延续低幻觉优势。在多个基准测试集中(zhong),文心4.5 Turbo多模态能力与GPT 4.1持平、优于GPT 4o。
李彦宏指出,“多模态将成为未来基础模型(xing)的标配,纯文本模型(xing)的市场会(hui)越变越小,多模态模型(xing)的市场会(hui)越来越大”。
文心大模型(xing)X1 Turbo则是基于4.5 Turbo的深度(du)思考模型(xing),性能提升的同时(shi),具(ju)备更(geng)先进的思维链,问答、创作、逻辑推理、工具(ju)调用和多模态能力进一步增强,整体(ti)效果领先DeepSeek R1、V3最新版。
多模态和推理,都是眼下大模型(xing)最重要的发展方向,也是应用落地需求最旺盛的场景,再加上文心5.0也将在年内发布,今年注定将是百(bai)度(du)的进攻之(zhi)年,有望在基础模型(xing)能力上重新跻(ji)身第一梯队。
最锋利的矛:秒哒、心响、数字人
2024年,李彦宏就多次强调,智(zhi)能体(ti)是未来AI应用落地的关键。今年,以Manus为代表的智(zhi)能体(ti)爆火,无疑证明了李彦宏的判断。
在各(ge)类智(zhi)能体(ti)中(zhong),代码智(zhi)能体(ti)Coding Agent,是最近半(ban)年AI应用进展最快、最火的赛道。海(hai)外的Cursor,字节的Coze,都快速积累(lei)了大量用户,逐渐颠覆传统的人工编(bian)程方式。
不过,Cursor和Coze都属于低代码编(bian)程工具(ju),也就是说,用户仍然需要基本的代码编(bian)程常识,才能较好地使(shi)用。它们能够服务的用户,仍然以程序员为主。
但是去年就开始预告的百(bai)度(du)秒哒,从一开始就定位(wei)于无代码编(bian)程Agent。
所谓无代码编(bian)程,是指用户无需任何代码常识,只要用自然语言描述自己的需求,Agent就能自主完(wan)成代码开发工作,给出交付(fu)即可用的产品(pin)。
李彦宏表示(shi),全球只有不到3000万程序员,有80亿人,当(dang)技术(shu)的门槛逐渐消失,每(mei)个人都可以具(ju)备程序员的能力。
今年3月(yue),秒哒已经(jing)向全社会(hui)开放,任何人都可以通过秒哒,一句话生成应用。就连一位(wei)退休师傅,都能利用秒哒,为小区创建一个可以进行车位(wei)、访(fang)客(ke)、维修登记和社区活动公(gong)告的居民(min)服务应用;一位(wei)陕西的果农,做了一个能卖苹果、自动算账的应用……
而今天的开发者(zhe)大会(hui)上,最大的感动也来自一位(wei)秒哒用户——一位(wei)视觉障碍的程序员钟科,牵(qian)着导盲犬站在了主舞台上。
或许会(hui)令人感到惊讶,中(zhong)国视障人群的第二大就业岗位(wei),竟然是IT行业。但是钟科先容说,视觉障碍者(zhe)的天然缺(que)陷,让他们无法完(wan)全理解模块化内容(rong)。无代码编(bian)程不仅是普通人提升自己的得力工具(ju),更(geng)有可能成为弱势人群的生存倚仗。
今天,百(bai)度(du)还发布了类似(si)于Manus的“通用超级(ji)智(zhi)能体(ti)”心响。心响可以一站式解决用户复杂问题。目前,心响已覆盖常识解析、旅游规划、学习办公(gong)等(deng)场景中(zhong)200个任务类型(xing)。
以租房维权为例,心响会(hui)理清事件关键问题,寻(xun)找专家律师AI分身,从不同的角度(du)提供专业建议,最后生成可下载的法律分析报告,并给出详细维权步骤。
百(bai)度(du)今天带来的另一个“炫技”,来自数字人。
由于直播带货这个庞大应用场景的存在,数字人已经(jing)成为国内大模型(xing)竞争的红(hong)海(hai),但是百(bai)度(du)今天发布的“高说服力数字人”,仍然给人极大惊喜。
在一段(duan)演示(shi)视频(pin)中(zhong),一位(wei)数字人主播不仅表情、语气、手势非常自然,甚至可以拿起桌面上的书本直接向观众先容,端起茶杯做出喝(he)茶的动作。
这是因(yin)为在多模态大模型(xing)的加持下,高说服力数字人拥有“剧本生成”能力,能够做到表情、语气、动作都匹配台词内容(rong)实时(shi)调整,让数字人拥有了超越真(zhen)人的表现力,迎来数字人的“DeepSeek时(shi)刻”。
同时(shi),高说服力数字人的成本也极大下降。百(bai)度(du)慧播星已上线(xian)“一键克隆”功(gong)能,用户只需录制(zhi)一条最短2分钟的视频(pin)上传训练,即可拥有自己的专属数字人,人人都能做主播。
过去一年,慧播星数字人主播数量累(lei)计超过10 万,其展现出来的高说服力也带来了显著的收益,大盘来看数字人直播转化率提升了31%,降低了80%的开播成本。
随着用户对于AI应用落地的需求日益明确,相较于基础模型(xing)能力,智(zhi)能体(ti)正(zheng)在成为最容(rong)易攻占(zhan)用户心智(zhi)的武器。如果说两大基础模型(xing)的升级(ji),保障了百(bai)度(du)AI能力的下限,那么高说服力数字人、秒哒、心响这样的智(zhi)能体(ti)工具(ju),或许更(geng)能够撑起百(bai)度(du)的上限,成为百(bai)度(du)在应用市场攻城略地最锋利的矛。
在2025这个智(zhi)能体(ti)元(yuan)年,百(bai)度(du)又一次成为起跑最快的玩家。
AI时(shi)代,百(bai)度(du)仍是最全面的一个
包括上述模型(xing)、智(zhi)能体(ti)等(deng)在内,百(bai)度(du)在本次开发者(zhe)大会(hui)上带来一系列产品(pin)技术(shu)发布,再一次证明了自己深厚的技术(shu)积累(lei)和全面性。
大模型(xing)技术(shu)可以分为芯片(pian)、框架、模型(xing)、应用四层架构,百(bai)度(du)是国内乃至全球少有的全面布局企业。从高端芯片(pian)昆仑芯,到飞桨深度(du)学习框架,再到文心预训练大模型(xing),各(ge)个层面都有关键自研技术(shu)。
相比于直接面向用户的模型(xing)和应用,百(bai)度(du)在基础设施层面的优势更(geng)加明显。
芯片(pian)层是中(zhong)国AI产业最薄弱的环节,而在本次大会(hui)上,百(bai)度(du)正(zheng)式宣布基于昆仑芯,点亮3万卡(ka)GPU集群。这是国内首个国产自研三万卡(ka)集群,意义格外重大。
李彦宏在年初谈到,“创新是不能被计划的。你不知道创新何时(shi)何地到来,你所能做的是,营造一个有利于创新的环境。”
在社会(hui)层面如此,在企业层面同样如此。一家企业无法保证自己的创新总是能够成功(gong),总是能够站在行业前沿,但是从概率上来说,基础设施更(geng)完(wan)备的企业,总是拥有更(geng)大的成功(gong)可能性。
由此而言,百(bai)度(du)今年产品(pin)发布节奏的加速,正(zheng)是多年投(tou)入基础设施的回报。
百(bai)度(du)的基础设施能力,也意味着它可以不陷于大模型(xing)之(zhi)间的竞争,而是拥有“卖铲子”的能力。在本次开发者(zhe)大会(hui)上,百(bai)度(du)也专门设置了DeepSeek分会(hui)场,因(yin)为DeepSeek应用落地的“最后一公(gong)里”,同样需要依赖百(bai)度(du)这样的算力服务商。
面向未来,大模型(xing)研发的重投(tou)入属性,注定了群雄(xiong)混战格局不会(hui)长期持续,无论是技术(shu)能力,还是用户使(shi)用习惯,都将向头部玩家收敛,最终可能仅剩与互联网时(shi)代类似(si)的少数几个超级(ji)入口(kou)。
今年以来百(bai)度(du)技术(shu)和产品(pin)的迭代加速,证明在这场入口(kou)之(zhi)争中(zhong),百(bai)度(du)产品(pin)布局的全面性,将会(hui)长期成为一个不容(rong)小觑的重要优势。
继DeepSeek之(zhi)后,百(bai)度(du)正(zheng)在引领新一波AI势能。上午(wu)发布会(hui)后,百(bai)度(du)港股股价午(wu)盘涨(zhang)近5%。
来源|观察者(zhe)网