如果让你(ni)说出今年人工智能领域最轰动的一件事情,那大(da)部分人的答案应(ying)该(gai)是DeepSeek的横空出世。今年2月初(chu),DeepSeek在(zai)140个国家和地区的应(ying)用市场下(xia)载排行(xing)榜同时登顶,并以开源策略充分展现其技术自信。
开源大(da)模型(xing)是指由研究机构或企业开发并公开发布的大(da)规模预训(xun)练模型(xing),其源代(dai)码、参数(shu)权重(zhong)甚至(zhi)是训(xun)练数(shu)据(ju)(或数(shu)据(ju)生成方法)都开放透明,任何(he)人都可以访(fang)问、使用、修改和分发。
“DeepSeek是一款完完全全的开源模型(xing),将各个环节包括数(shu)据(ju)、代(dai)码、权重(zhong)、推(tui)理链的运行(xing)思路、工程(cheng)构建(jian)方法都开放出来,让更多人愿意参与进去。”赛迪研究院(yuan)信软所App产业(ye)研究室副主任黄文鸿说明,就好比建(jian)造一所房子,真正的开源不(bu)仅公开图纸、材(cai)料、房屋结构,还会清晰(xi)地告诉你(ni),每一步应(ying)该(gai)建(jian)什么,有(you)了这(zhe)些信息你(ni)就可以1比1还原房子。由此可见(jian),DeepSeek开放程(cheng)度(du)之高前(qian)所未(wei)有(you),这(zhe)也是其一经发布就产生巨(ju)大(da)影响的原因之一。
降低生态构建(jian)成本(ben)
DeepSeek对于我国人工智能产业(ye)发展最大(da)的意义在(zai)于,其构建(jian)了基于自主研发基座大(da)模型(xing)的开发生态,从软硬件的适配到应(ying)用推(tui)广甚至(zhi)产品宣传,都是全球厂商和开发者共同完成的,极大(da)降低了生态建(jian)设(she)成本(ben)。例如,MicroSoft、英伟达(da)、AMAZON、英特尔、AMD等全球科技巨(ju)头相(xiang)继宣布上线了DeepSeek开源模型(xing)推(tui)理服务,国内厂商诸如Tencent云、阿里云均支(zhi)持DeepSeek的一键部署和调用。
“这(zhe)就像安卓操作系统是开源App一样,因为(wei)开源具有(you)良(liang)好的适配性(xing),手机、芯片、智能家居等各类厂商纷纷接入,让安卓成为(wei)移动互联网时代(dai)能够与苹果IOS系统并驾(jia)齐驱的通用技术底座。”黄文鸿告诉记(ji)者,互联网企业(ye)、车企、三大(da)运营商等纷纷接入DeepSeek,后续(xu)会让很多具体应(ying)用部署在(zai)DeepSeek基座模型(xing)上,将迅(xun)速提高其用户数(shu)量(liang)和市占率(lu)。
除DeepSeek以外,我国还有(you)不(bu)少开源模型(xing)在(zai)业(ye)界引起(qi)广泛关注。就在(zai)DeepSeek-R1发布前(qian),上海AI创业(ye)企业MiniMax发布了其开源模型(xing)MiniMax-01,首次采用线性(xing)注意力(li)机制,实现了技术突破(po);阿里巴(ba)巴(ba)最新开源的通义千问QwQ-32B推(tui)理模型(xing),在(zai)数(shu)学(xue)、代(dai)码及通用能力(li)的多项权威评测集中(zhong)表(biao)现良(liang)好,稳居全球最大(da)AI开源社区Hugging Face趋势榜榜首,成为(wei)当下(xia)最受欢迎的开源大(da)模型(xing)之一。
“这(zhe)些都彰显了开源对技术生态的推(tui)动作用,吸引了业(ye)内各方支(zhi)持,形成良(liang)好的技术分享氛围。”黄文鸿认(ren)为(wei),信息技术领域具有(you)强者恒强的发展规律,我国在(zai)开源模型(xing)上是有(you)先发优势的,必须进一步筑牢技术“护城河”。但(dan)目前(qian)各行(xing)各业(ye)真正懂开源模型(xing)的人才并不(bu)多,基于开源大(da)模型(xing)的下(xia)游企业(ye),以及做工程(cheng)优化、模型(xing)调优的研发人员相(xiang)对较(jiao)少,高校应(ying)该(gai)培养更多相(xiang)关人才,共同促成“创新—共享—再(zai)创新”,助力(li)产业(ye)生态更加完备。
阿里云高级总监朱迅(xun)垚(yao)认(ren)为(wei),开源理念(nian)在(zai)产业(ye)界还没有(you)形成广泛共识,但(dan)DeepSeek和通义千问的成功会让大(da)家逐步认(ren)识到,开源模型(xing)将成为(wei)推(tui)动我国人工智能发展最强劲的引擎。下(xia)一步,建(jian)议从国家到地方再(zai)到企业(ye),以更加积极的态度(du)拥抱开源,同时在(zai)布局智能算力(li)、构建(jian)高质量(liang)数(shu)据(ju)集、上云用云等方面加快创新步伐,紧跟世界先进水平。
推(tui)动应(ying)用落地
DeepSeek发布以来,各行(xing)各业(ye)都在(zai)探索将其融入自身(shen)业(ye)务场景。“开源模型(xing)凭借其低成本(ben)、高性(xing)能、高开放度(du)的技术优势,加速了人工智能在(zai)行(xing)业(ye)的普及速度(du)。”黄文鸿说。
今年2月,恒生电子大(da)模型(xing)应(ying)用全面接入DeepSeek,在(zai)金融投研、合(he)规、运营、投行(xing)等业(ye)务场景中(zhong)取得较(jiao)好效果。例如,在(zai)投行(xing)业(ye)务中(zhong),利用DeepSeek-R1理解能力(li),可自动解析招股书(shu)、尽调报(bao)告等复杂文档,实现财务数(shu)据(ju)校验、合(he)规风险提示的秒级响应(ying)。
通义千问开源模型(xing)Qwen系列更是凭借其多模态、全尺寸的技术能力(li),以及由数(shu)量(liang)庞大(da)的开发者和中(zhong)小企业(ye)汇(hui)聚起(qi)的良(liang)好生态,加快赋能千行(xing)百业(ye)。截(jie)至(zhi)目前(qian),阿里已开源200多款模型(xing),包括文本(ben)生成模型(xing)、视觉理解/生成模型(xing)、语音理解/生成模型(xing)、文生图及视频(pin)模型(xing)等多模态,覆盖从0.5B到110B参数(shu)的各类尺寸。
去年4月,中(zhong)国科学(xue)院(yuan)国家天(tian)文台人工智能工作组发布了基于Qwen打造的新一代(dai)天(tian)文大(da)模型(xing)“星语3.0”。目前(qian)已成功接入国家天(tian)文台兴隆观测站望远镜阵列Mini“司天(tian)”,可实现自主控制望远镜进行(xing)观测、分析观测结果,智能地给出下(xia)一步观测建(jian)议,这(zhe)是大(da)模型(xing)在(zai)天(tian)文观测领域的首次应(ying)用。“从预测蛋白质结构到合(he)成靶向药(yao)物,再(zai)到发现新的病毒种类,大(da)模型(xing)与科研相(xiang)结合(he)带来了许(xu)多突破(po)性(xing)成果。”朱迅(xun)垚(yao)说。
DeepSeek也好,通义千问也罢,我国开源模型(xing)正以其宽松的开发许(xu)可和低成本(ben)的训(xun)练方式,提升人工智能在(zai)行(xing)业(ye)的应(ying)用广度(du)。
商业(ye)模式仍需明晰(xi)
以ChatGPT为(wei)代(dai)表(biao)的闭源模型(xing),其商业(ye)模式被称为(wei)“token(令牌)经济”,即通过向用户提供API服务,基于token用量(liang)计价(jia),然(ran)后来赚取利润。那么,开源模型(xing)又是如何(he)盈利的?
对此,黄文鸿向记(ji)者分享了几(ji)个案例。Meta企业推(tui)出的Llama大(da)模型(xing)通过开源可以吸引更多企业(ye)和开发者加入其生态,为(wei)后续(xu)广告收入创造机会。
市场上还出现了开源闭源并行(xing)的模型(xing)产品。具体而言(yan),首先开放出来相(xiang)对基础的能力(li),培养用户使用习惯,而更高性(xing)能的模型(xing)则需付费(fei)使用。还有(you)的开源模型(xing)会与云服务绑定售卖,相(xiang)当于模型(xing)是免费(fei)的,收取的只是算力(li)费(fei)用。“这(zhe)种模式就好比你(ni)想用IOS系统就必须配备苹果手机。再(zai)有(you)更相(xiang)似的案例是,GOOGLE通过安卓系统吸引用户,再(zai)通过售卖GOOGLE邮箱、GOOGLE地图等增值(zhi)服务收取费(fei)用。”黄文鸿补充道。
在(zai)朱迅(xun)垚(yao)看来,很多做开源模型(xing)的企业(ye)具有(you)浓厚的技术理想主义色(se)彩,他们的初(chu)衷未(wei)必完全是奔着商业(ye)化去的。“通义千问大(da)模型(xing)在(zai)全球拥有(you)超过10万个衍生模型(xing)和上亿(yi)次下(xia)载量(liang),这(zhe)些都是免费(fei)提供给用户的。但(dan)正因为(wei)开源,大(da)量(liang)开发者被吸引过来,阿里云的模型(xing)服务和配套算力(li)服务得到更多开发者青(qing)睐(lai),开发者跟厂商形成一个‘开源—应(ying)用—反馈’的良(liang)性(xing)循环。”
开源模型(xing)的发展仍处于初(chu)期阶段,如何(he)形成健康成熟的商业(ye)模式业(ye)界仍在(zai)探索中(zhong)。“企业(ye)做开源模型(xing)肯定是想盈利的,要摸索出一条(tiao)正向循环发展路径,在(zai)技术普惠和商业(ye)变现间寻找到平衡点,让产业(ye)链上各个环节的参与者都能受益,确保(bao)开源模式持续(xu)稳定运转(zhuan)下(xia)去。”黄文鸿建(jian)议。 (经济日报(bao)记(ji)者 李芃达(da))