开源和闭源一直是大模型发(fa)展中的重(zhong)要议题(ti),DeepSeek掀起的大模型“旋风(feng)”更(geng)引(yin)起技(ji)术界对开闭源策略选择的争论。开源和闭源各有什么优劣?如何理解开源大模型对人工智能发(fa)展的意义?
所(suo)谓“开源”,指的是开放(fang)源代码,意味着开源App的源代码任何人都(dou)可以审查(cha)、修改和增强。DeepSeek便属于开源大模型;而与之相对的闭源App,只有创建者才具备修改权限,像OpenAI旗下chatGPT的一系列(lie)模型就属于闭源专有模型。
发(fa)展大模型,选择开源还是闭源,本质上是由企(qi)业的不同定位决(jue)定的。选择闭源的企(qi)业注重(zhong)用专有技(ji)术换商业利润,选择开源的企(qi)业注重(zhong)用技(ji)术扩散(san)换生态影响。
短期看,闭源将大模型变成企(qi)业的一大盈利点,能够保障企(qi)业在激烈的市场竞(jing)争中获得利润。相比来说,开源模式没有明显的盈利点,但也不意味着不能挣钱。
在大数据时代,信息和流量是最大的财(cai)富,相较专有闭源模型带来直接(jie)的商业利润,以DeepSeek为代表的开源模型通过卓越(yue)性能+免费开源的低部(bu)署成本,一跃成为人工智能时代的基础设施,为未来发(fa)展带来更(geng)多可能。
同时,开源大模型在凝聚全球开发(fa)者、建设智力共同体、快(kuai)速优化(hua)模型能力、本地化(hua)部(bu)署适配各类场景等(deng)各个方面(mian)具有闭源模型无可比拟的优势,更(geng)有潜力塑造行业标准,营(ying)造出(chu)一个能够源源不断培育顶级科技(ji)产品的开放(fang)生态,同时也能通过云服务和硬App等(deng)各种方式创造出(chu)不输于闭源模型的商业价值。
我国拥有联合国产业分(fen)类中所(suo)列(lie)全部(bu)工业门(men)类,开源大模型赋能全产业链空间无限。通过标准化(hua)、模块化(hua)的技(ji)术架(jia)构,大模型能够打通产业链上下游,形成协同创新的生态系统。
在硬件层,算力厂商基于开源模型的通用需求优化(hua)芯片设计;在数据层,标注服务和语料库建设因(yin)模型开源而标准化(hua);在应用层,开发(fa)者可快(kuai)速调用预训练模型开发(fa)垂直场景产品,如智能客服、医疗影像分(fen)析等(deng)。这种全链条的贯通效(xiao)应,使得技(ji)术创新能全方位转化(hua)为经济社(she)会效(xiao)益,为高(gao)质量发(fa)展注入持续动能。
传统闭源模式下,算法、算力、数据的“三重(zhong)垄断”将中小企(qi)业排斥在AI竞(jing)争之外(wai),一方面(mian)使得大模型赋能力度不足(zu),另一方面(mian)也使得大模型缺(que)少足(zu)够的场景和用户反馈,制约其继(ji)续创新。
开源大模型通过“技(ji)术平权”重(zhong)构经济格局。低成本加(jia)卓越(yue)性能,塑造了开源模型的高(gao)性价比,直接(jie)使得大模型能够全面(mian)赋能千行百业。这种开放(fang)生态形成了良性循环的“创新飞轮”:企(qi)业贡献基础模型,学术界优化(hua)算法,开发(fa)者创造应用,最终反哺模型迭代。
技(ji)术路(lu)线(xian)从来不会十全十美,开源模式也是如此。在发(fa)展开源大模型的过程中,应避免一些误区。比如,开源并不等(deng)于忽视常识产权,应加(jia)紧(jin)开源许可协议标准建设,为开源生态确(que)立(li)规范。开源策略公开代码,意味着安全风(feng)险(xian)的暴露和强传播性,应充分(fen)调动开源社(she)区维护者、开源App开发(fa)者、开源代码使用者等(deng)受益于代码开源的利益相关(guan)者的积极(ji)性,形成多元可靠的安全管控网络,以去中心化(hua)的人人防控确(que)保开源安全。
自2017年7月国务院印发(fa)《新一代人工智能发(fa)展规划》至今,我国人工智能产业蓬勃发(fa)展。在其从大转强的历史发(fa)展进程中,我国的人工智能需要一个能充分(fen)激发(fa)技(ji)术创造力和生产力的新生态,而开源正是打造新生态的有力“武器”。(本文来源:经济日报 编辑:钟梓滨)