必一运动·(B-sports)官方网站

业界动态
张维为《这就是中国》第274期| DeepSeek震撼,人工智能,字母,技术
2025-03-17 00:25:25
张维为《这就是中国》第274期| DeepSeek震撼,人工智能,字母,技术

“一个(ge)巨(ju)大的变化,就是一个(ge)产品出现(xian)之后,它带来的是整个(ge)外部世界对中国看法的改变。”

“到了人(ren)工智能时代,这(zhe)个(ge)情况发生了很大的逆转,为什么中文在人(ren)工智能中存在这(zhe)样的一个(ge)技术优势呢?”

前段时间(jian)DeepSeek是火爆出圈了,不仅在科技界引起了广泛的震动,很多普通人(ren)现(xian)在也开始在使用DeepSeek,甚至有的政(zheng)府机(ji)构也开始在应用上(shang)引入了DeepSeek。大家可能很好奇,为什么中国在人(ren)工智能时代会不断地有火爆的产品,中国的整个(ge)科创生态到底有什么样的优势?

在东方卫视3月11日播出的274期的《这(zhe)就是中国》节(jie)目中,复旦大学中国研究(jiu)院院长张维(wei)为教授和复旦大学中国研究(jiu)院特邀研究(jiu)员(yuan)汪涛老师,对DeepSeek的火爆出圈进行了深入观察(cha)和分析。

汪涛:

我今天演讲的主题是——中文在人(ren)工智能时代的优势。DeepSeek之所以爆火,主要并不是它技术上(shang)获(huo)得了突破性的进展,而是其效率获(huo)得了数量级的提升,从而使得它在相同性能的情况下,成本可以下降将近二十多倍。

不同AI模型的Token输(shu)入/输(shu)出价格(ge)(美金/每百万Tokens),可以看到DeepSeek的价格(ge)远低于(yu)其他AI模型Reddit

之所以如此,是因(yin)为研发团队(dui)几乎是将各(ge)种可能提升效率的技术都充分地进行了挖掘(jue),比如说更多地采用底层编码的语言PTX。一般来说,越是底层的编程语言,它的效率就会越高,但是编程的难度也会越大。

另外,还有适当地降低精(jing)度,比如采用一个(ge)字节(jie)的8比特浮点运算,而不是32比特,从而能成倍地减少存储量和运算量,这(zhe)在人(ren)工智能里面有一个(ge)专业的术语叫量化。

还有蒸馏的方法,同样可以极(ji)大地减少参数的数量,除(chu)此之外还有混合专家架构(MoE)、多头潜在注意力技术(MLA)等等。这(zhe)些技术本身并不完全是DeepSeek独创的,原来在美国人(ren)工智能产业界的专业人(ren)员(yuan)都知道这(zhe)些技术,但为什么DeepSeek把这(zhe)些技术充分利用了呢?

今天就谈一个(ge)大家比较容易理解,也非常有意思的话题:中文在人(ren)工智能时代的技术优势。DeepSeek充分利用了中文的优势,所以在它爆火之后,很多人(ren)开始关注到这(zhe)个(ge)问题。

如果大家(men)回顾一下两百多年来的历史,中文在现(xian)代科技中的作用,其实经历过一个(ge)变化的过程。

在中国古代的时期,中国对周边(bian)国家在学问上(shang)有压(ya)倒性的优势。其他地区对中国也有着非常仰慕的心态。但随着中国在近代的落后,尤其是甲午(wu)战争失败以后,导致很多中国常识阶层开始反(fan)思自身。首先反(fan)思的就是大家(men)的学问,也包括大家(men)自己的语言文字。这(zhe)种反(fan)思很快就发展到了极(ji)端,甚至有人(ren)认(ren)为汉字阻碍了中国进入现(xian)代科技文明。也有人(ren)认(ren)为中国应当放(fang)弃中文这(zhe)种象形文字形态,应该改成像拼音这(zhe)样的字母文字。

随着以电(dian)子计算机(ji)为代表的信息技术出现(xian)以后,中文在计算机(ji)键(jian)盘输(shu)入上(shang)存在一定的困难。因(yin)为计算机(ji)键(jian)盘来自英文的打字机(ji),所以输(shu)入英文当然是最简单方便(bian)的。因(yin)此,过去曾经认(ren)为中文阻碍了中国进入现(xian)代科技文明的观点和思潮,在信息技术时代又再一次(ci)沉渣泛起。但是, 二十世纪八十年代,中国科技界在汉字输(shu)入上(shang)做了大量的工作,在当时被(bei)称为叫“万码奔腾”。

这(zhe)些汉字输(shu)入的工作在很大程度上(shang)降低了中文电(dian)脑输(shu)入的困难。其中比较著名和主流的有五笔字型输(shu)入法,也叫王码,是王永民先生发明的。那么另外一个(ge)常用的输(shu)入法是拼音输(shu)入法。虽(sui)然客观上(shang)说,直到今天中文还是比英文等字母文字的键(jian)盘输(shu)入稍微麻烦那么一点点。但是这(zhe)些中文输(shu)入法,在很大程度上(shang),已经有效解决了中文在计算机(ji)上(shang)的输(shu)入问题。在五笔字型输(shu)入法的基础上(shang),充分采用词组输(shu)入以后,它的输(shu)入效率甚至还可以超过英文的输(shu)入。

到了人(ren)工智能时代,这(zhe)个(ge)情况发生了很大的逆转,为什么中文在人(ren)工智能中存在技术优势呢?主要有以下这(zhe)些原因(yin):

首先,汉字非常规整,或者说非常整齐。无论是书写的大小尺寸还是发音的长短尺寸,都是一样的,非常整齐。这(zhe)种规整对于(yu)计算机(ji)的处理而言,是非常方便(bian)的。比如要进行语音识别,中文每个(ge)字的发音都是声母加韵母,发音的长度一样,这(zhe)样就会相对比较容易区分出一句(ju)话中,每一个(ge)字的发音。

相比之下,英文单词的长度,从一个(ge)字母到十几个(ge)字母的都有,这(zhe)样的字母文字,每个(ge)单词它发音的长度可能都是不一样的。像英文里面的“祝贺(he)”,是“Congratulations”,这(zhe)就有15个(ge)字母。大家(men)可能会好奇,那最长的英文单词会有多少个(ge)字母呢?如果大家(men)到网(wang)上(shang)去搜索的话,可能会发现(xian)很多不一样的答案。

还有一个(ge)问题是很多英文的句(ju)子,它的发音会有连读的情况,比如说"what’s your name",那么这(zhe)就更加难以区分出每个(ge)单词。虽(sui)然现(xian)在这(zhe)些问题在人(ren)工智能的语音识别中都已经解决了,但是它解决的技术难度,确实要比中文困难很多,需(xu)要更大的运算量,而且几乎所有的字母文字都存在这(zhe)个(ge)问题。

第(di)二,汉字的信息密度一般比字母文字要高,这(zhe)体现(xian)在很多方面。汉字是一个(ge)表意文字,内涵很丰富,可以用词组、成语等很少的汉字表达相当丰富的含义。尤其像文言文,它的信息密度就更高了。对于(yu)人(ren)工智能来说,最终(zhong)它体现(xian)的是,相同含义的一段语言或文字,在计算机(ji)中需(xu)要有多少存储量和计算量。一般来说,中文的存储量和计算量都是最少的。如果大家(men)对比一下相同内容的中英文,中文一般页数或者篇幅是最少的。

但大家(men)要注意,这(zhe)并不是完全绝对的,因(yin)为英文也有自身的优点,比如说它相对比较严(yan)谨,所以比较严(yan)谨的一些论文或法律文书里面,英文的信息密度与中文的差异就没有那么大了。但是由(you)于(yu)绝大多数情况下,中文的信息密度的确是比较高的,所以在人(ren)工智能的训练中,相同内容的情况下,中文训练的存储量和计算量就会比较少。这(zhe)是中文效率优势的第(di)二个(ge)体现(xian)。

第(di)三,是中文的稳(wen)定性。汉字是相对比较稳(wen)定的一种语言,大家(men)今天使用的汉字与几千年前的甲骨文其实挺接近的。对于(yu)新出现(xian)的事物,汉字是通过常用的一些字去建立新的词组从而适应。并且,这(zhe)样的词组天然地会存在有规律的分类特性,比如机(ji)器的“机(ji)”,可以组成拖拉机(ji)、播种机(ji)、飞机(ji)、纺(fang)织(zhi)机(ji)、发动机(ji)、蒸汽机(ji)、计算机(ji),如此之多的机(ji)器汉字都可以用“机(ji)”这(zhe)个(ge)形成词组来表达。

汉字的稳(wen)定性对人(ren)工智能带来的好处是训练参数可以更少,有效的重(zhong)复训练可以更多,那么准确性就会更高。

相比之下,英文每年都会增(zeng)加大量的新词,常用的单词都可能会发生变化。当然大家(men)提到中文在人(ren)工智能时代的技术优势,并不是要把它过度地拔高,只是从以上(shang)不同技术时代,中文技术优劣势的变化过程中,希翼大家(men)能更客观地看待大家(men)中国自己的学问。在进入人(ren)工智能时代,大家(men)更应该发挥(hui)中文的优势,使得中国在人(ren)工智能时代可以获(huo)得更快的发展,并且有更好的经济效益。

从大家(men)长久以来对自己语言的态度变化中,可以获(huo)得一些启示(shi):那就是如何用科学的态度去看待自己的学问。所谓利弊(bi)或优劣,它永远是相对特定的要求来说的。大家(men)不能因(yin)为遇到了某种劣势就简单地去否定自己的学问,也不能遇到优势就自我膨胀(zhang)。

科学的态度就是实事求是,如果它是劣势,大家(men)就应该想办法改进,去消除(chu)或者减少这(zhe)种劣势。如果是优势,大家(men)就应该想办法去充分地开发利用它。因(yin)为即使是潜在的优势,如果不去充分地开发利用,它也不会自动地体现(xian)出来。谢谢大家。

【圆桌讨论】

主持人(ren):刚才汪涛老师做了非常精(jing)彩的演讲。其实DeepSeek能够一下子火出圈,这(zhe)让各(ge)行各(ge)界都为之震动。它可以说并不是“唯算力论”的,而是用种种方法提升了自己的效率。刚才汪涛老师在分析中提到,提升效率的种种途径当中非常重(zhong)要的一条,同时也是不能忽视的一条——因(yin)为它用的是中文。所以这(zhe)也是大家(men)的一种学问自信。张老师您以前在联合国工作的时候,看各(ge)国文字的文件,是不是中文的文件特别薄一点?

张维(wei)为:那肯定的,最典型的就是《联合国宪章》,有六种官方语言版本,中文是最薄的。道理非常简单,因(yin)为中文核心汉字只有3500个(ge)左右,掌握(wo)后就可以阅读所有报刊,而读《纽(niu)约(yue)时报》至少需(xu)要掌握(wo)2万个(ge)英文单词,否则你会读得非常累。

另外这(zhe)次(ci)DeepSeek的突破让我联想到我之前写过的一本教科书——《英汉同声传译》,至今仍然在使用。我举一个(ge)例子,比方说,一句(ju)很简单的话:你不去,我去。这(zhe)五个(ge)字,你要翻成英文的话是:“You don’t go, I go”。这(zhe)么翻译当然很简单粗暴,但实际(ji)上(shang)中文这(zhe)五个(ge)字,还可以放(fang)在上(shang)下文里来理解的。比方说你可以理解成,“If you don’t go,I will go”,即如果你不去,我去。这(zhe)是一种假(jia)设关系(xi)。也可能是一种让步关系(xi),比方说,即使你不去,我也去。

DeepSeek的开始界面

主持人(ren):或者只要你不去,我就去。

张维(wei)为:所以我在想,DeepSeek要把这(zhe)些关联背景都考虑到,这(zhe)就证明它的“智商”非常高,效率自然也更高。

主持人(ren):它在给你回答的时候,其实已经把各(ge)种条件全部都思考过一遍了。

汪涛:它的概括性很强。

张维(wei)为:如果这(zhe)种中文逻辑它都能够处理,那么它恐怕也是能够处理英文的,这(zhe)是背后的逻辑,我觉得这(zhe)是革(ge)命性的。

汪涛:英文的特点是严(yan)谨,除(chu)了张老师前面说的,英文里面还包括时态、单数、复数。所以英文在很多论文或法律文书中,确实是有它自身的优势,大家(men)也要客观地看到这(zhe)一点。

主持人(ren):现(xian)在很多人(ren)使用DeepSeek,有个(ge)很有意思的现(xian)象,就是你用不同的句(ju)式,或者把某些关键(jian)词前后颠倒一下,搜到的答案也都是不一样的。

汪涛:是的,所以大家(men)不能希望这(zhe)种大模型的精(jing)确性非常高,这(zhe)不仅是DeepSeek,其他所有大模型都是这(zhe)种情况。比如说宏观的经济数据,或行政(zheng)区域的一些数据,这(zhe)些是可以的,但你要想得到一些实效性很强,精(jing)确性很高的数据,这(zhe)就很难实现(xian)了,人(ren)工智能里面称之为“幻觉”。

主持人(ren):如果有人(ren)想要试试看的话,可能会发现(xian)DeepSeek或者其他的通用大模型,会非常严(yan)肃地跟(gen)你胡说八道。

张维(wei)为:恐怕就是要通用大模型以外的垂直模型,各(ge)行各(ge)业、千行百业都要非常具体地做自己的模型。

汪涛:对,所以大家也要注意到一个(ge)问题,就是大语言模型和通用人(ren)工智能,这(zhe)两个(ge)概念往往会被(bei)混在一起说,但其实这(zhe)是有区别的。大语言模型不能完全说它就是通用人(ren)工智能,它的确比以前的应用扩展了很多,尤其是它作为一个(ge)生成式的人(ren)工智能,这(zhe)最初(chu)就是从机(ji)器翻译技术里面过来的。因(yin)为它可以生成各(ge)种各(ge)样你想要的答案,所以感觉它的通用性会比过去强很多。但是真(zhen)正(zheng)你要在不同领域去应用的话,还是需(xu)要各(ge)个(ge)不同的人(ren)工智能技术。

张维(wei)为:这(zhe)次(ci)春(chun)节(jie)年初(chu)二,大家(men)去法国开会,一到那儿,就发觉大家都在谈DeepSeek,基本上(shang)都是西方的学者、官员(yuan),大家(men)一起吃饭,大家都聊这(zhe)个(ge),这(zhe)给他们(men)带来了巨(ju)大的震撼。一方面他们(men)觉得中国今天绝对是跟(gen)美国平起平坐的一个(ge)超级大国。

另外,他们(men)说要搞(gao)欧洲的人(ren)工智能通用大模型,一个(ge)重(zhong)要原因(yin)是要体现(xian)欧洲的价值观。你发现(xian)没有,大模型处理是有价值观的。在语言当中你输(shu)进去不同的语料,出来的东西也是不一样的,对不同问题的回答和描述也是不同的。

我想起德国哲学家维(wei)特根斯坦(tan)说过的名言:你讲这(zhe)个(ge)语言,这(zhe)个(ge)语言也讲你。(You speak a language,language also speaks about you.)你的整个(ge)学问背景都在你使用的语言里。你看大家(men)前段时间(jian)去蒙(meng)古国访问,蒙(meng)古国盛产绵(mian)羊(yang),相关的英文表述复杂得不得了:羊(yang)(sheep),羊(yang)肉(mutton) ,羊(yang)毛(wool),羊(yang)绒(cashmere)。

主持人(ren):不认(ren)识这(zhe)些单词的话,根本不知道它们(men)其实都有关联。

张维(wei)为:中文一下就抓住,所以中文是寻求共性的语言。

汪涛:中文都带“羊(yang)”字。

主持人(ren):就像张老师一直举例说,只要是三点水,在中文里头,它多少都是跟(gen)水有关系(xi),如江、河(he)、湖(hu)、海(hai)。

张维(wei)为:这(zhe)是伟大的智慧,大家(men)的祖先早就知道,想要治理这(zhe)么大的国家,就一定要强调共性,一定要强调不同事物之间(jian)的共同之处,这(zhe)对治国理政(zheng)都有启发。

主持人(ren):对,刚才张老师提到说DeepSeek引起了欧洲人(ren)的思考,而且他们(men)还担心在价值观影响方面落后于(yu)其他国家。所以,我想问问汪老师,当大家(men)讨论DeepSeek也好,包括今年火爆出圈的宇树科技,以及其他杭州“六小龙”成员(yuan)等等,就他们(men)给整个(ge)社会带来的震动,到底包括哪些内容?

汪涛:我觉得它最大的影响,就是彻底颠覆了大家(men)过去的认(ren)知,即中国只能作为追随者。事实上(shang)DeepSeek走出的这(zhe)一步说明,中国人(ren)是可以去引领一些技术发展方向的。这(zhe)给大家的震撼非常强,尤其它在市(shi)场上(shang)、应用上(shang)带来的很多方面的影响也非常大。

杭州“六小龙”

张维(wei)为:因(yin)为这(zhe)次(ci)在欧洲我也有这(zhe)个(ge)感觉,为什么他们(men)这(zhe)么被(bei)震撼?因(yin)为他们(men)一下就看到,美国对中国的科技封锁是没有用的。这(zhe)开始变成一种共识:中国在遭到如此封锁的情况下,还可以做到这(zhe)么好,做到世界一流。

这(zhe)次(ci)德意志银行关于(yu)中国资产的报告中,核心概念开始改变,过去它们(men)认(ren)为中国资产只是tradable,也就是可以买来作为交易的,短线的,或者小打小闹玩玩的;现(xian)在叫investable,就是可以投资的。这(zhe)是认(ren)知方面的巨(ju)大变化。所以说一个(ge)超级产品出现(xian)之后,它带来的是整个(ge)外部世界对中国看法的改变。

我承认(ren)一些报告里边(bian)可能包含不良企(qi)图,甚至阴谋诡计,甚至不排斥(chi)服务于(yu)华尔(er)街金融战的需(xu)要等等,但至少到现(xian)在为止,大家(men)看到DeepSeek对西方带来震撼是非常深刻的。网(wang)上(shang)有人(ren)说,DeepSeek帮中国打赢了科技战,也在间(jian)接地帮中国打赢金融战。

汪涛:我以前有个(ge)观点叫“遏制(zhi)背反(fan)定律”,就是遏制(zhi)有多大,它的促进力就有多大。DeepSeek就是一个(ge)非常典型的例子,因(yin)为它如果不是在这(zhe)种限制(zhi)、封锁越来越严(yan)厉的情况下,它不会想到去大幅度地提升效率。因(yin)为没有芯片可用了,它只好去把效率极(ji)大地提升,无止境地去挖掘(jue),挖掘(jue)到最后,我用现(xian)有的这(zhe)些芯片就可以来玩大模型,这(zhe)一定程度上(shang)也是被(bei)美国逼出来的一个(ge)创新。

那么DeepSeek一走通后,不仅让美国原来的封锁垮掉,而且让英伟达建立的整个(ge)体系(xi),或者说它以前的商业逻辑,一下都垮掉了。

主持人(ren):所以汪老师,您怎么来观察(cha)目前中国的科创生态?

汪涛:中国的整个(ge)产业链已经非常完善了,这(zhe)一点就体现(xian)在刚才谈到的:大家(men)一条路(lu)走不通,可以走另外一条路(lu)。过去无论是在芯片还是在人(ren)工智能上(shang),要想提升运算速度,有很多条路(lu)径可以走,提升集成度也有很多条路(lu)径可以走,所以你用28纳米也可以做出跟(gen)14纳米集成度一样的芯片。只不过可能在别的方面损失一点,但实际(ji)上(shang)它是可以实现(xian)的。

主持人(ren):效果一样就可以。

汪涛:那么像这(zhe)一次(ci)DeepSeek为什么能够实现(xian)这(zhe)么大的突破?事实上(shang)如此大程度的效率提升,它的潜力其实一直都存在,只不过过去都是沿着美国的路(lu)径设计的。因(yin)为整个(ge)技术发展的路(lu)径都是被(bei)这(zhe)些西方核心芯片企业所引导的,比如在很多人(ren)的概念中,电(dian)脑久了以后运算速度会下降,但如果大家(men)知道怎么配置,其实可以保持运算速度做到几乎不变。

所以,过去由(you)美国的技术企业主导着技术发展的方向。但是现(xian)在美国制(zhi)裁之后,逼着中国去找别的路(lu)径,最后大家(men)发现(xian)其实能走的路(lu)很多,大家(men)可以通过很多方法去提升效率。

中美科技企业的AI竞赛(sai)

张维(wei)为:对大家(men)的启发就是,大家(men)一定要有自己的话语,尤其不要总是跟(gen)随着美国的话语、华尔(er)街的话语、资本力量的话语。为什么大家(men)当时对美国的经济判断相对比较准确,对川普当选的预(yu)测也比较准确,一个(ge)重(zhong)要原因(yin)是因(yin)为大家(men)解构了它的话语,解构之后你就非常自信。美国经济情况不好,实际(ji)上(shang)科技情况也不是很好,所以这(zhe)对大家(men)很多媒体人(ren)、学者、一些科技工编辑也是个(ge)教训,大家(men)分析任何事情,要有独立自主的思考,现(xian)在到这(zhe)个(ge)阶段了。

主持人(ren):我觉得张老师这(zhe)点说得特别对,就是要有自己的独立思考。其实在科技这(zhe)一块,就像汪老师说的,因(yin)为以往所有的语言架构、语言体系(xi)都被(bei)设置好了,所以大家就是这(zhe)么干的,大部分不会去思考。但是被(bei)逼地去思考了以后,发现(xian)全然不是如此。

汪涛:对,是这(zhe)样的。

主持人(ren):我再问一下张老师,您有没有观察(cha)过DeepSeek这(zhe)个(ge)应用?您用下来感觉如何?

张维(wei)为:我真(zhen)的问了一个(ge)问题,这(zhe)个(ge)问题知道的人(ren)不多,它回答得还蛮有水平的。因(yin)为我研究(jiu)“文明型国家”,我问它“文明型国家”跟(gen)“文明国家”有什么区别?它给了我一个(ge)很像样的回答,这(zhe)是我没想到的,对这(zhe)么一个(ge)比较小众(zhong)的问题,一个(ge)定义方面的问题,它还拿出一个(ge)几百字的报告。

主持人(ren):现(xian)在除(chu)了个(ge)人(ren),有一些政(zheng)府机(ji)构也在用 DeepSeek。您觉得在哪些内容领域可以使用?

汪涛:首先大家(men)排除(chu)那些可靠(kao)性要求特别高的内容。比如说工业控制(zhi),不能轻易地使用,因(yin)为你出一次(ci)错,那造(zao)成的损失会很惨重(zhong)。其次(ci)。军事情报不要去轻易用。因(yin)为大模型的这(zhe)种“幻觉”,它在理论上(shang)是不可能消除(chu)的。所以它可以做参考,在其他一些对可靠(kao)性、精(jing)确度要求不那么高的领域,它确实应用可以更广。尤其是像文创,本身它就是描述一种感觉。

主持人(ren):要天马行空(kong),或者说多一点创意和创想。

汪涛:像是写报告、做PPT的话,它也可以让内容更加优化。甚至现(xian)在DeepSeek已经可以产出一些初(chu)步的、统(tong)计性的、宏观的地区经济分析,然后在他产出的基本报告上(shang)去加工,就能省很多事。

【观众(zhong)提问】

观众(zhong):今天想请教几位老师的一个(ge)问题是:DeepSeek 的开源(yuan)策略会如何推动中国在AI领域形成非对称技术竞争能力,突破美国的技术封锁?中国在今后是否会加大对开源(yuan)社区的政(zheng)策支(zhi)持?

主持人(ren):开源(yuan)是一个(ge)关键(jian)词,汪涛老师您觉得大家(men)怎么来理解开源(yuan)的作用?

汪涛:其实不是说开源(yuan)就一定会达到某种结果。比如在过去,个(ge)人(ren)计算机(ji)的时代下,MicroSoft的操作系(xi)统(tong)可以说处于(yu)统(tong)治地位,同时期还有Linux的操作系(xi)统(tong),也是开源(yuan)的,但是Linux的开源(yuan)一直没能撼动MicroSoft企业在个(ge)人(ren)计算机(ji)操作系(xi)统(tong)的地位。

在大模型时代,事实上(shang)在DeepSeek之前也有开源(yuan)的,像麦(mai)塔也开发过一个(ge)大模型就是开源(yuan)的。但为什么DeepSeek的开源(yuan),实现(xian)了这(zhe)么大的冲(chong)击?原因(yin)就是效率的提升,它不是说百分之几十的提升,甚至不是一倍的提升,而是数量级的提升。这(zhe)带来的影响本身就非常震撼。所以不是说App开源(yuan)了,它的经济性就一定好。

DeepSeek同其他模型性能对比

主持人(ren):如果免费但是很不好用,那也没有人(ren)来。

汪涛:或者是说效率的提升没有那么高,它的开源(yuan)意义就没有那么大,因(yin)为价值没有那么大。但是DeepSeek对于(yu)效率的数量级提升,除(chu)了它自己的使用成本降低以外,底层的硬件成本同样是数量级的降低,这(zhe)个(ge)价值就很大了。

除(chu)此之外,DeepSeek还有一个(ge)对中国很大的影响。大家(men)都知道,人(ren)工智能的大模型目前还处于(yu)初(chu)级阶段,标准还未完全形成。过去为什么Linux很难撼动MicroSoft在操作系(xi)统(tong)的地位?因(yin)为标准已经被(bei)MicroSoft建立起来了,整个(ge)生态已经建立起来了。

DeepSeek在美国的人(ren)工智能生态环境还没完全建立起来的时候,突然之间(jian)得到了广泛应用,紧接着带来的影响,就是建立一个(ge)以中国人(ren)工智能大模型为标准的生态,这(zhe)个(ge)影响是非常大的。

主持人(ren):张老师说中国话语有一个(ge)非常重(zhong)要的构成,就是标准的制(zhi)定。如果DeepSeek在未来能够引领相关标准的制(zhi)定,那这(zhe)将是它最大的贡献。

张维(wei)为:有些东西只要眼光稍微长远一点,就能认(ren)识到形成生态最终(zhong)可以带来的价值。而且据我知道,即使在开源(yuan)里边(bian),也并不都是一样的,它里边(bian)各(ge)种各(ge)样的源(yuan)代码,有的属于(yu)训练的源(yuan)代码,有的属于(yu)推理的源(yuan)代码,并非都是开放(fang)的,所以还有很多细分的技术领域。

主持人(ren):说到生态,我倒是想问汪老师一个(ge)问题,您觉得像DeepSeek这(zhe)些企业的出现(xian),它受益于(yu)大家(men)在科创生态上(shang)哪些成就?接下来还会对整个(ge)科创生态带来什么影响?

汪涛:DeepSeek的开发主要是人(ren)工智能App相关的开发,如果中国的人(ren)才积累没有达到现(xian)在非常雄厚的基础,那要开发是很难的。那么DeepSeek起来以后,它会连带影响其他生态的建立,比如人(ren)工智能的芯片。过去人(ren)们(men)的概念中只有用英伟达的芯片,现(xian)在DeepSeek将效率提升后,大家(men)可能没有那么依赖高性能的芯片,也可以带动中国人(ren)工智能芯片的爆炸性增(zeng)长。对于(yu)下游(you)环节(jie)的各(ge)种应用场景,这(zhe)种生态的建立也是有很大作用的。

刚才张老师谈到说,欧洲也想建立基于(yu)它自身价值观的“DeepSeek”,所以这(zhe)个(ge)影响是非常快的。

主持人(ren):差不多去年的这(zhe)个(ge)时候,大家(men)讨论的是ChatGPT 4。当时大家(men)还讨论它的文生视频。其实文生视频,张老师当时一直说这(zhe)是一个(ge)概念,你可能做个(ge)短视频可以,但做长的就不行。因(yin)为大家(men)也在节(jie)目里说过,这(zhe)是非常耗电(dian)的,电(dian)力支(zhi)撑很容易供(gong)应不上(shang)。但是刚才汪老师说因(yin)为DeepSeek它提供(gong)了效率,它不是“唯算力论”,而是数量级地降低了对算力的依赖,所以这(zhe)也就意味着它将会数量级地降低对能源(yuan)的依赖。

汪涛:这(zhe)是很自然的。

主持人(ren):这(zhe)是非常了不起的。所以当大家(men)做大型运算的时候,它对于(yu)周围的资源(yuan)消耗会变得很划算。

汪涛:这(zhe)个(ge)问题的出现(xian)是因(yin)为摩尔(er)定律逐渐达到了极(ji)限。原来芯片不断在发展,大家(men)对算力的需(xu)求也在不断增(zeng)长,过去没有这(zhe)个(ge)问题,现(xian)在为什么出现(xian)了这(zhe)个(ge)问题?在摩尔(er)定律还有效的时代,我提升几倍、十几倍的算力,它是可以保持功耗不变的。即使随着集成度的提升,在实现(xian)更高算力的情况下,它的功耗也一直维(wei)持在一个(ge)水平上(shang)。但是现(xian)在因(yin)为摩尔(er)定律越来越接近极(ji)限,这(zhe)就意味着伴随运算能力提升,功耗很难再降低了。

因(yin)此,现(xian)在大家(men)可以看到很多给最初(chu)计算机(ji)降温的技术,甚至水冷技术、液冷的技术都用上(shang)了。这(zhe)就意味着,算力的增(zeng)长必(bi)然带来功耗的同步增(zeng)长,或者说虽(sui)然没有完全同步,但是影响会很大。

DeepSeek的出现(xian)给了大家(men)另外一个(ge)方向:大家(men)不用单纯地去追求算力,而应该降低对算力的需(xu)求,这(zhe)也是一个(ge)节(jie)省能源(yuan)的方法。不仅仅DeepSeek可以这(zhe)么干,大模型、人(ren)工智能也可以这(zhe)么干,因(yin)为我研究(jiu)生时候的课题,是在个(ge)人(ren)计算机(ji)上(shang)面实现(xian)过去巨(ju)型机(ji)的卫星云图处理。当时大家(men)就采用了各(ge)种各(ge)样降低算力需(xu)求的方法,过去大家(men)也听到说中国研究(jiu)原子弹(dan),那时候没有高性能计算机(ji),是由(you)算盘打出来的。

如果算法完全一样,那用算盘也能把原子弹(dan)“打”出来,未来事实上(shang)也是这(zhe)样的。芯片提升是一个(ge)路(lu)径,但大家(men)现(xian)在提供(gong)了另外一条路(lu)径,只是说在过去摩尔(er)定律成立的时代,大家(men)把这(zhe)些方法都忘了。因(yin)为既然芯片算力可以那么快增(zeng)长,为什么要去省算力呢?

主持人(ren):最后发现(xian)算力不仅本身有瓶颈(jing),而且还要制(zhi)约(yue)你。

汪涛:所以未来这(zhe)可能在很多领域都会出现(xian),甚至在一些对算力需(xu)求很大的领域。那么怎么降低算力的一些技术发展?这(zhe)就成为了一个(ge)方向。

主持人(ren):我觉得汪老师的观点给了大家(men)一个(ge)启发,就是您说的从节(jie)约(yue)能耗、从对自然环境友好、从“双碳”目标的实现(xian)来说,咱也得换条路(lu)走,因(yin)为那种高能耗的路(lu)是不能走下去的。好,大家(men)再来看这(zhe)边(bian)还有哪位朋友要参与讨论,欢迎提问。

观众(zhong):两位老师好。主持人(ren)好,我是陈希赟,来自上(shang)海(hai),我是一名硕士二年级的在校学生。考虑到最近DeepSeek 和宇树科技都特别火,我想了解一下国家在相关方面的一些前沿布局是什么?以及我作为一个(ge)即将毕业参加秋招的学生,我也想了解一下,我可以重(zhong)点关注什么行业和领域?

汪涛:应该说DeepSeek这(zhe)种人(ren)工智能大模型对于(yu)文创领域是非常好的一个(ge)工具,也是很重(zhong)要的一个(ge)应用领域。需(xu)要认(ren)识到,它并不能完全替代人(ren)力,所以不要指望人(ren)工智能这(zhe)样的工具可以完全做到跟(gen)人(ren)一样,甚至完全替代掉人(ren)来做事。但是它会提供(gong)一些很好的基础工作,你在这(zhe)个(ge)上(shang)面去进行一些加工,会有很好的应用。

涉及到就业的问题就相对比较复杂一些。但不管怎么样,最重(zhong)要的是你的能力,比如说我在大学的专业是电(dian)子测量,但是后来大家(men)一个(ge)班的很少有人(ren)专门做这(zhe)个(ge)工作,但是你掌握(wo)的工具,它的应用面是很广的,就你可以去做很多别的工作,根据市(shi)场的变化,可以很容易去适应。

主持人(ren):我前两天跟(gen)一个(ge)大学教授有个(ge)对话,他都是要求他的学生交读书笔记的,但是最近他发现(xian),这(zhe)些学生交上(shang)来的读书笔记有很浓的DeepSeek痕迹,所以他说他打算改一个(ge)方式,跟(gen)自己的硕士博士生面对面地让他们(men)谈谈读某本书的感受。所以我就在想,可能DeepSeek可以帮助(zhu)大家初(chu)步地做些什么,但是最后的成果你应该远远超出它,这(zhe)样才是一个(ge)好的作品。

张维(wei)为:反(fan)正(zheng)我觉得DeepSeek也好,或者人(ren)工智能发展,机(ji)器人(ren)发展也好,某种意义上(shang)是革(ge)命性的,许多现(xian)有的工作可能会因(yin)此消失,但同时也会相应创造(zao)一些新的工作机(ji)遇,天无绝人(ren)之路(lu)。

2025年2月10日,杭州云深处科技的工作人(ren)员(yuan)在动态展示(shi)“绝影”系(xi)列机(ji)器人(ren)。新华社

主持人(ren):刚才大家(men)也聊到人(ren)工智能可能在未来生活当中的一些应用。但回过头来讲,大家(men)今天的话题从DeepSeek火出圈开始,到汪老师说明为什么它可以不要“唯算力论”来提高自己的效率。我想,包括DeepSeek在内的很多科技企业的成功,一方面在于(yu)大家(men)这(zhe)些年,其实在科创生态上(shang)始终(zhong)努力地布局,另一方面在于(yu)许许多多该领域从业者的心血努力。

另外,大家(men)也可以看到像这(zhe)样的一些企业的崛起和发展,毫无疑问还会继续重(zhong)塑大家(men)中国的整个(ge)科创生态,带来许许多多新的局面,也让大家(men)一起期待。谢谢演播室的两位嘉宾,谢谢大家一起来参与讨论,再见。

最新资讯
  • 雁峰区岳屏镇
  • 松滋市王家桥镇
  • 盐津县豆沙镇
  • 丰城市河洲街
  • 惠城区河南岸街
  • 兴国县潋江镇
  • 金溪县浒湾镇
  • 嵊州市仙岩镇
  • 华容县注滋口镇
  • 南汇区书院镇
  • 邢台县皇寺镇
  • 河南中青综合资讯
  • 游戏百科综合资讯
  • 快云游综合资讯
  • 快云综合资讯
  • 久诚汽车资讯
  • 癫痫百科
  • 体育百科资讯
  • App百科资讯
  • sitemapsitemap1sitemap2sitemap3sitemap4sitemap5sitemap6sitemap7
    XML 地图 | Sitemap 地图