张维为《这就是中国》第274期| DeepSeek震撼,人工智能,字母,技术20250317-业界动态-pqbbw.com

张维为《这就是中国》第274期| DeepSeek震撼,人工智能,字母,技术

2025-03-17 00:25:25

张维为《这就是中国》第274期| DeepSeek震撼,人工智能,字母,技术

“一个(ge)巨(ju)大的变化，就是一个(ge)产品出现(xian)之后，它带来的是整个(ge)外部世界对中国看法的改变。”

“到了人(ren)工智能时代，这(zhe)个(ge)情况发生了很大的逆转，为什么中文在人(ren)工智能中存在这(zhe)样的一个(ge)技术优势呢？”

前段时间(jian)DeepSeek是火爆出圈了，不仅在科技界引起了广泛的震动，很多普通人(ren)现(xian)在也开始在使用DeepSeek，甚至有的政(zheng)府机(ji)构也开始在应用上(shang)引入了DeepSeek。大家可能很好奇，为什么中国在人(ren)工智能时代会不断地有火爆的产品，中国的整个(ge)科创生态到底有什么样的优势？

在东方卫视3月11日播出的274期的《这(zhe)就是中国》节(jie)目中，复旦大学中国研究(jiu)院院长张维(wei)为教授和复旦大学中国研究(jiu)院特邀研究(jiu)员(yuan)汪涛老师，对DeepSeek的火爆出圈进行了深入观察(cha)和分析。

汪涛:

我今天演讲的主题是——中文在人(ren)工智能时代的优势。DeepSeek之所以爆火，主要并不是它技术上(shang)获(huo)得了突破性的进展，而是其效率获(huo)得了数量级的提升，从而使得它在相同性能的情况下，成本可以下降将近二十多倍。

展开剩余 94 %

不同AI模型的Token输(shu)入/输(shu)出价格(ge)（美金/每百万Tokens），可以看到DeepSeek的价格(ge)远低于(yu)其他AI模型Reddit

之所以如此，是因(yin)为研发团队(dui)几乎是将各(ge)种可能提升效率的技术都充分地进行了挖掘(jue)，比如说更多地采用底层编码的语言PTX。一般来说，越是底层的编程语言，它的效率就会越高，但是编程的难度也会越大。

另外，还有适当地降低精(jing)度，比如采用一个(ge)字节(jie)的8比特浮点运算，而不是32比特，从而能成倍地减少存储量和运算量，这(zhe)在人(ren)工智能里面有一个(ge)专业的术语叫量化。

还有蒸馏的方法，同样可以极(ji)大地减少参数的数量，除(chu)此之外还有混合专家架构（MoE）、多头潜在注意力技术（MLA）等等。这(zhe)些技术本身并不完全是DeepSeek独创的，原来在美国人(ren)工智能产业界的专业人(ren)员(yuan)都知道这(zhe)些技术，但为什么DeepSeek把这(zhe)些技术充分利用了呢？

今天就谈一个(ge)大家比较容易理解，也非常有意思的话题：中文在人(ren)工智能时代的技术优势。DeepSeek充分利用了中文的优势，所以在它爆火之后，很多人(ren)开始关注到这(zhe)个(ge)问题。

如果大家(men)回顾一下两百多年来的历史，中文在现(xian)代科技中的作用，其实经历过一个(ge)变化的过程。

在中国古代的时期，中国对周边(bian)国家在学问上(shang)有压(ya)倒性的优势。其他地区对中国也有着非常仰慕的心态。但随着中国在近代的落后，尤其是甲午(wu)战争失败以后，导致很多中国常识阶层开始反(fan)思自身。首先反(fan)思的就是大家(men)的学问，也包括大家(men)自己的语言文字。这(zhe)种反(fan)思很快就发展到了极(ji)端，甚至有人(ren)认(ren)为汉字阻碍了中国进入现(xian)代科技文明。也有人(ren)认(ren)为中国应当放(fang)弃中文这(zhe)种象形文字形态，应该改成像拼音这(zhe)样的字母文字。

随着以电(dian)子计算机(ji)为代表的信息技术出现(xian)以后，中文在计算机(ji)键(jian)盘输(shu)入上(shang)存在一定的困难。因(yin)为计算机(ji)键(jian)盘来自英文的打字机(ji)，所以输(shu)入英文当然是最简单方便(bian)的。因(yin)此，过去曾经认(ren)为中文阻碍了中国进入现(xian)代科技文明的观点和思潮，在信息技术时代又再一次(ci)沉渣泛起。但是，二十世纪八十年代，中国科技界在汉字输(shu)入上(shang)做了大量的工作，在当时被(bei)称为叫“万码奔腾”。

这(zhe)些汉字输(shu)入的工作在很大程度上(shang)降低了中文电(dian)脑输(shu)入的困难。其中比较著名和主流的有五笔字型输(shu)入法，也叫王码，是王永民先生发明的。那么另外一个(ge)常用的输(shu)入法是拼音输(shu)入法。虽(sui)然客观上(shang)说，直到今天中文还是比英文等字母文字的键(jian)盘输(shu)入稍微麻烦那么一点点。但是这(zhe)些中文输(shu)入法，在很大程度上(shang)，已经有效解决了中文在计算机(ji)上(shang)的输(shu)入问题。在五笔字型输(shu)入法的基础上(shang)，充分采用词组输(shu)入以后，它的输(shu)入效率甚至还可以超过英文的输(shu)入。

到了人(ren)工智能时代，这(zhe)个(ge)情况发生了很大的逆转，为什么中文在人(ren)工智能中存在技术优势呢？主要有以下这(zhe)些原因(yin)：

首先，汉字非常规整，或者说非常整齐。无论是书写的大小尺寸还是发音的长短尺寸，都是一样的，非常整齐。这(zhe)种规整对于(yu)计算机(ji)的处理而言，是非常方便(bian)的。比如要进行语音识别，中文每个(ge)字的发音都是声母加韵母，发音的长度一样，这(zhe)样就会相对比较容易区分出一句(ju)话中，每一个(ge)字的发音。

相比之下，英文单词的长度，从一个(ge)字母到十几个(ge)字母的都有，这(zhe)样的字母文字，每个(ge)单词它发音的长度可能都是不一样的。像英文里面的“祝贺(he)”，是“Congratulations”，这(zhe)就有15个(ge)字母。大家(men)可能会好奇，那最长的英文单词会有多少个(ge)字母呢？如果大家(men)到网(wang)上(shang)去搜索的话，可能会发现(xian)很多不一样的答案。

还有一个(ge)问题是很多英文的句(ju)子，它的发音会有连读的情况，比如说"what’s your name"，那么这(zhe)就更加难以区分出每个(ge)单词。虽(sui)然现(xian)在这(zhe)些问题在人(ren)工智能的语音识别中都已经解决了，但是它解决的技术难度，确实要比中文困难很多，需(xu)要更大的运算量，而且几乎所有的字母文字都存在这(zhe)个(ge)问题。

第(di)二，汉字的信息密度一般比字母文字要高，这(zhe)体现(xian)在很多方面。汉字是一个(ge)表意文字，内涵很丰富，可以用词组、成语等很少的汉字表达相当丰富的含义。尤其像文言文，它的信息密度就更高了。对于(yu)人(ren)工智能来说，最终(zhong)它体现(xian)的是，相同含义的一段语言或文字，在计算机(ji)中需(xu)要有多少存储量和计算量。一般来说，中文的存储量和计算量都是最少的。如果大家(men)对比一下相同内容的中英文，中文一般页数或者篇幅是最少的。

但大家(men)要注意，这(zhe)并不是完全绝对的，因(yin)为英文也有自身的优点，比如说它相对比较严(yan)谨，所以比较严(yan)谨的一些论文或法律文书里面，英文的信息密度与中文的差异就没有那么大了。但是由(you)于(yu)绝大多数情况下，中文的信息密度的确是比较高的，所以在人(ren)工智能的训练中，相同内容的情况下，中文训练的存储量和计算量就会比较少。这(zhe)是中文效率优势的第(di)二个(ge)体现(xian)。

第(di)三，是中文的稳(wen)定性。汉字是相对比较稳(wen)定的一种语言，大家(men)今天使用的汉字与几千年前的甲骨文其实挺接近的。对于(yu)新出现(xian)的事物，汉字是通过常用的一些字去建立新的词组从而适应。并且，这(zhe)样的词组天然地会存在有规律的分类特性，比如机(ji)器的“机(ji)”，可以组成拖拉机(ji)、播种机(ji)、飞机(ji)、纺(fang)织(zhi)机(ji)、发动机(ji)、蒸汽机(ji)、计算机(ji)，如此之多的机(ji)器汉字都可以用“机(ji)”这(zhe)个(ge)形成词组来表达。

汉字的稳(wen)定性对人(ren)工智能带来的好处是训练参数可以更少，有效的重(zhong)复训练可以更多，那么准确性就会更高。

相比之下，英文每年都会增(zeng)加大量的新词，常用的单词都可能会发生变化。当然大家(men)提到中文在人(ren)工智能时代的技术优势，并不是要把它过度地拔高，只是从以上(shang)不同技术时代，中文技术优劣势的变化过程中，希翼大家(men)能更客观地看待大家(men)中国自己的学问。在进入人(ren)工智能时代，大家(men)更应该发挥(hui)中文的优势，使得中国在人(ren)工智能时代可以获(huo)得更快的发展，并且有更好的经济效益。

从大家(men)长久以来对自己语言的态度变化中，可以获(huo)得一些启示(shi)：那就是如何用科学的态度去看待自己的学问。所谓利弊(bi)或优劣，它永远是相对特定的要求来说的。大家(men)不能因(yin)为遇到了某种劣势就简单地去否定自己的学问，也不能遇到优势就自我膨胀(zhang)。

科学的态度就是实事求是，如果它是劣势，大家(men)就应该想办法改进，去消除(chu)或者减少这(zhe)种劣势。如果是优势，大家(men)就应该想办法去充分地开发利用它。因(yin)为即使是潜在的优势，如果不去充分地开发利用，它也不会自动地体现(xian)出来。谢谢大家。

【圆桌讨论】

主持人(ren)：刚才汪涛老师做了非常精(jing)彩的演讲。其实DeepSeek能够一下子火出圈，这(zhe)让各(ge)行各(ge)界都为之震动。它可以说并不是“唯算力论”的，而是用种种方法提升了自己的效率。刚才汪涛老师在分析中提到，提升效率的种种途径当中非常重(zhong)要的一条，同时也是不能忽视的一条——因(yin)为它用的是中文。所以这(zhe)也是大家(men)的一种学问自信。张老师您以前在联合国工作的时候，看各(ge)国文字的文件，是不是中文的文件特别薄一点？

张维(wei)为：那肯定的，最典型的就是《联合国宪章》，有六种官方语言版本，中文是最薄的。道理非常简单，因(yin)为中文核心汉字只有3500个(ge)左右，掌握(wo)后就可以阅读所有报刊，而读《纽(niu)约(yue)时报》至少需(xu)要掌握(wo)2万个(ge)英文单词，否则你会读得非常累。

另外这(zhe)次(ci)DeepSeek的突破让我联想到我之前写过的一本教科书——《英汉同声传译》，至今仍然在使用。我举一个(ge)例子，比方说，一句(ju)很简单的话：你不去，我去。这(zhe)五个(ge)字，你要翻成英文的话是：“You don’t go, I go”。这(zhe)么翻译当然很简单粗暴，但实际(ji)上(shang)中文这(zhe)五个(ge)字，还可以放(fang)在上(shang)下文里来理解的。比方说你可以理解成，“If you don’t go，I will go”，即如果你不去，我去。这(zhe)是一种假(jia)设关系(xi)。也可能是一种让步关系(xi)，比方说，即使你不去，我也去。

DeepSeek的开始界面

主持人(ren)：或者只要你不去，我就去。

张维(wei)为：所以我在想，DeepSeek要把这(zhe)些关联背景都考虑到，这(zhe)就证明它的“智商”非常高，效率自然也更高。

主持人(ren)：它在给你回答的时候，其实已经把各(ge)种条件全部都思考过一遍了。

汪涛：它的概括性很强。

张维(wei)为：如果这(zhe)种中文逻辑它都能够处理，那么它恐怕也是能够处理英文的，这(zhe)是背后的逻辑，我觉得这(zhe)是革(ge)命性的。

汪涛：英文的特点是严(yan)谨，除(chu)了张老师前面说的，英文里面还包括时态、单数、复数。所以英文在很多论文或法律文书中，确实是有它自身的优势，大家(men)也要客观地看到这(zhe)一点。

主持人(ren)：现(xian)在很多人(ren)使用DeepSeek，有个(ge)很有意思的现(xian)象，就是你用不同的句(ju)式，或者把某些关键(jian)词前后颠倒一下，搜到的答案也都是不一样的。

汪涛：是的，所以大家(men)不能希望这(zhe)种大模型的精(jing)确性非常高，这(zhe)不仅是DeepSeek，其他所有大模型都是这(zhe)种情况。比如说宏观的经济数据，或行政(zheng)区域的一些数据，这(zhe)些是可以的，但你要想得到一些实效性很强，精(jing)确性很高的数据，这(zhe)就很难实现(xian)了，人(ren)工智能里面称之为“幻觉”。

主持人(ren)：如果有人(ren)想要试试看的话，可能会发现(xian)DeepSeek或者其他的通用大模型，会非常严(yan)肃地跟(gen)你胡说八道。

张维(wei)为：恐怕就是要通用大模型以外的垂直模型，各(ge)行各(ge)业、千行百业都要非常具体地做自己的模型。

汪涛：对，所以大家也要注意到一个(ge)问题，就是大语言模型和通用人(ren)工智能，这(zhe)两个(ge)概念往往会被(bei)混在一起说，但其实这(zhe)是有区别的。大语言模型不能完全说它就是通用人(ren)工智能，它的确比以前的应用扩展了很多，尤其是它作为一个(ge)生成式的人(ren)工智能，这(zhe)最初(chu)就是从机(ji)器翻译技术里面过来的。因(yin)为它可以生成各(ge)种各(ge)样你想要的答案，所以感觉它的通用性会比过去强很多。但是真(zhen)正(zheng)你要在不同领域去应用的话，还是需(xu)要各(ge)个(ge)不同的人(ren)工智能技术。

张维(wei)为：这(zhe)次(ci)春(chun)节(jie)年初(chu)二，大家(men)去法国开会，一到那儿，就发觉大家都在谈DeepSeek，基本上(shang)都是西方的学者、官员(yuan)，大家(men)一起吃饭，大家都聊这(zhe)个(ge)，这(zhe)给他们(men)带来了巨(ju)大的震撼。一方面他们(men)觉得中国今天绝对是跟(gen)美国平起平坐的一个(ge)超级大国。

另外，他们(men)说要搞(gao)欧洲的人(ren)工智能通用大模型，一个(ge)重(zhong)要原因(yin)是要体现(xian)欧洲的价值观。你发现(xian)没有，大模型处理是有价值观的。在语言当中你输(shu)进去不同的语料，出来的东西也是不一样的，对不同问题的回答和描述也是不同的。

我想起德国哲学家维(wei)特根斯坦(tan)说过的名言：你讲这(zhe)个(ge)语言，这(zhe)个(ge)语言也讲你。（You speak a language，language also speaks about you.）你的整个(ge)学问背景都在你使用的语言里。你看大家(men)前段时间(jian)去蒙(meng)古国访问，蒙(meng)古国盛产绵(mian)羊(yang)，相关的英文表述复杂得不得了：羊(yang)(sheep)，羊(yang)肉(mutton) ，羊(yang)毛(wool)，羊(yang)绒(cashmere)。

主持人(ren)：不认(ren)识这(zhe)些单词的话，根本不知道它们(men)其实都有关联。

张维(wei)为：中文一下就抓住，所以中文是寻求共性的语言。

汪涛：中文都带“羊(yang)”字。

主持人(ren)：就像张老师一直举例说，只要是三点水，在中文里头，它多少都是跟(gen)水有关系(xi)，如江、河(he)、湖(hu)、海(hai)。

张维(wei)为：这(zhe)是伟大的智慧，大家(men)的祖先早就知道，想要治理这(zhe)么大的国家，就一定要强调共性，一定要强调不同事物之间(jian)的共同之处，这(zhe)对治国理政(zheng)都有启发。

主持人(ren)：对，刚才张老师提到说DeepSeek引起了欧洲人(ren)的思考，而且他们(men)还担心在价值观影响方面落后于(yu)其他国家。所以，我想问问汪老师，当大家(men)讨论DeepSeek也好，包括今年火爆出圈的宇树科技，以及其他杭州“六小龙”成员(yuan)等等，就他们(men)给整个(ge)社会带来的震动，到底包括哪些内容？

汪涛：我觉得它最大的影响，就是彻底颠覆了大家(men)过去的认(ren)知，即中国只能作为追随者。事实上(shang)DeepSeek走出的这(zhe)一步说明，中国人(ren)是可以去引领一些技术发展方向的。这(zhe)给大家的震撼非常强，尤其它在市(shi)场上(shang)、应用上(shang)带来的很多方面的影响也非常大。

杭州“六小龙”

张维(wei)为：因(yin)为这(zhe)次(ci)在欧洲我也有这(zhe)个(ge)感觉，为什么他们(men)这(zhe)么被(bei)震撼？因(yin)为他们(men)一下就看到，美国对中国的科技封锁是没有用的。这(zhe)开始变成一种共识：中国在遭到如此封锁的情况下，还可以做到这(zhe)么好，做到世界一流。

这(zhe)次(ci)德意志银行关于(yu)中国资产的报告中，核心概念开始改变，过去它们(men)认(ren)为中国资产只是tradable，也就是可以买来作为交易的，短线的，或者小打小闹玩玩的；现(xian)在叫investable，就是可以投资的。这(zhe)是认(ren)知方面的巨(ju)大变化。所以说一个(ge)超级产品出现(xian)之后，它带来的是整个(ge)外部世界对中国看法的改变。

我承认(ren)一些报告里边(bian)可能包含不良企(qi)图，甚至阴谋诡计，甚至不排斥(chi)服务于(yu)华尔(er)街金融战的需(xu)要等等，但至少到现(xian)在为止，大家(men)看到DeepSeek对西方带来震撼是非常深刻的。网(wang)上(shang)有人(ren)说，DeepSeek帮中国打赢了科技战，也在间(jian)接地帮中国打赢金融战。

汪涛：我以前有个(ge)观点叫“遏制(zhi)背反(fan)定律”，就是遏制(zhi)有多大，它的促进力就有多大。DeepSeek就是一个(ge)非常典型的例子，因(yin)为它如果不是在这(zhe)种限制(zhi)、封锁越来越严(yan)厉的情况下，它不会想到去大幅度地提升效率。因(yin)为没有芯片可用了，它只好去把效率极(ji)大地提升，无止境地去挖掘(jue)，挖掘(jue)到最后，我用现(xian)有的这(zhe)些芯片就可以来玩大模型，这(zhe)一定程度上(shang)也是被(bei)美国逼出来的一个(ge)创新。

那么DeepSeek一走通后，不仅让美国原来的封锁垮掉，而且让英伟达建立的整个(ge)体系(xi)，或者说它以前的商业逻辑，一下都垮掉了。

主持人(ren)：所以汪老师，您怎么来观察(cha)目前中国的科创生态？

汪涛：中国的整个(ge)产业链已经非常完善了，这(zhe)一点就体现(xian)在刚才谈到的：大家(men)一条路(lu)走不通，可以走另外一条路(lu)。过去无论是在芯片还是在人(ren)工智能上(shang)，要想提升运算速度，有很多条路(lu)径可以走，提升集成度也有很多条路(lu)径可以走，所以你用28纳米也可以做出跟(gen)14纳米集成度一样的芯片。只不过可能在别的方面损失一点，但实际(ji)上(shang)它是可以实现(xian)的。

主持人(ren)：效果一样就可以。

汪涛：那么像这(zhe)一次(ci)DeepSeek为什么能够实现(xian)这(zhe)么大的突破？事实上(shang)如此大程度的效率提升，它的潜力其实一直都存在，只不过过去都是沿着美国的路(lu)径设计的。因(yin)为整个(ge)技术发展的路(lu)径都是被(bei)这(zhe)些西方核心芯片企业所引导的，比如在很多人(ren)的概念中，电(dian)脑久了以后运算速度会下降，但如果大家(men)知道怎么配置，其实可以保持运算速度做到几乎不变。

所以，过去由(you)美国的技术企业主导着技术发展的方向。但是现(xian)在美国制(zhi)裁之后，逼着中国去找别的路(lu)径，最后大家(men)发现(xian)其实能走的路(lu)很多，大家(men)可以通过很多方法去提升效率。

中美科技企业的AI竞赛(sai)

张维(wei)为：对大家(men)的启发就是，大家(men)一定要有自己的话语，尤其不要总是跟(gen)随着美国的话语、华尔(er)街的话语、资本力量的话语。为什么大家(men)当时对美国的经济判断相对比较准确，对川普当选的预(yu)测也比较准确，一个(ge)重(zhong)要原因(yin)是因(yin)为大家(men)解构了它的话语，解构之后你就非常自信。美国经济情况不好，实际(ji)上(shang)科技情况也不是很好，所以这(zhe)对大家(men)很多媒体人(ren)、学者、一些科技工编辑也是个(ge)教训，大家(men)分析任何事情，要有独立自主的思考，现(xian)在到这(zhe)个(ge)阶段了。

主持人(ren)：我觉得张老师这(zhe)点说得特别对，就是要有自己的独立思考。其实在科技这(zhe)一块，就像汪老师说的，因(yin)为以往所有的语言架构、语言体系(xi)都被(bei)设置好了，所以大家就是这(zhe)么干的，大部分不会去思考。但是被(bei)逼地去思考了以后，发现(xian)全然不是如此。

汪涛：对，是这(zhe)样的。

主持人(ren)：我再问一下张老师，您有没有观察(cha)过DeepSeek这(zhe)个(ge)应用？您用下来感觉如何？

张维(wei)为：我真(zhen)的问了一个(ge)问题，这(zhe)个(ge)问题知道的人(ren)不多，它回答得还蛮有水平的。因(yin)为我研究(jiu)“文明型国家”，我问它“文明型国家”跟(gen)“文明国家”有什么区别？它给了我一个(ge)很像样的回答，这(zhe)是我没想到的，对这(zhe)么一个(ge)比较小众(zhong)的问题，一个(ge)定义方面的问题，它还拿出一个(ge)几百字的报告。

主持人(ren)：现(xian)在除(chu)了个(ge)人(ren)，有一些政(zheng)府机(ji)构也在用 DeepSeek。您觉得在哪些内容领域可以使用？

汪涛：首先大家(men)排除(chu)那些可靠(kao)性要求特别高的内容。比如说工业控制(zhi)，不能轻易地使用，因(yin)为你出一次(ci)错，那造(zao)成的损失会很惨重(zhong)。其次(ci)。军事情报不要去轻易用。因(yin)为大模型的这(zhe)种“幻觉”，它在理论上(shang)是不可能消除(chu)的。所以它可以做参考，在其他一些对可靠(kao)性、精(jing)确度要求不那么高的领域，它确实应用可以更广。尤其是像文创，本身它就是描述一种感觉。

主持人(ren)：要天马行空(kong)，或者说多一点创意和创想。

汪涛：像是写报告、做PPT的话，它也可以让内容更加优化。甚至现(xian)在DeepSeek已经可以产出一些初(chu)步的、统(tong)计性的、宏观的地区经济分析，然后在他产出的基本报告上(shang)去加工，就能省很多事。

【观众(zhong)提问】

观众(zhong)：今天想请教几位老师的一个(ge)问题是：DeepSeek 的开源(yuan)策略会如何推动中国在AI领域形成非对称技术竞争能力，突破美国的技术封锁？中国在今后是否会加大对开源(yuan)社区的政(zheng)策支(zhi)持？

主持人(ren)：开源(yuan)是一个(ge)关键(jian)词，汪涛老师您觉得大家(men)怎么来理解开源(yuan)的作用？

汪涛：其实不是说开源(yuan)就一定会达到某种结果。比如在过去，个(ge)人(ren)计算机(ji)的时代下，MicroSoft的操作系(xi)统(tong)可以说处于(yu)统(tong)治地位，同时期还有Linux的操作系(xi)统(tong)，也是开源(yuan)的，但是Linux的开源(yuan)一直没能撼动MicroSoft企业在个(ge)人(ren)计算机(ji)操作系(xi)统(tong)的地位。

在大模型时代，事实上(shang)在DeepSeek之前也有开源(yuan)的，像麦(mai)塔也开发过一个(ge)大模型就是开源(yuan)的。但为什么DeepSeek的开源(yuan)，实现(xian)了这(zhe)么大的冲(chong)击？原因(yin)就是效率的提升，它不是说百分之几十的提升，甚至不是一倍的提升，而是数量级的提升。这(zhe)带来的影响本身就非常震撼。所以不是说App开源(yuan)了，它的经济性就一定好。

DeepSeek同其他模型性能对比

主持人(ren)：如果免费但是很不好用，那也没有人(ren)来。

汪涛：或者是说效率的提升没有那么高，它的开源(yuan)意义就没有那么大，因(yin)为价值没有那么大。但是DeepSeek对于(yu)效率的数量级提升，除(chu)了它自己的使用成本降低以外，底层的硬件成本同样是数量级的降低，这(zhe)个(ge)价值就很大了。

除(chu)此之外，DeepSeek还有一个(ge)对中国很大的影响。大家(men)都知道，人(ren)工智能的大模型目前还处于(yu)初(chu)级阶段，标准还未完全形成。过去为什么Linux很难撼动MicroSoft在操作系(xi)统(tong)的地位？因(yin)为标准已经被(bei)MicroSoft建立起来了，整个(ge)生态已经建立起来了。

DeepSeek在美国的人(ren)工智能生态环境还没完全建立起来的时候，突然之间(jian)得到了广泛应用，紧接着带来的影响，就是建立一个(ge)以中国人(ren)工智能大模型为标准的生态，这(zhe)个(ge)影响是非常大的。

主持人(ren)：张老师说中国话语有一个(ge)非常重(zhong)要的构成，就是标准的制(zhi)定。如果DeepSeek在未来能够引领相关标准的制(zhi)定，那这(zhe)将是它最大的贡献。

张维(wei)为：有些东西只要眼光稍微长远一点，就能认(ren)识到形成生态最终(zhong)可以带来的价值。而且据我知道，即使在开源(yuan)里边(bian)，也并不都是一样的，它里边(bian)各(ge)种各(ge)样的源(yuan)代码，有的属于(yu)训练的源(yuan)代码，有的属于(yu)推理的源(yuan)代码，并非都是开放(fang)的，所以还有很多细分的技术领域。

主持人(ren)：说到生态，我倒是想问汪老师一个(ge)问题，您觉得像DeepSeek这(zhe)些企业的出现(xian)，它受益于(yu)大家(men)在科创生态上(shang)哪些成就？接下来还会对整个(ge)科创生态带来什么影响？

汪涛：DeepSeek的开发主要是人(ren)工智能App相关的开发，如果中国的人(ren)才积累没有达到现(xian)在非常雄厚的基础，那要开发是很难的。那么DeepSeek起来以后，它会连带影响其他生态的建立，比如人(ren)工智能的芯片。过去人(ren)们(men)的概念中只有用英伟达的芯片，现(xian)在DeepSeek将效率提升后，大家(men)可能没有那么依赖高性能的芯片，也可以带动中国人(ren)工智能芯片的爆炸性增(zeng)长。对于(yu)下游(you)环节(jie)的各(ge)种应用场景，这(zhe)种生态的建立也是有很大作用的。

刚才张老师谈到说，欧洲也想建立基于(yu)它自身价值观的“DeepSeek”，所以这(zhe)个(ge)影响是非常快的。

主持人(ren)：差不多去年的这(zhe)个(ge)时候，大家(men)讨论的是ChatGPT 4。当时大家(men)还讨论它的文生视频。其实文生视频，张老师当时一直说这(zhe)是一个(ge)概念，你可能做个(ge)短视频可以，但做长的就不行。因(yin)为大家(men)也在节(jie)目里说过，这(zhe)是非常耗电(dian)的，电(dian)力支(zhi)撑很容易供(gong)应不上(shang)。但是刚才汪老师说因(yin)为DeepSeek它提供(gong)了效率，它不是“唯算力论”，而是数量级地降低了对算力的依赖，所以这(zhe)也就意味着它将会数量级地降低对能源(yuan)的依赖。

汪涛：这(zhe)是很自然的。

主持人(ren)：这(zhe)是非常了不起的。所以当大家(men)做大型运算的时候，它对于(yu)周围的资源(yuan)消耗会变得很划算。

汪涛：这(zhe)个(ge)问题的出现(xian)是因(yin)为摩尔(er)定律逐渐达到了极(ji)限。原来芯片不断在发展，大家(men)对算力的需(xu)求也在不断增(zeng)长，过去没有这(zhe)个(ge)问题，现(xian)在为什么出现(xian)了这(zhe)个(ge)问题？在摩尔(er)定律还有效的时代，我提升几倍、十几倍的算力，它是可以保持功耗不变的。即使随着集成度的提升，在实现(xian)更高算力的情况下，它的功耗也一直维(wei)持在一个(ge)水平上(shang)。但是现(xian)在因(yin)为摩尔(er)定律越来越接近极(ji)限，这(zhe)就意味着伴随运算能力提升，功耗很难再降低了。

因(yin)此，现(xian)在大家(men)可以看到很多给最初(chu)计算机(ji)降温的技术，甚至水冷技术、液冷的技术都用上(shang)了。这(zhe)就意味着，算力的增(zeng)长必(bi)然带来功耗的同步增(zeng)长，或者说虽(sui)然没有完全同步，但是影响会很大。

DeepSeek的出现(xian)给了大家(men)另外一个(ge)方向：大家(men)不用单纯地去追求算力，而应该降低对算力的需(xu)求，这(zhe)也是一个(ge)节(jie)省能源(yuan)的方法。不仅仅DeepSeek可以这(zhe)么干，大模型、人(ren)工智能也可以这(zhe)么干，因(yin)为我研究(jiu)生时候的课题，是在个(ge)人(ren)计算机(ji)上(shang)面实现(xian)过去巨(ju)型机(ji)的卫星云图处理。当时大家(men)就采用了各(ge)种各(ge)样降低算力需(xu)求的方法，过去大家(men)也听到说中国研究(jiu)原子弹(dan)，那时候没有高性能计算机(ji)，是由(you)算盘打出来的。

如果算法完全一样，那用算盘也能把原子弹(dan)“打”出来，未来事实上(shang)也是这(zhe)样的。芯片提升是一个(ge)路(lu)径，但大家(men)现(xian)在提供(gong)了另外一条路(lu)径，只是说在过去摩尔(er)定律成立的时代，大家(men)把这(zhe)些方法都忘了。因(yin)为既然芯片算力可以那么快增(zeng)长，为什么要去省算力呢？

主持人(ren)：最后发现(xian)算力不仅本身有瓶颈(jing)，而且还要制(zhi)约(yue)你。

汪涛：所以未来这(zhe)可能在很多领域都会出现(xian)，甚至在一些对算力需(xu)求很大的领域。那么怎么降低算力的一些技术发展？这(zhe)就成为了一个(ge)方向。

主持人(ren)：我觉得汪老师的观点给了大家(men)一个(ge)启发，就是您说的从节(jie)约(yue)能耗、从对自然环境友好、从“双碳”目标的实现(xian)来说，咱也得换条路(lu)走，因(yin)为那种高能耗的路(lu)是不能走下去的。好，大家(men)再来看这(zhe)边(bian)还有哪位朋友要参与讨论，欢迎提问。

观众(zhong)：两位老师好。主持人(ren)好，我是陈希赟，来自上(shang)海(hai)，我是一名硕士二年级的在校学生。考虑到最近DeepSeek 和宇树科技都特别火，我想了解一下国家在相关方面的一些前沿布局是什么？以及我作为一个(ge)即将毕业参加秋招的学生，我也想了解一下，我可以重(zhong)点关注什么行业和领域？

汪涛：应该说DeepSeek这(zhe)种人(ren)工智能大模型对于(yu)文创领域是非常好的一个(ge)工具，也是很重(zhong)要的一个(ge)应用领域。需(xu)要认(ren)识到，它并不能完全替代人(ren)力，所以不要指望人(ren)工智能这(zhe)样的工具可以完全做到跟(gen)人(ren)一样，甚至完全替代掉人(ren)来做事。但是它会提供(gong)一些很好的基础工作，你在这(zhe)个(ge)上(shang)面去进行一些加工，会有很好的应用。

涉及到就业的问题就相对比较复杂一些。但不管怎么样，最重(zhong)要的是你的能力，比如说我在大学的专业是电(dian)子测量，但是后来大家(men)一个(ge)班的很少有人(ren)专门做这(zhe)个(ge)工作，但是你掌握(wo)的工具，它的应用面是很广的，就你可以去做很多别的工作，根据市(shi)场的变化，可以很容易去适应。

主持人(ren)：我前两天跟(gen)一个(ge)大学教授有个(ge)对话，他都是要求他的学生交读书笔记的，但是最近他发现(xian)，这(zhe)些学生交上(shang)来的读书笔记有很浓的DeepSeek痕迹，所以他说他打算改一个(ge)方式，跟(gen)自己的硕士博士生面对面地让他们(men)谈谈读某本书的感受。所以我就在想，可能DeepSeek可以帮助(zhu)大家初(chu)步地做些什么，但是最后的成果你应该远远超出它，这(zhe)样才是一个(ge)好的作品。

张维(wei)为：反(fan)正(zheng)我觉得DeepSeek也好，或者人(ren)工智能发展，机(ji)器人(ren)发展也好，某种意义上(shang)是革(ge)命性的，许多现(xian)有的工作可能会因(yin)此消失，但同时也会相应创造(zao)一些新的工作机(ji)遇，天无绝人(ren)之路(lu)。

2025年2月10日，杭州云深处科技的工作人(ren)员(yuan)在动态展示(shi)“绝影”系(xi)列机(ji)器人(ren)。新华社

主持人(ren)：刚才大家(men)也聊到人(ren)工智能可能在未来生活当中的一些应用。但回过头来讲，大家(men)今天的话题从DeepSeek火出圈开始，到汪老师说明为什么它可以不要“唯算力论”来提高自己的效率。我想，包括DeepSeek在内的很多科技企业的成功，一方面在于(yu)大家(men)这(zhe)些年，其实在科创生态上(shang)始终(zhong)努力地布局，另一方面在于(yu)许许多多该领域从业者的心血努力。

另外，大家(men)也可以看到像这(zhe)样的一些企业的崛起和发展，毫无疑问还会继续重(zhong)塑大家(men)中国的整个(ge)科创生态，带来许许多多新的局面，也让大家(men)一起期待。谢谢演播室的两位嘉宾，谢谢大家一起来参与讨论，再见。

必一运动·(B-sports)官方网站