必一运动·(B-sports)官方网站

业界动态
编程能力大大提升,DeepSeek发布更新版V3模型,初创企业,网站,Sonnet
2025-03-28 00:19:24
编程能力大大提升,DeepSeek发布更新版V3模型,初创企业,网站,Sonnet

参考(kao)消息网(wang)3月25日报道 据(ju)新(xin)加坡《联合早报》网(wang)站3月25日报道,中国初创公(gong)司深度求索(DeepSeek)发布了V3模型更新(xin),加强了模型的编程能力,显示这家公(gong)司希翼在人(ren)工智(zhi)能(AI)领(ling)域的激烈竞争中保持领(ling)先优势。

综合彭博社和科技博客(ke)网(wang)站“风险投资节奏”网(wang)站的报道,AI开源模型DeepSeek-V3的更新(xin)版本V3-0324于24日深夜在AI开源平台低调上线。

深度求索没有为此次(ci)版本更新(xin)发布任何公(gong)告,延续(xu)了该公(gong)司的低调风格。

初代DeepSeek-V3发布于2024年12月26日,这款模型自上线后便以高性价(jia)比火速“出圈”。根据(ju)官方技术论文披露,DeepSeek-V3模型的总训练(lian)成本约(yue)为557.6万美金,而OpenAI的GPT-4o等模型的训练(lian)成本约(yue)为1亿美金。

更新(xin)后的DeepSeek-V3模型大小为641GB,模型参数为6850亿。与V3相同(tong),V3-0324模型采用(yong)混(hun)合专家(MoE)架(jia)构,并开源允许自由商用(yong)。

此次(ci)更新(xin)的最大亮点是编程能力的优化。有网(wang)民使(shi)用(yong)V3-0324模型编写800多行(xing)代码,全程没有出现任何故障。

有AI研究者在社交平台X上发布评测指出,V3-0324模型在所有基准(zhun)测试中都取(qu)得巨大进步,可能已超越美国Anthropic公(gong)司的Claude 3.5 Sonnet,成为最强大的非推理模型。Claude 3.5 Sonnet是当前最受认可的商业AI模型之(zhi)一。

让更多科技博主(zhu)关注的是,V3-0324模型可直(zhi)接在消费级硬件(jian)上运行(xing),如搭载苹果M3 Ultra芯片的Mac Studio上,而不需要(yao)动辄(zhe)千瓦级别功耗(hao)的数据(ju)中心。

M3 Ultra芯片在进行(xing)推理时(shi)的功耗(hao)不到200瓦,意味着V3-0324模型的部署和运营门槛(kan)已大大降低。

“风险投资节奏”网(wang)站报道认为,DeepSeek-V3-0324模型的发布,可能预(yu)示着DeepSeek-R2即将到来。DeepSeek一贯(guan)先推出基础模型,再(zai)推出专门优化推理能力的版本,如V3后不久发布的R1。

路透社今年2月引述消息称(cheng),DeepSeek正加快推出R1模型的后续(xu)产品R2。据(ju)悉,DeepSeek-R2原(yuan)计划在5月初发布,但公(gong)司现在希翼尽早推出。

“风险投资节奏”网(wang)站认为,DeepSeek-R2的发布,可能成为直(zhi)接挑战GPT-5的竞品。

用(yong)户在DeepSeek手机客(ke)户端上提问(新(xin)华社发)

最新资讯
  • 珠山区新村街
  • 云溪区路口镇
  • 黄埔区穗东街
  • 于洪区翟家街
  • 盖州市西海街
  • 江宁区汤山街
  • 凤凰县茶田镇
  • 襄城区庞公街
  • 阳山县杨梅镇
  • 余杭区余杭镇
  • 勐腊县勐满农场
  • 团风县回龙山镇
  • 高平市
  • 临泽县沙河镇
  • 泉山区湖滨街
  • 博兴县兴福镇
  • 安远县车头镇
  • 永胜县仁和镇
  • 吉安县天河镇
  • 萝岗区东区街
  • 河南中青综合资讯
  • 游戏百科综合资讯
  • 快云游综合资讯
  • 快云综合资讯
  • 久诚汽车资讯
  • 癫痫百科
  • 体育百科资讯
  • App百科资讯
  • sitemapsitemap1sitemap2sitemap3sitemap4sitemap5sitemap6sitemap7
    XML 地图 | Sitemap 地图