必一运动·(B-sports)官方网站

业界动态
Manus实测,它和DeepSeek有什么不同?,任务,数据,Agent
2025-03-22 02:27:14
Manus实测,它和DeepSeek有什么不同?,任务,数据,Agent

自3月(yue)5日开启内(nei)测以来,人工智能应用 Manus 出圈走红。3月(yue)12日晚间,Manus在自有 X 账号上表示,7天以来Manus使用申请等候名(ming)单增加到两百万人次(ci)。

澎湃资讯(wen)·对齐Lab在获得内(nei)测码后(hou),使用Manus进行(xing)了四种任务(wu)测试。总体而言(yan),Manus作为“开箱即用”的(de)创新智能体应用有不(bu)少优点(dian):交(jiao)互界面友好、拆解需求能力强、多AI协(xie)作有条不(bu)紊、设计(ji)功(gong)底强,但(dan)在信(xin)息整合能力、细节优化、交(jiao)付完成度上还有待提高。

Manus和AI Agent究竟是什么?

有别于(yu)之前爆火的(de)DeepSeek,Manus并不(bu)是一个新的(de)人工智能大模型,而是一款让AI大模型协(xie)作的(de)人工智能体(AI Agent)。也就是说,Manus不(bu)创造大模型,而是使用市面上已经存在的(de)大模型打(da)造了一个为人服务(wu)的(de)“助理”。理论上,AI Agent能够(gou)以类似人类的(de)方式工作,通过大模型来“理解”用户需求,“规划”达成目标的(de)路(lu)径(jing),调用包括大模型在内(nei)的(de)各种“工具”来实行(xing)任务(wu)。

Manus所处的(de)AI Agent赛道刚刚兴起,虽然不(bu)乏竞品,却还没有产生现象级的(de)产品。

Smiliarweb数据显(xian)示,在2月(yue)全球增速最高的(de)10个AI产品中,只有Dify一家与Agent概念有关(Manus目前处于(yu)逐步放开的(de)测试阶段)。但(dan)Dify更准确(que)的(de)定位是Agent开发平台,并不(bu)是像Manus这样的(de)AI Agent应用。AI产品中流量(liang)最高的(de),还是集中在AI聊天机器人这个品类。但(dan)从(cong)全球AI APP的(de)访问量(liang)总榜来看(kan),除了DeepSeek这样的(de)新晋爆款,其他高访问量(liang)AI产品大多是上榜多时且存在增长困难的(de)问题。

平均一个任务(wu)用时40分钟,Manus擅长做(zuo)什么?

从(cong)Manus官方和Discord社区发布的(de)测试案例来看(kan),网页、报告、PPT是用户希(xi)望Manus生成的(de)主要内(nei)容产品,符合大部分打(da)工人、学生群体的(de)需求。

根据不(bu)同的(de)任务(wu)难度,大家分别测试了Manus在svg图像生成、数据可视化、游(you)戏设计(ji)、数据挖掘、网页交(jiao)互设计(ji)等方面的(de)能力。

大家使用理解能力、准确(que)性、设计(ji)能力和代码能力这四个维度,对Manus测试过的(de)四个任务(wu)进行(xing)了评估。Manus最擅长的(de)是理解需求后(hou)拆解任务(wu),在不(bu)同任务(wu)难度下均能达到7分以上的(de)标准(满分10分)。此外,Manus的(de)网页设计(ji)能力和审美也值得称赞。在“小王子智能体世界”项目中,Manus在没有提示词的(de)引导下,通过理解故事和设定自主完成了风格化的(de)设计(ji)。

Manus 的(de)工作原理是使用多个 AI 模型协(xie)同决策,这些(xie) AI 模型会自动拆解任务(wu)目标、生成实行(xing)计(ji)划,调用工具接口完成文件操作、数据处理等任务(wu),并实时根据反馈动态调整策略,实现复杂任务(wu)的(de)自主实行(xing),从(cong)而实现一句提示词就将任务(wu)实行(xing)到底的(de)效果。Manus 的(de)所有工作流程均在云端虚拟机上完成。

提示词和参考资料越(yue)详细,项目的(de)完成效果可能越(yue)好。“上海赏樱地图网页”的(de)项目里,大家将上海市各区的(de)赏樱地点(dian)、花期等信(xin)息整理成表格喂(wei)给Manus,生成内(nei)容的(de)质量(liang)明显(xian)提升,任务(wu)用时也是4个任务(wu)中最短的(de)。可见,信(xin)息检索和数据爬取等内(nei)容整合工作,是比较费时费力的(de)。

为了更好地说明Manus的(de)工作原理,大家在上海赏樱地图的(de)任务(wu)回放基(ji)础上,制(zhi)作了一个说明Manus工作流程的(de)视频(pin)。

AI永(yong)远“使命必达”,幻(huan)觉(jue)问题更加凸显(xian)

在 Manus 实行(xing)任务(wu)的(de)各个环节中,大家最关心的(de)是资料和数据收集的(de)准确(que)性及整合能力。在 “模拟投资网页游(you)戏” 中,大家要求 Manus 生成不(bu)同历史阶段的(de)投资标的(de)数据。以梳理 2005 年每月(yue)黄金价(jia)格为例,Manus 的(de)梳理方法是依据资讯(wen)报道筛选出核(he)心事件,比如 “2005 年,黄金价(jia)格突破 450 美金 / 盎司”,然后(hou)结合相(xiang)关历史数据和统计(ji)方法,通过特定算法生成模拟趋势的(de)数据。

通过核(he)查2005年的(de)黄金价(jia)格后(hou)可知,2005年全球黄金市场的(de)月(yue)均价(jia)格确(que)实一度超过了450 美金 / 盎司,但(dan)Manus提供的(de)每月(yue)黄金数据与真(zhen)实数据均有不(bu)同程度的(de)偏(pian)差。也就是说,这些(xie)数据是 AI 在满足当年突破 450 美金这一点(dian)的(de)基(ji)础上“填(tian)空(kong)”出来的(de)。然而,这个生造数据的(de)过程, AI 并不(bu)会告诉你。这也就是各家大模型都在努力解决的(de) AI 幻(huan)觉(jue)问题,Manus 调用的(de)是现成的(de)大模型,也自然存在着这样的(de)幻(huan)觉(jue)问题。

图中显(xian)示,Manus基(ji)于(yu)历史数据模拟了数据的(de)趋势。图片来源:澎湃资讯(wen)·对齐Lab Manus实测

如果不(bu)去细抠任务(wu)中的(de)各个环节,不(bu)论是网页、PPT还是报告,Manus的(de)工作成果可以用可圈可点(dian)来形(xing)容。加上Manus允许用户实时观看(kan)自己的(de)操作过程,给人一种信(xin)赖感(gan)。这种产品设计(ji)上的(de)技(ji)巧,规避了AI的(de)一些(xie)能力不(bu)足的(de)问题。

这是市面上一些(xie)大模型和AI应用的(de)通病,通过营(ying)造出一种什么问题都能解决的(de)氛围,来满足市场和用户的(de)期待。尤其是在需求沟通、任务(wu)实行(xing)和总结汇报上,AI给出的(de)范式总是有模有样。加上擅长“高情商的(de)表达”,给用户提供了很多情绪价(jia)值。但(dan)仔细去核(he)验的(de)话,幻(huan)觉(jue)、误用、不(bu)准确(que)等问题其实并不(bu)少见。毕竟在激烈的(de)竞争中,AI是不(bu)会轻易和你说它(ta)做(zuo)不(bu)到的(de)。

从(cong)实测体验来说,以Manus为代表的(de)AI Agent确(que)实在把完成一件事的(de)门槛(kan)越(yue)拉越(yue)低,但(dan)也把做(zuo)好一件事的(de)标准越(yue)拉越(yue)高。越(yue)是对创意有着高要求,对内(nei)容准确(que)性、真(zhen)实性近乎严苛的(de)领域,流程化的(de)工具就只能陪(pei)你半程。更加精准地理解世界、理解人类,将成为决定工作品质与成果的(de)关键,让个人在未来的(de)竞争格局中占据一席(xi)之地。

作为一个串(chuan)联AI大模型的(de)工具,Manus也有很多当下大模型的(de)通病。但(dan)在涉及隐私等重(zhong)要的(de)细节问题上,Manus的(de)很多处理方式还是值得借鉴的(de)。比如,Manus不(bu)会使用用户提供的(de)API,哪怕你强制(zhi)要求它(ta)使用;在涉及儿童(tong)相(xiang)关的(de)内(nei)容时,即便没有提示词的(de)引导,Manus也会加上一个工作步骤,去验证(zheng)内(nei)容和设计(ji)是不(bu)是适合儿童(tong)观看(kan);Manus会让用户选择(ze)是否(fou)将项目部署到公网。这些(xie)机制(zhi)和设定,都能体现一款产品对人的(de)敬重(zhong)和保护。

在每一次(ci)等待 Manus 创作的(de)过程中,虽然实际时长远远短于(yu)人类自己创作的(de)时长,但(dan)期盼的(de)心情总酿成一种度秒如年的(de)感(gan)受。

这种感(gan)受,就像在电脑刚刚普(pu)及的(de)年代,你守在一台老式电脑前,眼(yan)巴(ba)巴(ba)地看(kan)着一张图像逐行(xing)加载(zai)。每一行(xing)像素的(de)显(xian)现,都勾得人心痒痒。那一刻,就仿佛望向互联网时代的(de)大门。而现如今, AI 虽有各种不(bu)完美,但(dan)也同样给人一种希(xi)望,新技(ji)术(shu)引领的(de)新时代又再次(ci)开启了。

澎湃资讯(wen)·对齐Lab Manus实测项目回看(kan):

1、上海赏樱数据可视化项目设计(ji),https://manus.im/share/Pihrl1JUmNZ0moPhoWfyh6?replay=1

2、AI企业产品的(de)交(jiao)互式可视化网页设计(ji),https://manus.im/share/MoZ9vlZnUVWnuG49BNFqjG?replay=1

3、小王子世界观AI代理网页游(you)戏设计(ji),https://manus.im/share/5ZuJ0R75Clzr7X6iaNLFNb?replay=1

4、什么是AI大模型的(de)通俗(su)讲解SVG卡片,https://manus.im/share/uytfTaasg9O9JpPnJU40jx?replay=1

最新资讯
  • 陆河县东坑镇
  • 永嘉县
  • 嵊州市
  • 龙泉市西街街
  • 鄱阳县油墩街镇
  • 望城县雨敞坪镇
  • 雨湖区雨湖路街
  • 电白县旦场镇
  • 岫岩满族自治县洋河镇
  • 双塔区站南街
  • 宣汉县普光镇
  • 凌河区龙江街
  • 陆川县清湖镇
  • 龙川县四都镇
  • 洱源县凤羽镇
  • 武强县武强镇
  • 鄞州区鄞江镇
  • 长岭县
  • 英德市白沙镇
  • 龙港区龙湾街
  • 河南中青综合资讯
  • 游戏百科综合资讯
  • 快云游综合资讯
  • 快云综合资讯
  • 久诚汽车资讯
  • 癫痫百科
  • 体育百科资讯
  • App百科资讯
  • sitemapsitemap1sitemap2sitemap3sitemap4sitemap5sitemap6sitemap7
    XML 地图 | Sitemap 地图