必一运动·(B-sports)官方网站

业界动态
用户破2200万、营收过亿元 可灵2.0再升级:快手新商业叙事“加载中”?,视频,模型,画面
2025-04-17 03:27:39
用户破2200万、营收过亿元 可灵2.0再升级:快手新商业叙事“加载中”?,视频,模型,画面

每经(jing)记者 王(wang)郁彪 每经(jing)编辑 文(wen)多

“我见过你们不会相信的东西:战舰群在猎户星座上沿燃烧(shao),C射线在唐豪瑟之门处的黑(hei)暗中闪耀。这些(xie)时刻都将随着时间(jian)消逝,就像(xiang)雨中的眼泪。”

这是著名科幻影片《银翼杀手》的台词(ci),被奉为(wei)影史经(jing)典时刻。遗憾的是,影片并未呈现这段描述中的画面,但43年后,可灵把(ba)它“拍”出来了。

4月15日(ri),可灵AI正式发布可灵2.0视频生成模型及可图2.0图像(xiang)生成模型。除模型基础质(zhi)量和模型效果提升外,可灵AI的这次更新还聚焦“多模态编辑功能”。

《每日(ri)经(jing)济资讯》记者实测后发现,可灵2.0大师版对提示词(ci)的语义理解更加(jia)准确(que),表述中的细节都会在画面中呈现。而多模态编辑功能,可以实现替换画面主体等元素,还可随意增删元素,无(wu)需(xu)重新描述生成。

除了功能“上新”,快手高级副总裁、社区科学线负责人盖(gai)坤透露,截至目前,可灵全球用户规模突破(po)2200万。快手前不久发布的年度业绩(ji)公告中披(pi)露,自(zi)开(kai)始商业化至今年2月,可灵AI累计收入超(chao)1亿元。

这场关于AI的“豪赌(du)”,不仅在快手发生。技术(shu)更迭、版本推新,谁能抢(qiang)先在AI市场拥(yong)有“话语权”,谁就有机会先拿到下一赛段的门票。

实测可灵2.0:指令遵循更准确(que) 画面细节有提升

所谓的“多模态编辑功能”,简单来说就是输入关键词(ci)时,还可在文(wen)本描述中插入图片、视频,或者引入其他模态的信息——如声音、运动轨迹等。在视频生成后,可以直接二次编辑处理,包括(kuo)替换、增删画面内的元素。

记者实测该功能后发现,视频生成后的画面中,无(wu)论是主体还是涉及的其他元素,都可以通过上传图片、文(wen)字描述等方式直接编辑替换。目前,“多模态编辑功能”只能在可灵1.6模型下生成,2.0大师版还不支撑。

不过,记者注(zhu)意到,在替换相关元素后,也存在部分原细节丢失的情况(kuang)。如,“熊猫弹吉他”视频中,太阳(yang)被替换为(wei)月亮后,原描述中的“戴墨镜”、“吐气”等要求并未表现(如下图)。

此(ci)外,记者也实测了可灵2.0大师版。如基于同(tong)一提示词(ci),无(wu)论是主体的生成、主体间(jian)的关联逻辑、描述中的细节元素捕捉和动态效果呈现,2.0版本对语义的理解较于此(ci)前的1.6模型都更加(jia)准确(que)。

可灵2.0大师版生成的图片

可灵1.6模型生成的图片

同(tong)时,记者也测试了可灵2.0大师版图生视频的功能。记者先是上传一幅油画图片,并描述画面转动态的要求后,其生成后的效果也与1.6模型生成后的效果有着较明显(xian)差距。

首(shou)先是画面风格。1.6模型生成的视频,在原油画风格上未有任何改变,但2.0大师版生产的动态画面,则从原油画风格变成了较写实的风格。其次是动作幅度,2.0大师版生成的画面中,无(wu)论是主体的动作还是其他元素,动作幅度明显(xian)更大。最后是细节呈现。1.6模型生成的画面中,部分元素有扭曲变形现象,2.0大师版则未出现。

可灵2.0大师版生成的图片

可灵1.6模型生成的图片

AIGC是下一代(dai)内容结构(gou)的雏形?

在发布可灵2.0大师版时,盖(gai)坤表示,文(wen)字在表达影像(xiang)信息时不完备。因此(ci),2.0新模型采用了Multi-modal Visual Language(简称MVL)交互(hu)理念。

记者了解到,MVL由TXT(Pure Text,语义骨架)和MMW(Multi-modal-document as a Word,多模态描述子)组成,能从基础方向以及精细控制两个层面,精准实现创意表达。

在这个交互(hu)理念下,用户可以结合图像(xiang)参考、视频片段等多模态信息,将包含身份、外观、风格、场景、动作、表情、运镜等多个维度的复杂创意传达给AI。

在这个升级逻辑下,图片质(zhi)量会对视频的生成效果产生重要影响。因此(ci),快手的图像(xiang)生成大模型“可图”也迎来了2.0升级。快手副总裁、可灵AI负责人张迪先容,当前,图生视频约占(zhan)到可灵AI视频创作量的85%。

4月16日(ri),工业和信息化部信息通信经(jing)济专(zhuan)家委员(yuan)会委员(yuan)盘和林在接受(shou)《每日(ri)经(jing)济资讯》记者微信采访时表示,视频生成赛道的最终受(shou)益者,可能还是内容创作平台。因为(wei),这些(xie)平台具备两样东西:其一是最相关的用户群体,视频生成未来可能更多还是为(wei)短视频自(zi)媒体服务;其二是最大规模的用户受(shou)众,生成式AI带来的内容创作升级,会进一步(bu)影响创编辑和观看者。

记者注(zhu)意到,除了C端(消费(fei)者)订阅用户,可灵AI也面向B端(商家)提供API(应(ying)用程序接口)接入等服务。目前,可灵AI已(yi)与小米、AMAZON云科技、阿里云、“Freepik”、蓝色(se)光标等建立了合作。

快手想借(jie)AI讲出新商业叙事

在商业化上,可灵的确(que)具备一定的优势。可灵于去年6月发布,而自(zi)商业化以来,截至2025年2月,可灵AI的累计营业收入超(chao)1亿元。

所以前不久的财报电话会上,几乎所有分析师提问,都围绕可灵提出,快手联合创始人、董事长兼CEO程一笑表示,预计可灵AI在2025年将实现收入的跨越(yue)式增长。

盘和林告诉记者,可灵的商业化还有开(kai)发空间(jian),1亿元营收对可灵来说,应(ying)该仅仅是开(kai)始。“未来,需(xu)要将AI和内容创作的全链条结合起来,提供更丰富的内容生成功能,AI营收还会有一定的提升。”他如此(ci)表示。

或许,想要增长,投入就不能停。

“快手将在未来3年甚至更长时间(jian)内,进行更大规模的Capex(资本支出)和研发投入,希翼能通过可灵AI的赋能,改造升级现有业务的同(tong)时,创造AI视频内容生产的新赛道,进一步(bu)升级快手作为(wei)短视频生产和消费(fei)社区的领先地位。”程一笑如此(ci)表示。

盘和林认为(wei),可灵对快手整个生态来说很重要。未来,快手平台上的创编辑,需(xu)要借(jie)助可灵这样的AI工具来生成内容,或者至少辅(fu)助内容创作,这会大大提高快手平台上内容输出的质(zhi)量,从而更好地吸(xi)引用户,扩大快手在内容平台领域的影响力。

“与此(ci)同(tong)时,可灵创造出的新的创收点,一定程度上也能够(gou)让(rang)快手的收入更加(jia)多元化,继而增加(jia)想象空间(jian)。无(wu)论是从长期发展(zhan)看,还是从吸(xi)引投资人的角度看,都对快手影响巨大。”盘和林进一步(bu)补充说。

最新资讯
  • 思明区莲前街
  • 泰宁县
  • 古交市河口镇
  • 金东区澧浦镇
  • 耒阳市公平圩镇
  • 东光县灯明寺镇
  • 青云谱区洪都街
  • 鲁山县
  • 姚安县
  • 洪雅县
  • 埇桥区符离镇
  • 孟连傣族拉祜族佤族自治县勐连农场
  • 惠安县东园镇
  • 高明区更合镇
  • 钟山县城厢镇
  • 冀州市魏屯镇
  • 南宫市垂杨镇
  • 邵武市吴家塘镇
  • 绍兴县福全镇
  • 凤冈县永安镇
  • 河南中青综合资讯
  • 游戏百科综合资讯
  • 快云游综合资讯
  • 快云综合资讯
  • 祁东综合资讯
  • 郴州综合资讯
  • 诸城资讯网综合资讯
  • imtoken
  • sitemapsitemap1sitemap2sitemap3sitemap4sitemap5sitemap6sitemap7
    XML 地图 | Sitemap 地图

    loading