Midjourney:先贩卖想象力,再贩卖精度

2024-01-15 17:14吴洋洋
第一财经 2024年1期
关键词:霍尔想象力社区

吴洋洋

Midjourney创始人David Holz。

时隔9个月,Midjourney在2023年圣诞节前推出了第六代文生图模型MidjourneyV6。相较于上一代产品,新版本可以生成分辨率更高的图像,像素达到2048×2048,用户可以在生成的图像中看清人皮肤上的细纹和汗毛,其他动物的毛发、各种场景的光影细节,也都与高清相机拍摄出来的差不多—区别在于Midjourney的图是通过AI模型生成的,用户只需要像聊天一样在对话框中输入几句图像描述,几秒种后,对话另一端的AI就会生成一幅相应的图像。

市面上的文生图模型和产品已有很多,单国内就有百度的文心一格、阿里云的通义万相、腾讯的混元,国外就更多了,Stability、Google旗下的Imagen2、OpenAI旗下的DALL·E3、Adobe旗下的Firefly……但最受设计师欢迎的还是Midjourney。

如果说MidjourneyV6售卖的是工业级的逼真,最初版本的Midjourney售卖的其实是想象力。

在诸多文生图AI软件中,Midjourney最先成为“网红”。初代产品发布不到一个月,用Midjourney生成的图片便登上了一个艺术博览会。2022年8月,在美国科罗拉多州举办的艺术博览会上,39岁的游戏设计师杰森·艾伦用Midjourney生成了一张图,经过Photoshop加工之后,这幅名为《太空歌剧院》的作品战胜人类画手,摘得展会数字艺术类别的冠军。

当时的Midjourney擅长模仿艺术家,它学习过莫奈的《睡莲》、达利的《记忆的永恒》,知道如何扮演不同风格的画家。此外,它还擅长创建漂浮在太空中的古代城市,或是一个虚构的星球景观。

大衛·霍尔兹(DavidHolz)是Midjourney的创始人,他一直试图让Midjourney变成一个更独特的产品。2023年7月,在MidjourneyV5中,会员用户可以使用更新的“weird”模式生成各种搞怪、有趣甚至诡异的表情包。比如你可以让马斯克穿上粉红色的裙子,也可以让雪人变成雪怪。

图像设计工具领域的老牌公司Adobe一直在更新技术,以避免被生成式AI时代抛弃。2023年8月,它在Photoshop中推出了一个叫“生成式填充”(GenerativeFill)的功能,用户可以通过输入文本在图片中添加或删除对象、生成背景,也可以扩展图像。但Midjourney的“weird”模式生成的图片更加有趣和前卫。在其0到3000的参数范围中,用户给出的参数值越大,生成的图片越离谱。

总之,竞品努力追求准确描绘现实世界的时候,Midjourney着重提供的是想象力。这种想象力让Midjourney比对手更早吸引到种子用户—设计师。这部分人向其下游客户售卖的首先同样是想象力。

位于硅谷的Midjourney并不是全球第一个文生图模型公司,若追溯这个细分市场的历史,位于英国伦敦的Stability和位于美国纽约的Runway,都更早开始研究图像生成技术,目前市面上流行的文生图模型算法StableDiffusion就是Stability和Runway共同研发并由Stability开源的。

然而,眼下获得最多用户的产品是Midjourney。仅在Discord社区,Midjourney的社区用户数就达到1480万。

Midjourney开辟了一种新型产品发布方式—寄身社交产品。迄今为止,Midjourney的所有产品都是在一个叫Discord的美国社交平台上发布,而不是苹果或安卓的应用商店。

Discord拥有1.5亿左右的Z世代月活用户。2022年3月,霍尔兹在这个平台上推出了第一版Midjourney。用户只要登录Discord,在Midjourney频道中输入一些文字需求,背后的AI模型就能生成相应的图片。比如,当用户想要生成一个未来主义风格的城市景观,可以在对话框中输入“未来主义城市景观、高科技建筑、夜晚、霓虹灯光”等提示词(prompt),Midjourney很快就可以吐出图片。如果想要修改,可以通过同样的交互方式向模型提出要求,比如将“城市”改为“日落时的城市”,Midjourney会在画面中添加相应的光影效果。

由Midjourney所生成的漂浮在太空中的古代城市。

整个过程中,用户不需要单独打开Midjourney的网页,或者下载一个同名App,他们只要是Discord用户就可以使用这个工具。

寄身Discord使Midjourney获得了一种社交裂变。在这个平台上,用户自发组成各种“提示词小组”,共同讨论如何给提示词调优,以获得期望的图像,他们还可以在Discord的“画廊”中展示自己的作品。依赖Discord平台本身的用户基础,Midjourney拥有了其他文生图AI应用不具备的社群氛围。

进驻Discord一年后,Midjourney的社区用户数就从200万增长到了1480万,成为Discord上最大的AI应用。根据数据统计网站Photutorial的信息,截至2023年11月,Midjourney每天平均生成的图片达到27.5万张,其产量与用户欢迎度都超过了竞争对手Stability和DALL·E3。

文生视频模型开发商Runway和Pika也开始效仿Midjourney,把Discord作为产品首发地。2023年5月,Midjourney曾试图以类似方式进入中国市场,当时它选择的产品发布平台是QQ。

直到2023年12月13日,“寄居”Discord社区两年后,Midjourney才推出独立网站,用户终于可以直接在Midjourney的网站上使用它的文生图功能,而无需注册成为Discord用户。

目前,Midjourney是生成式AI领域唯一没有从外部融资、单纯靠产品营收维持运营的公司。

盯着Midjourney的风险投资机构和大公司都不少,红杉资本、AndreessenHorowitz都曾向Midjourney表明投资意向,然而都被大卫·霍尔兹拒绝了。

“我(从上一次创业中)学到的是,首先要构建一个真正受人们喜欢的好产品。然后,当你完成这个产品时,才可以开始着手构建生态系统。”大卫·霍尔兹在接受技术媒体“极客公园”采访时说。在资本的控制下,很多创业者都被推动着过早地构建了生态系统,霍尔兹认为这会让创业者的注意力分散,不能专注于构建真正每个人可用的东西,而风险投资机构们在炒作时大笔投入,又常常在泡沫破裂后迅速退出。

创办Midjourney之前,大卫·霍尔兹是LeapMotion的联合创始人,后者是一家2010年成立的3D运动检测技术公司,其核心技术是能够精确识别并跟踪手部和指尖的动作,从而用手势控制计算机。当时正值VR投资热期间,LeapMotion从硅谷最知名的风险投资公司之一AndreessenHorowitz等投资机构那里筹集了超过1亿美元的资金。之后,霍尔兹就开始把大量精力花在了构建产品的内容生态上,而不是聚集于让产品交互体验更好。最终,由于设备需要专门的软件和驱动程序才能在Windows系统上运行,LeapMotion并未如霍爾兹所期望的那样,成为触摸屏之后的新一代交互方式。这次创业失败让霍尔兹格外注重产品本身与用户之间的关系,他开始在多个场合强调“先产品,后生态”的重要性。

卖掉LeapMotion后,2021年8月,霍尔兹创办了Midjourney,继续关注视觉,这一次,他选择不再被资本裹挟。

据早期用户Ebersweiler透露,2022年年底时Midjourney的月收入就已超过100万美元,当时,整个公司只雇用了11位员工。Midjourney很早就采用了付费模式,根据服务条款,付费用户拥有所生成图像的所有权,但如果用户是公司的雇员或所有者,且公司年收入超过100万美元,那么他们必须购买专业计划(ProPlan)或超级会员计划(MegaPlan)。2023年,Midjourney的1500万社区成员预计为其带来2亿美元收入。

猜你喜欢
霍尔想象力社区
看见你的想象力
3D打印社区
在社区推行“互助式”治理
打开新的想象力
离子推力器和霍尔推力器的异同
道格拉斯·斯高特·霍尔(1940-2013)
如何积极应对社区老年抑郁症
基于素质培养的霍尔效应实验