图像生成的 OG 是成功的,只是少了一些审核挑战
艾丽·拉塞尔 (Elle Russell) 是位于澳大利亚凯恩斯的NightCafe的联合创始人,该公司提供一套人工智能艺术创作工具,但她不太喜欢引人注目。
“我喜欢隐藏在监视器后面,”她在最近的一次采访中告诉我。
NightCafe 也同样低调。
五年前,拉塞尔帮助她的合伙人安格斯·拉塞尔创办了这家公司,但该公司的宣传力度不如Midjourney等竞争对手。然而,NightCafe 是一家完全自力更生的企业,据 Elle 报道,“大多数月份”都在盈利,而且影响力巨大。该公司的 2500 多万用户已经用其工具制作了近 10 亿张图片。
为了揭开网络上最古老的生成艺术市场之一的面纱,我与 Elle 谈论了 NightCafe 的起源、该平台面临的一些挑战,以及她和 Angus 对它未来发展的看法。
一个关于墙壁艺术的网站
NightCafe 的创立故事是这样的:安格斯最近搬进了悉尼内西区的一栋半独立式住宅,还没有机会用艺术品来装饰房子。“你应该买些艺术品;墙壁上光秃秃的,”一位客人说道。虽然安格斯同意了,但他在网上找不到任何能打动他的版画。
因此,2019 年,拥有设计学位并曾与他人共同创立过几家专注于设计的初创公司的安格斯开始了一份副业:一个可以买卖人工智能生成的艺术品的网站。他将其命名为 NightCafe,以纪念文森特·梵高的《夜间咖啡馆》。
这是一次彻底的失败。
人们喜欢创作艺术品,而 NightCafe 并不收取任何费用。但他们不愿意为墙面印刷品付费,而墙面印刷品是该网站唯一的赚钱方式。
后来,在一个决定性的一周,Angus 发现他的托管费用比平时高了几百美元。有人在短短几天内生成了数千张图片。他实施了信用系统,以防止这种情况再次发生。
不久之后,Angus 的收件箱里就塞满了要求添加购买更多积分选项的请求,他照做了。几乎一夜之间,网站就实现了收支平衡。
正是在这个时候,艾尔加入了 NightCafe,负责运营业务方面。“我拥有两个本科学士学位,分别是商业和通信专业,我还是一名注册会计师,”她说。“这很合理。”
NightCafe 的病毒式成功
几年后的 2021 年中,当 OpenAI 宣布DALL-E时,NightCafe 获得了第二次重大突破。
DALL-E 是 OpenAI 的首个图像生成 AI 模型,在当时堪称一流。OpenAI 选择不发布它,但不久之后,爱好者们就设法对 DALL-E 背后的一些方法进行逆向工程,并构建了自己的开源模型。
一直密切关注事态发展的 Angus迅速着手将 DALL-E 最受欢迎的替代方案之一 VQGAN+CLIP 引入 NightCafe。他斥资购买了数百台 GPU 来扩大规模。
这笔投资很快就获得了回报。
使用 NightCafe 的 VQGAN+CLIP 创建的图像在 Reddit 上爆红;NightCafe 一天就赚了 17,000 美元。Angus 决定辞去 Atlassian 的工作,全职从事该平台的工作。
模范市场
如今的NightCafe与几年前的NightCafe已经有很大不同。
该平台仍在自己的服务器上运行一些模型,包括最新版本的Stable Diffusion和 Ideogram。但它还集成了提供这些 API 的 AI 供应商的 API,为第三方生成器提供了相当于自定义接口的功能。
也就是说,NightCafe 将工具层层叠加在来自其他地方的模型之上,包括 OpenAI、谷歌和Black Forest Labs。自 2019 年以来,该网站还为想要马克杯、T 恤和任何艺术作品印刷品的客户提供印刷服务。
“我们是一家 UI 和社区公司,”Elle 说道。“NightCafe 没有任何内部 AI 或机器学习能力;我们整合了可用的图像模型,让它们变得有趣且易于使用。”
在 NightCafe 的聊天室中,用户可以分享自己的艺术作品并进行协作,或发起“AI 艺术挑战”。该平台还举办官方比赛,人们可以提交自己的作品以获得推荐展示。
去年,NightCafe 推出了微调功能,用户可以通过上传示例图像来训练模型,使其重现特定的风格、面部或物体。NightCafe 上的微调模型受到某些限制;例如,它们不能使用显示裸露、名人或 18 岁以下人士的图像进行训练,并且必须经过 NightCafe 审核团队的手动批准。(这是为了降低深度伪造的风险。)
部分功能需要订阅才能使用。用户只需支付每月 4.79 美元至 50 美元的费用(低于Midjourney和Civitai 的价格),即可优先使用功能更强大的模型、给创作者打赏、使用上述微调功能以及更高的图像生成限制。
这个模型对于 NightCafe 来说运行得非常好。
一位接近该公司的消息人士告诉 TechCrunch,NightCafe 的年收入为 400 万美元,毛利率接近 50%,这意味着 NightCafe 扣除开支后每年的利润约为 200 万美元(包括 9 名员工的工资)。
Elle 表示,每月大约有 100 万人访问 NightCafe,其中有 2 万人订阅了该服务。
“任何在线的人工智能艺术生成器都在与同一群人争夺资金,尽管我们的用户比业内许多人的年龄更大,”她说。“我们认为我们最大的竞争对手是其他拥有强大社区的应用程序:Leonardo、Civitai 和 Midjourney。”
人工智能艺术的版权问题
通过选择不训练自己的人工智能(并进行微调),NightCafe 试图避开许多其聚合模型的人工智能供应商陷入的法律僵局。
Stability AI、Midjourney 和另外两家模型提供商DeviantArt和Runway面临艺术家发起的集体诉讼,他们指控供应商未经许可在艺术作品上训练模型,侵犯了版权。(供应商声称这是合理使用辩护。)诉讼的部分内容已被驳回。但一名联邦法官在本月初允许其进入调查阶段。
NightCafe 可能受到《通信规范法》第 230 条的保护,该法规定用户而非平台应对非法内容(如侵犯版权的艺术作品)负责,只要平台根据要求删除内容即可。NightCafe 的总部澳大利亚有《广播服务法》,该法与第 230 条非常相似,但不同之处在于,如果未能迅速删除“极端暴力内容”,则会征收更高的额外费用。
当然,如果法院裁定 NightCafe 使用的模型本质上是抄袭机器,那么这将破坏公司的业务。但是,对于 NightCafe 的用户及其创作的艺术作品而言,版权又该如何呢?
根据该平台的服务条款,在承认此类作品具有版权的国家(如美国),用户可以保留其人工智能生成作品的版权——至少只要允许在其中使用任何第三方品牌、标识或商标。
NightCafe博客去年 5 月的一篇文章对此进行了更深入的阐释:“合法的创作者会认识到并承认他们创作图像的灵感来自其他来源。人工智能艺术创作工具也在快速发展,正在开发的系统可以支持持续的创作环境,同时确保用户只能在获得原创艺术家的同意的情况下访问源材料——就像免版税摄影图像可以在引用创作者的情况下被允许使用一样。”
换句话说,在 NightCafe 看来,需要保护自己权益的是用户,而不是 NightCafe。如果他们不这样做,平台将不会保护他们免受知识产权持有者的愤怒。
但看起来 IP 持有者并没有吓倒很多用户。
在 NightCafe 上粗略搜索,会出现神奇宝贝和唐老鸭的图片、布兰妮·皮尔斯等名人、可口可乐和乐高等品牌以及斯坦利·“Artgerm”·刘等艺术家风格的艺术作品。似乎没有一个是得到版权所有者许可的。
当被问及此事时,Elle 表示:“用户还可以举报通过自动过滤的内容,我们有一个人工审核团队,全天候审核被标记的内容。”
政治政策与深度伪造
随着我与 Elle 的采访进入审核阶段,我们深入探讨了 NightCafe 的一般内容准则,特别是其有关政治和深度伪造的政策。
在美国总统大选前夕,包括 Midjourney 在内的平台已采取措施禁止用户生成唐纳德·特朗普和卡马拉·哈里斯等政治人物的图片。但据 Elle 报道,NightCafe 并没有这样做,而且它也不打算这么做。
“制作特朗普和其他政治和公众人物的图片是允许的,”她说。“但是,我们不希望 NightCafe 成为政治争论的场所。”
NightCafe 如何能两全其美?虽然该平台不会阻止用户在其他地方发布政治图片,但如果用户试图将这些图片发布到 NightCafe 的公共信息流中,它会标记这些图片以供审查。
既然如此,在 NightCafe 的公共画廊中很容易找到拜登坐在轮椅上、特朗普拿着枪和可疑的哈里斯表情包的图片。民意调查显示,大多数美国人担心人工智能宣传和深度伪造的传播,NightCafe 肯定没有让执法工作变得更容易。
至于哪些内容是允许的或不允许的:这取决于情况。
“政治诱饵”、美化分裂人物或故意贬低或贬低他人的图片都是禁忌(尽管我的搜索结果是这样的)。大多数普通人认为有害或令人反感的内容也是被禁止的;NightCafe 的社区标准列表列出了种族主义和恐同图片、垃圾邮件、令人反感的脏话、恐怖主义主题、嘲笑残疾人的图片以及仇恨团体和符号的描述。
从技术上来说,这些主题可能被禁止。但在 NightCafe 的搜索栏中输入“自杀式炸弹袭击者”等词条,你很有可能会遇到至少一张似乎违反平台规则的图片。
Elle 告诉我,最终还是由版主来解读 NightCafe 的准则,并且反复发布被禁类别的图片,或绕过自动过滤器,可能会导致警告或禁令。
NightCafe 的审核团队规模相当小(考虑到该网站的用户每天至少生成 700 张图片):五名付费审核员和 20 名志愿者审核员,志愿者审核员以高级 NightCafe 功能的形式获得报酬。付费审核员负责监控内容,志愿者负责处理评论、NightCafe 的聊天室和经过微调的模型队列。考虑到内容版主通常要面对的恶劣工作条件,我向 Elle 询问了有关 NightCafe 版主招聘做法的更多信息。她说,付费团队由一家位于印度尼西亚的外包公司(她不愿透露具体名称)管理,并由一名内部 NightCafe 员工监督。
Elle 表示,所有付费版主都能获得“市场工资”。(截至 2024 年初,雅加达的最低工资约为每月325 美元。)
与 Civitai 类似,NightCafe 对“NSFW”内容有政策豁免:不允许出现裸露镜头,但允许出现挑逗性姿势(“裸露胸部和臀部”)、血腥和暴力、战争的生动描述以及非法使用毒品的图片(例如,米奇抽雪茄)。这在某种程度上取决于模型;例如,OpenAI 的DALL-E 2有一套更严格的过滤器。
为什么允许 NSFW 图片冒着风险发布,而且不允许添加任何形式的水印(加州可能很快就会出台法律规定)以防止滥用?对于第一个问题,Elle 表示,这会扼杀“艺术自由”。
“我们确实允许在网站上发布带有 NSFW 标签的轻度艺术裸体和成人主题,但不允许发布彻头彻尾的色情内容。我们已尽力在社区标准中为用户‘划清界限’,以便他们了解什么是允许的,什么是不允许的,”她补充道。“我们为我们的社区感到自豪,并成为所有 AI 艺术的‘中心’。”
从我几次搜索来看,NightCafe 似乎并没有充斥着越界令人反感的内容。但我不禁注意到,大多数“性感”图片都以女性为主角——这种模式在此类平台上很不幸。
NightCafe 的未来
和许多人工智能艺术创作领域的初创公司一样,NightCafe 似乎处于一种停滞状态。它正在将新模型引入网络,包括视频生成模型,如稳定视频扩散。但这并没有带来太大的震动——不言而喻的原因是,一个法院判决或法规就可能迫使 NightCafe 重新考虑其整个运营。
不过,Elle 似乎认为 NightCafe 有发展前景,不需要外部投资。
“过去两年,在图像生成领域大行其道的时候,我们的大多数竞争对手都筹集了资金,”拉塞尔说。“他们几乎都曾经或现在以亏本的价格提供图像生成服务,以吸引用户。并非所有竞争对手都能成功;NightCafe 率先将人工智能与艺术相结合,但也倡导让所有人都能利用先进技术创造创意的理念。”
尽管企业版 NightCafe 的利润非常丰厚(除了审核障碍),但目前还没有计划推出。Elle 表示,重点仍将放在在最新的生成模型上构建社区和“社交中心”。
“行业面临的一个挑战是,图像生成模型越来越优秀,很快就会商品化,”她说。“那么各公司在什么方面竞争呢?在 NightCafe,我们选择专注于成为顶级模型的聚合器,以提供最佳的多样性和最高水平的技术。”
我们将看看它如何在波涛汹涌的水域中航行。
原创文章,作者:王 浩然,如若转载,请注明出处:https://www.dian8dian.com/zai-midjourney-zhi-qian-you-nightcafe-er-qie-ta-xian-zai