Black Forest Labs (BFL)是一家初创公司,由流行的 Stable Diffusion AI 图像生成模型的创建者创立,该模型是许多 AI 图像生成应用程序和服务(如Midjourney)的基础,该公司宣布发布一种名为 Flux 1.1 Pro 的新型、更快的文本转图像模型,并提供付费应用程序编程接口 (API),开发人员可以在其上构建由该模型驱动的第三方应用程序(或将其合并到他们现有的应用程序中)。
这意味着,如果提供创意工具的公司(以及他们的最终用户)愿意支付 API 费用,他们可以将 Flux 作为其产品的一个选项。
个人用户无法通过 Black Forest Labs 网站访问新的 Flux 1.1 Pro 模型,而是可以通过合作伙伴together.ai、 Replicate、 fal.ai和 Freepik访问。其中一些服务以不同的名称引用该模型,例如“Flux Fast”。
目前尚未提供有关 Flux 1.1 Pro 训练数据集的详细信息,这是生成式人工智能公司之间的一个争议问题,最初的 Stability AI 和竞争对手 Midjourney 被艺术家起诉,他们指控这些公司和其他公司侵犯了他们的版权,在未经同意或补偿的情况下对发布到网上的人造图像进行大规模抓取和训练。针对Stability AI 和 Midjourney 的一项关键集体诉讼仍在法庭审理中。
此前,Flux 的首个开源文本转图像 AI 模型取得成功,该模型为伊隆·马斯克 (Elon Musk) 的 xAI Grok 2 聊天机器人提供支持,并可供其社交网络 X 的订阅者使用。
与其早期的 Flux.1 型号不同,后者是开源的,任何人都可以免费下载、微调、自定义,并根据自己的需要将其用于所有商业或个人用途,而新的 Flux 1.1 Pro 型号似乎与 Flux 1.0 Pro 一样,是一款付费专有产品。不过,它仍可用于商业和企业用途。
BFL 将其 API 和 Flux 1.1 Pro 的推出视为公司成长的重要一步,为开发人员和企业提供强大且可定制的图像生成工具。
代号为“蓝莓”的 Flux 1.1 Pro 在人工智能分析图像排行榜上占据新高
Flux 1.1 Pro 在早期的 Flux 1.0 Pro 型号基础上进行了改进, 生成速度提高了六倍,同时还提高了图像质量、及时性和多样性。
它实现了在不牺牲质量的情况下优先考虑速度的工作流程,输出速度比以前快三倍。
此外,BFL 宣布对原有的 Flux 1.0 Pro 进行更新,使其生成速度提高一倍,以全面提高效率。
Flux 1.1 Pro 的性能已通过其在Artificial Analysis上的秘密亮相得到验证,Artificial Analysis 是一个用于比较 AI 模型性能的独立第三方基准测试平台,该模型在今天宣布之前的几天内以代号“blueberry”进行了测试。(一些人在 X 上错误地猜测这是 OpenAI 在将 o1 LLM 测试为“strawberry”之后对 Sora 进行的测试。)
截至 2024 年 10 月 1 日,Flux 1.1 Pro 在平台上拥有最高的ELO 分数,为 1153,在视觉保真度和提示准确性方面超越其他生成模型,包括 Midjourney 6.1(ELO 分数为 1100)和 Ideogram v2(分数为 1108)。
ELO 第三方基准由 Artificial Analysis 联合创始人兼首席执行官 Micah Hill-Smith 和联合创始人兼产品负责人 George Cameron于 2024 年夏初建立,并使用人工对图像的评分来得出其分数。
对于要求高分辨率输出的用户,Flux 1.1 Pro 将很快支持超高分辨率图像(高达 2k),并通过即将推出的 API 更新保持其精度和速度。
BFL API 为开发人员提供 AI 图像生成服务,每张图片起价 4 美分
与 Flux 1.1 Pro 版本相辅相成的是测试版的 BFL API,它将 BFL 的生成功能直接带给希望将最先进的图像生成功能集成到自己的应用程序中的企业和开发人员。
该 API 提供高级定制功能,使用户能够调整模型选择、分辨率和内容审核以满足其特定需求。它还具有可扩展性,适用于从小型到企业级的项目。
BFL 的 API 具有竞争力的定价,对于寻求高质量输出而又无需过高成本的用户来说具有吸引力。
例如,Flux 1.1 Pro 图像生成的价格为每幅图像 0.04 美元,而旧版 Flux 1.0 Pro 的价格为每幅图像 0.05 美元。
开发人员今天就可以开始集成 API,并且 BFL 承诺随着测试版的进展将不断改进。
该公司预计其 API 将为无数创意应用打开大门,特别是在设计、广告和娱乐等行业,这些行业对高质量 AI 生成媒体的需求持续增长。
基于初步取得的巨大成功
Black Forest Labs 对聚光灯并不陌生。就在两个月前,该公司获得了 3100 万美元的种子资金,由 Andreessen Horowitz (a16z) 领投,并得到了 Brendan Iribe、Michael Ovitz 和 Garry Tan 等知名投资者的支持。
据 VentureBeat 报道,BFL 及其早期的 Flux 1.0 模型的推出被广泛视为 AI 社区的一个里程碑。
BFL 联合创始人 Robin Rombach、Patrick Esser 和 Andreas Blattmann 将他们在 Stable Diffusion 背后团队 Stability AI 的专业知识带入了这个新项目,旨在打造更易于访问的开源生成 AI 工具。
Flux 1.0 有三种版本(Flux 1.0 Pro、Flux 1.0 Dev 和 Flux 1.0 Schnell),因其 120 亿参数架构以及匹敌甚至超越 MidJourney 和 DALL-E 等竞争模型的输出质量的能力而获得了早期的赞誉。
这些模型的开源特性,尤其是 Flux 1.0 Dev 和 Flux 1.0 Schnell,使 BFL 成为开源与专有 AI 之争中的重要参与者。
行业背景和竞争
Black Forest Labs 推出 Flux 1.1 Pro 正值生成 AI 媒体领域竞争加剧之际,许多创作者希望利用文本到图像的 AI 模型以及图像到视频的模型,例如来自Pika、Runway和Luma 的模型。
Midjourney和Ideogram都在付费专有文本转图像 AI 模型领域与 Flux 直接竞争,而Stability AI在前 Weta(电影特效)首席执行官 Prem Akkaraju 和最近加入公司董事会的好莱坞导演詹姆斯·卡梅隆( 《泰坦尼克号》、《阿凡达》、《终结者》)的领导下,继续提供开源和专有模型。
与社交平台的整合表明,生成式人工智能正变得越来越被主流用户所接受,从而提高了该领域其他参与者的风险。
BFL 的下一步计划是什么?
展望未来,Black Forest Labs 已经致力于将其生成式 AI 功能扩展到图像之外。
该公司已将目光投向文本转视频系统,这一发展可以进一步巩固其在人工智能驱动媒体领域的领导地位。
如果成功,BFL 进军视频领域可能会进一步颠覆广告、内容创作和虚拟现实等行业。据报道,Midjourney 也在开发生成式 AI 视频模型和硬件。
目前,Flux 1.1 Pro 和 BFL API 代表了生成技术的重大进步,为用户提供了更快、更高效的工具,同时还不影响质量。
无论是通过自己的 API 还是合作伙伴平台(如 together.ai、Replicate、fal.ai 和 Freepik),BFL 都希望将 Flux 1.1 Pro 打造为大多数用户的首选 AI 图像生成模型。
随着 BFL 继续突破生成式 AI 的界限,该公司也在扩大员工队伍,寻求有才华的创新者加入其使命。感兴趣的候选人可以通过公司网站探索空缺职位。
原创文章,作者:王 浩然,如若转载,请注明出处:https://www.dian8dian.com/black-forest-labs-fa-bu-flux-1-1-pro-he-api