Napkin AI 的人工智能代理“设计机构”正在改变专业人士创作图形的方式

Napkin AI 的人工智能代理“设计机构”正在改变专业人士创作图形的方式

平面设计公司Napkin AI正在垂直 AI 代理应用这一令人兴奋的前沿领域开辟一条独特的道路。

用户可以在 Napkin AI 的网站上输入文本,其模型会在五秒内生成代表文本的图形。

令人着迷的是,Napkin 在底层实现了这一目标,它接手了设计机构的各种传统工作——文案、设计师、插画师、品牌造型师——并使用单独的AI 代理(而不是人类)来复制这些离散功能。

该产品自 8 月推出以来,就获得了令人印象深刻的关注。Napkin 联合创始人兼首席执行官 Pramod Sharma 表示,该产品目前拥有 200 万测试用户,是六周前用户数量的两倍。

“我们采取了略微不同的角度,”他在接受采访时表示。“我们一开始并没有想:‘让我们看看一个图像模型,看看它能做什么。’事实上,对我们来说,这是事后的想法。我们真正关心的是创建图形需要什么,以及今天是如何做到的,然后再反向思考。”

Napkin AI 是垂直 AI 代理趋势的一部分

Napkin 是越来越多初创公司之一,它们为垂直领域提供服务,其产品不是由现有 SaaS 模式驱动,而是由幕后的垂直 AI 代理驱动。Napkin 展示了这些代理公司的生产力。该公司拥有一支由 12 名远程工作人员组成的团队,Sharma 是唯一一位住在旧金山湾区的员工。这些公司还有望带来极大的颠覆性,因为它们针对特定用例的可定制性和功能性更强。

Napkin 与其他竞争对手的不同之处在于,它专注于满足特定需求:帮助非平面设计专家的专业人士创建漂亮的设计,主要用于 PowerPoint 演示文稿。这些用户想要的是图表和其他插图,而不仅仅是许多
生成式 AI 提供商制作的精美图像——他们希望能够轻松简单地编辑这些图像。这就是 Napkin 所做的:在五秒钟内将最佳照片返回给用户后,它允许用户编辑样式、颜色和设计类型等内容。

Napkin AI 的人工智能代理“设计机构”正在改变专业人士创作图形的方式

Napkin AI 代表了第三种方式

Sharma 表示,Napkin 不像大多数其他图像提供商那样使用扩散 AI 模型,因为这些模型不允许用户轻松编辑插图的独特元素,例如饼图的切片或周围的文本。通过在 Napkin 产品中引入具有特定、有用功能的代理,Napkin 的方法代表了“第三种方式”。 

Adobe 或 Canva 等现任平面设计同行采取的“第一种方式”是将人工智能工具与传统设计工作流程相结合。Napkin 不这样做。它是新一代人工智能优先,因为它根据用户的提示使用该技术尽可能地创建最佳的视觉初稿。然后,它简化了剩余的编辑过程,同时考虑到大多数用户不具备高级设计技能——例如,你需要掌握 Adob​​e Creative Cloud 所需的技能。

Napkin 也不走“第二种道路”,即新一代人工智能图像和视频公司(如 MidJourney、Stable Diffusion、Runway、Ideogram 等)的路线。这些公司以人工智能为先而自豪,并使用大量传播模型用高质量的图像或视频欺骗用户。它们之间的区别通常并不明显。然而,Sharma 指出,Napkin 决心不为了追求卓越技术而沉迷其中,因为这样做并没有把用户放在第一位。

Napkin AI 的工作原理如下:它允许用户粘贴文本描述(无论是演示提示、博客摘录还是头脑风暴笔记),并在几秒钟内获得多个高质量的图形选项。这些图形不仅仅是模板,而是可定制的设计,具有可编辑的字体、颜色和布局,但它们易于使用,带有滑动工具。该产品避开了巨大的菜单栏,而是 Figma 或 Canva 等更复杂的工具提供的数百个选项。创建图像后,Napkin 允许您以 PNG、PDF 或 SVG 格式导出它。

Napkin AI 有四个子代理

不过,更有趣的是这些代理在幕后是如何工作的:Napkin 使用一个由 OpenAI 的 GPT-4o mini 驱动的协调器大型语言模型 (LLM) 来响应用户的提示。这个 LLM 充当代理,将工作委托给一系列具有特定职责的其他子代理。第一个“文本”代理建议一些可以在设计中使用的文本。第二个“布局”代理查看文本,并决定最适合该文本的特定设计布局。

第三个“图标和插图”代理检查数据库,查看是否有与文本请求相匹配的图标,如果没有,它可能会即时生成一个图标。最后,还有第四个“样式”代理,它允许用户使用自己的公司颜色和样式自定义设计。正如 Sharma 所解释的那样,Napkin 不会对这四个代理施加太多限制,除了最大限度地提高质量和速度。Sharma 说,五秒钟内做出响应是满足客户需求的关键。

每个代理都对整体构图做出贡献,确保生成的图形不仅美观,而且符合用户的意图。

Sharma 解释说,第四个样式代理将于下周引入产品,随着时间的推移,它会不断改进。很快,用户将能够上传他们公司样式的屏幕截图或其他文档,这样图像模型就可以自动生成该样式的图像。Sharma 引用了Meta 在大型概念模型 (LCM) 领域所做的研究,这可能会有所帮助。不过,目前,Napkin 的代理是一个渲染引擎,它通过仪表板向用户提供各种样式选项。 

Napkin AI 的人工智能代理“设计机构”正在改变专业人士创作图形的方式

质量和专注是差异化因素

Napkin 最引人注目的承诺之一就是注重质量。对于 Sharma 来说,目标不仅仅是快速制作视觉效果,而是确保每张图表都值得使用。“我们将您的书面内容转化为真正体现您想法精髓的图表,”Sharma 说道。“我们意识到,对于图表而言,光是好是不够的。它必须非常非常棒。否则就违背了目的。”

在分享了对演示文稿质量的共同不满后, Sharma 与 Jerome Scholler 共同创立了 Napkin AI 。在创办 Napkin 之前,Sharma 创立了教育游戏公司 Osmo,该公司也以设计质量而闻名。Scholler 是 Osmo 的创始团队成员。Sharma 也曾是谷歌员工。

这种对质量的执着延伸到了技术基础。与通常缺乏对图形语义理解的传播模型不同,Napkin 的代理驱动平台允许它分离内容、布局和样式等元素。这种分离允许用户动态修改内容而不会失去设计的完整性。

牵引与扩张

市场似乎认同 Napkin 的做法。该平台的用户在过去六周内翻了一番,而且留存率很高,这表明用户喜欢其底层工作流程。经过几周的使用,Sharma 指出:“用户会说:‘给我更多!’‘你能扩展目录吗?可能性?插图类型?’这对我们来说是件好事,因为我们现在非常专注。”

然而,有趣的是,对于视觉传达,某些设计效果很好,而其他设计则不然。例如,人类大脑可以轻松理解饼图和条形图,但理解其他设计则比较困难。“我们对空间的了解是,结构本身并不是无限的,”夏尔马说。“它们是人们通常使用的明确定义的结构或隐喻,但你如何呈现它们?你如何说明这个隐喻?这就是大量创造力的来源,我们实际上正在努力大幅扩展它。”

该公司筹集了1000 万美元的种子轮融资,并于 2024 年 8 月正式成立。但他们开始研究这个问题已经三年了。“我可以告诉你,这仍然是一个很难的问题,”夏尔马说。“人类非常擅长阅读图形,并判断图形是否好。他们不知道如何制作图形,但他们可以非常非常快地判断图形。”

Napkin AI 的未来

随着 Canva 和 Adob​​e 等大型公司瞄准新一代人工智能领域,Napkin AI 的明显差异化可能使其成为收购目标。无论是作为独立的颠覆者还是更大生态系统的关键组成部分,Napkin AI 无疑是新一代人工智能图形领域值得关注的公司。

原创文章,作者:王 浩然,如若转载,请注明出处:https://www.dian8dian.com/napkin-ai-de-ren-gong-zhi-neng-dai-li-she-ji-ji-gou-zheng

Like (0)
王 浩然的头像王 浩然作者
Previous 2025年2月11日
Next 2025年2月12日

相关推荐

发表回复

Please Login to Comment