Runware 使用定制硬件和高级编排实现快速 AI 推理

王浩然 • 2024年10月2日下午5:00 • AI前沿 • 117 views

有时，演示就是您了解产品所需的全部内容。Runware 就是这种情况。如果您访问Runware 的网站，输入提示并按 Enter 生成图像，您会惊讶于 Runware 为您生成图像的速度有多快——只需不到一秒钟。

Runware 是 AI 推理或生成 AI 初创领域的新秀。该公司正在构建自己的服务器并优化这些服务器上的软件层，以消除瓶颈并提高图像生成模型的推理速度。这家初创公司已经从 Andreessen Horowitz 的 Speedrun、LakeStar 的 Halo II 和 Lunar Ventures 获得了 300 万美元的资金。

该公司并不想重新发明轮子。它只是想让它转得更快。在幕后，Runware 制造了自己的服务器，在同一块主板上安装了尽可能多的 GPU。它拥有自己定制的冷却系统并管理自己的数据中心。

在服务器上运行 AI 模型时，Runware 通过 BIOS 和操作系统优化优化了编排层，以缩短冷启动时间。它开发了自己的算法来分配干扰工作负载。

演示本身就令人印象深刻。现在，该公司希望利用所有这些研究成果进行研发，并将其转化为一门生意。

与许多 GPU 托管公司不同，Runware 不会根据 GPU 时间来出租其 GPU。相反，它认为应该鼓励公司加快工作负载。这就是为什么 Runware 提供具有传统按 API 调用收费结构的图像生成 API。它基于 Flux 和 Stable Diffusion 的流行 AI 模型。

“如果你看看Together AI、Replicate、Hugging Face——所有这些公司——他们都在根据GPU时间销售计算能力，”联合创始人兼首席执行官Flaviu Radulescu告诉TechCrunch。“如果你比较一下我们制作图像所需的时间与他们制作图像所需的时间。然后比较一下定价，你会发现我们便宜得多，速度快得多。”

“他们不可能达到这样的性能，”他补充道。“特别是在云提供商中，你必须在虚拟化环境中运行，这会增加额外的延迟。”

由于 Runware 正在研究整个推理流程并优化硬件和软件，该公司希望在不久的将来能够使用来自多个供应商的 GPU。这对几家初创公司来说是一项重要的努力，因为 Nvidia 是 GPU 领域的明显领导者，这意味着 Nvidia GPU 往往非常昂贵。

“目前，我们只使用 Nvidia GPU。但这应该是软件层的抽象，”Radulescu 说道。“我们可以非常快速地将模型从 GPU 内存中切换进出，这使我们能够将多个客户放在同一个 GPU 上。

“所以我们与竞争对手不同。他们只是将模型加载到 GPU 中，然后 GPU 执行非常具体的任务。在我们的案例中，我们开发了这种软件解决方案，它允许我们在进行推理时切换 GPU 内存中的模型。”

如果 AMD 和其他 GPU 供应商能够创建与典型 AI 工作负载兼容的兼容层，Runware 就完全有能力构建一个依赖多家供应商 GPU 的混合云。如果它想在 AI 推理方面保持比竞争对手更便宜的价格，这肯定会有所帮助。

原创文章，作者：王浩然，如若转载，请注明出处：https://www.dian8dian.com/runware-shi-yong-ding-zhi-ying-jian-he-gao-ji-bian-pai-shi

AI 推理 AMD FLUX GPU Nvidia Runware Stable Diffusion 数据中心服务器混合云

Like (0)

王浩然作者

0 0

Meta 不愿透露是否利用智能眼镜拍摄的照片来训练 AI

Previous 2024年10月2日

Pika 1.5 推出，具有违反物理规律的 AI 特效

Next 2024年10月2日

AI前沿

从 o1 到 o3：OpenAI 如何重新定义人工智能中的复杂推理

生成式人工智能重新定义了我们对人工智能能力的认知。它最初只是一种用于完成简单重复性任务的工具，现在正在解决我们面临的一些最具挑战性的问题。OpenAI 在这一转变中发挥了重要作用，…

王浩然
2024年12月27日
000
AI前沿

Nvidia 赢得关键设计大奖，将 AI 引入自动驾驶汽车车队

Nvidia宣布已赢得丰田、Aurora 和大陆等汽车制造商的自动驾驶汽车关键设计订单。这些合作伙伴是 Nvidia 不断增长的合作伙伴名单的一部分，他们正在推出下一代高度自动化…

王浩然
2025年1月8日
000
AI前沿

MemGPT团队官宣创业，融资1000万美金，硅谷大佬Jeff Dean也投了

据TechCrunch本周一报道，MemGPT团队首次官宣创业。由该团队创立的Letta公司，推出了一个同名的AI上下文内存管理平台Letta。最近2年，大语言模型快速发展，但受…

点点
2024年9月25日
000
AI前沿

据报道，中国军事研究人员利用 Meta AI 开发国防聊天机器人

据报道，与中国执政党的军事部门中国人民解放军 (PLA) 有关的中国研究科学家使用 Meta 的“开放”人工智能开发了一种国防应用工具。据路透社报道，中国研究人员（包括两名隶属于…

王浩然
2024年11月2日
000
AI前沿

GibberLink：让AI代理以机器语言互相“通话”‌

在人工智能领域，随着技术的不断进步，AI代理间的通信成为了一个备受关注的课题。近日，一款名为GibberLink的创新技术横空出世，它实现了AI代理之间以一种独特的“机器语言”进行…

王浩然
2025年3月8日
000
AI前沿

阿里巴巴研究人员推出具有高级推理能力的法学硕士 Marco-o1

OpenAI o1的近期发布引起了人们对大型推理模型 (LRM) 的极大关注，并启发了旨在解决经典语言模型经常遇到的复杂问题的新模型。基于 o1 的成功和 LRM 的概念，阿里巴巴…

王浩然
2024年11月28日
000
AI前沿

Nvidia 完成收购 AI 基础设施初创公司 Run:ai

Nvidia 已完成对以色列初创公司 Run:ai 的收购，后者致力于管理和优化 AI 硬件基础设施。作为合并的一部分，Run:ai 表示其软件（目前仅适用于 Nvidia 产品…

王浩然
2024年12月31日
000
AI前沿

如何在不入侵任何东西的情况下窃取人工智能模型

人工智能模型的可窃取性令人惊讶——只要你设法嗅出模型的电磁特征。北卡罗来纳州立大学的研究人员在一篇新论文中描述了这种技术，尽管他们一再强调，事实上他们并不想帮助人们攻击神经网络。他…

王浩然
2024年12月29日
000
AI前沿

Black Forest Labs 发布 Flux 1.1 Pro 和 API

Black Forest Labs (BFL)是一家初创公司，由流行的 Stable Diffusion AI 图像生成模型的创建者创立，该模型是许多 AI 图像生成应用程序和服务…

王浩然
2024年10月7日
000
AI前沿

2024 年人工智能的四大新闻和 2025 年的一个重要预测

从各方面来看，2024 年都是人工智能迄今为止最重要的一年——至少就该技术的商业化而言。 2022 年末 ChatGPT 的推出推动了大型语言模型 (LLM) 热潮，这一热潮丝毫没…

王浩然
2024年12月24日
000
AI前沿

临床环境中的人工智能：了解护士的怀疑态度并找到前进的方向

由于普遍的职业倦怠和劳动力短缺，不断变化的医疗保健领域一直在寻找“下一个大事件”来支持劳动力赋能，而人工智能目前是领先的竞争者。人工智能在临床环境中的应用越来越普遍，并且将继续存在…

点点
2024年10月27日
000
AI前沿

Pentera获6000万美元融资，估值达10亿美元，致力于打造模拟网络攻击以培训安全团队‌

在网络安全威胁日益严峻的今天，如何有效提升企业的安全防护能力成为了业界关注的焦点。近日，一家专注于网络安全培训的创新企业Pentera宣布成功获得6000万美元的融资，估值飙升至1…

王浩然
2025年3月13日
000
AI前沿

在 Midjourney 之前，有 NightCafe — 而且它现在还在营业

图像生成的 OG 是成功的，只是少了一些审核挑战艾丽·拉塞尔 (Elle Russell) 是位于澳大利亚凯恩斯的NightCafe的联合创始人，该公司提供一套人工智能艺术创作工…

王浩然
2024年9月1日
000
AI前沿

Twins首推AI智能体：专为Qonto客户打造的发票检索助手

在数字化转型的浪潮中，金融科技领域正经历着前所未有的变革。近日，创新企业Twins宣布推出其首款AI智能体——专为Qonto客户设计的发票检索助手。这一举措不仅标志着AI技术在财务…

王浩然
2025年3月28日
000
AI前沿

AI 股票惨败之际 DeepSeek 推出“Janus Pro 7B”视觉模型，引发对中国科技主导地位的新担忧

迅速发展的中国人工智能公司DeepSeek再次撼动了全球科技界。就在该公司前沿人工智能模型的快速崛起引发美国人工智能股票抛售之际，该公司推出了一款全新产品： Janus Pro …

王浩然
2025年1月28日
000
AI前沿

人工智能聊天机器人能理解而人类无法理解的隐形文本？没错，确实存在。

Unicode 标准中的一个怪癖隐藏着一个理想的隐写代码通道。

点点
2024年10月16日
000
AI前沿

数据新时代的交易枢纽：Carbon Arc打造授权交易数据市场，赋能LLMs与企业应用

在数据被誉为“新石油”的当今时代，数据的重要性不言而喻。然而，尽管数据被视为一种宝贵的资源，但其交易与流通却远不如石油那样顺畅。数据的获取往往伴随着法律纠纷与版权问题，使得企业在追…

王浩然
2025年3月24日
000
AI前沿

OpenAI 的红队创新为 AI 时代的安全领导者定义了新的要素

OpenAI 在红队演练方面采取了比其 AI 竞争对手更积极的态度，展示了其安全团队在两个领域的先进能力：多步强化和外部红队演练。OpenAI 最近发布了两篇论文，为在这两种技术及…

王浩然
2025年1月7日
000
AI前沿

革命性的人工智能模型无需预定义知识即可预测物理系统

Archetype AI研究人员最近的一项研究揭示了一种能够泛化各种物理信号和现象的开创性 AI 模型，标志着人工智能领域的一次重大飞跃。这篇题为“物理信号的现象学 AI 基础模型…

点点
2024年10月18日
000
AI前沿

量子媒体与娱乐营销总监 Skip Levens – 访谈系列

Skip Levens是 Quantum 的产品负责人和 AI 策略师，Quantum 是 AI 和非结构化数据数据管理解决方案领域的领导者。他目前负责推动 Quantum 端到端…

点点
2024年10月16日
000

发表回复

Please Login to Comment

Runware 使用定制硬件和高级编排实现快速 AI 推理

相关推荐

发表回复

Share To :