Cerebras 与 Nvidia：新的推理工具有望实现更高的性能

AI News • 2024年9月1日上午8:00 • AI前沿 • 123 views

人工智能硬件初创公司Cerebras创建了一种新的人工智能推理解决方案，可能与 Nvidia 为企业提供的 GPU 产品相媲美。

Cerebras Inference 工具基于该公司的 Wafer-Scale Engine，并有望提供惊人的性能。据消息人士透露，该工具已实现 Llama 3.1 8B 每秒 1,800 个令牌的速度，Llama 3.1 70B 每秒 450 个令牌的速度。Cerebras 声称，这些速度不仅比 Nvidia 的 GPU 生成这些系统所需的通常超大规模云产品更快，而且更具成本效益。

正如 Gartner 分析师 Arun Chandrasekaran 所说，这是进入生成式 AI 市场的重大转变。虽然这个市场之前的重点是训练，但目前正在转向推理的成本和速度。这种转变是由于企业环境中 AI 使用案例的增长，并为 Cerebras 等 AI 产品和服务供应商提供了基于性能展开竞争的绝佳机会。

正如 Artificial Analysis 联合创始人兼首席执行官 Micah Hill-Smith 所说，Cerebras 在 AI 推理基准测试中表现出色。该公司的测量结果显示，在 Llama 3.1 8B 上每秒输出超过 1,800 个 token，在 Llama 3.1 70B 上每秒输出超过 446 个 token。这样，他们在两个基准测试中都创下了新纪录。

Cerebras 推出 AI 推理工具，速度提高 20 倍，成本仅为 GPU 的一小部分 — *Cerebras 推出了速度提高 20 倍而成本仅为 GPU 的一小部分的 AI 推理工具。*

然而，尽管具有潜在的性能优势，Cerebras 在企业市场仍面临重大挑战。Nvidia 的软件和硬件堆栈在行业中占据主导地位，并被企业广泛采用。Futurum Group 分析师 David Nicholson 指出，虽然 Cerebras 的晶圆级系统能够以比 Nvidia 更低的成本提供高性能，但关键问题是企业是否愿意调整其工程流程以适应 Cerebras 的系统。

在 Nvidia 和 Cerebras 等替代方案之间做出选择取决于几个因素，包括运营规模和可用资本。较小的公司可能会选择 Nvidia，因为它提供已经成熟的解决方案。同时，拥有更多资本的大型企业可能会选择后者来提高效率并节省成本。

随着人工智能硬件市场的不断发展，Cerebras 还将面临来自专业云提供商、微软、AWS 和谷歌等超大规模提供商以及 Groq 等专用推理提供商的竞争。性能、成本和易实施性之间的平衡可能会影响企业采用新推理技术的决策。

每秒能够超过 1,000 个 token 的高速 AI 推理的出现相当于宽带互联网的发展，这可能为 AI 应用开辟新的领域。Cerebras 的 16 位精度和更快的推理能力可能有助于创建未来的 AI 应用程序，其中整个 AI 代理必须快速、重复和实时地运行。

随着人工智能领域的发展，人工智能推理硬件市场也在不断扩大。该领域约占整个人工智能硬件市场的 40%，正成为更广泛的人工智能硬件行业中越来越有利可图的目标。鉴于更知名的公司占据了这一领域的大部分份额，许多新进入者应该仔细考虑这一竞争格局的重要方面，考虑到竞争性质以及驾驭企业领域所需的大量资源。

原创文章，作者：AI News，如若转载，请注明出处：https://www.dian8dian.com/cerebras-yu-nvidia-xin-de-tui-li-gong-ju-you-wang-shi-xian-2

AI Cerebras Nvidia 人工智能

Like (0)

AI News作者

0 0

百度限制谷歌和必应抓取内容用于人工智能训练

Previous 2024年8月31日下午10:00

Shaktiman Mall，Aviatrix 首席产品经理 – 访谈系列

Next 2024年9月1日上午10:00

AI前沿

人工智能悖论：未来的尖端工具如何成为危险的网络威胁（以及需要做好哪些准备）

人工智能正在改变企业的运营方式。虽然这种转变在很大程度上是积极的，但它也带来了一些独特的网络安全问题。像agentic AI这样的下一代人工智能应用对组织的安全态势构成了特别值得注…

王浩然
2025年2月4日
000
AI前沿

三星哈曼的人工智能将使汽车更具同情心

如果您认为车道上的汽车只是一个从 A 点到 B 点的设备，那么您就错了，因为三星子公司哈曼已经在 CES 上展示了新技术，声称这项技术将把汽车变成一个有同情心的伴侣。该公司总部位…

王浩然
2025年1月9日
000
AI前沿

人工智能生产力引擎在最新一轮融资中筹集 5000 万美元

协作式 AI 生产力引擎 You.com 在由成长期 B2B 投资者 Georgian 领投的 B 轮融资中获得了 5000 万美元。 Salesforce Ventures、NV…

点点
2024年9月12日
000
AI前沿

Cassette Group 首席执行官兼联合创始人 Ben Taylor – 访谈系列

Ben Taylor是Cassette Group的联合创始人兼首席执行官，该集团是一家沉浸式技术公司，专门为企业提供培训、教育和通信解决方案。该公司利用 3D 实时技术通过动画…

点点
2024年9月28日
000
AI前沿

Meta 与 Lumen 合作推动网络扩张和 AI 目标

Lumen Technologies 已与 Meta 合作，帮助提高 Meta 的网络容量并推动其 AI 目标。扩展的网络预计将有助于加强和提高 Meta 的人工智能…

王浩然
2024年11月7日
000
AI前沿

亚马逊网络服务 (AWS) re:Invent 2024 的重磅新闻

云计算领导者亚马逊网络服务 (AWS) 的2024 年年度 re:Invent 大会本周于内华达州拉斯维加斯举行，它有望成为该系列12 年前推出以来规模最大的一次大会。为什么？当…

王浩然
2024年12月5日
000
AI前沿

Meta 推出 AI 工具，让机器人在现实世界中拥有人类的触感

Meta本周发布了几项有关机器人和具身 AI 系统的重大公告。其中包括发布基准和工件，以便更好地理解和与物理世界互动。Meta 发布的三项研究工件 Sparsh、Digit 36…

王浩然
2024年11月3日
000
AI前沿

一种新的代理可靠性方法：AgentSpec强制代理遵循规则

在人工智能领域，随着AI代理（Agent）在企业流程和自动驾驶等应用中的日益普及，其安全性和可靠性问题也日益凸显。AI代理在执行任务时可能会采取意外行动，缺乏灵活性且难以控制，这给…

王浩然
2025年3月31日
000
AI前沿

微软的 AI 生态系统如何胜过 Salesforce 和 AWS

人工智能代理是一种自主系统，旨在执行通常需要人类参与的任务。通过使用高级算法，这些代理可以处理各种功能，从回答客户查询到预测业务趋势。这种自动化不仅简化了重复流程，还使人类工作者能…

王浩然
2024年12月26日
000
AI前沿

CoreWeave创始人：在40亿美元IPO前夕，已入账4.88亿美元‌

随着科技行业的蓬勃发展，云计算领域再次迎来了一个令人瞩目的里程碑。CoreWeave，这家专注于高性能计算的云计算服务提供商，正站在40亿美元IPO（首次公开募股）的门槛上。而在此…

王浩然
2025年3月8日
000
AI前沿

中国研究人员推出 LLaVA-o1，挑战 OpenAI 的 o1 模型

OpenAI的 o1 模型表明，推理时间扩展（在推理过程中使用更多计算）可以显著提升语言模型的推理能力。LLaVA -o1是由中国多所大学的研究人员开发的新模型，它将这一范式引入了…

王浩然
2024年11月26日
000
AI前沿

超越法学硕士：SandboxAQ 的大型量化模型如何优化企业 AI

虽然大型语言模型 (LLM) 和生成式 AI在过去一年中占据了企业 AI 讨论的主导地位，但企业还可以通过其他方式从 AI 中获益。其中一种替代方案是大型定量模型 (LQM)。 L…

王浩然
2024年12月20日
000
AI前沿

人工智能增强人力资源，但以人为本的方法不可或缺

随着人工智能 (AI) 在人力资源领域不断开辟新天地，其接受度也越来越高。最近的一项研究显示，近一半接受调查的英国和美国员工认为人工智能有助于减少偏见和不公平的招聘待遇；许多人甚至…

王浩然
2025年1月13日
000
AI前沿

埃隆马斯克的 X 正在改变其隐私政策，允许第三方在你的帖子上训练人工智能

周三，社交网络 X（前身为 Twitter）更新了其隐私政策，表明它将允许第三方“合作者”使用 X 数据训练他们的 AI 模型，除非用户选择退出。虽然 X 所有者埃隆·马斯克使用 …

王浩然
2024年10月19日
000
AI前沿

起底AIGC概念股：退潮之后，谁在裸泳？

生成式AI技术狂飙一年多以后，A股市场的「AIGC概念股」正在经历一场集体的「去泡沫」。截至9月12日收盘，相比去年的涨幅，今年以来，万得AIGC概念指数(8841660.WI)…

点点
2024年9月13日
000
AI前沿

研究发现：基于不安全代码训练的AI模型具有毒性‌

最新研究表明，使用未受保护或存在安全漏洞的代码来训练的AI模型，可能会表现出“毒性”特征，即这些模型在生成代码或做出决策时可能包含恶意代码、偏见或错误逻辑。 ‌一、研究背景‌ 在人…

王浩然
2025年3月2日
000
AI前沿

如何将 OpenAI 的 ChatGPT 高级语音模式映射到 iPhone 操作按钮

我必须坦白：尽管我职业生涯的大部分时间都是一名科技记者，并且一直热衷于接受或至少测试最新、最伟大的个人技术，但我从未发现语音助手对我来说是有用的。部分原因在于这项技术迄今为止确实…

王浩然
2025年1月4日
000
AI前沿

畅销书作家批评全国小说写作月的人工智能中立立场

全国小说写作月（NaNoWriMo）是一个已有 25 年历史的非营利组织，旨在鼓励任何有兴趣的人每年 11 月创作一本小说。该组织最近宣布将接受使用人工智能 (AI)作为写作过程的…

王浩然
2024年9月5日
000
AI前沿

Basecamp Research 斥资 6000 万美元打造“生物学 GPT”

就在 OpenAI 和 Anthropic 等公司继续推广使用普通语言向人工智能代理询问问题、撰写提案或绘制图片的想法时，一家名为Basecamp Research 的伦敦初创公司…

王浩然
2024年10月10日
000
AI前沿

埃隆·马斯克再次起诉 OpenAI 对 AI 行业意味着什么

埃隆·马斯克最近对 OpenAI、其首席执行官山姆·奥特曼和联合创始人格雷格·布罗克曼发起了新的联邦诉讼，重新点燃了一场可能对人工智能行业产生重大影响的法律战。这起诉讼于 8 月初…

王浩然
2024年8月23日
012

发表回复

Please Login to Comment

Cerebras 与 Nvidia：新的推理工具有望实现更高的性能

相关推荐

发表回复

Share To :