Cerebras 成为世界上最快的 DeepSeek R1 主机，速度比 Nvidia GPU 快 57 倍

王浩然 • 2025年2月1日下午10:00 • AI前沿 • 59 views

Cerebras Systems今天宣布，它将在美国服务器上托管 DeepSeek 的突破性 R1 人工智能模型，承诺速度比基于 GPU 的解决方案快 57 倍，同时将敏感数据保留在美国境内。此举正值人们对中国快速发展的人工智能和数据隐私的担忧日益加剧之际。

这家人工智能芯片初创公司将在其专有的晶圆级硬件上部署一个拥有 700 亿个参数的DeepSeek-R1版本，每秒可输出 1,600 个令牌，这比在处理较新的“推理”人工智能模型时遇到困难的传统 GPU 实现有了显著的改进。

DeepSeek 的推理模型为何会重塑企业 AI

“这些推理模型影响着经济，”Cerebras 高管 James Wang 在独家采访时表示。“任何知识工作者基本上都必须完成某种多步骤的认知任务。这些推理模型将成为他们工作流程中的工具。”

此前的一周，DeepSeek 的出现引发了 Nvidia史上最大的市值损失，接近 6000 亿美元，引发了人们对这家芯片巨头的 AI 霸主地位的质疑。Cerebras 的解决方案直接解决了出现的两个关键问题：高级 AI 模型的计算需求和数据主权。

“如果你使用目前非常流行的DeepSeek API ，这些数据就会直接发送到中国，”王解释说。“这是一个严重的警告，[让]许多美国公司和企业……不愿意考虑[它]。”

Cerebras 的晶圆级技术如何在 AI 速度上击败传统 GPU

Cerebras 通过一种新颖的芯片架构实现了其速度优势，该架构将整个 AI 模型放在单个晶圆大小的处理器上，从而消除了困扰基于 GPU 的系统的内存瓶颈。该公司声称其实施的 DeepSeek-R1 达到或超过了 OpenAI 专有模型的性能，同时完全在美国本土运行。

这一进展代表了人工智能领域的重大转变。DeepSeek由前对冲基金高管梁文锋创立，该公司以仅相当于美国竞争对手 1% 的成本实现了复杂的人工智能推理能力，震惊了整个行业。Cerebras 的托管解决方案现在为美国公司提供了一种利用这些进步同时保持数据控制的方法。

“美国研究实验室向世界赠送这项礼物，这其实是一个美好的故事。中国人拿来并改进了它，但它有局限性，因为它在中国运行，存在一些审查问题，现在我们把它拿回来，在美国数据中心运行，没有审查，没有数据保留，”王说。

人工智能创新走向全球，美国科技领导地位面临新问题

该服务将从今天开始通过开发者预览版提供。虽然最初是免费的，但由于早期需求旺盛，Cerebras 计划实施API 访问控制。

此举正值美国立法者努力应对 DeepSeek 崛起的影响之际，这暴露了美国为保持对中国的技术优势而制定的贸易限制的潜在局限性。尽管存在芯片出口管制，但中国公司仍能实现突破性的人工智能能力，这引发了对新监管方法的呼吁。

行业分析师认为，这一发展可能会加速人工智能基础设施从依赖 GPU 的转变。“英伟达不再是推理性能的领导者，”王先生指出，基准测试显示各种专用人工智能芯片的性能更优越。“这些其他人工智能芯片公司在运行这些最新模型时确实比 GPU 更快。”

影响不仅限于技术指标。随着人工智能模型越来越多地融入复杂的推理能力，其计算需求也急剧上升。Cerebras 认为其架构更适合这些新兴工作负载，可能会重塑企业人工智能部署的竞争格局。

原创文章，作者：王浩然，如若转载，请注明出处：https://www.dian8dian.com/cerebras-cheng-wei-shi-jie-shang-zui-kuai-de-deepseek-r1

Cerebras Deepseek R1 Nvidia GPU

Like (0)

王浩然作者

0 0

Riffusion 的免费 AI 音乐平台可能成为未来的 Spotify

Previous 2025年1月31日

巧妙的架构胜过原始计算：DeepSeek 打破了“越大越好”的 AI 开发方法

Next 2025年2月2日

AI前沿

Goodnotes增加了一个人工智能，甚至可以读取和解释最糟糕的笔迹

人工智能已经非常擅长坚持与人类对话的结束，但来自数字笔记应用程序Goodnotes的一组新的人工智能功能通过阅读足够好的手写来讨论它，甚至回答有关涂鸦的问题，表演了更令人印象深刻的…

点点
2024年10月8日
000
AI前沿

2025 年为何将重新定义数据基础设施：11 位专家对主权云、爆炸式增长的数据、PaaS 等的见解

如果说 2023 年是关于生成式人工智能聊天机器人和搜索，那么2024 年则引入了代理式人工智能——能够在数字环境中规划和执行多步骤操作的工具。从Devin 的工程突破到微软对Co…

王浩然
2024年12月31日
000
AI前沿

亚马逊的 Tye Brady 讨论下一代机器人仓库

过去几年，“交付未来”活动展示了亚马逊运营的最新技术。西雅图 2023 年的活动展示了该公司药房服务和无人机送货的最新进展。今年在纳什维尔，亚马逊讨论了人工智能对其购物体验的更新…

点点
2024年10月13日
000
AI前沿

OpenAI 在多国部署 AI 代理 Operator

OpenAI 近期宣布，其先进的 AI 代理 Operator 已在多个国家正式上线。这款 AI 代理旨在简化用户在不同平台间的交互操作，通过智能技术提升用户体验。 Operato…

王浩然
2025年2月25日
000
AI前沿

IBM 研究：大多数 CEO 担心人工智能的准确性和偏见

根据 IBM 商业价值研究院关于人工智能治理的最新调查，近一半的首席执行官担心人工智能的准确性和偏见。 IBM 商业价值研究院针对人工智能治理的最新调查还发现，21% 的高管表示其…

王浩然
2024年11月8日
000
AI前沿

Zenlytic 获得 900 万美元融资，与 AI 数据分析师 Zoë 共同革新商业智能

Zenlytic是人工智能商业智能(BI) 领域的先驱，已成功筹集 900 万美元 A 轮融资，由M13领投，贝恩资本风险投资公司 ( Bain Capital Ventures …

点点
2024年9月27日
000
AI前沿

2025 年的身份管理：安全团队可通过 4 种方式解决漏洞和风险

虽然99%的企业计划在安全方面投入更多，但只有52% 的企业完全实施了多因素身份验证 (MFA)，只有41% 的企业在访问管理中遵守最小特权原则。包括民族国家、国家资助的攻击者和…

王浩然
2024年11月11日
000
AI前沿

新兴技术助力超级碗 LIX 的 7 种方式

今年的超级碗对决在费城老鹰队和堪萨斯城酋长队之间展开，物联网和新兴技术再次携手为这一盛事助力。超级碗 LIX 充满了场内场外为比赛提供动力的技术，从机器人技术和增强现实技术到增强…

王浩然
2025年2月8日
000
AI前沿

AR 的突破：微型化显示屏为主流 AR 眼镜铺平道路

多年来，增强现实 (AR) 技术一直吸引着人们的想象力，有望将数字信息与我们的物理世界无缝融合。通过将计算机生成的图像叠加到现实世界的视图上，AR 有可能彻底改变我们与环境的互动方…

点点
2024年10月6日
000
AI前沿

据称人工智能和机器人被用来欺诈性地增加音乐流量

一位美国歌手被指控利用人工智能技术和机器人操纵音乐流媒体平台，欺诈性地夸大他的流媒体统计数据并赚取数百万美元的版税。来自北卡罗来纳州的 52 岁的迈克尔·史密斯 (Michael…

点点
2024年9月18日
000
AI前沿

克服人工智能基础设施部署障碍的 5 种方法

如今，企业面临着利用人工智能作为竞争优势的巨大压力，但我们仍处于早期阶段。只有约40% 的大型企业在其业务中积极部署人工智能，但障碍使另外 40% 的企业处于探索和实验阶段。尽管人…

王浩然
2024年11月1日
000
AI前沿

杰夫·辛顿和约翰·霍普菲尔德因其在基础人工智能领域的工作获得诺贝尔物理学奖

瑞典皇家科学院宣布了2024 年诺贝尔物理学奖。杰夫·辛顿和约翰·霍普菲尔德因他们从 20 世纪 70 年代末和 80 年代初开始在人工神经网络方面所做的工作而共同分享了这一享有盛…

王浩然
2024年10月10日
000
AI前沿

赢得对抗性人工智能的战争需要从人工智能原生 SOC 开始

由于警报疲劳、高流动率和工具过时，日益复杂的多域攻击不断涌现，安全领导者正在拥抱人工智能原生的安全运营中心 (SOC) 作为防御的未来。今年，攻击者利用了仅为外围防御而设计的传统…

王浩然
2025年1月19日
000
AI前沿

OpenAI获英伟达B200最强超算，GPT-5训练无底洞，微软算力却严重不足

就在刚刚，OpenAI收到了来自英伟达的首批工程版DGX B200！此情此景，不得不让人联想到，刚刚成立的OpenAI在接收英伟达初代DGX时的画面。如今，早已物是人非。依然…

点点
2024年10月9日
000
AI前沿

Moondream 筹集 450 万美元，以证明小型 AI 模型仍能发挥作用

Moondream今天以 450 万美元的种子前融资和一项激进的主张走出了隐身模式：对于 AI 模型来说，越小越好。这家初创公司得到了Felicis Ventures、微软的 M1…

王浩然
2024年10月29日
000
AI前沿

Zillow 升级人工智能搜索，将向你展示更多你买不起的房屋

Zillow 正在升级其 AI 搜索功能，能够根据房屋或出租房屋与办公室、学校或其他兴趣点的距离来查找房屋或出租房屋。现在，您无需通过选择特定位置或过滤器来缩小搜索范围，只需输入“…

王浩然
2024年9月4日
000
AI前沿

Anthropic发布新型AI模型：思考时长任你定‌

近日，Anthropic公司推出了一款创新的AI模型，该模型能够按照用户的意愿持续思考，为用户提供更加深入和全面的回答。这款AI模型的问世，标志着人工智能技术在理解和响应用户需求方…

王浩然
2025年2月27日
000
AI前沿

如果埃隆·马斯克接管了 OpenAI，你会停止使用其 ChatGPT 和 API 吗？

人工智能领域几乎从来都不会无聊，今天也不例外：《华尔街日报》今天下午报道称，由世界首富、多家公司所有者埃隆·马斯克领导的私人投资者财团已向 OpenAI 的非营利董事会提出了974…

王浩然
2025年2月11日
000
AI前沿

Workday 收购人工智能文档平台 Evisort

Workday周二宣布，将收购人工智能合同管理平台Evisort ，收购金额未公开。 Workday集团总经理 Terrance Wampler 在一份声明中表示，Evisort …

王浩然
2024年9月19日
000
AI前沿

思科研究：公用事业公司采用人工智能实现更一体化的运营

根据思科的最新报告，近一半的公用事业公司希望人工智能将支持其运营中不可或缺的 IT 和运营技术 (OT) 功能之间的更好协作。该报告采访了 17 个国家的 145 名公用事业行业…

王浩然
2024年12月22日
000