Cerebras宣布六大AI数据中心，每秒处理4000万令牌，或对NVIDIA构成威胁

王浩然 • 2025年3月19日下午4:00 • AI前沿 • 59 views

Cerebras大幅扩展数据中心版图，携手两大企业巨头引领AI推理服务新风尚

在人工智能（AI）市场持续蓬勃发展的背景下，Cerebras Systems，这一AI硬件领域的新兴势力，正以前所未有的速度挑战NVIDIA的霸主地位。近日，Cerebras宣布了一项重大举措：将在北美和欧洲增设六大AI数据中心，此举将使其推理能力提升至每秒超过4000万令牌，实现了20倍的增长。这一战略部署不仅彰显了Cerebras对高速AI推理市场前景的坚定信心，也预示着AI行业将迎来一场深刻变革。

六大数据中心布局全球，美国市场占据核心地位

Cerebras此次扩建的数据中心分别位于达拉斯、明尼阿波利斯、俄克拉荷马城、蒙特利尔、纽约以及法国，其中85%的推理能力将集中在美国。这一布局不仅强化了Cerebras在全球范围内的服务网络，更凸显了其对美国国内AI基础设施建设的重视。随着技术的不断进步和应用的日益广泛，AI推理能力已成为衡量企业竞争力的关键指标之一。Cerebras通过大幅提升推理速度，正致力于满足市场对更快速、更高效AI解决方案的迫切需求。

携手Hugging Face与AlphaSense，共筑AI生态新蓝图

在宣布数据中心扩建的同时，Cerebras还宣布了两项重要合作伙伴关系，分别与AI开发者平台Hugging Face和市场情报平台AlphaSense携手。通过与Hugging Face的合作，Cerebras将能够触及其庞大的开发者社区，使超过500万的开发者能够一键接入Cerebras推理服务，无需单独注册。这一集成将极大促进开源AI模型的应用与普及，特别是对于那些依赖LLama 3.3 70B等模型的开发者而言。

而与AlphaSense的合作则标志着Cerebras在金融领域的又一重大突破。AlphaSense作为广受金融服务业欢迎的市场情报平台，已选择Cerebras作为其AI加速解决方案提供商。这一转变不仅将显著提升AlphaSense的AI搜索能力，还将为其服务的众多财富100强企业带来前所未有的速度优势。据Cerebras产品营销总监James Wang介绍，Cerebras的系统已将AlphaSense的搜索速度提高了10倍，使得原本需要数秒甚至更长时间的查询现在几乎可以瞬间完成。

专注高速推理，引领AI硬件新潮流

Cerebras自成立以来便专注于高速AI推理领域，其独有的Wafer-Scale Engine（WSE-3）处理器被誉为AI推理领域的“速度之王”。据Wang介绍，Cerebras的处理器在运行AI模型时速度可比传统GPU解决方案快10至70倍。这一速度优势在AI模型向更复杂推理能力演进的背景下显得尤为重要。随着推理模型变得越来越复杂，传统GPU在处理这些任务时显得力不从心，而Cerebras的专用硬件则能够轻松应对这一挑战。

成本效益显著，挑战GPT-4等领先模型

除了速度优势外，Cerebras在成本效益方面同样表现出色。Wang指出，经过Cerebras优化的开源模型LLama 3.3 70B在智力测试中的表现与OpenAI的GPT-4不相上下，但运行成本却大幅降低。他解释说：“使用GPT-4的成本大约为每1000个令牌4.4美元，而LLama 3.3 70B的成本仅为60美分左右。如果你选择Cerebras，你的成本将降低近一个数量级，同时速度还将提高另一个数量级。”这一成本效益比无疑将对那些正在寻找更经济、更高效AI解决方案的企业产生巨大吸引力。

原创文章，作者：王浩然，如若转载，请注明出处：https://www.dian8dian.com/cerebras-xuan-bu-liu-da-ai-shu-ju-zhong-xin-mei-miao-chu-li

Like (0)

王浩然作者

0 0

Creatio发布首个内置代理型数字人才的AI原生平台

Previous 2025年3月19日

Chain of Experts（COE）：低成本高效能的大型语言模型框架

Next 2025年3月19日

AI前沿

利用人工智能代理优化公司工作流程：神话还是现实？

一个问题随着越来越多的大公司投资人工智能代理，将其视为提高运营效率的未来，越来越多的怀疑论者也开始涌现。虽然人们对这些技术的潜力感到兴奋，但许多组织发现，现实往往与炒作的程度不符…

点点
2024年11月6日
000
AI前沿

Distributional 融资 1900 万美元，用于自动化 AI 模型和应用程序测试

Distributional是由英特尔前人工智能软件总经理 Scott Clark 创立的人工智能测试平台，已完成由 Two Sigma Ventures 领投的 1900 万美元…

王浩然
2024年10月10日
000
AI前沿

医学教育的AI飞跃：代理式检索增强生成（RAG）、开放权重大型语言模型（LLMs）和实时病例洞察如何塑造纽约大学朗格尼医学中心的新一代医生

病人数据记录往往复杂且有时不完整，这意味着医生并不总能立即获得所需的所有信息。此外，医学专业人士无法跟上行业内涌现的大量病例研究、研究论文、试验和其他前沿发展。位于纽约市的纽约大学…

王浩然
2025年2月22日
000
AI前沿

ElevenLabs推出新功能：作者可在平台上自创并发布有声书‌

近期，ElevenLabs宣布了一项重大更新，允许作者在其平台上直接创建并发布有声书。这一功能为众多内容创作者提供了一个全新的发布渠道，使得他们能够更加便捷地将文字作品转化为音频形…

王浩然
2025年2月28日
000
AI前沿

什么是 AI 代理？计算机科学家解释下一波 AI 工具

与 ChatGPT 等 AI 聊天机器人互动可能很有趣，有时也很有用，但日常 AI 的下一个级别不仅仅是回答问题：AI 代理可以为您执行任务。包括OpenAI、微软、谷歌和Sal…

王浩然
2025年1月6日
000
AI前沿

英国竞争管理局认为微软与OpenAI的合作无需调查‌

近日，英国竞争管理局（UK Competition Authority）宣布，经过细致审查，该局认定微软与OpenAI之间的合作伙伴关系并未触及反垄断法的红线，因此不符合启动正式调…

王浩然
2025年3月6日
000
AI前沿

诉讼称 Character.AI 导致 14 岁男孩死亡

佛罗里达州一名 14 岁男孩自杀，据其母亲称，该男孩对该平台上的聊天机器人过于痴迷，此后Character.AI成为诉讼对象。据《纽约时报》报道，奥兰多九年级学生塞维尔·塞泽三世…

王浩然
2024年10月25日
000
AI前沿

YouTube 正在开发用于音乐和面部的 AI 检测工具

YouTube 周四宣布了一套新的 AI 检测工具，以保护包括艺术家、演员、音乐家和运动员在内的创作者，防止他们的面部和声音等肖像被复制并用于其他视频。新检测技术的一个关键组成部分…

王浩然
2024年9月8日
000
AI前沿

LLM 汽车：人机通信领域的突破

随着自动驾驶汽车 (AV) 逐渐普及，一个重大挑战仍然存在：弥合人类乘客和机器人司机之间的沟通鸿沟。尽管自动驾驶汽车在复杂道路环境中的导航方面取得了显著进步，但它们往往难以理解人类…

点点
2024年9月20日
000
AI前沿

ChatGPT for macOS：现可直接编辑代码‌

在科技日新月异的今天，ChatGPT再次为用户带来了惊喜。如今，macOS平台上的ChatGPT已经支持直接编辑代码，这一功能的加入无疑将极大地提升开发者的工作效率。 ChatGP…

王浩然
2025年3月9日
000
AI前沿

人工智能的变革者：Tsetlin 机器在降低能源消耗方面发挥的作用

人工智能 (AI)的迅速崛起已经改变了众多行业，从医疗保健和金融到能源管理等。然而，人工智能应用的增长也导致了严重的能源消耗问题。现代人工智能模型，尤其是基于深度学习和神经网络的模…

点点
2024年10月27日
000
AI前沿

OpenAI 曾是一家研究实验室——现在只是一家科技公司

OpenAI 的 11 位联合创始人中，只有包括 Sam Altman 在内的 3 人留在了公司。向投资者借钱的目的是为了获得回报。 OpenAI 成立之初就秉持着一个著名的利他…

王浩然
2024年9月30日
000
AI前沿

MetaScale利用自适应策略提升大型语言模型推理能力

重写与翻译后的内容 MetaScale利用自适应策略提升大型语言模型推理能力 ‌引言‌ 在人工智能领域，大型语言模型（LLM）的推理能力一直是研究者们关注的焦点。近期，MetaSc…

王浩然
2025年3月26日
000
AI前沿

Cerebras 与 Nvidia：新的推理工具有望实现更高的性能

人工智能硬件初创公司Cerebras创建了一种新的人工智能推理解决方案，可能与 Nvidia 为企业提供的 GPU 产品相媲美。 Cerebras Inference 工具基于该公…

AI News
2024年9月1日
000
AI前沿

训练数据提供商发布事后报告，Reflection 70B 事件仍在继续

2024 年 9 月 5 日，初创公司Hyperwrite AI（也称为 OthersideAI）的联合创始人兼首席执行官马特·舒默 (Matt Shumer) 在社交网络 X上发…

王浩然
2024年10月6日
000
AI前沿

Pegasystems 首席技术官 Don Schuerman – 访谈系列

Don Schuerman 是 Pegasystems 的首席技术官兼产品营销副总裁，负责 Pega 的平台和客户关系管理 (CRM) 应用程序。他拥有 20 年为财富 500 …

点点
2024年10月16日
000
AI前沿

Meta 因存储数亿个明文密码而付出代价

爱尔兰官员对 Meta 处以 1.01 亿美元的罚款，原因是该公司以纯文本形式存储了数亿用户密码，并向公司员工公开。 Facebook 应用程序以明文形式记录用户的密码，因为为什么…

点点
2024年9月30日
000
AI前沿

起底AIGC概念股：退潮之后，谁在裸泳？

生成式AI技术狂飙一年多以后，A股市场的「AIGC概念股」正在经历一场集体的「去泡沫」。截至9月12日收盘，相比去年的涨幅，今年以来，万得AIGC概念指数(8841660.WI)…

点点
2024年9月13日
000
AI前沿

微软的新 rStar-Math 技术升级小型模型，在数学问题上超越 OpenAI 的 o1 预览版

随着rStar-Math 的推出，微软加倍挖掘了小型语言模型 (SLM) 的潜力。rStar -Math是一种新的推理技术，可应用于小型模型，利用推理技术提高其在数学问题上的性能 …

王浩然
2025年1月10日
000
AI前沿

Zeekr 将使用 Nvidia 超级芯片；向 Waymo 交付自动驾驶出租车：CES 2025

中国高端品牌 Zeekr在CES 上发布了几项重要公告，表明其将成为自动驾驶汽车(AV) 市场中一股不容忽视的力量。首先，该公司确认将推出一款采用 Nvidia Drive…

王浩然
2025年1月12日
000