Together AI 3.05亿美元赌注：DeepSeek-R1等推理模型正在增加而非减少GPU需求‌重写并翻译后的内容

王浩然 • 2025年2月22日下午6:00 • AI前沿 • 46 views

DeepSeek-R1刚出现时，业界普遍担忧先进推理能力的实现可能会减少对基础设施的需求。然而，事实证明情况并非如此。至少，根据Together AI的说法，DeepSeek和开源推理的兴起产生了完全相反的效果：它不仅没有减少，反而增加了对基础设施的需求。这种增加的需求进一步推动了Together AI平台和业务的增长。今日，该公司宣布完成了一轮3.05亿美元的B轮融资，由General Catalyst领投，Prosperity7联合领投。

Together AI自2023年成立以来，旨在简化企业对开源大型语言模型（LLMs）的使用。2024年，公司推出了Together企业平台，支持在虚拟私有云（VPC）和本地环境中部署AI。2025年，Together AI再次扩展其平台，增加了推理集群和代理式AI功能。公司声称，其AI部署平台拥有超过45万名注册开发者，业务年增长率达到6倍。客户包括企业和AI初创公司，如Krea AI、Captions和Pika Labs。

“我们现在服务于所有模态的模型：语言、推理、图像、音频和视频，”Together AI首席执行官Vipul Prakash告诉VentureBeat。

DeepSeek-R1对AI基础设施需求的巨大影响

DeepSeek-R1的首次亮相极具颠覆性，原因之一是它暗示了一个前沿的开源推理模型可以比专有模型使用更少的基础设施来构建和部署。然而，Prakash解释说，Together AI之所以扩大基础设施，部分原因是为了支持DeepSeek-R1相关工作负载的增加需求。“这是一个运行推理相当昂贵的模型，”他说，“它有6710亿个参数，需要分布在多个服务器上。而且，由于质量更高，通常对高端的需求也更大，这意味着你需要更多的容量。”此外，他还指出，DeepSeek-R1的请求通常持续时间更长，可能长达两到三分钟。用户对DeepSeek-R1的巨大需求进一步推动了对更多基础设施的需求。为满足这一需求，Together AI推出了一项名为“推理集群”的服务，提供从128到2000个芯片的专用容量，以最佳性能运行模型。

Together AI如何帮助企业使用推理AI

Together AI在多个特定领域看到了推理模型的使用，包括：

‌编码代理‌：推理模型有助于将大问题分解为步骤。
‌减少幻觉‌：推理过程有助于验证模型的输出，从而减少幻觉，这对于准确性至关重要的应用尤为重要。
‌改进非推理模型‌：客户正在提炼和改进非推理模型的质量。
‌实现自我改进‌：使用强化学习与推理模型相结合，允许模型递归地自我改进，而无需依赖大量人工标记的数据。

代理式AI也在推动AI基础设施需求的增加。Prakash解释说，代理式工作流中，单个用户请求会导致成千上万的API调用以完成任务，这给Together AI的基础设施带来了更多的计算需求。为支持代理式AI工作负载，Together AI最近收购了CodeSandbox，其技术提供了轻量级、快速启动的虚拟机（VM），以在Together AI云中执行任意、安全的代码，其中也驻留了语言模型。这减少了代理代码与需要调用的模型之间的延迟，提高了代理式工作流的性能。

Nvidia Blackwell芯片的影响

所有AI平台都面临着日益增长的需求。这也是Nvidia不断推出提供更高性能的新硅芯片的原因之一。Nvidia的最新产品芯片是Blackwell GPU，目前正在Together AI部署。Prakash表示，Blackwell芯片的成本比上一代高出约25%，但性能提高了一倍。配备Blackwell芯片的GB 200平台特别适合在多个InfiniBand连接的服务器上训练和推理混合专家（MoE）模型。他还指出，与小型模型相比，Blackwell芯片预计将为大型模型的推理提供更大的性能提升。

代理式AI市场的竞争态势

AI基础设施平台市场竞争激烈。Together AI既面临来自微软、AWS和谷歌等成熟云服务提供商的竞争，也面临来自Groq和Samba Nova等新兴AI专注型企业的竞争。Together AI提供全栈解决方案，包括GPU基础设施以及软件平台层。这使客户能够轻松地使用开源模型构建，或在Together AI平台上开发自己的模型。公司还专注于研究和开发针对推理和训练的优化和加速运行时。“例如，我们以每秒85个令牌的速度提供DeepSeek-R1模型，而Azure的速度为每秒7个令牌，”Prakash说，“我们为客户提供的性能和成本效益方面的差距正在不断扩大。”

原创文章，作者：王浩然，如若转载，请注明出处：https://www.dian8dian.com/together-ai-3-05-yi-mei-yuan-du-zhu-deepseekr1-deng-tui-li

Like (0)

王浩然作者

0 0

医学教育的AI飞跃：代理式检索增强生成（RAG）、开放权重大型语言模型（LLMs）和实时病例洞察如何塑造纽约大学朗格尼医学中心的新一代医生

Previous 2025年2月22日

OpenAI的ChatGPT用户激增至4亿，GPT-5即将面世‌

Next 2025年2月22日

AI前沿

美国海军陆戰队刚刚公布了ROGUE 1：其新的爆炸无人机

周二，美国海军陆战队和Teledyne FLIR Defense推出了“Rogue 1”——一种垂直起飞和降落（VTOL）神风无人机，具有一些有趣的功能：弹头可以在战场上交换，如果…

点点
2024年9月29日
000
AI前沿

谷歌推出基于Gemini的新文本嵌入模型‌

近日，谷歌在人工智能领域再度发力，正式推出了一款基于Gemini架构的全新文本嵌入模型。这一创新之举标志着谷歌在自然语言处理技术上取得了新的突破。据悉，该模型采用了先进的Gemi…

王浩然
2025年3月10日
000
AI前沿

ChatGPT 的最新功能让用户可以为其分配“Chatty”和“Gen Z”等特征

OpenAI 正在推出一种新方式，让用户定制与该公司人工智能聊天机器人ChatGPT 的互动。周五，OpenAI宣布将为 ChatGPT 的自定义指令菜单推出新的用户界面，包括自…

王浩然
2025年1月20日
000
AI前沿

据报道，谷歌正在开发一种“使用计算机的代理”人工智能系统

据报道，谷歌最早可能在 12 月预览其对 Rabbit 大型动作模型概念的看法。据该媒体采访的三位直接了解该项目的人士称，该项目的代号为“Project Jarvis”，将为用户执…

王浩然
2024年10月29日
000
AI前沿

科尔莫戈罗夫-阿诺德网络：高效且可解释的神经网络新前沿

神经网络一直处于人工智能发展的前沿，推动了从自然语言处理和计算机视觉到战略游戏、医疗保健、编程、艺术，甚至自动驾驶汽车等各个领域的发展。然而，随着这些模型在规模和复杂性方面的扩展，…

王浩然
2024年8月22日
000
AI前沿

在《Roadrunner》遭到强烈反对后，导演摩根·内维尔 (Morgan Neville) 避开了生成式人工智能

摩根·内维尔 (Morgan Neville) 执导的关于安东尼·波登的纪录片《Roadrunner》最引人注目的方面之一是内维尔使用生成式人工智能来复制波登的声音。现在回想起来…

王浩然
2024年10月14日
000
AI前沿

GitHub Spark 让你用简单的英语构建 Web 应用程序

当 GitHub Copilot 推出并开始自动完成代码行（后来是整个代码片段）时，许多人都在问：我们多久才能用自然语言描述一个应用程序，然后 Copilot 会为我们构建它？近几…

王浩然
2024年10月30日
000
AI前沿

人工智能如何增强人类在销售和营销方面的潜力

人工智能 (AI) 正在彻底改变各行各业专业人士的营销和销售方式。通过采用 AI，该领域的专业人士可以提高效率、提高成果并做出更快、更明智的决策。销售和营销的 AI 演变不仅意味着…

点点
2024年10月9日
000
AI前沿

从问题开始，沙盒，确定值得信赖的供应商——人工智能入门快速指南

77%的公司已在使用或探索使用 AI，超过 80% 的公司声称这是首要任务，领导者渴望从该技术中获得最大价值。然而，可用的解决方案数量和随之而来的大量营销信息可能会让寻找一条清晰的…

王浩然
2025年2月9日
000
AI前沿

Adobe Firefly AI 视频生成器首次亮相——迄今为止最“IP 安全”的 AI 工具？

Adobe发布新的视频生成模型，扩展其生成式 AI 功能，这标志着该公司在为专业创作者提供可在商业项目中安全使用的 AI 工具方面迈出了重要一步。该公司今天宣布，其Firefly…

王浩然
2025年2月16日
000
AI前沿

法官允许加州禁止未成年人食用成瘾性食品的禁令生效

周二晚些时候，一名联邦法官阻止了科技游说团体 NetChoice 对加州最近颁布的法律SB 976的挑战，该法律禁止公司向未成年人提供“上瘾内容”。该决定的效果是，从周三开始，除…

王浩然
2025年1月2日
000
AI前沿

在建立真正的业务关系的同时探索人工智能世界

人工智能 (AI) 的发展速度超乎人们的想象。从提高生产力到改善决策能力和创造力，工作场所中的人工智能不再是一个未来概念，而是我们日常生活中不可或缺的一部分。根据微软的 2024 …

点点
2024年9月21日
000
AI前沿

DeepMind的米开朗基罗基准：揭示长上下文LLMs的局限性

随着人工智能 (AI) 的不断发展，处理和理解长序列信息的能力变得越来越重要。人工智能系统现在用于执行复杂的任务，例如分析长文档、跟上长时间的对话以及处理大量数据。然而，许多当前模…

点点
2024年10月18日
000
AI前沿

CoreWeave创始人：在40亿美元IPO前夕，已入账4.88亿美元‌

随着科技行业的蓬勃发展，云计算领域再次迎来了一个令人瞩目的里程碑。CoreWeave，这家专注于高性能计算的云计算服务提供商，正站在40亿美元IPO（首次公开募股）的门槛上。而在此…

王浩然
2025年3月8日
000
AI前沿

Gemini Extensions 将帮助谷歌的人工智能接管你的 Android 手机

谷歌承诺其 Gemini AI 不会成为 Google Assistant 的简单聊天机器人替代品。未来几周，我们将看到这一承诺是否能实现。Gemini 扩展将允许 AI 访问更…

王浩然
2024年10月6日
000
AI前沿

Anthropics的Claude代码工具现重大漏洞，致部分系统崩溃‌

近期，人工智能领域知名初创公司Anthropics遭遇了一次技术挑战。其明星产品Claude代码工具被发现存在一个重大漏洞，该漏洞导致部分用户系统出现了严重故障，甚至无法正常使用。…

王浩然
2025年3月9日
000
AI前沿

OpenAI 将在新加坡、巴黎、布鲁塞尔开设办事处，促进全球扩张

OpenAI在 X 上的一篇文章中表示，作为公司全球扩张战略的一部分，除了现有的旧金山、伦敦、都柏林和东京办事处外，还将在纽约、西雅图、巴黎、布鲁塞尔和新加坡等多个城市开设新办事处…

王浩然
2024年10月10日
000
AI前沿

YouTube Shorts 将整合谷歌的 AI 视频模型 Veo

YouTube 周三上午举办的 Made On YouTube 活动的主要亮点是人工智能。该公司宣布，将把 Google DeepMind 的 AI 视频生成模型Veo整合到 Yo…

王浩然
2024年9月19日
000
AI前沿

谷歌的人工智能系统可能会改变我们的写作方式：InkSight 将手写笔记数字化

纸笔是百年历史的技术，如今正迎来数字化的重大升级。谷歌研究院开发出一种人工智能系统，可以准确地将手写笔记的照片转换成可编辑的数字文本，这可能会改变数百万人捕捉和保存想法的方式。新…

王浩然
2024年11月1日
000
AI前沿

xAI 凭借“Colossus”人工智能训练系统打破纪录

埃隆·马斯克的xAI推出了其破纪录的 AI 训练系统，被称为“Colossus”。马斯克透露，经过 122 天的准备，xAI 团队已成功将 Colossus 100k H100 …

点点
2024年9月4日
000

发表回复

Please Login to Comment

Together AI 3.05亿美元赌注：DeepSeek-R1等推理模型正在增加而非减少GPU需求‌重写并翻译后的内容

相关推荐

发表回复

Share To :