Together AI 有望通过私有云企业 AI 平台实现更快的推理速度和更低的成本

王浩然 • 2024年9月24日下午2:00 • AI前沿 • 92 views

在公共云中运行人工智能可能会给企业带来许多有关数据隐私和安全的担忧。

这就是为什么一些企业会选择在私有云或本地环境中部署 AI。Together AI是寻求解决挑战的供应商之一，这些挑战使企业能够以经济高效的方式在私有云中部署 AI。该公司今天宣布推出 Together Enterprise Platform，支持在虚拟私有云 (VPC) 和本地环境中部署 AI。

Together AI 于 2023 年首次亮相，旨在简化企业对开源 LLM 的使用。该公司已经拥有一个全栈平台，使企业能够在自己的云服务上轻松使用开源 LLM。新平台将 AI 部署扩展到客户控制的云和本地环境。Together Enterprise Platform 旨在解决采用 AI 技术的企业的关键问题，包括性能、成本效益和数据隐私。

Together AI 首席执行官 Vipul Prakash 说：“随着 AI 工作负载的扩大，效率和成本对公司来说很重要，他们也非常关心数据隐私。”“企业内部也有完善的隐私和合规政策，这些政策已经在自己的云设置中实施，公司也关心模型所有权。”

如何利用 Together AI 降低私有云企业 AI 成本

Together Enterprise Platform 的主要承诺是组织可以在自己的私有云部署中管理和运行 AI 模型。

这种适应性对于已经在 IT 基础设施上投入大量资金的企业来说至关重要。该平台通过在私有云中工作并允许用户扩展到 Together 云来提供灵活性。

Together Enterprise 平台的一个主要优势是它能够显著提高 AI 推理工作负载的性能。

Prakash 表示：“我们通常能够将推理性能提高两到三倍，并将用于推理的硬件数量减少 50%。这为企业节省了大量成本，并增加了生产更多产品、构建更多模型和推出更多功能的容量。”

性能提升是通过优化软件和硬件利用率的组合来实现的。

Prakash 解释说：“我们在如何安排和组织 GPU 上的计算以获得最大利用率和最低延迟方面有很多算法技巧。我们在推测解码方面做了很多工作，它使用一个小模型来预测更大的模型会产生什么，从而减少了计算密集型模型的工作量。”

灵活的模型编排和混合代理方法

Together Enterprise 平台的另一个关键特性是它能够在单个应用程序或工作流中协调多个 AI 模型的使用。

Prakash 表示：“我们在企业中看到的情况是，他们通常使用不同模型的组合——开源模型、定制模型和来自不同来源的模型。Together 平台可以协调所有这些工作，根据特定时间对特定功能的需求来扩大或缩小模型。”

组织可以通过多种不同的方式来协调模型以使其协同工作。一些组织和供应商将使用LangChain等技术将模型组合在一起。另一种方法是使用模型路由器（如 Martian 构建的路由器）将查询路由到最佳模型。SambaNova 使用专家组合模型，将多个模型组合在一起以获得最佳结果。

Together AI 正在使用一种不同的方法，它称之为“混合代理”。Prakash 表示，这种方法将多模型代理 AI 与可训练系统相结合，以实现持续改进。它的工作方式是使用“较弱”的模型作为“提议者”——它们各自对提示做出响应。然后使用“聚合器”模型将这些响应组合在一起，从而产生更好的整体答案。

“我们是一个计算和推理平台，我们对代理 AI 工作流程非常感兴趣，”他说。“在接下来的几个月里，您将从 Together AI 中看到更多关于我们围绕它所做的事情。”

原创文章，作者：王浩然，如若转载，请注明出处：https://www.dian8dian.com/together-ai-you-wang-tong-guo-si-you-yun-qi-ye-ai-ping-tai

AI GPU LLM Together AI VPC 私有云

Like (0)

王浩然作者

0 0

ChatGPT 的资源需求正在失控

Previous 2024年9月24日下午1:00

Duolingo 评论：你能达到 100% 流利程度吗？我的经验

Next 2024年9月24日下午3:00

AI前沿

科技行业巨头敦促欧盟简化人工智能监管

Meta牵头发表了一封公开信，呼吁欧盟紧急改革人工智能监管规定。这封信得到了爱立信、SAP和 Spotify 等 50 多家知名公司的支持，并以广告形式刊登在《金融时报》上。这些…

点点
2024年9月20日
000
AI前沿

Puppygraph 加快了 LLM 获取图形数据洞察的速度

随着企业继续在高级分析和大型语言模型(LLM)方面投入大量资金，图形技术已成为设置数据堆栈最受欢迎的方法之一。它允许用户了解数据集中的复杂关系，而这些关系在传统关系数据库中通常并不…

王浩然
2024年11月9日
000
AI前沿

微软的 AI 生态系统如何胜过 Salesforce 和 AWS

人工智能代理是一种自主系统，旨在执行通常需要人类参与的任务。通过使用高级算法，这些代理可以处理各种功能，从回答客户查询到预测业务趋势。这种自动化不仅简化了重复流程，还使人类工作者能…

王浩然
2024年12月26日
000
AI前沿

超越基准：DeepSeek-R1 和 o1 在实际任务中的表现如何

DeepSeek-R1无疑引起了很多兴奋和担忧，尤其是对于 OpenAI 的竞争对手模型 o1。因此，我们在几个简单的数据分析和市场研究任务上对它们进行了并排比较测试。为了让这…

王浩然
2025年2月2日
000
AI前沿

ConverzAI 获 1600 万美元融资，为企业带来 30% 效率提升

总部位于华盛顿州雷德蒙德的初创公司ConverzAI是一家人工智能招聘自动化提供商，该公司在A 轮融资中筹集了 1600 万美元，以帮助其推动产品创新并扩大市场范围。此轮融资由 …

王浩然
2025年2月12日
000
AI前沿

Perplexity 称其目前每周处理 1 亿次搜索查询

Perplexity 首席执行官 Aravind Srinivas表示，该人工智能搜索引擎目前每周执行 1 亿次查询。按月推算，大约有 4 亿次查询，高于7 月份的 2.5 亿次查…

王浩然
2024年10月26日
000
AI前沿

用AI“创造”蛋白质，「分子之心」获数亿元A轮融资

AI蛋白质设计平台公司「分子之心」近日完成数亿元A轮融资，由谢诺投资、深创投联合领投，商汤国香资本、久奕投资跟投。本轮融资将用于进一步扩大复合型人才团队，深入完善AI蛋白质基础大模…

点点
2024年9月13日
000
AI前沿

Appen 首席执行官 Ryan Kolln – 访谈系列

Ryan Kolln是Appen的首席执行官兼董事总经理。Ryan 拥有 20 多年的全球技术和电信经验，对 Appen 的业务和 AI 行业有着深刻的理解。他的职业生涯始于一名…

点点
2024年10月23日
000
AI前沿

企鹅出版社在其图书中添加了“禁止为人工智能抓取内容”页面

据《书商》报道，出版巨头企鹅兰登书屋将修改其所有图书版权页上的文字，明确禁止将其作品用于训练人工智能系统，以坚决反对科技公司未经授权使用其作者的作品。这与其他大型出版商有着显著的…

王浩然
2024年10月20日
000
AI前沿

Crogl携3000万美元资金，推出面向安全分析师的AI版“钢铁侠”战衣‌

近日，Crogl公司凭借其获得的3000万美元资金支持，正式揭晓了一款专为安全分析师打造的全新AI辅助系统，形象地被称为“AI版钢铁侠战衣”。这款创新产品的推出，标志着Crogl在…

王浩然
2025年3月7日
000
AI前沿

这是我见过的最奇怪的游戏笔记本电脑

宏碁在IFA 2024上推出了一些非常有趣的产品。该公司发布了 Project DualPlay，这是一款笔记本电脑概念产品，其中隐藏着一些有趣的技巧。合上盖子时，它是一种相对标准…

王浩然
2024年9月5日
000
AI前沿

超级马里奥成AI新基准测试工具‌

近年来，人工智能（AI）领域的发展日新月异，各类基准测试工具层出不穷，用于评估AI模型的性能。而近日，一个令人意想不到的角色——超级马里奥，竟也加入了这一行列，成为衡量AI能力的新…

王浩然
2025年3月5日
000
AI前沿

Meta 将发布重大 WhatsApp AI 更新

想象一下这样一个世界：消息应用不仅仅是通讯工具，更是改善日常生活的强大助手。消息平台不再只是简单的文本交流。它们已经发展成为使用人工智能 (AI) 来提高生产力和沟通能力的强大工具…

王浩然
2024年8月26日
000
AI前沿

谷歌的 Gemini AI 打破了视觉处理的规则——这对你来说意味着什么

谷歌的Gemini AI悄然颠覆了人工智能领域，实现了几乎没人认为可能的里程碑：实时同时处理多个视觉流。这项突破性技术让 Gemini 不仅能观看实时视频，还能同时分析静态图像。…

王浩然
2025年1月15日
000
AI前沿

Nous Research 正在使用分布在互联网上的机器训练人工智能模型

名为Nous Research的人工智能研究团队目前正在快速发展的生成人工智能领域做一些独特的事情（至少据我所知）：Nous 正在使用分布在互联网和世界各地的机器对一个新的 150…

王浩然
2024年12月3日
000
AI前沿

OpenAI发布迄今最大AI模型GPT 4.5 Orion‌

全球领先的AI研究机构OpenAI，近日正式揭晓了其最新的研究成果——GPT 4.5 Orion。这款AI模型代表了OpenAI在人工智能领域的又一重大突破，是迄今为止规模最大、能…

王浩然
2025年3月2日
000
AI前沿

AI驱动的更加个性化的Siri被推迟发布‌

近期，苹果公司宣布了一个令人意外的消息：原定于近期推出的AI驱动的更加个性化的Siri版本将延期发布。这一决定引发了广泛关注和讨论。据悉，新款Siri在个性化方面进行了大幅提升。…

王浩然
2025年3月10日
000
AI前沿

xAI 凭借“Colossus”人工智能训练系统打破纪录

埃隆·马斯克的xAI推出了其破纪录的 AI 训练系统，被称为“Colossus”。马斯克透露，经过 122 天的准备，xAI 团队已成功将 Colossus 100k H100 …

点点
2024年9月4日
000
AI前沿

OpenAI 未能在 2025 年之前提供其承诺的退出工具

早在5 月份，OpenAI 就表示正在开发一款工具，让创作者可以指定他们希望自己的作品如何纳入或排除在其 AI 训练数据中。但 7 个月过去了，这项功能仍未面世。 OpenAI 当…

王浩然
2025年1月2日
000
AI前沿

Google Gemini：你需要了解的有关生成式 AI 模型的一切

谷歌正试图利用其旗舰级生成式 AI 模型、应用和服务套件 Gemini 引起轰动。但 Gemini 是什么？如何使用它？它与其他生成式 AI 工具（如 OpenAI 的ChatGP…

王浩然
2024年9月12日
000