SambaNova 和 Gradio 让每个人都能使用高速人工智能——其工作原理如下

王浩然 • 2024年10月19日下午6:00 • AI前沿 • 99 views

SambaNova Systems和Gradio推出了一项新的集成，让开发人员只需几行代码即可访问最快的 AI 推理平台之一。此次合作旨在让高性能 AI 模型更易于访问，并加快开发人员和企业采用人工智能的速度。

Gradio 机器学习增长主管 Ahsen Khaliq 在接受 VentureBeat 采访时表示： “这种集成让开发人员可以轻松地从SambaNova 游乐场复制代码，只需几行代码即可在几分钟内运行Gradio Web 应用程序。借助 SambaNova Cloud 的超快速推理功能，这意味着开发人员和最终用户都能获得出色的用户体验。”

SambaNova-Gradio 集成使用户能够使用 Gradio 的功能创建由 SambaNova 的高速 AI 模型驱动的 Web 应用程序gr.load()。开发人员现在可以快速生成连接到 SambaNova 模型的聊天界面，从而更轻松地使用高级 AI 系统。

超越 GPU：AI 处理中数据流架构的兴起

SambaNova 是一家由软银和贝莱德支持的硅谷初创公司，该公司凭借其数据流架构芯片在人工智能硬件领域掀起了波澜。这些芯片旨在超越传统 GPU 来处理人工智能工作负载，该公司声称提供“世界上最快的人工智能推理服务”。

SambaNova 的平台可以以每秒 132 个令牌的速度全精度运行 Meta 的Llama 3.1 405B 模型，这一速度对于希望大规模部署 AI 的企业来说尤为重要。

随着人工智能基础设施市场升温，SambaNova、Groq和Cerebras等初创公司正在挑战Nvidia在人工智能芯片领域的主导地位。这些新进入者专注于推理——人工智能的生产阶段，模型根据训练生成输出——预计这将成为一个比模型训练更大的市场。

从代码到云：简化人工智能应用程序开发

对于开发人员来说，SambaNova-Gradio 集成提供了一个无摩擦的切入点来尝试高性能 AI。用户可以访问 SambaNova 的免费套餐，将任何受支持的模型打包到 Web 应用程序中，并在几分钟内自行托管。这种易用性反映了旨在简化 AI 应用程序开发的最新行业趋势。

该集成目前支持 Meta 的Llama 3.1 系列模型，包括海量 405B 参数版本。SambaNova 声称是唯一一家以全 16 位精度高速运行此模型的提供商，这种保真度水平对于需要高精度的应用（例如医疗保健或金融服务）尤其有吸引力。

人工智能的隐性成本：驾驭速度、规模和可持续性

虽然这种集成使高性能人工智能更加容易实现，但人们对正在进行的人工智能芯片竞争的长期影响仍然存在疑问。随着各家公司竞相提供更快的处理速度，人们对能源使用、可扩展性和环境影响的担忧也与日俱增。

虽然关注每秒令牌数等原始性能指标很重要，但可能会掩盖人工智能部署中的其他关键因素。随着企业将人工智能融入其运营，他们需要在速度与可持续性之间取得平衡，同时考虑总拥有成本，包括能源消耗和冷却要求。

此外，支持这些新型 AI 芯片的软件生态系统将极大地影响它们的采用。尽管 SambaNova 和其他公司提供了强大的硬件，但Nvidia 的 CUDA 生态系统凭借其众多优化库和工具保持优势，许多 AI 开发人员已经熟知这些库和工具。

随着人工智能基础设施市场的不断发展，像 SambaNova-Gradio 这样的合作可能会变得越来越普遍。这些合作有可能促进这一有望全面改变行业的领域的创新和竞争。然而，真正的考验在于这些技术如何转化为现实世界的应用，以及它们是否能够兑现让所有人都能获得更便捷、更高效、更强大的人工智能的承诺。

原创文章，作者：王浩然，如若转载，请注明出处：https://www.dian8dian.com/sambanova-he-gradio-rang-mei-ge-ren-dou-neng-shi-yong-gao

Like (0)

王浩然作者

0 0

小而强大：H2O.ai 的新 AI 模型在文档分析领域挑战科技巨头

Previous 2024年10月19日

Salesforce 首席执行官 Marc Beinoff 抨击 Microsoft Copilot 为“Clippy 2.0”

Next 2024年10月19日

AI前沿

非营利组织加入伊隆·马斯克的行列，阻止 OpenAI 向营利性转型

Encode 是一家非营利组织，也是加利福尼亚州命运多舛的 SB 1047人工智能安全法案的共同发起人，该组织已请求允许提交一份法庭之友陈述，以支持埃隆·马斯克的禁令，阻止 Ope…

王浩然
2024年12月29日
000
AI前沿

生成式AI重塑电信行业：2025年世界移动通信大会展望

一、引言电信行业正经历着前所未有的变革，这主要得益于数据消费量的激增、5G及下一代网络的广泛部署以及客户期望的不断提升。在这场变革中，生成式AI（Generative AI）正成…

王浩然
2025年3月14日
000
AI前沿

DeepSeek 的新 AI 模型似乎是迄今为止最好的“公开”挑战者之一

中国的一个实验室创建了迄今为止最强大的“开放式”人工智能模型之一。该模型DeepSeek V3由人工智能公司 DeepSeek 开发，并于周三根据宽松的许可证发布，允许开发人员下…

王浩然
2024年12月28日
000
AI前沿

DeepSeek 有助于加速威胁检测，但同时也引发了国家安全担忧

DeepSeek 及其 R1 模型不会浪费任何时间来实时重写网络安全 AI 规则，从初创公司到企业提供商等所有公司都在本月试行集成到他们的新模型中。 R1 是在中国开发的，基于纯强…

王浩然
2025年2月3日
000
AI前沿

Salesforce 发现，93% 的 IT 领导者看到了 AI 代理的价值，但难以实现

每个人都在谈论人工智能代理。但到目前为止，很多都还只是说说而已。 Salesforce 表示，这种情况将在 2025 年发生改变——人工智能代理终于成为现实。根据其集成…

王浩然
2025年2月4日
000
AI前沿

开放权重模型的兴起：阿里巴巴的 Qwen2 如何重新定义 AI 能力

人工智能 (AI)已经从早期基于基本规则的系统和简单的机器学习算法发展到如今的水平。如今，世界正在进入人工智能的新时代，而推动这一时代发展的是开放权重模型这一革命性概念。与具有固定…

点点
2024年10月11日
000
AI前沿

美国版权局称，人工智能生成的内容可受版权保护——只要人类参与或编辑

美国版权局负责管理政府对电影、电视节目、小说、艺术、音乐甚至软件等人类创作的作品的版权保护，该局在今天发布的重要且有用的更新中澄清说，某些形式的人工智能生成内容实际上可以获得版权保…

王浩然
2025年2月4日
000
AI前沿

Uplimit：以AI赋能企业培训，同时培训千名员工

在数字化时代，企业面临着前所未有的挑战和机遇。为了保持竞争力，企业必须不断提升员工的技能和知识。然而，传统的企业培训方式往往效率低下，难以满足大规模、快速培训的需求。近日，Upli…

王浩然
2025年4月4日
000
AI前沿

如何将 OpenAI 的 ChatGPT 高级语音模式映射到 iPhone 操作按钮

我必须坦白：尽管我职业生涯的大部分时间都是一名科技记者，并且一直热衷于接受或至少测试最新、最伟大的个人技术，但我从未发现语音助手对我来说是有用的。部分原因在于这项技术迄今为止确实…

王浩然
2025年1月4日
000
AI前沿

DeepMind 的新推理时间缩放技术提高了 LLM 中的规划准确性

推理时间扩展是2025 年人工智能的一大主题，人工智能实验室正在从不同角度对其进行攻克。谷歌 DeepMind 在其最新研究论文中引入了“思维进化”的概念，这是一种优化大型语言模型…

王浩然
2025年1月23日
000
AI前沿

EDR 中的人机合作：利用人工智能增强网络安全团队

随着网络攻击越来越频繁和复杂，公司难以跟上。技术精湛的安全团队日夜工作，以发现和阻止数字入侵者，但这往往让人觉得是一场必败之战。黑客似乎总是占上风。然而，隧道尽头还是有曙光的。新…

点点
2024年10月5日
000
AI前沿

SLK Software 首席执行官 Ajay Kumar – 访谈系列

Ajay Kumar 是SLK Software的首席执行官。Ajay 热衷于为客户带来积极影响，同时领导 SLK 所有垂直领域的损益表。作为行业资深人士，Ajay 具有创业信念，…

点点
2024年10月27日
000
AI前沿

Emily Popson，CallRail 增长营销副总裁 – 访谈系列

Emily Popson 是CallRail的增长营销副总裁，负责领导需求生成、网站优化、客户营销和内容营销团队。Popson 自己之前也是一家小企业主，她热衷于让即使是最小的团…

点点
2024年10月17日
000
AI前沿

Manus：来自中国的新一代AI代理系统，被誉为第二个“DeepSeek时刻”

引言在人工智能（AI）领域，每一次技术创新都可能引发行业地震。最近，一款名为Manus的AI代理系统在中国横空出世，并迅速在全球范围内引起了广泛关注。这款被誉为中国第二个“Dee…

王浩然
2025年3月19日
000
AI前沿

网站建设者 Squarespace 表示正在通过策划和品味来训练其人工智能工具

生成式人工智能工具能帮助人们建立更好的网站吗？还是只会让网络充斥着垃圾信息？Squarespace 最近推出了Design Intelligence，这是一款充满生成式人工智能工具…

王浩然
2024年10月8日
000
AI前沿

临床环境中的人工智能：了解护士的怀疑态度并找到前进的方向

由于普遍的职业倦怠和劳动力短缺，不断变化的医疗保健领域一直在寻找“下一个大事件”来支持劳动力赋能，而人工智能目前是领先的竞争者。人工智能在临床环境中的应用越来越普遍，并且将继续存在…

点点
2024年10月27日
000
AI前沿

对抗人工智能“永动机”的不同方法

TechCrunch Disrupt 2024的人工智能舞台以一场关于打击虚假信息的小组讨论开场，气氛热烈但富有建设性。但在充满尊重和赞同的激烈意见交流中，三位小组成员都对社交媒体…

王浩然
2024年10月31日
000
AI前沿

亚马逊推出用于生成文本、图像和视频的 Nova AI 模型系列

作为世界上最大的科技公司之一，亚马逊在正在进行的生成式人工智能竞赛中的地位主要集中在构建其开发工具和平台上，以及为初创公司 Anthropic 提供大量资金。但现在情况已不再如此…

王浩然
2024年12月4日
000
AI前沿

合成数据有其局限性——为什么人类来源的数据可以帮助防止人工智能模型崩溃

天哪，科技界的形势瞬息万变。就在两年前，人工智能还被誉为“统治一切的下一个变革性技术”。现在，人工智能非但没有达到天网的水平并统治世界，反而在逐渐退化。人工智能曾是新智能时代的…

王浩然
2024年12月16日
000
AI前沿

OpenAI 招募微软副总裁，加剧 AI 人才争夺战

Sebastien Bubeck 曾任微软生成式人工智能副总裁

点点
2024年10月22日
000