Gensparks的Super Agent：通用人工智能代理竞赛中的新星‌

王浩然 • 4天前 • AI前沿 • 26 views

在人工智能领域，通用型代理的竞争格局正日益激烈且充满野心。近日，总部位于帕洛阿尔托的初创公司Genspark推出了其名为Super Agent的快速自主系统。该系统旨在跨多个领域处理现实世界的任务，包括一些令人瞠目结舌的应用，如使用逼真的合成声音拨打餐厅电话进行预订。

随着Genspark的Super Agent问世，一场关于AI竞争的新前沿正在形成：谁将打造出首个可靠、灵活且真正实用的通用型代理？而更为紧迫的是，这对于企业来说意味着什么？

就在三周前，另一家由中国人创立的初创公司Manus因其能够协调工具和数据源以完成异步云任务（如旅行预订、简历筛选和股票分析）而备受瞩目。这些任务通常需要当前大多数代理所不具备的自主能力。而Genspark现在声称，其Super Agent在功能上更进一步。

据联合创始人Eric Jing介绍，Super Agent的构建基于三大支柱：九个不同的大型语言模型（LLMs）的协同、80多个工具以及10多个专有数据集，所有这些都在一个协调的流程中协同工作。它远远超越了传统的聊天机器人，能够处理复杂的工作流程并返回完全执行的结果。

在一次演示中，Genspark的代理规划了一次完整的五天圣地亚哥之旅，计算了景点之间的步行距离，规划了公共交通路线，并使用语音呼叫代理预订餐厅，同时处理了食物过敏和座位偏好等细节。另一项演示展示了该代理如何制作烹饪视频集锦，包括生成食谱步骤、视频场景和音频叠加。在第三项演示中，它编写并制作了一集以近期涉及与政治记者分享战争计划的Signalgate政治丑闻为主题的《南方公园》风格动画。

这些应用看似以消费者为中心，但它们实际上揭示了技术的未来发展方向——即向多模态、多步骤任务自动化迈进，模糊了创意生成与执行之间的界限。

“解决这些现实世界的问题比我们想象的要困难得多，”Jing在视频中说，“但我们对所取得的进展感到兴奋。”

Super Agent的一个引人注目的特点是，它能够清晰地可视化其思维过程，追踪它是如何通过每一步进行推理的，它调用了哪些工具，以及为什么要调用这些工具。实时观看这种逻辑展开使该系统不再像一个黑盒子，而更像是一个协作伙伴。这可能会激励企业开发者在自己的AI系统中构建类似的可追溯推理路径，从而提高应用的透明度和可信度。

此外，Super Agent还非常容易试用。其界面在浏览器中顺利启动，无需任何技术设置。Genspark允许用户无需提供个人凭据即可开始测试。相比之下，Manus仍然要求申请者加入等待列表，并披露社交媒体账户和其他私人信息，这给试验带来了不便。

早在去年11月，我们就曾报道过Genspark，当时它推出了由Claude支持的财务报告。该公司已筹集至少1.6亿美元的两轮融资，并由美国和新加坡的投资者支持。

Genspark的方法之所以脱颖而出，是因为它解决了长期存在的AI工程挑战：即大规模的工具协调。大多数当前的代理在处理超过几个外部API或工具时就会崩溃。而Genspark的Super Agent似乎在这方面做得更好，它可能通过使用模型路由和基于检索的选择来根据任务动态选择工具和子模型。

这一策略与中国苏州大学的CoTools框架中的新兴研究相呼应，该框架增强了大型语言模型（LLMs）如何使用广泛且不断演变的工具集。与以前依赖大量提示工程或严格微调的旧方法不同，CoTools保持基础模型“冻结”状态，同时训练较小的组件以高效判断、检索和调用工具。

另一个促成因素是模型上下文协议（MCP），这是一个鲜为人知但越来越被采用的标准，它允许代理在跨步骤时携带更丰富的工具和内存上下文。结合Genspark的专有数据集，MCP可能是其代理看起来比其他替代方案更“可控”的原因之一。

当然，Genspark并不是第一家推广通用代理的初创公司。上个月，由总部位于中国的Monica公司推出的Manus凭借其多代理系统引起了轰动，该系统可以自主运行如网页浏览器、代码编辑器或电子表格引擎等工具来完成多步骤任务。

Manus对开源组件（包括网页工具和如Claude这样的LLMs）的高效集成令人惊讶。尽管它没有构建专有模型堆栈，但在GAIA基准测试（一项旨在评估代理现实任务自动化的合成测试）上仍超越了OpenAI，取得了86%的分数。

然而，Genspark声称已经超越了Manus，在GAIA上获得了87.8%的分数，并且其架构包括专有组件和更广泛的工具覆盖。

与此同时，美国最大的AI公司则显得更为谨慎。微软的主要AI代理产品Copilot Studio专注于与Excel和Outlook等企业应用紧密对齐的微调垂直代理。OpenAI的Agent SDK提供了构建块，但并未推出自己功能齐全、通用的代理。亚马逊最近宣布的Nova Act则采用了以开发者为先的方法，通过SDK提供基于浏览器的原子操作，但紧密绑定在其Nova LLM和云基础设施上。

这些方法更加模块化、更安全，并且明确针对企业使用。但它们缺乏Genspark演示中所展示的雄心或自主性。

这背后的原因可能是风险规避。如果谷歌或微软的通用代理预订了错误的航班或在电话中说出了奇怪的话，那么声誉成本可能会很高。这些公司还受限于自己的模型生态系统，限制了它们在多模型协调方面进行实验的灵活性。

相比之下，像Genspark这样的初创公司则拥有自由混合搭配LLMs并快速行动的能力。

这是战略层面的问题。大多数企业并不需要通用型代理来预订晚餐或制作讽刺漫画。但它们可能很快就会需要能够处理特定领域多步骤任务的代理，如提取和格式化合规数据、协调客户入职流程或跨多种格式生成内容。

在此背景下，Genspark的工作变得更具相关性。通用代理变得越来越无缝和自主，同时它们整合了语音、内存和外部工具，就越有可能开始与传统SaaS应用和RPA平台竞争。

而且，它们正在以更轻量级的基础设施做到这一点。例如，Genspark声称其代理“极易操控”，并且可被营销人员、教师、招聘人员、设计师和分析师等使用，且几乎无需设置。

通用代理时代已不再是假设。它已经到来，并且正在快速发展。

原创文章，作者：王浩然，如若转载，请注明出处：https://www.dian8dian.com/gensparks-de-super-agent-tong-yong-ren-gong-zhi-neng-dai-li

Like (0)

王浩然作者

0 0

Meta推出Llama 4系列模型，应对DeepSeek挑战‌

Previous 5天前

DeepSeek震撼AI行业：AI的下一次飞跃或不再依赖更多数据，而是推理时的更强计算能力‌

Next 4天前

AI前沿

倾听技术用户的声音——他们引领了历史上最具颠覆性的创新

1971 年，现代互联网的前身高级研究计划局网络 (ARPANET) 拥有约 1,000 名用户。@ 符号当时还不为人所知。后来，工程师雷·汤姆林森 (Ray Tomlinson …

王浩然
2025年1月12日
000
AI前沿

RAG性能评估的新纪元：开源框架助力企业科学衡量AI效能

随着企业纷纷投入资源构建检索增强型生成（RAG）系统，一个关键问题逐渐浮现：这些系统是否真的如预期般有效工作？为了填补这一评估盲区，矢量科技（Vectara）携手滑铁卢大学的林吉米…

王浩然
1天前
000
AI前沿

IBM为五家城市可持续发展非营利组织提供人工智能支持

IBM最近宣布了一项与城市可持续发展相关的非营利组织开展的开创性合作。通过这些非营利组织参与的IBM可持续发展计划，它们将获得人工智能（AI）支持，以扩大其援助世界上最脆弱社区的使…

王浩然
2025年2月22日
000
AI前沿

了解 GE Healthcare 如何使用 AWS 构建解释 MRI 的新型 AI 模型

毫无疑问，MRI 图像非常复杂并且数据量巨大。因此，开发人员在训练大型语言模型(LLM) 进行 MRI 分析时，必须将捕获的图像切片成 2D。但这只能得到原始图像的近…

王浩然
2024年12月24日
000
AI前沿

成熟的AI要学会自己搞研究！MIT推出「科研特工

自己读论文、自己找方向、自己做实验，当代科研小吗喽。 ——别误会，我说的是AI。近日，MIT团队推出了用于科学自动化发现的多智能体系统——SciAgents。论文地址：http…

点点
2024年10月9日
000
AI前沿

许多公司不愿透露是否会遵守加州的人工智能培训透明度法

周日，加州州长加文·纽瑟姆签署了一项法案AB-2013，要求开发生成式人工智能系统的公司发布用于训练其系统的数据的高级摘要。除其他事项外，摘要必须涵盖谁拥有数据、数据是如何获得或授…

王浩然
2024年10月7日
000
AI前沿

确保 OT 环境中 AI 的使用安全

随着拥有运营技术 (OT) 的组织开始采用 AI，安全性需要成为其战略的重中之重。AI 的集成大大拓宽了攻击面 — — 这一范围已经因 IT 和 OT 的融合而扩大。大多数 OT …

点点
2024年9月6日
000
AI前沿

SambaNova 和 Gradio 让每个人都能使用高速人工智能——其工作原理如下

SambaNova Systems和Gradio推出了一项新的集成，让开发人员只需几行代码即可访问最快的 AI 推理平台之一。此次合作旨在让高性能 AI 模型更易于访问，并加快开发…

王浩然
2024年10月19日
000
AI前沿

Groq与PlayAI合作推出Dialog：让语音AI更自然、更高效

在人工智能领域，一场关于如何让机器声音更加人性化的革新正在悄然进行。近日，Groq与PlayAI携手宣布，将把PlayAI的先进文本转语音模型Dialog推向市场，而这一切都将借助…

王浩然
2025年3月29日
000
AI前沿

企业供应链需要特定领域的AI，而非通用模型：Articul8如何构建新模型，实现3倍性能提升

在企业运营中广泛实施AI的过程中，许多企业发现通用模型在处理需要深厚领域知识和顺序推理的专门工业任务时常常力不从心。虽然微调和检索增强生成（RAG）可以提供帮助，但对于像供应链这样…

王浩然
5天前
000
AI前沿

人类新视野：Anthropic科学家揭示AI的“思考”方式，发现其秘密规划并偶尔说谎‌

在人工智能领域，科学家们一直致力于探索和理解大型语言模型（LLMs）如何处理信息并做出决策。近日，Anthropic公司的一项新研究为我们揭示了这些AI系统内部工作的惊人细节，发现…

王浩然
2025年3月31日
000
AI前沿

加州禁止政治广告中使用 AI Deepfat

就在 11 月大选前几周，加州州长加文·纽瑟姆 (Gavin Newsom) 签署了三项法案，禁止在竞选广告中使用深度伪造和其他误导性的数字创建或修改内容。纽森说：“…

点点
2024年9月21日
000
AI前沿

OpenAI o3 的五大突破使其成为人工智能的转折点，同时也带来了一大挑战

2024 年年底，人工智能迎来了清算，业内人士担心，人工智能向更智能方向发展的速度正在放缓。但 OpenAI上周刚刚发布的 o3 模型引发了新一轮的兴奋和争论，并表明 2025 年…

王浩然
2024年12月30日
000
AI前沿

Nous Research 正在使用分布在互联网上的机器训练人工智能模型

名为Nous Research的人工智能研究团队目前正在快速发展的生成人工智能领域做一些独特的事情（至少据我所知）：Nous 正在使用分布在互联网和世界各地的机器对一个新的 150…

王浩然
2024年12月3日
000
AI前沿

一种新的计算模型可以更准确地预测抗体结构

利用该模型，研究人员或许能够识别出可针对多种传染病的抗体药物。通过采用被称为大型语言模型的人工智能模型，研究人员在根据蛋白质序列预测其结构方面取得了巨大进步。然而，这种方法对抗体…

王浩然
2025年1月3日
000
AI前沿

科技领袖对 DeepSeek 的快速崛起做出回应

如果你还没听说过，那么现在城里出现了一颗新的人工智能明星：DeepSeek，香港量化分析公司 High-Flyer Capital Management 的子公司，本周早些时候发布…

王浩然
2025年1月25日
000
AI前沿

人工智能的变革者：Tsetlin 机器在降低能源消耗方面发挥的作用

人工智能 (AI)的迅速崛起已经改变了众多行业，从医疗保健和金融到能源管理等。然而，人工智能应用的增长也导致了严重的能源消耗问题。现代人工智能模型，尤其是基于深度学习和神经网络的模…

点点
2024年10月27日
000
AI前沿

Anthropic 呼吁对人工智能进行监管以避免灾难

Anthropic指出了人工智能系统的潜在风险，并呼吁制定完善的监管措施，以避免潜在的灾难。该组织认为，有针对性的监管对于充分利用人工智能的优势并减轻其风险至关重要。随着人工智能…

点点
2024年11月4日
000
AI前沿

ChatGPT 集成如何与 Apple Intelligence 协同工作

周三，借助新发布的 iOS 18.2、iPadOS 18.2 和 macOS Sequoia 15.2 更新，开发人员首次体验了 Apple Intelligence 的 Chat…

王浩然
2024年10月25日
000
AI前沿

在 Midjourney 之前，有 NightCafe — 而且它现在还在营业

图像生成的 OG 是成功的，只是少了一些审核挑战艾丽·拉塞尔 (Elle Russell) 是位于澳大利亚凯恩斯的NightCafe的联合创始人，该公司提供一套人工智能艺术创作工…

王浩然
2024年9月1日
000

发表回复

Please Login to Comment

Gensparks的Super Agent：通用人工智能代理竞赛中的新星‌

相关推荐

发表回复

Share To :