推理框架 Archon 有望加快 LLM 进程，且无需额外成本

王浩然 • 2024年10月3日上午8:00 • AI前沿 • 276 views

斯坦福大学扩展智能实验室的研究人员介绍了一种新的推理框架，可以帮助大型语言模型 (LLM) 更快地处理潜在的响应。

该框架 Archon 使用推理时间架构搜索 (ITAS) 算法来提高 LLM 性能，而无需额外训练。它与模型无关，开源，并且设计为大型和小型模型的即插即用。

你准备好迎接人工智能代理了吗？

Archon 理想情况下可以帮助开发人员使用多种推理时间技术设计 AI 模型系统，以减少确定响应所需的模型数量。Scaling Intelligence Lab 表示，像 Archon 这样的技术将有助于降低与构建模型和推理相关的成本。随着 LLM 开发转向更大的参数或更高级的推理，尽管像 OpenAI 这样的公司预计价格会更实惠，但成本可能会增加。

据研究人员介绍，Archon 可以自动设计架构来改善任务泛化能力，使模型能够执行最初训练任务以外的任务。

研究人员在论文中表示：“我们的 Archon 框架和 ITAS 算法分别从神经架构和神经架构搜索中汲取灵感。Archon由多层 LLM 构成，其中同一层中的模型并行运行，但每个模型随后按顺序运行。”

这些层执行不同的推理时间技术，“要么通过生成和融合来转换候选响应的数量（如线性变换），要么减少候选响应的数量以提高质量（如非线性）”。

Archon在 MT-Bench、Arena-Hard-Auto、Alpaca-2.0 Eval、MixEval、MixEval Hard、MATH、CodeContests 等基准测试中，比GPT-4o和Claude 3.5 Sonnet高出 15.1 个百分点；在开源 LLM 中，Archon 的表现比它们高出 11.2 个百分点。

Archon 组件

ITAS 算法由几个 LLM 组件组成，可以执行推理时间技术。

第一个组件是生成器，它为模型创建可能的答案。第二个组件 Guser 将获取这些响应并将它们组合成一个。例如，如果向模型提出的问题是想知道法国的首都，融合器将获取生成的响应“法国首都是巴黎”，“法国在欧洲”，并将其转换为“法国的首都是巴黎，法国是欧洲国家。”

接下来，Archon 转到 Ranker 组件，该组件对最佳答案进行排名。Critic 组件评估排名后的答案，以确定它们是好是坏。Verifier 检查逻辑性和正确性，然后转到 Unit Test Generator 和 Evaluator，后者进行小测试以查看响应是否有效并检查测试结果。

研究人员表示，通过以这种方式构建 Archon，该框架可以更快地提高 LLM 的响应质量，而无需进行额外的微调。

Archon 的局限性

到目前为止，Archon 框架最适合用于具有 70B 参数的 LLM，或者更像Meta 的 Code Llama 70B，因此目前很难指出大多数 LLM。研究人员表示，大部分挑战来自于较小的模型由于上下文窗口较小而遵循指令的能力有限。

论文指出：“当我们使用仅有70 亿个开源模型的Archon 架构时，性能显著下降了 16%。”

使用 Archon 框架的小型模型比单圈模型落后 15.7%。

斯坦福实验室还表示，Archon“不适合那些喜欢单个 LLM 调用延迟的任务”，比如聊天机器人。由于该框架执行不同的操作，因此它会进行多次 LLM 调用，因此单个问答查询不会从其功能中受益。Archon 可能更适合涉及复杂指令的任务，例如解方程、编程，甚至是复杂的客户服务问题。

尽管存在局限性，Archon 背后的研究人员表示，他们希望它可以加速高性能模型的开发，而不需要更多的推理和训练资本。

原创文章，作者：王浩然，如若转载，请注明出处：https://www.dian8dian.com/tui-li-kuang-jia-archon-you-wang-jia-kuai-llm-jin-cheng-qie

Like (0)

王浩然作者

0 0

DeepMind 的 SCoRe 表明，法学硕士可以利用他们的内部知识来纠正错误

Previous 2024年10月2日下午10:00

Mostly AI 的合成文本工具可以解锁企业电子邮件和对话，用于 AI 训练

Next 2024年10月3日上午9:00

AI前沿

人工智能不断从新的经验中学习，不会忘记过去

我们的大脑在不断学习。那家新开的三明治熟食店很棒。那家加油站？以后最好别去那里。此类记忆会重新连接大脑中支持新学习的区域。在睡眠期间，前一天的记忆会被转移到大脑的其他部位进行长期…

点点
2024年9月3日
000
AI前沿

倾听技术用户的声音——他们引领了历史上最具颠覆性的创新

1971 年，现代互联网的前身高级研究计划局网络 (ARPANET) 拥有约 1,000 名用户。@ 符号当时还不为人所知。后来，工程师雷·汤姆林森 (Ray Tomlinson …

王浩然
2025年1月12日
000
AI前沿

Noma 为企业 AI 解决方案提供从数据存储到部署的安全保障

随着 2024 年接近尾声，企业技术的现状是，各种规模和领域的公司都热衷于利用生成性 AI 应用程序中的数据来改善内部（面向员工）或外部（面向客户/合作伙伴）流程。然而，确保安全…

王浩然
2024年11月3日
000
AI前沿

开源开发者：以智慧与决心对抗AI爬虫

在数字世界的广袤疆域中，一场无声的战役正在悄然上演。这场战役的主角是开源开发者，他们正以前所未有的智慧和决心，对抗着日益猖獗的AI爬虫。这些爬虫，利用人工智能技术，无孔不入地搜集着…

王浩然
2025年3月28日
000
AI前沿

埃隆·马斯克的 xAI 为 Grok 添加了图像理解功能

埃隆·马斯克旗下的 xAI 为其 Grok AI 模型添加了图像理解功能。这意味着他的社交平台 X 上的付费用户可以访问 AI 聊天机器人，上传图像并向 AI 询问有关该图像的问题…

王浩然
2024年10月29日
000
AI前沿

LlamaIndex推出构建非结构化数据代理的云服务‌

在数字化转型的浪潮中，企业对于非结构化数据的处理能力日益成为竞争的关键。为了满足这一需求，LlamaIndex近日宣布推出了一项创新的云服务，旨在帮助企业轻松构建和管理非结构化数据…

王浩然
2025年3月5日
000
AI前沿

ChatGPT并非唯一用户量激增的聊天机器人‌

在科技日新月异的今天，人工智能（AI）的应用场景正以惊人的速度扩展。聊天机器人，作为AI技术的重要分支，正逐渐成为我们日常生活中不可或缺的一部分。提到聊天机器人，ChatGPT无疑…

王浩然
2025年4月2日
000
AI前沿

人工智能视觉搜索登陆 iPhone

该公司在周一的 Apple Event 2024 上宣布，视觉搜索即将登陆 iPhone，由苹果的 AI 功能套件 Apple Intelligence 提供支持。相机控制是iP…

王浩然
2024年9月10日
000
AI前沿

DeepSeek V3 在 Mac Studio 上的惊人表现：每秒 20 个标记，OpenAI 的噩梦？

在人工智能领域，技术的飞速发展正不断推动着边界的拓展。最近，一款名为 DeepSeek V3 的深度学习模型在 Mac Studio 上的表现引发了广泛关注。据悉，DeepSeek…

王浩然
2025年3月25日
000
AI前沿

OpenAI推出全新工具套件，助力企业高效构建AI代理

在人工智能（AI）技术日新月异的今天，OpenAI再次走在行业前沿，为帮助企业更好地利用AI技术，推出了全新的工具套件。这一工具套件旨在简化AI代理的构建过程，使更多企业能够轻松驾…

王浩然
2025年3月13日
000
AI前沿

OpenAI 计划为其。o1“推理”模型注册商标

OpenAI 已为其最新 AI 模型o1提交了商标申请，以保护其知识产权。周二，OpenAI 向美国专利商标局 (USPTO) 提交了文件，注册“OpenAI o1”商标。有趣的…

王浩然
2024年11月28日
000
AI前沿

Oleksandr (Sasha) Strozhemin，Trinetix 联合创始人兼首席执行官 – 访谈系列

Oleksandr (Sasha) Strozhemin 是Trinetix的联合创始人兼首席执行官。Trinetix 是一家全球性科技公司，为财富 500 强企业和在金融、专业服…

点点
2024年8月30日
000
AI前沿

OpenAI 正在资助“人工智能道德”研究

OpenAI 正在资助能够预测人类道德判断的算法的学术研究。在提交给美国国税局的文件中，OpenAI 的非盈利组织 OpenAI Inc. 披露，它向杜克大学的研究人员提供了一项…

王浩然
2024年11月30日
000
AI前沿

Cybord 获得 870 万美元 A 轮融资，通过可追溯性革新电子制造业

Cybord是一家在电子制造领域处于领先地位的视觉 AI 技术公司，该公司在 A 轮融资中筹集了 870 万美元。此次融资由 Capri Ventures 领投，Ocean Azu…

点点
2024年9月18日
000
AI前沿

黑客诱骗 ChatGPT 泄露自制炸弹的详细说明

如果你要求 ChatGPT 帮助你制作一个自制的化肥炸弹，类似于1995 年俄克拉荷马城恐怖爆炸案中使用的炸弹，聊天机器人会拒绝。 “我无法提供帮助，”ChatGPT 在周二的一…

王浩然
2024年9月14日
000
AI前沿

ApertureData 使用多模式数据为企业提供 10 倍速度提升

数据是人工智能的圣杯。从敏捷的初创公司到全球企业集团，世界各地的组织都在投入数十亿美元来调动数据集，以打造高性能的人工智能应用程序和系统。但即使付出了这么多努力，现实情况是，访问…

王浩然
2024年10月15日
000
AI前沿

语言过度：SLM 如何打败规模更大、资源密集型的同类

ChatGPT 公开发布两年后，各行各业的公司都希望利用大型语言模型(LLM) 来改变业务流程，因此关于 AI 的讨论已不可避免。然而，尽管 LLM 功能强大且前景光明，但许多业务…

王浩然
2024年12月22日
000
AI前沿

Meta Connect 2024 值得期待的内容——下一代 Quest VR 头显

Meta 将于下周举行其年度 Connect 开发者大会，大会将展示一系列令人期待甚至惊喜的新型 VR 和 AR 硬件——同时，Meta AI 还将重点展示该公司最新的 Llama…

王浩然
2024年9月23日
000
AI前沿

佳士得AI艺术拍卖会据报道超出预期‌

近日，佳士得拍卖行举办的一场AI艺术拍卖会吸引了广泛关注，据报道，此次拍卖的结果远远超出了业界的预期。这场拍卖会不仅展示了AI艺术的无限潜力，也引发了人们对艺术与科技结合的深入思考…

王浩然
2025年3月9日
000
AI前沿

冷静一下：DeepSeek-R1 很棒，但 ChatGPT 的产品优势还远未结束

就在一周前——2025 年 1 月 20 日——中国人工智能初创公司 DeepSeek 发布了一个名为 R1 的新开源人工智能模型，该模型最初可能会被误认为是自OpenAI两年多前…

王浩然
2025年1月28日
000

发表回复

Please Login to Comment

推理框架 Archon 有望加快 LLM 进程，且无需额外成本

Archon 组件

Archon 的局限性

相关推荐

发表回复

Share To :