使用 LlamaIndex 和 Gemini 实现 REAcT Agent

王浩然 • 2024年10月20日下午7:00 • AI前沿, 技术评测 • 301 views

在过去的 2-3 年里，我们见证了人工智能领域的非凡发展，主要体现在大型语言模型、扩散模型、多模态模型等方面。我最喜欢的兴趣之一是代理工作流。今年早些时候，Coursera 的创始人、深度学习的先驱 Andrew Ng发了一条推文，称“代理工作流将在今年推动人工智能的巨大进步”。自这条推文发布以来，我们看到了代理领域令人难以置信的发展，许多人都在构建自主代理、多代理架构等。

在本文中，我们将深入探讨 REAcT Agent 的实现，这是代理工作流中的一种强大方法。我们将探索 REAcT 提示是什么、它为什么有用以及如何使用 LlamaIndex 和 Gemini LLM 实现它。

学习目标

我们将了解 REAcT 提示及其在构建能够推理、行动和思考复杂任务的更强大的 AI 代理中的作用。
关于如何编写 REAcT 提示的示例提示。
进一步在 LlamaIndex 框架内实现 REAcT Agents，为 Agent 提供反馈功能。
探索 REAcT 代理的功能，特别是其分解任务、使用各种工具和提供透明推理过程的能力。

什么是 REAcT 提示？

REAcT代表推理、行动和思考。它是一种提示技术，可使大型语言模型 (LLM) 将复杂任务分解为一系列思考过程、行动和观察。

REAcT 提示非常简单，遵循三个步骤：

思考：根据用户查询，代理形成如何解决问题的想法。
行动：代理根据其想法，利用可用的工具或 API 执行某些操作。例如，您可以使用 Google 搜索、文件加载等。
观察：代理分析其动作的结果并决定是否继续该过程或提供最终答案。

该过程循环运行，直到获得满意的结果或达到最大迭代次数。

REAcT 提示示例

让我们看一下 REAcT 提示的典型结构：

Thought: [The agent's reasoning about the task]
Action: [The action to be taken, e.g., "Search"]
Action Input: [The input for the action, e.g., a search query]
Observation: [The result of the action]
Thought: [Further reasoning based on the observation]
...
[This process repeats until a final answer is reached]
Final Answer: [The agent's conclusion]

让我们看一个实时示例，了解 REAcT 代理如何处理有关最新技术进步的查询。此示例将展示代理的思维过程、行动和观察。

用户查询：“在最近的印度与英格兰测试系列赛中，谁是系列赛最佳球员，他们的主要表现是什么？”

输出：（使用crewAI生成）

Thought: To answer this query accurately, I need to find information about the recent India vs England Test series, identify the man of the series, and gather details about their performances. I'll start by searching for the series results.

Action: Search
Action Input: "India vs England Test series 2024 results"

Observation: The India vs England Test series concluded recently with India winning the series 4-1. The series was played in India from January to March 2024.

Thought: Now that I have confirmed the series details, I need to find out who was named the man of the series.

Action: Search
Action Input: "India vs England Test series 2024 man of the series"

Observation: Yashasvi Jaiswal was named the man of the series for his outstanding batting performances throughout the series.

Thought: I've identified the man of the series. Now, I need to gather information about Yashasvi Jaiswal's key performances in this series.

Action: Search
Action Input: "Yashasvi Jaiswal performance India vs England Test series 2024"

Observation: Yashasvi Jaiswal had an exceptional series:
- He scored a total of 712 runs in the series.
- His scores included two double centuries (209 and 214*).
- He hit the most sixes (26) in a Test series by any batter.
- Jaiswal maintained an impressive average of 89 throughout the series.

Thought: I now have all the necessary information to provide a comprehensive answer about the man of the series and his key performances.

Final Answer: The man of the series in the recent India vs England Test series (played from January to March 2024) was Yashasvi Jaiswal. India won the series 4-1, and Jaiswal's performances were crucial to this victory.

Key performances by Yashasvi Jaiswal in the series:

1. Total runs: Jaiswal amassed an impressive 712 runs across the five-match series.
2. Double centuries: He scored two double hundreds - 209 and 214* (not out).
3. Six-hitting record: Jaiswal hit 26 sixes, setting a new record for the most sixes in a Test series by any batter.
4. Batting average: He maintained an outstanding average of 89 throughout the series.

These performances demonstrate Jaiswal's consistency, ability to play long innings, and his aggressive style of play, especially evident in his six-hitting prowess. His contributions were pivotal in India's dominant performance in the series, justifying his selection as the man of the series.

Jaiswal's performance is particularly noteworthy given that this was one of his early Test series, marking him as a rising star in Indian cricket. His ability to perform at such a high level against a strong England team suggests a promising future in Test cricket for the young batsman.

为什么 REAcT 提示对建筑代理有用？

获得 LLM 成绩的典型方法是编写结构良好的提示。但是，重要的是要记住 LLM 缺乏固有的推理能力。人们尝试了各种方法使 LLM 能够推理和规划，但其中许多方法都失败了。思维链、思维树和自洽性 COT 等技术已显示出前景，但在实现稳健推理方面并不完全成功。后来出现了 ReAct，它在某种程度上成功地设计了比以前的方法更合理的逻辑研究计划。

REAcT 将复杂的任务分解为一系列想法、行动和观察，REAcT 代理可以以以前难以实现的透明度和适应性水平解决复杂问题。这种方法可以更细致地了解代理的决策过程，使开发人员更容易调试、改进和优化 LLM 响应。

此外，REAcT 提示的迭代特性使代理能够处理不确定性。随着代理经历多个思考、行动和观察周期，它可以根据新信息调整其方法，就像人类面对复杂任务时一样。通过将决策建立在具体行动和观察的基础上，REAcT 代理可以提供更可靠、更符合情境的响应，从而显著降低出现幻觉的风险。

REAcT 药剂的主要应用和用例

我们将探索 REAcT 代理的多样化应用和实际用例，强调它们通过增强推理、决策和在各种情况下的适应性来改变行业的潜力。

实时体育分析与预测

基于互联网上大量信息的 ReAcT 代理可以为体育行业提供分析和预测。它可以处理实时比赛数据、球员统计数据和历史表现，以提供深入的分析和预测。例如，在 IPL 比赛期间，代理可以：

分析球员表现趋势
预测最佳击球顺序或投球变化
根据击球手的击球区域建议场地位置

自动化客户支持

客户支持始终需要技能来提供有价值的反馈。当需要向 LLM 或代理提供智能反馈时，ReAcT 代理是一个不错的选择。这可以帮助：

理解复杂的客户查询
访问相关产品信息和故障排除指南
引导客户逐步了解解决方案

学生个性化学习

教育是 ReAcT Agents 能够产生巨大影响的另一个领域。想象一下，个性化的 AI 导师可以：

评估学生当前的知识水平
将复杂的主题分解成易于管理的部分
根据学生的反应调整教学风格
提供实时反馈并建议额外资源

在我们的代码实现中，我们将研究实时体育数据查询和分析。

使用 LlamaIndex 实现 REAcT 代理

现在，让我们进入激动人心的部分——使用 LlamaIndex 实现 REAcT 代理。实现非常简单，只需几行代码即可完成。

安装和设置

在继续代码实现之前，让我们安装一些必要的库，包括 LlamaIndex。LlamaIndex 是一个可以有效地将大型语言模型连接到您的数据的框架。对于我们的操作工具，我们将使用 DuckDuckGo Search，而 Gemini 将是我们集成到代码中的 LLM。

!pip install llama-index
!pip install duckduckgo-search
!pip install llama-index-llms-gemini

首先，我们需要导入必要的组件。由于 ReAct 代理需要与外部工具交互以获取数据，我们可以使用在 LlamaIndex 核心工具中定义的函数工具来实现这一点。逻辑很简单：每当代理需要访问真实世界的数据时，它都会触发一个 Python 函数来检索所需的信息。这就是 DuckDuckGo 发挥作用的地方，它有助于为代理获取相关上下文。

from llama_index.core.tools import FunctionTool
from duckduckgo_search import DDGS

from llama_index.llms.gemini import Gemini

定义双子座法学硕士 (LLM)

在 LlamaIndex 中，OpenAI 是默认的 LLM，要覆盖 Gemini，我们需要在设置中初始化它。要使用 Gemini LLM，您需要从此处获取 API 密钥：https: //aistudio.google.com/

from llama_index.core import Settings
import os

GOOGLE_API_KEY = "" # add your API key here
os.environ["GOOGLE_API_KEY"] = GOOGLE_API_KEY

llm = Gemini()
Settings.llm = llm

为 REAcT 代理创建行动工具

接下来，我们定义搜索工具 DuckDuckGo Search。需要记住的一个重要细节是，在定义用于执行操作的 FunctionTool 时，需要指定输入参数的数据类型。例如，search(query: str) -> str 确保查询参数是字符串。由于 DuckDuckGo 返回带有附加元数据的搜索结果，因此我们将仅从结果中提取正文内容以简化响应。

def search(query:str) -> str:
  """
  Args:
      query: user prompt
  return:
  context (str): search results to the user query
  """
  # def search(query:str)
  req = DDGS()
  response = req.text(query,max_results=4)
  context = ""
  for result in response:
    context += result['body']
  return context
  
search_tool = FunctionTool.from_defaults(fn=search)

使用 LlamaIndex 编写 REAcT 代理

在设置了代理的主要组件后，我们现在可以定义 ReAct 代理。我们可以直接使用 LlamaIndex 核心中的 ReAct 代理。此外，我们设置 verbose=True 以了解幕后发生的事情。将 allow_parallel_tool_calls 设置为 True 可使代理无需始终依赖外部操作即可做出决策，从而允许它在适当的时候使用自己的推理。

from llama_index.core.agent import ReActAgent

agent = ReActAgent.from_tools([search_tool], 
                               llm=llm, 
                               verbose=True,
                               allow_parallel_tool_calls=True
                             )

就这样！我们已经创建了 REAcT Agent。现在我们可以通过运行 agent.chat 方法使用它来回答查询。

template = """
You are an expert Sport analysis reporter. 
Understand the trends of Virat Kohli performance in IPL 2024 and provide what was his strengths and weakness
Also provide total score of Virat Kohli in the IPL 2024
I also need highest score as Virat Kohli in the same season
"""

response = agent.chat(template) 
print(response)

Screenshot_2024-10-18_at_04.18.20-thumbnail_webp-600x300-1

结论

REAcT 代理代表了人工智能和代理工作流领域的重大进步。通过使用 LlamaIndex 实现 REAcT 代理，我们创建了一个强大的工具，它可以通过实时用户查询进行推理、行动和思考。

关键要点

REAcT 提示代表了代理工作流程的重大进步，为大型语言模型的复杂推理提供了一种结构化方法。
使用 LlamaIndex 实现 REAcT Agents 非常简单，只需几行代码即可创建强大的自适应 AI 系统。
REAcT 提示的迭代特性允许动态解决问题，使代理能够根据中间结果和新信息调整其方法。
REAcT 代理显著降低了幻觉的风险，这是语言模型中常见的挑战。

原创文章，作者：王浩然，如若转载，请注明出处：https://www.dian8dian.com/shi-yong-llamaindex-he-gemini-shi-xian-react-agent

Like (0)

王浩然作者

0 0

使用生成式人工智能进行 SEO 的 12 种方法

Previous 2024年10月20日

我们能教机器像人类一样思考吗？

Next 2024年10月20日

AI前沿

Meta 的 Llama 3.2：利用设备端和多模式功能重新定义开源生成式 AI

Meta 最近推出了 Llama 3.2 ，这是其 Llama 系列大型语言模型的最新版本，是开源生成式 AI 生态系统发展的重要进展。此次升级在两个维度上扩展了 Llama 的功…

点点
2024年9月28日
000
AI前沿

谷歌推出人工智能编码助手“Jules”，承诺自动修复错误并加快开发周期

谷歌周三发布了人工智能编码助手“ Jules ”，它可以在开发人员睡觉时自主修复软件错误并准备代码更改，这标志着该公司在核心编程任务自动化方面取得了重大进展。该实验性的人工智能代…

王浩然
2024年12月12日
000
AI前沿

人工智能代理入门（第 2 部分）：自主性、保障措施和陷阱

在我们的第一部分中，我们概述了利用 AI 代理提高企业效率的关键策略。我解释了与独立 AI 模型不同，代理如何使用上下文和工具迭代地优化任务以增强代码生成等结果。我还讨论了多代理系…

王浩然
2024年11月27日
000
AI前沿

人工智能驱动的栩栩如生的人形机器人将成为“情感伴侣”

人形机器人 Uma 的设计与人类相似，能够理解自然语言，可以讲故事、回答问题这种栩栩如生的形态是否代表着机器人的未来？这是 Una，它是由总部位于深圳的优必选机器人公司打造的 …

王浩然
2025年2月21日
000
AI前沿

苹果针对性别语言翻译的解决方案

苹果公司刚刚与南加州大学合作发表了一篇论文，探讨了用于让 iOS18 操作系统用户在翻译时拥有更多性别选择权的机器学习方法。在 iOS18 中，用户可以在原生翻译应用中为翻译的单…

点点
2024年10月9日
000
AI前沿

代理实验室：AMD 和约翰霍普金斯大学共同组建的虚拟研究团队

当每个人都在热议人工智能代理和自动化时，AMD 和约翰霍普金斯大学一直在致力于改善人类和人工智能在研究中的协作方式。他们的新开源框架Agent Laboratory完全重新构想了如…

王浩然
2025年1月14日
000
AI前沿

Cohere 更新 API，让开发人员更轻松地从其他模型切换

Cohere宣布发布其 AI 模型 Chat、Embed、Rerank 和 Classify 的应用程序编程接口 (API) 的更新版本。新的 API 更新统称为 API V2，…

王浩然
2024年9月30日
000
AI前沿

以下是增强 AI 性能的 3 个关键 LLM 压缩策略

在当今快节奏的数字环境中，依赖人工智能的企业面临着新的挑战：运行人工智能模型的延迟、内存使用和计算能力成本。随着人工智能的快速发展，支持这些创新的模型变得越来越复杂和资源密集。虽然…

王浩然
2024年11月11日
000
AI前沿

Credo AI 的集成中心可实现亚马逊、微软等公司 AI 项目的自动化治理

人工智能治理公司Credo AI推出了一个新平台，该平台与第三方人工智能运营和业务工具相结合，以更好地了解负责任的人工智能政策。 Credo AI 的 Integrations …

王浩然
2024年10月7日
000
AI前沿

人工智能可以帮助 NetOps 完成的 5 项网络任务以及人工智能无法完成的 5 项网络任务

随着网络基础设施的复杂性和规模持续呈指数级增长，当今的数字环境正在迅速发展。这种激增使得有效管理网络变得比以往任何时候都更具挑战性。虽然有各种各样的工具可以帮助 NetOps 团队…

点点
2024年9月27日
000
AI前沿

通用人工智能：安永对短期未来的展望

通用人工智能（AGI）是一种人工智能，它有望通过匹配或超越人类的认知能力来颠覆多个行业并解决世界上一些最大的问题。尽管这一概念源自科幻小说，但 AGI 可能比我们想象的更接近现实…

王浩然
2025年1月26日
000
AI前沿

Anthropic重塑教育AI：Claude学习模式让学生主动思考

在人工智能（AI）迅速发展的今天，其在教育领域的应用引发了广泛关注。然而，大多数现有的教育AI工具往往侧重于提供快速答案，而非培养学生的批判性思维和深度理解能力。为了打破这一局面，…

王浩然
2天前
000
AI前沿

腾讯研究院对话前OpenAI研究员：为什么伟大不能被计划？

2024年9月25日，腾研读书举办了一场对谈，腾讯研究院资深专家袁晓辉对谈前OpenAI研究员，也是《为什么伟大不能被计划》一书的两位作者肯尼斯·斯坦利（Kenneth Stanl…

点点
2024年10月12日
000
AI前沿

为什么微软的安全计划和苹果的云隐私现在对企业如此重要

随着网络威胁越来越自动化和恶意化，保护企业数据和隐私变得前所未有的困难。Apple和Microsoft的新安全计划利用其核心云安全和隐私优势来弥补安全漏洞并降低每家企业的风险。微…

王浩然
2024年9月30日
000
AI前沿

将法学硕士课程扎根于现实：一家公司如何利用人工智能将生产力提高 70%

总部位于硅谷的金融科技初创公司Drip Capital正在利用生成式人工智能，将跨境贸易融资业务的生产力显著提高 70%。该公司已通过债务和股权融资筹集了超过 5 亿美元，正在采用…

王浩然
2024年9月22日
000
AI前沿

微软在 Windows 召回系统重新发布前详细介绍了其安全/隐私方面的改进

微软正在对其备受争议的 Copilot+ Windows PC 的 Recall 功能进行另一次调整，此前该功能的原始版本在夏季安全研究人员和测试人员的严格审查下崩溃并烧毁。Rec…

点点
2024年9月30日
000
AI前沿

Agentic AI：深入探究自动化的未来

超越生成式人工智能人工智能最具变革性的承诺一直是其自主潜力，即创建无需人工监督即可自行智能行动的系统。然而，到目前为止，这种“代理人工智能”对于大多数企业用例来说仍然遥不可及。 …

王浩然
2024年9月15日
000
AI前沿

生成式人工智能热潮背后的风险：为何人们越来越谨慎

在不久的将来，硅谷可能会回顾最近发生的事件，认为这是生成式人工智能热潮走得太远的标志。今年夏天，投资者质疑顶级人工智能股票能否维持其高估值，因为大规模人工智能支出缺乏回报。随着秋…

点点
2024年10月11日
000
AI前沿

一些初创公司正在采用“fair source”来避免开源许可的陷阱

由于专有软件和开源软件（OSS）之间长期存在的紧张关系短期内不太可能结束，一家价值 30 亿美元的初创公司正全力支持一种新的许可模式 — — 该模式旨在连接开放世界和专有世界，充满…

点点
2024年9月23日
000
AI前沿

DeepSeek 的新 AI 模型似乎是迄今为止最好的“公开”挑战者之一

中国的一个实验室创建了迄今为止最强大的“开放式”人工智能模型之一。该模型DeepSeek V3由人工智能公司 DeepSeek 开发，并于周三根据宽松的许可证发布，允许开发人员下…

王浩然
2024年12月28日
000