2025 年将成为企业 AI 的关键一年。过去的一年见证了快速创新,今年也将如此。这使得重新审视您的AI战略以保持竞争力并为客户创造价值变得比以往任何时候都更加重要。从扩展 AI 代理到优化成本,以下是企业今年应优先考虑的五个关键领域。
1. 代理:下一代自动化
AI 代理不再只是理论上的东西。到 2025 年,它们将成为企业简化运营和增强客户互动的必备工具。与传统软件不同,由大型语言模型 (LLM) 驱动的代理可以做出细致入微的决策,处理复杂的多步骤任务,并与工具和 API 无缝集成。
2024 年初,代理尚未做好迎接黄金时段的准备,犯了一些令人沮丧的错误,比如产生幻觉 URL。随着前沿大型语言模型本身的改进,它们开始变得更好。
“让我这样说吧,”Red Dragon 的联合创始人 Sam Witteveen 说道,该公司为公司开发代理,最近审查了去年建立的 48 个代理。“有趣的是,我们在年初建立的代理,很多在年底表现得更好,因为模型变得更好了。”Witteveen 在我们拍摄的视频播客中分享了这一点,详细讨论了这五大趋势。
模型越来越好,幻觉越来越少,它们也接受了执行代理任务的训练。模型提供商正在研究的另一个功能是使用 LLM 作为评判者,随着模型越来越便宜(我们将在下面介绍),公司可以使用三个或更多模型来挑选出最佳输出以做出决策。
秘诀的另一部分是什么?检索增强生成 (RAG) 正在变得越来越好,它允许代理高效地存储和重复使用知识。想象一下,一个旅行社机器人不仅可以规划行程,还可以根据更新的偏好和预算实时预订航班和酒店。
要点:企业需要确定代理可以提供高投资回报率的用例——无论是在客户服务、销售还是内部工作流程中。工具使用和高级推理能力将决定这一领域的赢家。
2. 评估:可靠人工智能的基础
评估或“评估”是任何强大的 AI 部署的支柱。这是选择使用哪个 LLM(目前有数百个)来完成任务的过程。这对于准确性很重要,也对于将 AI 输出与企业目标保持一致很重要。良好的评估可确保聊天机器人理解语气、推荐系统提供相关选项,并且预测模型可避免代价高昂的错误。
例如,一家公司对客户支持聊天机器人的评估可能包括平均解决时间、响应准确性和客户满意度分数等指标。
许多公司投入大量时间来处理输入和输出,以使其符合公司的期望和工作流程,但这会耗费大量时间和资源。随着模型本身的改进,许多公司通过更多地依赖模型本身来完成工作来节省精力,因此选择合适的模型变得更加重要。
这个过程迫使人们进行清晰的沟通和做出更好的决策。当你“更加清楚如何评估某件事的结果以及你真正想要的是什么时,这不仅会让你在法学硕士和人工智能方面表现得更好,而且实际上会让你在与人类打交道方面表现得更好,”维特文说。“当你能清楚地向人类表达:这就是我想要的,这就是我希望它看起来的样子,这是我对它的期望。当你对此非常具体时,人类的表现会突然好很多。”
维特文指出,公司经理和其他开发人员告诉他:“哦,你知道,通过擅长快速工程,或者擅长为模型编写正确的评估,我已经能够更好地向我的团队发出指示。”
通过撰写清晰的评估,企业迫使自己明确目标——这对人类和机器来说都是双赢的。
要点:制定高质量的评估至关重要。首先要明确基准:响应准确性、解决时间以及与业务目标的一致性。这可确保您的 AI 不仅表现出色,而且与您的品牌价值保持一致。
3. 成本效益:扩大人工智能规模,无需花费太多资金
人工智能正在变得越来越便宜,但战略部署仍然是关键。法学硕士链各个层面的改进正在大幅降低成本。法学硕士提供商之间以及来自开源竞争对手的激烈竞争导致价格定期下调。
同时,后期培训软件技术正在使 LLM 变得更加高效。
Groq 的 LPU 等新硬件供应商的竞争,以及传统 GPU 提供商 Nvidia 的改进,大大降低了推理成本,使 AI 可用于更多用例。
真正的突破来自于优化模型在应用程序中的使用方式,即推理时,而不是训练时,即首次使用数据构建模型时。模型蒸馏等其他技术以及硬件创新意味着公司可以用更少的资源实现更多的目标。这不再关乎你是否能负担得起人工智能——今年你可以以比六个月前更低的成本完成大多数项目——而是如何扩展它。
要点:对您的 AI 项目进行成本效益分析。比较硬件选项并探索模型提炼等技术,以在不影响性能的情况下降低成本。
4.记忆个性化:根据用户需求定制人工智能
个性化不再是可选项,而是预期。2025 年,具有记忆功能的 AI 系统将实现这一目标。通过记住用户偏好和过去的互动,AI 可以提供更具针对性和更有效的体验。
记忆个性化并没有得到广泛或公开的讨论,因为用户通常对人工智能应用程序存储个人信息以增强服务感到不安。这涉及到隐私问题,而且当模型给出的答案表明它对你了解很多时,比如,你有几个孩子,你以什么为生,你的个人品味是什么,这令人厌恶。OpenAI 就是一个例子,它在其系统内存中保护有关 ChatGPT 用户的信息——尽管默认情况下是开启的,但可以关闭和删除。
虽然使用 OpenAI 和其他模型的企业无法获得相同的信息,但他们可以使用 RAG 创建自己的记忆系统,确保数据既安全又有效。然而,企业必须谨慎行事,在个性化和隐私之间取得平衡。
要点:制定明确的记忆个性化策略。选择加入系统和透明政策可以在提供价值的同时建立信任。
5. 推理和测试时间计算:新的效率和推理前沿
推理是人工智能与现实世界的交汇点。2025 年,重点是让这一过程更快、更便宜、更强大。思路链推理(模型将任务分解为逻辑步骤)正在彻底改变企业处理复杂问题的方式。现在,人工智能可以有效地处理需要更深层次推理的任务,例如战略规划。
例如,OpenAI 的 o3-mini 模型预计将于本月晚些时候发布,随后将发布完整的 o3 模型。它们引入了高级推理能力,将复杂问题分解为可管理的块,从而减少人工智能幻觉并提高决策准确性。这些推理改进在数学、编码和科学应用等领域发挥作用,在这些领域,增加思考可以有所帮助——尽管在合成语言等其他领域,进步可能有限。
然而,这些改进也将带来计算需求的增加,从而带来更高的运营成本。o3-mini 旨在提供一种折衷方案,在保持高性能的同时控制成本。
要点:确定可从高级推理技术中获益的工作流程。实施您公司的特殊思路链推理步骤并选择优化的模型,可以让您在此方面占据优势。
结论:将洞察转化为行动
2025 年的人工智能不仅仅是采用新工具,它还关乎战略选择。无论是部署代理、完善评估还是以经济高效的方式扩展,成功之路都在于深思熟虑的实施。企业应该以明确、有针对性的战略来拥抱这些趋势。
原创文章,作者:王 浩然,如若转载,请注明出处:https://www.dian8dian.com/2025-nian-qi-ye-ai-cheng-gong-ju-ben-cong-dai-li-dao-ping-gu