Salesforce 推出 Agentforce 测试中心，让座席人员接受测试

王浩然 • 2024年11月26日下午3:00 • AI前沿 • 100 views

代理人工智能的下一阶段可能只是评估和监控，因为企业希望让他们开始部署的代理更具可观察性。

虽然AI 代理基准可能会产生误导，但了解代理是否按其期望的方式工作却具有很大的价值。为此，公司开始提供平台，客户可以在其中测试 AI 代理或评估其性能。

Salesforce于周三在有限试点中发布了其代理评估平台 Agentforce Testing Center。预计 12 月将全面上市。Testing Center 让企业可以观察和制作 AI 代理的原型，以确保它们可以访问所需的工作流程和数据。

测试中心的新功能包括针对 Agentforce 的 AI 生成测试、针对 Agentforce 和数据云的沙盒以及针对 Agentforce 的监控和可观察性。

人工智能生成的测试允许公司使用人工智能模型生成“数百次合成交互”，以测试代理最终是否按照公司希望的方式回答问题。顾名思义，沙盒提供了一个隔离的环境来测试代理，同时镜像公司的数据以更好地反映代理如何为他们工作。监控和可观察性让企业在代理投入生产时将审计跟踪带到沙盒中。

Salesforce 产品和行业营销执行副总裁 Patrick Stokes 表示，测试中心是公司称之为代理生命周期管理的新代理类别的一部分。

“我们正在定位我们认为将成为代理的一个新子类别，”斯托克斯说。“当我们说生命周期时，我们指的是从起源到开发再到部署的整个过程，以及部署过程中的迭代。”

斯托克斯表示，目前，测试中心还没有针对特定工作流程的洞察，开发人员无法看到代理使用的 API、数据或模型的具体选择。不过，Salesforce 在其 Einstein Trust Layer 上收集了这类数据。

斯托克斯说：“我们正在做的是构建开发工具，向我们的客户公开元数据，以便他们可以实际使用它来更好地构建他们的代理。”

Salesforce 正致力于 AI 代理，将大量精力集中在其代理产品 Agentforce上。Salesforce 客户可以使用预设代理或在 Agentforce 上构建定制代理来连接到他们的实例。

评估代理商

人工智能代理触及组织中的许多点，并且由于良好的代理生态系统旨在实现大量工作流程的自动化，因此确保它们运行良好变得至关重要。

如果代理决定使用错误的 API，这可能会给企业带来灾难。人工智能代理本质上是随机的，就像支持它们的模型一样，它们在得出结果之前会考虑每个潜在概率。斯托克斯说，Salesforce 通过向代理发送相同话语或问题的多个版本来测试代理。它的回答被评为通过或失败，允许代理在人类开发人员可以控制的安全环境中学习和发展。

帮助企业评估 AI 代理的平台正迅速成为一种新型产品。6 月，客户体验 AI 公司Sierra 推出了一款名为 TAU-bench 的 AI 代理基准，以考察对话代理的性能。自动化公司UiPath于 10 月发布了其Agent Builder 平台，该平台还提供了一种在全面部署之前评估代理性能的方法。

测试 AI 应用程序并不是什么新鲜事。除了对模型性能进行基准测试外，许多 AI 模型存储库（如 AWS Bedrock 和 Microsoft Azure）已经允许客户在受控环境中测试基础模型，以了解哪种模型最适合他们的用例。

原创文章，作者：王浩然，如若转载，请注明出处：https://www.dian8dian.com/salesforce-tui-chu-agentforce-ce-shi-zhong-xin-rang-zuo-xi

Agentforce Salesforce

Like (0)

王浩然作者

0 0

H2O.ai 利用预测模型提高 AI 代理的准确性

Previous 2024年11月26日

亚马逊加倍押注 Anthropic，将自己定位为人工智能军备竞赛的关键参与者

Next 2024年11月26日

AI前沿

超越RAG：SEARCH-R1将搜索引擎直接融入推理模型

在人工智能（AI）领域，大型语言模型（LLM）的推理能力取得了显著进步。然而，这些模型在结合推理能力正确引用和使用外部数据——即它们未接受训练的信息——方面仍存在较大不足。这一问题…

王浩然
2025年3月22日
000
AI前沿

一种新的计算模型可以更准确地预测抗体结构

利用该模型，研究人员或许能够识别出可针对多种传染病的抗体药物。通过采用被称为大型语言模型的人工智能模型，研究人员在根据蛋白质序列预测其结构方面取得了巨大进步。然而，这种方法对抗体…

王浩然
2025年1月3日
000
AI前沿

Together AI 有望通过私有云企业 AI 平台实现更快的推理速度和更低的成本

在公共云中运行人工智能可能会给企业带来许多有关数据隐私和安全的担忧。这就是为什么一些企业会选择在私有云或本地环境中部署 AI。Together AI是寻求解决挑战的供应商之一，这…

王浩然
2024年9月24日
000
AI前沿

平台工程：简化现代软件开发

随着我们加速迈向工业 4.0，数字化转型以前所未有的水平重塑了企业。如今，组织面临着更快、更可靠、更大规模地交付软件的巨大压力。云环境的日益复杂以及对无摩擦客户体验的需求不断增加…

点点
2024年11月5日
000
AI前沿

无形的、自主的且可被攻击的：无人预见的AI代理困境

随着人工智能（AI）技术的飞速发展，一种新型的网络安全威胁正在悄然兴起——无形的、自主的AI代理。这些AI代理在后台默默运行，能够自我学习、自我决策，并在不被察觉的情况下执行恶意任…

王浩然
2025年2月23日
000
AI前沿

2025年，1X将在数百户家庭中测试人形机器人

随着科技的飞速发展，人形机器人正逐渐成为现实生活中的一部分。据最新消息，创新科技公司1X计划在2025年启动一项雄心勃勃的项目：在数百户家庭中测试其人形机器人的实际应用。这一举措标…

王浩然
2025年3月25日
000
AI前沿

中国电信利用国产芯片训练具有1万亿参数的AI模型

中国电信是中国国有电信巨头之一，它已设立了两门仅针对国产芯片进行培训的法学硕士课程。这一突破代表着中国在人工智能技术自主化方面不断努力迈出的重要一步，特别是在美国对其竞争对手获取…

点点
2024年10月11日
000
AI前沿

数千名创意人员签署请愿书，反对人工智能数据抓取

演员凯文·贝肯、小说家石黑一雄、音乐家罗伯特·史密斯、记者兼历史学家西德尼·布卢门撒尔有什么共同点？他们都是 11,500 名签署请愿书的人之一，反对未经许可使用创意作品进行人工智…

王浩然
2024年10月24日
000
AI前沿

人工智能视觉搜索登陆 iPhone

该公司在周一的 Apple Event 2024 上宣布，视觉搜索即将登陆 iPhone，由苹果的 AI 功能套件 Apple Intelligence 提供支持。相机控制是iP…

王浩然
2024年9月10日
000
AI前沿

了解影子人工智能及其对您的业务的影响

市场正因创新和新的 AI 项目而蓬勃发展。企业纷纷使用 AI 以在当前快节奏的经济中保持领先地位，这并不奇怪。然而，这种快速的 AI 采用也带来了一个隐藏的挑战：“影子 AI ”的…

王浩然
2024年12月26日
000
AI前沿

Emily Popson，CallRail 增长营销副总裁 – 访谈系列

Emily Popson 是CallRail的增长营销副总裁，负责领导需求生成、网站优化、客户营销和内容营销团队。Popson 自己之前也是一家小企业主，她热衷于让即使是最小的团…

点点
2024年10月17日
000
AI前沿

Luma AI 发布 Ray2 生成视频模型，具有“快速、自然”的运动和更好的物理特性

去年夏天，Luma AI 推出了其Dream Machine生成式 AI 视频创作平台，引起轰动。当然，虽然这仅仅是七个月前的事，但随着美国和中国的竞争对手初创公司发布了许多新的…

王浩然
2025年1月20日
000
AI前沿

Telefónica 的 Wayra 支持人工智能应答引擎 Perplexity

西班牙电信 (Telefónica) 的企业风险投资部门Wayra宣布投资人工智能解答引擎Perplexity。 Perplexity 的 AI 驱动平台旨在通过使用自然语言处理为…

点点
2024年10月16日
000
AI前沿

确保人工智能前沿：保护企业系统免受人工智能驱动的威胁

到 2025 年，针对身份的武器化人工智能攻击（看不见且通常恢复成本最高）将对企业网络安全构成最大威胁。大型语言模型 (LLM) 是恶意攻击者、网络犯罪集团和民族国家攻击团队的新…

王浩然
2024年11月18日
000
AI前沿

亚马逊通过 AI 视频搜索改进 Ring 订阅服务

亚马逊正在改进其 Ring 视频门铃和摄像头的订阅服务。一项名为 Ring Home Premium 的新服务将包括全天候录制和人工智能视频搜索等功能，起价为每月 19.99 美…

王浩然
2024年10月10日
000
AI前沿

OpenAI 推出高级语音模式，提供更多声音和新外观

OpenAI于周二宣布，将向 ChatGPT 的更多付费客户推出高级语音模式 (AVM)。该音频功能使 ChatGPT 的对话更加自然，将首先向 ChatGPT 的 Plus 和 …

王浩然
2024年9月25日
000
AI前沿

及时的 Stytch：Connected Apps 解开了 AI 代理的授权绑定

人工智能代理将改变ID授权：当它们在后台集成时，它们需要代表我们在不同的应用程序之间无缝移动，而不会被登录屏幕不断阻止，以免变得繁琐。授权平台Stytch首席执行官 …

王浩然
2025年2月20日
000
AI前沿

苹果的 ELEGNT 框架可以让家用机器人不再像机器，而更像伴侣

苹果研究人员开发出了一种新框架，可以使非人形机器人在与人互动时动作更加自然、富有表现力，这可能为家庭和工作场所中更具吸引力的机器人助手铺平道路。这项研究于本月在 arXiv 上发…

王浩然
2025年2月9日
000
AI前沿

解决量子计算最紧迫的挑战

量子计算有可能改变许多行业，从密码学到药物研发。但扩展这些系统是一项艰巨的任务。随着量子计算机的发展，它们面临着更多的错误和噪音，这些错误和噪音可能会扰乱计算。为了解决这个问题…

王浩然
2024年12月8日
000
AI前沿

代理实验室：AMD 和约翰霍普金斯大学共同组建的虚拟研究团队

当每个人都在热议人工智能代理和自动化时，AMD 和约翰霍普金斯大学一直在致力于改善人类和人工智能在研究中的协作方式。他们的新开源框架Agent Laboratory完全重新构想了如…

王浩然
2025年1月14日
000

发表回复

Please Login to Comment

Salesforce 推出 Agentforce 测试中心，让座席人员接受测试

评估代理商

相关推荐

发表回复

Share To :