Anthropic 推出全新 Claude AI 模型和“计算机控制”

点点 • 2024年10月24日下午3:00 • AI前沿 • 160 views

Anthropic宣布升级其 AI 产品组合，包括增强型 Claude 3.5 Sonnet 模型和推出 Claude 3.5 Haiku，同时在公开测试版中推出“计算机控制”功能。

升级后的 Claude 3.5 Sonnet 在所有指标上都表现出了显著的改进，尤其是在编码能力方面取得了显著的进步。该模型在 SWE-bench Verified 基准测试中取得了令人印象深刻的 49.0% 的成绩，超越了所有公开可用的模型，包括 OpenAI 的产品和专业编码系统。

Anthropic 的开创性进展是引入了计算机使用功能，使 Claude 能够像人类一样与计算机交互：查看屏幕、控制光标、点击和打字。此功能目前处于公开测试阶段，标志着 Claude 3.5 Sonnet 成为第一个提供此类功能的前沿 AI 模型。

几家大型科技公司已经开始实施这些新功能。

GitLab 报告称：“升级后的 Claude 3.5 Sonnet 代表了人工智能编码的重大飞跃”，并指出在用例中推理能力提高了 10%，且没有额外的延迟。

新的 Claude 3.5 Haiku 型号将于本月晚些时候发布，其性能与之前的 Claude 3 Opus 相当，同时保持了成本效益和速度。它在 SWE-bench Verified 上取得了 40.6% 的成绩，优于许多竞争型号，包括原始的 Claude 3.5 Sonnet 和 GPT-4o。

关于计算机控制能力，Anthropic 采取了慎重的态度，承认当前的局限性，同时强调潜力。在评估计算机界面导航的 OSWorld 基准测试中，Claude 3.5 Sonnet 在仅屏幕截图测试中取得了 14.9% 的成绩，远远超过排名第二的系统的 7.8%。

这些开发成果经过了严格的安全评估，并与美国和英国的人工智能安全研究所合作进行了部署前测试。Anthropic 坚持认为，其负责任的扩展政策中详述的 ASL-2 标准仍然适用于这些模型。

原创文章，作者：点点，如若转载，请注明出处：https://www.dian8dian.com/anthropic-tui-chu-quan-xin-claude-ai-mo-xing-he-ji-suan-ji

AI 产品 Anthropic Claude GitLab 计算机控制

Like (0)

点点

0 0

Stability AI 发布迄今为止最强大的图像生成模型

Previous 2024年10月24日

欧盟人工智能法案：早期准备可使企业获得竞争优势

Next 2024年10月24日

AI前沿

Agentic AI：大型语言模型如何塑造自主代理的未来

继生成式人工智能兴起之后，随着代理式人工智能的出现，人工智能即将迎来另一场重大变革。这一变化是由大型语言模型 (LLM)演变为主动决策实体所推动的。这些模型不再局限于生成类似人类的…

点点
2024年11月5日
000
AI前沿

“创造市场”与“算法进化”，中美AI竞速的岔路口

“人工智能的商业模式，是要创造一个市场，而非一个算法”。这是世界AI泰斗Michael I.Jordan的观点。图源pixabay 而当前的全球AI市场，占据主导地位的中美双方，…

点点
2024年9月16日
000
AI前沿

人工智能如何帮助绘制宇宙地图

人工智能 (AI) 已成为了解世界的重要工具。现在，随着人们对太空探索的兴趣重新升温，人工智能也可能对其他世界产生同样的影响。尽管经过了几十年的研究，科学家们对地球大气层以外的宇…

点点
2024年9月17日
000
AI前沿

仓库中的机器人经过人工智能训练，可实现更快的分类

Ambi Robotics 最近发布了 Prime-1，该公司称这是第一个用于商业仓库运营中部署的机器人分拣机的 AI 基础模型。 Prime-1 代表可立即投入生产的工业操作专家…

王浩然
2025年1月26日
000
AI前沿

随着人工智能的进步，这对用户生成内容意味着什么？

创作者经济的崛起是互联网领域最具颠覆性的力量之一，为独立作家、艺术家、音乐家、播客、YouTube 博主和社交媒体影响者直接与观众联系并从中赚钱铺平了道路。创作者纷纷…

AI News
2024年8月28日
000
AI前沿

为了在数字无障碍方面取得真正的进步，我们需要进行范式转变

互联网每时每刻都在变得越来越广泛和复杂。尽管数字足迹不断增加，但大多数网站仍然提供难以访问的体验。想想看：每三秒钟就会创建一个新网站。然而，根据 2024 年WebAIM 报告，…

王浩然
2024年9月22日
000
AI前沿

谷歌推出 Gemini 2.0 Pro、Flash-Lite 并将推理模型 Flash Thinking 连接到 YouTube、地图和搜索

谷歌的 Gemini 系列人工智能大型语言模型 (LLM) 在近一年前刚开始并不顺利，出现了一些令人尴尬的图像生成错误事件，但自那以后，它一直在稳步改进，而且该公司似乎有意让其第二…

王浩然
2025年2月6日
000
AI前沿

Cleerly 从 Insight Partners 融资 1.06 亿美元，用于 AI 心脏健康早期检测

尽管心脏病是美国的主要死亡原因，但很大一部分心脏病发作的人并不知道自己患有潜在疾病。心血管成像初创公司Cleerly希望解决这一问题。通过分析心脏 CT 扫描，该公司的 AI 软…

王浩然
2024年12月5日
000
AI前沿

这是你永远不应该外包给人工智能模型的事情

在这个效率至上、颠覆性技术一夜之间创造出数十亿美元市场的世界里，企业不可避免地将生成式人工智能视为强大的盟友。从 OpenAI 的 ChatGPT 生成类似人类的文本，到 DALL…

王浩然
2024年12月8日
000
AI前沿

专家称特朗普撤销拜登人工智能行政令将使行业更加混乱

新的一年，即将上任的特朗普政府预计将对现有政策做出许多改变，人工智能监管也将不例外。这可能包括废除现任总统乔·拜登的人工智能行政命令。拜登的命令设立了政府监督办公室，并鼓励模型开…

王浩然
2024年11月17日
000
AI前沿

利用人工智能代理优化公司工作流程：神话还是现实？

一个问题随着越来越多的大公司投资人工智能代理，将其视为提高运营效率的未来，越来越多的怀疑论者也开始涌现。虽然人们对这些技术的潜力感到兴奋，但许多组织发现，现实往往与炒作的程度不符…

点点
2024年11月6日
000
AI前沿

临床环境中的人工智能：了解护士的怀疑态度并找到前进的方向

由于普遍的职业倦怠和劳动力短缺，不断变化的医疗保健领域一直在寻找“下一个大事件”来支持劳动力赋能，而人工智能目前是领先的竞争者。人工智能在临床环境中的应用越来越普遍，并且将继续存在…

点点
2024年10月27日
000
AI前沿

谷歌推出新款AI视频模型Veo 2，每秒使用成本仅需50美分

近日，谷歌公司正式推出了一款全新的AI视频模型——Veo 2。据悉，该模型每秒的使用成本仅为50美分，极大地降低了AI视频制作与应用的门槛。 Veo 2基于谷歌先进的人工智能技术，…

王浩然
2025年2月26日
000
AI前沿

人工智能监管的未来尚不确定：您的下一步行动是什么？

人工智能监管一直是一个热门话题。但随着即将上任的美国政府准备拆除人工智能护栏，监管也成为一个大问号。对于本已复杂的合规环境来说，这更加复杂，也更加不稳定。AI Impact Tou…

王浩然
2024年12月13日
000
AI前沿

加速清洁能源项目的平台

由麻省理工学院校友创办的 Station A 让业主购买清洁能源的过程变得简单。企业和开发商在安装清洁能源技术（例如太阳能装置和电动汽车充电器）时，通常面临陡峭的学习曲线。为了获…

王浩然
2025年1月27日
000
AI前沿

代理人工智能与空间计算的融合是否会在人工智能革命中增强人类能动性？

随着人工智能竞赛的起起伏伏继续吸引着商界领袖、投资者和媒体的注意力，最令人兴奋的新兴创新之一是代理人工智能和空间计算，它们将重新定义我们与数字系统和物理环境的互动方式。Gartne…

王浩然
2025年1月14日
000
AI前沿

OpenAI Stargate 是一笔 5000 亿美元的赌注：美国的人工智能曼哈顿计划还是代价高昂的死胡同？

本周，特朗普总统重返白宫开始第二任期，白宫发布了一系列行政命令，如果你错过了，昨天下午刚刚宣布了对人工智能基础设施的最大一笔投资。该项目被称为“星际之门项目”，由 OpenAI、软…

王浩然
2025年1月23日
000
AI前沿

Brookfield 承诺投资 200 亿美元，法国 AI 生态系统投资额达 850 亿美元

据法新社证实，加拿大投资公司 Brookfield 计划到 2030 年向法国人工智能项目投资 200 亿欧元（按当前汇率计算约为 207 亿美元）。这笔资金的大部分将用于建设以人…

王浩然
2025年2月10日
000
AI前沿

GenAI 游戏开发平台 Series 已悄然从 Netflix、戴尔、a16z 等公司筹集了 2800 万美元

对于游戏行业高管 Pany Haritatos 来说，这是相当不平凡的一年。根据美国证券交易委员会的文件和该公司的确认，上个月，他悄悄地为他的新游戏工作室初创公司Se…

王浩然
2024年10月1日
000
AI前沿

Lightmatter 获得 4 亿美元融资，AI 超大规模企业对光子数据中心充满期待

光子计算初创公司Lightmatter已筹集 4 亿美元，旨在突破现代数据中心的一个瓶颈。该公司的光学互连层可让数百个 GPU 同步工作，从而简化了昂贵而复杂的 AI 模型训练和运…

王浩然
2024年10月17日
000

发表回复

Please Login to Comment

Anthropic 推出全新 Claude AI 模型和“计算机控制”

相关推荐

发表回复

Share To :