2024 年人工智能的四大新闻和 2025 年的一个重要预测

王浩然 • 2024年12月24日上午10:00 • AI前沿 • 74 views

从各方面来看，2024 年都是人工智能迄今为止最重要的一年——至少就该技术的商业化而言。

2022 年末 ChatGPT 的推出推动了大型语言模型 (LLM) 热潮，这一热潮丝毫没有放缓的迹象，不仅 OpenAI 和微软、Meta 和谷歌等巨头都推出了众多新的 LLM，还有许多其他初创公司和个人开发者也推出了众多新的 LLM。

事实证明，有关人工智能研究放缓的报道即使不是毫无根据的，也肯定是夸大其词。

此外，超越大多数大型 LLM 所依赖的 Transformer 架构的新技术开始浮出水面，例如Liquid AI 的 Liquid Foundation 模型。

最后，公司开始全面接受人工智能的“代理”方法——开发特定的人工智能机器人、应用程序和工作流程，它们可以独立解决特定问题，或者比 LLM 聊天机器人典型的来回沟通更少的人工管理。

将今年的新闻故事提炼为 14 大新闻，更不用说 10 大新闻或 4 大新闻，是一项令人烦恼的工作。但我还是继续尝试，尽管有点作弊，将几则新闻合并成更大的主题。在我看来，以下是今年将产生最大影响的内容：

1. OpenAI 的扩张范围超越了 ChatGPT

尽管面临着来自新手和传统技术，甚至是其投资者和合作伙伴微软的激烈竞争，但这家可以说是开启人工智能时代最具影响力的公司今年仍表现不俗。

o1 模型：OpenAI 发布了其 GPT 系列之外的首个大型通用模型系列，即o1“推理”系列，该系列分配了更多时间来处理复杂提示，从而提高了准确性。它在科学、编码和推理任务中特别有效。

o3 模型：继 9 月份的 o1 模型之后，OpenAI 于年底发布了更为先进的 o3 模型。虽然该模型要到 2025 年初才会向公众发布，甚至不会向任何第三方发布，但这表明 OpenAI 并没有满足于现状。

ChatGPT 搜索：此功能最初作为仅限邀请的独立产品SearchGPT推出，后来被整合到 ChatGPT 中，可以在 ChatGPT 中实现更实时的网络信息检索和更精致的搜索结果呈现，增强其对最新查询的实用性，并与 Google、Bing 和新来者 Perplexity 展开正面交锋。

Canvas：Canvas 于 10 月推出，它将ChatGPT 界面从对话界面扩展为类似工作站的窗格，可以根据用户的要求（例如编辑文档或编码项目）动态更新内容。当然，很难不把它看作是对几个月前 Anthropic 宣布的 Artifacts 的回应，或者至少是与之类似的功能。

Sora：在用其严密保护的视频生成器模型向我们展示了近一年之后，OpenAI 终于在 12 月初向大众推出了 Sora，并迅速引起了广泛的反响，因为它试图通过独特且深思熟虑的界面和故事板功能在竞争激烈的 AI 视频领域中脱颖而出。

2. 开源人工智能开始腾飞

Llama 3 和 3.1：Meta于 4 月推出了 Llama 3，为开源 AI 的性能树立了新标准，随后又于 7 月迅速推出了拥有 4050 亿个参数的 Llama 3.1。Llama 3.1 版本用于支持 Meta AI，Meta AI 是该公司的助手，集成在 WhatsApp、Messenger、Instagram 和 Facebook 等平台上，旨在成为使用最广泛的 AI 助手。

Llama 3.3： Llama 3.3于 2024 年 12 月发布，其性能可与大型模型相媲美，但计算成本仅为其一小部分，使其更适合企业应用程序。

与此同时，阿里巴巴的Qwen-2.5 系列和DeepSeek 的新 V2.5和R1-Lite 预览版等中国型号似乎突然出现在一些基准测试排行榜上名列前茅，而 Nvidia 本身除了提供显卡和软件架构外，还推出了自己的开源、强大的Nemotron-70B 模型。

Nous Research 是旧金山的一家小型机构，旨在提供更加个性化、限制更少的开源人工智能模型，该公司还推出了几个很酷的新想法。

我们不要忘记法国的Mistral，它迅速扩展了自己的开源和专有 AI 产品。

3. 谷歌双子系列成为最佳产品的有力竞争者

在今年的回归故事中，谷歌的 Gemini 系列人工智能模型曾因其奇怪的图像生成而受到嘲笑，并被批评为过于“醒目”，但它却以更强大的新版本强势回归，目前位居第三方性能基准测试排行榜榜首，对开发人员和企业的吸引力也越来越大。

谷歌推出了Gemini 2.0 Flash，这是一种多模态 AI 模型，支持流视频分析，可以在屏幕上查看和指导你正在做的事情，随后又推出了Gemini 2.0 Flash Thinking，与 OpenAI 的 o1 和 o3 推理模型相竞争。

4. Agentic AI 席卷企业

随着时间的推移，“代理”人工智能从一个热门话题变成了顶级企业软件供应商推出的一系列重要产品和举措。例如：

Salesforce 的 Agentforce 2.0： Salesforce几天前发布了 Agentforce 2.0 ，这是一款先进的 AI 代理程序，可增强其 CRM 和销售产品以及Slack 的推理、集成和定制功能，显著提高企业生产力工具。

SAP 的 Joule：SAP 将其 Joule 聊天机器人转换为由开源大型语言模型 (LLM ) 驱动的 AI 代理，推动企业环境中的创新和效率。

谷歌的 Project Astra：作为 Gemini 2.0 计划的一部分，谷歌推出了 Project Astra，这是一个人工智能助手，旨在通过利用谷歌的服务套件提供实时、情境响应，从而提高用户的工作效率和决策能力。

我对 2025 年的重大预测：人工智能生成的内容将占据主导地位

基于这些进步，2025 年将见证 AI 生成内容在商业和消费者领域的激增，特别是从 OpenAI 到 Meta、谷歌、微软、苹果，甚至埃隆马斯克的 xAI，现在都在其产品中内置了 AI 图像生成器。

此次扩展将简化内容创建、增强个性化并提高各个领域的效率。

此外，我们预计大型语言模型 (LLM) 和生成式人工智能机器人将在商业和消费者环境中得到大规模部署，从而彻底改变自动化和人机交互。

这就是 2024 年最后一期 #AIBeat 时事通讯的全部内容。感谢您的阅读、撰写、订阅、分享、评论以及与我们在一起。期待在 2025 年分享更多内容并听到更多来自大家的消息。

原创文章，作者：王浩然，如若转载，请注明出处：https://www.dian8dian.com/2024-nian-ren-gong-zhi-neng-de-si-da-xin-wen-he-2025-nian

Like (0)

王浩然作者

0 0

据报道，OpenAI 的。GPT-5 未达到预期

Previous 2024年12月23日

了解 GE Healthcare 如何使用 AWS 构建解释 MRI 的新型 AI 模型

Next 2024年12月24日

AI前沿

谷歌发布免费 Gemini 2.0 Flash Thinking 模型，对 OpenAI 的付费战略施压

谷歌悄然发布了其热门人工智能模型 Gemini 的重大更新，该模型现在可以解释其推理过程，在数学和科学任务中创下新的性能记录，并提供了 OpenAI 高级服务的免费替代方案。周二…

王浩然
2025年1月23日
000
AI前沿

振动编码在企业级AI工具中的应用：全面覆盖开发全生命周期

随着人工智能技术的飞速发展，振动编码（Vibe Coding）现象正逐渐从一个小众概念演变为主流开发方法。开发者们日益依赖AI来生成和辅助编写代码，GitHub Copilot等工…

王浩然
2天前
000
AI前沿

OpenAI的战略之举：Agent SDK及其对企业AI的深远影响

一、引言在AI领域，OpenAI一直是引领创新的先锋。近期，OpenAI发布了一项重大更新——Agent SDK，这一举措不仅巩固了其在企业AI市场的地位，还预示着AI技术应用的…

王浩然
2025年3月15日
000
AI前沿

腾讯推出“浑元3D 2.0”，人工智能让3D设计时间从几天缩短到几秒

腾讯推出了“浑元3D 2.0 ”，这是一款人工智能系统，可在几秒钟内将单幅图像或文字描述转化为详细的3D模型。该系统将一个通常需要很长时间的过程（熟练的艺术家可能需要几天或几周的时…

王浩然
2025年1月22日
000
AI前沿

亚马逊通过 AI 视频搜索改进 Ring 订阅服务

亚马逊正在改进其 Ring 视频门铃和摄像头的订阅服务。一项名为 Ring Home Premium 的新服务将包括全天候录制和人工智能视频搜索等功能，起价为每月 19.99 美…

王浩然
2024年10月10日
000
AI前沿

移动网络运营商如何利用人工智能革新电信行业

三十多年来，移动网络运营商 (MNO) 一直将研发重点放在五个关键领域：消息传递、漫游、策略、信令和清算。鉴于这些系统处理的数据量巨大，MNO 越来越注重利用人工智能 (AI)来增…

点点
2024年10月5日
000
AI前沿

Meta据传正计划推出独立AI聊天机器人应用‌

据报道，社交媒体巨头Meta正着手开发一款独立的AI聊天机器人应用，此举标志着Meta在人工智能领域的又一重大布局。 ‌一、应用背景与目的‌ 随着人工智能技术的飞速发展，聊天机器人…

王浩然
2025年3月1日
000
AI前沿

全球最大人工智能数据中心计划落户韩国

数据中心项目预计初始年收入将达到 35 亿美元，总价值有望达到 350 亿美元 LG 电子创始家族成员 Brian Koo 与韩国政府合作，打造了全球最大的人工智能数据中心。韩国…

王浩然
2025年2月19日
000
AI前沿

OpenAI 更新 ChatGPT Search，增加语音查询、更快的结果和移动地图集成

圣诞节的第八天，也就是“OpenAI 的 12 天”（ChatGPT 背后的公司发布的一系列假日主题公告）的第八天，OpenAI在 YouTube 上通过其现在熟悉的直播宣布了其标…

王浩然
2024年12月19日
000
AI前沿

Anomalo 的非结构化数据解决方案将企业 AI 部署时间缩短了 30%

长期以来用于结构化数据的数据质量工具现在正扩展到企业 AI 的非结构化数据。Anomalo 就是这样一家供应商，该公司多年来一直在开发用于结构化数据的数据质量平台。今天，该公司宣布…

王浩然
2024年11月25日
000
AI前沿

谷歌宣布重组以加速人工智能计划

谷歌首席执行官桑达尔·皮查伊宣布了一系列结构性变革和领导层任命，旨在加速公司的人工智能计划。此次重组后，由 Sissie Hsiao 领导的 Gemini 应用团队将加入由 De…

点点
2024年10月21日
000
AI前沿

我们能教机器像人类一样思考吗？

介绍当我开始学习人工智能时，最令人着迷的想法之一就是机器像人类一样思考。但是，当我仔细研究人工智能和机器学习方法的实际作用时，我惊讶地发现，课程和书籍中关于人类思维方式（即人类认…

王浩然
2024年10月20日
000
AI前沿

竞争日趋激烈，谷歌云推出 AI Agent Space

正如我们之前报道过的那样，云计算之战已迅速演变为人工智能之战，领先的云计算部门 Google Cloud、Microsoft Azure 和 Amazon Web Services…

王浩然
2024年11月26日
000
AI前沿

人工智能育儿已然到来，a16z 已做好准备

人工智能希望帮助我们更好地驾驶、更好地书写和更快地诊断疾病。现在想象一下人工智能帮助你成为更好的父母。安德森·霍洛维茨基金合伙人贾斯汀·摩尔 (Justine Moo…

王浩然
2024年11月8日
000
AI前沿

Anthropic发布新型AI模型：思考时长任你定‌

近日，Anthropic公司推出了一款创新的AI模型，该模型能够按照用户的意愿持续思考，为用户提供更加深入和全面的回答。这款AI模型的问世，标志着人工智能技术在理解和响应用户需求方…

王浩然
2025年2月27日
000
AI前沿

腾讯的 EzAudio AI 将文本转换为逼真的声音，引发创新和争论

约翰霍普金斯大学和腾讯 AI 实验室的研究人员推出了EzAudio，这是一种新的文本转音频 (T2A) 生成模型，有望以前所未有的效率从文本提示中产生高质量的音效。这一进步标志着人…

王浩然
2024年9月22日
000
iPhone 16 Pro是第一款感觉像相机的手机

摄影爱好者有句流行語——通常归因于Chase Jarvis——最好的相机就是你带的相机。换句话说，如果你想拍照时没有相机，相机有多好并不重要。如今，这将争辩说，最好的相机是我们大…

free
AI前沿 2024年9月28日
000
AI前沿

ChatGPT：全面解析这款AI聊天机器人

在人工智能（AI）技术日新月异的今天，一款名为ChatGPT的AI聊天机器人横空出世，迅速引起了业界的广泛关注。ChatGPT以其强大的自然语言处理能力、丰富的知识储备以及灵活的交…

王浩然
2025年3月28日
000
AI前沿

据报道，苹果正在投资 OpenAI，这可能预示着双方将建立更深层次的 ChatGPT 合作伙伴关系

据《华尔街日报》报道，苹果今年对自己的Apple Intelligence人工智能功能有着宏伟的计划，但可能会通过投资 OpenAI 来规避风险。考虑到OpenAI即将进行的融…

王浩然
2024年9月2日
000
AI前沿

随着“AlphaChip”的兴起，谷歌和 Meta 更新了他们的人工智能模型

于 OpenAI 的影响，本周人工智能新闻异常繁忙，包括首席执行官 Sam Altman 发表的一篇有争议的博客文章、高级语音模式的广泛推出、5GW数据中心的传闻、重大员工变动以及…

点点
2024年9月30日
000