从各方面来看,2024 年都是人工智能迄今为止最重要的一年——至少就该技术的商业化而言。
2022 年末 ChatGPT 的推出推动了大型语言模型 (LLM) 热潮,这一热潮丝毫没有放缓的迹象,不仅 OpenAI 和微软、Meta 和谷歌等巨头都推出了众多新的 LLM,还有许多其他初创公司和个人开发者也推出了众多新的 LLM。
事实证明,有关人工智能研究放缓的报道即使不是毫无根据的,也肯定是夸大其词。
此外,超越大多数大型 LLM 所依赖的 Transformer 架构的新技术开始浮出水面,例如Liquid AI 的 Liquid Foundation 模型。
最后,公司开始全面接受人工智能的“代理”方法——开发特定的人工智能机器人、应用程序和工作流程,它们可以独立解决特定问题,或者比 LLM 聊天机器人典型的来回沟通更少的人工管理。
将今年的新闻故事提炼为 14 大新闻,更不用说 10 大新闻或 4 大新闻,是一项令人烦恼的工作。但我还是继续尝试,尽管有点作弊,将几则新闻合并成更大的主题。在我看来,以下是今年将产生最大影响的内容:
1. OpenAI 的扩张范围超越了 ChatGPT
尽管面临着来自新手和传统技术,甚至是其投资者和合作伙伴微软的激烈竞争,但这家可以说是开启人工智能时代最具影响力的公司今年仍表现不俗。
o1 模型:OpenAI 发布了其 GPT 系列之外的首个大型通用模型系列,即o1“推理”系列,该系列分配了更多时间来处理复杂提示,从而提高了准确性。它在科学、编码和推理任务中特别有效。
o3 模型:继 9 月份的 o1 模型之后,OpenAI 于年底发布了更为先进的 o3 模型。虽然该模型要到 2025 年初才会向公众发布,甚至不会向任何第三方发布,但这表明 OpenAI 并没有满足于现状。
ChatGPT 搜索:此功能最初作为仅限邀请的独立产品SearchGPT推出,后来被整合到 ChatGPT 中,可以在 ChatGPT 中实现更实时的网络信息检索和更精致的搜索结果呈现,增强其对最新查询的实用性,并与 Google、Bing 和新来者 Perplexity 展开正面交锋。
Canvas:Canvas 于 10 月推出,它将ChatGPT 界面从对话界面扩展为类似工作站的窗格,可以根据用户的要求(例如编辑文档或编码项目)动态更新内容。当然,很难不把它看作是对几个月前 Anthropic 宣布的 Artifacts 的回应,或者至少是与之类似的功能。
Sora:在用其严密保护的视频生成器模型向我们展示了近一年之后,OpenAI 终于在 12 月初向大众推出了 Sora,并迅速引起了广泛的反响,因为它试图通过独特且深思熟虑的界面和故事板功能在竞争激烈的 AI 视频领域中脱颖而出。
2. 开源人工智能开始腾飞
Llama 3 和 3.1:Meta于 4 月推出了 Llama 3,为开源 AI 的性能树立了新标准,随后又于 7 月迅速推出了拥有 4050 亿个参数的 Llama 3.1。Llama 3.1 版本用于支持 Meta AI,Meta AI 是该公司的助手,集成在 WhatsApp、Messenger、Instagram 和 Facebook 等平台上,旨在成为使用最广泛的 AI 助手。
Llama 3.3: Llama 3.3于 2024 年 12 月发布,其性能可与大型模型相媲美,但计算成本仅为其一小部分,使其更适合企业应用程序。
与此同时,阿里巴巴的Qwen-2.5 系列和DeepSeek 的新 V2.5和R1-Lite 预览版等中国型号似乎突然出现在一些基准测试排行榜上名列前茅,而 Nvidia 本身除了提供显卡和软件架构外,还推出了自己的开源、强大的Nemotron-70B 模型。
Nous Research 是旧金山的一家小型机构,旨在提供更加个性化、限制更少的开源人工智能模型,该公司还推出了几个很酷的新想法。
我们不要忘记法国的Mistral,它迅速扩展了自己的开源和专有 AI 产品。
3. 谷歌双子系列成为最佳产品的有力竞争者
在今年的回归故事中,谷歌的 Gemini 系列人工智能模型曾因其奇怪的图像生成而受到嘲笑,并被批评为过于“醒目”,但它却以更强大的新版本强势回归,目前位居第三方性能基准测试排行榜榜首,对开发人员和企业的吸引力也越来越大。
谷歌推出了Gemini 2.0 Flash,这是一种多模态 AI 模型,支持流视频分析,可以在屏幕上查看和指导你正在做的事情,随后又推出了Gemini 2.0 Flash Thinking,与 OpenAI 的 o1 和 o3 推理模型相竞争。
4. Agentic AI 席卷企业
随着时间的推移,“代理”人工智能从一个热门话题变成了顶级企业软件供应商推出的一系列重要产品和举措。例如:
Salesforce 的 Agentforce 2.0: Salesforce几天前发布了 Agentforce 2.0 ,这是一款先进的 AI 代理程序,可增强其 CRM 和销售产品以及Slack 的推理、集成和定制功能,显著提高企业生产力工具。
SAP 的 Joule:SAP 将其 Joule 聊天机器人转换为由开源大型语言模型 (LLM ) 驱动的 AI 代理,推动企业环境中的创新和效率。
谷歌的 Project Astra:作为 Gemini 2.0 计划的一部分,谷歌推出了 Project Astra,这是一个人工智能助手,旨在通过利用谷歌的服务套件提供实时、情境响应,从而提高用户的工作效率和决策能力。
我对 2025 年的重大预测:人工智能生成的内容将占据主导地位
基于这些进步,2025 年将见证 AI 生成内容在商业和消费者领域的激增,特别是从 OpenAI 到 Meta、谷歌、微软、苹果,甚至埃隆马斯克的 xAI,现在都在其产品中内置了 AI 图像生成器。
此次扩展将简化内容创建、增强个性化并提高各个领域的效率。
此外,我们预计大型语言模型 (LLM) 和生成式人工智能机器人将在商业和消费者环境中得到大规模部署,从而彻底改变自动化和人机交互。
这就是 2024 年最后一期 #AIBeat 时事通讯的全部内容。感谢您的阅读、撰写、订阅、分享、评论以及与我们在一起。期待在 2025 年分享更多内容并听到更多来自大家的消息。
原创文章,作者:王 浩然,如若转载,请注明出处:https://www.dian8dian.com/2024-nian-ren-gong-zhi-neng-de-si-da-xin-wen-he-2025-nian