Meta 的 Llama 3.2：利用设备端和多模式功能重新定义开源生成式 AI

点点 • 2024年9月28日下午6:00 • AI前沿 • 92 views

Meta 最近推出了 Llama 3.2 ，这是其 Llama 系列大型语言模型的最新版本，是开源生成式 AI 生态系统发展的重要进展。此次升级在两个维度上扩展了 Llama 的功能。一方面，Llama 3.2 允许处理多模态数据（集成图像、文本等），使更广泛的受众能够使用高级 AI 功能。另一方面，它拓宽了其在边缘设备上的部署潜力，为实时设备端 AI 应用创造了令人兴奋的机会。在本文中，我们将探讨这一发展及其对未来 AI 部署的影响。

骆驼的进化

Meta 的 Llama 之旅始于 2023 年初，在此期间，该系列经历了爆炸式增长和采用。从 Llama 1 开始，当时仅限于非商业用途，只有部分研究机构可以访问，随着 2023 年 Llama 2 的发布，该系列过渡到开源领域。今年早些时候推出的 Llama 3.1 是该进化过程中向前迈出的重要一步，因为它引入了最大的开源模型，参数数量为 4050 亿，与其专有竞争对手相当甚至超过。最新版本的 Llama 3.2 更进一步，引入了新的轻量级和以视觉为中心的模型，使设备上的 AI 和多模式功能更易于访问。Meta 对开放性和可修改性的奉献使 Llama 成为开源社区的领先模型。该公司相信，通过坚持透明度和可访问性，我们可以更有效地推动 AI 创新——不仅对开发人员和企业，而且对全世界的每个人。

隆重推出 Llama 3.2

Llama 3.2 是 Meta 的 Llama 系列的最新版本，包含各种语言模型，旨在满足各种需求。最大和中等规模的模型包括 900 亿和 110 亿个参数，旨在处理包括文本和图像在内的多模态数据。这些模型可以有效地解释图表、图形和其他形式的视觉数据，使其适合在计算机视觉、文档分析和增强现实工具等领域构建应用程序。轻量级模型具有 10 亿和 30 亿个参数，专门用于移动设备。这些纯文本模型在多语言文本生成和工具调用功能方面表现出色，使其在检索增强生成、摘要和在边缘设备上创建个性化的基于代理的应用程序等任务中非常有效。

Llama 3.2 的意义

此次发布的 Llama 3.2 在两个关键领域取得了进步。

多模态人工智能的新时代

Llama 3.2 是 Meta 首个同时具备文本和图像处理功能的开源模型。这是开源生成式人工智能发展过程中的一项重大进展，因为它使模型能够分析和响应视觉输入以及文本数据。例如，用户现在可以上传图像并根据自然语言提示接收详细分析或修改，例如识别对象或生成标题。马克·扎克伯格在发布会上强调了这一功能，称 Llama 3.2 旨在“实现许多需要视觉理解的有趣应用”。这种集成扩大了 Llama 的应用范围，使其适用于依赖多模式信息的行业，包括零售、医疗、教育和娱乐。

设备上的无障碍功能

Llama 3.2 的突出特点之一是它针对设备部署进行了优化，特别是在移动环境中。该模型的轻量级版本具有 10 亿和 30 亿个参数，专门设计用于在搭载 Qualcomm 和联发科硬件的智能手机和其他边缘设备上运行。该实用程序允许开发人员创建应用程序，而无需大量计算资源。此外，这些模型版本在多语言文本处理方面表现出色，并支持 128K 标记的更长上下文长度，使用户能够用他们的母语开发自然语言处理应用程序。此外，这些模型还具有工具调用功能，允许用户直接在他们的设备上参与代理应用程序，例如管理日历邀请和计划旅行。

本地部署 AI 模型的能力使开源 AI 能够克服与云计算相关的挑战，包括延迟问题、安全风险、高运营成本以及对互联网连接的依赖。这一进步有可能改变医疗、教育和物流等行业，使它们能够在不受云基础设施或隐私问题限制的情况下实时使用 AI。这也为 AI 进入连接受限的地区打开了大门，使尖端技术的使用变得民主化。

竞争优势

Meta 报告称，Llama 3.2 在性能方面的表现与 OpenAI 和 Anthropic 的领先模型不相上下。他们声称 Llama 3.2 在各种基准测试中都优于 Claude 3-Haiku 和 GPT-4o-mini 等竞争对手，包括指令跟踪和内容摘要任务。这种竞争优势对 Meta 至关重要，因为它旨在确保开源 AI 在快速发展的生成 AI 领域与专有模型保持同步。

Llama Stack：简化 AI 部署

Llama 3.2 版本的一个关键方面是引入了 Llama Stack。这套工具使开发人员能够更轻松地在不同环境中使用 Llama 模型，包括单节点、本地、云和设备上的设置。Llama Stack 包括对 RAG 和支持工具的应用程序的支持，为部署生成式 AI 模型提供了灵活、全面的框架。通过简化部署流程，Meta 使开发人员能够轻松地将 Llama 模型集成到他们的应用程序中，无论是用于云、移动还是桌面环境。

底线

Meta 的 Llama 3.2是开源生成式 AI 发展的重要时刻，为可访问性、功能性和多功能性树立了新的标杆。凭借其设备端功能和多模式处理，该模型为从医疗保健到教育等各个行业带来了变革性的可能性，同时解决了隐私、延迟和基础设施限制等关键问题。通过让开发人员能够高效地在本地部署高级 AI，Llama 3.2 不仅扩大了 AI 应用的范围，还在全球范围内实现了尖端技术的民主化。

原创文章，作者：点点，如若转载，请注明出处：https://www.dian8dian.com/meta-de-llama-3-2-li-yong-she-bei-duan-he-duo-mo-shi-gong

AI AI 模型 GPT Llama 3.2 Meta OpenAI 大型语言模型

Like (0)

点点

0 0

人工智能与人工智能：权威手机数据如何帮助预防人工智能欺诈

Previous 2024年9月28日下午5:00

Cassette Group 首席执行官兼联合创始人 Ben Taylor – 访谈系列

Next 2024年9月28日下午7:00

AI前沿

随着代理 AI 编码工具市场加速发展，GitHub Copilot 预览代理模式

Agentic AI 如今在应用程序开发和编码等多个领域风靡一时。今天， GitHub终于加入了代理 AI 阵营，推出了 GitHub Copilot 代理模式。开发中的代理 A…

王浩然
2025年2月7日
000
AI前沿

得益于“负责任的”人工智能，经典圣诞歌曲获得西班牙语改编授权

自 1958 年发行以来的几十年里，布伦达·李 (Brenda Lee) 的摇滚风格歌曲《Rockin’ Around the Christmas Tree》已成为有史…

王浩然
2024年10月26日
000
AI前沿

AWS 将数据库价格降低近 50%，并增加了分布式扩展功能

AWS正在扩展其云数据库产品组合的功能，同时降低企业成本。在今天的AWS re:invent 2024会议上，这家云计算巨头概述了一系列云数据库创新。其中包括新的 Amazon …

王浩然
2024年12月6日
000
AI前沿

超级马里奥成AI新基准测试工具‌

近年来，人工智能（AI）领域的发展日新月异，各类基准测试工具层出不穷，用于评估AI模型的性能。而近日，一个令人意想不到的角色——超级马里奥，竟也加入了这一行列，成为衡量AI能力的新…

王浩然
2025年3月5日
000
AI前沿

NVIDIA Isaac GR00T N1：重新定义人形机器人的未来

在人工智能和机器人技术的交汇点，NVIDIA的Isaac GR00T N1项目正引领着人形机器人领域的一场革命。这一创新不仅展现了技术在模拟人类动作和智能方面的惊人进步，更预示着一…

王浩然
2025年3月25日
000
AI前沿

离开OpenAI后，Ilya拿了10亿美金对抗AI作恶

当地时间 9 月 4 日，OpenAI 前联合创始人 Ilya Sutskever 所创立的 AI 初创公司 SSI（Safe Superintelligence）在其社交媒体官方…

点点
2024年9月7日
000
AI前沿

AI 是否能通过妨碍安全检查来故意破坏用户？可以，但目前做得不太好

人工智能公司声称已经实施了严格的安全检查，以确保模型不会说或做奇怪、非法或不安全的事情。但如果模型能够逃避这些检查，并出于某种原因试图破坏或误导用户，该怎么办？据 Anthropi…

王浩然
2024年10月21日
000
AI前沿

Voltron Data与Accenture联手，攻克AI数据处理的重大难题

随着人工智能技术的迅猛发展，企业对数据处理能力的需求达到了前所未有的高度。Mountain View的初创公司Voltron Data与全球知名咨询公司Accenture宣布达成战…

王浩然
2025年2月23日
000
AI前沿

用AI找客户，半年怒赚200万美元，AI销售是Agent的下一站

继搜索、抄写、写作、编程之后，销售成为AI Agent的下一个重要落地场景。根据字节跳动推出的《生成式AI商业落地白皮书》，经过590名企业中高层的票选，在“十大生成式AI最有价…

点点
2024年9月12日
000
AI前沿

Duolingo 评论：你能达到 100% 流利程度吗？我的经验

学习一门新语言很容易让人不知所措。在记忆词汇、掌握复杂的语法规则和练习发音之间，难怪许多人在开始之前就放弃了。然而， Duolingo提供了一种令人耳目一新的替代方案！与依赖教科…

AI评测师
2024年9月24日
000
AI前沿

忘掉 Nvidia：Ndea 希望打造能够不断自我改进且“看不到任何瓶颈”的人工智能

谷歌前工程师、广为使用的 Python 深度学习框架Keras的创建者 François Chollet 与 Zapier 联合创始人 Mike Knoop 共同创立了新的人工智能…

王浩然
2025年1月16日
000
AI前沿

苹果放弃投资 OpenAI，硅谷史上最大融资悬了？CEO 曝出丑闻，GPT-5 或将难产

OpenAI 正分崩离析今天，我做出了一个艰难的决定，那就是继续留在 OpenAI。 OpenAI 最近的日子可谓冰火两重天，一方面，融资活动如火如荼；另…

点点
2024年9月29日
000
AI前沿

人类视觉模型的基础

大规模预训练以及随后针对特定任务的语言建模微调取得了巨大成功，这种方法已成为一种标准做法。同样，计算机视觉方法也逐渐采用大规模数据进行预训练。LAION5B、Instagram-3…

点点
2024年9月11日
000
AI前沿

Pinterest 向广告商推出用于产品图像的 genAI 工具

图片灵感和购物网站Pinterest是最新一家向广告商推出生成式 AI 产品的科技公司，此前谷歌、亚马逊等公司也采取了类似举措。在周二的Pinterest Presents广告商活…

王浩然
2024年10月2日
000
AI前沿

数据新时代的交易枢纽：Carbon Arc打造授权交易数据市场，赋能LLMs与企业应用

在数据被誉为“新石油”的当今时代，数据的重要性不言而喻。然而，尽管数据被视为一种宝贵的资源，但其交易与流通却远不如石油那样顺畅。数据的获取往往伴随着法律纠纷与版权问题，使得企业在追…

王浩然
2025年3月24日
000
AI前沿

Apple Intelligence 在 iOS 18.1 首次发布时更注重便利性

经过大肆宣传，该公司的 AI 功能套件Apple Intelligence终于在本周随 iOS 18.1 更新向用户发布。我通过测试版软件使用了这些功能几个月，意识到本周推出的功能…

王浩然
2024年10月30日
000
AI前沿

利用人工智能进行漏洞评估

根据Cybersecurity Ventures 2023 年的一份报告，到 2025 年，网络犯罪估计每年将给世界造成 10.5 万亿美元的损失。每年记录在案的网络犯罪数量都…

点点
2024年10月7日
000
AI前沿

为什么生成视频系统不能制作完整的电影？

生成式人工智能视频的出现和进步促使许多普通观察者预测，机器学习将导致我们所知的电影业的消亡——相反，单个创作者将能够在家里通过本地或基于云端的 GPU 系统创作好莱坞风格的大片。 …

王浩然
2024年9月24日
000
AI前沿

Perplexity 与Carbon 的集成将使企业更容易将其数据连接到 AI 搜索

2024 年是Perplexity辉煌的一年。这家由前 DeepMind 和 OpenAI 研究员 Aravind Srinivas 创立的人工智能搜索初创公司筹集了数亿美元——据…

王浩然
2024年12月21日
000
AI前沿

Nvidia 的“Eagle”人工智能以超高清视角看世界，它将取代你的工作

Nvidia 的研究人员推出了“ Eagle ”，这是一组新的人工智能模型，可以显著提高机器理解和与视觉信息交互的能力。该项研究发表在 arXiv 上，展示了从视觉问答到文档理解…

王浩然
2024年9月3日
000