本杰明·富兰克林曾经写道,除了死亡和税收,没有什么是确定的。让我修改一下这句话,以反映当前的人工智能淘金热:除了死亡、税收和新的人工智能模型,没有什么是确定的,其中最后一种模式正在以越来越快的速度到来。
本周早些时候,谷歌发布了升级版Gemini模型,本月早些时候,OpenAI 发布了其 o1 模型。但周三,轮到 Meta 在门洛帕克举行的公司年度Meta Connect 2024 开发者大会上推出其最新产品了。
骆驼的多模态性
Meta 的多语言 Llama 系列模型已升级至 3.2 版,与 3.1 版相比,多个 Llama 模型现已实现多模式化。Llama 3.2 11B(紧凑型模型)和 90B(更大、功能更强大的模型)可以解读图表和图形、为图像添加标题,并根据简单描述精确定位图片中的物体。
例如,给定一张公园地图,Llama 3.2 11B 和 90B 可能能够回答诸如“什么时候地势会变得更陡峭?”和“这条路的距离是多少?”之类的问题。或者,给出一张显示公司一年内收入的图表,这些模型可以快速聚焦其中表现最好的月份。
对于希望严格将模型用于文本应用程序的开发人员,Meta 表示 Llama 3.2 11B 和 90B 被设计为 3.1 的“嵌入式”替代品。11B 和 90B 可以在有或没有新的安全工具 Llama Guard Vision 的情况下部署,该工具旨在检测输入到模型或由模型生成的潜在有害(即有偏见或有毒)文本和图像。
在世界上大多数地方,多模式 Llama 模型可以从许多云平台下载和使用,包括 Hugging Face、Microsoft Azure、Google Cloud 和 AWS。Meta 还将它们托管在官方 Llama 网站 Llama.com 上,并使用它们为其 AI 助手 Meta AI 提供支持,这些助手可在 WhatsApp、Instagram 和 Facebook 上使用。
但 Llama 3.2 11B 和 90B 在欧洲无法使用。因此,Meta AI 的几项在其他地方可用的功能(如图像分析)对欧洲用户不可用。Meta再次将责任归咎于欧盟监管环境的“不可预测性”。
Meta 对《人工智能法案》表示担忧,并拒绝了与之相关的自愿安全承诺。《人工智能法案》是欧盟制定的一项法律,旨在为人工智能建立法律和监管框架。除其他要求外,《人工智能法案》还要求在欧盟开发人工智能的公司承诺记录其模型是否有可能被部署在“高风险”情况下,例如警务。Meta 担心,其模型的“开放”性质使其无法深入了解这些模型的使用方式,这可能会使其难以遵守《人工智能法案》的规定。
Meta 面临的另一个问题是 GDPR(欧盟广泛的隐私法)中有关人工智能训练的规定。Meta 使用未选择退出的 Instagram 和 Facebook 用户的公开数据来训练模型,而这些数据在欧洲受到 GDPR 保障。欧盟监管机构今年早些时候要求 Meta 停止使用欧洲用户数据进行训练,同时评估该公司的 GDPR 合规性。
Meta 让步了,同时支持一封公开信,呼吁对 GDPR 进行“现代解读”,但不要“拒绝进步”。
本月初,Meta 表示,在“将监管反馈纳入”修订后的退出流程后,将恢复对英国用户数据的培训。但该公司尚未分享整个欧盟培训的最新进展。
更紧凑的型号
其他新的 Llama 模型(未根据欧洲用户数据进行训练的模型)将于周三在欧洲(和全球)推出。
Llama 3.2 1B 和 3B 是两款轻量级纯文本模型,专为在智能手机和其他边缘设备上运行而设计,可应用于总结和重写段落(例如在电子邮件中)等任务。Meta 表示,1B 和 3B 针对高通和联发科的 Arm 硬件进行了优化,经过一些配置后,还可以利用日历应用等工具,让它们自主采取行动。
8 月份发布的旗舰 Llama 3.1 405B模型,无论是否采用多模式,都没有后续产品。考虑到 405B 的庞大规模(需要数月时间进行训练),这可能是计算资源受限的问题。我们询问 Meta 是否还有其他因素在起作用,如果收到回复,我们会更新此报道。
Meta 的新 Llama Stack 是一套以 Llama 为中心的开发工具,可用于微调所有 Llama 3.2 模型:1B、3B、11B 和 90B。Meta 表示,无论如何定制,这些模型一次最多可以处理约 100,000 个单词。
争夺心智份额
Meta 首席执行官马克·扎克伯格经常谈论要确保所有人都能享受到人工智能的“好处和机遇”。然而,这种言论背后隐含着一种愿望,即这些工具和模型都是 Meta 创造的。
在可以商品化的模型上投入资金,迫使竞争对手(例如 OpenAI、Anthropic)降低价格,广泛传播 Meta 的 AI 版本,并让 Meta 吸收开源社区的改进。Meta 声称其 Llama 模型已被下载超过 3.5 亿次,并被 Zoom、AT&T 和高盛等大型企业使用。
对于许多开发者和公司来说,Llama 模型在最严格的意义上不是“开放”的,这并不重要。Meta 的许可证 限制了 某些开发者对其的使用方式;每月用户超过 7 亿的平台必须向 Meta 申请特殊许可证,Meta 将自行决定是否授予此类许可证。
当然,没有自己的内部模型的平台并不多。但 Meta 并没有特别透明地披露这一过程。本月,当我询问该公司是否已批准平台的自由裁量 Llama 许可时,一位发言人告诉我,Meta“对此话题没有任何可分享的信息”。
毫无疑问,Meta 正在全力以赴。它花费 数百万美元游说监管机构接受其偏爱的“开放”人工智能,并向服务器、数据中心和网络基础设施投入数十亿美元来训练未来的模型。
Llama 3.2 模型均无法解决当今人工智能的主要问题,例如人工智能倾向于编造事物并重复使用有问题的训练数据(例如,可能未经许可使用受版权保护的电子书,这是针对 Meta 的集体诉讼的主题)。但是,正如我之前所写,它们确实推进了 Meta 的一个关键目标:成为人工智能的代名词,尤其是生成式人工智能。
原创文章,作者:王 浩然,如若转载,请注明出处:https://www.dian8dian.com/meta-de-llama-ai-mo-xing-xian-zai-ye-zhi-chi-tu-xiang