Meta 的 Llama AI 模型现在也支持图像

王浩然 • 2024年9月29日上午10:00 • AI前沿 • 128 views

本杰明·富兰克林曾经写道，除了死亡和税收，没有什么是确定的。让我修改一下这句话，以反映当前的人工智能淘金热：除了死亡、税收和新的人工智能模型，没有什么是确定的，其中最后一种模式正在以越来越快的速度到来。

本周早些时候，谷歌发布了升级版Gemini模型，本月早些时候，OpenAI 发布了其 o1 模型。但周三，轮到 Meta 在门洛帕克举行的公司年度Meta Connect 2024 开发者大会上推出其最新产品了。

骆驼的多模态性

Meta 的多语言 Llama 系列模型已升级至 3.2 版，与 3.1 版相比，多个 Llama 模型现已实现多模式化。Llama 3.2 11B（紧凑型模型）和 90B（更大、功能更强大的模型）可以解读图表和图形、为图像添加标题，并根据简单描述精确定位图片中的物体。

例如，给定一张公园地图，Llama 3.2 11B 和 90B 可能能够回答诸如“什么时候地势会变得更陡峭？”和“这条路的距离是多少？”之类的问题。或者，给出一张显示公司一年内收入的图表，这些模型可以快速聚焦其中表现最好的月份。

对于希望严格将模型用于文本应用程序的开发人员，Meta 表示 Llama 3.2 11B 和 90B 被设计为 3.1 的“嵌入式”替代品。11B 和 90B 可以在有或没有新的安全工具 Llama Guard Vision 的情况下部署，该工具旨在检测输入到模型或由模型生成的潜在有害（即有偏见或有毒）文本和图像。

在世界上大多数地方，多模式 Llama 模型可以从许多云平台下载和使用，包括 Hugging Face、Microsoft Azure、Google Cloud 和 AWS。Meta 还将它们托管在官方 Llama 网站 Llama.com 上，并使用它们为其 AI 助手 Meta AI 提供支持，这些助手可在 WhatsApp、Instagram 和 Facebook 上使用。

但 Llama 3.2 11B 和 90B 在欧洲无法使用。因此，Meta AI 的几项在其他地方可用的功能（如图像分析）对欧洲用户不可用。Meta再次将责任归咎于欧盟监管环境的“不可预测性”。

Meta 对《人工智能法案》表示担忧，并拒绝了与之相关的自愿安全承诺。《人工智能法案》是欧盟制定的一项法律，旨在为人工智能建立法律和监管框架。除其他要求外，《人工智能法案》还要求在欧盟开发人工智能的公司承诺记录其模型是否有可能被部署在“高风险”情况下，例如警务。Meta 担心，其模型的“开放”性质使其无法深入了解这些模型的使用方式，这可能会使其难以遵守《人工智能法案》的规定。

Meta 面临的另一个问题是 GDPR（欧盟广泛的隐私法）中有关人工智能训练的规定。Meta 使用未选择退出的 Instagram 和 Facebook 用户的公开数据来训练模型，而这些数据在欧洲受到 GDPR 保障。欧盟监管机构今年早些时候要求 Meta 停止使用欧洲用户数据进行训练，同时评估该公司的 GDPR 合规性。

Meta 让步了，同时支持一封公开信，呼吁对 GDPR 进行“现代解读”，但不要“拒绝进步”。

本月初，Meta 表示，在“将监管反馈纳入”修订后的退出流程后，将恢复对英国用户数据的培训。但该公司尚未分享整个欧盟培训的最新进展。

更紧凑的型号

其他新的 Llama 模型（未根据欧洲用户数据进行训练的模型）将于周三在欧洲（和全球）推出。

Llama 3.2 1B 和 3B 是两款轻量级纯文本模型，专为在智能手机和其他边缘设备上运行而设计，可应用于总结和重写段落（例如在电子邮件中）等任务。Meta 表示，1B 和 3B 针对高通和联发科的 Arm 硬件进行了优化，经过一些配置后，还可以利用日历应用等工具，让它们自主采取行动。

8 月份发布的旗舰 Llama 3.1 405B模型，无论是否采用多模式，都没有后续产品。考虑到 405B 的庞大规模（需要数月时间进行训练），这可能是计算资源受限的问题。我们询问 Meta 是否还有其他因素在起作用，如果收到回复，我们会更新此报道。

Meta 的新 Llama Stack 是一套以 Llama 为中心的开发工具，可用于微调所有 Llama 3.2 模型：1B、3B、11B 和 90B。Meta 表示，无论如何定制，这些模型一次最多可以处理约 100,000 个单词。

争夺心智份额

Meta 首席执行官马克·扎克伯格经常谈论要确保所有人都能享受到人工智能的“好处和机遇”。然而，这种言论背后隐含着一种愿望，即这些工具和模型都是 Meta 创造的。

在可以商品化的模型上投入资金，迫使竞争对手（例如 OpenAI、Anthropic）降低价格，广泛传播 Meta 的 AI 版本，并让 Meta 吸收开源社区的改进。Meta 声称其 Llama 模型已被下载超过 3.5 亿次，并被 Zoom、AT&T 和高盛等大型企业使用。

对于许多开发者和公司来说，Llama 模型在最严格的意义上不是“开放”的，这并不重要。Meta 的许可证限制了某些开发者对其的使用方式；每月用户超过 7 亿的平台必须向 Meta 申请特殊许可证，Meta 将自行决定是否授予此类许可证。

当然，没有自己的内部模型的平台并不多。但 Meta 并没有特别透明地披露这一过程。本月，当我询问该公司是否已批准平台的自由裁量 Llama 许可时，一位发言人告诉我，Meta“对此话题没有任何可分享的信息”。

毫无疑问，Meta 正在全力以赴。它花费数百万美元游说监管机构接受其偏爱的“开放”人工智能，并向服务器、数据中心和网络基础设施投入数十亿美元来训练未来的模型。

Llama 3.2 模型均无法解决当今人工智能的主要问题，例如人工智能倾向于编造事物并重复使用有问题的训练数据（例如，可能未经许可使用受版权保护的电子书，这是针对 Meta 的集体诉讼的主题）。但是，正如我之前所写，它们确实推进了 Meta 的一个关键目标：成为人工智能的代名词，尤其是生成式人工智能。

原创文章，作者：王浩然，如若转载，请注明出处：https://www.dian8dian.com/meta-de-llama-ai-mo-xing-xian-zai-ye-zhi-chi-tu-xiang

Like (0)

王浩然作者

0 0

Meta 让企业能够创建嵌入广告的聊天机器人

Previous 2024年9月29日上午9:00

如何在 Photoshop 中使用 AI：我喜欢的 3 款令人惊叹的 AI 工具

Next 2024年9月29日上午11:00

AI前沿

马克·贝尼奥夫警告称，人工智能虽然有用，但被夸大了，并将部分责任归咎于微软

科技行业最热衷炒作的人之一、Salesforce 首席执行官马克·贝尼奥夫 (Marc Benioff) 想让你知道，他对生成式人工智能充满期待，但即便如此，他也不认为它能做到其最…

点点
2024年10月18日
000
AI前沿

Google Gemini 意外超越 OpenAI 跃居第一，但基准测试并不能说明全部情况

谷歌凭借其最新实验模型在一项关键的人工智能基准测试中名列前茅，标志着人工智能竞赛发生重大转变——但业内专家警告称，传统的测试方法可能不再有效衡量真正的人工智能能力。该模型名为“ …

王浩然
2024年11月19日
000
AI前沿

让董事会接受 GRC – 尤其是随着 AI 的采用不断增加

随着法规的增多和新技术的融合，治理、风险和合规 (GRC) 功能对于当今企业的健康、财务和安全而言正变得越来越重要。然而，GRC 需要支持才能很好地完成工作，而这需要自上而下的支持…

点点
2024年9月12日
000
AI前沿

Adobe 如何保护艺术家免受 AI 滥用

近年来，生成式人工智能在创造逼真的视觉效果、模仿艺术风格和创造全新表达形式方面的能力日益增强，重新定义了艺术的创作和体验方式。虽然这种转变为创意行业的创新和生产力提供了巨大的机会，…

点点
2024年10月16日
000
AI前沿

OpenAI翅膀硬了要单飞？急欲摆脱对微软数据中心依赖

划重点： OpenAI抱怨称，微软在为其供应服务器方面的响应速度不够快。 OpenAI正与甲骨文洽谈，计划联手构建一个全球最顶尖的AI数据中心。微软已承诺，将在2025年底之前向…

点点
2024年10月9日
000
AI前沿

卖家销量下降后，Poshmark 撤销了降低销售费用的决定

社交市场 Poshmark宣布将降低销售费用并提高买家费用后不久，由于卖家的愤怒，该公司决定恢复原来的收费结构。在周一发送给卖家的一封电子邮件中，创始人兼首席执行官 Manis…

王浩然
2024年10月23日
000
AI前沿

支持自动化公司的能力随着新现金和收购而增长

大卫·卡兰迪什 (David Karandish) 一直很忙。他的支持自动化公司Capacity原本计划进行 500 万美元的“过渡融资”，以帮助公司达到盈亏平衡点。但 TVC C…

王浩然
2024年10月17日
000
AI前沿

小语言模型如何通过测试时缩放解锁隐藏推理能力并超越大型语言模型‌

根据上海人工智能实验室的一项新研究，非常小的语言模型（SLMs）在推理任务中能够超越领先的大型语言模型（LLMs）。研究人员展示，通过正确的工具和测试时缩放技术，一个具有10亿参数…

王浩然
2025年2月22日
000
AI前沿

“个性化、不受限制”的人工智能实验室 Nous Research 推出首个开启推理模型：DeepHermes-3

人工智能推理模型——在文本中产生“思路链”（CoT）并反思自己的分析以尝试在输出响应之前中途捕捉错误的模型——现在风靡一时，这要归功于DeepSeek和OpenAI 的“o”系列。…

王浩然
2025年2月18日
000
AI前沿

Genies发布用户生成内容工具，让任何人都能创建自定义AI头像

Genies，这家专注于文化元素的头像技术公司，最近揭示了其用户生成内容（UGC）工具，该工具允许任何人创建自定义的AI头像。这一举措标志着Genies在构建其所谓的“Partie…

王浩然
4天前
000
AI前沿

CoreWeave与EcoDataCenter携手筹集5亿美元，打造AI可持续建筑‌

在人工智能领域不断发展的背景下，CoreWeave与EcoDataCenter宣布了一项雄心勃勃的合作计划。两家公司已共同筹集了5亿美元资金，旨在建设更加环保、高效的建筑，以支持A…

王浩然
2025年3月6日
000
AI前沿

为什么生成视频系统不能制作完整的电影？

生成式人工智能视频的出现和进步促使许多普通观察者预测，机器学习将导致我们所知的电影业的消亡——相反，单个创作者将能够在家里通过本地或基于云端的 GPU 系统创作好莱坞风格的大片。 …

王浩然
2024年9月24日
000
AI前沿

英国获得63亿英镑数据基础设施投资

美国四大公司宣布计划向英国数据基础设施投资总计 63 亿英镑。英国科技大臣彼得·凯尔在国际投资峰会上宣布了这一消息，称这是对英国与企业合作推动增长的方式的“信任投票”…

点点
2024年10月15日
000
AI前沿

Emergence 推出的 AI 协调器可以完成大型技术产品无法完成的任务：与其他产品良好协作

Emergence AI是一家由 IBM 研究院资深人员创立的初创公司，今年早些时候获得了超过 9700 万美元的融资，今天推出了企业级自主多智能体 AI 编排器，据称这是市场上最…

王浩然
2024年12月4日
000
AI前沿

Shaktiman Mall，Aviatrix 首席产品经理 – 访谈系列

Shaktiman Mall是 Aviatrix 的首席产品经理。凭借十多年的网络解决方案设计和实施经验，Mall 以其独创性、创造力、适应性和精确性而自豪。在加入 Aviatri…

点点
2024年9月1日
000
AI前沿

法官允许加州禁止未成年人食用成瘾性食品的禁令生效

周二晚些时候，一名联邦法官阻止了科技游说团体 NetChoice 对加州最近颁布的法律SB 976的挑战，该法律禁止公司向未成年人提供“上瘾内容”。该决定的效果是，从周三开始，除…

王浩然
2025年1月2日
000
AI前沿

Verizon 以 200 亿美元收购 Frontier Communications

此次收购扩大了 Verizon 的覆盖范围，并扩展了其智能边缘网络，以实现包括人工智能和物联网在内的数字创新

点点
2024年9月7日
000
AI前沿

Twins首推AI智能体：专为Qonto客户打造的发票检索助手

在数字化转型的浪潮中，金融科技领域正经历着前所未有的变革。近日，创新企业Twins宣布推出其首款AI智能体——专为Qonto客户设计的发票检索助手。这一举措不仅标志着AI技术在财务…

王浩然
2025年3月28日
000
AI前沿

微软的 AI 生态系统如何胜过 Salesforce 和 AWS

人工智能代理是一种自主系统，旨在执行通常需要人类参与的任务。通过使用高级算法，这些代理可以处理各种功能，从回答客户查询到预测业务趋势。这种自动化不仅简化了重复流程，还使人类工作者能…

王浩然
2024年12月26日
000
AI前沿

OpenText 扩展 AI 功能以提高企业生产力和投资回报率

关于人工智能及其能为企业带来什么，人们有着很多炒作和承诺。对于企业软件供应商OpenText来说，超越炒作，真正展示人工智能的价值，已经成为日常任务。今天，OpenText 宣布…

王浩然
2024年11月22日
000

发表回复

Please Login to Comment

Meta 的 Llama AI 模型现在也支持图像

骆驼的多模态性

更紧凑的型号

争夺心智份额

相关推荐

发表回复

Share To :