Meta 在手机 AI 竞赛中击败谷歌和苹果

王浩然 • 2024年10月27日上午10:00 • AI前沿 • 118 views

Meta Platforms创建了其 Llama 人工智能模型的较小版本，可以在智能手机和平板电脑上运行，为数据中心以外的人工智能开辟了新的可能性。

该公司今天宣布推出其Llama 3.2 1B和3B 型号的压缩版本，其运行速度比早期版本快四倍，而占用的内存却不到早期版本的一半。根据 Meta 的测试，这些较小型号的性能几乎与较大型号相当。

Meta 如何让大型语言模型在手机上运行

这项进步使用了一种称为量化的压缩技术，它简化了支持 AI 模型的数学计算。Meta 结合了两种方法：使用 LoRA 适配器 (QLoRA) 的量化感知训练以保持准确性，以及使用SpinQuant来提高可移植性。

这项技术成果解决了一个关键问题：运行先进的人工智能时无需大量计算能力。到目前为止，复杂的人工智能模型需要数据中心和专用硬件。

在OnePlus 12 Android 手机上进行的测试表明，压缩后的模型体积缩小了 56%，占用的内存减少了 41%，同时处理文本的速度提高了一倍多。这些模型最多可以处理 8,000 个字符的文本，足以满足大多数移动应用的需求。

科技巨头竞相定义人工智能的移动未来

Meta 的发布加剧了科技巨头之间为控制 AI 在移动设备上的运行方式而展开的战略斗争。尽管谷歌和苹果对移动 AI 采取了谨慎、可控的方法——将其与操作系统紧密集成——但 Meta 的策略却截然不同。

通过开源这些压缩模型并与芯片制造商高通和联发科合作，Meta 绕过了传统的平台守门人。开发人员无需等待谷歌的Android 更新或苹果的iOS 功能即可构建 AI 应用程序。这一举措与移动应用程序的早期阶段如出一辙，当时开放平台极大地加速了创新。

与高通和联发科的合作意义重大。这两家公司为全球大多数 Android 手机提供支持，包括 Meta 认为具有增长潜力的新兴市场的设备。通过针对这些广泛使用的处理器优化其模型，Meta 确保其 AI 能够在不同价位的手机上高效运行，而不仅仅是高端设备。

Meta决定通过其Llama 网站和影响力日益增强的 AI 模型中心Hugging Face进行分发，表明 Meta 致力于在开发人员工作的地方接触他们。这种双重分发策略可以帮助 Meta 的压缩模型成为移动 AI 开发的事实标准，就像TensorFlow和PyTorch成为机器学习的标准一样。

口袋里的人工智能的未来

Meta 今天的声明表明人工智能正在发生更大转变：从集中式计算转向个人计算。虽然基于云的人工智能将继续处理复杂任务，但这些新模型表明，未来手机可以私密且快速地处理敏感信息。

时机很重要。科技公司在数据收集和人工智能透明度方面面临越来越大的压力。Meta 的方法——让这些工具开放并直接在手机上运行——解决了这两个问题。你的手机，而不是远程服务器，很快就能处理文档摘要、文本分析和创意写作等任务。

这反映了计算领域的其他重大转变。正如处理能力从大型机转移到个人电脑，计算能力从台式机转移到智能手机一样，人工智能似乎也准备好向个人设备过渡。Meta 认为，开发人员将接受这一变化，创建将移动应用的便利性与人工智能的智能相结合的应用程序。

成功并非板上钉钉。这些模型仍然需要功能强大的手机才能运行良好。开发人员必须权衡隐私的好处和云计算的原始能力。而 Meta 的竞争对手，尤其是苹果和谷歌，对手机上 AI 的未来有着自己的愿景。

但有一点是清楚的：人工智能正在从一部手机中摆脱数据中心的束缚。

原创文章，作者：王浩然，如若转载，请注明出处：https://www.dian8dian.com/meta-zai-shou-ji-ai-jing-sai-zhong-ji-bai-gu-ge-he-ping-guo

AI 竞赛 Android LLaMA Meta PyTorch 联发科苹果谷歌

Like (0)

王浩然作者

0 0

DeepMind 的 Talker-Reasoner 框架为 AI 代理带来了系统 2 思维

Previous 2024年10月27日

企业对人工智能模型的判断：开源为何会胜出

Next 2024年10月27日

AI前沿

薪资初创公司 Warp 与发表白人至上言论的“关联公司”断绝关系

Warp是纽约的一家年轻的薪资初创公司，由于与该公司关联的一个账户发布了一些有争议的帖子而备受关注。周四，一个名为维托里奥 (Vittorio) 的账户在 X 上发帖称，“我更喜…

点点
2024年9月8日
000
AI前沿

联发科新天玑1000旗舰移动芯片上的“Agentic”AI到底是什么？

每个芯片制造商都在 AI 领域孤注一掷，但联发科的 Dimensity 9400 SoC 却推动了“代理”AI 的概念，即能够为您控制手机的 AI。总部位于中国的芯片制造商联发科…

王浩然
2024年10月10日
000
AI前沿

应对副驾驶的安全风险

越来越多的企业正在使用副驾驶和低代码平台，使员工（即使是那些技术专长很少或没有技术专长的员工）能够创建强大的副驾驶和业务应用程序，以及处理大量数据。 Zenity 的一份新报告《2…

点点
2024年9月25日
000
AI前沿

AlphaProteo：谷歌 DeepMind 在蛋白质设计方面的突破

在不断发展的分子生物学领域，最具挑战性的任务之一是设计能够有效结合特定靶标（例如病毒蛋白、癌症标志物或免疫系统成分）的蛋白质。这些蛋白质结合物是药物发现、疾病治疗、诊断和生物技术中…

点点
2024年9月18日
000
AI前沿

联邦政府太穷且太愚蠢，无法应对AI革命

不管你喜欢还是讨厌，人工智能正在世界各地的办公室里蓬勃发展。除非这些办公室里都是为美国联邦政府工作的员工。Fedscoop 的一份新报告对华盛顿能否跟上时代的步伐表示怀疑。根据其对…

王浩然
2024年10月15日
000
AI前沿

这家初创公司刚刚赢得五角大楼首份人工智能国防合同

美国国防部已将其首份生成式人工智能防御合同授予Jericho Security，标志着军事网络安全的战略转变。这份价值 180 万美元的小型企业技术转让 (STTR) 第二阶段合同…

王浩然
2024年11月6日
000
AI前沿

利用人工智能代理优化公司工作流程：神话还是现实？

一个问题随着越来越多的大公司投资人工智能代理，将其视为提高运营效率的未来，越来越多的怀疑论者也开始涌现。虽然人们对这些技术的潜力感到兴奋，但许多组织发现，现实往往与炒作的程度不符…

点点
2024年11月6日
000
AI前沿

OpenAI 确认新前沿模型 o3 和 o3-mini

OpenAI 正在慢慢邀请选定的用户测试一整套新的推理模型，名为 o3 和 o3 mini，它们是本月初刚刚全面发布的o1 和 o1-mini 模型的后继者。 OpenAI o3 …

王浩然
2024年12月21日
000
AI前沿

Decart 的 AI 模拟了 Minecraft 的实时可玩版本

Decart是一家以色列人工智能公司，今天正式亮相，获得了红杉资本和 Oren Zeev 的 2100 万美元融资，该公司发布了据称是首款可玩的“开放世界”人工智能模型。该模型名…

王浩然
2024年11月2日
000
AI前沿

GenLayer推出AI代理交易新方案：让多个大型语言模型投票选出合适合同

GenLayer创新策略：利用AI集体智慧优化合同制定流程在人工智能（AI）技术日新月异的今天，AI正逐渐渗透到各个行业和领域的核心业务流程中。近期，GenLayer公司推出了一…

王浩然
2025年3月19日
000
AI前沿

Meta 的 Llama AI 模型现在也支持图像

本杰明·富兰克林曾经写道，除了死亡和税收，没有什么是确定的。让我修改一下这句话，以反映当前的人工智能淘金热：除了死亡、税收和新的人工智能模型，没有什么是确定的，其中最后一种模式正在…

王浩然
2024年9月29日
000
AI前沿

数据之道：Databricks如何革新AI大型语言模型的微调过程，摒弃数据标签依赖

在人工智能（AI）领域，大型语言模型（LLM）的性能优化长久以来依赖于高质量的数据标签。这些标签如同训练过程中的指南针，指引着模型理解并学习上下文信息。然而，随着企业纷纷踏上AI转…

王浩然
2025年3月31日
000
AI前沿

使用高斯溅射进行图像编辑

波兰和英国研究人员之间的新合作提出了使用高斯溅射技术编辑图像的前景，通过暂时将图像的选定部分解释为 3D 空间，允许用户修改和操作图像的 3D 表示，然后应用变换。要改变猫头的方…

AI评测师
2024年10月5日
000
AI前沿

Airtel 部署人工智能遏制垃圾邮件，呼吁印度对 WhatsApp 进行监管

印度第二大电信运营商巴帝电信周三向所有客户推出了一款免费的人工智能垃圾信息检测系统，旨在遏制该国猖獗的垃圾电话和信息，同时呼吁对 WhatsApp 和其他消息平台进行更严格的监管。…

王浩然
2024年9月28日
000
AI前沿

推理框架 Archon 有望加快 LLM 进程，且无需额外成本

斯坦福大学扩展智能实验室的研究人员介绍了一种新的推理框架，可以帮助大型语言模型 (LLM) 更快地处理潜在的响应。该框架 Archon 使用推理时间架构搜索 (ITAS) 算法…

王浩然
2024年10月3日
000
AI前沿

Black Forest Labs 发布 Flux 1.1 Pro 和 API

Black Forest Labs (BFL)是一家初创公司，由流行的 Stable Diffusion AI 图像生成模型的创建者创立，该模型是许多 AI 图像生成应用程序和服务…

王浩然
2024年10月7日
000
AI前沿

量子媒体与娱乐营销总监 Skip Levens – 访谈系列

Skip Levens是 Quantum 的产品负责人和 AI 策略师，Quantum 是 AI 和非结构化数据数据管理解决方案领域的领导者。他目前负责推动 Quantum 端到端…

点点
2024年10月16日
000
AI前沿

新兴开源AI公司Deep Cogito发布首批模型，迅速登顶排行榜‌

2025年4月8日，位于旧金山的AI研究初创公司Deep Cogito正式亮相，推出了其首批产品——Cogito v1系列。这是一系列经过精细调优的开源大型语言模型（LLMs），基…

王浩然
12小时前
000
AI前沿

新的 NFL 投注应用程序利用人工智能来平衡比赛

随着劳动节的过去和职业橄榄球赛季的正式开始，体育分析公司 Field Vision Sports 推出了所谓的首款移动应用程序，提供基于人工智能和机器学习的 NFL 比赛预测，让投…

点点
2024年9月11日
000
AI前沿

Cohere 更新 API，让开发人员更轻松地从其他模型切换

Cohere宣布发布其 AI 模型 Chat、Embed、Rerank 和 Classify 的应用程序编程接口 (API) 的更新版本。新的 API 更新统称为 API V2，…

王浩然
2024年9月30日
000