语言过度：SLM 如何打败规模更大、资源密集型的同类

王浩然 • 2024年12月22日上午9:00 • AI前沿 • 98 views

ChatGPT 公开发布两年后，各行各业的公司都希望利用大型语言模型(LLM) 来改变业务流程，因此关于 AI 的讨论已不可避免。然而，尽管 LLM 功能强大且前景光明，但许多业务和 IT 领导者已经过度依赖它们，而忽视了它们的局限性。这就是为什么我预计未来专业语言模型 (SLM) 将在企业 IT 中发挥更大的补充作用。

SLM 通常被称为“小型语言模型”，因为它们需要的数据和训练时间更少，是“ LLM 的更精简版本”。但我更喜欢“专业化”这个词，因为它更好地传达了这些专用解决方案能够以比 LLM 更高的准确性、一致性和透明度执行高度专业化的工作的能力。通过用 SLM 补充 LLM，组织可以创建利用每个模型优势的解决方案。

信任与法学硕士“黑匣子”问题

LLM 非常强大，但它们也因有时“失去主线”而闻名，即由于其通用训练和海量数据集而提供偏离轨道的输出。OpenAI的 ChatGPT和其他 LLM 本质上是“黑匣子”，不会透露它们如何得出答案，这一趋势变得更加成问题。

这个黑箱问题将在未来成为一个更大的问题，特别是对于公司和业务关键型应用程序而言，准确性、一致性和合规性至关重要。医疗保健、金融服务和法律就是典型的例子，在这些行业中，不准确的答案可能会带来巨大的财务后果，甚至生死攸关的后果。监管机构已经注意到了这一点，并可能会开始要求可解释的人工智能解决方案，尤其是在依赖数据隐私和准确性的行业。

虽然企业通常会采用“人机交互”方法来缓解这些问题，但过度依赖 LLM 可能会导致虚假的安全感。随着时间的推移，自满情绪会逐渐滋生，错误也会被忽视。

SLM = 更高的可解释性

幸运的是，SLM 更适合解决 LLM 的许多局限性。SLM 并非为通用任务而设计，而是针对更狭窄的焦点进行开发，并针对特定领域的数据进行训练。这种特殊性使它们能够在精度至关重要的领域处理细微的语言要求。SLM 不是依赖于庞大的异构数据集，而是针对有针对性的信息进行训练，从而为它们提供上下文智能，以提供更一致、更可预测和更相关的响应。

这有几个好处。首先，它们更容易解释，更容易理解其输出的来源和理由。这在受监管的行业中至关重要，因为这些行业的决策需要追溯到源头。

其次，SLM 体积更小，这意味着它们通常可以比 LLM 运行得更快，这对于实时应用程序来说是一个关键因素。第三，SLM 为企业提供了对数据隐私和安全的更多控制，尤其是在内部部署或专为企业构建的情况下。

此外，虽然 SLM 最初可能需要专门培训，但它们降低了使用由外部供应商控制的第三方 LLM 带来的风险。这种控制在要求严格数据处理和合规性的应用中非常有用。

专注于发展专业知识（并警惕过度承诺的供应商）

我想明确指出，LLM 和 SLM并不相互排斥。实际上，SLM 可以增强 LLM，从而创建混合解决方案，其中 LLM 提供更广泛的背景，而 SLM 确保精确执行。即使就 LLM 而言，现在也还处于早期阶段，因此我总是建议技术领导者继续探索 LLM 的众多可能性和优势。

此外，虽然 LLM 可以很好地解决各种问题，但 SLM 可能无法很好地转移到某些用例。因此，提前清楚了解要解决哪些用例非常重要。

业务和 IT 领导者投入更多时间和精力来培养培训、微调和测试 SLM 所需的独特技能也很重要。幸运的是，Coursera、YouTube 和Huggingface.co等常见资源提供了大量免费信息和培训。随着 AI 专业知识的争夺愈演愈烈，领导者应确保其开发人员有足够的时间学习和试验 SLM。

我还建议领导者仔细审查合作伙伴。我最近与一家公司进行了交谈，他们向我征求了有关某家技术提供商的说法的意见。我的看法是，他们要么夸大其词，要么根本就不了解该技术的能力。

该公司明智地退后一步，实施了受控的概念验证来测试供应商的说法。正如我所料，该解决方案根本还没准备好迎接黄金时段，而该公司只需投入相对较少的时间和金钱就能成功。

无论公司是从概念验证还是实际部署开始，我都建议他们从小处着手，经常测试并在早期成功的基础上继续发展。我个人曾经历过使用一小部分指令和信息进行工作，但当我向模型输入更多信息时，却发现结果偏离了方向。这就是为什么稳扎稳打是一种谨慎的做法。

总而言之，虽然 LLM 将继续提供越来越有价值的功能，但随着企业扩大对 AI 的依赖，其局限性也变得越来越明显。补充 SLM 提供了一条前进的道路，特别是在需要准确性和可解释性的高风险领域。通过投资 SLM，公司可以为他们的 AI 战略提供面向未来的保障，确保他们的工具不仅能推动创新，还能满足信任、可靠性和控制的要求。

原创文章，作者：王浩然，如若转载，请注明出处：https://www.dian8dian.com/yu-yan-guo-du-slm-ru-he-da-bai-gui-mo-geng-da-zi-yuan-mi-ji

Like (0)

王浩然作者

0 0

AI 电影制作人注意了！Runway 推出人才平台，用于会面、接待和招聘

Previous 2024年12月21日

IBM 希望凭借其新的开源 Granite 3.1 模型成为企业 LLM 之王

Next 2024年12月22日

AI前沿

IMAX 利用 AI 扩大原创内容覆盖范围

随着全球内容消费量不断增长，对非英语内容的需求超过对英语电影和节目的需求，IMAX 正在利用人工智能来扩大其原创内容的本地化。根据普华永道的报告，娱乐和媒体行业在 2023 年将…

王浩然
2024年11月29日
000
AI前沿

Level AI 首席执行官兼创始人 Ashish Nagar – 访谈系列

Ashish Nagar 是Level AI的首席执行官兼创始人，他利用自己在亚马逊 Alexa 团队的工作经验，利用人工智能来改变联络中心的运营。Ashish 拥有深厚的技术和创…

点点
2024年11月6日
000
AI前沿

Midjourney的新研究：让大型语言模型更具创意地写作

在人工智能领域，创新总是层出不穷。近日，以AI图像生成为主的Midjourney公司携手纽约大学（NYU）的机器学习专家，发布了一项令人瞩目的新研究。这项研究专注于提升文本型大型语…

王浩然
2025年3月25日
000
AI前沿

丰田与 NTT 联手推进 33 亿美元 AI 移动出行项目

日本汽车制造商丰田正与电信巨头日本电报电话公司 (NTT) 合作开发使用人工智能预防事故的驾驶辅助系统。两人计划投资 33 亿美元打造一个全新的移动 AI 平台，该平台利用大量数…

王浩然
2024年11月7日
000
AI前沿

Throne 的厕所摄像头可以拍摄你的便便

Throne是一家位于奥斯汀的健康初创公司。它销售一种相机。它夹在马桶边上。它会拍下你的便便。该系统目前处于测试阶段，利用人工智能检查你的便便，以确定肠道健康和补水情况。事实证明…

点点
2024年10月21日
000
AI前沿

miRoncol 推出突破性血液检测技术，可检测 12 种以上早期癌症

在癌症检测领域取得重大进展的背景下，医疗技术初创公司miRoncol完成了一项突破性血液检测的概念验证研究，该检测能够在早期检测出多种类型的癌症。这项创新检测利用了尖端技术，包括微…

点点
2024年10月16日
000
AI前沿

“每一毫秒都很重要”：为什么电动方程式车队选择 Cato Networks 来连接其维修站

最近采访了保时捷赛车运动IT 主管 Friedemann Kurz ，他数十年的经验使他成为将技术与高风险赛车相结合的领导者。 Kurz 负责监管泰格豪雅保时捷电动方程式车队的 I…

王浩然
2024年12月1日
000
AI前沿

从MIPS到Exaflops：40年间计算能力的飞跃将重塑AI领域

在最近的NVIDIA GTC大会上，该公司揭幕了一款据称是全球首款能够达到每秒一百亿亿次（即一Exaflop）浮点运算的单机架服务器系统。这一突破性进展基于最新的GB200 NVL…

王浩然
1天前
000
AI前沿

AI21首席执行官表示，由于错误延续，变压器不适合人工智能代理

随着越来越多的企业组织展望所谓的代理未来，一个障碍可能是人工智能模型的构建方式。对于企业人工智能开发人员A121来说，答案是显而易见的，该行业需要寻找其他模型架构来启用更高效的人工…

点点
2024年10月14日
000
AI前沿

PIN AI 推出移动应用程序，让您可以在手机上创建自己的个性化、私人 DeepSeek 或 Llama 驱动的 AI 模型

通过《她》和其他众多科幻作品，我们很容易想象这样一个世界：每个人都有自己的个性化人工智能助手——它知道我们是谁、我们的职业、我们的爱好、我们的目标和激情、我们的好恶…&…

王浩然
2025年2月14日
000
AI前沿

使用生成式人工智能进行 SEO 的 12 种方法

生成式人工智能 (GenAI) 的兴起正在改变数字营销人员处理搜索引擎优化 (SEO) 的方式。GenAI 驱动的工具正在帮助企业提高搜索排名并比以往更有效地推动自然流量。根据se…

王浩然
2024年10月20日
000
AI前沿

谷歌首席执行官表示，人工智能模型 Gemini 将成为公司 2025 年的“最大重点”

据报道，首席执行官桑达尔·皮查伊 (Sundar Pichai) 告诉谷歌员工，2025 年将是公司“关键”的一年。据 CNBC 报道，它获得了 12 月 18 日战略会议的音频…

王浩然
2024年12月29日
000
AI前沿

谁需要 GPT-4o 高级语音模式？Hume 的 EVI 2 现已推出，带有情感化的语音 AI 和 API

由前谷歌 DeepMinder/计算科学家 Alan Cowen 共同创立并领导的人工智能初创公司Hume时，正是 2024 年春天，该公司刚刚在 B 轮私募股权融资中筹集了 50…

王浩然
2024年9月22日
000
AI前沿

Chipotle 投资人工智能来增强食品安全

Lumachain 的 AI 供应链平台可实时监控供应链中的每个项目

点点
2024年10月22日
000
用于自动驾驶开发的生成式 AI 视频已升级

总部位于加州的初创公司 Helm.ai 发布了用于自动驾驶的 VidGen 生成式 AI 模型的更新版本。 VidGen-2 是继今年早些时候推出的 VidGen-1 之后推出的…

点点
AI前沿 2024年10月8日
000
AI前沿

OpenAI 首席技术官和其他两人离职，Altman 否认与重组计划有关

OpenAI 首席技术官 Mira Murati在社交网络 X 上分享了她令人意外的辞职信，宣布她将离开公司。Murati 于 2018 年加入 OpenAI，在六年半的时间里担任…

点点
2024年10月1日
000
AI前沿

微软的新 AI 代理支持 1,800 种模型（并且还在不断增加）

人工智能代理是目前企业热议的话题。但是，企业领导者希望了解切实的成果和相关用例（而不是未来主义的、尚未实现的场景），并且需要易于部署和使用的工具，此外，还要支持他们首选的模型。 …

王浩然
2024年11月21日
000
AI前沿

Midjourney 增加了类似 Pinterest 的“情绪板”并支持多种自定义 AI 图像模型

MidJourney是一款流行的 AI 图像生成器，拥有超过 1900 万用户，它推出了新功能来增强用户定制。今天，这家小公司推出了受 Pinterest 启发的“情绪板”并支持…

王浩然
2024年12月19日
000
AI前沿

“Figures”人形机器人：语音指令助手，让家务变得更轻松

近日，一款名为“Figures”的人形机器人走进了大众视野，这款机器人能够通过接收语音指令来帮助用户完成各种家务任务。它的问世，预示着智能家居领域迎来了又一位得力助手，将为用户带来…

王浩然
2025年2月24日
000
AI前沿

这款“AI Granny”黑客利用无聊的闲聊浪费电话诈骗者的时间

电话诈骗并不是什么新鲜事，但随着人工智能的出现，人们比以往任何时候都更难知道他们正在通话的人是否是他们所说的那个人。但英国移动网络 O2 正在扭转局面，创造了所谓的“人工智能奶奶”…

王浩然
2024年11月17日
000