开源AI辩论：为什么选择性透明度构成严重威胁‌

王浩然 • 2025年3月24日下午5:00 • AI前沿 • 43 views

在当今科技巨头纷纷宣称其AI产品开源的时代，“开源”这一曾经的内行术语已跃然成为公众视野中的热门词汇。然而，在这个AI技术发展的关键时期，任何公司的失误都可能让公众对AI的信任度倒退十年甚至更久。在此背景下，开放性和透明度的概念被随意甚至不诚实地使用，以建立信任。同时，随着新白宫政府采取对科技监管更为放手的态度，创新与监管之间的界限已变得泾渭分明，预测如果“错误”的一方占据上风，将带来灾难性的后果。然而，存在一条经过验证的第三条道路，它植根于开放性和透明度的原则之中，真正的开源协作能够加速创新，同时促使行业开发出无偏见、合乎伦理且对社会有益的技术。

开源协作的力量

简而言之，开源软件以免费提供的源代码为特征，这些代码可以被查看、修改、剖析、采纳和分享，用于商业和非商业目的。历史上，开源软件如Linux、Apache、MySQL和PHP等对互联网的兴起起到了至关重要的作用。如今，通过民主化AI模型、数据、参数和开源AI工具的访问，社区可以再次加速创新，而不是不断地重复造轮子。这正是IBM最近对2400名IT决策者进行的一项研究所揭示的，研究发现，人们对使用开源AI工具来推动投资回报率（ROI）的兴趣日益增长。

在决定AI的ROI时，快速开发和创新位居榜首，但研究还证实，采用开放解决方案可能与更高的财务可行性相关。开源AI不仅有利于短期内的少数公司获利，更鼓励跨行业和领域的多样化、定制化应用的创建，这些领域可能原本没有资源来开发专有模型。

透明度的重要性

开源的透明度允许对AI系统的行为和伦理进行独立审查和审计。当我们利用公众的兴趣和动力时，他们能够发现问题和错误，正如在LAION 5B数据集事件中那样。在该事件中，公众找出了数据集中隐藏的超过1000个包含已验证儿童色情虐待材料的URL，这些数据为Stable Diffusion和Midjourney等生成式AI模型提供了燃料，这些模型是许多在线视频生成工具和应用的基础。如果LAION 5B数据集是封闭的，如OpenAI的Sora或Google的Gemini那样，后果可能会更加严重。

选择性透明度的危险

虽然源代码本身相对容易共享，但AI系统远比软件复杂。它们依赖于系统源代码、模型参数、数据集、超参数、训练源代码、随机数生成和软件框架，所有这些组件必须协同工作才能使AI系统正常运行。在AI安全成为关注焦点的背景下，声称某项发布是开源或开放源代码已成为常态。然而，为了准确无误，创新者必须分享AI系统的所有组成部分，以便其他参与者能够全面了解、分析和评估其属性，最终复制、修改和扩展其功能。

例如，Meta宣称Llama 3.1 405B是“第一个前沿级别的开源AI模型”，但只公开了系统的预训练参数（或权重）和一些软件。虽然这允许用户随意下载和使用模型，但源代码和数据集等关键组件仍然封闭，这在Meta宣布将注入AI机器人配置文件到网络中，同时停止对内容进行准确性审核的背景下变得更加令人担忧。

拥抱挑战

随着自动驾驶汽车在主要城市上路，AI系统在手术室中辅助外科医生，我们正处于让这项技术掌控更多领域的起点。前景广阔，但潜在的错误风险也同样巨大。因此，我们需要建立新的衡量标准来评估AI的可信度。尽管斯坦福大学的Anka Reuel及其同事最近尝试为评估模型性能的AI基准测试建立新框架，但行业和公众所依赖的审查实践仍不够充分。基准测试未能考虑到学习系统核心的数据集在不断变化，以及适当指标因用例而异的事实。此外，该领域仍然缺乏丰富的数学语言来描述当代AI的能力和局限性。

通过分享整个AI系统以实现开放性和透明度，而不是依赖不足的审查和空谈流行语，我们可以促进更大的协作，并培育出安全、伦理上可接受的AI创新。尽管真正的开源AI为实现这些目标提供了一个经过验证的框架，但行业中缺乏透明度的问题令人担忧。如果没有科技公司的大胆领导和合作来进行自我管理，这一信息鸿沟可能会损害公众对AI的信任和接受度。

拥抱开放性、透明度和开源不仅仅是一种强大的商业模式，更是选择一种惠及所有人的AI未来，而不是仅仅惠及少数人。

原创文章，作者：王浩然，如若转载，请注明出处：https://www.dian8dian.com/kai-yuan-ai-bian-lun-wei-shen-me-xuan-ze-xing-tou-ming-du

AI模型参数 LAION 5B Meta 伦理公众信任创新协作基准测试安全性开源AI 手术辅助技术监管投资回报率数学语言数据集自动驾驶汽车自我管理行为审查选择性透明度透明度

Like (0)

王浩然作者

0 0

AI工作取代：是逐渐发生还是突然到来？‌

Previous 2025年3月24日

Anthropic的Claude聊天机器人：疑似采用Brave浏览器驱动其网页搜索功能

Next 2025年3月24日

AI前沿

OpenAI 售价 200 美元的 ChatGPT Pro：思考更深入的人工智能（但你需要它吗？）

OpenAI 刚刚推出了他们所谓的“世界上最智能的模型”。它的月费为 200 美元，并承诺比我们以前见过的任何东西都更努力地思考、工作更长时间并解决更复杂的问题。但在这个似乎每周都…

王浩然
2024年12月9日
000
AI前沿

解锁人工智能的投资回报率：成功实施人工智能的策略

企业越来越多地使用人工智能来增强运营，但实现强劲的投资回报率仍然是一项挑战。为了评估人工智能的真正价值，行业领导者应该采取创新和前瞻性的方法。人工智能在收入增长、成本降低、决策、客…

王浩然
2024年8月25日
000
AI前沿

OpenAI为付费ChatGPT用户推出深度研究功能‌

在人工智能领域持续创新的浪潮中，OpenAI再次迈出重要一步。据最新消息，OpenAI现已向其付费ChatGPT用户推出深度研究功能，旨在为用户提供更加专业、深入的AI分析与解答服…

王浩然
2025年2月28日
000
AI前沿

Meta 推出开源 Llama 3.3，将强大的大模型缩小到更小的尺寸

Meta 生成 AI 副总裁 Ahmad Al-Dahle 今天在竞争对手社交网络 X 上宣布发布Llama 3.3，这是 Facebook、Instagram、WhatsApp …

王浩然
2024年12月7日
000
AI前沿

ChatGPT 现在可以读取 Mac 上的部分桌面应用程序

OpenAI 的 ChatGPT 开始与您计算机上的其他应用程序协同工作。周四，这家初创公司宣布，适用于 macOS 的 ChatGPT 桌面应用程序现在可以读取一些以开发人员为…

王浩然
2024年11月16日
000
AI前沿

巧妙的架构胜过原始计算：DeepSeek 打破了“越大越好”的 AI 开发方法

人工智能的发展已经到达了一个关键的转折点。DeepSeek 的突破——无需依赖最先进的芯片即可实现最先进的性能——证明了 12 月 NeurIPS 上许多人已经宣称的内容：人工智能…

王浩然
2025年2月2日
000
AI前沿

Pedego 的 Cargo 电动自行车：运动、时尚、动力强劲，售价 4,000 美元

Pedego的 Cargo 电动自行车被宣传为一款强劲而运动的自行车，主要面向带着孩子在城里走动的父母和任何需要携带重型装备的人。我花了整个夏天测试这款货运电动自行车，看看它是…

点点
2024年9月23日
000
AI前沿

AlphaProteo：谷歌 DeepMind 在蛋白质设计方面的突破

在不断发展的分子生物学领域，最具挑战性的任务之一是设计能够有效结合特定靶标（例如病毒蛋白、癌症标志物或免疫系统成分）的蛋白质。这些蛋白质结合物是药物发现、疾病治疗、诊断和生物技术中…

点点
2024年9月18日
000
AI前沿

商业领袖如何实现人工智能和可持续发展目标

对于企业来说，平衡人工智能的采用和对环境的影响是当务之急。根据世界经济论坛(WEF) 的数据，支持人工智能发展所需的电力每 100 天翻一番。到 2028 年，人工智能的能源消耗可…

王浩然
2024年12月11日
000
AI前沿

Arcee AI 推出 SuperNova：一种可定制、符合指令的企业模型

Arcee AI今天推出了SuperNova，这是一个专为企业部署而设计的 700 亿参数语言模型，具有先进的指令跟踪功能和完整的自定义选项。该模型旨在为 OpenAI 和 Ant…

王浩然
2024年9月17日
000
AI前沿

为 GPU 成本波动的动荡时代做好准备

图形芯片（GPU）是人工智能革命的引擎，为聊天机器人和其他人工智能应用所依赖的大型语言模型（LLM）提供动力。由于这些芯片的价格在未来几年可能会大幅波动，许多企业将需要首次学习如何…

王浩然
2024年9月9日
000
AI前沿

Manus或许并非中国的第二个“DeepSeek时刻”‌

近期，有关Manus的热烈讨论在中国科技界掀起了波澜，许多人将其视为继DeepSeek之后的又一里程碑事件。然而，深入剖析后不难发现，Manus可能并未达到DeepSeek那样的高…

王浩然
2025年3月11日
000
AI前沿

OpenAI 推出全新“Canvas”ChatGPT 界面，专门针对写作和编码项目

OpenAI 周四推出了一种与 ChatGPT 交互的新方式：一种被它称为“画布”的界面。该产品在普通聊天窗口旁边打开一个单独的窗口，其中包含用于编写和编码项目的工作区。用户可以直…

王浩然
2024年10月6日
000
AI前沿

AWS 为 Bedrock 带来多代理编排功能

AWS宣布在其 Amazon Bedrock 平台上推出多代理功能，加倍加大对 AI 代理的投入。 AWS 首席执行官马特·加曼 (Matt Garman) 在 AWS re:I…

王浩然
2024年12月4日
000
AI前沿

“Figures”人形机器人：语音指令助手，让家务变得更轻松

近日，一款名为“Figures”的人形机器人走进了大众视野，这款机器人能够通过接收语音指令来帮助用户完成各种家务任务。它的问世，预示着智能家居领域迎来了又一位得力助手，将为用户带来…

王浩然
2025年2月24日
000
AI前沿

Cursor洽谈融资，估值或达100亿美元：AI编程领域蓬勃发展‌

随着AI编程行业的持续升温，创新企业Cursor正积极洽谈新一轮融资，旨在将公司估值推高至惊人的100亿美元。Cursor以其强大的AI技术为核心，致力于革新软件开发流程，提升编码…

王浩然
2025年3月10日
000
AI前沿

研究发现，由于效果不佳，Deepfakes 对 2024 年选举几乎没有影响

尽管互联网上越来越多地充斥着虚假图片，但我们至少可以相信人类在重要时刻嗅出谎言的能力。最近的大量研究表明，人工智能生成的虚假信息对今年全球选举没有产生任何实质性影响，因为它还不是很…

王浩然
2024年12月28日
000
AI前沿

如何利用生成工具推动 Glean 筹集 2.6 亿美元：GraphRAG

当创新型企业搜索公司 Glean 的销售代表需要为一次重要的客户会议做准备时，他们求助于自己强大的生成式 AI工具。几分钟之内，系统就梳理了多年的电子邮件、Slack 消息和通话录…

王浩然
2024年9月15日
000
AI前沿

Meta AI正式进军中东与非洲市场，推出阿拉伯语支持功能

Meta AI近日正式宣布将业务版图拓展至中东与非洲地区，此举象征着其在全球范围内迈出了重要的一步。此次拓展的核心目标，是将Meta AI前沿的人工智能技术带给更多用户，特别是广大…

王浩然
2025年2月27日
000
AI前沿

谷歌 GenAI 面临欧洲隐私风险评估审查

谷歌在欧盟的主要隐私监管机构已展开调查，以查明该公司在使用个人信息训练生成式人工智能方面是否遵守了欧盟的数据保护法。具体来说，它正在调查这家科技巨头是否需要进行数据保护影响评估（…

王浩然
2024年9月14日
000