为 AI 模型评分：Endor Labs 推出评估工具

点点 • 2024年10月17日上午8:00 • AI前沿 • 120 views

Endor Labs已开始根据 AI 模型的安全性、受欢迎程度、质量和活跃度对其进行评分。

这一独特功能被称为“AI 模型的 Endor 分数”，旨在通过提供直接的分数来简化识别 Hugging Face（一个共享大型语言模型 (LLM)、机器学习模型和其他开源 AI 模型和数据集的平台）上目前最安全的开源 AI 模型的过程。

这一消息发布之际，开发人员越来越多地转向 Hugging Face 等平台获取现成的 AI 模型，这与早期随时可用的开源软件 (OSS) 的情况如出一辙。这一新版本通过使开发人员能够“从头开始”使用 AI 模型来改善AI 治理，而这一目标迄今为止一直难以实现。

Endor Labs 联合创始人兼首席执行官 Varun Badhwar 表示：“我们的使命一直是保护您的代码所依赖的一切，而 AI 模型是这项关键任务的下一个重要前沿。

“每个组织都在试验人工智能模型，无论是为特定应用程序提供支持，还是构建整个基于人工智能的业务。安全性必须跟上步伐，这是一个难得的机会，可以从头开始，避免日后的风险和高昂的维护成本。”

Endor Labs 创始工程师 George Apostolopoulos 补充道：“现在每个人都在试验 AI 模型。一些团队正在建立全新的基于 AI 的业务，而其他团队则在寻找方法将‘由 AI 驱动’的标签贴在他们的产品上。有一件事是肯定的，你的开发人员正在研究 AI 模型。”

然而，这种便利并非没有风险。Apostolopoulos 警告称，当前的形势就像“狂野西部”，人们会抓住适合自己需求的模型，而不考虑潜在的漏洞。

Endor Labs 的方法将 AI 模型视为软件供应链中的依赖项

Apostolopoulos 表示：“Endor Labs 的使命是‘保护代码所依赖的一切’。”这种观点使组织能够将类似的风险评估方法应用于 AI 模型，就像它们对其他开源组件所做的那样。

Endor 的 AI 模型评分工具重点关注几个关键风险领域：

安全漏洞：预先训练的模型可能在模型权重中隐藏恶意代码或漏洞，当集成到组织环境中时可能会导致安全漏洞。
法律和许可问题：遵守许可条款至关重要，尤其是考虑到人工智能模型及其训练集的复杂谱系。
操作风险：对预先训练模型的依赖会创建一个复杂的图表，其管理和保护起来可能很困难。

为了解决这些问题，Endor Labs 的评估工具对 Hugging Face 上的 AI 模型进行了 50 次开箱即用的检查。系统根据维护者数量、企业赞助、发布频率和已知漏洞等因素生成“Endor 分数”。

该系统对 AI 模型进行评分的积极因素包括使用安全的权重格式、存在许可信息以及较高的下载量和参与度指标。消极因素包括文档不完整、缺乏性能数据以及使用不安全的权重格式。

Endor Scores 的一个主要特点是其用户友好型方法。开发人员不需要知道具体的模型名称；他们可以从一般问题开始搜索，例如“我可以使用哪些模型来对情绪进行分类？”或“Meta 中最受欢迎的模型是什么？”然后，该工具会提供清晰的分数，对每个模型的正面和负面方面进行排名，让开发人员能够根据自己的需求选择最合适的选项。

“您的团队每天都会被问及 AI，他们会寻找可以用来加速创新的模型，”Apostolopoulos 指出。“使用 Endor Labs 评估开源 AI 模型可以帮助您确保您使用的模型能够按照您的预期运行，并且可以安全使用。”

原创文章，作者：点点，如若转载，请注明出处：https://www.dian8dian.com/wei-ai-mo-xing-ping-fen-endor-labs-tui-chu-ping-gu-gong-ju

AI 模型 AI 模型评分 Apostolopoulos Endor Labs

Like (0)

点点

0 0

Nvidia 容器安全应用程序增强 AI 网络防御

Previous 2024年10月16日

利用人类注意力可以改善人工智能生成的图像

Next 2024年10月17日

AI前沿

ChatGPT for macOS：现可直接编辑代码‌

在科技日新月异的今天，ChatGPT再次为用户带来了惊喜。如今，macOS平台上的ChatGPT已经支持直接编辑代码，这一功能的加入无疑将极大地提升开发者的工作效率。 ChatGP…

王浩然
2025年3月9日
000
AI前沿

超越生成式AI：代理式AI的崛起与影响

近年来，生成式AI（如ChatGPT）的兴起引起了广泛关注，并在多个领域展现出了巨大的应用潜力。然而，随着技术的进一步发展，一种更为先进、功能更为强大的AI形态——代理式AI（Ag…

王浩然
2025年3月14日
000
AI前沿

应对副驾驶的安全风险

越来越多的企业正在使用副驾驶和低代码平台，使员工（即使是那些技术专长很少或没有技术专长的员工）能够创建强大的副驾驶和业务应用程序，以及处理大量数据。 Zenity 的一份新报告《2…

点点
2024年9月25日
000
AI前沿

微软小型 AI 模型击败大型模型：效率之王 Phi-4

微软推出了一款新的人工智能模型，该模型实现了卓越的数学推理能力，同时使用的计算资源远少于其大型竞争对手。拥有 140 亿个参数的Phi-4经常胜过谷歌Gemini Pro 1.5等…

王浩然
2024年12月17日
000
AI前沿

Amazon Nova 基础模型：重新定义生成式 AI 的价格和性能

生成式人工智能通过实现独特的内容创建、自动化任务和引领创新来改变行业。在过去十年中，人工智能 (AI)取得了显著进步。OpenAI的GPT-4 和 Google 的 Bard 等技…

王浩然
2025年1月20日
000
AI前沿

Observo 的 AI 原生数据管道将嘈杂遥测减少了 70%，增强了企业安全性

人工智能热潮引发了数据爆炸式增长。人工智能模型需要大量数据集进行训练，它们所支持的工作负载（无论是内部工具还是面向客户的应用程序）正在生成大量遥测数据：日志、指标、跟踪等等。即使…

王浩然
2025年2月4日
000
AI前沿

Meta 放弃事实核查内容：这对企业意味着什么

Facebook 创始人兼 Meta 首席执行官马克·“扎克”·扎克伯格今天再次震惊了世界，他宣布将彻底改变该公司在美国审核和处理用户生成帖子和内容的方式扎克伯格于今天早上（1 …

王浩然
2025年1月8日
000
AI前沿

谷歌利用人工智能编写新代码；裁员

谷歌首席执行官桑达尔·皮查伊 (Sundar Pichai)在第三季度财报电话会议上表示，谷歌超过四分之一的新代码是由人工智能生成的。他说，然后工程师们会审查并接受代码，帮助他…

王浩然
2024年11月7日
000
AI前沿

Cohere 推出全新 AI 模型，旨在弥合全球语言鸿沟

Cohere今天在其 Aya 项目中发布了两个新的开放权重模型，以缩小基础模型中的语言差距。 Aya Expanse 8B 和 35B 现已在Hugging Face上推出，扩展…

王浩然
2024年10月26日
000
AI前沿

人工智能与人工智能：权威手机数据如何帮助预防人工智能欺诈

人工智能（AI）与任何其他技术一样，本质上没有好坏之分——它仅仅是人们可以用于正当或恶意目的的工具。例如，许多公司在语音和面部识别中使用人工智能生物识别解决方案来简化登录流程，并…

点点
2024年9月28日
000
AI前沿

烟雾、反射和入口：Adobe 的 TransPixar 将 AI VFX 提升到新水平

Adobe Research和香港科技大学(HKUST)的一个团队开发了一种人工智能系统，可以改变电影、游戏和交互式媒体的视觉效果的制作方式。这项名为TransPixar的技术为…

王浩然
2025年1月9日
000
AI前沿

量子处理单元：计算的未来

量子计算曾经是一个理论领域，如今正迅速转变为一项突破性的技术前沿。这场革命的核心是量子处理单元(QPU)，即驱动量子计算机的引擎。与依赖二进制逻辑（代表 0 或 1 的位）的传统处…

点点
2024年10月22日
000
AI前沿

神秘「蓝莓」登顶文生图竞技场，疑似Flux.1续作，网友：都来免费打广告了

都来玩这套。继OpenAI“草莓”之后，又有神秘模型蓝莓来“霸榜”。在文生图模型排行榜上，两个“无人认领”的模型blueberry_0和blueberry_1力压Flux.1、…

点点
2024年9月29日
000
AI前沿

什么是 AI 代理？计算机科学家解释下一波 AI 工具

与 ChatGPT 等 AI 聊天机器人互动可能很有趣，有时也很有用，但日常 AI 的下一个级别不仅仅是回答问题：AI 代理可以为您执行任务。包括OpenAI、微软、谷歌和Sal…

王浩然
2025年1月6日
000
AI前沿

今年 Station F 上排名前 40 的初创企业几乎都使用了人工智能

每年，超过 1,000 家初创公司加入巴黎标志性创业园区Station F。由于筛选 1,000 家初创公司的描述可能很困难，Station F 会选出 40 家最有前途的初创公司…

王浩然
2024年11月14日
000
AI前沿

Salesforce 发现，93% 的 IT 领导者看到了 AI 代理的价值，但难以实现

每个人都在谈论人工智能代理。但到目前为止，很多都还只是说说而已。 Salesforce 表示，这种情况将在 2025 年发生改变——人工智能代理终于成为现实。根据其集成…

王浩然
2025年2月4日
000
AI前沿

据报道，OpenAI 正在制定新策略来应对人工智能改进放缓

据报道，OpenAI 正在制定新策略来应对人工智能改进放缓据《The Information》报道， OpenAI 的下一代旗舰模型可能不会像其前代产品那样带来巨大的飞跃。据报…

王浩然
2024年11月11日
000
AI前沿

科尔莫戈罗夫-阿诺德网络：高效且可解释的神经网络新前沿

神经网络一直处于人工智能发展的前沿，推动了从自然语言处理和计算机视觉到战略游戏、医疗保健、编程、艺术，甚至自动驾驶汽车等各个领域的发展。然而，随着这些模型在规模和复杂性方面的扩展，…

王浩然
2024年8月22日
000
AI前沿

人工智能视觉搜索登陆 iPhone

该公司在周一的 Apple Event 2024 上宣布，视觉搜索即将登陆 iPhone，由苹果的 AI 功能套件 Apple Intelligence 提供支持。相机控制是iP…

王浩然
2024年9月10日
000
AI前沿

人工智能的变革者：Tsetlin 机器在降低能源消耗方面发挥的作用

人工智能 (AI)的迅速崛起已经改变了众多行业，从医疗保健和金融到能源管理等。然而，人工智能应用的增长也导致了严重的能源消耗问题。现代人工智能模型，尤其是基于深度学习和神经网络的模…

点点
2024年10月27日
000

发表回复

Please Login to Comment

为 AI 模型评分：Endor Labs 推出评估工具

相关推荐

发表回复

Share To :