DeepSeek 的新 AI 模型似乎是迄今为止最好的“公开”挑战者之一

王浩然 • 2024年12月28日上午11:00 • AI前沿 • 251 views

中国的一个实验室创建了迄今为止最强大的“开放式”人工智能模型之一。

该模型DeepSeek V3由人工智能公司 DeepSeek 开发，并于周三根据宽松的许可证发布，允许开发人员下载和修改它以用于大多数应用程序，包括商业应用程序。

DeepSeek V3 可以处理一系列基于文本的工作负载和任务，例如编码、翻译以及根据描述性提示撰写文章和电子邮件。

根据 DeepSeek 的内部基准测试，DeepSeek V3 的表现优于可下载的“公开”可用模型和只能通过 API 访问的“封闭”AI 模型。在编程竞赛平台 Codeforces 举办的编码竞赛子集中，DeepSeek 的表现优于其他模型，包括 Meta 的Llama 3.1 405B、OpenAI 的GPT-4o和阿里巴巴的 Qwen 2.5 72B。

DeepSeek V3 在 Aider Polyglot 测试中也击败了竞争对手，该测试旨在衡量模型是否能够成功编写出可集成到现有代码中的新代码。

DeepSeek 声称 DeepSeek V3 是在包含 14.8 万亿个 token 的数据集上进行训练的。在数据科学中，token 用于表示原始数据的位 – 100 万个 token 相当于约 75 万个单词。

庞大的不仅仅是训练集。DeepSeek V3 的规模也十分巨大：6710 亿个参数，在 AI 开发平台 Hugging Face 上则有 6850 亿个参数。（参数是模型用来进行预测或决策的内部变量。）这大约是 Llama 3.1 405B 的 1.6 倍，后者有 4050 亿个参数。

参数数量通常（但并非总是）与技能相关；参数较多的模型往往比参数较少的模型表现更好。但大型模型也需要更强大的硬件才能运行。未优化的 DeepSeek V3 版本需要一组高端 GPU 才能以合理的速度回答问题。

虽然 DeepSeek V3 不是最实用的模型，但它在某些方面是一项成就。DeepSeek 能够在短短两个月内使用 Nvidia H800 GPU 数据中心训练该模型——美国商务部最近禁止中国公司采购这些 GPU。该公司还声称，它只花了 550 万美元来训练 DeepSeek V3，这只是 OpenAI 的 GPT-4 等模型开发成本的一小部分。

缺点是，该模型的政治观点有点……不自然。例如，向 DeepSeek V3 询问天安门广场的问题，它不会回答。

DeepSeek 是一家中国公司，需要接受中国互联网监管机构的评估，以确保其模型的响应“体现社会主义核心价值观”。许多中国人工智能系统拒绝回应可能引起监管机构愤怒的话题，例如有关习近平政权的猜测。

DeepSeek 是一家充满好奇心的组织，该公司于 11 月底推出了DeepSeek-R1，这是对OpenAI 的 o1“推理”模型的回应。该公司得到了 High-Flyer Capital Management 的支持，这是一家使用人工智能来指导其交易决策的中国量化对冲基金。

High-Flyer 建立了自己的服务器集群用于模型训练，据报道，最新的集群之一拥有 10,000 个 Nvidia A100 GPU，耗资 10 亿日元（约合 1.38 亿美元）。High-Flyer 由计算机科学毕业生梁文峰创立，旨在通过其 DeepSeek 组织实现“超级智能”AI。

在今年早些时候的一次采访中，文峰将 OpenAI 等闭源 AI 描述为“暂时的”护城河。“[它]并没有阻止其他人迎头赶上，”他指出。

的确。

原创文章，作者：王浩然，如若转载，请注明出处：https://www.dian8dian.com/deepseek-de-xin-ai-mo-xing-si-hu-shi-qi-jin-wei-zhi-zui-hao

Like (0)

王浩然作者

0 0

ChatGPT 和。Sora 本月第二次宕机

Previous 2024年12月28日

超大型开源 AI DeepSeek-V3 发布时表现超越 Llama 和 Qwen

Next 2024年12月28日

AI前沿

人工智能是老年人口更安全、更独立的关键

人工智能正在应用于解决全球范围内的各类问题，其中包括保障老年人年老时的安全。绝大多数老年人都希望独立生活：92% 的老年人表示他们更愿意在目前的家中度过晚年。事实上，能够按照自己…

王浩然
2024年12月27日
000
AI前沿

美国海军陆戰队刚刚公布了ROGUE 1：其新的爆炸无人机

周二，美国海军陆战队和Teledyne FLIR Defense推出了“Rogue 1”——一种垂直起飞和降落（VTOL）神风无人机，具有一些有趣的功能：弹头可以在战场上交换，如果…

点点
2024年9月29日
000
AI前沿

随着代理 AI 编码工具市场加速发展，GitHub Copilot 预览代理模式

Agentic AI 如今在应用程序开发和编码等多个领域风靡一时。今天， GitHub终于加入了代理 AI 阵营，推出了 GitHub Copilot 代理模式。开发中的代理 A…

王浩然
2025年2月7日
000
AI前沿

人工智能搜索大战升温：Genspark 按需添加由 Claude 提供支持的财务报告

早在 2024 年 6 月——快速发展的生成式 AI 领域的永恒——一家由微软、谷歌和百度校友创立的初创公司MainFunc 推出了其首款产品 Genspark，一款 AI 搜索引…

王浩然
2024年11月17日
000
AI前沿

Cohere 推出全新 AI 模型，旨在弥合全球语言鸿沟

Cohere今天在其 Aya 项目中发布了两个新的开放权重模型，以缩小基础模型中的语言差距。 Aya Expanse 8B 和 35B 现已在Hugging Face上推出，扩展…

王浩然
2024年10月26日
000
AI前沿

Stable Diffusion 3.5：文本到图像 AI 的架构进步

Stability AI发布了 Stable Diffusion 3.5，标志着文本转图像 AI 模型的又一次进步。此版本代表了一次全面改革，由宝贵的社区反馈和对突破生成式 AI …

点点
2024年10月25日
000
AI前沿

谷歌发布免费 Gemini 2.0 Flash Thinking 模型，对 OpenAI 的付费战略施压

谷歌悄然发布了其热门人工智能模型 Gemini 的重大更新，该模型现在可以解释其推理过程，在数学和科学任务中创下新的性能记录，并提供了 OpenAI 高级服务的免费替代方案。周二…

王浩然
2025年1月23日
000
AI前沿

“创造市场”与“算法进化”，中美AI竞速的岔路口

“人工智能的商业模式，是要创造一个市场，而非一个算法”。这是世界AI泰斗Michael I.Jordan的观点。图源pixabay 而当前的全球AI市场，占据主导地位的中美双方，…

点点
2024年9月16日
000
AI前沿

利用人工智能和知识图谱进行企业决策

当今的商业环境无疑比以往任何时候都更具竞争性和复杂性：客户期望空前高涨，企业需要满足（或超越）这些需求，同时创造新产品和新体验，为消费者带来更多价值。与此同时，许多组织资源匮乏，预…

点点
2024年11月5日
000
AI前沿

Archy 融资 1500 万美元，利用人工智能驱动的自动化技术革新牙科诊所

作为牙科诊所转型的重要一步，Archy在 A 轮融资中获得了 1500 万美元。这笔投资由Entrée Capital领投， Bessemer Venture Partn…

点点
2024年10月24日
000
AI前沿

Tails OS 与 Tor Project 合并

Tor 项目是一家非盈利组织，负责维护 Tor 匿名网络的软件。目前，该项目正与使用 Tor 的便携式操作系统制造商 Tails 携手合作。两家组织都希望共享资源、降低管理费用，并…

点点
2024年10月1日
000
AI前沿

解锁人工智能的投资回报率：成功实施人工智能的策略

企业越来越多地使用人工智能来增强运营，但实现强劲的投资回报率仍然是一项挑战。为了评估人工智能的真正价值，行业领导者应该采取创新和前瞻性的方法。人工智能在收入增长、成本降低、决策、客…

王浩然
2024年8月25日
000
AI前沿

Agentic AI 即将崛起，带来新的网络安全风险

据管理咨询公司 Gartner 称， Agentic AI可以大幅提高人工智能的潜力，到 2028 年，该技术可能会被纳入到 33% 的企业软件应用程序中，而目前这一比例仅为 1%…

王浩然
2024年12月7日
000
AI前沿

Slack 正在成为人工智能工作场所：这对你的工作意味着什么

这款让数百万办公室工作人员分享表情包、协调项目的消息应用程序正在悄然转变为一个更具雄心壮志的目标：一个让人工智能代理作为数字同事与人类一起工作的平台。作为 Salesforce …

王浩然
2024年12月21日
000
AI前沿

放射学AI软件供应商Gleamer通过两项小型收购进军MRI领域‌

放射学AI领域的佼佼者Gleamer近日宣布了两项重要的小型收购，标志着其正式进军MRI（磁共振成像）市场。此次战略扩展，旨在强化Gleamer在医疗影像诊断方面的技术实力和市场地…

王浩然
2025年3月12日
000
AI前沿

研究人员质疑人工智能的“推理”能力，因为模型在解决数学问题时出现了微小的变化

机器学习模型是如何做到的？它们真的像我们一样“思考”或“推理”吗？这既是一个哲学问题，也是一个实践问题，但周五发表的一篇新论文表明，答案至少就目前而言，是一个相当明确的“不”。苹…

王浩然
2024年10月12日
000
AI前沿

人工智能通过改变行为帮助预防皮肤癌

在过去的一年里，随着越来越多的临床医生在日常实践中测试、使用和整合人工智能伴侣，我们看到了人工智能辅助癌症诊断方面取得的显著成就。皮肤癌也不例外，我们预计未来 AI 诊断工具将广…

点点
2024年9月14日
000
AI前沿

为什么 ChatGPT 的数学这么差？

如果你曾经尝试将 ChatGPT 用作计算器，你几乎肯定会注意到它的计算障碍：聊天机器人数学不好。在这方面，它并不是 AI 中独一无二的。 Anthropic 的Claude无法解…

王浩然
2024年10月3日
000
AI前沿

超越思维链：思维偏好优化如何推进LLMs

Meta、加州大学伯克利分校和纽约大学的研究人员团队开发出一项突破性的新技术，有望增强人工智能系统处理一般任务的能力。这种方法被称为“思维偏好优化”（TPO），旨在使大型语言模型（…

点点
2024年10月16日
000
AI前沿

Dottxt 获 1190 万美元融资，帮助 AI 模型回答问题

正如我们之前报道的那样，企业 CIO 正在缓慢地推进生成式 AI。其中一个原因是 AI 不适合现有的软件工程工作流程，因为它实际上使用的不是同一种语言。例如，LLM（又称大型语言模…

点点
2024年10月18日
000

发表回复

Please Login to Comment

DeepSeek 的新 AI 模型似乎是迄今为止最好的“公开”挑战者之一

相关推荐

发表回复

Share To :