
上周,中国初创公司DeepSeek发布了性能强大但成本低廉的开源版本 DeepSeek-R1,在人工智能界引起轩然大波。该模型使用纯强化学习 (RL),在一系列基准测试中与 OpenAI 的 o1相匹敌,挑战了长期以来只有使用强大芯片进行大规模训练才能实现高性能人工智能的观念。
然而,随着这部重磅影片的上映,许多人也开始思考中国模式的含义,包括DeepSeek 可能会将个人用户数据传输到中国。
人们的担忧始于该公司的隐私政策。很快,问题就愈演愈烈,OpenAI 技术人员 Steven Heidel 间接暗示,美国人喜欢将自己的数据“赠送”给中国共产党,以获得免费的东西。

从安全角度来看,这些指控意义重大,但事实是,只有当通过该公司自己的类似 ChatGPT 的服务使用模型时,DeepSeek 才能将数据存储在中国服务器上。
如果开源模型在本地托管或通过美国的 GPU 进行协调,则数据不会传输到中国。
对 DeepSeek 隐私政策的担忧
DeepSeek在其隐私政策中指出,该公司以不同的方式收集信息,包括用户注册或使用其服务时的信息。这意味着从帐户设置信息(姓名、电子邮件、号码和密码)到使用数据(例如文本或音频输入提示、上传文件、反馈和更广泛的聊天记录),所有内容都归该公司所有。

但这还不是全部。该政策进一步指出,所收集的信息将存储在位于中华人民共和国的安全服务器中,并可能出于帮助调查非法活动或仅仅遵守适用法律、法律程序或政府要求等原因与执法机构、公共当局和其他机构共享。
后者很重要,因为中国的数据保护法允许政府以最少的借口从该国任何服务器获取数据。
由于中国服务器上有如此丰富的信息,可能引发各种各样的事件,包括个人和组织的分析、敏感商业数据的泄露,甚至网络监控活动。
陷阱
虽然该政策很容易引发安全和隐私警报(对许多人来说已经如此),但值得注意的是,它仅适用于使用云端 R1 模型的 DeepSeek 自己的服务——应用程序、网站和软件。
如果您已经注册了DeepSeek 聊天网站,或者正在您的 Android 或 iOS 设备上使用 DeepSeek AI 助手,那么您迄今为止的设备数据、个人信息和提示很有可能已被发送并存储在中国。
该公司尚未就此事表明立场,但鉴于 iOS 版 DeepSeek 应用一直位居第一,甚至超过 ChatGPT,可以说许多人可能已经注册了该助手来测试其功能 — — 并在此过程中在某种程度上分享了他们的数据。
该服务的 Android 应用程序下载量也已超过一百万次。
DeepSeek-R1 本身是开源的
至于核心的DeepSeek-R1模型,不存在数据传输的问题。
R1 是完全开源的,这意味着团队可以通过Ollama等开源实现工具在本地针对目标用例运行它。这确保模型有效地完成工作,同时将数据限制在机器本身。据Stability AI 前创始人兼首席执行官Emad Mostaque称,R1-distill-Qwen-32B 模型可以在配备 16GB vRAM 的新 Mac 上流畅运行。
作为替代方案,团队还可以使用第三方协调器的 GPU 集群来训练、微调和部署模型——没有数据传输风险。其中之一是Hyperbolic Labs,它允许用户租用 GPU 来托管 R1。该公司还允许通过安全 API 进行推理。

话虽如此,如果有人只是想和 DeepSeek-R1 聊天来解决一个特定的推理问题,那么目前最好的方法就是使用Perplexity。该公司刚刚将 R1 添加到其模型选择器中,允许用户使用思路链推理进行深度网络研究。
Perplexity 首席执行官 Aravind Srinivas 表示,公司通过将该模型托管在位于美国和欧洲的数据中心服务器中,为其客户实现了这一用例。
长话短说:只要您的数据转移到本地托管的 DeepSeek-R1 版本,它就是安全的,无论它在您的机器上还是在西方某个地方的 GPU 集群上。
原创文章,作者:王 浩然,如若转载,请注明出处:https://www.dian8dian.com/deepseek-zhen-de-zai-xiang-zhong-guo-fa-song-shu-ju-ma-rang