OpenAI 指控 DeepSeek “偷师” GPT-4

查看: 3|回复: 3

[新闻娱乐] OpenAI 指控 DeepSeek “偷师” GPT-4 [复制链接]

xixi392

九州任逍遥

Rank: 16

签到天数: 603 天

[LV.9]以坛为家II

金币: 236387 枚
威望: 2047 点
好评: 16 点
爱心值: 42 点
钻石: 0 颗
贡献值: 342 点
帖子: 4690
精华: 0

鲜花(502)

鸡蛋(51)

电梯直达

1^#

发表于 2025-1-31 19:20:09 |只看该作者 |正序浏览

春节期间，DeepSeek 在全球 AI 圈炸翻了天，然而也进入了多事之秋。这个春节，老狐也一直在关注 DeepSeek 的动态。

这不，昨天 OpenAI 突然放大招，声称掌握确凿证据，指控中国 AI 公司 DeepSeek 违规使用 GPT-4 技术开发开源模型 R1，涉嫌违反服务条款。

Anthropic CEO 连夜码出万字长文，疾呼美国将中国 AI 企业列入实体清单，美参议院火速响应。

微软更是紧急切割，之前热火朝天的 Azure 版 R1 项目被曝“暂停推进”，官方回应也相当谨慎：“正在评估合规性。”

不过，我想说能让美国科技圈这么重视，说明实力 DeepSeek 不容小觑。

外媒深扒发现，DeepSeek 最新研究硬刚英伟达技术壁垒，靠自研算法让 A100 芯片算力利用率飙升至 90% ，直接威胁 CUDA 生态霸权。

打不过就举报？硅谷也太输不起了吧！

关于 DeepSeek 来龙去脉还不是很了解的朋友，可以先看下面这个视频，对阅读本文有所帮助。

DeepSeek 为何成美国眼中钉？

DeepSeek 的崛起堪称 AI 圈年度最炸裂的大戏，短短一个月内凭借技术突破、市场攻势和用户狂热直接站上全球 AI 舞台的 C 位。

1 月 20 日，开源大模型 DeepSeek-R1 发布，以数学推理能力碾压 GPT-4，GitHub 星标三天突破五万，迅速成为AI界的“顶流”。

而 1 月 27 日，DeepSeek 更是凭借强劲的产品体验，在中美苹果商店下载榜双杀 ChatGPT，服务器被挤到直接崩溃。

1 月 28 日，多模态模型 Janus-Pro 在医疗影像诊断领域惊艳登场，误差率低至 0.1%，被称为“放射科医生杀手”，让医学界和 AI 界双双震撼。

这场技术、商业、用户生态的全维度爆发，让 DeepSeek 从开源界的黑马变成全球 AI 明星

然而，正是这份耀眼的成绩单，让 DeepSeek 成为美国封杀的重点目标。美国的围剿行动迅速而凶猛，三大封锁手段接连落地。

首先，OpenAI 率先发难，指控 DeepSeek 利用 “模型蒸馏” 窃取 GPT-4 能力，试图在技术上遏制其发展。

紧接着，微软火速暂停 Azure 合作，英伟达限制 A100 芯片供应，试图从商业上掐断 DeepSeek 的算力命脉。

而最具杀伤力的是，美国政府直接出手，美国海军向美国消费者新闻与商业频道证实，已向相关人员发出邮件示警，提醒“不得以任何形式下载、安装或使用 DeepSeek 模型”。

1 月 28 日，DeepSeek 官网显示，其线上服务受到大规模恶意攻击。据专家介绍，DeepSeek 这次受到的网络攻击，IP 地址都在美国。

与此同时，美国商务部启动国家安全调查，意大利也突袭下架 DeepSeek 应用，欧洲市场封杀同步推进。

短短几周，DeepSeek 从开源 AI 的希望之星变成硅谷眼中的头号“威胁”，这场围剿与反围剿的较量已进入白热化。

模型蒸馏=偷师？

那么，DeepSeek 到底做了什么，能让 OpenAI 如此焦虑？

本质上，模型蒸馏是 AI界众所周知的手法，通俗来说，就是“小学生（小模型）抄学霸（大模型）作业，但必须自己理解解题思路”。

谷歌用 GPT-3 训练 PaLM，Meta 用蒸馏技术打造 Llama，全员“偷师”，但被罚的只有 DeepSeek，硅谷双标可见一斑。

而真正让 OpenAI 焦头烂额的，是 DeepSeek-R1 开源后的市场冲击。

企业用 R1 生成代码的成本仅为 GPT-4 的 1/3， GitHub 调查显示，60% 以上开发者考虑因 R1 放弃 Copilot，直接威胁 OpenAI 的盈利模式。

同时，DeepSeek 亮出训练日志，数据源明确为 300TB 自研专利库 + 公开合规语料，让 OpenAI 的法律攻势难以落地。

这场 AI 风暴，早已超越技术竞争，成为全球 AI 话语权的博弈。

MIT 教授 Lex Fridman 一针见血地指出：“美国允许自己用 TikTok 数据训练 AI，却不准中国模型参考 GPT？”

突破英伟达护城河，动了谁的奶酪？

DeepSeek 的技术突破也进一步加剧了英伟达的焦虑。

最新研究表明，DeepSeek 已经实现了 A100 芯片算力的 90% 利用率，将成本压缩至同类的五分之一。

同时，基于国产算力的混合精度优化方案，使得单卡推理的能效比达到NVIDIA A100 的 1.8 倍。

通过动态专家路由和知识蒸馏联合训练框架，DeepSeek 将 16 专家模型的专家利用率从 15% 提升至 70%，推理延迟降低了 40%。

此外，DeepSeek 还在开发过程中绕过了英伟达 CUDA 中间层，直接采用底层 PTX 编程哲学，为芯片厂商和开发者提供了全新的选择。

这一技术进步标志着中国可以通过软件手段绕过英伟达的硬件封锁，打破了英伟达在 AI 训练市场的技术垄断。

如果 DeepSeek 继续推动这种突破，英伟达的芯片封锁政策将面临巨大挑战，英伟达的市场控制力将大幅下降。

1 月 27 日，DeepSeek-R1 开源当天，英伟达股价闪崩 5%，480 亿美元市值蒸发，纳斯达克十大科技巨头集体缩水 1 万亿美元，Meta、谷歌暴跌 7%。

可见，资本市场已经通过股价变动“用脚投票”。

美国总统特朗普也表示， DeepSeek 的崛起应当为美国企业敲响“警钟”，美国公司“需要专注于竞争以赢得胜利”。

这也揭示了美国的真正恐惧：技术霸权的崩塌。

来源：科技狐
参考资料：APPSO、北京晚报、中国青年网、人民日报
编辑：不吃麦芽糖