   
签到天数: 603 天 [LV.9]以坛为家II - 金币
- 236387 枚
- 威望
- 2047 点
- 好评
- 16 点
- 爱心值
- 42 点
- 钻石
- 0 颗
- 贡献值
- 342 点
- 帖子
- 4690
- 精华
- 0
 鲜花( 502)  鸡蛋( 51) |
春节期间,DeepSeek 在全球 AI 圈炸翻了天,然而也进入了多事之秋。这个春节,老狐也一直在关注 DeepSeek 的动态。
这不,昨天 OpenAI 突然放大招,声称掌握确凿证据,指控中国 AI 公司 DeepSeek 违规使用 GPT-4 技术开发开源模型 R1,涉嫌违反服务条款。
Anthropic CEO 连夜码出万字长文,疾呼美国将中国 AI 企业列入实体清单,美参议院火速响应。
微软更是紧急切割,之前热火朝天的 Azure 版 R1 项目被曝“暂停推进”,官方回应也相当谨慎:“正在评估合规性。”
不过,我想说能让美国科技圈这么重视,说明实力 DeepSeek 不容小觑。
外媒深扒发现,DeepSeek 最新研究硬刚英伟达技术壁垒,靠自研算法让 A100 芯片算力利用率飙升至 90% ,直接威胁 CUDA 生态霸权。
打不过就举报?硅谷也太输不起了吧!
关于 DeepSeek 来龙去脉还不是很了解的朋友,可以先看下面这个视频,对阅读本文有所帮助。
DeepSeek 为何成美国眼中钉?
DeepSeek 的崛起堪称 AI 圈年度最炸裂的大戏,短短一个月内凭借技术突破、市场攻势和用户狂热直接站上全球 AI 舞台的 C 位。
1 月 20 日,开源大模型 DeepSeek-R1 发布,以数学推理能力碾压 GPT-4,GitHub 星标三天突破五万,迅速成为AI界的“顶流”。
而 1 月 27 日,DeepSeek 更是凭借强劲的产品体验,在 中美苹果商店下载榜双杀 ChatGPT,服务器被挤到直接崩溃。
1 月 28 日,多模态模型 Janus-Pro 在医疗影像诊断领域惊艳登场,误差率低至 0.1%,被称为“放射科医生杀手”,让医学界和 AI 界双双震撼。
这场技术、商业、用户生态的全维度爆发,让 DeepSeek 从开源界的黑马变成全球 AI 明星
然而,正是这份耀眼的成绩单,让 DeepSeek 成为美国封杀的重点目标。美国的围剿行动迅速而凶猛,三大封锁手段接连落地。
首先,OpenAI 率先发难,指控 DeepSeek 利用 “模型蒸馏” 窃取 GPT-4 能力,试图在技术上遏制其发展。
紧接着,微软火速暂停 Azure 合作,英伟达限制 A100 芯片供应,试图从商业上掐断 DeepSeek 的算力命脉。
而最具杀伤力的是,美国政府直接出手,美国海军向美国消费者新闻与商业频道证实,已向相关人员发出邮件示警,提醒“不得以任何形式下载、安装或使用 DeepSeek 模型”。
1 月 28 日,DeepSeek 官网显示,其线上服务受到大规模恶意攻击。据专家介绍,DeepSeek 这次受到的网络攻击,IP 地址都在美国。
与此同时,美国商务部启动国家安全调查,意大利也突袭下架 DeepSeek 应用,欧洲市场封杀同步推进。
短短几周,DeepSeek 从开源 AI 的希望之星变成硅谷眼中的头号“威胁”,这场围剿与反围剿的较量已进入白热化。
模型蒸馏=偷师?
那么,DeepSeek 到底做了什么,能让 OpenAI 如此焦虑?
本质上,模型蒸馏是 AI界众所周知的手法,通俗来说,就是“小学生(小模型)抄学霸(大模型)作业,但必须自己理解解题思路”。
谷歌用 GPT-3 训练 PaLM,Meta 用蒸馏技术打造 Llama,全员“偷师”,但被罚的只有 DeepSeek,硅谷双标可见一斑。
而真正让 OpenAI 焦头烂额的,是 DeepSeek-R1 开源后的市场冲击。
企业用 R1 生成代码的成本仅为 GPT-4 的 1/3, GitHub 调查显示,60% 以上开发者考虑因 R1 放弃 Copilot,直接威胁 OpenAI 的盈利模式。
同时,DeepSeek 亮出训练日志,数据源明确为 300TB 自研专利库 + 公开合规语料,让 OpenAI 的法律攻势难以落地。
这场 AI 风暴,早已超越技术竞争,成为全球 AI 话语权的博弈。
MIT 教授 Lex Fridman 一针见血地指出:“美国允许自己用 TikTok 数据训练 AI,却不准中国模型参考 GPT?”
突破英伟达护城河,动了谁的奶酪?
DeepSeek 的技术突破也进一步加剧了英伟达的焦虑。
最新研究表明,DeepSeek 已经实现了 A100 芯片算力的 90% 利用率,将成本压缩至同类的五分之一。
同时,基于国产算力的混合精度优化方案,使得单卡推理的能效比达到NVIDIA A100 的 1.8 倍。
通过动态专家路由和知识蒸馏联合训练框架,DeepSeek 将 16 专家模型的专家利用率从 15% 提升至 70%,推理延迟降低了 40%。
此外,DeepSeek 还在开发过程中绕过了英伟达 CUDA 中间层,直接采用底层 PTX 编程哲学,为芯片厂商和开发者提供了全新的选择。
这一技术进步标志着中国可以通过软件手段绕过英伟达的硬件封锁,打破了英伟达在 AI 训练市场的技术垄断。
如果 DeepSeek 继续推动这种突破,英伟达的芯片封锁政策将面临巨大挑战, 英伟达的市场控制力将大幅下降。
1 月 27 日,DeepSeek-R1 开源当天,英伟达股价闪崩 5%,480 亿美元市值蒸发,纳斯达克十大科技巨头集体缩水 1 万亿美元,Meta、谷歌暴跌 7%。
可见,资本市场已经通过股价变动“用脚投票”。
美国总统特朗普也表示, DeepSeek 的崛起应当为美国企业敲响“警钟”,美国公司“需要专注于竞争以赢得胜利”。
这也揭示了美国的真正恐惧:技术霸权的崩塌。
来源:科技狐
参考资料:APPSO、北京晚报、中国青年网、人民日报
编辑:不吃麦芽糖 |
|