← cd ../posts

开源生态与闭源前沿:2026 的牌面对比

2026-06-13

AI 系列第 23 篇。系列终篇。我们把整个 AI 圈的牌面摊出来看一遍,并展望未来。

0. AI 圈的"两条线"

自从 LLM 时代开始,行业明显分成两条线:

闭源前沿 (Closed Frontier):
  Anthropic Claude
  OpenAI GPT / o-series
  Google Gemini
  xAI Grok (新晋)

开源生态 (Open Ecosystem):
  Meta Llama
  阿里 Qwen
  DeepSeek
  Mistral
  其他 (Phi, Gemma, Yi, GLM, Kimi...)

闭源派砸大钱训前沿模型,靠 API 赚钱。开源派把模型权重放出来,让所有人能用、能改、能本地部署。

两边都赢了一些战役,也都输了一些。这一篇我们看清楚牌面。


1. 2026 年的真实差距:还在,但缩小了

综合能力(reasoning, coding, multimodal)

顶级:
  Claude Opus 4.7 (Anthropic)
  GPT-5 / o4 (OpenAI)
  Gemini 2.5 Pro (Google)

挑战者:
  DeepSeek-V3.5 / R2
  Llama 4 (推测中)
  Qwen 3 Max

差距估算: 6-12 个月

2023 年开源距闭源大约 18 个月。2024 年缩到 12 个月。2025 年缩到 6-9 个月。

收敛趋势在继续,但还没收敛。

各维度看

维度 闭源领先 开源追赶
通用对话 闭源略好 接近持平
代码生成 闭源(Claude)领先 DeepSeek-Coder 接近
数学推理 闭源(o3)顶尖 DeepSeek-R2 接近
多模态 闭源领先 开源刚追上
长上下文 闭源(Gemini 2M)领先 开源 200K 比较稳
工具使用 / agent 闭源领先 差距还大
中文能力 Qwen / DeepSeek 反超 闭源在中文上反而弱
推理速度 看部署,不是模型

2. 开源派的几个真实优势

优势 1:成本

GPT-5 API:          $40 / 1M tokens
DeepSeek API:       $0.27 / 1M tokens
本地 Llama 3.3 70B: 几乎免费(折算硬件)

100× 价差。这是开源最大杀手锏。

优势 2:可定制

闭源 API 你只能 prompt。开源你能:

  • LoRA fine-tune
  • 改架构(MoE → dense, 改 attention)
  • 调整 tokenizer
  • 加领域知识
  • 提取 attention heads
  • ……

公司有专属数据 → 开源 + fine-tune 比闭源 + prompt 强很多。

优势 3:数据隐私

数据不出公司网络。医疗 / 金融 / 政企必须。

优势 4:透明 + 研究

开源模型的训练数据、模型权重、训练代码都可看。学术研究、安全审计都靠开源。

优势 5:避免 vendor lock-in

闭源 API 调用风险:

  • 价格涨了你没办法
  • 模型被退役(GPT-3.5 已被退役了 N 次)
  • 服务可用性
  • 政治风险(某些国家被限流)

3. 闭源派的几个真实优势

优势 1:前沿能力

最难的任务(复杂 reasoning、long-horizon agent、新模态)闭源还领先。

优势 2:工程化产品

ChatGPT / Claude 已经是成熟产品——UI、记忆、文件上传、工具集成、企业 SSO。开源模型自己跑这些全要重造轮子。

优势 3:安全与可靠

闭源团队有专门的 alignment / safety / red team。商业部署的"安全保证"闭源更强。

优势 4:更新快

闭源前沿大约 3-6 个月一次大升级。开源跟进慢一些。

优势 5:客户支持 / SLA

企业级合同里 SLA 是硬要求。开源没人保你。


4. 各家的"性格"和"押注"

Anthropic

  • 强项:alignment / safety / coding / agent / long context
  • 押注:reasoning + safety + coding
  • 代表:Claude Opus 4.7 (1M context)
  • 特色:thinking mode、computer use、Claude Code

OpenAI

  • 强项:通用能力 / 多模态 / reasoning
  • 押注:scaling + AGI + 产品
  • 代表:GPT-5, o4
  • 特色:消费级产品(ChatGPT)市场份额最大

Google

  • 强项:multimodal / 长上下文 / 视频
  • 押注:multimodal + infrastructure (TPU)
  • 代表:Gemini 2.5 (2M context)
  • 特色:Notebook LM、AlphaFold(Bio AI)

Meta

  • 强项:开源、底层基础设施、视频
  • 押注:开源生态 + world model + Reality Labs (AR/VR)
  • 代表:Llama 4 系列(推测)
  • 特色:唯一对开源全力以赴的大厂

xAI

  • 强项:speed of iteration(Elon 推得快)+ X 平台数据
  • 押注:unfiltered + 大规模 GPU 集群
  • 代表:Grok 3 / 4
  • 特色:用户互动数据丰富

DeepSeek

  • 强项:高效训练 + reasoning + open weight
  • 押注:把成本做到极致
  • 代表:DeepSeek-V3, R1, R2
  • 特色:1/10 的成本接近 frontier

阿里 Qwen

  • 强项:多语言(特别中文)+ 全规模覆盖
  • 押注:开源 + 全链路(0.5B → 72B 全开)
  • 代表:Qwen 2.5 / 3 系列
  • 特色:消费 + 企业全打通

5. 未来 12 个月(2026-2027)值得关注的几件事

1. Agent 的真实可用性

2025 是 agent 元年的喊话期。2026 是兑现期。真正能稳定跑长任务的 agent 会从前沿实验室走向产品

关注:Claude Computer Use 2、Devin 类自主开发 agent、OpenAI 内部 agent 产品。

2. 推理 scaling 还能 push 多远

o3 → o4 → o5?test-time compute scaling 有没有撞墙?

DeepSeek R2 / R3 的发布节奏值得密切关注。

3. 数据墙怎么破

互联网文字数据快用完了。下一波数据来源:

  • 合成数据 / self-play
  • 多模态(视频、音频)
  • 真实世界传感器(机器人交互数据)

4. 开源能不能真正追上前沿

DeepSeek 已经证明:在 reasoning 上能追上。其他维度(agent、多模态)还在差距期。

如果 Llama 4 / DeepSeek R3 / Qwen 3 持续猛冲,2027 年闭源-开源差距可能缩到 3 个月内。

5. 商业模式洗牌

  • API 价格战已经开打(DeepSeek 把 OpenAI 拖下水)
  • 推理算力市场(NVIDIA / AMD / Groq)会有大变化
  • "AI 应用层"创业能否产生大公司

6. 监管 / 治理

EU AI Act 已落地。美国总统级别的 EO 在变。中国"生成式 AI 管理办法"在更新。

监管会影响开源派(合规成本)和闭源派(API 限制)的相对地位。

7. 机器人 / 具身智能

2026 是人形机器人商业化拐点(Figure 02、Optimus、Unitree H1+)。背后是 multimodal LLM + world model 的融合。

这是 LLM 之后最大的产品爆发点。

8. 科学 AI

AlphaFold 3、Aviary(生物 AI)、AI 数学家、AI 物理学家——AI 在科研里的影响在加速。

诺贝尔奖 2024 给了 Hinton(AI)和 Hassabis(AlphaFold)—— 科学界开始正式承认 AI 是新工具


6. 这条系列的核心 takeaway

把我们走过的 23 篇浓缩成几条:

1. AI 是 80 年的工程,不是 5 年的奇迹

1943 神经元模型,1956 AI 命名,1986 反向传播,2012 AlexNet,2017 Transformer,2022 ChatGPT。每一步都站在前一步的肩膀上。

2. 突破 = 算法 × 算力 × 数据 × 信仰

没有 GPU,AlexNet 跑不动。没有 ImageNet,AlexNet 没数据。没有 Hinton 坚持 25 年,反向传播没人记得。任何一项缺位,不会有今天

3. 三大流派都活在 LLM 里

联结主义的身体 + 统计学习的骨架 + 符号主义的外衣。AI 30 年的内战,最终是融合,不是某一派的胜利。

4. Scaling 仍是大牌,但不是唯一牌

2020-2024 是 scaling 主导。2024 之后是 scaling + post-training + reasoning + tools 的组合战。

5. Tool use + Agent 是下一个十年的主线

LLM 从"信息生成"到"行动执行"的转变。MCP / Agent SDK 是这个转变的基础设施。

6. World Model 是 LLM 之外的另一根支柱

如果 LeCun 是对的,我们今天看到的 LLM 只是更大故事的开篇。

7. 开源 vs 闭源 不是零和

闭源探路,开源跟进 + 民主化。两者一起推着整个行业。

8. Evals 决定一切

每一次"模型变强了"的说法,背后都是某个 benchmark + 某个评估方法。学会写 evals,比学会写 prompt 更重要。


7. 给你的最后作业

  1. 把这条 23 篇文章串成一张"思维导图"。每一篇放一个节点,标出节点之间的关系。
  2. 挑一个你现在最感兴趣的方向(agent / reasoning / multimodal / world model / open-source),写一段"为什么我相信它会改变未来"的论述。
  3. 写一个问题——是你看完这整个系列后,没被解答的最大困惑。 这个问题可能就是你接下来值得追的方向。

8. 写在系列尾

这个系列是 2026 年 5-6 月之间写的。

写它的过程里,我自己也学到了很多——不是新知识,是把零散知识串成线的过程。AI 不是一堆论文堆出来的,是一条 80 年的脉络。看完这条脉络,再回去读任何新论文,都比之前清楚。

如果你跟着走完了 23 篇,恭喜你。你不是变成了 AI 专家——但你有了 AI 专家的地图。剩下的就是在地图上挑一块感兴趣的区域,深挖。

技术会变,模型会迭代,公司会洗牌。但这张地图大致结构稳定。十年后回头看,2026 年这一版 AI 知识地图,骨架应该还是这个样子。

AI 的故事远没结束。 我们都还在第二幕。

—— Tenggouwa, 2026.06.13