AI 系列第 3 篇。把 1986 年那篇被冷落了 25 年的反向传播论文讲清楚。用"在高维大山上摸黑下山"的比喻,从损失函数 → 梯度 → 梯度下降 → 反向传播一路推到底,最后回答:"为什么同一篇论文 1986 没人用、2012 改变了世界?