AI 系列第 18 篇。"对齐"听起来很哲学,但它其实是一个工程问题——怎么让 LLM 在能力范围内做有用的事、拒绝有害的事、不撒谎。这一篇讲 HHH 原则、Constitutional AI、jailbreak 攻防、以及 2026 年 AI 安全的真实焦虑点。