不是 Linux 系列。这半年我从「能把模型加载起来出字」起步,去回答一个朴素的问题:自建算力跑大模型推理对外服务,技术上行不行、经济上划不划算。下面是四个和直觉完全相反、每个都让我重写一遍认知的坑。技术细节已脱敏,只留可公开的机制。