$ grep -l Deepseek posts/*.md

自建大模型推理服务：PD 分离 / FP4 绑卡 / 合成压测，四个反直觉的坑
2026-06-14

不是 Linux 系列。这半年我从「能把模型加载起来出字」起步，去回答一个朴素的问题：自建算力跑大模型推理对外服务，技术上行不行、经济上划不划算。下面是四个和直觉完全相反、每个都让我重写一遍认知的坑。技术细节已脱敏，只留可公开的机制。

AI Infra Agent Deepseek