~$ tenggouwa
~ posts inspirations lab about

$ grep -l Deepseek posts/*.md

  • 自建大模型推理服务:PD 分离 / FP4 绑卡 / 合成压测,四个反直觉的坑

    2026-06-14

    不是 Linux 系列。这半年我从「能把模型加载起来出字」起步,去回答一个朴素的问题:自建算力跑大模型推理对外服务,技术上行不行、经济上划不划算。下面是四个和直觉完全相反、每个都让我重写一遍认知的坑。技术细节已脱敏,只留可公开的机制。

    AI Infra Agent Deepseek
© 2026 tenggouwa · made with caffeine ☕
RSS [ uptime: ∞ ]