All Posts DeepSeek-V4 论文解读:百万 Token 上下文不是窗口竞赛,而是系统工程 DeepSeek-V4 Paper Notes: Million-Token Context as Systems Engineering 2026年04月24日 从超长上下文到终身服务:为什么开源模型最终会走向 State-Centric Serving 2026年04月21日 From Ultra-Long Context to Lifelong Service: Why Open Models Are Likely to Become State-Centric Serving Systems 2026年04月21日 Claude Code 源码解读阅读地图 A Reading Map for Claude Code Source Analysis 2026年04月16日 Harness Engineering:把会写代码的模型,变成真正能交付的软件系统 2026年04月15日 The Death of the App: Why the "Intent Canvas" is the Endgame of Operating Systems 2026年03月18日 App 的尽头是"画布":零应用时代的底层架构逻辑 2026年03月18日 大模型对话格式全景 2025年08月22日 LLM Agent 记忆管理方案 2025年08月07日 GPT-OSS Model Card 解析 2025年08月06日 原生轻量化大语言模型 Native Small Language Models 2025年08月05日 可验证奖励的强化学习(RLVR) Reinforcement Learning with Verifiable Rewards (RLVR) 2025年08月05日 大型语言模型量化技术:原理、前沿与实践 LLM Quantization: Principles, Frontiers and Practice 2025年08月05日