Notes

Thariq / X 2026年04月16日

Claude Code：会话管理与 1M 上下文

Using Claude Code: Session Management & 1M Context

这是一份围绕 Claude Code 长会话管理的实战指南。它的重点不在于“把 1M context 用满”，而在于当上下文窗口大到足以承载超长任务时，如何避免噪声、失败路径和过时信息把模型一步步拖偏。长上下文不是越满越好，真正的能力来自对上下文的取舍。

claude code session management long context

Anthropic Prithvi Rajasekaran 2026年03月24日

面向长时运行应用开发的 Harness 设计

Harness design for long-running application development

在过去几个月里，我一直在研究两个相互关联的问题：如何让 Claude 生成高质量的前端设计，以及如何让它在无人干预的情况下构建完整的应用程序。这项工作源于我们早期在前端设计技能和长时间运行的编码智能体框架上的探索——我和同事通过提示工程与框架设计，将 Cla...

harness software engineering

OpenAI Ryan Lopopolo 2026年02月11日

工程技术：在智能体优先的世界中利用 Codex

Harness engineering: leveraging Codex in an agent-first world

在过去五个月里，我们的团队一直在进行一项实验：构建并交付一款软件产品的内部 beta 版，其中没有一行代码由人类手写。

agent harness software engineering

OpenAI Celia Chen 2026年02月04日

解锁 Codex 运行框架：我们如何构建 App Server

Unlocking the Codex harness: how we built the App Server

Codex 同时存在于 Web 应用、CLI、IDE 扩展和 macOS 应用里。表面上看，它们是不同产品形态；更深一层看，它们共享的是同一个 Codex 运行框架，也就是支撑所有 Codex 体验的智能体循环和执行逻辑。Codex App Server 正...

codex harness app server

OpenAI Michael Bolin 2026年01月23日

深入解析 Codex 智能体循环

Unrolling the Codex agent loop

这篇文章是理解 Codex 的入口：它不从模型能力讲起，而是先拆解一个编码智能体最基本、也最容易被忽视的结构——智能体循环。

codex agent loop harness

Anthropic Justin Young 2025年11月26日

面向长时运行智能体的高效 Harness

Effective harnesses for long-running agents

随着 AI 智能体能力提升，开发者越来越多地让它们承担需要数小时甚至数天才能完成的复杂任务。但真正困难的地方，不是让智能体开始工作，而是让它跨越多个上下文窗口后仍能持续、稳定、可交接地推进。

agent harness long running

Anthropic 2025年09月29日

面向 AI 智能体的高效上下文工程

Effective context engineering for AI agents

在提示工程作为应用 AI 的关注焦点数年之后，一个新术语开始浮现：上下文工程。构建语言模型应用，正在从“怎样写出更好的提示词”，转向一个更宏观的问题：什么样的上下文配置，最可能让模型产生我们想要的行为？

agent context engineering

Anthropic 2025年09月11日

为智能体编写高效工具：借助智能体完成

Writing effective tools for agents — with agents

模型上下文协议（MCP）可以为大语言模型智能体连接数百种工具，让它们处理现实世界中的任务。但工具越多，不等于智能体越强。真正的问题是：怎样让这些工具被模型正确理解、正确选择，并以较低上下文成本发挥作用？

agent tool design

Anthropic 2025年06月13日

我们如何构建多智能体研究系统

How we built our multi-agent research system

Claude 的研究功能可以跨网络、Google Workspace 及各类集成进行搜索，用来完成复杂的信息型任务。这篇文章真正值得读的地方，不只是“用了多个智能体”，而是它解释了多智能体系统何时有效、为什么昂贵，以及从原型走向生产时会遇到哪些工程问题。

multi agent research system

Anthropic 2025年04月18日

Claude Code：智能体式编码最佳实践

Claude Code: Best practices for agentic coding

Claude Code 最佳实践

agent coding agent workflow