Notes
Primary-source reading notes for agent and systems work
Chinese translations and structured reading notes from OpenAI, Anthropic, source-code readings, and engineering blogs.
Claude Code:会话管理与 1M 上下文
Using Claude Code: Session Management & 1M Context
这是一份围绕 Claude Code 长会话管理的实战指南。它的重点不在于“把 1M context 用满”,而在于当上下文窗口大到足以承载超长任务时,如何避免噪声、失败路径和过时信息把模型一步步拖偏。长上下文不是越满越好,真正的能力来自对上下文的取舍。
面向长时运行应用开发的 Harness 设计
Harness design for long-running application development
在过去几个月里,我一直在研究两个相互关联的问题:如何让 Claude 生成高质量的前端设计,以及如何让它在无人干预的情况下构建完整的应用程序。这项工作源于我们早期在前端设计技能和长时间运行的编码智能体框架上的探索——我和同事通过提示工程与框架设计,将 Cla...
工程技术:在智能体优先的世界中利用 Codex
Harness engineering: leveraging Codex in an agent-first world
在过去五个月里,我们的团队一直在进行一项实验:构建并交付一款软件产品的内部 beta 版,其中没有一行代码由人类手写。
解锁 Codex 运行框架:我们如何构建 App Server
Unlocking the Codex harness: how we built the App Server
Codex 同时存在于 Web 应用、CLI、IDE 扩展和 macOS 应用里。表面上看,它们是不同产品形态;更深一层看,它们共享的是同一个 Codex 运行框架,也就是支撑所有 Codex 体验的智能体循环和执行逻辑。Codex App Server 正...
深入解析 Codex 智能体循环
Unrolling the Codex agent loop
这篇文章是理解 Codex 的入口:它不从模型能力讲起,而是先拆解一个编码智能体最基本、也最容易被忽视的结构——智能体循环。
面向长时运行智能体的高效 Harness
Effective harnesses for long-running agents
随着 AI 智能体能力提升,开发者越来越多地让它们承担需要数小时甚至数天才能完成的复杂任务。但真正困难的地方,不是让智能体开始工作,而是让它跨越多个上下文窗口后仍能持续、稳定、可交接地推进。
面向 AI 智能体的高效上下文工程
Effective context engineering for AI agents
在提示工程作为应用 AI 的关注焦点数年之后,一个新术语开始浮现:上下文工程。构建语言模型应用,正在从“怎样写出更好的提示词”,转向一个更宏观的问题:什么样的上下文配置,最可能让模型产生我们想要的行为?
为智能体编写高效工具:借助智能体完成
Writing effective tools for agents — with agents
模型上下文协议(MCP)可以为大语言模型智能体连接数百种工具,让它们处理现实世界中的任务。但工具越多,不等于智能体越强。真正的问题是:怎样让这些工具被模型正确理解、正确选择,并以较低上下文成本发挥作用?
我们如何构建多智能体研究系统
How we built our multi-agent research system
Claude 的研究功能可以跨网络、Google Workspace 及各类集成进行搜索,用来完成复杂的信息型任务。这篇文章真正值得读的地方,不只是“用了多个智能体”,而是它解释了多智能体系统何时有效、为什么昂贵,以及从原型走向生产时会遇到哪些工程问题。
Claude Code:智能体式编码最佳实践
Claude Code: Best practices for agentic coding
Claude Code 最佳实践
No matching notes.