Agent 开发者的三个灵魂拷问

核心理解

识别一个 Agent 开发者是真懂还是只搓过 demo，三个问题就够了：

问题一：怎么保证 Agent Loop 的稳定？

大部分人对 Agent 的理解止于一个 ReAct 循环、一个 while loop。但真正做起来要处理的 dirty work 太多：死循环、token 上下文超限、LLM 调用 400 错误、部分模型厂商 API 会挂掉、网络不好 SSE 推送会一直卡住。能回答多少，全看自己真正处理过多少。而且这些东西很难让 AI 一开始帮你考虑好——想不到就是会踩坑，也是最能体现专业价值的地方。

核心知识点：Harness Engineering、对话循环、断路器模式、上下文压缩策略、错误恢复。

问题二：你在 Agent 的 Context 里面放了哪些东西？

这个问题能看出一个人对 Context Engineering 的理解深度——哪些东西该放，哪些不该放，哪些应该按需加载。能自然触及 Skills、MCP、RAG、Memory 等核心概念。能答上来的可以继续追问：怎么保证长期的 Memory 记忆不坏掉？

核心知识点：渐进式压缩（Snip→Microcompact→Collapse→Autocompact）、记忆系统”只保存无法推导的信息”、按需加载 vs 全量注入。

问题三：如何控制 Agent 的成本？

Token 成本远超其他所有基础设施——CI/CD、服务器、数据库加起来一年的成本可能都不如一个月的 token 账单。省 token 是必修课。Prompt Cache 绕不开，需要对各模型厂商的缓存策略心知肚明，知道什么场景用什么策略（如 Gemini 显式缓存 vs 隐式缓存的时机选择），以及怎么用模型路由进一步降低成本。

核心知识点：缓存感知设计、Prompt Cache 策略、模型路由、token 预算管理。

思考

这三个问题没有标准答案，但能聊多深，一聊就知道了。做过的人和没做过的人，差的不是知识面，是在行动中不断调整的认知。认知和执行力从来不分家。

这三个问题其实正好对应 Harness Engineering 的三个子系统：问题一 → 会话生命周期（Lifecycle）+ 验证（Verification），问题二 → 指令（Instructions）+ 状态（State），问题三 → 范围（Scope）+ 缓存感知设计。

行动

面试 Agent 开发岗位时，用这三个问题作为深度探针
自检：我自己对每个问题能答到多深？
把这三个问题转化为团队内部的技术分享主题

钩子

招聘面试场景
团队技术能力评估
Agent 产品设计讨论

出处

2026-05-09: 与创业朋友咖啡聊天后的复盘
参考：Harness Engineering、御舆：解码 Agent Harness、Learn Harness Engineering

更新记录

2026-05-09: 初稿，咖啡聊天复盘

🪴 小胖的数字花园

探索