核心理解
识别一个 Agent 开发者是真懂还是只搓过 demo,三个问题就够了:
问题一:怎么保证 Agent Loop 的稳定?
大部分人对 Agent 的理解止于一个 ReAct 循环、一个 while loop。但真正做起来要处理的 dirty work 太多:死循环、token 上下文超限、LLM 调用 400 错误、部分模型厂商 API 会挂掉、网络不好 SSE 推送会一直卡住。能回答多少,全看自己真正处理过多少。而且这些东西很难让 AI 一开始帮你考虑好——想不到就是会踩坑,也是最能体现专业价值的地方。
核心知识点:Harness Engineering、对话循环、断路器模式、上下文压缩策略、错误恢复。
问题二:你在 Agent 的 Context 里面放了哪些东西?
这个问题能看出一个人对 Context Engineering 的理解深度——哪些东西该放,哪些不该放,哪些应该按需加载。能自然触及 Skills、MCP、RAG、Memory 等核心概念。能答上来的可以继续追问:怎么保证长期的 Memory 记忆不坏掉?
核心知识点:渐进式压缩(Snip→Microcompact→Collapse→Autocompact)、记忆系统”只保存无法推导的信息”、按需加载 vs 全量注入。
问题三:如何控制 Agent 的成本?
Token 成本远超其他所有基础设施——CI/CD、服务器、数据库加起来一年的成本可能都不如一个月的 token 账单。省 token 是必修课。Prompt Cache 绕不开,需要对各模型厂商的缓存策略心知肚明,知道什么场景用什么策略(如 Gemini 显式缓存 vs 隐式缓存的时机选择),以及怎么用模型路由进一步降低成本。
核心知识点:缓存感知设计、Prompt Cache 策略、模型路由、token 预算管理。
思考
这三个问题没有标准答案,但能聊多深,一聊就知道了。做过的人和没做过的人,差的不是知识面,是在行动中不断调整的认知。认知和执行力从来不分家。
这三个问题其实正好对应 Harness Engineering 的三个子系统:问题一 → 会话生命周期(Lifecycle)+ 验证(Verification),问题二 → 指令(Instructions)+ 状态(State),问题三 → 范围(Scope)+ 缓存感知设计。
行动
- 面试 Agent 开发岗位时,用这三个问题作为深度探针
- 自检:我自己对每个问题能答到多深?
- 把这三个问题转化为团队内部的技术分享主题
钩子
- 招聘面试场景
- 团队技术能力评估
- Agent 产品设计讨论
出处
- 2026-05-09: 与创业朋友咖啡聊天后的复盘
- 参考:Harness Engineering、御舆:解码 Agent Harness、Learn Harness Engineering
更新记录
- 2026-05-09: 初稿,咖啡聊天复盘