核心理解

识别一个 Agent 开发者是真懂还是只搓过 demo,三个问题就够了:

问题一:怎么保证 Agent Loop 的稳定?

大部分人对 Agent 的理解止于一个 ReAct 循环、一个 while loop。但真正做起来要处理的 dirty work 太多:死循环、token 上下文超限、LLM 调用 400 错误、部分模型厂商 API 会挂掉、网络不好 SSE 推送会一直卡住。能回答多少,全看自己真正处理过多少。而且这些东西很难让 AI 一开始帮你考虑好——想不到就是会踩坑,也是最能体现专业价值的地方。

核心知识点:Harness Engineering对话循环、断路器模式、上下文压缩策略、错误恢复。

问题二:你在 Agent 的 Context 里面放了哪些东西?

这个问题能看出一个人对 Context Engineering 的理解深度——哪些东西该放,哪些不该放,哪些应该按需加载。能自然触及 Skills、MCP、RAG、Memory 等核心概念。能答上来的可以继续追问:怎么保证长期的 Memory 记忆不坏掉?

核心知识点:渐进式压缩(Snip→Microcompact→Collapse→Autocompact)、记忆系统”只保存无法推导的信息”、按需加载 vs 全量注入。

问题三:如何控制 Agent 的成本?

Token 成本远超其他所有基础设施——CI/CD、服务器、数据库加起来一年的成本可能都不如一个月的 token 账单。省 token 是必修课。Prompt Cache 绕不开,需要对各模型厂商的缓存策略心知肚明,知道什么场景用什么策略(如 Gemini 显式缓存 vs 隐式缓存的时机选择),以及怎么用模型路由进一步降低成本。

核心知识点:缓存感知设计、Prompt Cache 策略、模型路由、token 预算管理。

思考

这三个问题没有标准答案,但能聊多深,一聊就知道了。做过的人和没做过的人,差的不是知识面,是在行动中不断调整的认知。认知和执行力从来不分家。

这三个问题其实正好对应 Harness Engineering 的三个子系统:问题一 → 会话生命周期(Lifecycle)+ 验证(Verification),问题二 → 指令(Instructions)+ 状态(State),问题三 → 范围(Scope)+ 缓存感知设计。

行动

  • 面试 Agent 开发岗位时,用这三个问题作为深度探针
  • 自检:我自己对每个问题能答到多深?
  • 把这三个问题转化为团队内部的技术分享主题

钩子

  • 招聘面试场景
  • 团队技术能力评估
  • Agent 产品设计讨论

出处

更新记录

  • 2026-05-09: 初稿,咖啡聊天复盘