tags: [LLM, Agent, Index, 阿里面试] created: 2026-05-22

AI Agent 工程化系统手册 (2026 版)

面试核心定位：面向**阿里 AI 应用工程师（工程落地）**的实战知识体系。
所有理论必须能映射到工程实现和高并发业务场景。

📚 知识体系导航

本手册已按主题拆分为专项深度笔记，每篇包含原理拓展 + Python 示例代码：

序号	主题	核心内容	阿里面试相关度
01	[[agent-01-planning-reasoning]]	CoT / ReAct / Plan-and-Execute / Reflection / ToT	⭐⭐⭐⭐⭐
02	[[agent-02-memory-context]]	Sliding Window / Summary / RAG / Hybrid Search / Rerank	⭐⭐⭐⭐⭐
03	[[agent-03-tool-use-action]]	Function Calling / Pydantic校验 / 并发工具 / MCP / 熔断降级	⭐⭐⭐⭐⭐
04	[[agent-04-eval-system]]	LLM-as-Judge / RAGAS / Eval Runner / CI/CD 门禁	⭐⭐⭐⭐⭐
05	[[agent-05-infra-performance]]	KV Cache / PagedAttention / Continuous Batching / SSE 流式	⭐⭐⭐⭐⭐
06	[[agent-06-observability]]	Tracing / Token成本 / 归因分析 / 告警	⭐⭐⭐⭐

🗺️ 核心架构速览

┌─────────────────────────────────────────────────────────┐
│                    Agent 系统架构                         │
│                                                          │
│  User Input                                              │
│      ↓                                                   │
│  ┌─────────────────────────────────────────┐            │
│  │  Planning Layer（规划层）                │            │
│  │  ReAct / Plan-and-Execute / Reflection   │            │
│  └─────────────────────────────────────────┘            │
│      ↓                    ↓                              │
│  ┌──────────┐      ┌──────────────┐                     │
│  │ Memory   │      │ Tool / Action │                     │
│  │ RAG/滑窗 │      │ Function Call │                     │
│  └──────────┘      └──────────────┘                     │
│      ↓                    ↓                              │
│  ┌─────────────────────────────────────────┐            │
│  │  Eval 体系（评测 + CI/CD 质量门禁）       │            │
│  └─────────────────────────────────────────┘            │
│  ┌─────────────────────────────────────────┐            │
│  │  Observability（Trace + Metrics + Cost） │            │
│  └─────────────────────────────────────────┘            │
│  ┌─────────────────────────────────────────┐            │
│  │  Infra（vLLM + Continuous Batching）     │            │
│  └─────────────────────────────────────────┘            │
└─────────────────────────────────────────────────────────┘

⚡ 高频面试问题速查

Planning 相关

Q: ReAct 有什么缺点？ → [[agent-01-planning-reasoning#三、ReAct]]
上下文膨胀（每步携带完整历史）+ 容错率低（一步错步步错）
Q: 如何解决 Agent 死循环？ → 设置 max_steps；Reflection 闭环自我纠错

Memory / RAG 相关

Q: 如何提高 RAG 检索准确率？ → [[agent-02-memory-context#二、长期记忆]]
混合检索（BM25 + 向量） + Cross-Encoder Reranker
Q: Lost in the Middle 是什么？ → 长上下文中间部分被模型忽略；减少 Top-K 或重排文档位置

Tool Use 相关

Q: 如何提高 Function Calling 的参数填充正确率？ → [[agent-03-tool-use-action]]
精化 Schema description + 加 example + Pydantic 校验 + Auto-Correction 重试

Infra 相关

Q: vLLM 的 PagedAttention 原理？ → [[agent-05-infra-performance#二、KV Cache 与 PagedAttention]]
借鉴操作系统分页机制，动态分配 KV Cache，消除显存碎片，Batch Size 提升 2-4x
Q: 什么是 Continuous Batching？ → 请求完成后立刻插入新请求，GPU 始终满载

Eval 相关

Q: 什么是 Faithfulness？怎么计算？ → [[agent-04-eval-system#四、RAGAS 指标实现]]
将答案拆解为 Claims，逐一验证是否有 Context 支撑，支撑比例即 Faithfulness

🎯 面试防守策略：如何用 CodeBuddy 回答概念问题

策略：将具体项目作为抽象概念的落地证明。

当问”意图识别”时：
“在 CodeBuddy 中，通过前置路由层将’解释代码’和’重构代码’分流到不同小 Agent，提高并发能力和响应速度。”
当问”Agent 幻觉”时：
“引入 Reflection 闭环：模型生成修改计划后，校验卡点对比 AST，错误信息反馈给模型纠正。”
当问”长上下文优化”时：
“没有把整个文件树喂给模型，而是只注入相关函数签名（摘要），按需工具读取完整内容。”
当问”系统如何保证稳定性”时：
“三层保障：Pydantic 强校验 + Auto-Correction 重试 + 规则引擎兜底；同时有熔断器监控失败率。”

同目录：[[prompt-engineering]]