一个月突击：AI大模型应用开发工程师面试指南

一、岗位核心能力模型

1.1 能力图谱

┌──────────────────────────────────────────────────────────────┐
│              AI大模型应用开发工程师 - 核心能力                    │
├──────────────────────────────────────────────────────────────┤
│                                                               │
│  📚 理论基础 (20%)              🔧 应用开发 (40%)              │
│  ├── Transformer架构            ├── Prompt工程                │
│  ├── Attention机制             ├── RAG架构开发               │
│  ├── 训练与推理原理             ├── Agent框架设计             │
│  └── 主流模型演进               └── 工具链集成                │
│                                                               │
│  ⚙️ 模型微调 (15%)              🚀 推理优化 (15%)              │
│  ├── LoRA / QLoRA              ├── vLLM / TGI                │
│  ├── P-Tuning / Prefix-Tuning ├── 量化与加速                 │
│  ├── SFT / RLHF                ├── 服务化部署                 │
│  └── 数据处理与增强             └── 多模态推理                 │
│                                                               │
│  📊 工程能力 (10%)              🛡️ 安全合规 (5%)              │
│  ├── 向量数据库 (Milvus/Chroma)├── 内容安全审核              │
│  ├── LangChain / LlamaIndex    ├── 数据隐私保护              │
│  ├── 数据清洗与评估             ├── 敏感信息过滤              │
│  └── 监控与告警                 └── 合规要求理解               │
│                                                               │
└──────────────────────────────────────────────────────────────┘

1.2 知识权重分配

领域	面试出现频率	掌握难度	建议投入时间
Prompt工程 & RAG	⭐⭐⭐⭐⭐	中	6天
Agent开发与框架	⭐⭐⭐⭐⭐	中高	6天
Transformer与LLM原理	⭐⭐⭐⭐	高	5天
模型微调技术	⭐⭐⭐⭐	高	4天
推理优化与部署	⭐⭐⭐⭐	中	4天
向量数据库	⭐⭐⭐	中	2天
工程化/安全/评估	⭐⭐⭐	中低	3天

二、四周突击计划

第1周：基础理论与Prompt工程（夯实地基）

目标：理解LLM核心原理，掌握Prompt设计方法论

日期	学习内容	关键成果	每日学习时长
Day1	Transformer架构详解	画出完整架构图，理解Encoder-Decoder	3h
Day2	Attention机制与变体	手写Self-Attention伪代码，理解Multi-Head	3h
Day3	主流模型演进（GPT/BERT/Llama）	掌握各模型核心创新点与区别	3h
Day4	Prompt工程基础	熟练掌握Few-shot、CoT、角色扮演	3h
Day5	Prompt工程进阶	ReAct、Tree of Thoughts、Prompt优化技巧	3h
Day6	RAG原理与组件	理解RAG整体架构，掌握Embedding原理	3h
Day7	周复盘 + 模拟题练习	整理思维导图，完成30道基础题	3h

第2周：RAG深入与Agent开发（核心应用）

目标：掌握RAG全流程开发，理解Agent设计模式

日期	学习内容	关键成果	每日学习时长
Day8	文档处理与文本切分	理解Chunk策略，实现多种切分方法	3h
Day9	向量数据库与相似度搜索	掌握Milvus/Chroma使用，理解ANN索引	3h
Day10	检索优化技术	掌握HyDE、重排序、混合检索、查询改写	3h
Day11	LangChain框架实战	实现一个RAG问答Demo	4h
Day12	Agent核心原理	理解ReAct、Plan-and-Execute模式	3h
Day13	Function Calling与工具集成	实现一个带工具调用的Agent	3h
Day14	周复盘 + 项目Demo	构建完整的知识库问答系统	4h

第3周：模型微调与推理优化（进阶能力）

目标：理解主流微调方法，掌握推理优化策略

日期	学习内容	关键成果	每日学习时长
Day15	微调基础与数据准备	理解SFT数据格式与构建方法	3h
Day16	LoRA/QLoRA原理与实践	掌握LoRA核心参数与效果评估	3h
Day17	P-Tuning等轻量微调	理解不同方法的适用场景	3h
Day18	vLLM与推理加速	理解PagedAttention，部署vLLM	4h
Day19	量化技术（GPTQ/AWQ）	理解量化原理与效果权衡	3h
Day20	模型评估方法论	掌握BLEU/ROUGE/HumanEval等指标	3h
Day21	周复盘 + 项目Demo	完成一个领域模型微调实验	4h

第4周：综合项目与面试冲刺（临门一脚）

目标：完善项目经验，掌握高频题，提升表达能力

日期	学习内容	关键成果	每日学习时长
Day22-23	综合项目：企业知识库问答	从0到1实现一个完整项目	8h
Day24-25	高频题专题训练	刷完100道核心面试题	6h
Day26	场景题/系统设计	掌握RAG系统设计、Agent架构设计	4h
Day27	简历梳理与项目包装	准备3个能讲清楚的AI项目	3h
Day28	模拟面试与错题回顾	至少进行2轮模拟面试	4h

三、学习方法与资料推荐

3.1 必学资料清单

📖 论文与理论

Transformer: "Attention Is All You Need"（必读）
LoRA: "LoRA: Low-Rank Adaptation of Large Language Models"
QLoRA: "QLoRA: Efficient Finetuning of Quantized LLMs"
RAG: "Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks"
ReAct: "ReAct: Synergizing Reasoning and Acting in Language Models"

🛠️ 框架与工具

LangChain 官网文档 + 示例代码
LlamaIndex 文档（侧重RAG）
vLLM GitHub README
Milvus / Chroma 文档

📚 优质博客与教程

Hugging Face 官方教程
LLM Course（GitHub开源课程）
Prompt Engineering Guide（promptingguide.ai）
Lilian Weng Blog（lilianweng.github.io）

3.2 学习策略

1. 理论+实践交替：

每天至少1小时动手实践
学完概念立即写Demo验证
整理代码片段到个人仓库

2. 输出驱动输入：

每个知识点用自己的话复述
写博客/笔记总结
给他人讲解（费曼学习法）

3. 面试导向：

以"如果被问到这个问题，我怎么回答"为导向
每个知识点准备：定义 → 原理 → 优缺点 → 应用场景
高频题优先突破

4. 项目驱动：

至少完成2个完整项目
1. 企业级知识库问答系统（RAG）
2. 工具调用型Agent（如代码助手或数据分析Agent）

四、面试题库文档目录

docs/E_AI大模型应用面试/
├── 01_面试突击方案.md                    # 本篇：整体规划与方法论
├── 02_LLM基础理论.md                     # Transformer/Attention/模型原理
├── 03_Prompt工程与优化.md                # Prompt设计与优化技巧
├── 04_RAG架构与实现.md                   # RAG全流程技术点
├── 05_Agent开发与框架.md                 # Agent原理与实现
├── 06_模型微调技术.md                    # LoRA/QLoRA/SFT
├── 07_推理优化与部署.md                  # vLLM/量化/部署
├── 08_向量数据库与检索.md                # Milvus/Chroma/ANN索引
├── 09_工程化与评估.md                    # 监控/评估/测试
└── 10_场景题与系统设计.md                # 开放问题与架构设计

五、高频题预览（10道必考）

Q1: 请画出Transformer架构图并讲解核心组件

Input Embedding + Positional Encoding → Multi-Head Self-Attention → Feed-Forward → Layer Norm

Q2: Attention机制的数学表达与直觉理解

Attention(Q, K, V) = softmax(Q·K^T / √d_k) · V

Q3: RAG vs 微调，如何选择？

维度	RAG	微调
知识更新	实时更新，新增文档即可	需要重新训练
事实准确性	高（有引用来源）	低（易幻觉）
部署成本	低	中高（需要训练资源）
风格/语气	弱	强
适用场景	知识库问答、文档检索	风格迁移、领域术语适配

Q4: Prompt工程中，CoT（思维链）为什么有效？

CoT通过显式的推理步骤引导模型进行更复杂的逻辑思考，主要优势：
将复杂问题分解为中间步骤，降低单步推理难度
给模型提供推理模板，学习如何逐步解决问题
可解释性强，可以看到模型的思考过程

Q5: Agent的核心组件有哪些？

┌──────────────────────────────────────────┐
│             Agent 核心组件                │
├──────────────────────────────────────────┤
│  🎯 规划器 (Planner)    → 任务拆解与策略 │
│  💭 记忆模块 (Memory)   → 短期/长期记忆   │
│  🔧 工具使用 (Tools)    → 调用外部能力   │
│  📋 执行器 (Executor)   → 执行与结果处理  │
│  🔍 观察器 (Observer)   → 监控与反馈      │
└──────────────────────────────────────────┘

Q6: LoRA的核心思想与优势

核心：在原有权重W基础上，用低秩矩阵B×A模拟权重变化ΔW
优势：
  1. 训练参数量小（仅0.1%~1%）
  2. 不影响原模型推理延迟
  3. 多任务切换方便（插拔式）

Q7: vLLM为什么快？PagedAttention原理

统一管理KV缓存，类似操作系统虚拟内存机制
将KV存放在pages中，非连续物理内存
请求按需分配/释放pages
大幅提高批处理吞吐量（吞吐量提升2-4倍）

Q8: RAG中常见的检索优化方法

方法	说明
HyDE	先用LLM生成假设性答案，再用假设答案检索
重排序	向量粗召回 + Cross-Encoder精排
混合检索	关键词(BM25) + 语义向量融合
查询改写	将用户问题改写为更适合检索的形式
子查询	将复杂问题拆分为多个子问题并行检索

Q9: 如何评估一个RAG系统的效果？

检索质量：Recall@K、Precision@K、NDCG
回答质量：Faithfulness（忠实度）、Answer Relevance（相关性）
端到端评测：人工打分、BLEU/ROUGE、LLM-as-a-Judge
性能指标：延迟、吞吐、Token成本

Q10: 请设计一个企业级知识库问答系统的架构

用户问题
   ↓
[查询理解/改写] ← [用户画像/上下文]
   ↓
[混合检索] → [关键词检索(BM25)] + [语义检索(向量DB)]
   ↓
[结果重排序] ← [Cross-Encoder]
   ↓
[上下文整合] → [Prompt模板] + [参考文档] + [引用标记]
   ↓
[LLM生成] ← [安全审核/敏感词过滤]
   ↓
[答案+引用来源] ← 用户

[监控层]：Query日志、Token消耗、用户反馈、满意度统计

六、学习建议

✅ 必做清单

[ ] 手推Attention公式
[ ] 写一个完整的RAG系统（LangChain + Chroma + 任意LLM）
[ ] 实现一个带Function Calling的Agent
[ ] 阅读Transformer、LoRA、RAG三篇核心论文
[ ] 完成至少1个小项目并部署到GitHub
[ ] 刷完本系列100道面试题

⚠️ 常见误区避免

过度关注模型训练而忽视应用：大多数岗位是做应用开发，不是训练模型
只学API调用而忽略原理：面试会考底层原理，必须理解
忽视工程化能力：日志、监控、错误处理同样重要
Prompt工程太简单：好的Prompt是产品体验的关键，需要深入研究
忽视数据安全与合规：企业级应用必须考虑，面试高频问

💪 学习资源模板

文档：docs/E_AI大模型应用面试/（本系列全部文档）
代码：个人GitHub仓库（建议创建AI-Playground）
笔记：Notion/Obsidian，按知识点整理
工具：Postman调试API、Colab跑实验、Ollama本地部署

一个月突击：AI大模型应用开发工程师面试指南 ​

一、岗位核心能力模型 ​

1.1 能力图谱 ​

1.2 知识权重分配 ​

二、四周突击计划 ​

第1周：基础理论与Prompt工程（夯实地基） ​

第2周：RAG深入与Agent开发（核心应用） ​

第3周：模型微调与推理优化（进阶能力） ​

第4周：综合项目与面试冲刺（临门一脚） ​

三、学习方法与资料推荐 ​

3.1 必学资料清单 ​

📖 论文与理论 ​

🛠️ 框架与工具 ​

📚 优质博客与教程 ​

3.2 学习策略 ​

四、面试题库文档目录 ​

五、高频题预览（10道必考） ​

Q1: 请画出Transformer架构图并讲解核心组件 ​

Q2: Attention机制的数学表达与直觉理解 ​

Q3: RAG vs 微调，如何选择？ ​

Q4: Prompt工程中，CoT（思维链）为什么有效？ ​

Q5: Agent的核心组件有哪些？ ​

Q6: LoRA的核心思想与优势 ​

Q7: vLLM为什么快？PagedAttention原理 ​

Q8: RAG中常见的检索优化方法 ​

Q9: 如何评估一个RAG系统的效果？ ​

Q10: 请设计一个企业级知识库问答系统的架构 ​

六、学习建议 ​

✅ 必做清单 ​

⚠️ 常见误区避免 ​

💪 学习资源模板 ​

一个月突击：AI大模型应用开发工程师面试指南

一、岗位核心能力模型

1.1 能力图谱

1.2 知识权重分配

二、四周突击计划

第1周：基础理论与Prompt工程（夯实地基）

第2周：RAG深入与Agent开发（核心应用）

第3周：模型微调与推理优化（进阶能力）

第4周：综合项目与面试冲刺（临门一脚）

三、学习方法与资料推荐

3.1 必学资料清单

📖 论文与理论

🛠️ 框架与工具

📚 优质博客与教程

3.2 学习策略

四、面试题库文档目录

五、高频题预览（10道必考）

Q1: 请画出Transformer架构图并讲解核心组件

Q2: Attention机制的数学表达与直觉理解

Q3: RAG vs 微调，如何选择？

Q4: Prompt工程中，CoT（思维链）为什么有效？

Q5: Agent的核心组件有哪些？

Q6: LoRA的核心思想与优势

Q7: vLLM为什么快？PagedAttention原理

Q8: RAG中常见的检索优化方法

Q9: 如何评估一个RAG系统的效果？

Q10: 请设计一个企业级知识库问答系统的架构

六、学习建议

✅ 必做清单

⚠️ 常见误区避免

💪 学习资源模板