Skip to content

一个月突击:AI大模型应用开发工程师面试指南

一、岗位核心能力模型

1.1 能力图谱

┌──────────────────────────────────────────────────────────────┐
│              AI大模型应用开发工程师 - 核心能力                    │
├──────────────────────────────────────────────────────────────┤
│                                                               │
│  📚 理论基础 (20%)              🔧 应用开发 (40%)              │
│  ├── Transformer架构            ├── Prompt工程                │
│  ├── Attention机制             ├── RAG架构开发               │
│  ├── 训练与推理原理             ├── Agent框架设计             │
│  └── 主流模型演进               └── 工具链集成                │
│                                                               │
│  ⚙️ 模型微调 (15%)              🚀 推理优化 (15%)              │
│  ├── LoRA / QLoRA              ├── vLLM / TGI                │
│  ├── P-Tuning / Prefix-Tuning ├── 量化与加速                 │
│  ├── SFT / RLHF                ├── 服务化部署                 │
│  └── 数据处理与增强             └── 多模态推理                 │
│                                                               │
│  📊 工程能力 (10%)              🛡️ 安全合规 (5%)              │
│  ├── 向量数据库 (Milvus/Chroma)├── 内容安全审核              │
│  ├── LangChain / LlamaIndex    ├── 数据隐私保护              │
│  ├── 数据清洗与评估             ├── 敏感信息过滤              │
│  └── 监控与告警                 └── 合规要求理解               │
│                                                               │
└──────────────────────────────────────────────────────────────┘

1.2 知识权重分配

领域面试出现频率掌握难度建议投入时间
Prompt工程 & RAG⭐⭐⭐⭐⭐6天
Agent开发与框架⭐⭐⭐⭐⭐中高6天
Transformer与LLM原理⭐⭐⭐⭐5天
模型微调技术⭐⭐⭐⭐4天
推理优化与部署⭐⭐⭐⭐4天
向量数据库⭐⭐⭐2天
工程化/安全/评估⭐⭐⭐中低3天

二、四周突击计划

第1周:基础理论与Prompt工程(夯实地基)

目标:理解LLM核心原理,掌握Prompt设计方法论
日期学习内容关键成果每日学习时长
Day1Transformer架构详解画出完整架构图,理解Encoder-Decoder3h
Day2Attention机制与变体手写Self-Attention伪代码,理解Multi-Head3h
Day3主流模型演进(GPT/BERT/Llama)掌握各模型核心创新点与区别3h
Day4Prompt工程基础熟练掌握Few-shot、CoT、角色扮演3h
Day5Prompt工程进阶ReAct、Tree of Thoughts、Prompt优化技巧3h
Day6RAG原理与组件理解RAG整体架构,掌握Embedding原理3h
Day7周复盘 + 模拟题练习整理思维导图,完成30道基础题3h

第2周:RAG深入与Agent开发(核心应用)

目标:掌握RAG全流程开发,理解Agent设计模式
日期学习内容关键成果每日学习时长
Day8文档处理与文本切分理解Chunk策略,实现多种切分方法3h
Day9向量数据库与相似度搜索掌握Milvus/Chroma使用,理解ANN索引3h
Day10检索优化技术掌握HyDE、重排序、混合检索、查询改写3h
Day11LangChain框架实战实现一个RAG问答Demo4h
Day12Agent核心原理理解ReAct、Plan-and-Execute模式3h
Day13Function Calling与工具集成实现一个带工具调用的Agent3h
Day14周复盘 + 项目Demo构建完整的知识库问答系统4h

第3周:模型微调与推理优化(进阶能力)

目标:理解主流微调方法,掌握推理优化策略
日期学习内容关键成果每日学习时长
Day15微调基础与数据准备理解SFT数据格式与构建方法3h
Day16LoRA/QLoRA原理与实践掌握LoRA核心参数与效果评估3h
Day17P-Tuning等轻量微调理解不同方法的适用场景3h
Day18vLLM与推理加速理解PagedAttention,部署vLLM4h
Day19量化技术(GPTQ/AWQ)理解量化原理与效果权衡3h
Day20模型评估方法论掌握BLEU/ROUGE/HumanEval等指标3h
Day21周复盘 + 项目Demo完成一个领域模型微调实验4h

第4周:综合项目与面试冲刺(临门一脚)

目标:完善项目经验,掌握高频题,提升表达能力
日期学习内容关键成果每日学习时长
Day22-23综合项目:企业知识库问答从0到1实现一个完整项目8h
Day24-25高频题专题训练刷完100道核心面试题6h
Day26场景题/系统设计掌握RAG系统设计、Agent架构设计4h
Day27简历梳理与项目包装准备3个能讲清楚的AI项目3h
Day28模拟面试与错题回顾至少进行2轮模拟面试4h

三、学习方法与资料推荐

3.1 必学资料清单

📖 论文与理论

  • Transformer: "Attention Is All You Need"(必读)
  • LoRA: "LoRA: Low-Rank Adaptation of Large Language Models"
  • QLoRA: "QLoRA: Efficient Finetuning of Quantized LLMs"
  • RAG: "Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks"
  • ReAct: "ReAct: Synergizing Reasoning and Acting in Language Models"

🛠️ 框架与工具

  • LangChain 官网文档 + 示例代码
  • LlamaIndex 文档(侧重RAG)
  • vLLM GitHub README
  • Milvus / Chroma 文档

📚 优质博客与教程

  • Hugging Face 官方教程
  • LLM Course(GitHub开源课程)
  • Prompt Engineering Guide(promptingguide.ai)
  • Lilian Weng Blog(lilianweng.github.io)

3.2 学习策略

1. 理论+实践交替:

  • 每天至少1小时动手实践
  • 学完概念立即写Demo验证
  • 整理代码片段到个人仓库

2. 输出驱动输入:

  • 每个知识点用自己的话复述
  • 写博客/笔记总结
  • 给他人讲解(费曼学习法)

3. 面试导向:

  • 以"如果被问到这个问题,我怎么回答"为导向
  • 每个知识点准备:定义 → 原理 → 优缺点 → 应用场景
  • 高频题优先突破

4. 项目驱动:

  • 至少完成2个完整项目
    1. 企业级知识库问答系统(RAG)
    2. 工具调用型Agent(如代码助手或数据分析Agent)

四、面试题库文档目录

docs/E_AI大模型应用面试/
├── 01_面试突击方案.md                    # 本篇:整体规划与方法论
├── 02_LLM基础理论.md                     # Transformer/Attention/模型原理
├── 03_Prompt工程与优化.md                # Prompt设计与优化技巧
├── 04_RAG架构与实现.md                   # RAG全流程技术点
├── 05_Agent开发与框架.md                 # Agent原理与实现
├── 06_模型微调技术.md                    # LoRA/QLoRA/SFT
├── 07_推理优化与部署.md                  # vLLM/量化/部署
├── 08_向量数据库与检索.md                # Milvus/Chroma/ANN索引
├── 09_工程化与评估.md                    # 监控/评估/测试
└── 10_场景题与系统设计.md                # 开放问题与架构设计

五、高频题预览(10道必考)

Q1: 请画出Transformer架构图并讲解核心组件

Input Embedding + Positional Encoding → Multi-Head Self-Attention → Feed-Forward → Layer Norm

Q2: Attention机制的数学表达与直觉理解

Attention(Q, K, V) = softmax(Q·K^T / √d_k) · V

Q3: RAG vs 微调,如何选择?

维度RAG微调
知识更新实时更新,新增文档即可需要重新训练
事实准确性高(有引用来源)低(易幻觉)
部署成本中高(需要训练资源)
风格/语气
适用场景知识库问答、文档检索风格迁移、领域术语适配

Q4: Prompt工程中,CoT(思维链)为什么有效?

CoT通过显式的推理步骤引导模型进行更复杂的逻辑思考,主要优势:

  1. 将复杂问题分解为中间步骤,降低单步推理难度
  2. 给模型提供推理模板,学习如何逐步解决问题
  3. 可解释性强,可以看到模型的思考过程

Q5: Agent的核心组件有哪些?

┌──────────────────────────────────────────┐
│             Agent 核心组件                │
├──────────────────────────────────────────┤
│  🎯 规划器 (Planner)    → 任务拆解与策略 │
│  💭 记忆模块 (Memory)   → 短期/长期记忆   │
│  🔧 工具使用 (Tools)    → 调用外部能力   │
│  📋 执行器 (Executor)   → 执行与结果处理  │
│  🔍 观察器 (Observer)   → 监控与反馈      │
└──────────────────────────────────────────┘

Q6: LoRA的核心思想与优势

核心:在原有权重W基础上,用低秩矩阵B×A模拟权重变化ΔW
优势:
  1. 训练参数量小(仅0.1%~1%)
  2. 不影响原模型推理延迟
  3. 多任务切换方便(插拔式)

Q7: vLLM为什么快?PagedAttention原理

  1. 统一管理KV缓存,类似操作系统虚拟内存机制
  2. 将KV存放在pages中,非连续物理内存
  3. 请求按需分配/释放pages
  4. 大幅提高批处理吞吐量(吞吐量提升2-4倍)

Q8: RAG中常见的检索优化方法

方法说明
HyDE先用LLM生成假设性答案,再用假设答案检索
重排序向量粗召回 + Cross-Encoder精排
混合检索关键词(BM25) + 语义向量融合
查询改写将用户问题改写为更适合检索的形式
子查询将复杂问题拆分为多个子问题并行检索

Q9: 如何评估一个RAG系统的效果?

  • 检索质量:Recall@K、Precision@K、NDCG
  • 回答质量:Faithfulness(忠实度)、Answer Relevance(相关性)
  • 端到端评测:人工打分、BLEU/ROUGE、LLM-as-a-Judge
  • 性能指标:延迟、吞吐、Token成本

Q10: 请设计一个企业级知识库问答系统的架构

用户问题

[查询理解/改写] ← [用户画像/上下文]

[混合检索] → [关键词检索(BM25)] + [语义检索(向量DB)]

[结果重排序] ← [Cross-Encoder]

[上下文整合] → [Prompt模板] + [参考文档] + [引用标记]

[LLM生成] ← [安全审核/敏感词过滤]

[答案+引用来源] ← 用户

[监控层]:Query日志、Token消耗、用户反馈、满意度统计

六、学习建议

✅ 必做清单

  • [ ] 手推Attention公式
  • [ ] 写一个完整的RAG系统(LangChain + Chroma + 任意LLM)
  • [ ] 实现一个带Function Calling的Agent
  • [ ] 阅读Transformer、LoRA、RAG三篇核心论文
  • [ ] 完成至少1个小项目并部署到GitHub
  • [ ] 刷完本系列100道面试题

⚠️ 常见误区避免

  1. 过度关注模型训练而忽视应用:大多数岗位是做应用开发,不是训练模型
  2. 只学API调用而忽略原理:面试会考底层原理,必须理解
  3. 忽视工程化能力:日志、监控、错误处理同样重要
  4. Prompt工程太简单:好的Prompt是产品体验的关键,需要深入研究
  5. 忽视数据安全与合规:企业级应用必须考虑,面试高频问

💪 学习资源模板

  • 文档docs/E_AI大模型应用面试/(本系列全部文档)
  • 代码:个人GitHub仓库(建议创建AI-Playground)
  • 笔记:Notion/Obsidian,按知识点整理
  • 工具:Postman调试API、Colab跑实验、Ollama本地部署

Released under the MIT License.