基本概念
什么是大语言模型(LLM)
大语言模型(Large Language Model)是一种基于深度学习的自然语言处理模型,通过在海量文本数据上进行预训练,学习语言的语法、语义和上下文关系。
主流LLM模型
国际模型
| 模型 | 公司 | 特点 |
|---|---|---|
| GPT-4o | OpenAI | 多模态能力强,推理性能优秀 |
| GPT-4 Turbo | OpenAI | 速度快,成本低,支持128K上下文 |
| Claude 3.5 | Anthropic | 长文本理解强,安全对齐好 |
| Gemini 1.5 | 超长上下文(1M tokens),原生多模态 |
国产模型
| 模型 | 公司 | 特点 |
|---|---|---|
| 文心一言 4.0 | 百度 | 中文能力强,ERNIE系列 |
| 通义千问 2.5 | 阿里 | 开源友好,性能均衡 |
| 智谱 GLM-4 | 智谱AI | 国产标杆,支持长上下文 |
| Kimi (Moonshot) | 月之暗面 | 超长上下文(200K),Agent友好 |
| DeepSeek | 深度求索 | 开源能力强,性价比高 |
模型能力对比
核心能力维度
┌─────────────────────────────────────────────────────────────┐
│ LLM 核心能力 │
├─────────────────────────────────────────────────────────────┤
│ 📝 文本生成 │ 💬 对话理解 │ 🔍 知识问答 │
│ 📖 文本摘要 │ 🌐 翻译 │ 💻 代码生成 │
│ 🧮 数学推理 │ 🎯 逻辑推理 │ 📋 任务规划 │
│ 🎭 情感分析 │ 🔎 信息抽取 │ 🏗️ 结构化输出 │
└─────────────────────────────────────────────────────────────┘选择模型的考虑因素
- 任务类型:代码生成、文本创作、对话系统等不同任务适合不同模型
- 成本预算:不同模型的API定价差异很大
- 响应速度:实时应用需要考虑延迟
- 上下文长度:长文档处理需要支持更长上下文的模型
- 中文能力:国产模型在中文场景通常表现更好
模型输入输出
基本交互格式
javascript
// OpenAI API 示例
const response = await openai.chat.completions.create({
model: "gpt-4-turbo",
messages: [
{
role: "system",
content: "你是一个专业的技术顾问"
},
{
role: "user",
content: "请解释什么是RAG架构"
}
],
temperature: 0.7,
max_tokens: 1000
});
console.log(response.choices[0].message.content);参数说明
| 参数 | 说明 | 常用值 |
|---|---|---|
model | 使用的模型 | gpt-4-turbo、glm-4 |
messages | 对话历史 | 包含role和content |
temperature | 创造性控制 | 0.0-2.0,越高越随机 |
max_tokens | 最大输出长度 | 根据需求设置 |
top_p | 核采样参数 | 通常1.0或0.95 |
应用场景
常见应用领域
┌────────────────────────────────────────────────────────────┐
│ LLM 应用场景 │
├────────────────────────────────────────────────────────────┤
│ │
│ 💼 智能客服 ──── 文档问答 ──── 内容创作 ──── 代码助手 │
│ │
│ 📊 数据分析 ──── 报告生成 ──── 翻译服务 ──── 知识管理 │
│ │
│ 🤖 AI Agent ──── 自动化流程 ──── 工具调用 ──── 多模态 │
│ │
└────────────────────────────────────────────────────────────┘技术架构演进
- 直接调用:简单Prompt调用API
- Prompt工程:优化Prompt设计提升效果
- RAG架构:结合知识库提升准确性
- Agent系统:工具调用+自主规划
- Multi-Agent:多Agent协作完成复杂任务