基本概念

什么是大语言模型（LLM）

大语言模型（Large Language Model）是一种基于深度学习的自然语言处理模型，通过在海量文本数据上进行预训练，学习语言的语法、语义和上下文关系。

主流LLM模型

国际模型

模型	公司	特点
GPT-4o	OpenAI	多模态能力强，推理性能优秀
GPT-4 Turbo	OpenAI	速度快，成本低，支持128K上下文
Claude 3.5	Anthropic	长文本理解强，安全对齐好
Gemini 1.5	Google	超长上下文（1M tokens），原生多模态

国产模型

模型	公司	特点
文心一言 4.0	百度	中文能力强，ERNIE系列
通义千问 2.5	阿里	开源友好，性能均衡
智谱 GLM-4	智谱AI	国产标杆，支持长上下文
Kimi (Moonshot)	月之暗面	超长上下文（200K），Agent友好
DeepSeek	深度求索	开源能力强，性价比高

模型能力对比

核心能力维度

┌─────────────────────────────────────────────────────────────┐
│                      LLM 核心能力                           │
├─────────────────────────────────────────────────────────────┤
│  📝 文本生成     │  💬 对话理解     │  🔍 知识问答        │
│  📖 文本摘要     │  🌐 翻译          │  💻 代码生成        │
│  🧮 数学推理     │  🎯 逻辑推理      │  📋 任务规划        │
│  🎭 情感分析     │  🔎 信息抽取      │  🏗️ 结构化输出      │
└─────────────────────────────────────────────────────────────┘

选择模型的考虑因素

任务类型：代码生成、文本创作、对话系统等不同任务适合不同模型
成本预算：不同模型的API定价差异很大
响应速度：实时应用需要考虑延迟
上下文长度：长文档处理需要支持更长上下文的模型
中文能力：国产模型在中文场景通常表现更好

模型输入输出

基本交互格式

javascript

// OpenAI API 示例
const response = await openai.chat.completions.create({
  model: "gpt-4-turbo",
  messages: [
    {
      role: "system",
      content: "你是一个专业的技术顾问"
    },
    {
      role: "user", 
      content: "请解释什么是RAG架构"
    }
  ],
  temperature: 0.7,
  max_tokens: 1000
});

console.log(response.choices[0].message.content);

参数说明

参数	说明	常用值
`model`	使用的模型	gpt-4-turbo、glm-4
`messages`	对话历史	包含role和content
`temperature`	创造性控制	0.0-2.0，越高越随机
`max_tokens`	最大输出长度	根据需求设置
`top_p`	核采样参数	通常1.0或0.95

应用场景

常见应用领域

┌────────────────────────────────────────────────────────────┐
│                      LLM 应用场景                          │
├────────────────────────────────────────────────────────────┤
│                                                            │
│  💼 智能客服 ──── 文档问答 ──── 内容创作 ──── 代码助手      │
│                                                            │
│  📊 数据分析 ──── 报告生成 ──── 翻译服务 ──── 知识管理      │
│                                                            │
│  🤖 AI Agent ──── 自动化流程 ──── 工具调用 ──── 多模态    │
│                                                            │
└────────────────────────────────────────────────────────────┘

技术架构演进

直接调用：简单Prompt调用API
Prompt工程：优化Prompt设计提升效果
RAG架构：结合知识库提升准确性
Agent系统：工具调用+自主规划
Multi-Agent：多Agent协作完成复杂任务

基本概念 ​

什么是大语言模型（LLM） ​

主流LLM模型 ​

国际模型 ​

国产模型 ​

模型能力对比 ​

核心能力维度 ​

选择模型的考虑因素 ​

模型输入输出 ​

基本交互格式 ​

参数说明 ​

应用场景 ​

常见应用领域 ​

技术架构演进 ​

基本概念

什么是大语言模型（LLM）

主流LLM模型

国际模型

国产模型

模型能力对比

核心能力维度

选择模型的考虑因素

模型输入输出

基本交互格式

参数说明

应用场景

常见应用领域

技术架构演进