AI 使用进化论：从你好到 MCP 的五个阶段

每个人使用 AI 的方式都在不断进化，简单记录一下从简单对话到复杂 Agent 系统的完整演进路径。

前言

ChatGPT 在 2022 年底横空出世，大语言模型（LLM）彻底改变了我们和计算机打交道的方式。但很多人没意识到，我们使用 AI 的方式本身也在经历一场变革。

这篇文章带你回顾 AI 使用的五个阶段，从最简单的"打招呼"，到今天最前沿的 MCP（Model Context Protocol）和 Agent 系统。

第一阶段：简单尝试期 - “Hi，你好！”

典型特征

把 AI 当聊天机器人
问简单问题，获取直接回答
一问一答的交互方式

常见场景

用户：你好
AI：你好！有什么我可以帮助你的吗？

用户：今天天气怎么样？
AI：抱歉，我无法获取实时天气信息。建议你查看天气应用或网站。

用户：给我讲个笑话
AI：为什么程序员总是分不清万圣节和圣诞节？因为 Oct 31 = Dec 25！

这个阶段的特点

大多数人这时候只是把 AI 当个有趣的聊天对象。问点通用知识，让它写点简单文案，或者纯粹为了好玩聊两句。

优点：

入门门槛低，打开就能用
快速感受 AI 的能力

局限：

拿不到实时信息
做不了实际操作
回答有时候不太准

第二阶段：搜索引擎替代期 - “帮我查一下…”

典型特征

用 AI 替代百度、Google
提问方式变得更复杂
期待 AI 整合、总结信息

常见场景

用户：Vue 3 和 React 18 有什么区别？哪个更适合新项目？
AI：Vue 3 和 React 18 各有优势，选择取决于团队背景和项目需求...

用户：帮我总结一下最近关于 RISC-V 的新闻
AI：近期 RISC-V 领域的重要进展包括...

用户：解释一下微服务架构，有什么优缺点？
AI：微服务架构是一种将应用程序拆分为多个小型服务的架构风格...

这个阶段的特点

用户开始发现 AI 比搜索引擎更擅长：

信息整合：把多个来源的信息揉在一起
个性化回答：根据上下文调整回复
持续对话：可以追问、澄清、深入聊

关键进步：

学会了怎么提问（Prompt Engineering 的雏形）
开始理解 AI 的能力边界
用 AI 加速学习和决策

潜在风险：

AI 可能编造不存在的"事实"
信息可能不是最新的
重要信息需要交叉验证

第三阶段：Prompt 工程期 - “精确控制的艺术”

典型特征

掌握提示词技巧
用角色扮演、思维链、Few-shot 等方法
追求更精准、可控的输出

常用技巧

1. 角色设定

你是一位资深的前端工程师，有 10 年的 React 开发经验。
请用专业但易懂的语言解释 React Server Components 的工作原理。

2. 思维链

请一步步思考这个问题：
如果一个城市要减少交通拥堵，有哪些可行的方案？
请先分析问题，再列举方案，最后比较优劣。

3. Few-shot 学习

以下是一些产品描述的示例：

输入：无线蓝牙耳机
输出：沉浸音质，无线自由。这款蓝牙耳机采用最新音频技术...

输入：机械键盘
输出：指尖韵律，敲击如歌。高品质机械轴体带来...

现在请为"智能手表"写一段产品描述。

4. 结构化输出

请以 JSON 格式返回以下信息：
- 书名
- 作者
- 出版年份
- 三句话简介

书籍：《人类简史》

这个阶段的特点

用户不再被动接受 AI 的回答，而是主动设计交互方式来获得更好的结果。

核心认知：

输入质量决定输出质量
AI 是工具，得用对方法
可以通过"编程"AI 来获得特定格式和风格

第四阶段：工具调用期 - Function Calling & Tool Use

典型特征

AI 不只是"说话"，而是能"做事"
通过 Function Calling 连接外部 API 和服务
从对话助手升级为执行代理

什么是 Function Calling？

Function Calling（函数调用）让 LLM 能够：

识别用户意图需要调用哪个函数
生成符合函数参数要求的 JSON
由外部系统执行函数并返回结果
基于结果继续对话

实际案例

## 定义的函数
functions = [
    {
        "name": "get_weather",
        "description": "获取指定城市的天气信息",
        "parameters": {
            "type": "object",
            "properties": {
                "city": {"type": "string", "description": "城市名称"},
                "unit": {"type": "string", "enum": ["celsius", "fahrenheit"]}
            },
            "required": ["city"]
        }
    },
    {
        "name": "send_email",
        "description": "发送电子邮件",
        "parameters": {
            "type": "object",
            "properties": {
                "to": {"type": "string", "description": "收件人邮箱"},
                "subject": {"type": "string", "description": "邮件主题"},
                "body": {"type": "string", "description": "邮件内容"}
            },
            "required": ["to", "subject", "body"]
        }
    }
]

用户交互示例

用户：北京今天天气怎么样？如果温度低于 15 度，给我发一封邮件提醒带外套。

AI：[调用 get_weather("北京")]
    → 北京当前温度：12°C

    [调用 send_email(to="user@example.com", 
                     subject="天气提醒", 
                     body="北京今天温度 12°C，建议带外套")]

    已查询天气并为你发送了提醒邮件！

这个阶段的革命性意义

突破信息边界：AI 可以获取实时数据
执行实际操作：不再只是建议，而是直接行动
组合能力：可以串联多个工具完成复杂任务

代表性产品：

ChatGPT Plugins
Claude Tool Use
OpenAI Assistants API
各类 AI Agent 框架

第五阶段：MCP 与 Agent 生态 - 标准化的未来

典型特征

统一的模型上下文协议（MCP）
可复用的 Skill/Tool 生态
自主规划和执行的智能体（Agent）

什么是 MCP？

Model Context Protocol（MCP） 是 Anthropic 在 2024 年提出的开放标准，解决 AI 应用与外部工具/数据源之间的连接问题。

┌─────────────────────────────────────────────────┐
│                    AI 应用                       │
│  (Claude Desktop / Cursor / Continue / ...)     │
└─────────────────┬───────────────────────────────┘
                  │ MCP 协议
    ┌─────────────┼─────────────┐
    ▼             ▼             ▼
┌───────┐   ┌───────┐   ┌───────────┐
│文件系统│   │数据库 │   │ API 服务  │
│Server │   │Server │   │  Server   │
└───────┘   └───────┘   └───────────┘

MCP 的核心概念

Server（服务端）：提供工具、资源或提示词
Client（客户端）：AI 应用，通过 MCP 协议与 Server 通信
Resources：可读取的数据源（文件、数据库记录等）
Tools：可执行的函数
Prompts：预定义的提示词模板

MCP Server 示例

// 一个简单的 MCP Server 示例
const server = new Server({
  name: "weather-server",
  version: "1.0.0"
}, {
  capabilities: {
    tools: {}
  }
});

server.setRequestHandler(ListToolsRequestSchema, async () => ({
  tools: [{
    name: "get_forecast",
    description: "获取天气预报",
    inputSchema: {
      type: "object",
      properties: {
        latitude: { type: "number" },
        longitude: { type: "number" }
      },
      required: ["latitude", "longitude"]
    }
  }]
}));

server.setRequestHandler(CallToolRequestSchema, async (request) => {
  if (request.params.name === "get_forecast") {
    const { latitude, longitude } = request.params.arguments;
    const forecast = await fetchWeatherData(latitude, longitude);
    return { content: [{ type: "text", text: JSON.stringify(forecast) }] };
  }
});

Skill 与 Agent

Skill（技能） 是封装好的能力单元，比如：

代码解释和执行
文档处理
API 调用
工作流自动化

Agent（智能体） 则更进一步：

能够自主规划任务
选择和组合使用工具
从结果中学习并调整策略
处理多步骤的复杂任务

实际应用场景

用户：帮我把这个 PDF 翻译成中文，总结要点，
     然后发到我的企业微信，并创建一个待办事项。

Agent 思考过程：
1. [读取文件] 使用 filesystem-mcp 读取 PDF
2. [翻译内容] 调用翻译 API
3. [生成摘要] 使用 LLM 总结
4. [发送消息] 通过 wecom-mcp 发送到企业微信
5. [创建待办] 调用待办 API 创建任务
6. [反馈结果] 向用户报告完成状态

这个阶段的变革

标准化：不同 AI 应用可以共享同一套工具
可组合：复杂任务由简单工具组合完成
可扩展：开发者可以轻松添加新能力
生态系统：形成工具市场和能力共享平台

对比总结

阶段	核心能力	典型交互	局限性
简单尝试期	基础对话	“你好”	无实际能力
搜索替代期	信息整合	“帮我查…”	信息滞后、幻觉
Prompt 工程期	精准控制	结构化提问	仍限于文本输出
工具调用期	执行操作	Function Calling	需要开发集成
MCP/Agent 期	自主智能	复杂任务自动化	仍在快速发展中

未来展望

AI 使用方式的演进远未结束。我们可以预见：

多模态交互：语音、图像、视频的无缝融合
个性化 Agent：真正理解你的专属助手
Agent 间协作：多个 AI 协同完成大型任务
自主学习：从交互中持续进化

结语

从"你好"开始，到今天能够自主规划、调用工具、完成复杂任务的 Agent，AI 使用方式的每一次进化都在拓展可能性的边界。

你现在处于哪个阶段？

无论答案是什么，重要的是保持学习和探索的心态。因为这场革命，才刚刚开始。