AI 使用进化论:从你好到 MCP 的五个阶段

AI 使用进化论:从"你好"到 MCP 的五个阶段

每个人使用 AI 的方式都在不断进化,这篇文章记录了从简单对话到复杂 Agent 系统的完整演进路径。

前言

ChatGPT 在 2022 年底横空出世,大语言模型(LLM)彻底改变了我们和计算机打交道的方式。但很多人没意识到,我们使用 AI 的方式本身也在经历一场变革。

这篇文章带你回顾 AI 使用的五个阶段,从最简单的"打招呼",到今天最前沿的 MCP(Model Context Protocol)和 Agent 系统。


第一阶段:简单尝试期 - “Hi,你好!”

典型特征

  • 把 AI 当聊天机器人
  • 问简单问题,获取直接回答
  • 一问一答的交互方式

常见场景

用户:你好
AI:你好!有什么我可以帮助你的吗?

用户:今天天气怎么样?
AI:抱歉,我无法获取实时天气信息。建议你查看天气应用或网站。

用户:给我讲个笑话
AI:为什么程序员总是分不清万圣节和圣诞节?因为 Oct 31 = Dec 25!

这个阶段的特点

大多数人这时候只是把 AI 当个有趣的聊天对象。问点通用知识,让它写点简单文案,或者纯粹为了好玩聊两句。

优点:

  • 入门门槛低,打开就能用
  • 快速感受 AI 的能力

局限:

  • 拿不到实时信息
  • 做不了实际操作
  • 回答有时候不太准

第二阶段:搜索引擎替代期 - “帮我查一下…”

典型特征

  • 用 AI 替代百度、Google
  • 提问方式变得更复杂
  • 期待 AI 整合、总结信息

常见场景

用户:Vue 3 和 React 18 有什么区别?哪个更适合新项目?
AI:Vue 3 和 React 18 各有优势,选择取决于团队背景和项目需求...

用户:帮我总结一下最近关于 RISC-V 的新闻
AI:近期 RISC-V 领域的重要进展包括...

用户:解释一下微服务架构,有什么优缺点?
AI:微服务架构是一种将应用程序拆分为多个小型服务的架构风格...

这个阶段的特点

用户开始发现 AI 比搜索引擎更擅长:

  • 信息整合:把多个来源的信息揉在一起
  • 个性化回答:根据上下文调整回复
  • 持续对话:可以追问、澄清、深入聊

关键进步:

  • 学会了怎么提问(Prompt Engineering 的雏形)
  • 开始理解 AI 的能力边界
  • 用 AI 加速学习和决策

潜在风险:

  • AI 可能编造不存在的"事实"
  • 信息可能不是最新的
  • 重要信息需要交叉验证

第三阶段:Prompt 工程期 - “精确控制的艺术”

典型特征

  • 掌握提示词技巧
  • 用角色扮演、思维链、Few-shot 等方法
  • 追求更精准、可控的输出

常用技巧

1. 角色设定

你是一位资深的前端工程师,有 10 年的 React 开发经验。
请用专业但易懂的语言解释 React Server Components 的工作原理。

2. 思维链

请一步步思考这个问题:
如果一个城市要减少交通拥堵,有哪些可行的方案?
请先分析问题,再列举方案,最后比较优劣。

3. Few-shot 学习

以下是一些产品描述的示例:

输入:无线蓝牙耳机
输出:沉浸音质,无线自由。这款蓝牙耳机采用最新音频技术...

输入:机械键盘
输出:指尖韵律,敲击如歌。高品质机械轴体带来...

现在请为"智能手表"写一段产品描述。

4. 结构化输出

请以 JSON 格式返回以下信息:
- 书名
- 作者
- 出版年份
- 三句话简介

书籍:《人类简史》

这个阶段的特点

用户不再被动接受 AI 的回答,而是主动设计交互方式来获得更好的结果。

核心认知:

  • 输入质量决定输出质量
  • AI 是工具,得用对方法
  • 可以通过"编程"AI 来获得特定格式和风格

第四阶段:工具调用期 - Function Calling & Tool Use

典型特征

  • AI 不只是"说话",而是能"做事"
  • 通过 Function Calling 连接外部 API 和服务
  • 从对话助手升级为执行代理

什么是 Function Calling?

Function Calling(函数调用)让 LLM 能够:

  1. 识别用户意图需要调用哪个函数
  2. 生成符合函数参数要求的 JSON
  3. 由外部系统执行函数并返回结果
  4. 基于结果继续对话

实际案例

# 定义的函数
functions = [
    {
        "name": "get_weather",
        "description": "获取指定城市的天气信息",
        "parameters": {
            "type": "object",
            "properties": {
                "city": {"type": "string", "description": "城市名称"},
                "unit": {"type": "string", "enum": ["celsius", "fahrenheit"]}
            },
            "required": ["city"]
        }
    },
    {
        "name": "send_email",
        "description": "发送电子邮件",
        "parameters": {
            "type": "object",
            "properties": {
                "to": {"type": "string", "description": "收件人邮箱"},
                "subject": {"type": "string", "description": "邮件主题"},
                "body": {"type": "string", "description": "邮件内容"}
            },
            "required": ["to", "subject", "body"]
        }
    }
]

用户交互示例

用户:北京今天天气怎么样?如果温度低于 15 度,给我发一封邮件提醒带外套。

AI:[调用 get_weather("北京")]
    → 北京当前温度:12°C

    [调用 send_email(to="user@example.com", 
                     subject="天气提醒", 
                     body="北京今天温度 12°C,建议带外套")]

    已查询天气并为你发送了提醒邮件!

这个阶段的革命性意义

  1. 突破信息边界:AI 可以获取实时数据
  2. 执行实际操作:不再只是建议,而是直接行动
  3. 组合能力:可以串联多个工具完成复杂任务

代表性产品:

  • ChatGPT Plugins
  • Claude Tool Use
  • OpenAI Assistants API
  • 各类 AI Agent 框架

第五阶段:MCP 与 Agent 生态 - 标准化的未来

典型特征

  • 统一的模型上下文协议(MCP)
  • 可复用的 Skill/Tool 生态
  • 自主规划和执行的智能体(Agent)

什么是 MCP?

Model Context Protocol(MCP) 是 Anthropic 在 2024 年提出的开放标准,解决 AI 应用与外部工具/数据源之间的连接问题。

┌─────────────────────────────────────────────────┐
│                    AI 应用                       │
│  (Claude Desktop / Cursor / Continue / ...)     │
└─────────────────┬───────────────────────────────┘
                  │ MCP 协议
    ┌─────────────┼─────────────┐
    ▼             ▼             ▼
┌───────┐   ┌───────┐   ┌───────────┐
│文件系统│   │数据库 │   │ API 服务  │
│Server │   │Server │   │  Server   │
└───────┘   └───────┘   └───────────┘

MCP 的核心概念

  1. Server(服务端):提供工具、资源或提示词
  2. Client(客户端):AI 应用,通过 MCP 协议与 Server 通信
  3. Resources:可读取的数据源(文件、数据库记录等)
  4. Tools:可执行的函数
  5. Prompts:预定义的提示词模板

MCP Server 示例

// 一个简单的 MCP Server 示例
const server = new Server({
  name: "weather-server",
  version: "1.0.0"
}, {
  capabilities: {
    tools: {}
  }
});

server.setRequestHandler(ListToolsRequestSchema, async () => ({
  tools: [{
    name: "get_forecast",
    description: "获取天气预报",
    inputSchema: {
      type: "object",
      properties: {
        latitude: { type: "number" },
        longitude: { type: "number" }
      },
      required: ["latitude", "longitude"]
    }
  }]
}));

server.setRequestHandler(CallToolRequestSchema, async (request) => {
  if (request.params.name === "get_forecast") {
    const { latitude, longitude } = request.params.arguments;
    const forecast = await fetchWeatherData(latitude, longitude);
    return { content: [{ type: "text", text: JSON.stringify(forecast) }] };
  }
});

Skill 与 Agent

Skill(技能) 是封装好的能力单元,比如:

  • 代码解释和执行
  • 文档处理
  • API 调用
  • 工作流自动化

Agent(智能体) 则更进一步:

  • 能够自主规划任务
  • 选择和组合使用工具
  • 从结果中学习并调整策略
  • 处理多步骤的复杂任务

实际应用场景

用户:帮我把这个 PDF 翻译成中文,总结要点,
     然后发到我的企业微信,并创建一个待办事项。

Agent 思考过程:
1. [读取文件] 使用 filesystem-mcp 读取 PDF
2. [翻译内容] 调用翻译 API
3. [生成摘要] 使用 LLM 总结
4. [发送消息] 通过 wecom-mcp 发送到企业微信
5. [创建待办] 调用待办 API 创建任务
6. [反馈结果] 向用户报告完成状态

这个阶段的变革

  1. 标准化:不同 AI 应用可以共享同一套工具
  2. 可组合:复杂任务由简单工具组合完成
  3. 可扩展:开发者可以轻松添加新能力
  4. 生态系统:形成工具市场和能力共享平台

对比总结

阶段 核心能力 典型交互 局限性
简单尝试期 基础对话 “你好” 无实际能力
搜索替代期 信息整合 “帮我查…” 信息滞后、幻觉
Prompt 工程期 精准控制 结构化提问 仍限于文本输出
工具调用期 执行操作 Function Calling 需要开发集成
MCP/Agent 期 自主智能 复杂任务自动化 仍在快速发展中

未来展望

AI 使用方式的演进远未结束。我们可以预见:

  1. 多模态交互:语音、图像、视频的无缝融合
  2. 个性化 Agent:真正理解你的专属助手
  3. Agent 间协作:多个 AI 协同完成大型任务
  4. 自主学习:从交互中持续进化

结语

从"你好"开始,到今天能够自主规划、调用工具、完成复杂任务的 Agent,AI 使用方式的每一次进化都在拓展可能性的边界。

你现在处于哪个阶段?

无论答案是什么,重要的是保持学习和探索的心态。因为这场革命,才刚刚开始。