AI Agent终极定义:程序员1张图彻底搞懂「感知‑规划‑行动」闭环
作者:xiaoxin.gao · 2025-07-30 · 阅读时间:7分钟
文章目录
收藏它,下次面试官问“Agent和Chatbot有何不同”时,一张图+一段代码闭嘴!
为何2025年非谈Agent不可
| 事件 | 冲击 |
|---|---|
| OpenAI发布 Responses API 2025‑03 | 原生Function Calling流式返回,Agent响应延迟降至200 ms |
| Google推出 A2A Protocol 2025‑05 | 统一Agent通信格式,终结碎片化 |
| Anthropic开源 Claude Agent SDK 2025‑06 | 100行代码即可跑复杂Agent任务 |
| 欧盟 AI Liability Directive 2025‑07 | 黑盒系统须可解释,Agent自带审计日志 |
Agent已从PPT概念,变为生产环境刚需。
1 一张图看透:感知‑规划‑行动‑审计闭环

桌面常驻图:任何Agent架构一目了然。
2 五大子系统拆解:程序员视角技术栈
| 子系统 | 开源/商用选项 | 关键指标 |
|---|---|---|
| 感知层 | LangChain WebBaseLoader、Twilio、OpenCV、REST API |
延迟 < 500 ms |
| 记忆层 | ChromaDB、Pinecone、Redis、SQLite | 向量检索 Top‑k < 20 ms |
| 规划层 | OpenAI GPT-4o-mini、Claude-3-Haiku、Llama-3-8B | 推理成本 < \$0.01/1k token |
| 行动层 | Python函数、Bash、Docker、gRPC、HTTP | 执行成功率 > 99.5 % |
| 审计层 | LangSmith、Weights & Biases、OpenTelemetry | 全链路可观测 & 可解释 |
3 从0到1:30行Python跑通最小Agent
3.1 环境依赖
pip install openai langchain pydantic
3.2 最简示例
from openai import OpenAI
import os, json, datetime
client = OpenAI(api_key=os.getenv("OPENAI_API_KEY"))
class Agent:
def __init__(self):
self.memory = []
def perceive(self, query):
self.memory.append({"role":"user","content":query})
return {"query":query, "time":str(datetime.datetime.utcnow())}
def plan(self, tools):
prompt = f"Use these tools {tools} to answer: {self.memory[-1]['content']}"
resp = client.chat.completions.create(
model="gpt-4o-mini",
messages=[{"role":"system","content":prompt}],
tools=tools
)
return resp.choices[0].message
def act(self, call):
name = call.function.name
args = json.loads(call.function.arguments)
if name=="get_weather":
return {"temp":25, "city":args["city"]}
return {"error":"unknown"}
def run(self, query):
self.perceive(query)
tools = [{
"type":"function",
"function":{"name":"get_weather","description":"current weather","parameters":{
"type":"object","properties":{"city":{"type":"string"}}}}
}]
msg = self.plan(tools)
if msg.tool_calls:
result = self.act(msg.tool_calls[0])
self.memory.append({"role":"assistant","content":str(result)})
return self.memory[-1]["content"]
agent = Agent()
print(agent.run("What's the weather in Beijing?"))
输出:
{'temp': 25, 'city': 'Beijing'}
30行骨架,轻松扩展自定义工具。
4 实战加速:LangGraph × Function Calling
场景:抓取Hacker News并自动生成技术周报
架构图
graph LR
U[用户指令] --> S[Agent Supervisor]
S --> F[抓取 HN]
F --> P[LLM 总结]
P --> R[生成周报]
R --> M[发送邮件]
核心代码
from langgraph.graph import Graph, END
from langchain_openai import ChatOpenAI
from langchain_core.messages import HumanMessage
import requests
llm = ChatOpenAI(model="gpt-4o-mini", temperature=0)
def fetch_hn(state):
top = requests.get("https://hacker-news.firebaseio.com/v0/topstories.json").json()[:5]
titles = [requests.get(f"https://hacker-news.firebaseio.com/v0/item/{i}.json")
.json()["title"] for i in top]
return {"titles": titles}
def summarize(state):
prompt = f"Summarize these titles into a tech weekly report:\n{state['titles']}"
return {"summary": llm.invoke([HumanMessage(content=prompt)]).content}
def send_email(state):
print("📨", state["summary"])
return END
w = Graph()
w.add_node("fetch", fetch_hn)
w.add_node("summarize", summarize)
w.add_node("email", send_email)
w.add_edge("fetch","summarize")
w.add_edge("summarize","email")
app = w.compile()
app.invoke({})
1分钟搞定「感知→规划→行动」闭环。
5 成本揭秘:一次任务只需\$0.0002
| 步骤 | Token数 | 单价(\$/1k) | 单次成本 |
|---|---|---|---|
| 感知抓取 | 0 | — | \$0 |
| LLM规划 | 350 | 0.0006 | \$0.00021 |
| 行动发送 | 0 | — | \$0 |
| 总计 | 350 | — | \$0.00021 |
万次日活仅\$2.1,开会2杯咖啡钱。
6 工程坑盘点:Token暴增、循环、幻觉
-
Token暴增:
- 只保留最近4k tokens;摘要旧记忆;向量检索Top‑5
-
循环调用:
- 限制深度(默认5);结果缓存;Plan自检去重
-
幻觉治理:
- 用 Guardrails 校验Schema;失败重试;可观测
7 2026路线图:多Agent协作、边缘推理、合规沙箱
| 方向 | 技术 | 时间 |
|---|---|---|
| 多Agent协作 | A2A Protocol+消息总线 | 2025 Q4 |
| 边缘推理 | Llama‑3‑8B INT4 @RK3588 < 150ms | 2026 Q1 |
| 合规沙箱 | eBPF + WASM代码审计 | 2026 Q2 |
| 实时RL | 在线强化学习微调Planner | 2026 Q3 |
8 一句话总结:贴桌面边框的3个关键数字
- 200 ms:端到端延迟红线
- \$0.0002:单次成本上限
- 5步:循环深度安全阈值
写在便利贴,下次架构评审你即Agent架构专家!
热门推荐
一个账号试用1000+ API
助力AI无缝链接物理世界 · 无需多次注册
3000+提示词助力AI大模型
和专业工程师共享工作效率翻倍的秘密
热门API
- 1. AI文本生成
- 2. AI图片生成_文生图
- 3. AI图片生成_图生图
- 4. AI图像编辑
- 5. AI视频生成_文生视频
- 6. AI视频生成_图生视频
- 7. AI语音合成_文生语音
- 8. AI文本生成(中国)
最新文章
- 您需要了解的OpenAI Assistants API功能 – PageOn.ai
- DRF库详解:用Django轻松搭建功能强大的API服务
- 一文搞懂在 HTTP 如何 one-api 调用,实操指南来袭!
- 探索海洋数据的宝库:Amentum海洋数据探测API的潜力
- 云原生 API 网关 APISIX 入门教程
- API Key 密钥:深入理解与应用
- 2025年国内免费生成式 AI API 平台大盘点:探索国产大模型的开放能力
- 使用DeepSeek和Claude绘制出高质量的SVG 图片
- 精通REST API:解析iOS开发中的核心要点
- ASP.NET Core Web API 的授权指南 – Auth0
- Supertest:如何像专业人士一样测试API – Testim博客
- Next.js API 路由:GET 和 POST 请求示例