2025 LangChain LLM 应用开发｜链式工具调用＋向量检索实战

在大语言模型（LLM）持续爆发的时代，如何将复杂的多步骤任务高效地组合起来，打造具备强大推理、检索和交互能力的智能应用，成为开发者和企业的核心需求。作为目前最热门的开源框架之一，LangChain 凭借“链式调用”与“模块化组件”理念，极大简化了 LLM 应用的开发复杂度，推动了大模型从研究走向产品。

本文将围绕 LangChain 的核心设计，结合前沿的向量检索技术，为你深入解析 2025 年最新的开发方法和实战技巧，帮助你快速构建具备上下文记忆、工具调用及知识检索能力的智能系统。

一、为什么选择 LangChain？它解决了什么问题？

虽然 GPT-4、ChatGPT 等大模型拥有惊人的生成能力，但在实际应用中常常遇到诸多限制：

上下文限制：单次对话长度有限，无法完整表达复杂业务逻辑。
知识盲区：模型对最新或专业领域知识掌握有限。
工具调用困难：需要将模型生成的文本和外部 API 或系统联动。
信息检索：无法直接访问自定义知识库，实现语义级别的信息匹配。

LangChain 的出现，就是为了构建“链式调用”机制，将模型输出与多种工具和数据源串联起来，解决以上痛点。它支持多种 LLM，配合模块化链条，极大提高 LLM 应用的灵活性和实用性。

二、LangChain 核心组件解析

了解 LangChain，需先掌握以下几个核心模块：

1. Chain（链）

链是 LangChain 的核心设计单位，代表一个任务的步骤集合。可以将多个链以串联、并联方式组合，支持条件分支和动态调用。

2. Prompt Template（提示模板）

用于动态构造 LLM 输入提示，支持参数填充和格式化。

3. Memory（记忆）

帮助模型在对话或多轮任务中保持上下文，支持短期与长期记忆。

4. Tools（工具）

外部能力封装，如调用搜索引擎、计算器、数据库等。

5. Document Loaders & Vector Stores（文档加载器和向量数据库）

帮助加载文本或结构化数据，将信息转成向量用于语义检索。

三、2025 年最新 LangChain 开发环境搭建

1. 安装核心依赖

pip install langchain openai faiss-cpu

LangChain：主框架
OpenAI：GPT-4 或 GPT-3.5 接口调用
FAISS：Facebook 开源的高效向量检索库

如需 GPU 支持，安装 faiss-gpu。

2. 配置 OpenAI API Key

前往 OpenAI 控制台创建 API Key，导出环境变量：

export OPENAI_API_KEY='你的API密钥'

四、链式调用实战：构建智能问答助手

假设我们要打造一个基于上下文多轮对话、集成搜索与计算功能的智能助理。

1. 构建 Prompt 模板

from langchain.prompts import PromptTemplate

template = """
你是一个智能助理。用户的问题是：{question}
请给出详细、准确的回答。
"""
prompt = PromptTemplate(input_variables=["question"], template=template)

2. 定义 LLM 调用

from langchain.llms import OpenAI

llm = OpenAI(temperature=0.7, model_name="gpt-4")

3. 设计简单链条

from langchain.chains import LLMChain

qa_chain = LLMChain(llm=llm, prompt=prompt)

response = qa_chain.run(question="2025年AI发展趋势如何？")
print(response)

五、向量检索集成：实现知识库问答

大模型知识库有限，集成向量检索是解决方案。以下演示如何用 FAISS 向量数据库搭建语义搜索。

1. 文档加载与分块

from langchain.document_loaders import TextLoader
from langchain.text_splitter import RecursiveCharacterTextSplitter

loader = TextLoader("knowledge_base.txt")
documents = loader.load()

text_splitter = RecursiveCharacterTextSplitter(chunk_size=500, chunk_overlap=50)
texts = text_splitter.split_documents(documents)

2. 嵌入向量生成

from langchain.embeddings.openai import OpenAIEmbeddings

embeddings = OpenAIEmbeddings()

3. 构建 FAISS 向量索引

from langchain.vectorstores import FAISS

vectorstore = FAISS.from_documents(texts, embeddings)

4. 创建检索链

from langchain.chains import RetrievalQA

retriever = vectorstore.as_retriever(search_type="similarity", search_kwargs={"k":3})
qa = RetrievalQA.from_chain_type(llm=llm, retriever=retriever)

query = "什么是链式调用？"
result = qa.run(query)
print(result)

六、结合工具调用，实现更复杂的多步骤任务

LangChain 支持接入自定义工具，比如天气查询、计算器、数据库接口等，实现“模型+工具”的闭环。

1. 自定义工具示例：计算器

from langchain.agents import Tool
import math

def calculator_fn(query: str) - > str:
    try:
        return str(eval(query))
    except Exception as e:
        return "无法计算：" + str(e)

calculator_tool = Tool(
    name="Calculator",
    func=calculator_fn,
    description="执行数学表达式的计算"
)

2. Agent 结合工具调用

from langchain.agents import initialize_agent, AgentType

tools = [calculator_tool]

agent = initialize_agent(tools, llm, agent=AgentType.ZERO_SHOT_REACT_DESCRIPTION, verbose=True)

response = agent.run("计算 345 * 23 的结果是多少？")
print(response)