PDF 阅读器 MCP 服务器,赋能你的 AI 代理

作者:Kyle Tse
编译:小兰

简介

大型语言模型(LLMs)和 AI 代理正在改变我们与信息交互的方式。

然而,访问锁定在 PDF 文档中的数据仍然是一个挑战。由于 Token 限制和二进制格式,发送整个 PDF 通常不可行,而依赖外部 CLI 工具可能既不安全又低效。

今天,我们激动地推出 PDF 阅读器 MCP 服务器 (PDF Reader MCP Server),这是一个基于 模型上下文协议 (Model Context Protocol, MCP)[1] 构建的专用工具,专门用于弥合这一差距。

现在,您的 AI 代理可以在您的项目上下文中安全高效地读取和提取 PDF 文件中的信息。

什么是 MCP

MCP 为 AI 模型和外部工具或服务(如此 PDF 阅读器)提供了一种标准化的方式,以安全高效地进行通信,通常在隔离环境中运行工具。

关键特性:统一的read_pdf工具

PDF 阅读器 MCP 服务器提供了一个单一、灵活的 read_pdf 工具,而不是多个特定的工具。这简化了代理的交互,同时提供了对提取信息的精细控制。

核心功能

  • 来源灵活性: 处理来自项目内本地相对路径 (path) 或直接来自公共 URL (url) 的 PDF。
  • 安全性: 本地文件访问严格限制在启动服务器的项目根目录内,防止未经授权的访问。
  • 内容提取:
    • 获取全文内容 (include_full_text: true)。
    • 使用 pages 参数从特定页面或范围提取文本(例如 "1,3-5"[1, 3, 5])。这将返回一个 page_texts 数组。
  • 元数据与信息:
    • 检索标准 PDF 元数据和文档信息 (include_metadata: true,默认)。
    • 获取总页数 (include_page_count: true,默认)。
  • 效率: 内部利用了强大的 pdf-parse Node.js 库。

如何使用

将服务器集成到您的 MCP 主机环境(如 Cline)非常简单。

使用 npx (推荐):

{
  "mcpServers": {
    "pdf-reader-mcp": {
      "command": "npx",
      "args": [
        "@shtse8/pdf-reader-mcp"
      ],
      "name": "PDF Reader (npx)"
    }
  }
}

(请确保您的主机在正确的项目目录作为其当前工作目录 (CWD) 的情况下启动此命令,以便访问本地文件。)

使用 Docker:

{
  "mcpServers": {
    "pdf-reader-mcp": {
      "command": "docker",
      "args": [
        "run", "-i", "--rm",
        "-v", "/path/to/your/project:/app", // Use $PWD, %CD%, ${PWD}, or ${workspaceFolder} if possible
        "shtse8/pdf-reader-mcp:latest"
      ],
      "name": "PDF Reader (Docker)"
    }
  }
}

为何使用它?

  • 安全: 让您的 AI 自信地访问项目 PDF,而无需暴露整个文件系统。
  • 高效: 避免消耗大量 Token 的变通方法,并直接向代理提供结构化数据。
  • 灵活: 单一工具适应各种 PDF 阅读需求。
  • 简单: 通过 npx 或 Docker 轻松集成。

立即尝试!

准备好赋予您的 AI 代理阅读 PDF 的能力了吗?

  • GitHub 仓库: https://github.com/shtse8/pdf-reader-mcp
  • npm 包: https://www.npmjs.com/package/@shtse8/pdf-reader-mcp

我们欢迎反馈、Bug 报告和贡献!让我们知道您是如何使用 PDF 阅读器 MCP 服务器的。

引用链接

[1] 模型上下文协议 (Model Context Protocol, MCP): https://docs.modelcontextprotocol.com/

原文链接:,转发请注明来源!