作者:Kyle Tse
编译:小兰
简介
大型语言模型(LLMs)和 AI 代理正在改变我们与信息交互的方式。
然而,访问锁定在 PDF 文档中的数据仍然是一个挑战。由于 Token 限制和二进制格式,发送整个 PDF 通常不可行,而依赖外部 CLI 工具可能既不安全又低效。
今天,我们激动地推出 PDF 阅读器 MCP 服务器 (PDF Reader MCP Server),这是一个基于 模型上下文协议 (Model Context Protocol, MCP)[1] 构建的专用工具,专门用于弥合这一差距。
现在,您的 AI 代理可以在您的项目上下文中安全高效地读取和提取 PDF 文件中的信息。
什么是 MCP
MCP 为 AI 模型和外部工具或服务(如此 PDF 阅读器)提供了一种标准化的方式,以安全高效地进行通信,通常在隔离环境中运行工具。
关键特性:统一的read_pdf工具
PDF 阅读器 MCP 服务器提供了一个单一、灵活的 read_pdf 工具,而不是多个特定的工具。这简化了代理的交互,同时提供了对提取信息的精细控制。
核心功能
- 来源灵活性: 处理来自项目内本地相对路径 (path) 或直接来自公共 URL (url) 的 PDF。
- 安全性: 本地文件访问严格限制在启动服务器的项目根目录内,防止未经授权的访问。
- 内容提取:
- 获取全文内容 (include_full_text: true)。
- 使用 pages 参数从特定页面或范围提取文本(例如 "1,3-5" 或 [1, 3, 5])。这将返回一个 page_texts 数组。
- 元数据与信息:
- 检索标准 PDF 元数据和文档信息 (include_metadata: true,默认)。
- 获取总页数 (include_page_count: true,默认)。
- 效率: 内部利用了强大的 pdf-parse Node.js 库。
如何使用
将服务器集成到您的 MCP 主机环境(如 Cline)非常简单。
使用 npx (推荐):
{
"mcpServers": {
"pdf-reader-mcp": {
"command": "npx",
"args": [
"@shtse8/pdf-reader-mcp"
],
"name": "PDF Reader (npx)"
}
}
}(请确保您的主机在正确的项目目录作为其当前工作目录 (CWD) 的情况下启动此命令,以便访问本地文件。)
使用 Docker:
{
"mcpServers": {
"pdf-reader-mcp": {
"command": "docker",
"args": [
"run", "-i", "--rm",
"-v", "/path/to/your/project:/app", // Use $PWD, %CD%, ${PWD}, or ${workspaceFolder} if possible
"shtse8/pdf-reader-mcp:latest"
],
"name": "PDF Reader (Docker)"
}
}
}为何使用它?
- 安全: 让您的 AI 自信地访问项目 PDF,而无需暴露整个文件系统。
- 高效: 避免消耗大量 Token 的变通方法,并直接向代理提供结构化数据。
- 灵活: 单一工具适应各种 PDF 阅读需求。
- 简单: 通过 npx 或 Docker 轻松集成。
立即尝试!
准备好赋予您的 AI 代理阅读 PDF 的能力了吗?
- GitHub 仓库: https://github.com/shtse8/pdf-reader-mcp
- npm 包: https://www.npmjs.com/package/@shtse8/pdf-reader-mcp
我们欢迎反馈、Bug 报告和贡献!让我们知道您是如何使用 PDF 阅读器 MCP 服务器的。
引用链接
[1] 模型上下文协议 (Model Context Protocol, MCP): https://docs.modelcontextprotocol.com/
