模力方舟 MCP Server 上线:在 Cursor 里玩 AI 生图+语音

模力方舟现已上线 模力方舟 MCP Server,为 AI 助手和多模态应用提供统一的上下文协议(Model Context Protocol, MCP)接入能力,目前已支持文本生成图片与语音两项功能。

MCP 是干什么的相信大家已经很熟悉了,那么话不多说,先看效果

这张图展示了使用模力方舟 MCP Server 在 Cursor 客户端中完成「AI 生成项目 Logo 并自动加入项目目录」的完整流程:

1 调用 MCP 服务生成图片:AI 根据用户输入,通过 text-to-image 接口生成图像,并返回公网 URL;

2 自动下载图片并保存:通过 wget 命令将图片保存至项目本地目录(assets/logo.png);

3 智能插入引用代码:AI 自动将图片路径添加至 index.html 和 README.md,分别用于页面展示与项目文档;

4 图片成功渲染:最终图像正确加载,展示在页面中,形成清晰的视觉输出。

这正是模力方舟 MCP Server 在实际开发流程中「即插即用」的真实写照:图像生成、文件管理、代码修改,用 AI 一气呵成。

除了 Cursor 外,模力方舟 MCP Server 还支持 Claude Code 和 Cherry Studio 等支持 MCP 协议的 AI 工具。

对于还不熟悉 MCP 的同学,接下来就听听马建仓的详细介绍:

什么是模力方舟 MCP Server?

模力方舟 MCP Server 是一项专为模力方舟设计的模型上下文协议服务,支持通过 MCP 协议接入多媒体模型,包括图像生成和语音合成工具。它可集成到 Cursor、Claude Desktop 等 AI 工具中,帮助 AI 助手「看得见、讲得出」

两大核心能力:文本生成图片与语音

文本生成图片

  • 支持模型:如 stable-diffusion-3.5-large-turbo
  • 可设定图像尺寸、参考图像(URL 或 Base64)
  • 输出格式灵活(Base64、URL 链接)
  • 支持用户 ID 追踪与内容定向

文本生成语音

  • 支持模型:如 whisper-large-v3-turbo
  • 输出格式支持 MP3、WAV,支持二进制流或临时 URL
  • URL 链接有效期为 1 小时,适合集成即时内容播报场景

快速接入指南

1.登录模力方舟获取访问令牌(Access Token):

2.在支持 MCP 的客户端中配置:

{
  "mcpServers": {
    "gitee-ai": {
      "url": "https://ai.gitee.com/mcp/sse",
      "headers": {
        "Authorization": "Bearer <your_access_token>"
      }
    }
  }
}
  • 以 Cursor 为例:

1 进入设置-添加新的 MCP Server

2 填写配置文件+访问令牌并保存

3 显示为绿色即加载成功,快去试试吧!

配置完成后,你就可以在日常使用 AI 助手时,直接调用图像和语音生成功能。例如在写技术文档时一键生成配图、给项目介绍加上语音旁白,甚至批量产出社媒图文组合内容。

不管你是在 Cursor 或 Claude Desktop 中使用 AI 助手,还是在自己的项目中集成多模态能力,模力方舟 MCP Server 都能为你提供你快速接入图像与语音能力。

原文链接:,转发请注明来源!