Documentation Index
Fetch the complete documentation index at: https://docs.mountsea.ai/llms.txt
Use this file to discover all available pages before exploring further.
Hub 简介
Hub 是 Mountsea 的优质 AI 网关 —— 一套统一接口接入全球顶尖的图像、视频、音频和语音转写模型。为什么选择 Hub?
官方旗舰画质
只接入官方旗舰模型,绝无山寨版或蒸馏精简版。Veo 3.1、Nano Banana Pro、GPT Image 2、Kling v3 Pro、WAN 2.7、Seedance 2.0、ElevenLabs Music —— 完全等同于官方 的模型权重与输出质量。
生产级稳定
专为 7×24 生产流量 设计:多区域智能路由、自动故障切换、瞬时错误透明重试、按队列感知的负载均衡。不再担心 突发限流、上游抖动、配额墙等问题。
比官方更实惠
只为成功的生成结果付费,按统一积分计费,单价显著低于 直接调用官方接口。无单家供应商的起步门槛、无月费、失败任务完全免费。
对比一览
| Hub | 直连各家官方 | |
|---|---|---|
| 模型 | 4 大能力的官方旗舰模型一站接入 —— 图像 / 视频 / 音频 / 转写 | 需注册并维护 6+ 个账号(Google、OpenAI、快手、阿里、字节、ElevenLabs …) |
| 价格 | 低于官方零售价,仅在 status=completed 时扣费 —— 失败任务零成本 | 按官方零售价付费,绝大多数厂商失败也扣额度 |
| 稳定性 | 多通道智能路由 + 自动重试,瞬时错误对你透明 | 单点故障;重试逻辑与限流处理需自行实现 |
| 接入成本 | 一个 Bearer Token、一个 Base URL、一份统一积分 | 各家独立 Key、独立账单、独立 SDK |
| 运维成本 | 我们负责新增模型 / 替换下线模型的路由 | 需自行跟踪每家供应商的弃用通知与迁移成本 |
核心能力
图像生成
Nano Banana (Fast / 2 / Pro) + GPT Image 2 —— 文生图与图像编辑
视频生成
Veo 3.1 · Kling v3 · WAN 2.7 · Seedance 2.0 —— 文生视频、图生视频、多参考图、首尾帧、视频编辑
音频(音乐)
ElevenLabs Music —— 文本生成音乐,可控长度与纯器乐开关
语音转写
Whisper / Wizper —— 音视频转写与翻译
Hub 调用模式
所有 Hub 任务都遵循同样的简单流程:提交任务 → 获取task_id → 轮询直到 ready=true。
发现可用模型(可选)
调用
GET /hub/v1/models?capability=image|video|audio|transcribe 查看某能力下的全部模型。
对单个模型 GET /hub/v1/models/:model 可返回完整的 input_schema 和可直接复制使用的 example 示例。精选模型
🖼️ 图像
| 模型 | 提供商 | 能力 | 亮点 |
|---|---|---|---|
nano-banana | 文生图 | Gemini 2.5 Flash Image —— 快速且经济 | |
nano-banana-2 | 文生图 | Gemini 3.1 —— 极端宽高比(1:8 / 8:1) | |
nano-banana-pro | 文生图 | Gemini 3 Pro —— 工作室级画质,最高 4K | |
gpt-image-2 | OpenAI | 文生图 | 细节丰富,文字排版精细 |
*-edit 变体 | — | 图像编辑 | 通过参考图 URL 编辑现有图像 |
🎬 视频
| 模型 | 提供商 | 能力 | 亮点 |
|---|---|---|---|
veo-3.1 / -fast / -lite | 文生视频 | 原生音频,4s / 6s / 8s,最高 4K | |
veo-3.1-image | 图生视频 | 让单张参考图动起来 | |
veo-3.1-ref | 多参考图 | 多张图保持人物/物体一致 | |
veo-3.1-first-last | 首尾帧 | 两帧之间生成过渡视频 | |
kling-v3-pro / -standard | 快手 | 文/图生视频 | 3-15 秒,原生音频,多镜头 |
wan-2.7 | 阿里 | 文生视频 | 高质量,默认 1080p |
wan-2.7-image | 阿里 | 图生视频 | 首尾帧、音频驱动 |
wan-2.7-ref | 阿里 | 参考图视频 | 多主体参考 |
wan-2.7-edit | 阿里 | 视频到视频 | 基于指令的视频编辑 |
seedance-2.0 / -fast | 字节 | 文/图生视频 | 电影感、原生音频、物理感 |
🎵 音频(音乐)
| 模型 | 提供商 | 能力 | 亮点 |
|---|---|---|---|
elevenlabs-music | ElevenLabs | 音乐生成 | 文本生成音乐,3 秒-10 分钟,可选纯器乐 |
🎙️ 语音转写
| 模型 | 提供商 | 能力 | 亮点 |
|---|---|---|---|
| Whisper / Wizper | — | 转写 / 翻译 | BCP-47 语言代码,词级 / 句段时间戳 |
使用 GET /hub/v1/models?capability=transcribe 获取最新列表。
快速示例 —— 图像
快速示例 —— 视频
快速示例 —— 音乐
快速示例 —— 转写
端点速览
| 端点 | 方法 | 说明 |
|---|---|---|
/hub/v1/image | POST | 提交图像生成 / 编辑任务 |
/hub/v1/video | POST | 提交视频生成 / 编辑任务 |
/hub/v1/audio | POST | 提交音乐生成任务 |
/hub/v1/transcribe | POST | 提交转写 / 翻译任务 |
/hub/v1/tasks/{task_id} | GET | 查询任务状态与结果 |
/hub/v1/models | GET | 列出所有模型(可按能力筛选) |
/hub/v1/models/{model} | GET | 获取单个模型完整 input schema + 示例 |
任务状态
| 状态 | 含义 |
|---|---|
pending | 已入队,等待 worker |
processing | 正在执行 |
completed | ✅ 完成 —— data 中包含结果 |
failed | ❌ 失败 —— 查看 error_code / error_message |
timeout | 超过处理时间限制 |
cancelled | 已被用户或系统取消 |