为何自托管Stable Diffusion
托管型图像生成服务使用便捷,却存在三个挥之不去的限制:它们会监控并通常留存您提交的每一条提示词和每一张生成图像;它们设有内容过滤器,由其决定您被允许生成的内容;而且按图像或点数计费,对于批量生成的用户来说费用迅速累积。对于偶尔使用的用户而言,这或许是可以接受的权衡;但对于有认真创作需求的人来说,这三点足以令人另寻出路。
在您自己的GPU服务器上运行Stable Diffusion,上述三个问题迎刃而解。提示词与图像始终留在您掌控的服务器上,不会有任何第三方记录或审查。您可以自由选择任何模型和扩展插件,无需受制于外部内容政策。费用也变为按月计费的固定硬件租金,不再是随每次生成累积的计量表。而在无KYC的离岸GPU服务商上,服务器本身同样不与任何身份信息绑定。本指南将介绍如何选择GPU、部署Web界面,以及实际费用构成。

选择GPU
Stable Diffusion对显存的需求远低于大型语言模型 — 决定性因素仍是VRAM,但门槛要低得多。VRAM容量决定了您能运行哪些模型世代,以及支持的分辨率和批量大小。
- RTX 4090(24 GB VRAM) — Stable Diffusion的最佳选择。它能运行所有当前主流开源模型,包括较大的SDXL级别及更新的扩散模型,生成速度快,高分辨率和合理批量大小均可轻松应对。对于单用户或小团队而言,这是首选显卡。
- RTX 5090(32 GB VRAM) — 余量更为充裕:支持更大批量、最新最重型的模型,迭代更快。如果您追求极致速度或需要运行最苛刻的扩散模型,这是正确选择。
- H100(80 GB VRAM) — 远超单纯图像生成的需求,但若同一台服务器还需服务大量并发用户,或同时兼任LLM主机,这便是正确选择。
对于绝大多数Stable Diffusion用户而言,单张RTX 4090是正确且经济高效的答案。只有在需要同时服务大量用户或运行异常高负载模型时,才有必要考虑更高配置。
第一步 — 开通GPU服务器
在ServPrivacy上选择含有所需显卡的GPU套餐 — 大多数用户选RTX 4090 — 确定您希望的服务器地区,并以加密货币支付。服务器将自动完成配置,NVIDIA驱动程序与CUDA已预先安装,服务器启动后即可立即投入GPU运算;无需自行处理任何驱动安装问题。
通过SSH连接服务器,运行nvidia-smi确认GPU存在且处于空闲状态。从这一步开始,运行Stable Diffusion只需简短几步。
第二步 — 安装Stable Diffusion Web界面
您几乎肯定需要一个Web界面,而非直接使用命令行 — Web界面为提示词输入、参数设置、模型切换以及各类使Stable Diffusion功能强大的扩展插件提供了浏览器操作界面。成熟的主流选项如下:
- AUTOMATIC1111 — 历史悠久、功能丰富的Web界面,拥有最庞大的扩展插件生态系统和最完善的社区文档,是大多数用户的默认选择。
- ComfyUI — 以节点为基础的界面,将完整的生成流程以图形化方式呈现。上手曲线较陡,但提供无与伦比的精细控制能力,是复杂、可复现工作流的首选。
- Forge — AUTOMATIC1111系列的优化分支,针对性能与较低VRAM占用进行了专项调优。
每款Web界面均附有完整的安装脚本文档;在已预装CUDA的服务器上,您只需克隆项目、运行安装程序并下载模型检查点。服务器启动后不到一小时,您便拥有了一台可以正常工作的图像生成服务器。Web界面监听本地端口 — 这引出了唯一需要正确处理的关键一步。
第三步 — 私密访问您的服务器
切勿将Web界面直接暴露在公网上。这些界面默认没有任何身份验证,一旦公网IP上的Stable Diffusion界面被发现,陌生人便会趁机使用,白白消耗您的GPU时间和带宽。
安全访问有两种方式。最简单的是SSH隧道:将Web界面绑定到服务器的本地回环地址,通过SSH连接转发端口,这样界面便以localhost的形式出现在您自己的浏览器中,而不会对外暴露。若有多人需要访问,另一种方案是在其前端部署一个强制登录和TLS的反向代理。对于单用户而言,SSH隧道是最简洁、最私密的选择 — 界面仅对您本人开放,提示词仅在您的本机与服务器之间传输。
费用对比:GPU服务器与托管服务
经济账完全取决于您的生成量。托管图像服务按图像或点数计费 — 少量出图时颇具优势,批量生成时则费用高昂。租用GPU服务器则是固定月费,硬件能生成多少就生成多少,没有任何按图计费的计量表。
ServPrivacy RTX 4090服务器起价约为每月122美元。RTX 4090每小时可生成大量图像,因此一个月下来,以这笔固定费用可完成的生成量极为可观。如果您在托管服务上的使用量是持续稳定的出图流,而非偶尔的零星图片,那么专用GPU服务器的每张图成本将远低于托管服务 — 而且生成量越大,节省越显著。您还能在毫无点数压力的情况下进行无限次迭代,没有内容过滤器,完全保护您的隐私。偶尔使用时,托管服务更为简便;但有实质性使用量时,服务器在成本上的优势毋庸置疑。
自托管是正确选择的时机
当以下三种情况之一成立时,自托管Stable Diffusion便是正确之举:您的生成量较大,按图计费已不再合算;您需要完全的创作自由 — 任意模型、任意扩展插件、任意工作流,不受任何内容过滤器的限制;或者您不希望任何第三方记录您的提示词与图像。
如果您只是偶尔生成图片,托管服务是更简便的路径。但对于严肃、持续、注重隐私的图像生成需求而言,运行您自己Stable Diffusion实例的GPU服务器更快、每张图更便宜,且完全属于您 — 在无KYC的离岸GPU服务商上,这套图像生成环境没有身份信息、没有过滤器、没有计量表。