Tại sao tự lưu trữ Stable Diffusion
Các dịch vụ tạo ảnh hosted tiện lợi, nhưng đi kèm với ba giới hạn dai dẳng. Họ theo dõi và thường lưu trữ mọi prompt và mọi ảnh bạn tạo ra. Họ áp dụng bộ lọc nội dung quyết định bạn được phép tạo gì. Và họ tính phí theo ảnh hoặc theo credit, cộng dồn nhanh chóng với ai tạo nhiều. Với người dùng thông thường, đó có thể là sự đánh đổi chấp nhận được; với ai tạo ảnh nghiêm túc, đó là ba lý do để tìm chỗ khác.
Chạy Stable Diffusion trên GPU server riêng loại bỏ cả ba. Prompt và ảnh không bao giờ rời khỏi máy chủ bạn kiểm soát — không có gì được ghi nhật ký hay xem xét bởi bên thứ ba. Bạn chạy bất kỳ model và extension nào bạn muốn, không có chính sách nội dung bên ngoài nào can thiệp. Và chi phí là mức cố định hằng tháng cho phần cứng, không phải đồng hồ chạy theo từng lần tạo. Trên GPU host nước ngoài không KYC, bản thân máy chủ cũng không mang danh tính nào. Hướng dẫn này đề cập đến việc chọn GPU, cài đặt web UI, và chi phí thực tế là bao nhiêu.

Chọn GPU
Stable Diffusion nhẹ hơn nhiều so với large language model — yếu tố quyết định vẫn là VRAM, nhưng ngưỡng thấp hơn nhiều. VRAM quyết định model generation nào bạn có thể chạy, và ở độ phân giải và batch size nào.
- RTX 4090 (24 GB VRAM) — điểm ngọt cho Stable Diffusion. Nó chạy mọi model open hiện tại, kể cả SDXL-class lớn hơn và các diffusion model mới hơn, tạo ảnh nhanh, và xử lý độ phân giải cao cùng batch size hợp lý thoải mái. Với một người dùng hay nhóm nhỏ, đây là card nên chọn.
- RTX 5090 (32 GB VRAM) — nhiều headroom hơn: batch lớn hơn, model mới nhất và nặng nhất, iteration nhanh hơn. Lựa chọn nếu bạn muốn tốc độ tối đa hay đang chạy các diffusion model đòi hỏi nhất.
- H100 (80 GB VRAM) — vượt xa nhu cầu tạo ảnh đơn thuần, nhưng đúng lựa chọn nếu cùng máy chủ phục vụ nhiều người dùng đồng thời, hay kiêm nhiệm làm LLM host.
Với đại đa số người dùng Stable Diffusion, một RTX 4090 đơn lẻ là câu trả lời đúng đắn và tiết kiệm chi phí. Chỉ nâng cấp khi bạn phục vụ nhiều người dùng cùng lúc hay chạy model đặc biệt nặng.
Bước 1 — Cài đặt GPU server
Trên ServPrivacy, chọn gói GPU với card của bạn — RTX 4090 với hầu hết mọi người — và vùng lãnh thổ bạn muốn, rồi thanh toán bằng crypto. Máy chủ được cấp phép tự động, với driver NVIDIA và CUDA được cài sẵn, sẵn sàng cho công việc GPU ngay khi khởi động; không cần vật lộn với cài đặt driver.
Kết nối qua SSH và chạy nvidia-smi để xác nhận GPU hiện diện và đang rảnh. Từ đây, cài đặt Stable Diffusion là công việc ngắn.
Bước 2 — Cài đặt web UI Stable Diffusion
Bạn hầu như chắc chắn muốn web UI hơn là dòng lệnh thuần — nó cung cấp giao diện trình duyệt cho prompt, cài đặt, chuyển đổi model, và tất cả extension giúp Stable Diffusion trở nên mạnh mẽ. Các lựa chọn đã được kiểm chứng:
- AUTOMATIC1111 — web UI lâu đời, giàu tính năng nhất, với hệ sinh thái extension lớn nhất và tài liệu cộng đồng nhiều nhất. Lựa chọn mặc định cho hầu hết người dùng.
- ComfyUI — giao diện dựa trên node hiển thị toàn bộ pipeline tạo ảnh dưới dạng đồ thị. Đường cong học tập cao hơn, nhưng kiểm soát vô song, và là lựa chọn ưa thích cho quy trình làm việc phức tạp, có thể tái lập.
- Forge — fork tối ưu hóa trong nhánh AUTOMATIC1111, được điều chỉnh cho hiệu suất và dùng ít VRAM hơn.
Mỗi cái cài đặt bằng script đã được tài liệu hóa; trên máy chủ đã có CUDA, bạn clone project, chạy trình cài đặt, và tải về model checkpoint. Trong vòng một giờ sau khi máy chủ khởi động, bạn đã có image-generation server hoạt động. Web UI lắng nghe trên cổng cục bộ — điều đó dẫn đến một điều cần làm đúng.
Bước 3 — Truy cập một cách riêng tư
Đừng để lộ web UI trực tiếp ra internet. Mặc định các giao diện này không có xác thực, và một Stable Diffusion UI mở trên IP công khai sẽ bị tìm thấy và sử dụng bởi người lạ — tiêu hao GPU time và băng thông của bạn.
Truy cập an toàn theo một trong hai cách. Đơn giản nhất là SSH tunnel: giữ UI bind vào localhost trên máy chủ và chuyển tiếp cổng qua kết nối SSH, để giao diện xuất hiện trong trình duyệt của bạn tại localhost trong khi không bao giờ bị lộ công khai. Nếu nhiều người cần truy cập, đặt nó sau reverse proxy yêu cầu đăng nhập và TLS. Với người dùng đơn lẻ, SSH tunnel là lựa chọn gọn gàng, riêng tư nhất — UI chỉ có thể truy cập bởi bạn, và prompt chỉ truyền giữa máy của bạn và máy chủ.
Chi phí: GPU server vs dịch vụ hosted
Kinh tế học hoàn toàn phụ thuộc vào mức độ bạn tạo ảnh. Dịch vụ tạo ảnh hosted tính phí theo ảnh hay theo credit — tuyệt vời cho vài bức ảnh, đắt khi dùng nhiều. GPU server thuê là chi phí cố định hằng tháng và tạo nhiều ảnh như phần cứng có thể, không có đồng hồ theo từng ảnh.
ServPrivacy RTX 4090 server chạy từ khoảng $122/tháng. RTX 4090 tạo rất nhiều ảnh mỗi giờ, vì vậy trong một tháng, dedicated server đại diện cho một số lượng tạo ảnh khổng lồ với mức phí cố định đó. Nếu mức sử dụng của bạn trên dịch vụ hosted là dòng chảy đều đặn thay vì vài tấm ảnh thỉnh thoảng, GPU chuyên dụng rẻ hơn đáng kể trên mỗi ảnh — và khoản tiết kiệm tăng theo lượng tạo ảnh. Bạn cũng được iteration không giới hạn không lo credit, không có bộ lọc nội dung, và hoàn toàn riêng tư. Với dùng thỉnh thoảng thì dịch vụ hosted đơn giản hơn; với khối lượng thực sự, máy chủ thắng tuyệt đối về chi phí.
Khi nào tự lưu trữ là lựa chọn đúng
Tự lưu trữ Stable Diffusion là quyết định đúng khi bất kỳ một trong ba điều là thực: bạn tạo ảnh nhiều và hóa đơn theo ảnh đã không còn hợp lý; bạn muốn toàn quyền sáng tạo — mọi model, mọi extension, mọi quy trình, không có bộ lọc nội dung nào quyết định bạn có thể làm gì; hoặc prompt và ảnh là thứ bạn không muốn bên thứ ba nào ghi lại.
Nếu bạn chỉ thỉnh thoảng tạo vài ảnh, dịch vụ hosted là con đường đơn giản hơn. Nhưng với tạo ảnh nghiêm túc, liên tục, riêng tư, GPU server chạy Stable Diffusion của riêng bạn nhanh hơn, rẻ hơn trên mỗi ảnh, và hoàn toàn thuộc về bạn — và trên GPU host nước ngoài không KYC, đó là hệ thống tạo ảnh không danh tính, không bộ lọc, không đồng hồ tính tiền.