Mengapa self-host Stable Diffusion
Layanan pembuatan gambar berbasis cloud memang praktis, namun datang dengan tiga keterbatasan yang terus-menerus. Mereka memantau dan sering menyimpan setiap prompt serta setiap gambar yang Anda buat. Mereka menerapkan filter konten yang menentukan apa yang boleh Anda hasilkan. Dan mereka mengenakan biaya per gambar atau per kredit, yang cepat menumpuk bagi siapa pun yang berkreasi dalam jumlah besar. Bagi pengguna kasual hal itu mungkin bisa diterima; bagi siapa pun yang berkreasi secara serius, ketiga hal tersebut adalah alasan untuk mencari alternatif lain.
Menjalankan Stable Diffusion di server GPU Anda sendiri menghilangkan ketiganya sekaligus. Prompt dan gambar tidak pernah meninggalkan server yang Anda kendalikan — tidak ada yang dicatat atau ditinjau oleh pihak ketiga. Anda menjalankan model apa pun dan ekstensi apa pun yang Anda pilih, tanpa kebijakan konten eksternal yang menghalangi. Dan biayanya adalah tarif bulanan tetap untuk perangkat keras, bukan meteran yang berdetak setiap kali Anda membuat gambar. Pada host GPU offshore tanpa KYC, server itu sendiri pun tidak membawa identitas apa pun. Panduan ini mencakup cara memilih GPU, cara menjalankan web UI, dan berapa biaya sesungguhnya.

Memilih GPU
Stable Diffusion jauh lebih ringan dibandingkan model bahasa berukuran besar — faktor penentu tetap VRAM, tetapi ambangnya jauh lebih rendah. Yang ditentukan oleh VRAM adalah generasi model mana yang bisa Anda jalankan, serta pada resolusi dan ukuran batch berapa.
- RTX 4090 (24 GB VRAM) — titik optimal untuk Stable Diffusion. Kartu ini menjalankan semua model terbuka saat ini, termasuk model kelas SDXL dan model difusi yang lebih baru, menghasilkan gambar dengan cepat, serta menangani resolusi tinggi dan ukuran batch yang memadai dengan nyaman. Untuk satu pengguna atau tim kecil, inilah kartu yang tepat dipilih.
- RTX 5090 (32 GB VRAM) — ruang gerak lebih luas lagi: batch yang lebih besar, model terbaru dan terberat, iterasi lebih cepat. Pilihan tepat jika Anda menginginkan kecepatan maksimal atau menjalankan model difusi paling demanding.
- H100 (80 GB VRAM) — jauh melampaui kebutuhan pembuatan gambar saja, tetapi pilihan tepat jika server yang sama juga melayani banyak pengguna secara bersamaan, atau merangkap sebagai host LLM.
Bagi sebagian besar pengguna Stable Diffusion, satu RTX 4090 adalah jawaban yang tepat dan hemat biaya. Pertimbangkan yang lebih tinggi hanya jika Anda melayani banyak pengguna sekaligus atau menjalankan model yang sangat berat.
Langkah 1 — Provisioning server GPU
Di ServPrivacy, pilih paket GPU dengan kartu yang Anda inginkan — RTX 4090 untuk kebanyakan orang — serta yurisdiksi yang Anda kehendaki, lalu bayar dengan kripto. Server diprovisikan secara otomatis, dengan driver NVIDIA dan CUDA yang sudah terpasang sebelumnya, sehingga siap digunakan untuk pekerjaan GPU sejak pertama kali dinyalakan; tidak ada pengaturan driver yang perlu diurus.
Hubungkan melalui SSH dan jalankan nvidia-smi untuk memastikan GPU hadir dan dalam kondisi idle. Dari sini, menjalankan Stable Diffusion adalah pekerjaan singkat.
Langkah 2 — Instal web UI Stable Diffusion
Anda hampir pasti menginginkan web UI alih-alih baris perintah biasa — antarmuka browser ini menyediakan kontrol prompt, pengaturan, pergantian model, dan semua ekstensi yang membuat Stable Diffusion begitu powerful. Pilihan yang sudah mapan:
- AUTOMATIC1111 — web UI berfitur lengkap yang sudah lama teruji, dengan ekosistem ekstensi terbesar dan dokumentasi komunitas terlengkap. Pilihan default bagi sebagian besar pengguna.
- ComfyUI — antarmuka berbasis node yang mengekspos seluruh pipeline pembuatan gambar sebagai sebuah graf. Kurva belajar lebih curam, tetapi memberikan kontrol tak tertandingi dan menjadi favorit untuk alur kerja yang kompleks dan dapat diulang.
- Forge — fork AUTOMATIC1111 yang dioptimalkan, disetel untuk performa tinggi dan penggunaan VRAM yang lebih rendah.
Masing-masing diinstal dengan skrip pengaturan yang terdokumentasi; pada server dengan CUDA yang sudah terpasang, Anda cukup meng-clone project, menjalankan installer-nya, dan mengunduh checkpoint model. Dalam waktu kurang dari satu jam sejak server dinyalakan, Anda sudah memiliki server pembuatan gambar yang berfungsi penuh. Web UI mendengarkan di port lokal — yang membawa kita ke satu hal penting yang perlu dilakukan dengan benar.
Langkah 3 — Akses secara privat
Jangan mengekspos web UI langsung ke internet. Antarmuka-antarmuka ini tidak memiliki autentikasi bawaan, dan sebuah Stable Diffusion UI terbuka di IP publik akan ditemukan dan digunakan oleh orang asing — menghabiskan waktu GPU dan bandwidth Anda.
Akses dengan aman melalui salah satu dari dua cara. Yang paling sederhana adalah tunnel SSH: biarkan UI terikat ke localhost di server dan teruskan port melalui koneksi SSH Anda, sehingga antarmuka muncul di browser Anda sendiri di localhost tanpa pernah terekspos secara publik. Alternatifnya, jika beberapa orang membutuhkan akses, adalah menempatkannya di balik reverse proxy yang menegakkan login dan TLS. Untuk pengguna tunggal, tunnel SSH adalah opsi paling bersih dan paling privat — UI hanya dapat diakses oleh Anda, dan prompt hanya berpindah antara mesin Anda dan server Anda.
Biaya: server GPU vs layanan hosted
Ekonomi seluruhnya bergantung pada seberapa banyak Anda berkreasi. Layanan gambar hosted mengenakan biaya per gambar atau per kredit — sangat baik untuk sejumlah kecil gambar, tetapi mahal jika dalam jumlah besar. Server GPU sewaan memiliki biaya bulanan tetap dan menghasilkan gambar sebanyak yang mampu dilakukan oleh perangkat kerasnya, tanpa meteran per gambar.
Server RTX 4090 ServPrivacy dimulai dari sekitar $122/bulan. Sebuah RTX 4090 menghasilkan sangat banyak gambar per jam, sehingga dalam sebulan server dedicated merepresentasikan jumlah generasi yang sangat besar dengan biaya tetap tersebut. Jika penggunaan Anda pada layanan hosted adalah aliran gambar yang konsisten alih-alih gambar sesekali, GPU dedicated jauh lebih murah per gambar — dan penghematannya semakin besar seiring semakin banyak Anda berkreasi. Anda juga mendapatkan iterasi tak terbatas tanpa kekhawatiran kredit, tanpa filter konten, dan privasi yang sempurna. Untuk penggunaan sesekali, layanan hosted lebih sederhana; untuk volume nyata, server jauh lebih unggul dari sisi biaya.
Kapan self-hosting adalah pilihan yang tepat
Self-hosting Stable Diffusion adalah langkah yang tepat ketika salah satu dari tiga kondisi ini terpenuhi: Anda berkreasi dalam volume besar dan tagihan per gambar sudah tidak lagi masuk akal; Anda menginginkan kendali kreatif penuh — setiap model, setiap ekstensi, setiap alur kerja, tanpa filter konten yang menentukan apa yang boleh Anda buat; atau prompt dan gambar Anda adalah sesuatu yang lebih Anda sukai tidak dicatat oleh pihak ketiga mana pun.
Jika Anda hanya sesekali membuat gambar, layanan hosted adalah jalan yang lebih mudah. Tetapi untuk pembuatan gambar yang serius, berkelanjutan, dan privat, server GPU yang menjalankan instalasi Stable Diffusion Anda sendiri lebih cepat, lebih murah per gambar, dan sepenuhnya milik Anda — dan pada host GPU offshore tanpa KYC, itu adalah pengaturan pembuatan gambar tanpa identitas, tanpa filter, dan tanpa meteran.