Perché fare self-hosting di Stable Diffusion
I servizi in hosting per la generazione di immagini sono comodi, ma comportano tre limiti persistenti. Monitorano e spesso archiviano ogni prompt e ogni immagine prodotta. Applicano un filtro contenuti che decide cosa è consentito generare. E addebitano un costo per immagine o per credito, che si accumula rapidamente per chi genera a volume. Per un utente occasionale può essere un compromesso accettabile; per chi genera seriamente, sono tre buone ragioni per cercare un'alternativa.
Eseguire Stable Diffusion sul proprio server GPU elimina tutti e tre i problemi. I prompt e le immagini non lasciano mai un server sotto il tuo controllo — nulla viene registrato o esaminato da terzi. Puoi usare qualsiasi modello e qualsiasi estensione, senza policy esterne sui contenuti. E il costo è una tariffa mensile fissa per l'hardware, non un contatore che scatta a ogni generazione. Su un host GPU offshore e no-KYC, il server stesso non è associato ad alcuna identità. Questa guida illustra come scegliere la GPU, come avviare una web UI e quanto costa davvero.

Scegliere la GPU
Stable Diffusion è molto meno esigente di un grande modello linguistico — il fattore determinante rimane la VRAM, ma la soglia è molto più bassa. La VRAM determina quali generazioni di modelli si possono eseguire e a quale risoluzione e dimensione di batch.
- RTX 4090 (24 GB VRAM) — il punto di equilibrio ideale per Stable Diffusion. Esegue tutti gli attuali modelli open, inclusi quelli di classe SDXL e i più recenti modelli diffusivi, genera velocemente e gestisce risoluzioni elevate e batch di dimensioni discrete senza problemi. Per un singolo utente o un piccolo team, questa è la scheda da scegliere.
- RTX 5090 (32 GB VRAM) — ancora più margine: batch più grandi, i modelli più nuovi e pesanti, iterazioni più rapide. La scelta giusta se si vuole la massima velocità o si eseguono i modelli diffusivi più esigenti.
- H100 (80 GB VRAM) — ben oltre le esigenze della sola generazione di immagini, ma la scelta corretta se lo stesso server serve molti utenti in contemporanea o funge anche da host per LLM.
Per la grande maggioranza degli utenti di Stable Diffusion, una singola RTX 4090 è la risposta giusta e conveniente. Ricorrere a qualcosa di più potente ha senso solo se si serve un gran numero di utenti simultanei o si eseguono modelli insolitamente pesanti.
Passaggio 1 — Provisionare il server GPU
Su ServPrivacy, scegli un piano GPU con la scheda desiderata — una RTX 4090 per la maggior parte degli utenti — e la giurisdizione che preferisci, e paga in criptovalute. Il server viene provisionato automaticamente con i driver NVIDIA e CUDA preinstallati, così è pronto per il lavoro GPU dal momento in cui si avvia; nessuna configurazione dei driver da affrontare.
Connettiti via SSH ed esegui nvidia-smi per confermare che la GPU sia presente e inattiva. Da qui, avere Stable Diffusion operativo è un lavoro rapido.
Passaggio 2 — Installare una web UI per Stable Diffusion
Quasi certamente vorrai una web UI piuttosto che la semplice riga di comando — offre un'interfaccia browser per i prompt, le impostazioni, il cambio di modello e tutte le estensioni che rendono Stable Diffusion potente. Le opzioni più consolidate:
- AUTOMATIC1111 — la web UI storica e ricca di funzionalità, con il più ampio ecosistema di estensioni e la documentazione comunitaria più vasta. La scelta predefinita per la maggior parte degli utenti.
- ComfyUI — un'interfaccia a nodi che espone l'intera pipeline di generazione come un grafo. Curva di apprendimento più ripida, ma controllo senza pari, e il preferito per workflow complessi e ripetibili.
- Forge — un fork ottimizzato della famiglia AUTOMATIC1111, orientato alle prestazioni e a un uso ridotto della VRAM.
Ognuno si installa con uno script di configurazione documentato; su un server con CUDA già pronto, si clona il progetto, si esegue il suo installer e si scarica un checkpoint del modello. Entro un'ora dall'avvio del server hai un image-generation server funzionante. La web UI è in ascolto su una porta locale — il che ci porta all'unica cosa da fare bene.
Passaggio 3 — Accedervi in modo privato
Non esporre la web UI direttamente a internet. Di default queste interfacce non hanno autenticazione, e una UI di Stable Diffusion aperta su un IP pubblico verrà trovata e usata da estranei — consumando il tuo tempo GPU e la tua banda.
Accedi in modo sicuro in uno dei due modi. Il più semplice è un tunnel SSH: tieni la UI legata a localhost sul server e fai il forward della porta tramite la tua connessione SSH, così l'interfaccia appare nel tuo browser a localhost senza mai essere esposta pubblicamente. L'alternativa, se più persone hanno bisogno di accesso, è posizionare la UI dietro un reverse proxy che imponga un login e TLS. Per un singolo utente il tunnel SSH è l'opzione più pulita e privata — la UI è raggiungibile solo da te e i prompt viaggiano esclusivamente tra la tua macchina e il tuo server.
Costi: server GPU vs servizio in hosting
La convenienza economica dipende interamente da quanto si genera. Un servizio di immagini in hosting addebita un costo per immagine o per credito — ottimo per poche immagini, costoso a volume. Un server GPU in affitto ha un costo mensile fisso e genera quanto l'hardware fisicamente consente, senza contatore per immagine.
Un server ServPrivacy con RTX 4090 parte da circa $122/mese. Una RTX 4090 genera moltissime immagini all'ora, quindi nel corso di un mese un server dedicato rappresenta un numero enorme di generazioni a quella tariffa fissa. Se il tuo utilizzo su un servizio in hosting è un flusso costante piuttosto che immagini occasionali, la GPU dedicata è nettamente più economica per immagine — e il risparmio cresce all'aumentare del volume generato. Si guadagna anche l'iterazione illimitata senza ansia da crediti, nessun filtro contenuti e totale privacy. Per un uso occasionale un servizio in hosting è più semplice; per qualsiasi volume reale, il server vince nettamente in termini di costo.
Quando il self-hosting è la scelta giusta
Fare self-hosting di Stable Diffusion è la mossa giusta quando è vera almeno una di queste tre condizioni: si genera a volume e i costi per immagine non hanno più senso; si vuole pieno controllo creativo — ogni modello, ogni estensione, ogni workflow, senza un filtro contenuti che decida cosa si può creare; oppure i prompt e le immagini sono qualcosa che non si vuole che terze parti registrino.
Se si generano solo immagini occasionali, un servizio in hosting è il percorso più semplice. Ma per una generazione di immagini seria, continuativa e privata, un server GPU con la propria installazione di Stable Diffusion è più veloce, più economico per immagine e interamente tuo — e su un host GPU offshore e no-KYC, è una soluzione di image-generation senza identità, senza filtri e senza contatore.