چرا Stable Diffusion را خودتان هاست کنید
سرویسهای تولید تصویر هاستشده راحت هستند، اما سه محدودیت دائمی دارند. هر prompt و هر تصویری که میسازید را زیر نظر میگیرند و اغلب ذخیره میکنند. یک فیلتر محتوا اعمال میکنند که تصمیم میگیرد چه چیزی مجاز به تولید هستید. و به ازای هر تصویر یا هر اعتبار هزینه میگیرند که برای هر کسی که با حجم بالا تولید میکند به سرعت انباشته میشود. برای یک کاربر معمولی این شاید مصالحه قابل قبولی باشد؛ برای هر کسی که جدی تولید میکند، سه دلیل برای نگاه کردن به جای دیگر است.
اجرای Stable Diffusion روی سرور GPU شخصی هر سه را از بین میبرد. Promptها و تصاویر هرگز سروری را که کنترل میکنید ترک نمیکنند — هیچ چیز توسط طرف سومی ثبت یا بررسی نمیشود. هر مدل و هر افزونهای که انتخاب میکنید را اجرا میکنید، بدون هیچ سیاست محتوای خارجی در مسیر. و هزینه یک نرخ ماهانه ثابت برای سختافزار است، نه کنتوری که با هر تولید تیک میزند. روی یک هاست GPU برونمرزی بدون KYC، خود سرور هم هیچ هویتی ندارد. این راهنما انتخاب GPU، راهاندازی یک رابط وب، و هزینه واقعی را پوشش میدهد.

انتخاب GPU
Stable Diffusion بسیار سبکتر از یک مدل زبانی بزرگ است — عامل تعیینکننده هنوز VRAM است، اما سقف بسیار پایینتر است. آنچه VRAM تعیین میکند این است که کدام نسلهای مدل میتوانید اجرا کنید و با چه رزولوشن و اندازه batch.
- RTX 4090 (24 گیگابایت VRAM) — نقطه شیرین برای Stable Diffusion. هر مدل باز فعلی را اجرا میکند، از جمله مدلهای بزرگتر کلاس SDXL و مدلهای diffusion جدیدتر، سریع تولید میکند، و رزولوشنهای بالا و اندازه batch مناسب را بهراحتی مدیریت میکند. برای یک نفر یا یک تیم کوچک، این همان کارت برای انتخاب است.
- RTX 5090 (32 گیگابایت VRAM) — فضای بیشتر: batchهای بزرگتر، جدیدترین و سنگینترین مدلها، تکرار سریعتر. انتخاب مناسب اگر بیشترین سرعت میخواهید یا سنگینترین مدلهای diffusion را اجرا میکنید.
- H100 (80 گیگابایت VRAM) — بسیار بیشتر از آنچه تولید تصویر به تنهایی نیاز دارد، اما انتخاب درست اگر همان سرور کاربران همزمان زیادی را سرویسدهی میکند، یا بهعنوان یک هاست LLM هم استفاده میشود.
برای اکثریت کاربران Stable Diffusion، یک RTX 4090 منفرد پاسخ درست و مقرونبهصرفه است. فقط در صورتی به چیز بیشتری دست بزنید که کاربران زیادی را همزمان سرویسدهی میکنید یا مدلهای غیرمعمول سنگینی دارید.
گام ۱ — تهیه سرور GPU
در ServPrivacy، یک پلن GPU با کارت مورد نظرتان — RTX 4090 برای اکثر افراد — و حوزه قضایی دلخواه انتخاب کنید و با رمزارز پرداخت کنید. سرور بهصورت خودکار تهیه میشود، با درایورهای NVIDIA و CUDA از پیش نصبشده، بنابراین از لحظه بوت آماده کار GPU است؛ هیچ نصب درایوری برای دست و پنجه نرم کردن وجود ندارد.
از طریق SSH وصل شوید و nvidia-smi را اجرا کنید تا تأیید کنید GPU حاضر و بیکار است. از اینجا، راهاندازی Stable Diffusion کاری کوتاه است.
گام ۲ — نصب یک رابط وب Stable Diffusion
تقریباً قطعاً یک رابط وب میخواهید نه خط فرمان ساده — یک رابط مرورگری برای promptها، تنظیمات، تعویض مدل، و همه افزونههایی که Stable Diffusion را قدرتمند میکنند به شما میدهد. گزینههای جا افتاده:
- AUTOMATIC1111 — رابط وب قدیمی و پرامکانات، با بزرگترین اکوسیستم افزونه و بیشترین مستندات جامعه. انتخاب پیشفرض برای اکثر کاربران.
- ComfyUI — یک رابط مبتنی بر گره که کل pipeline تولید را بهصورت یک گراف نشان میدهد. منحنی یادگیری بیشتری دارد، اما کنترل بینظیر، و مورد علاقه برای workflow های پیچیده و قابل تکرار.
- Forge — یک fork بهینهشده از خانواده AUTOMATIC1111، تنظیمشده برای عملکرد بهتر و مصرف کمتر VRAM.
هر کدام با یک اسکریپت نصب مستند نصب میشوند؛ روی سروری که CUDA از قبل نصب است، پروژه را clone میکنید، نصاب آن را اجرا میکنید، و یک checkpoint مدل دانلود میکنید. در کمتر از یک ساعت از بوت سرور، یک سرور تولید تصویر کارآمد دارید. رابط وب روی یک پورت محلی گوش میدهد — که ما را به تنها چیزی که باید درست انجام دهید میرساند.
گام ۳ — دسترسی خصوصی به آن
رابط وب را مستقیماً در معرض اینترنت قرار ندهید. این رابطها بهطور پیشفرض احراز هویتی ندارند، و یک رابط Stable Diffusion باز روی IP عمومی پیدا شده و توسط غریبهها استفاده میشود — که زمان GPU و پهنای باند شما را میسوزانند.
به یکی از دو روش به آن بهصورت ایمن دسترسی داشته باشید. سادهترین یک تونل SSH است: رابط را به localhost روی سرور متصل نگه دارید و پورت را از طریق اتصال SSH خود forward کنید، تا رابط در مرورگر خودتان روی localhost ظاهر شود در حالی که هرگز بهصورت عمومی در معرض نیست. گزینه جایگزین، اگر چند نفر نیاز به دسترسی دارند، قرار دادن آن پشت یک reverse proxy است که ورود و TLS را اجبار میکند. برای یک کاربر تنها، تونل SSH تمیزترین و خصوصیترین گزینه است — رابط فقط توسط شما قابل دسترسی است و promptها فقط بین دستگاه و سرور شما سفر میکنند.
هزینه: سرور GPU در مقابل سرویس هاستشده
اقتصادیات کاملاً به میزان تولید شما بستگی دارد. یک سرویس تصویر هاستشده به ازای هر تصویر یا هر اعتبار هزینه میگیرد — عالی برای تعداد انگشتشماری تصویر، گران در حجم بالا. یک سرور GPU اجارهای یک هزینه ماهانه ثابت است و به اندازهای که سختافزار فیزیکاً قادر است تولید میکند، بدون هیچ کنتور به ازای هر تصویر.
یک سرور RTX 4090 از ServPrivacy از حدود $122/ماه شروع میشود. یک RTX 4090 تعداد زیادی تصویر در ساعت تولید میکند، پس در طول یک ماه یک سرور اختصاصی تعداد عظیمی از تولیدها را در ازای آن هزینه ثابت نمایندگی میکند. اگر استفاده شما از یک سرویس هاستشده جریانی پایدار بهجای تصویر گاهبهگاه باشد، GPU اختصاصی بهطرز چشمگیری ارزانتر به ازای هر تصویر است — و صرفهجویی هر چه بیشتر تولید کنید بیشتر میشود. همچنین تکرار نامحدود بدون نگرانی از اعتبار، بدون فیلتر محتوا، و حریم خصوصی کامل به دست میآورید. برای استفاده گاهبهگاه یک سرویس هاستشده سادهتر است؛ برای هر حجم واقعی، سرور از نظر هزینه بهوضوح برنده است.
چه وقت خود هاستینگ انتخاب درست است
خود هاستینگ Stable Diffusion انتخاب درست است وقتی یکی از سه چیز صادق باشد: با حجم بالا تولید میکنید و صورتحسابهای به ازای هر تصویر دیگر منطقی نیستند؛ کنترل خلاقانه کامل میخواهید — هر مدل، هر افزونه، هر workflow، بدون فیلتر محتوایی که تصمیم بگیرد چه میتوانید بسازید؛ یا promptها و تصاویر چیزی هستند که ترجیح میدهید هیچ طرف سومی ثبت نکند.
اگر فقط گاهی تصویر تولید میکنید، یک سرویس هاستشده مسیر سادهتری است. اما برای تولید تصویر جدی، پایدار و خصوصی، یک سرور GPU که نصب Stable Diffusion شخصی شما را اجرا میکند سریعتر، ارزانتر به ازای هر تصویر، و کاملاً متعلق به شماست — و روی یک هاست GPU برونمرزی بدون KYC، یک راهاندازی تولید تصویر بدون هویت، بدون فیلتر، و بدون کنتور است.