CUDA 12
CUDA 12.4/12.6 + cuDNN از پیش نصبشده. بوت کنید، SSH بزنید، nvidia-smi اجرا کنید.
سرورهای GPU NVIDIA RTX 4090، RTX 5090 و H100 SXM5 برای آموزش هوش مصنوعی، استنتاج، تولید تصویر و ویدیو. CUDA 12 و cuDNN از پیش نصبشده، بهعلاوه پیشتنظیمهای PyTorch / ComfyUI / Ollama آماده اتصال SSH. هاستهای Threadripper Pro در سطوح H100 برای تعداد کامل خط PCIe Gen 5. در ۴ حوزه قضایی برونمرزی موجود است، بدون KYC، پرداخت فقط با ارز دیجیتال در ۲۰ ارز از جمله Monero.
همان سختافزار NVIDIA در هر حوزه قضایی با پهنای باند نامحدود در هر طرح. قیمتگذاری بسته به حوزه قضایی متفاوت است — Iceland کمکربنترین گزینه است، Moldova ارزانترین.
| پلان | GPU | VRAM | CPU | RAM | NVMe | پهنای باند | قیمت | |
|---|---|---|---|---|---|---|---|---|
| IS-S | 1× NVIDIA RTX 4090 | 24 GB GDDR6X | 12 vCPU | 64 GB DDR5 | 1 TB NVMe | نامحدود | $146.50/mo | سفارش |
| IS-M محبوب | 1× NVIDIA RTX 5090 | 32 GB GDDR7 | 16 vCPU | 96 GB DDR5 | 1.5 TB NVMe | نامحدود | $234.50/mo | سفارش |
| IS-L | 1× NVIDIA H100 SXM5 | 80 GB HBM3 | 24 vCPU | 192 GB DDR5 | 2 TB NVMe | نامحدود | $906.00/mo | سفارش |
| IS-XL | 2× NVIDIA H100 SXM5 | 160 GB HBM3 | 32 vCPU | 384 GB DDR5 | 4 TB NVMe | نامحدود | $1714.50/mo | سفارش |
| پلان | GPU | VRAM | CPU | RAM | NVMe | پهنای باند | قیمت | |
|---|---|---|---|---|---|---|---|---|
| MD-S | 1× NVIDIA RTX 4090 | 24 GB GDDR6X | 12 vCPU | 64 GB DDR5 | 1 TB NVMe | نامحدود | $122.00/mo | سفارش |
| MD-M محبوب | 1× NVIDIA RTX 5090 | 32 GB GDDR7 | 16 vCPU | 96 GB DDR5 | 1.5 TB NVMe | نامحدود | $195.50/mo | سفارش |
| MD-L | 1× NVIDIA H100 SXM5 | 80 GB HBM3 | 24 vCPU | 192 GB DDR5 | 2 TB NVMe | نامحدود | $832.50/mo | سفارش |
| MD-XL | 2× NVIDIA H100 SXM5 | 160 GB HBM3 | 32 vCPU | 384 GB DDR5 | 4 TB NVMe | نامحدود | $1567.50/mo | سفارش |
| پلان | GPU | VRAM | CPU | RAM | NVMe | پهنای باند | قیمت | |
|---|---|---|---|---|---|---|---|---|
| RO-S | 1× NVIDIA RTX 4090 | 24 GB GDDR6X | 12 vCPU | 64 GB DDR5 | 1 TB NVMe | نامحدود | $132.00/mo | سفارش |
| RO-M محبوب | 1× NVIDIA RTX 5090 | 32 GB GDDR7 | 16 vCPU | 96 GB DDR5 | 1.5 TB NVMe | نامحدود | $210.00/mo | سفارش |
| RO-L | 1× NVIDIA H100 SXM5 | 80 GB HBM3 | 24 vCPU | 192 GB DDR5 | 2 TB NVMe | نامحدود | $857.00/mo | سفارش |
| RO-XL | 2× NVIDIA H100 SXM5 | 160 GB HBM3 | 32 vCPU | 384 GB DDR5 | 4 TB NVMe | نامحدود | $1616.50/mo | سفارش |
| پلان | GPU | VRAM | CPU | RAM | NVMe | پهنای باند | قیمت | |
|---|---|---|---|---|---|---|---|---|
| NL-S | 1× NVIDIA RTX 4090 | 24 GB GDDR6X | 12 vCPU | 64 GB DDR5 | 1 TB NVMe | نامحدود | $136.50/mo | سفارش |
| NL-M محبوب | 1× NVIDIA RTX 5090 | 32 GB GDDR7 | 16 vCPU | 96 GB DDR5 | 1.5 TB NVMe | نامحدود | $220.00/mo | سفارش |
| NL-L | 1× NVIDIA H100 SXM5 | 80 GB HBM3 | 24 vCPU | 192 GB DDR5 | 2 TB NVMe | نامحدود | $881.50/mo | سفارش |
| NL-XL | 2× NVIDIA H100 SXM5 | 160 GB HBM3 | 32 vCPU | 384 GB DDR5 | 4 TB NVMe | نامحدود | $1665.50/mo | سفارش |
هاستینگ GPU در ۴ حوزه قضایی در زمان راهاندازی موجود است (Iceland، Netherlands، Romania، Moldova). Russia به دلیل تحریمهای صادراتی NVIDIA حذف شده؛ Switzerland و Panama فعلاً فقط Linux نگه داشته میشوند.
CUDA 12.4/12.6 + cuDNN از پیش نصبشده. بوت کنید، SSH بزنید، nvidia-smi اجرا کنید.
از سفارش پرداختشده تا خروجی nvidia-smi در کمتر از ۶۰ ثانیه.
تا ۴ TB NVMe SSD، همراه با DDR5 RAM برای I/O سریع مجموعه داده.
SSH با دسترسی کامل root، بهعلاوه JupyterLab از پیش متصلشده روی پورت ۸۸۸۸ با احراز هویت توکن.
فاینتیونینگ Llama، Mistral، Qwen، DeepSeek با LoRA / QLoRA / FT کامل روی H100. یا استنتاج خود-میزبان با vLLM / TGI / Ollama برای ارائه مدل در تولید.
Stable Diffusion، FLUX.1، SDXL با ComfyUI یا Forge. LoRA خودتان را آموزش دهید، در مقیاس دستهای تولید کنید، یا یک endpoint استنتاج خود-میزبان راهاندازی کنید.
OpenSora، CogVideoX، Wan-2.1، AnimateDiff. تولید ویدیو به VRAM جدی نیاز دارد — از RTX 5090 (32 GB) یا H100 (80 GB) شروع کنید.
مدلهای فاینتیونشده را پشت API خودتان مستقر کنید. هزینههای قابل پیشبینی، بدون کارمزد هر توکن، بدون خروج داده از حوزه قضایی شما. JupyterLab + FastAPI گنجانده شده.
گزینههای مورد نظر را در زمان سفارش علامت بزنید و سرور GPU شما با پشتهای که قبلاً نصب، پیکربندی و از طریق systemd راهاندازی شده است بوت میشود. مدلهای از پیش دانلودشده را در پایین فعال کنید تا دانلود ۳۰ تا ۶۰ دقیقهای HuggingFace را نیز بگذارید.
Production-grade LLM serving with continuous batching and paged attention. Exposes an /v1/completions endpoint compatible with the OpenAI SDK.
Self-hosted ChatGPT-style web UI. Pulls Ollama-native quantized weights; easiest path to "talk to my LLM in a browser".
Gradio UI with broad backend support — Transformers, ExLlamaV2, llama.cpp, AWQ, GPTQ. Power-user choice for benchmarking quantizations.
HuggingFace Text Generation Inference — production server with token streaming, tensor parallelism, paged attention.
YAML-config driven finetuning. Supports LoRA, QLoRA, full FT, DPO, ORPO. Pre-cloned to /opt/axolotl with starter configs for Llama / Qwen / Mistral.
2× faster + 70% less VRAM finetuning via custom Triton kernels. Ideal for budget runs on RTX 4090. Pre-installed in /opt/unsloth.
WebUI-driven finetuning platform. SFT / RLHF / DPO / KTO. Good entry point for non-coders who want to finetune on a UI.
Node-graph image-gen interface, ships with FLUX.1-schnell + Kontext workflows. Power-user image generation pipeline.
The mainstream Stable Diffusion WebUI. Stable Diffusion 3.5 + extensions ecosystem. Familiar UI for users coming from civitai.
A1111 fork optimized for FLUX, faster sampling, lower VRAM. Drop-in replacement for users coming from Auto1111.
GUI for training Stable Diffusion / FLUX LoRA, DreamBooth, textual inversion. Trains a custom-style LoRA on RTX 4090 in 30-90 min.
ComfyUI with video-gen workflows preloaded — Wan 2.2 T2V, HunyuanVideo, LTX-Video. Needs 40+ GB VRAM for usable speed at 720p.
Lightweight video workflows — CogVideoX-5B, Wan 2.1 1.3B, LTX-Video. Runs on a single RTX 4090.
OpenAI Whisper Large v3 Turbo with faster-whisper backend behind a /transcribe HTTP API. 8× faster than v3, 99 langs, real-time on any GPU.
Multi-model TTS endpoint serving Kokoro 82M (54 voices, 8 langs) and Sesame CSM-1B (conversational with context). REST + WebSocket streaming.
Always installed. PyTorch 2.5 + CUDA 12.4 + Transformers + diffusers + accelerate + bitsandbytes + xformers + flash-attn. The universal AI dev baseline.
VSCode running in your browser, full Python/IPython/extensions. For users who prefer IDE workflow over notebooks.
چندین پشته را روی همان GPU ترکیب کنید — اسکریپت استقرار تعارضهای وابستگی را حل میکند و پورتهای غیرمتعارض را تخصیص میدهد.
مدلهای مورد نیاز را در زمان سفارش علامت بزنید و آنها قبل از ورود شما در /root/.cache/huggingface کش میشوند. مدلهای 🔒 محدود (Llama، Mistral، Gemma، FLUX-dev، SD 3.5) به توکن HuggingFace شما نیاز دارند (همچنین در زمان سفارش درخواست میشود).
| مدل | HuggingFace | اندازه | حداقل VRAM | حداقل سطح GPU | نوع |
|---|---|---|---|---|---|
| Llama 3.3 70B Instruct 🔒 محدود | meta-llama/Llama-3.3-70B-Instruct |
140 GB | 160 GB | GPU-L | LLM |
| Qwen3 32B | Qwen/Qwen3-32B |
64 GB | 80 GB | GPU-L | LLM |
| Qwen3 14B | Qwen/Qwen3-14B |
28 GB | 32 GB | GPU-S | LLM |
| Qwen3 8B | Qwen/Qwen3-8B |
16 GB | 20 GB | GPU-S | LLM |
| DeepSeek-R1 Distill Qwen 32B | deepseek-ai/DeepSeek-R1-Distill-Qwen-32B |
64 GB | 80 GB | GPU-S | LLM |
| DeepSeek-R1 Distill Llama 70B | deepseek-ai/DeepSeek-R1-Distill-Llama-70B |
140 GB | 160 GB | GPU-S | LLM |
| Mistral Small 3.2 24B (multimodal) | mistralai/Mistral-Small-3.2-24B-Instruct-2506 |
48 GB | 60 GB | GPU-S | LLM |
| Gemma 3 27B (multimodal) 🔒 محدود | google/gemma-3-27b-it |
54 GB | 64 GB | GPU-L | LLM |
| Gemma 3 12B (multimodal) 🔒 محدود | google/gemma-3-12b-it |
24 GB | 28 GB | GPU-S | LLM |
| Phi-4 (14B) | microsoft/phi-4 |
28 GB | 32 GB | GPU-S | LLM |
| Phi-4 Mini Instruct (3.8B) | microsoft/Phi-4-mini-instruct |
8 GB | 10 GB | GPU-S | LLM |
| FLUX.1 [dev] 🔒 محدود | black-forest-labs/FLUX.1-dev |
24 GB | 24 GB | GPU-S | تصویر |
| FLUX.1 [schnell] | black-forest-labs/FLUX.1-schnell |
24 GB | 24 GB | GPU-S | تصویر |
| FLUX.1 Kontext [dev] (image editing) 🔒 محدود | black-forest-labs/FLUX.1-Kontext-dev |
24 GB | 24 GB | GPU-S | تصویر |
| Stable Diffusion 3.5 Large 🔒 محدود | stabilityai/stable-diffusion-3.5-large |
16 GB | 18 GB | GPU-S | تصویر |
| Stable Diffusion 3.5 Medium 🔒 محدود | stabilityai/stable-diffusion-3.5-medium |
5 GB | 10 GB | GPU-S | تصویر |
| HiDream-I1 Full | HiDream-ai/HiDream-I1-Full |
34 GB | 40 GB | GPU-S | تصویر |
| Wan 2.2 T2V A14B | Wan-AI/Wan2.2-T2V-A14B |
28 GB | 40 GB | GPU-S | ویدیو |
| Wan 2.1 T2V 1.3B (low VRAM) | Wan-AI/Wan2.1-T2V-1.3B |
3 GB | 8 GB | GPU-S | ویدیو |
| HunyuanVideo 1.5 (8.3B) | tencent/HunyuanVideo-1.5 |
17 GB | 24 GB | GPU-S | ویدیو |
| LTX-Video 0.9.8 13B | Lightricks/LTX-Video |
26 GB | 24 GB | GPU-S | ویدیو |
| CogVideoX-5B | zai-org/CogVideoX-5b |
10 GB | 16 GB | GPU-S | ویدیو |
| Whisper Large v3 Turbo | openai/whisper-large-v3-turbo |
2 GB | 4 GB | GPU-S | صدا |
| Whisper Large v3 | openai/whisper-large-v3 |
3 GB | 6 GB | GPU-S | صدا |
| Kokoro 82M (TTS) | hexgrad/Kokoro-82M |
1 GB | 2 GB | GPU-S | صدا |
| Sesame CSM-1B (conversational TTS) | sesame/csm-1b |
2 GB | 6 GB | GPU-S | صدا |
| Stable Audio Open 1.0 🔒 محدود | stabilityai/stable-audio-open-1.0 |
3 GB | 8 GB | GPU-S | صدا |
اندازهها وزنهای FP16 هستند. برای RTX 4090 (24 گیگابایت VRAM) با مدلهای 70B، نسخه AWQ-quantised بهطور خودکار و موازی دانلود میشود.
پرداخت فقط با رمزارز، Monero بومی، ثبتنام فقط با توکن، پشتههای هوش مصنوعی از پیش نصبشده، مدلهای HuggingFace از پیش دانلودشده، توکنهای HF رمزنگاریشده، endpoint های خودکار Let's Encrypt، پهنای باند نامحدود، و ۱۰۰٪ انرژی تجدیدپذیر در Iceland — ردیف ServPrivacy را بخوانید و خودتان قضاوت کنید.
| ویژگی | ServPrivacy | Vast.ai | RunPod | Paperspace | Lambda | TensorDock |
|---|---|---|---|---|---|---|
| پرداخت فقط با رمزارز | ✅ 20 coins | ⚠️ BTC | ⚠️ Gateway | ❌ | ❌ | ⚠️ BTC/ETH/USDT |
| Monero (XMR) بومی | ✅ | ❌ | ❌ | ❌ | ❌ | ❌ |
| بدون KYC، ثبتنام بدون ایمیل | ✅ Token-only | ⚠️ Email + ID for trust | ⚠️ Email + payment | ❌ Full KYC | ❌ Enterprise KYC | ⚠️ Email + light KYC |
| پشتههای هوش مصنوعی از پیش نصبشده | ✅ 17 templates | ⚠️ Docker BYO | ✅ 100+ | ⚠️ Notebooks only | ⚠️ Lambda Stack only | ⚠️ Docker BYO |
| مدلهای از پیش دانلودشده در زمان سفارش | ✅ 27 models | ❌ | ❌ | ❌ | ❌ | ❌ |
| توکن HuggingFace در زمان سفارش | ✅ Encrypted, used once | ❌ | ❌ | ❌ | ❌ | ❌ |
| کلید SSH در زمان سفارش | ✅ | ✅ | ✅ | ⚠️ | ✅ | ⚠️ |
| تایمر خاموششدن خودکار | ✅ 6h-7d | ✅ | ⚠️ Spot only | ❌ | ❌ | ❌ |
| Endpoint عمومی HTTPS (Let's Encrypt) | ✅ Auto | ⚠️ Manual | ✅ Pods | ✅ | ❌ | ⚠️ Manual |
| پهنای باند نامحدود | ✅ | ⚠️ Per host | ⚠️ Capped | ⚠️ Capped | ⚠️ Capped | ⚠️ Per host |
| دیتاسنتر با انرژی تجدیدپذیر | ✅ Iceland 100% geo+hydro | ❌ Variable | ⚠️ US grid | ⚠️ US grid | ⚠️ US grid | ⚠️ Variable |
| حوزه قضایی برونمرزی | ✅ IS / NL / RO / MD | ❌ Distributed P2P | ❌ US-centric | ❌ US | ❌ US-only | ⚠️ Multi-region |
| حالت اجرای آزمایشی Sandbox | ✅ ?dry_run=1 | ⚠️ Trial credit | ⚠️ Limited | ⚠️ Free GPU tier | ❌ | ❌ |
| اول عامل هوش مصنوعی / MCP | ✅ MCP + REST + x402 | ⚠️ REST | ⚠️ REST | ⚠️ REST | ⚠️ REST | ⚠️ REST |
| ورودی RTX 4090 / ماه | $122.00 | ~$216 spot | ~$396 on-demand | n/a | n/a | ~$252 spot |
دادههای مقایسه از صفحات قیمتگذاری عمومی و جریانهای ثبتنام رقبا از 2026-05 گرفته شده است. ورودی ServPrivacy RTX 4090 = 249 دلار در ماه Moldova؛ قیمتهای «اسپات» رقبا میانگین سختافزار معادل هستند.
passthrough سختافزاری کامل. کل کارت فیزیکی NVIDIA با دسترسی مستقیم VRAM دریافت میکنید — نه یک برش vGPU، نه یک پارتیشن MIG با زمان مشترک. nvidia-smi داخل VM همان اعداد هاست فلزی را نشان میدهد. دسترسی کامل راننده، CUDA کامل، PyTorch / TensorFlow stack کامل — بدون رزرواسیون SR-IOV.
تصویر پیشفرض: Ubuntu 22.04 + CUDA 12.4 + cuDNN 9 + NVIDIA driver 550. سایر تصاویر آماده: Ubuntu 24.04 + CUDA 12.6، Ubuntu 22 + PyTorch 2.5، Ubuntu 22 + ComfyUI + Flux، Ubuntu 22 + Ollama + Open WebUI. Ubuntu / Debian / AlmaLinux / Rocky ساده هم ارائه میشود اگر میخواهید stack خودتان را نصب کنید. میتوانید نسخه راننده را هر زمان به عنوان root کامل تغییر دهید.
بله. بسیاری از مشتریان GPU ما APIهای استنتاج عمومی روی vLLM / TGI / FastAPI اجرا میکنند. سرورهای GPU با دسترسی کامل root، صورتحساب ماهانه قابل پیشبینی (بدون غافلگیری هر توکن) و IP حوزه قضایی ثابت ارائه میشوند. پهنای باند در هر طرح GPU نامحدود است، پس میتوانید endpointهای عمومی پرترافیک را بدون نگرانی از متر یا پرداخت هزینه اضافی ارائه دهید.
H100، A100 و کارتهای RTX سطح بالا (4090 و بالاتر) NVIDIA تحت کنترلهای صادراتی وزارت بازرگانی آمریکا (15 CFR Part 744) و مقررات دوگانه EU هستند که ارسال به مراکز داده روسیه را ممنوع میکند. ما آنها را در Russia برای رعایت کنترلهایی که برای زنجیره تأمین ما اعمال میشود، تأمین نمیکنیم. اگر به Linux VPS یا اختصاصی برونمرزی در Russia نیاز دارید، آن خطوط محصول تحت تأثیر نیستند.
دیتاسنترهای Iceland با ۱۰۰٪ انرژی تجدیدپذیر زمینگرمایی و آبی کار میکنند، و دمای محیطی پایین بهطور واقعی سربار خنککاری سرورهای H100 را که هر کدام زیر بار پایدار ۷۰۰ وات مصرف میکنند، کاهش میدهد. نتیجه نهایی، کمکربنترین پردازش GPU برونمرزی در بازار است. قیمت بالاتر، هزینه بیشتر دیتاسنتر در Iceland و تأمین انرژی پاکتر را پوشش میدهد — برای تیمهای هوش مصنوعی با رویکرد ESG، این تنها پاسخ معتبر برونمرزی است.
بله — سطح GPU-XL شامل ۲× H100 SXM5 با اتصال NVLink درون یک سرور است که برای FSDP / DeepSpeed Zero-3 / DDP روی یک ماشین ایدهآل است. برای آموزش چندگرهای میتوانید چند سرور GPU-XL در همان دیتاسنتر اجاره کنید و آنها را از طریق لینک ۱۰ Gbps متصل کنید. در حال حاضر کلاسترهای ۸× H100 ارائه نمیدهیم — اگر آموزش شما به مقیاس بیشتری نیاز دارد، با ما تماس بگیرید.
حوزه قضاییتان را انتخاب کنید، GPU NVIDIAتان را انتخاب کنید، با هر یک از ۲۰ ارز دیجیتال پرداخت کنید. JupyterLab زنده در کمتر از ۶۰ ثانیه. بدون KYC، بدون ایمیل، بدون تلفن — فقط یک توکن.
مشاهده طرحهای GPU