خانه / هاستینگ GPU AI
RTX 4090 · RTX 5090 · H100 SXM5 · CUDA 12

هاستینگ GPU AI ناشناس برون‌مرزی، بدون KYC

سرورهای GPU NVIDIA RTX 4090، RTX 5090 و H100 SXM5 برای آموزش هوش مصنوعی، استنتاج، تولید تصویر و ویدیو. CUDA 12 و cuDNN از پیش نصب‌شده، به‌علاوه پیش‌تنظیم‌های PyTorch / ComfyUI / Ollama آماده اتصال SSH. هاست‌های Threadripper Pro در سطوح H100 برای تعداد کامل خط PCIe Gen 5. در ۴ حوزه قضایی برون‌مرزی موجود است، بدون KYC، پرداخت فقط با ارز دیجیتال در ۲۰ ارز از جمله Monero.

بدون احراز هویت
فقط ارز دیجیتال
CUDA 12
IP های تمیز
دسترسی کامل Root
Monero accepted
همه طرح‌های GPU

طرح‌های GPU بر اساس مکان

همان سخت‌افزار NVIDIA در هر حوزه قضایی با پهنای باند نامحدود در هر طرح. قیمت‌گذاری بسته به حوزه قضایی متفاوت است — Iceland کم‌کربن‌ترین گزینه است، Moldova ارزان‌ترین.

ایسلند پناهگاه آزادی بیان

پلانGPUVRAMCPURAMNVMeپهنای باندقیمت
IS-S 1× NVIDIA RTX 4090 24 GB GDDR6X 12 vCPU 64 GB DDR5 1 TB NVMe نامحدود $146.50/mo سفارش
IS-M محبوب 1× NVIDIA RTX 5090 32 GB GDDR7 16 vCPU 96 GB DDR5 1.5 TB NVMe نامحدود $234.50/mo سفارش
IS-L 1× NVIDIA H100 SXM5 80 GB HBM3 24 vCPU 192 GB DDR5 2 TB NVMe نامحدود $906.00/mo سفارش
IS-XL 2× NVIDIA H100 SXM5 160 GB HBM3 32 vCPU 384 GB DDR5 4 TB NVMe نامحدود $1714.50/mo سفارش

مولداوی برون‌مرزی اقتصادی

پلانGPUVRAMCPURAMNVMeپهنای باندقیمت
MD-S 1× NVIDIA RTX 4090 24 GB GDDR6X 12 vCPU 64 GB DDR5 1 TB NVMe نامحدود $122.00/mo سفارش
MD-M محبوب 1× NVIDIA RTX 5090 32 GB GDDR7 16 vCPU 96 GB DDR5 1.5 TB NVMe نامحدود $195.50/mo سفارش
MD-L 1× NVIDIA H100 SXM5 80 GB HBM3 24 vCPU 192 GB DDR5 2 TB NVMe نامحدود $832.50/mo سفارش
MD-XL 2× NVIDIA H100 SXM5 160 GB HBM3 32 vCPU 384 GB DDR5 4 TB NVMe نامحدود $1567.50/mo سفارش

رومانی ضد نگهداری داده

پلانGPUVRAMCPURAMNVMeپهنای باندقیمت
RO-S 1× NVIDIA RTX 4090 24 GB GDDR6X 12 vCPU 64 GB DDR5 1 TB NVMe نامحدود $132.00/mo سفارش
RO-M محبوب 1× NVIDIA RTX 5090 32 GB GDDR7 16 vCPU 96 GB DDR5 1.5 TB NVMe نامحدود $210.00/mo سفارش
RO-L 1× NVIDIA H100 SXM5 80 GB HBM3 24 vCPU 192 GB DDR5 2 TB NVMe نامحدود $857.00/mo سفارش
RO-XL 2× NVIDIA H100 SXM5 160 GB HBM3 32 vCPU 384 GB DDR5 4 TB NVMe نامحدود $1616.50/mo سفارش

هلند بهترین پیرینگ

پلانGPUVRAMCPURAMNVMeپهنای باندقیمت
NL-S 1× NVIDIA RTX 4090 24 GB GDDR6X 12 vCPU 64 GB DDR5 1 TB NVMe نامحدود $136.50/mo سفارش
NL-M محبوب 1× NVIDIA RTX 5090 32 GB GDDR7 16 vCPU 96 GB DDR5 1.5 TB NVMe نامحدود $220.00/mo سفارش
NL-L 1× NVIDIA H100 SXM5 80 GB HBM3 24 vCPU 192 GB DDR5 2 TB NVMe نامحدود $881.50/mo سفارش
NL-XL 2× NVIDIA H100 SXM5 160 GB HBM3 32 vCPU 384 GB DDR5 4 TB NVMe نامحدود $1665.50/mo سفارش

هاستینگ GPU در ۴ حوزه قضایی در زمان راه‌اندازی موجود است (Iceland، Netherlands، Romania، Moldova). Russia به دلیل تحریم‌های صادراتی NVIDIA حذف شده؛ Switzerland و Panama فعلاً فقط Linux نگه داشته می‌شوند.

موجود در هر سرور GPU

CUDA 12

CUDA 12.4/12.6 + cuDNN از پیش نصب‌شده. بوت کنید، SSH بزنید، nvidia-smi اجرا کنید.

استقرار ۶۰ ثانیه‌ای

از سفارش پرداخت‌شده تا خروجی nvidia-smi در کمتر از ۶۰ ثانیه.

NVMe SSD

تا ۴ TB NVMe SSD، همراه با DDR5 RAM برای I/O سریع مجموعه داده.

SSH + Jupyter

SSH با دسترسی کامل root، به‌علاوه JupyterLab از پیش متصل‌شده روی پورت ۸۸۸۸ با احراز هویت توکن.

موارد استفاده

What GPU AI Hosting is Used For

فاین‌تیونینگ و استنتاج LLM

فاین‌تیونینگ Llama، Mistral، Qwen، DeepSeek با LoRA / QLoRA / FT کامل روی H100. یا استنتاج خود-میزبان با vLLM / TGI / Ollama برای ارائه مدل در تولید.

تولید تصویر

Stable Diffusion، FLUX.1، SDXL با ComfyUI یا Forge. LoRA خودتان را آموزش دهید، در مقیاس دسته‌ای تولید کنید، یا یک endpoint استنتاج خود-میزبان راه‌اندازی کنید.

تولید ویدیوی هوش مصنوعی

OpenSora، CogVideoX، Wan-2.1، AnimateDiff. تولید ویدیو به VRAM جدی نیاز دارد — از RTX 5090 (32 GB) یا H100 (80 GB) شروع کنید.

استنتاج تولیدی

مدل‌های فاین‌تیون‌شده را پشت API خودتان مستقر کنید. هزینه‌های قابل پیش‌بینی، بدون کارمزد هر توکن، بدون خروج داده از حوزه قضایی شما. JupyterLab + FastAPI گنجانده شده.

استقرار تک‌کلیکی

قالب‌های هوش مصنوعی از پیش نصب‌شده

گزینه‌های مورد نظر را در زمان سفارش علامت بزنید و سرور GPU شما با پشته‌ای که قبلاً نصب، پیکربندی و از طریق systemd راه‌اندازی شده است بوت می‌شود. مدل‌های از پیش دانلود‌شده را در پایین فعال کنید تا دانلود ۳۰ تا ۶۰ دقیقه‌ای HuggingFace را نیز بگذارید.

استنتاج LLM

vLLM (OpenAI-compatible)

Production-grade LLM serving with continuous batching and paged attention. Exposes an /v1/completions endpoint compatible with the OpenAI SDK.

LLMOpenAI APIproduction 16 GB+
استنتاج LLM

Ollama + Open WebUI

Self-hosted ChatGPT-style web UI. Pulls Ollama-native quantized weights; easiest path to "talk to my LLM in a browser".

LLMchat UIbeginner 8 GB+
استنتاج LLM

text-generation-webui (Oobabooga)

Gradio UI with broad backend support — Transformers, ExLlamaV2, llama.cpp, AWQ, GPTQ. Power-user choice for benchmarking quantizations.

LLMmulti-backendpower user 16 GB+
استنتاج LLM

HuggingFace TGI

HuggingFace Text Generation Inference — production server with token streaming, tensor parallelism, paged attention.

LLMproductionHuggingFace 24 GB+
فاین‌تیون

Axolotl (LLM finetuning)

YAML-config driven finetuning. Supports LoRA, QLoRA, full FT, DPO, ORPO. Pre-cloned to /opt/axolotl with starter configs for Llama / Qwen / Mistral.

finetuneLoRAQLoRA 24 GB+
فاین‌تیون

Unsloth (2× faster finetune)

2× faster + 70% less VRAM finetuning via custom Triton kernels. Ideal for budget runs on RTX 4090. Pre-installed in /opt/unsloth.

finetunefastlow VRAM 16 GB+
فاین‌تیون

LLaMA-Factory

WebUI-driven finetuning platform. SFT / RLHF / DPO / KTO. Good entry point for non-coders who want to finetune on a UI.

finetuneGUI 24 GB+
تولید تصویر

ComfyUI + FLUX.1

Node-graph image-gen interface, ships with FLUX.1-schnell + Kontext workflows. Power-user image generation pipeline.

imageFLUXworkflow 24 GB+
تولید تصویر

Automatic1111 + SD 3.5

The mainstream Stable Diffusion WebUI. Stable Diffusion 3.5 + extensions ecosystem. Familiar UI for users coming from civitai.

imageSD 3.5 16 GB+
تولید تصویر

Forge (faster A1111)

A1111 fork optimized for FLUX, faster sampling, lower VRAM. Drop-in replacement for users coming from Auto1111.

imageFLUXfast 16 GB+
تولید تصویر

Kohya SS (LoRA training)

GUI for training Stable Diffusion / FLUX LoRA, DreamBooth, textual inversion. Trains a custom-style LoRA on RTX 4090 in 30-90 min.

LoRA trainingimageGUI 16 GB+
ویدیوی هوش مصنوعی

ComfyUI + Wan 2.2 / HunyuanVideo

ComfyUI with video-gen workflows preloaded — Wan 2.2 T2V, HunyuanVideo, LTX-Video. Needs 40+ GB VRAM for usable speed at 720p.

videoWan 2.2HunyuanVideo 40 GB+
ویدیوی هوش مصنوعی

ComfyUI Video Lite (CogVideoX / LTX)

Lightweight video workflows — CogVideoX-5B, Wan 2.1 1.3B, LTX-Video. Runs on a single RTX 4090.

videoCogVideoXlow VRAM 16 GB+
صدا

Whisper Large v3 Turbo server

OpenAI Whisper Large v3 Turbo with faster-whisper backend behind a /transcribe HTTP API. 8× faster than v3, 99 langs, real-time on any GPU.

audiospeech-to-textAPI 6 GB+
صدا

TTS server (Kokoro + CSM-1B)

Multi-model TTS endpoint serving Kokoro 82M (54 voices, 8 langs) and Sesame CSM-1B (conversational with context). REST + WebSocket streaming.

audiotext-to-speechAPI 6 GB+
نوت‌بوک‌ها و توسعه

JupyterLab + PyTorch baseline

Always installed. PyTorch 2.5 + CUDA 12.4 + Transformers + diffusers + accelerate + bitsandbytes + xformers + flash-attn. The universal AI dev baseline.

notebookbaselinealways-on 0 GB+
نوت‌بوک‌ها و توسعه

code-server (VSCode in browser)

VSCode running in your browser, full Python/IPython/extensions. For users who prefer IDE workflow over notebooks.

IDEVSCodedev 0 GB+

چندین پشته را روی همان GPU ترکیب کنید — اسکریپت استقرار تعارض‌های وابستگی را حل می‌کند و پورت‌های غیرمتعارض را تخصیص می‌دهد.

از دانلود صرف‌نظر کنید

مدل‌های open-weight از پیش دانلود‌شده

مدل‌های مورد نیاز را در زمان سفارش علامت بزنید و آن‌ها قبل از ورود شما در /root/.cache/huggingface کش می‌شوند. مدل‌های 🔒 محدود (Llama، Mistral، Gemma، FLUX-dev، SD 3.5) به توکن HuggingFace شما نیاز دارند (همچنین در زمان سفارش درخواست می‌شود).

مدل HuggingFace اندازه حداقل VRAM حداقل سطح GPU نوع
Llama 3.3 70B Instruct 🔒 محدود meta-llama/Llama-3.3-70B-Instruct 140 GB 160 GB GPU-L LLM
Qwen3 32B Qwen/Qwen3-32B 64 GB 80 GB GPU-L LLM
Qwen3 14B Qwen/Qwen3-14B 28 GB 32 GB GPU-S LLM
Qwen3 8B Qwen/Qwen3-8B 16 GB 20 GB GPU-S LLM
DeepSeek-R1 Distill Qwen 32B deepseek-ai/DeepSeek-R1-Distill-Qwen-32B 64 GB 80 GB GPU-S LLM
DeepSeek-R1 Distill Llama 70B deepseek-ai/DeepSeek-R1-Distill-Llama-70B 140 GB 160 GB GPU-S LLM
Mistral Small 3.2 24B (multimodal) mistralai/Mistral-Small-3.2-24B-Instruct-2506 48 GB 60 GB GPU-S LLM
Gemma 3 27B (multimodal) 🔒 محدود google/gemma-3-27b-it 54 GB 64 GB GPU-L LLM
Gemma 3 12B (multimodal) 🔒 محدود google/gemma-3-12b-it 24 GB 28 GB GPU-S LLM
Phi-4 (14B) microsoft/phi-4 28 GB 32 GB GPU-S LLM
Phi-4 Mini Instruct (3.8B) microsoft/Phi-4-mini-instruct 8 GB 10 GB GPU-S LLM
FLUX.1 [dev] 🔒 محدود black-forest-labs/FLUX.1-dev 24 GB 24 GB GPU-S تصویر
FLUX.1 [schnell] black-forest-labs/FLUX.1-schnell 24 GB 24 GB GPU-S تصویر
FLUX.1 Kontext [dev] (image editing) 🔒 محدود black-forest-labs/FLUX.1-Kontext-dev 24 GB 24 GB GPU-S تصویر
Stable Diffusion 3.5 Large 🔒 محدود stabilityai/stable-diffusion-3.5-large 16 GB 18 GB GPU-S تصویر
Stable Diffusion 3.5 Medium 🔒 محدود stabilityai/stable-diffusion-3.5-medium 5 GB 10 GB GPU-S تصویر
HiDream-I1 Full HiDream-ai/HiDream-I1-Full 34 GB 40 GB GPU-S تصویر
Wan 2.2 T2V A14B Wan-AI/Wan2.2-T2V-A14B 28 GB 40 GB GPU-S ویدیو
Wan 2.1 T2V 1.3B (low VRAM) Wan-AI/Wan2.1-T2V-1.3B 3 GB 8 GB GPU-S ویدیو
HunyuanVideo 1.5 (8.3B) tencent/HunyuanVideo-1.5 17 GB 24 GB GPU-S ویدیو
LTX-Video 0.9.8 13B Lightricks/LTX-Video 26 GB 24 GB GPU-S ویدیو
CogVideoX-5B zai-org/CogVideoX-5b 10 GB 16 GB GPU-S ویدیو
Whisper Large v3 Turbo openai/whisper-large-v3-turbo 2 GB 4 GB GPU-S صدا
Whisper Large v3 openai/whisper-large-v3 3 GB 6 GB GPU-S صدا
Kokoro 82M (TTS) hexgrad/Kokoro-82M 1 GB 2 GB GPU-S صدا
Sesame CSM-1B (conversational TTS) sesame/csm-1b 2 GB 6 GB GPU-S صدا
Stable Audio Open 1.0 🔒 محدود stabilityai/stable-audio-open-1.0 3 GB 8 GB GPU-S صدا

اندازه‌ها وزن‌های FP16 هستند. برای RTX 4090 (24 گیگابایت VRAM) با مدل‌های 70B، نسخه AWQ-quantised به‌طور خودکار و موازی دانلود می‌شود.

نحوه مقایسه ما

ServPrivacy در مقابل Vast.ai · RunPod · Paperspace · Lambda Labs · TensorDock

پرداخت فقط با رمزارز، Monero بومی، ثبت‌نام فقط با توکن، پشته‌های هوش مصنوعی از پیش نصب‌شده، مدل‌های HuggingFace از پیش دانلود‌شده، توکن‌های HF رمزنگاری‌شده، endpoint های خودکار Let's Encrypt، پهنای باند نامحدود، و ۱۰۰٪ انرژی تجدیدپذیر در Iceland — ردیف ServPrivacy را بخوانید و خودتان قضاوت کنید.

ویژگی ServPrivacy Vast.ai RunPod Paperspace Lambda TensorDock
پرداخت فقط با رمزارز ✅ 20 coins⚠️ BTC⚠️ Gateway⚠️ BTC/ETH/USDT
Monero (XMR) بومی
بدون KYC، ثبت‌نام بدون ایمیل ✅ Token-only⚠️ Email + ID for trust⚠️ Email + payment❌ Full KYC❌ Enterprise KYC⚠️ Email + light KYC
پشته‌های هوش مصنوعی از پیش نصب‌شده ✅ 17 templates⚠️ Docker BYO✅ 100+⚠️ Notebooks only⚠️ Lambda Stack only⚠️ Docker BYO
مدل‌های از پیش دانلود‌شده در زمان سفارش ✅ 27 models
توکن HuggingFace در زمان سفارش ✅ Encrypted, used once
کلید SSH در زمان سفارش ⚠️⚠️
تایمر خاموش‌شدن خودکار ✅ 6h-7d⚠️ Spot only
Endpoint عمومی HTTPS (Let's Encrypt) ✅ Auto⚠️ Manual✅ Pods⚠️ Manual
پهنای باند نامحدود ⚠️ Per host⚠️ Capped⚠️ Capped⚠️ Capped⚠️ Per host
دیتاسنتر با انرژی تجدیدپذیر ✅ Iceland 100% geo+hydro❌ Variable⚠️ US grid⚠️ US grid⚠️ US grid⚠️ Variable
حوزه قضایی برون‌مرزی ✅ IS / NL / RO / MD❌ Distributed P2P❌ US-centric❌ US❌ US-only⚠️ Multi-region
حالت اجرای آزمایشی Sandbox ✅ ?dry_run=1⚠️ Trial credit⚠️ Limited⚠️ Free GPU tier
اول عامل هوش مصنوعی / MCP ✅ MCP + REST + x402⚠️ REST⚠️ REST⚠️ REST⚠️ REST⚠️ REST
ورودی RTX 4090 / ماه $122.00~$216 spot~$396 on-demandn/an/a~$252 spot

داده‌های مقایسه از صفحات قیمت‌گذاری عمومی و جریان‌های ثبت‌نام رقبا از 2026-05 گرفته شده است. ورودی ServPrivacy RTX 4090 = 249 دلار در ماه Moldova؛ قیمت‌های «اسپات» رقبا میانگین سخت‌افزار معادل هستند.

سؤالات متداول

سؤالات متداول هاستینگ GPU AI

01 آیا GPU با دسترسی کامل به سخت‌افزار منتقل می‌شود، یا مشترک / vGPU تقسیم‌شده است؟

passthrough سخت‌افزاری کامل. کل کارت فیزیکی NVIDIA با دسترسی مستقیم VRAM دریافت می‌کنید — نه یک برش vGPU، نه یک پارتیشن MIG با زمان مشترک. nvidia-smi داخل VM همان اعداد هاست فلزی را نشان می‌دهد. دسترسی کامل راننده، CUDA کامل، PyTorch / TensorFlow stack کامل — بدون رزرواسیون SR-IOV.

02 کدام نسخه‌های CUDA / راننده از پیش نصب شده‌اند؟

تصویر پیش‌فرض: Ubuntu 22.04 + CUDA 12.4 + cuDNN 9 + NVIDIA driver 550. سایر تصاویر آماده: Ubuntu 24.04 + CUDA 12.6، Ubuntu 22 + PyTorch 2.5، Ubuntu 22 + ComfyUI + Flux، Ubuntu 22 + Ollama + Open WebUI. Ubuntu / Debian / AlmaLinux / Rocky ساده هم ارائه می‌شود اگر می‌خواهید stack خودتان را نصب کنید. می‌توانید نسخه راننده را هر زمان به عنوان root کامل تغییر دهید.

03 آیا می‌توانم استنتاج تولیدی استارتاپ هوش مصنوعی خودم را روی این GPU‌ها اجرا کنم؟

بله. بسیاری از مشتریان GPU ما APIهای استنتاج عمومی روی vLLM / TGI / FastAPI اجرا می‌کنند. سرورهای GPU با دسترسی کامل root، صورت‌حساب ماهانه قابل پیش‌بینی (بدون غافلگیری هر توکن) و IP حوزه قضایی ثابت ارائه می‌شوند. پهنای باند در هر طرح GPU نامحدود است، پس می‌توانید endpoint‌های عمومی پرترافیک را بدون نگرانی از متر یا پرداخت هزینه اضافی ارائه دهید.

04 چرا Russia از مکان‌های GPU حذف شده؟

H100، A100 و کارت‌های RTX سطح بالا (4090 و بالاتر) NVIDIA تحت کنترل‌های صادراتی وزارت بازرگانی آمریکا (15 CFR Part 744) و مقررات دوگانه EU هستند که ارسال به مراکز داده روسیه را ممنوع می‌کند. ما آن‌ها را در Russia برای رعایت کنترل‌هایی که برای زنجیره تأمین ما اعمال می‌شود، تأمین نمی‌کنیم. اگر به Linux VPS یا اختصاصی برون‌مرزی در Russia نیاز دارید، آن خطوط محصول تحت تأثیر نیستند.

05 چرا Iceland به عنوان موقعیت ممتاز GPU معرفی شده است؟

دیتاسنترهای Iceland با ۱۰۰٪ انرژی تجدیدپذیر زمین‌گرمایی و آبی کار می‌کنند، و دمای محیطی پایین به‌طور واقعی سربار خنک‌کاری سرورهای H100 را که هر کدام زیر بار پایدار ۷۰۰ وات مصرف می‌کنند، کاهش می‌دهد. نتیجه نهایی، کم‌کربن‌ترین پردازش GPU برون‌مرزی در بازار است. قیمت بالاتر، هزینه بیشتر دیتاسنتر در Iceland و تأمین انرژی پاک‌تر را پوشش می‌دهد — برای تیم‌های هوش مصنوعی با رویکرد ESG، این تنها پاسخ معتبر برون‌مرزی است.

06 آیا می‌توانم از چند GPU در آموزش توزیع‌شده (DDP / FSDP) استفاده کنم؟

بله — سطح GPU-XL شامل ۲× H100 SXM5 با اتصال NVLink درون یک سرور است که برای FSDP / DeepSpeed Zero-3 / DDP روی یک ماشین ایده‌آل است. برای آموزش چندگره‌ای می‌توانید چند سرور GPU-XL در همان دیتاسنتر اجاره کنید و آن‌ها را از طریق لینک ۱۰ Gbps متصل کنید. در حال حاضر کلاسترهای ۸× H100 ارائه نمی‌دهیم — اگر آموزش شما به مقیاس بیشتری نیاز دارد، با ما تماس بگیرید.

سرور GPU برون‌مرزی خود را مستقر کنید

حوزه قضایی‌تان را انتخاب کنید، GPU NVIDIA‌تان را انتخاب کنید، با هر یک از ۲۰ ارز دیجیتال پرداخت کنید. JupyterLab زنده در کمتر از ۶۰ ثانیه. بدون KYC، بدون ایمیل، بدون تلفن — فقط یک توکن.

مشاهده طرح‌های GPU