Tinh chỉnh & inference LLM
Tinh chỉnh Llama, Mistral, Qwen, DeepSeek với LoRA / QLoRA / full FT trên H100. Hoặc inference tự host với vLLM / TGI / Ollama cho serving mô hình production.
Máy chủ NVIDIA GPU offshore tại Netherlands từ $136.50/tháng. Card RTX 4090, RTX 5090 và H100 SXM5 được passthrough qua KVM với full root. CUDA 12 + cuDNN được cài sẵn, các preset image PyTorch / ComfyUI / Ollama sẵn sàng ssh vào. Thanh toán chỉ bằng crypto, không KYC, không email — chỉ cần một token tài khoản.
Netherlands cho bạn tính toán GPU độ trễ thấp nhất trong mạng của chúng tôi nhờ peering AMS-IX. Nếu bạn phục vụ mô hình AI cho người dùng châu Âu (inference dưới 10ms đến Tây Âu) hoặc kéo dataset lớn từ các model registry châu Âu, đây là vị trí nên chọn. Băng thông AMS-IX cũng rẻ nhất trên mỗi TB trong mạng của chúng tôi.
Tất cả gói đều bao gồm CUDA 12 + cuDNN được cài sẵn, NVMe SSD, DDR5 RAM, full root access, SSH + JupyterLab và băng thông không giới hạn.
| Gói | GPU | VRAM | CPU | RAM | NVMe | Băng thông | Giá | |
|---|---|---|---|---|---|---|---|---|
| NL-S | 1× NVIDIA RTX 4090 | 24 GB GDDR6X | 12 vCPU | 64 GB DDR5 | 1 TB NVMe | Không giới hạn | $136.50/mo | Đặt hàng |
| NL-M Phổ biến | 1× NVIDIA RTX 5090 | 32 GB GDDR7 | 16 vCPU | 96 GB DDR5 | 1.5 TB NVMe | Không giới hạn | $220.00/mo | Đặt hàng |
| NL-L | 1× NVIDIA H100 SXM5 | 80 GB HBM3 | 24 vCPU | 192 GB DDR5 | 2 TB NVMe | Không giới hạn | $881.50/mo | Đặt hàng |
| NL-XL | 2× NVIDIA H100 SXM5 | 160 GB HBM3 | 32 vCPU | 384 GB DDR5 | 4 TB NVMe | Không giới hạn | $1665.50/mo | Đặt hàng |
Máy chủ GPU tỏa sáng với các workload tăng tốc theo VRAM và tensor core — tinh chỉnh và inference LLM, tạo ảnh diffusion, video AI, và serving mô hình thông lượng cao.
Tinh chỉnh Llama, Mistral, Qwen, DeepSeek với LoRA / QLoRA / full FT trên H100. Hoặc inference tự host với vLLM / TGI / Ollama cho serving mô hình production.
Stable Diffusion, FLUX.1, SDXL với ComfyUI hoặc Forge. Huấn luyện LoRA riêng, tạo hàng loạt theo quy mô, hoặc tự host endpoint inference.
OpenSora, CogVideoX, Wan-2.1, AnimateDiff. Tạo video cần VRAM nghiêm túc — bắt đầu từ RTX 5090 (32 GB) hoặc H100 (80 GB).
Triển khai các mô hình đã tinh chỉnh sau API riêng của bạn. Chi phí dự đoán được, không phí theo token, không dữ liệu rời khỏi vùng tài phán của bạn. Đã bao gồm JupyterLab + FastAPI.
RTX 4090 (24 GB), RTX 5090 (32 GB), H100 SXM5 (80 GB), 2× H100 (160 GB).
Lên đến 4 TB NVMe SSD, kết hợp với DDR5 RAM để I/O dataset nhanh.
Từ đơn hàng đã thanh toán đến output nvidia-smi trong dưới 60 giây.
Full root SSH, cộng với JupyterLab được bind sẵn trên cổng 8888 với xác thực token.
Netherlands cung cấp kết nối mạng tốt nhất châu Âu qua AMS-IX. Độ trễ dưới 10ms tới hầu hết Tây Âu, dung lượng băng thông xuất sắc và môi trường hosting khoan dung theo lịch sử.
Netherlands là thành viên EU nên GDPR áp dụng. Tuy nhiên, ServPrivacy không thu thập dữ liệu cá nhân, vì vậy tuân thủ GDPR được tích hợp vào kiến trúc không-dữ-liệu của chúng tôi. Không có dữ liệu cá nhân đồng nghĩa với không có rủi ro GDPR.
Cực kỳ nhanh. Kết nối AMS-IX mang lại độ trễ dưới 10ms tới Tây Âu và kết nối toàn cầu xuất sắc. Máy chủ Hà Lan của chúng tôi đi kèm với uplink lên đến 10 Gbps và băng thông không giới hạn.
Luật bảo vệ quyền riêng tư mạnh, năng lượng tái tạo, ngoài EU.
Quy định nhẹ, giá thấp, hợp tác quốc tế tối thiểu.
Tòa án đã bãi bỏ luật lưu giữ dữ liệu. Kết nối EU tuyệt vời.
Thanh toán bằng BTC, XMR, ETH, USDT hoặc 10 chuỗi khác. SSH + JupyterLab trên GPU NVIDIA thực tại Netherlands trong dưới 60 giây.