Tinh chỉnh & inference LLM
Tinh chỉnh Llama, Mistral, Qwen, DeepSeek với LoRA / QLoRA / full FT trên H100. Hoặc inference tự host với vLLM / TGI / Ollama cho serving mô hình production.
Máy chủ NVIDIA GPU offshore tại Moldova từ $122.00/tháng. Card RTX 4090, RTX 5090 và H100 SXM5 được passthrough qua KVM với full root. CUDA 12 + cuDNN được cài sẵn, các preset image PyTorch / ComfyUI / Ollama sẵn sàng ssh vào. Thanh toán chỉ bằng crypto, không KYC, không email — chỉ cần một token tài khoản.
Moldova là tầng GPU ngân sách trong mạng của chúng tôi. Cùng phần cứng NVIDIA, nhưng chi phí điện thấp hơn và khung pháp lý tối giản cho phép chúng tôi định giá các gói GPU thấp hơn Romania 10-15% và thấp hơn Iceland 15-25%. Dùng vùng tài phán này khi chi phí mỗi token quan trọng hơn peering hay tư thế marketing.
Tất cả gói đều bao gồm CUDA 12 + cuDNN được cài sẵn, NVMe SSD, DDR5 RAM, full root access, SSH + JupyterLab và băng thông không giới hạn.
| Gói | GPU | VRAM | CPU | RAM | NVMe | Băng thông | Giá | |
|---|---|---|---|---|---|---|---|---|
| MD-S | 1× NVIDIA RTX 4090 | 24 GB GDDR6X | 12 vCPU | 64 GB DDR5 | 1 TB NVMe | Không giới hạn | $122.00/mo | Đặt hàng |
| MD-M Phổ biến | 1× NVIDIA RTX 5090 | 32 GB GDDR7 | 16 vCPU | 96 GB DDR5 | 1.5 TB NVMe | Không giới hạn | $195.50/mo | Đặt hàng |
| MD-L | 1× NVIDIA H100 SXM5 | 80 GB HBM3 | 24 vCPU | 192 GB DDR5 | 2 TB NVMe | Không giới hạn | $832.50/mo | Đặt hàng |
| MD-XL | 2× NVIDIA H100 SXM5 | 160 GB HBM3 | 32 vCPU | 384 GB DDR5 | 4 TB NVMe | Không giới hạn | $1567.50/mo | Đặt hàng |
Máy chủ GPU tỏa sáng với các workload tăng tốc theo VRAM và tensor core — tinh chỉnh và inference LLM, tạo ảnh diffusion, video AI, và serving mô hình thông lượng cao.
Tinh chỉnh Llama, Mistral, Qwen, DeepSeek với LoRA / QLoRA / full FT trên H100. Hoặc inference tự host với vLLM / TGI / Ollama cho serving mô hình production.
Stable Diffusion, FLUX.1, SDXL với ComfyUI hoặc Forge. Huấn luyện LoRA riêng, tạo hàng loạt theo quy mô, hoặc tự host endpoint inference.
OpenSora, CogVideoX, Wan-2.1, AnimateDiff. Tạo video cần VRAM nghiêm túc — bắt đầu từ RTX 5090 (32 GB) hoặc H100 (80 GB).
Triển khai các mô hình đã tinh chỉnh sau API riêng của bạn. Chi phí dự đoán được, không phí theo token, không dữ liệu rời khỏi vùng tài phán của bạn. Đã bao gồm JupyterLab + FastAPI.
RTX 4090 (24 GB), RTX 5090 (32 GB), H100 SXM5 (80 GB), 2× H100 (160 GB).
Lên đến 4 TB NVMe SSD, kết hợp với DDR5 RAM để I/O dataset nhanh.
Từ đơn hàng đã thanh toán đến output nvidia-smi trong dưới 60 giây.
Full root SSH, cộng với JupyterLab được bind sẵn trên cổng 8888 với xác thực token.
Có. Mặc dù ít nổi tiếng hơn Iceland hay Switzerland, Moldova cung cấp cơ sở hạ tầng vững chắc với kết nối châu Âu. Môi trường pháp lý nhẹ và chi phí thấp làm cho đây là lựa chọn đáng giá cho hosting offshore.
Các gói VPS Moldova của chúng tôi bắt đầu từ $7.50/mo cho 2 vCPU, 4GB DDR4 RAM, 60GB NVMe và băng thông không giới hạn. Đây là lựa chọn giá rẻ nhất trong mạng lưới của chúng tôi.
Moldova có hợp tác tư pháp rất hạn chế với các nước phương Tây. Không có các thỏa thuận chia sẻ dữ liệu ràng buộc với Mỹ hay hầu hết các thành viên EU có ảnh hưởng đến các nhà cung cấp hosting.
Luật bảo vệ quyền riêng tư mạnh, năng lượng tái tạo, ngoài EU.
Tòa án đã bãi bỏ luật lưu giữ dữ liệu. Kết nối EU tuyệt vời.
Kết nối xuất sắc, hosting khoan dung, kết nối AMS-IX.
Thanh toán bằng BTC, XMR, ETH, USDT hoặc 10 chuỗi khác. SSH + JupyterLab trên GPU NVIDIA thực tại Moldova trong dưới 60 giây.