Tinh chỉnh & inference LLM
Tinh chỉnh Llama, Mistral, Qwen, DeepSeek với LoRA / QLoRA / full FT trên H100. Hoặc inference tự host với vLLM / TGI / Ollama cho serving mô hình production.
Máy chủ NVIDIA GPU offshore tại Romania từ $132.00/tháng. Card RTX 4090, RTX 5090 và H100 SXM5 được passthrough qua KVM với full root. CUDA 12 + cuDNN được cài sẵn, các preset image PyTorch / ComfyUI / Ollama sẵn sàng ssh vào. Thanh toán chỉ bằng crypto, không KYC, không email — chỉ cần một token tài khoản.
Romania kết hợp hạ tầng chuẩn EU với tiền lệ Tòa án Hiến pháp mạnh nhất chống lưu trữ dữ liệu trong EU. Các datacenter tại đây có peering trực tiếp đến AMS-IX và DE-CIX với độ trễ 25-30 ms đến Tây Âu — với giá Đông Âu. Điểm trung gian tốt khi bạn muốn chi phí thấp mà không từ bỏ tư thế pháp lý.
Tất cả gói đều bao gồm CUDA 12 + cuDNN được cài sẵn, NVMe SSD, DDR5 RAM, full root access, SSH + JupyterLab và băng thông không giới hạn.
| Gói | GPU | VRAM | CPU | RAM | NVMe | Băng thông | Giá | |
|---|---|---|---|---|---|---|---|---|
| RO-S | 1× NVIDIA RTX 4090 | 24 GB GDDR6X | 12 vCPU | 64 GB DDR5 | 1 TB NVMe | Không giới hạn | $132.00/mo | Đặt hàng |
| RO-M Phổ biến | 1× NVIDIA RTX 5090 | 32 GB GDDR7 | 16 vCPU | 96 GB DDR5 | 1.5 TB NVMe | Không giới hạn | $210.00/mo | Đặt hàng |
| RO-L | 1× NVIDIA H100 SXM5 | 80 GB HBM3 | 24 vCPU | 192 GB DDR5 | 2 TB NVMe | Không giới hạn | $857.00/mo | Đặt hàng |
| RO-XL | 2× NVIDIA H100 SXM5 | 160 GB HBM3 | 32 vCPU | 384 GB DDR5 | 4 TB NVMe | Không giới hạn | $1616.50/mo | Đặt hàng |
Máy chủ GPU tỏa sáng với các workload tăng tốc theo VRAM và tensor core — tinh chỉnh và inference LLM, tạo ảnh diffusion, video AI, và serving mô hình thông lượng cao.
Tinh chỉnh Llama, Mistral, Qwen, DeepSeek với LoRA / QLoRA / full FT trên H100. Hoặc inference tự host với vLLM / TGI / Ollama cho serving mô hình production.
Stable Diffusion, FLUX.1, SDXL với ComfyUI hoặc Forge. Huấn luyện LoRA riêng, tạo hàng loạt theo quy mô, hoặc tự host endpoint inference.
OpenSora, CogVideoX, Wan-2.1, AnimateDiff. Tạo video cần VRAM nghiêm túc — bắt đầu từ RTX 5090 (32 GB) hoặc H100 (80 GB).
Triển khai các mô hình đã tinh chỉnh sau API riêng của bạn. Chi phí dự đoán được, không phí theo token, không dữ liệu rời khỏi vùng tài phán của bạn. Đã bao gồm JupyterLab + FastAPI.
RTX 4090 (24 GB), RTX 5090 (32 GB), H100 SXM5 (80 GB), 2× H100 (160 GB).
Lên đến 4 TB NVMe SSD, kết hợp với DDR5 RAM để I/O dataset nhanh.
Từ đơn hàng đã thanh toán đến output nvidia-smi trong dưới 60 giây.
Full root SSH, cộng với JupyterLab được bind sẵn trên cổng 8888 với xác thực token.
Có. Tòa án Hiến pháp Romania đã bãi bỏ các luật lưu giữ dữ liệu nhiều lần, tạo ra án lệ pháp lý mạnh mẽ. Các nhà cung cấp hosting tại Romania không bắt buộc phải lưu giữ dữ liệu người dùng, khiến đây là một trong những thành viên EU thân thiện với quyền riêng tư nhất.
Romania kết hợp cơ sở hạ tầng và kết nối mạng chuẩn EU với án lệ chống lưu giữ dữ liệu. Bạn nhận được hiệu suất Tây Âu với giá Đông Âu, không cần ghi logs dữ liệu bắt buộc.
Có. Romania có kết nối xuất sắc tới các điểm trao đổi châu Âu lớn. Độ trễ tới Tây Âu thường dưới 30ms, lý tưởng cho các ứng dụng đòi hỏi hiệu suất cao.
Luật bảo vệ quyền riêng tư mạnh, năng lượng tái tạo, ngoài EU.
Quy định nhẹ, giá thấp, hợp tác quốc tế tối thiểu.
Kết nối xuất sắc, hosting khoan dung, kết nối AMS-IX.
Thanh toán bằng BTC, XMR, ETH, USDT hoặc 10 chuỗi khác. SSH + JupyterLab trên GPU NVIDIA thực tại Romania trong dưới 60 giây.