Ajuste fino e inferência de LLM
Ajuste fino de Llama, Mistral, Qwen, DeepSeek com LoRA / QLoRA / FT completo no H100. Ou inferência self-hosted com vLLM / TGI / Ollama para serving de modelos em produção.
Servidores GPU NVIDIA offshore em Países Baixos a partir de $279/mês. Placas RTX 4090, RTX 5090 e H100 SXM5 em passthrough KVM com root completo. CUDA 12 + cuDNN pré-instalados, presets de imagem PyTorch / ComfyUI / Ollama prontos para SSH. Checkout apenas em cripto, sem KYC, sem e-mail — apenas um token de conta.
Netherlands oferece a computação GPU de menor latência da nossa rede graças ao peering AMS-IX. Se você serve modelos de IA para usuários europeus (inferência abaixo de 10ms para a Europa Ocidental) ou baixa grandes datasets de registros europeus de modelos, esta é a localização a escolher. A largura de banda AMS-IX também é a mais barata por TB da nossa rede.
Todos os planos incluem CUDA 12 + cuDNN pré-instalados, NVMe SSD, DDR5 RAM, acesso root completo, SSH + JupyterLab e largura de banda ilimitada.
| Plano | GPU | VRAM | CPU | RAM | NVMe | Banda | Preço | |
|---|---|---|---|---|---|---|---|---|
| NL-S | 1× NVIDIA RTX 4090 | 24 GB GDDR6X | 12 vCPU | 64 GB DDR5 | 1 TB NVMe | Ilimitado | $279/mo | Contratar |
| NL-M Popular | 1× NVIDIA RTX 5090 | 32 GB GDDR7 | 16 vCPU | 96 GB DDR5 | 1.5 TB NVMe | Ilimitado | $449/mo | Contratar |
| NL-L | 1× NVIDIA H100 SXM5 | 80 GB HBM3 | 24 vCPU | 192 GB DDR5 | 2 TB NVMe | Ilimitado | $1799/mo | Contratar |
| NL-XL | 2× NVIDIA H100 SXM5 | 160 GB HBM3 | 32 vCPU | 384 GB DDR5 | 4 TB NVMe | Ilimitado | $3399/mo | Contratar |
Servidores GPU se destacam em cargas de trabalho que escalam com VRAM e tensor cores — ajuste fino e inferência de LLM, geração de imagens por difusão, vídeo com IA e serving de modelos em alta vazão.
Ajuste fino de Llama, Mistral, Qwen, DeepSeek com LoRA / QLoRA / FT completo no H100. Ou inferência self-hosted com vLLM / TGI / Ollama para serving de modelos em produção.
Stable Diffusion, FLUX.1, SDXL com ComfyUI ou Forge. Treine seu próprio LoRA, gere em lote em escala ou hospede um endpoint de inferência.
OpenSora, CogVideoX, Wan-2.1, AnimateDiff. Geração de vídeo exige VRAM sério — comece com RTX 5090 (32 GB) ou H100 (80 GB).
Implante modelos ajustados atrás da sua própria API. Custos previsíveis, sem taxas por token, sem dados saindo da sua jurisdição. JupyterLab + FastAPI incluídos.
RTX 4090 (24 GB), RTX 5090 (32 GB), H100 SXM5 (80 GB), 2× H100 (160 GB).
Até 4 TB NVMe SSD, combinado com DDR5 RAM para I/O rápido de dataset.
Do pedido pago à saída do nvidia-smi em menos de 60 segundos.
SSH root completo, mais JupyterLab pré-vinculado na porta 8888 com autenticação por token.
Os Países Baixos oferecem o melhor peering de rede na Europa através do AMS-IX. Latência inferior a 10ms para a maior parte da Europa Ocidental, excelente capacidade de largura de banda e um ambiente de hospedagem historicamente tolerante.
Os Países Baixos são membros da UE, portanto o GDPR se aplica. No entanto, a ServPrivacy não coleta dados pessoais, então a conformidade com o GDPR está integrada à nossa arquitetura de dados zero. Sem dados pessoais não há risco de GDPR.
Extremamente rápidos. O peering AMS-IX oferece latência inferior a 10ms para a Europa Ocidental e excelente conectividade global. Nossos servidores holandeses incluem uplink de até 10 Gbps e largura de banda ilimitada.
Leis de privacidade rigorosas, energia renovável, fora da UE.
Regulamentação mínima, preços baixos, cooperação internacional mínima.
Tribunais derrubaram leis de retenção de dados. Excelente conectividade com a UE.
Pague em BTC, XMR, ETH, USDT ou outras 10 redes. SSH + JupyterLab em uma GPU NVIDIA real em Países Baixos em menos de 60 segundos.