Que es Ollama y por que usarlo en un VPS

Ollama es una herramienta de codigo abierto que simplifica la instalacion, gestion y ejecucion de modelos de lenguaje grande (LLMs) en servidores Linux. Permite descargar y ejecutar modelos como Llama 3, Mistral, Gemma, DeepSeek, Phi y docenas mas con un solo comando, exponiendo una API compatible que puede usarse directamente desde aplicaciones.

Ejecutar Ollama en un VPS en lugar de en el equipo local ofrece varias ventajas: el modelo esta siempre disponible sin consumir los recursos de tu equipo, puede ser accedido por multiples usuarios o aplicaciones simultaneamente, y puede ser integrado en sitios web, aplicaciones moviles o sistemas empresariales.

Requerimientos del servidor para Ollama

ModeloTamañoRAM minimaRAM recomendada
Llama 3.2 (3B)~2 GB4 GB8 GB
Llama 3.1 (8B)~5 GB8 GB16 GB
Mistral (7B)~4.5 GB8 GB16 GB
DeepSeek-R1 (8B)~5 GB8 GB16 GB
Llama 3.1 (70B)~40 GB64 GB128 GB

Como instalar Ollama en un VPS Linux

# Instalar Ollama con el script oficial
curl -fsSL https://ollama.com/install.sh | sh

# Verificar que el servicio esta activo
systemctl status ollama

# Descargar y ejecutar un modelo
ollama pull llama3.2
ollama run llama3.2

# Probar la API
curl http://localhost:11434/api/generate -d '{"model":"llama3.2","prompt":"Hola"}'

Exponer Ollama de forma segura

Por defecto, Ollama solo escucha en localhost. Para hacerlo accesible de forma segura desde el exterior, se recomienda usar Nginx como proxy inverso con autenticacion:

# En /etc/nginx/sites-available/ollama
server {
    listen 443 ssl;
    server_name ia.tudominio.com;
    location / {
        proxy_pass http://127.0.0.1:11434;
    }
}

Un VPS de WebHosting MX con 16-32 GB de RAM es suficiente para ejecutar modelos de 7-13B parametros con Ollama y dar servicio a un equipo de trabajo o una aplicacion web. Conoce nuestros VPS en webhosting.mx.

Was this answer helpful? 0 Users Found This Useful (0 Votes)