: Inteligencia Artificial; 03 Julio 2026

Cómo montar un laboratorio de Inteligencia Artificial en Linux con herramientas open source

Autor: Carlos Monje | Publicado: 03/07/2026

Laboratorio_ia

Montar un laboratorio de Inteligencia Artificial en Linux es una de las mejores formas de aprender IA con control, privacidad y bajo costo. No necesitas empezar con servidores caros ni depender completamente de plataformas propietarias: puedes crear un entorno local con herramientas open source para aprender, probar modelos, analizar datos y construir asistentes privados.

La clave está en hacerlo con orden. Un laboratorio de IA no debe ser una carpeta llena de notebooks sueltos, modelos descargados sin licencia clara y comandos copiados sin criterio. Debe tener una estructura mínima: sistema Linux estable, Python, entorno virtual, notebooks, librerías de machine learning, modelos locales, base vectorial, seguimiento de experimentos y buenas prácticas de seguridad.

Importante: en IA, “open source” no siempre significa lo mismo para software, modelos y pesos. Antes de usar un modelo en una empresa, revisa su licencia, restricciones comerciales y condiciones de uso.

Herramientas recomendadas para el laboratorio

Capa	Herramientas	Uso principal
Sistema base	Ubuntu LTS, Debian, Fedora	Base estable para desarrollo, paquetes y servicios.
Python	venv, pip, NumPy, pandas	Programación, análisis de datos y scripts.
Notebooks	JupyterLab	Experimentación, documentación y visualización.
Machine learning	scikit-learn, PyTorch	Modelos clásicos, redes neuronales y pruebas de aprendizaje automático.
Modelos locales	Ollama, llama.cpp	Ejecutar modelos de lenguaje en Linux sin depender siempre de la nube.
Interfaz web	Open WebUI	Chat local, pruebas de prompts y asistentes internos.
RAG	Chroma, sentence-transformers	Búsqueda semántica y consultas sobre documentos propios.
MLOps	MLflow, DVC, Git	Versionar datos, registrar experimentos y repetir resultados.

1. Preparar Linux y paquetes base

Para empezar, usa una distribución estable. Ubuntu LTS es una de las opciones más prácticas para principiantes por su documentación, compatibilidad y facilidad de instalación. Debian es excelente si priorizas estabilidad. Fedora puede ser útil si quieres herramientas más recientes.

En Ubuntu, Debian o Linux Mint, instala los paquetes básicos:

Terminal Linux

sudo apt update
sudo apt upgrade
sudo apt install -y git curl wget build-essential python3 python3-pip python3-venv htop tree unzip

2. Crear una estructura ordenada

Un laboratorio de IA debe estar organizado desde el primer día. Esto evita perder notebooks, modelos, datasets o configuraciones.

Estructura del laboratorio

mkdir -p ~/ia-lab/{notebooks,src,data,models,experiments,rag,docs}
cd ~/ia-lab
git init

Una organización simple puede ser suficiente: notebooks para pruebas, data para datasets, models para modelos, src para código reutilizable y experiments para resultados.

3. Crear un entorno virtual de Python

No instales librerías de IA directamente sobre el Python del sistema. Usa un entorno virtual para mantener el laboratorio separado y reproducible.

Entorno virtual

cd ~/ia-lab
python3 -m venv .venv
source .venv/bin/activate
python -m pip install --upgrade pip setuptools wheel

4. Instalar JupyterLab y librerías de datos

JupyterLab es útil para aprender, documentar experimentos, analizar datos y probar modelos de forma interactiva.

JupyterLab y ciencia de datos

pip install jupyterlab numpy pandas matplotlib scikit-learn ipykernel
python -m ipykernel install --user --name ia-lab --display-name "IA Lab"

Luego inicia JupyterLab:

Iniciar JupyterLab

jupyter lab --notebook-dir ~/ia-lab

5. Instalar PyTorch y Transformers

PyTorch es una de las herramientas más utilizadas para aprendizaje profundo, investigación y prototipos de IA. Para empezar en CPU:

PyTorch y Transformers

pip install torch torchvision torchaudio
pip install transformers datasets accelerate sentence-transformers

Si usarás GPU, revisa primero la compatibilidad con CUDA, ROCm o los controladores de tu tarjeta. Para aprender, CPU es suficiente; para modelos grandes, una GPU ayuda bastante.

6. Ejecutar modelos locales con Ollama

Ollama permite ejecutar modelos de lenguaje de forma local en Linux. Es práctico para crear asistentes internos, hacer pruebas con prompts y experimentar sin enviar todo a servicios externos.

Instalar Ollama

curl -fsSL https://ollama.com/install.sh -o install-ollama.sh
less install-ollama.sh
sh install-ollama.sh

Ejecutar un modelo:

Modelo local

ollama pull nombre-del-modelo
ollama run nombre-del-modelo

Seguridad: no expongas Ollama, JupyterLab, MLflow u Open WebUI directamente a Internet. Úsalos en local o detrás de firewall, autenticación y red controlada.

7. Crear una interfaz con Open WebUI

Open WebUI permite tener una interfaz tipo chat para trabajar con modelos locales. Es útil para usuarios que no quieren usar solo terminal.

Instala Podman y ejecuta Open WebUI:

Open WebUI con Podman

sudo apt install -y podman

podman run -d --network=host 
-v open-webui:/app/backend/data 
--name open-webui 
ghcr.io/open-webui/open-webui:main

Luego abre en el navegador:

Navegador

http://localhost:8080

8. Agregar RAG con Chroma

RAG permite que un asistente consulte documentos propios antes de responder. Para eso necesitas embeddings y una base vectorial. Chroma es una alternativa open source para guardar y buscar vectores.

Instalar Chroma

pip install chromadb sentence-transformers pypdf

Con esto puedes crear asistentes que respondan sobre manuales, documentos internos, políticas, reportes, bases de conocimiento o archivos técnicos.

9. Controlar experimentos con MLflow y DVC

Un laboratorio de IA debe permitir repetir resultados. Para eso conviene registrar experimentos y versionar datos.

MLflow y DVC

pip install mlflow dvc

mlflow ui --host 127.0.0.1 --port 5000

dvc init

MLflow ayuda a guardar métricas, parámetros y modelos. DVC ayuda a organizar datasets y artefactos grandes sin llenar el repositorio Git.

Checklist mínimo del laboratorio

Linux actualizado.
Python con entorno virtual.
JupyterLab para notebooks.
scikit-learn para machine learning clásico.
PyTorch para deep learning.
Ollama o llama.cpp para modelos locales.
Open WebUI para interfaz de chat.
Chroma para RAG y búsqueda semántica.
MLflow para experimentos.
DVC y Git para control de versiones.
Firewall y servicios locales protegidos.
Registro de versiones, modelos y datasets.

Errores comunes

Instalar paquetes de IA como root.
No usar entornos virtuales.
Descargar modelos sin revisar licencia.
No documentar versiones de Python, librerías y modelos.
No separar datos, código, notebooks y experimentos.
Exponer servicios locales sin autenticación.
Empezar con modelos muy grandes antes de dominar lo básico.

Preguntas clave

¿Necesito GPU para empezar?

No. Puedes aprender Python, JupyterLab, scikit-learn, embeddings y RAG con CPU. La GPU ayuda cuando trabajas con modelos grandes o entrenamiento intensivo.

¿Qué distribución Linux conviene usar?

Ubuntu LTS es una opción práctica para empezar. Debian es sólida si buscas estabilidad y Fedora puede ser útil si quieres paquetes más recientes.

¿Ollama reemplaza a PyTorch?

No. Ollama sirve para ejecutar modelos locales de lenguaje. PyTorch sirve para aprender y construir modelos de aprendizaje profundo.

¿Qué es RAG?

RAG combina búsqueda de información en documentos propios con respuestas generadas por un modelo de lenguaje. Es útil para asistentes internos y bases de conocimiento.

¿Todo modelo descargable es open source?

No. Algunos modelos solo publican pesos, otros tienen restricciones comerciales y otros no cumplen una definición estricta de IA open source. Siempre revisa la licencia.

Recomendamos

En resumen

Montar un laboratorio de IA en Linux con herramientas open source es una forma práctica de aprender inteligencia artificial con independencia, privacidad y control. La ruta recomendada es empezar con Linux, Python, JupyterLab y scikit-learn; luego avanzar a PyTorch, Ollama, Open WebUI, Chroma, MLflow y DVC.

No se trata de instalar muchas herramientas, sino de construir un entorno ordenado, seguro y reproducible. Un buen laboratorio permite probar modelos, documentar resultados, versionar datos, medir experimentos y aprender sin depender completamente de servicios propietarios.

Conclusión editorial

La IA abierta en Linux no empieza por descargar el modelo más grande. Empieza por construir una base limpia: sistema estable, datos organizados, entornos virtuales, notebooks, modelos locales, seguridad y documentación.

03 Julio 2026

Visto: 15