95 modelos entre texto, imagen, video y audio · 39 dispositivos · validado 2026-06-15
¿Puedo ejecutar este modelo de IA en local?
Elige un modelo y tu hardware. Te decimos si funciona, cuánta memoria necesita, el comando exacto y la mejor herramienta para tu plataforma: Mac, Windows, Linux, iOS o Android.
CubreGeneración de texto/Modelos de imagen/Modelos de video/Modelos de audio/Apple Silicon/NVIDIA / AMD
Cómo funciona
1
Tamaños reales
Los tamaños por cuantización vienen de Ollama y HuggingFace, no de suposiciones. Cada número tiene su fuente.
2
Cálculo de memoria honesto
Sumamos la caché KV y el overhead, y usamos memoria utilizable realista (Apple unificada ~66-75% (segun el chip), VRAM menos el driver).
3
La herramienta adecuada
Por plataforma: MLX/Ollama en Mac, CUDA en Windows, vLLM en Linux, PocketPal en el móvil.
Preguntas frecuentes
¿Cómo sé si mi ordenador puede ejecutar un modelo de IA en local?
Compara la memoria que necesita el modelo con tu memoria utilizable. Un modelo de texto de 7-8B en Q4_K_M necesita unos 6-7 GB, así que funciona en un Mac de 16 GB o una GPU de 12 GB. Los modelos de imagen (como Stable Diffusion o FLUX) requieren ~4-8 GB según la variante. localmodel.run hace ese cálculo para 95 modelos en 39 dispositivos.
¿Puedo ejecutar modelos de IA en local en un Mac?
Sí. Apple Silicon comparte memoria unificada, así que un Mac de 16 GB ejecuta modelos de 7-8B y uno de 64 GB+ ejecuta 70B. Usa LM Studio (que incluye MLX) o mlx-lm para máxima velocidad. vLLM no es para Mac, es un motor de servidor para Linux/CUDA.
¿Puedo ejecutar un LLM en el móvil?
Sí, con límites. Los iPhone y los Android tope de gama ejecutan de forma realista modelos de 1B-4B. En iOS 26 usa los Foundation Models de Apple o PocketPal AI; en Android, PocketPal AI o Google AI Edge.