Colossus: la guerra de la IA se gana con logística
De una fábrica vacía en Memphis a 230.000 GPUs y rumbo al millón: xAI sorteó la red con 35 generadores y Megapacks, convirtiendo energía, cobre y velocidad en ventaja estratégica.
El Axioma que Define el Futuro
"Las guerras se ganan con logística" es un principio militar que Elon Musk cita frecuentemente, y que ahora está determinando quién dominará la era de la inteligencia artificial. Mientras OpenAI, Meta y Google construyen sus imperios digitales con comunicados de prensa y conferencias en la Casa Blanca, xAI está desplegando una máquina logística que redefine lo que significa escalar infraestructura tecnológica.
La ecuación es fácil: quien pueda desplegar la mayor cantidad de poder computacional de manera más eficiente ganará la carrera del AI. No es una cuestión de algoritmos elegantes o arquitecturas innovadoras. Es capacidad de procesamiento organizada y desplegada a una velocidad sin precedentes.
Por Qué el Hardware Determina Todo
Rich Sutton, después de observar 70 años de investigación en AI, documentó un patrón que llamó "The Bitter Lesson". La observación es que todos los trucos ingeniosos, las optimizaciones algorítmicas y las arquitecturas sofisticadas consistentemente pierden ante el poder del cómputo escalado.
La ecuación fundamental que gobierna el progreso en AI puede expresarse como:
Rendimiento del Modelo ∝ (Datos × Cómputo)^α
Donde α típicamente oscila entre 0.5 y 0.7, dependiendo del dominio específico. Esto significa que duplicar tu capacidad computacional no duplica tu rendimiento, pero el crecimiento sigue siendo sustancial y predecible. Es una ley de potencia que favorece a quien pueda acumular más GPUs y hacerlas trabajar en conjunto.
Esta realidad matemática convierte a Elon Musk en el jugador más formidable del tablero. No necesariamente porque tenga los mejores investigadores en AI (aunque su equipo ciertamente está entre los mejores), sino porque ha demostrado ser el operador logístico más efectivo en la industria tecnológica moderna.
De Cero a Colossus en Tiempo Récord - 122 Días
En julio de 2023, xAI era solo una declaración de misión: "Entender el Universo". No tenían oficinas, servidores, ni infraestructura. Veintinueve meses después, operan Colossus, el supercomputador de AI más grande y poderoso del mundo.
Para contextualizar: Meta llevaba una década trabajando en AI cuando xAI se formó. OpenAI tenía ocho años de ventaja. Google había estado desarrollando capacidades de AI desde antes de que el deep learning se volviera mainstream. Sin embargo, en menos de tres años, xAI los ha alcanzado y en varios aspectos críticos, superado.
Colossus 1, el primer datacenter de xAI, ilustra esta velocidad de ejecución. Ubicado en una antigua fábrica de Electrolux en Memphis, Tennessee, este complejo de 785,000 pies cuadrados alberga 230,000 GPUs trabajando en perfecta sincronía. Hasta el año pasado, el consenso en la industria era que hacer funcionar coherentemente más de 30,000 GPUs era técnicamente imposible. Los expertos consideraban esto una barrera física del hardware y el software disponible.
Musk, después de analizar personalmente la arquitectura del cableado del datacenter, resolvió el problema de coherencia. No delegó esto a un equipo de ingenieros o consultores externos. Él mismo descifró cómo hacer que 230,000 GPUs actuaran como una sola unidad computacional.
La Infraestructura Energética como Campo de Batalla
El desafío más significativo en la construcción de Colossus 1 no fue tecnológico sino energético. El datacenter requería más de 250 MW de potencia. El sitio venía equipado con una conexión de apenas 15 MW. El tiempo estimado por los expertos para actualizar la conexión a la red eléctrica: entre 2 y 4 años.
La solución implementada por xAI fue movilizar 35 generadores capaces de suministrar hasta 420 megavatios de potencia. Utilizaron una disposición regulatoria que permite usar generadores móviles en sitio por hasta 364 días sin permiso especial. Este sistema fue respaldado con al menos 250 megavatios-hora de Megapacks de Tesla.
Esta configuración resuelve tres problemas técnicos fundamentales:
Estabilización del suministro eléctrico: Los datacenters de AI requieren estabilidad absoluta. Una fluctuación de microsegundos puede arruinar una sesión de entrenamiento que ha consumido semanas y millones de dólares. Los Megapacks proporcionan un buffer que garantiza continuidad operativa.
Gestión de picos de demanda: Cuando 230,000 GPUs procesan datos simultáneamente, la demanda energética puede fluctuar en decenas de megavatios múltiples veces por segundo. La ecuación de potencia instantánea es:
P(t) = P_base + ΣΔP_i × sin(ωt + φ_i)
Donde las fluctuaciones ΔP_i pueden ser del orden de 50-100 MW. Los Megapacks absorben estos picos manteniendo la estabilidad del sistema.
Protección de infraestructura circundante: Sin esta intermediación, las fluctuaciones extremas comprometerían la integridad de la red eléctrica regional.
La Escala de Colossus 2
Mientras la industria procesa la magnitud de Colossus 1, xAI ya está construyendo Colossus 2: un supercluster diseñado para albergar un millón de GPUs. Cada GPU NVIDIA GB200 que utilizarán tiene un costo aproximado de $30,000-40,000, representando una inversión de $30-40B solo en procesadores.
La velocidad de despliegue es el factor diferenciador. xAI instaló sus primeros 100,000 H100s en 122 días. Los siguientes 100,000 (50,000 H100s y 50,000 H200s) tomaron solo 92 días. Esta curva de aprendizaje sugiere una mejora operacional que puede modelarse como:
Tiempo de instalación (n) = T_0 × (0.75)^n
Donde T_0 es el tiempo inicial de instalación y n representa el número de iteraciones. Si mantienen esta tasa de mejora, podrían estar instalando 110,000 GPUs cada 46 días para finales de 2025.
Las Matemáticas del Consumo Energético
Colossus 2, cuando esté completamente operativo, consumirá aproximadamente 3 gigavatios de energía. Esta cantidad de electricidad podría alimentar 2.25 millones de hogares estadounidenses promedio, o equivale al consumo total de energía de países como Jamaica o Luxemburgo o 3 ciudades en Colombia como Medellín, Cali y Barranquilla.
La infraestructura física requerida es igualmente masiva. El cobre necesario para el cableado puede calcularse mediante:
Cobre total = (N_GPUs × L_avg × A_conductor × ρ_cu) / η_packing
Donde:
N_GPUs = 1,000,000
L_avg = longitud promedio del cable ≈ 10 metros
A_conductor = área de sección transversal ≈ 50 mm²
ρ_cu = densidad del cobre = 8,960 kg/m³
η_packing = eficiencia de empaquetamiento ≈ 0.7
Esto resulta en aproximadamente 6,400 toneladas métricas de cobre, representando el 0.026% de la producción mundial anual ( ojalá entiendan la importancia de no minar Quebradona)
Geografía Estratégica y Acceso Energético
La selección de Memphis como ubicación no fue arbitraria. Memphis Light, Gas and Water obtiene su electricidad de la Tennessee Valley Authority (TVA), que mantiene aproximadamente 4.5 gigavatios de capacidad de generación disponible. La TVA ofrece acuerdos de "flex-connect", permitiendo a las empresas acceder a la red inmediatamente a cambio de reducir consumo durante picos de demanda.
Esta flexibilidad operacional marca una diferencia fundamental. Mientras OpenAI y Microsoft navegan procesos de permisos para Stargate, xAI ya está operando. Mientras Meta negocia con autoridades locales para Prometheus, xAI instala su siguiente lote de 100,000 GPUs.
La ventaja temporal en esta carrera genera retornos exponenciales. Cada día de ventaja permite entrenar modelos más grandes, atraer mejor talento y asegurar contratos estratégicos.
Las Ventajas Estructurales de Musk
Si construir datacenters masivos es la clave para dominar la IA, surge la pregunta de por qué otros actores no pueden replicar la velocidad de xAI. La respuesta tiene tres componentes estructurales:
Integración vertical: Musk controla Tesla (que produce Megapacks), SpaceX (con experiencia en sistemas complejos), y mantiene relaciones establecidas con proveedores industriales globales. Cuando xAI necesita 200 megavatios de almacenamiento en baterías, no negocian con proveedores externos; simplemente redirigen producción desde las líneas de Tesla.
Tolerancia al riesgo diferenciada: Implementar 35 generadores móviles explotando una disposición regulatoria de 364 días no es una estrategia que una empresa pública tradicional consideraría viable. Los riesgos regulatorios, ambientales y reputacionales serían evaluados como prohibitivos. Para la estructura operativa de Musk, es una decisión táctica estándar.
Velocidad decisional: Mientras competidores forman comités evaluadores, Musk completó la compra de la fábrica de Electrolux en una semana. Mientras otros esperan aprobaciones de juntas directivas, él ya tiene generadores operando.
La Nueva Categoría de Infraestructura
Lo que estamos presenciando trasciende una competencia corporativa. Es el surgimiento de una nueva categoría de infraestructura fundamental. Los datacenters de AI están posicionándose como el equivalente moderno de las represas hidroeléctricas del siglo XX: proyectos de infraestructura que definen la capacidad productiva nacional.
La demanda de GPUs crece exponencialmente mientras la capacidad de producción permanece limitada. NVIDIA, el principal fabricante, enfrenta tiempos de espera de 6-12 meses para pedidos grandes. Aquí también xAI mantiene ventaja: Musk anticipó la escasez de transformadores hace dos años y ha acumulado inventario. Solo en Giga Austin, mantienen aproximadamente 1 GW de transformadores en reserva.
El desequilibrio entre oferta y demanda es estructural:
Demanda proyectada de GPUs (2025) ≈ 10 millones de unidades Capacidad de producción (2025) ≈ 3 millones de unidades
Este déficit de 7 millones de unidades no es un error de proyección. Refleja una industria creciendo más rápido que la capacidad física de manufactura.
Hacia los Datacenters de 1 TW
Musk ya articula la siguiente fase: datacenters de escala de teravatios. Un teravatio equivale a 1,000 gigavatios, más energía que el consumo total del continente africano, representando aproximadamente el 4% del consumo energético global de la humanidad.
La física de estos sistemas presenta desafíos sin precedentes. El calor generado sería suficiente para alterar patrones climáticos locales. El enfriamiento requeriría millones de galones de agua diarios. La infraestructura necesitaría plantas de energía nuclear dedicadas.
1 TERAWATT: LA CARRERA ENERGÉTICA DE EE.UU.
Hace unos días, Elon Musk disparó una de esas frases que parecen ciencia ficción pero que, si prestas atención, son un plan maestro: “El objetivo es 1 Terawatt”. No es una cifra mágica. Es el umbral que define si Estados Unidos puede sostener una economía de inteligencia artificial, robots, chips, autos eléctricos y computación cuántica, o si se convert…
Implicaciones Geopolíticas
xAI no está construyendo solo ventaja corporativa sino capacidad estratégica nacional. El país que controle la mayor capacidad de AI dominará la investigación científica, el descubrimiento farmacéutico, el diseño de materiales, la estrategia militar y prácticamente cada campo del desarrollo humano.
China comprende esta realidad y construye sus propios megaclusters pese a las restricciones de exportación de semiconductores. Europa reconoce la importancia aunque su respuesta ha sido fragmentada. Estados Unidos, específicamente a través de xAI, está estableciendo el ritmo global.
La velocidad de xAI no es solo operacionalmente impresionante; es estratégicamente decisiva. Cada mes de ventaja significa modelos más avanzados, aplicaciones más sofisticadas y comprensión más profunda de los problemas fundamentales que la AI puede resolver.
La Organización como Ventaja Competitiva
xAI comenzó con menos de 20 personas y mantiene una estructura organizacional deliberadamente pequeña considerando la escala de sus operaciones. Esto refleja una filosofía operacional perfeccionada por Musk: equipos pequeños, altamente motivados, con autoridad para ejecutar sin capas burocráticas.
No hay comités de revisión prolongados. Si algo necesita hacerse, se ejecuta. Si algo falla, se corrige inmediatamente. Si algo parece imposible, se encuentra una solución alternativa. La cultura organizacional prioriza resultados sobre procesos, velocidad sobre perfección teórica, acción sobre análisis paralizante.
Esta estructura es la antítesis de cómo operan las grandes corporaciones tecnológicas tradicionales, y precisamente por eso genera resultados tan dramáticamente diferentes.
Contrastes Organizacionales
OpenAI comenzó como organización sin fines de lucro dedicada a asegurar que la AI beneficie a toda la humanidad, ahora es una corporación valorada en $300B. Meta, enfocada en "conectar personas", desarrolla AI principalmente para optimizar engagement publicitario. Google, cuyo principio fundacional era "Don't be evil", dispersa sus esfuerzos de AI en múltiples campus no coherentes.
xAI, fundada con la misión aparentemente abstracta de "entender el universo", está entregando infraestructura tangible a velocidad sin precedentes. La diferencia no radica en la filosofía corporativa sino en la capacidad de ejecución: convertir recursos en resultados más rápido que cualquier competidor.
Proyecciones para los Próximos 12 Meses
Los planes de xAI para los próximos meses son ambiciosos pero, basándose en su historial, alcanzables:
Enero 2026: 550,000 GPUs operativas
Verano 2026: 1 millón de GPUs objetivo
Estos no son proyecciones especulativas. Basándose en las tasas de mejora documentadas y los recursos ya comprometidos, representan objetivos operacionales concretos.
El impacto en mercados relacionados será significativo:
Semiconductores: NVIDIA enfrenta demanda que excede capacidad de producción. La presión sobre la cadena de suministro intensificará la escasez.
Commodities: La demanda de cobre de xAI podría influir en mercados globales. 6,400 toneladas por datacenter representa volumen suficiente para impactar precios.
Energía: Utilities capaces de proporcionar gigavatios de potencia flexible se volverán activos estratégicos. Ubicaciones con acceso a energía abundante verán valorización acelerada.
Bienes Raíces Industriales: Propiedades con infraestructura eléctrica robusta cerca de fuentes de energía se convertirán en recursos críticos.
La Transformación del Paisaje Competitivo
Mientras Microsoft y OpenAI anuncian Stargate con proyecciones para 2028, mientras Meta publicita Prometheus con líneas de tiempo extendidas, mientras Google fragmenta recursos entre múltiples ubicaciones, xAI construye. No están teorizando sobre el futuro de la IA; lo están materializando un megavatio a la vez.
La competencia en AI no se decidirá por elegancia algorítmica o innovación teórica. Se determinará por capacidad de desplegar silicio, acero y cobre a escala y velocidad sin precedentes. Es fundamentalmente un desafío logístico.
En este dominio, Musk ha demostrado capacidades únicas. Ha desarrollado cohetes reutilizables cuando los expertos lo consideraban imposible. Creó una red de manufactura automotriz que produce vehículos cada 45 segundos cuando los analistas predecían bancarrota. Desplegó más satélites que naciones enteras cuando el concepto de megaconstelaciones era ciencia ficción.
Ahora está construyendo la infraestructura computacional más grande en la historia humana, no en las décadas que los expertos consideraban necesarias, no en los años que los optimistas proyectaban, sino en meses.
La Arquitectura Invisible: El Arte del Cableado
El secreto menos glamoroso pero más crítico de Colossus radica en kilómetros de cables amarillos perfectamente organizados. Cada GPU requiere múltiples conexiones de alta velocidad: alimentación, datos, refrigeración y redundancia. Para 230,000 GPUs, esto significa literalmente millones de cables que deben mantener señales sincronizadas viajando a la velocidad de la luz. Un solo cable mal conectado, una curva demasiado cerrada, o una interferencia electromagnética puede destruir la coherencia del sistema completo.
Lo que las imágenes de Colossus revelan es una sinfonía de organización: bandejas de cables amarillos dispuestas en capas perfectamente paralelas, cada una siguiendo rutas optimizadas para minimizar la longitud y maximizar la integridad de la señal. Esta no es solo una cuestión estética. A las velocidades de transmisión que maneja Colossus, cada centímetro extra de cable introduce latencia. Cada cruce innecesario genera interferencia. La diferencia entre el éxito y el fracaso se mide en nanosegundos.
Musk pasó horas personalmente en el datacenter, no supervisando sino literalmente trazando rutas de cables, calculando interferencias, optimizando cada conexión. Mientras otros CEOs delegan la infraestructura física, Musk entiende que en los detalles del cableado está la diferencia entre 30,000 GPUs funcionando (el límite anterior de la industria) y 230,000 GPUs operando como una sola mente artificial. Es logística llevada a su expresión más pura: no hay software lo suficientemente inteligente para compensar un cableado deficiente.
Reflexiones sobre el Momento Histórico
Estamos presenciando un punto de inflexión comparable a la construcción del sistema ferroviario transcontinental o la electrificación urbana. La diferencia es la velocidad: lo que antes tomaba generaciones ahora ocurre en años.
Los datacenters de IA no son solo infraestructura tecnológica. Son los cimientos sobre los cuales se construirá la próxima era de capacidad humana. Cada GPU adicional no es solo más poder de cómputo; es más capacidad para resolver problemas que han desafiado a la humanidad durante siglos.
xAI, con su misión de "entender el universo", podría parecer grandilocuente. Pero cuando tienes un millón de GPUs trabajando coherentemente, procesando información a escalas que desafían la comprensión humana, tal vez entender el universo no sea tan descabellado después de todo.
Una Lección para Ciudades Emergentes: El Caso Medellín
La historia de xAI y Colossus ofrece lecciones importantes para ciudades que buscan posicionarse en la economía del AI. Medellín, con su legado de grandes complejos industriales textiles como Fabricato y Coltejer, posee activos subutilizados que podrían transformarse en centros de AI. La planta de Coltejer en Itagüí, cerrada en 2020, y el complejo de Coltabaco con 95,000 metros cuadrados, representan espacios industriales con infraestructura eléctrica existente que podrían reconvertirse para la nueva economía digital.
El edificio Coltejer, con sus 42,000 metros cuadrados construidos, aunque actualmente funciona como oficinas, demuestra la escala de infraestructura disponible. Más relevante aún, el Metro de Medellín instaló una red de fibra óptica en 1998 a un costo de 1.8 millones de dólares, aunque permanece subutilizada para comunicaciones internas. Esta infraestructura de telecomunicaciones, combinada con la cobertura Wi-Fi en las 28 estaciones del metro con canales de 300 megas simétricos, crea una base de conectividad que podría soportar operaciones de datacenters.
Colombia mantiene una ventaja estructural con su matriz energética donde aproximadamente 70% proviene de hidroelectricidad. Esta disponibilidad de energía renovable, combinada con la infraestructura industrial heredada de la era textil, posiciona a ciudades como Medellín para competir en la economía del AI. En lugar de convertir estos espacios exclusivamente en desarrollos inmobiliarios residenciales, las ciudades deberían considerar reservar lotes estratégicos para datacenters o fábricas de AI, donde se generará la verdadera productividad del siglo XXI. La transformación de Memphis con xAI demuestra que el verdadero valor no está en construir más apartamentos, sino en crear la infraestructura computacional que definirá las próximas décadas.
Por eso tenemos que apostarle a todas las empresas que estan ayudando en el proceso de electrificación: EIE, Celsia, etc
El Legado en Construcción
Dentro de una década, cuando analicemos cómo la AI transformó la civilización, el momento decisivo no será el lanzamiento de ChatGPT o el desarrollo de modelos multimodales. Será el momento en que Elon Musk decidió que esperar años por conexiones eléctricas era inaceptable y trajo 35 generadores móviles a Memphis.
Ese acto de impaciencia creativa, de negarse a aceptar las limitaciones convencionales, estableció un nuevo estándar para lo que significa construir infraestructura tecnológica. Demostró que los límites que la industria consideraba inmutables eran, en realidad, opcionales.
La revolución de la AI no está ocurriendo en laboratorios de investigación o salas de juntas corporativas. Está sucediendo en una antigua fábrica de electrodomésticos en Tennessee, alimentada por generadores móviles, enfriada por sistemas improvisados, y construida por un equipo que no sabía que lo que estaban haciendo era supuestamente imposible.
Es una revolución medida no en papers publicados o valoraciones bursátiles, sino en megavatios desplegados y GPUs sincronizadas. Es una revolución donde la victoria no la determina quien tiene las mejores ideas, sino quien puede convertir esas ideas en infraestructura operativa más rápidamente.
En esta nueva realidad, xAI no está simplemente compitiendo; está redefiniendo las reglas del juego. Y lo está haciendo no con proclamaciones o promesas, sino con la única métrica que importa en una carrera de infraestructura: capacidad instalada y operativa.
Bienvenidos a la era donde la supremacía tecnológica se mide en gigavatios y la ventaja competitiva se calcula en días saved en tiempo de construcción. Bienvenidos al mundo que xAI está construyendo, un datacenter a la vez.
Esta semana llego a este nivel xAI mayor consumo de tokens
⚡ Si te gustó el post, compártelo con amigos, deja un like y cuéntame qué piensas en los comentarios.
Subscribed
X: @holdmybirra
Linkedin: Hernanjaramillo
📜 Descargo de responsabilidad
Las opiniones expresadas en este artículo son únicamente del autor. El contenido aquí presentado no constituye asesoría de inversión, y su propósito es exclusivamente educativo. Nada de lo discutido representa una oferta para vender ni una solicitud para comprar valores de ninguna empresa. Todo el contenido es subjetivo y deberías realizar tu propio análisis y diligencia antes de tomar cualquier decisión. Hernán Jaramillo / 10ampro no garantiza, expresa ni implícitamente, la exactitud, confiabilidad, integridad o razonabilidad de la información contenida en esta publicación. Cualquier suposición, opinión o estimación expresada refleja el juicio del autor en la fecha de publicación y está sujeta a cambios sin previo aviso. Las proyecciones incluidas se basan en múltiples supuestos sobre condiciones de mercado, sin garantía alguna de que se cumplan los resultados proyectados. Hernán Jaramillo / 10ampro no asume ninguna responsabilidad por pérdidas directas, indirectas o de cualquier otro tipo derivadas del uso o la confianza en el contenido aquí expuesto. Hernán Jaramillo / 10ampro no actúa como tu asesor financiero, legal, contable, fiscal ni en ninguna otra capacidad fiduciaria


















Un cambio de era y una revolución milenaria. Y Colombia? Bien, gracias… hablando si el salario mínimo hay que subirlo por encima de la inflación y si la jornada laboral termina a las 7 o a las 9 pm! Y el resto discutiendo sobre Dayro Moreno en la selección. Terminaremos cocinando con Cocinol si no traemos estos temas a la agenda central de país!
Gracias por el substack !Entender el Colossus de xAI es impresionante. La lección es clara: en IA, el hardware manda. Adicional la propuesta de reconvertir espacios industriales subutilizados en Colombia, como antiguas fábricas textiles, en datacenters es visionaria. Ojalá algún político medio inteligente pueda escuchar este podcast!