Por Ernesto Ángeles
El lunes pasado, las acciones de diferentes empresas tecnológicas de Estados Unidos amanecieron en números rojos, especialmente la famosa empresa de semiconductores Nvidia, la cual perdió más de 460 mil millones de dólares de valor en el mercado, la mayor pérdida de valor de la historia. En total, el sector tecnológico estadounidense perdió un trillón de dólares de valor en una jornada.
La razón: la semana pasada una empresa de Inteligencia Artificial de China llamada DeepSeek lanzó al mercado una aplicación que sirve de interfaz para su modelo de inteligencia artificial (IA) fundacional llamado DeepSeek-R1, el cual salió al mercado el 20 de enero y cuyas capacidades compiten con el modelo de IA de Open AI, ChatGPT-o1, especialmente en tareas de razonamiento; asimismo, la empresa tiene otro modelo que hizo público en diciembre, el DeepSeek-V3, un modelo de propósito general que rivaliza con el ChatGPT-4o.
Lo más importante de ambos modelos de DeepSeek no radica en sus capacidades como tal, sino porque el coste computacional de entrenamiento de los modelos ha sido mucho menor, lo que disminuyó fuertemente el precio final del producto: mientras que el entrenamiento de un modelo de GPT ronda los 100 millones de dólares, el entrenamiento de un modelo DeepSeek es de poco menos de 7 millones de dólares, según la propia empresa. Además, la aplicación que lanzó DeepSeek se convirtió en la app más descargada en Estados Unidos, aumentando la presión sobre el futuro de la competencia de IA entre China y Estados Unidos.
Y tal como habría de esperar, este adelanto tecnológico generó una avalancha de reacciones, las cuales no sólo impactaron el mercado de valores, sino que también escaló a nivel político y social, al punto que el presidente de Estados Unidos, Donald Trump, hizo un llamado de atención a las empresas estadounidenses, así como denunció el supuesto abuso de DeepSeek a OpenAI, ya que supuestamente estos nuevos modelos habían sido entrenados explotando los recursos de ChatGPT.
A nivel social este suceso fue catalogado por algunas voces (la mayor parte de estas no expertas) como un momento Sputnik en la carrera por el dominio de la IA. Tal fue la expectativa, shock y fantasía que hasta se auguró el fin del dominio tecnológico estadounidense, tal como si China hubiera ganado la carrera por la IA o, al menos, se hubiera situado codo a codo con el poderío tecno-empresarial estadounidense.
Sin embargo, voces expertas, o al menos más cautas, señalaron una serie de indicadores que pone en duda los diagnósticos más aventurados y apocalípticos, tal como el hecho que DeepSeek se trata de un avance en optimización de recursos de cómputo, más que en hacer obsoleto el poder de cómputo; o el hecho que DeepSeek fue entrenado en hardware de Nvidia, aunque no en el más avanzado. Entonces ¿cuál es el significado real de DeepSeek y por qué parece tan importante? ¿Estamos ante un momento Sputnik o sólo fue un hecho alimentado por la curiosidad y la necesidad de expresarse en redes sociales?
Para comenzar, la gran pérdida de valor de mercado de Nvidia se debió a que el paradigma que dominaba en la IA suponía que para desarrollar una IA avanzada se necesitaba gran poder de cómputo, especialmente los chips más avanzados, por lo que Nvidia era de las empresas mejor posicionadas para reaccionar a las necesidades técnicas del mercado; empero, gracias a DeepSeek ahora se tienen técnicas de optimización para entrenar modelos de IA sin necesitar mucho poder de cómputo, así como tampoco los chips más avanzados para su entrenamiento; hay que recordar que China enfrenta un bloqueo comercial para acceder a tecnología de semiconductores de última generación.
Aunque ojo, ese modelo fue entrenado con hardware de Nvidia y esto no quita la necesidad del poder de cómputo; además, no sólo ya existía una tendencia a la disminución de costos de cómputo en el desarrollo de IA, sino que a inicios de año Nvidia anunció su plan de apostar por la democratización del poder de cómputo. Por tanto, el hito de DeepSeek fue el utilizar técnicas para que el entrenamiento de su modelo no requiriera tantos recursos, haciendo esta tecnología más barata y accesible, sin necesitar gran inversión en poder de cómputo o en capacidad de chips.
Otra cosa importante para señalar es que la tendencia actual apunta al desarrollo de tecnología muy parecida entre sí, por lo que el tema no es solo si DeepSeek hace lo que puede hacer GPT o Gemini, sino más bien cómo se puede aplicar, usar y adaptar, ya que, a diferencia de otros modelos, DeepSeek es de código abierto, por lo que no sólo muchas de sus funciones son gratuitas, sino que el modelo puede ser modificado y alimentado con datos especializados, así como con la IA de Meta, LLaMA, la cual también es de código abierto.
Por tanto, el tema central es la sorpresa en la optimización de recursos en el entrenamiento de un modelo y el fin del mito que se necesita gran poder de cómputo de última generación para entrenar un gran modelo de IA, por lo que es más que seguro que tal técnica sea implementada por otras empresas, sentando un estándar dentro de la industria. Esto es importante porque, tal como apunta el internacionalista Daniel Drezner, un cambio tecnológico es también un ejercicio de redistribución: distribución de poder internacional, distribución en el alojamiento de intereses, así como distribución en la formación de normas internacionales; aunque éste es un paso más en la construcción de un sistema tecnológico alternativo al de Estados Unidos, antes que la sustitución de uno por otro o la destrucción de alguno.
Ahora bien, más allá de un conflicto entre hegemonías y mercados, esta competición puede traer beneficios sustanciales a usuarios y a la humanidad en general, ya que no hay que olvidar que sin la competencia tecnológica en la Guerra Fría entre EUA y la Unión Soviética, tecnologías como internet, los satélites o el desarrollo intensivo de la computadora no hubieran sucedido como sucedieron; por lo que la competencia entre DeepSeek vs Silicon Valley puede traer tecnología más barata y extendida, ya que sin la barrera de un costo tan alto es posible que haya una explosión de IAs, lo que acelerará el proceso de implementación y uso de esta tecnología más allá de interfaces de chat.
Grosso modo, es probable que el caso de DeepSeek genere más dinamismo en el mercado, más democratización en el desarrollo de IA, el abaratamiento de costos en el entrenamiento, así como más competencia en el mercado de IA, no sólo frente a las empresas estadounidenses, sino también al interior del mercado chino; por ejemplo, el día de hoy la BigTech china Alibaba presentó al mundo su plataforma de IA, la cual promete ser más avanzada que la de OpenAI, Google y DeepSeek, algo que sorprendió por lo inesperado del anuncio y que sólo demuestra la presión que DeepSeek vino a traer al mercado, incluido en China. Entonces, el impacto real de DeepSeek es como el mito de Apolo que robó el fuego de los dioses para otorgárselo a la humanidad.
Para terminar, también es necesario mencionar las limitantes de tal hazaña tecnológica, ya que esto NO va a acabar con la necesidad del poder de cómputo, NO va a acabar con la necesidad de chips e infraestructuras de cómputo y NO va a dañar el modelo económico de las empresas estadounidenses, si acaso el de OpenAI, Meta y su tradicional maximalismo. Y para quienes crean lo contrario, sobra decir que no sólo basta con entrenar un modelo, sino escalar su servicio a nivel mundial, por lo que las infraestructuras de cómputo son y seguirán siendo necesarias.
La carrera de la IA no se gana sólo con un producto, por lo que este caso representa un revés en la dominación mundial de IA, sí, pero no representa el fin de la competencia; además que buena parte de la tecnología implicada en el desarrollo de DeepSeek fue creada originalmente por Estados Unidos, tal como el modelo transformador, las redes neuronales o la arquitectura MoE. En fin, la carrera por la IA apenas comienza, pero para entenderla es necesario alejarse de voces que sólo se guían por el sensacionalismo y títulos de clickbait y empezar a analizar ecosistemas y tendencias tecnológicas más ampliamente.