El trasfondo de la llegada de la IA DeepSeek: "Demuestra la capacidad que tiene China y cambia el tablero"

Paco Herrera, catedrático de Ciencias de la Computación e Inteligencia Artificial de la UGR, destaca la rentabilidad y eficiencia del modelo

DeepSeek, el asistente de IA chino que ha desbancado a ChatGPT — DeepSeek, el asistente de IA chino | Foto: EP

31/01/2025 06:00

Sergio Rodríguez Acosta

La importancia de la inteligencia artificial es cada vez más notable. Su empleo ya se encuentra en la rutina de muchos ciudadanos, motivo por el que el dominio de este recurso ha ganado mucha importancia. La irrupción de la IA china DeepSeek ha generado un gran impacto en este campo y sus especialistas lo confirman. Paco Herrera, catedrático de Ciencias de la Computación e Inteligencia Artificial de la Universidad de Granada, analiza la relevancia de este paso y destaca que "demuestra la capacidad que tiene China" además de "cambiar el tablero" en este entorno.

Las cotas de DeepSeek se intuyen rápidamente con la reacción de Sam Altman, director ejecutivo de OpenAI, la compañía creadora del famoso ChatGPT. El responsable "ha reconocido que es brillante y que han dado un salto". Paco Herrera incide en que gran parte del debate sobre los grandes modelos de lenguaje giraba en torno a los grandes costes económicos de "mantenimiento, entrenamiento o electricidad central". El mérito de DeepSeek ha sido construir un modelo pequeño que puede presumir de eficiencia en su funcionamiento y rentabilidad en inversión.

Antes de este episodio, el docente universitario apunta que los "hermanos pequeños de los grandes modelos siempre eran de una calidad muy inferior". Herrera expone que él y otros especialistas comparten la opinión de que "para aplicaciones más pequeñas tú no necesitas un gran modelo". Esta visión apunta a un futuro en el que se buscará "un salto más" a través de esa mejora de la tecnología con "modelos más pequeños".

Una gran sorpresa a raíz de un entrenamiento con los grandes modelos

La perspectiva de los especialistas de un escenario con usos más concretos con "propósitos específicos" no preveía la gran sorpresa de DeepSeek: su modelo compite con el mismísimo ChatGPT. Herrera desgrana que habitualmente estos pequeños proyectos se entrenaban con sus hermanos mayores, un método que se llama 'destilación'. La estrategia china en este caso ha sido combinar esta posibilidad con el uso de "grandes modelos para aprender de ellos".

Dentro de este proceso está presente el nombre de la compañía Nvidia, puntera en computación de inteligencia artificial y cuyas tarjetas gráficas son las de "más alto nivel". Herrera detalla que China no puede adquirir estas tarjetas de forma directa a Estados Unidos, pero sí comprándolas a terceros países, una clave para acometer los entrenamientos de los modelos. Aún así, asegura que la necesidad ha servido para "agudizar la inteligencia en un diseño de altísima calidad" que ha mostrado que "China no va a la zaga en tecnología".

"Esto no se había hecho. Hasta ahora se habían realizado destilaciones. Me consta que Google tenía modelos pequeñitos por destilación y me habían dicho que eran muy buenos, pero esto es lo que han hecho directamente es 'cojo un modelo grande y me sirve para entrenar el mío en preguntas y respuestas'. Entonces, aquí lo que han hecho es una absorción de información de modelos grandes. Obviamente están disponibles y han sido inteligentes en ello", aporta el catedrático. El mundo de la inteligencia artificial no es ajeno al uso de avances previos o ajenos para nuevos trabajos. El especialista recuerda que OpenAI se valió en su momento del buen desarrollo acometido previamente por Google y Meta.

El código abierto, la llave para un uso privado

Una novedad clave de DeepSeek es que ofrece un "código abierto', lo que permite a los usuarios instalarlo en un equipo propio, reentrenarlo y emplearlo sin necesidad de implicarse con una nube que absorbe sus datos. "La información que tú estás utilizando para trabajar con él queda cerrada para ti y no es accesible. Esta es la gran ventaja de los modelos pequeños", puntualiza el profesor universitario. Esto muestra que sus entresijos van más allá de responder con discreción a preguntas comprometidas relacionadas con China, que, curiosamente, "democratiza el modelo de IA abierto de más calidad en el mercado ahora mismo", según expone el propio Herrera.

Trump anunció recientemente una inversión de 500.000 millones en centros de cálculo, una pista de que la carrera por la hegemonía en este campo va a ser menuda. A juicio de Paco Herrera, Europa debe apostar por estar, dentro de sus posibilidades, en esta carrera para conseguir valía para un recurso que "va a ser tan importante como la energía".