PEKÍN.- La empresa tecnológica china Alibaba -cuyo fundador y presidente ejecutivo es el millonario Jack Ma– lanzó el miércoles una nueva versión de su modelo de Inteligencia Artificial (IA) Qwen 2.5 que, afirmó, supera al aclamado DeepSeek-V3.

El inusual momento de la presentación de Qwen 2.5-Max, el primer día del Año Nuevo Lunar, cuando la mayoría de los chinos no trabajan y están con sus familias, apunta a la presión que el meteórico ascenso de la empresa china de inteligencia artificial DeepSeek en las últimas tres semanas ha ejercido no sólo sobre sus rivales extranjeros, sino también sobre su competencia nacional.

“Qwen 2.5-Max supera prácticamente a GPT-4o, DeepSeek-V3 y Llama-3.1-405B”, afirma la unidad de nube de Alibaba en un anuncio publicado en su cuenta oficial de WeChat, en referencia a los modelos de IA de código abierto más avanzados de OpenAI y Meta.

El logo de la firma china Alibaba. (AP Photo/Thibault Camus)

Alibaba Cloud explicó que el nuevo Qwen2.5 deriva de uno anterior, que los desarrolladores han probado en los últimos cinco meses y gracias al cual lograron crear un modelo de lenguaje “más útil”. De este modo, “da un salto significativo con respecto al modelo anterior” y lo mejoró al incorporar “potentes capacidades de análisis de documentos”.

El lanzamiento el 10 de enero del asistente de IA de DeepSeek, basado en el modelo DeepSeek-V3, así como el lanzamiento el 20 de enero de su modelo R1, han conmocionado a Silicon Valley y provocaron el desplome de las acciones tecnológicas.

Los supuestos bajos costos de desarrollo y uso de la empresa emergente china han llevado a los inversores a cuestionar los enormes planes de gasto de las principales empresas de IA de Estados Unidos. Pero el éxito de DeepSeek también provocó una lucha entre sus competidores nacionales por mejorar sus propios modelos de IA.

El ícono de la aplicación móvil DeepSeek en la pantalla de un teléfono inteligente en Pekín. (AP/Andy Wong)

Dos días después del lanzamiento de DeepSeek-R1, ByteDance, propietaria de TikTok, publicó una actualización de su modelo insignia de IA, que, según afirmaba, superaba al o1 de OpenAI, respaldado por Microsoft, en AIME, una prueba de referencia que mide la capacidad de los modelos de IA para comprender y responder a instrucciones complejas.

DeepSeek afirma que su modelo R1 rivaliza con el o1 de OpenAI en varias pruebas de rendimiento.

El predecesor del modelo V3 de DeepSeek, DeepSeek-V2, desencadenó una guerra de precios de modelos de IA en China tras su lanzamiento en mayo pasado.

El hecho de que DeepSeek-V2 fuera de código abierto y tuviera un precio sin precedentes, sólo 1 yuan (0,14 dólares) por 1 millón de tokens -o unidades de datos procesados por el modelo de IA-, llevó a la unidad en la nube de Alibaba a anunciar recortes de precios de hasta el 97% en una serie de modelos.

El mutlimillonario fundador de Alibaba, Jack Ma, es uno de los emprendedores más famosos de China.

Otras empresas tecnológicas chinas siguieron su ejemplo, como Baidu, que lanzó el primer equivalente chino a ChatGPT en marzo de 2023, y la empresa de Internet más valiosa del país, Tencent.

Liang Wenfeng, el enigmático fundador de DeepSeek, dijo en julio, en una rara entrevista con el medio chino Waves, que a la empresa emergente “no le importaba” la guerra de precios y que su principal objetivo era lograr la AGI (Inteligencia Artificial General).

Liang Wenfeng, el fundador de DeekSeek, siempre mantuvo el perfil bajo

OpenAI define la AGI como sistemas autónomos que superan a los humanos en la mayoría de las tareas de valor económico.

Mientras que grandes empresas tecnológicas chinas como Alibaba tienen cientos de miles de empleados, DeepSeek funciona como un laboratorio de investigación, formado principalmente por jóvenes licenciados y estudiantes de doctorado de las mejores universidades chinas.

Liang dijo en su entrevista de julio que creía que las mayores empresas tecnológicas chinas podrían no ser adecuadas para el futuro de la industria de la IA, contrastando sus elevados costos y sus estructuras jerárquicas con el funcionamiento ágil y el estilo de gestión flexible de DeepSeek.

“Los grandes modelos fundacionales requieren una innovación continua, las capacidades de los gigantes tecnológicos tienen sus límites”, afirmó Liang.

Eduardo Baptista

Agencia Reuters