DeepSeek V-3, el último modelo de inteligencia artificial desarrollado en China, ha despertado gran interés a nivel mundial, presentándose como uno de los actores más prometedores dentro de la competencia entre modelos avanzados de IA. Este sistema no solo rivaliza con gigantes como ChatGPT (GPT-4o) de OpenAI y Llama 3.1 de Meta, sino que también muestra resultados destacados en categorías específicas, así lo señala un informe técnico difundido por DeepSeek AI.
La compañía asegura que DeepSeek V-3 requiere únicamente dos mil setecientos ochenta y ocho millones de horas GPU H800 para su entrenamiento. En comparación, modelos como los de OpenAI, que emplean la GPU Nvidia H100 –más avanzada en cuanto a ancho de banda y rendimiento–, exigen mayores recursos computacionales. Sin embargo, el informe enfatiza: “DeepSeek V-3 supera a otros modelos abiertos y consigue un rendimiento comparable con los mejores sistemas cerrados”.
Comparativa en desempeño: las fortalezas del modelo chino
Entre las ventajas competitivas del modelo chino destacan su capacidad de análisis y comprensión en ámbitos complejos. “De acuerdo con DeepSeek AI, el modelo supera a ChatGPT en inglés en pruebas como MMLU Redux y DROP (3-shot F1), donde demuestra mayor precisión y razonamiento en tareas que abarcan diferentes áreas como matemáticas, ciencias y humanidades”, explica el informe técnico publicado.
El benchmark MMLU Redux es una variante simplificada del popular test de Comprensión Masiva de Lenguaje Multitarea, que evalúa el entendimiento del modelo en más de cincuenta disciplinas. Además, en el test DROP, diseñado para medir algoritmos sobre párrafos extensos, DeepSeek V-3 alcanza una notable calificación de precisión al realizar operaciones como sumas y comparaciones.
En contraste, OpenAI mantiene su ventaja en categorías específicas como SimpleAQ (Calidad de Respuesta Simple) y FRAMES, enfocados en evaluar la claridad de respuestas breves y la coherencia en diálogos complejos, respectivamente.
Eficiencia y democratización: el impacto económico y social de DeepSeek
Un aspecto disruptivo es la inversión significativamente inferior en el desarrollo del modelo chino si se compara con otros líderes de IA. Mientras que las empresas occidentales destinan millas de millones de dólares en sus modelos, “DeepSeek V-3 tuvo un costo de cinco mil quinientos setenta y seis millones de dólares”, asegura el informe técnico. Esto lo convierte en una opción más accesible para su implementación.
Edwin Huaynate, catedrático de la Universidad de Lima, detalla el impacto de esta economía de recursos: “Esta eficiencia representa un cambio disruptivo que podría democratizar el acceso a la IA y brindar a diversas regiones la posibilidad de adaptar la tecnología a sus necesidades específicas”, declaró en conversación con DeepSeek AI. Además, resalta que el modelo abierto permite modificaciones y mejoras flexibles, algo que contrasta notablemente con las restricciones habituales en sistemas desarrollados en Occidente.
Reacción del mercado: una tormenta tecnológica
El auge de DeepSeek V-3 ya se ha reflejado en los mercados financieros. A principios de esta semana, se registró una caída abrupta del índice Nasdaq, con un descenso del 3,07 % en el valor promedio de las acciones tecnológicas y una pérdida acumulada de seiscientos mil millones de dólares en la valoración de Nvidia, uno de los principales fabricantes de chips. Este hecho subraya las implicaciones económicas globales que los desarrollos de IA chinos están comenzando a generar.
Pese a estas fluctuaciones, Nvidia muestra una recuperación parcial, mientras los analistas observan con atención el comportamiento a largo plazo de las empresas afectadas por el crecimiento de DeepSeek V-3.
Uso gratuito y tutoriales para empresas
Otro atractivo de este modelo reside en su accesibilidad. Según DeepSeek AI, los usuarios pueden registrarse gratuitamente para acceder a DeepSeek V-3. Además, AMD ha lanzado un tutorial sobre cómo operar versiones optimizadas del modelo DeepSeek R1 Distilled en dispositivos con tecnología AMD Ryzen AI y Radeon. “Implementar estos modelos en los procesadores Ryzen y tarjetas gráficas Radeon ya es muy sencillo y está disponible a través de LM Studio”, señaló la compañía en su blog oficial.
Por otro lado, los documentos técnicos para el uso del modelo especializado DeepSeek R-1 están disponibles en GitHub, lo que permite a las empresas explorar estas herramientas e integrarlas en sus operaciones acorde a sus propias necesidades.
Diferencias clave con GPT-4o: idioma, datos en tiempo real y fecha de entrenamiento
Mientras que ChatGPT limita sus datos de entrenamiento a abril de 2023, DeepSeek V-3 incorpora información hasta julio de 2023. Además, el modelo chino sobresale por incluir contenido basado en datos en tiempo real sin costo adicional, algo que podría representar una ventaja significativa frente al modelo gratuito de OpenAI.
El idioma nativo del también modelo es un aspecto destacable. Aunque ChatGPT, en su versión para inglés, sobresale en métricas conversacionales específicas, DeepSeek V-3 registra un desempeño superior en idiomas orientales y en áreas técnicas como programación y matemáticas.
¿El mejor modelo abierto de inteligencia artificial?
La combinación de eficiencia económica, flexibilidad en código abierto y un rendimiento técnico competitivo ha posicionado a DeepSeek V-3 como una de las opciones más prometedoras en el mundo de la inteligencia artificial. Según Huaynate, “las empresas que antes no podían permitirse adoptar estas tecnologías tienen ahora una oportunidad concreta para innovar y mejorar sus procesos”, una tendencia que, de consolidarse, podría transformar la mano de obra tecnológica global y los costos asociados a herramientas avanzadas.
Por el momento, el desafío principal que tendrá DeepSeek V-3 será mantenerse relevante en un mercado altamente competitivo y demostrar su capacidad a largo plazo más allá de los benchmarks. A medida que las empresas y los desarrolladores exploran sus posibilidades, el modelo chino seguirá marcando la agenda tanto en innovación como en mercado tecnológico.
¿Cómo usar DeepSeek gratis?
Para utilizar el chatbot del modelo de IA DeepSeek, simplemente accede al sitio web oficial de DeepSeek o descarga la aplicación desde Google Play. Luego, puedes registrarte con un correo electrónico o iniciar sesión usando tu cuenta de Google. Es importante tener en cuenta que debido a su popularidad reciente, la plataforma puede experimentar lentitud ocasionalmente y restricciones en la creación de nuevas cuentas durante períodos de alta demanda.
Una vez que hayas creado tu cuenta, podrás realizar consultas o solicitudes al estilo de ChatGPT. Por ejemplo, puedes preguntar sobre las diferencias entre diferentes modelos de IA o solicitar la creación de una tabla que compare sus características distintivas y similitudes. Los usuarios pueden interactuar en español y recibir respuestas en el mismo idioma.