¿Qué es DeepSeek? Esto sabemos de la nueva app china de IA que ‘asusta’ a ChatGPT y OpenAI

DeepSeek, una startup de inteligencia artificial que nació hace poco más de un año, causó asombro y consternación en Silicon Valley con su innovador modelo de inteligencia artificial que ofrecía un rendimiento comparable al de los mejores chatbots del mundo a un costo aparentemente menor.

Creada en Hangzhou, China, DeepSeek tiene implicaciones de largo alcance para la industria tecnológica global y la cadena de suministro, y ofrece un contrapunto a la creencia generalizada de que el futuro de la inteligencia artificial requerirá cantidades cada vez mayores de potencia y energía para desarrollarse.

¿Qué es exactamente DeepSeek?

DeepSeek es una startup china fundada en 2023 por Liang Wenfeng, el jefe del fondo de cobertura cuantitativo basado en inteligencia artificial High-Flyer. La empresa desarrolla modelos de inteligencia artificial de código abierto y su aplicación móvil homónima se situó en lo más alto de las listas de descargas del iPhone en Estados Unidos tras su lanzamiento a principios de enero.

La aplicación DeepSeek se distingue de otros chatbots como ChatGPT de OpenAI al articular su razonamiento antes de dar una respuesta a una solicitud. La empresa afirma que su versión R1 ofrece un rendimiento a la par con la última de OpenAI y ha otorgado licencia a las personas interesadas en desarrollar chatbots con esta tecnología para que la utilicen.

¿Cómo se compara DeepSeek R1 con OpenAI o Meta AI?

Aunque la empresa no lo ha detallado en detalle, el coste de formación y desarrollo de los modelos de DeepSeek parece ser solo una fracción de lo que se requiere para los mejores productos de OpenAI o Meta Platforms Inc. La eficiencia mucho mejor del modelo pone en tela de juicio la necesidad de grandes gastos de capital para adquirir los aceleradores de IA más recientes y potentes de empresas como Nvidia Corp. Eso también aumenta la atención sobre las restricciones estadounidenses a la exportación de semiconductores tan avanzados a China, que tenían como objetivo evitar un avance del tipo que DeepSeek parece representar.

DeepSeek R1 está cerca o mejor que los modelos rivales en varios puntos de referencia líderes, como AIME 2024 para tareas matemáticas, MMLU para conocimientos generales y AlpacaEval 2.0 para rendimiento de preguntas y respuestas. También se ubica entre los de mejor desempeño en una tabla de clasificación afiliada a UC Berkeley llamada Chatbot Arena.

¿Qué está causando alarma en Estados Unidos con DeepSeek?

Washington ha prohibido la exportación de tecnologías de punta como semiconductores para GPU a China, en un intento de frenar los avances del país en inteligencia artificial, la frontera fundamental en la contienda entre Estados Unidos y China por la supremacía tecnológica.

Pero el progreso de DeepSeek sugiere que los ingenieros de inteligencia artificial chinos han sorteado las restricciones, centrándose en una mayor eficiencia con recursos limitados. Si bien no está claro a cuánto hardware avanzado de entrenamiento de inteligencia artificial ha tenido acceso DeepSeek, la empresa ha demostrado lo suficiente como para sugerir que las restricciones comerciales no han sido del todo efectivas para obstaculizar el progreso de China.

Nvidia ha tratado de descalificar a DeepSeek (Bloomberg)

¿Cuándo despertó DeepSeek el interés mundial?

El desarrollador de inteligencia artificial ha sido seguido de cerca desde el lanzamiento de su primer modelo en 2023. Luego, en noviembre, le dio al mundo un vistazo de su modelo de razonamiento DeepSeek R1, diseñado para imitar el pensamiento humano. Ese modelo sustenta su aplicación de chatbot móvil, que junto con la interfaz web en enero alcanzó renombre mundial como una alternativa mucho más barata a OpenAI, y el inversor Marc Andreessen la llamó “el momento Sputnik de la IA“.

La aplicación móvil DeepSeek fue descargada 1.6 millones de veces hasta el 25 de enero y ocupó el puesto número 1 en las tiendas de aplicaciones de iPhone en Australia, Canadá, China, Singapur, Estados Unidos y el Reino Unido, según datos del rastreador de mercado App Figures.

¿Quién es el dueño de DeepSeek?

Nacido en Guangdong en 1985, Liang obtuvo una licenciatura y una maestría en ingeniería electrónica e informática en la Universidad de Zhejiang. Fundó DeepSeek con solo 10 millones de yuanes (1.4 millones de dólares) de capital registrado, según la base de datos de la empresa Tianyancha.

El obstáculo para futuros avances no es la recaudación de fondos, dijo Liang en una entrevista con el medio chino 36kr, sino las restricciones de Estados Unidos al acceso a los mejores chips. La mayoría de sus principales investigadores son recién graduados de las mejores universidades chinas, dijo, y enfatizó la necesidad de que China desarrolle su propio ecosistema nacional similar al construido alrededor de Nvidia y sus chips de inteligencia artificial.

“Una mayor inversión no necesariamente conduce a una mayor innovación. De lo contrario, las grandes empresas se apoderarían de toda la innovación”, afirmó Liang.

¿Dónde se sitúa DeepSeek en el panorama de la inteligencia artificial de China?

Los líderes tecnológicos de China, desde Alibaba Group Holding Ltd. y Baidu Inc. hasta Tencent Holdings Ltd., han invertido una cantidad significativa de dinero y recursos en la carrera por adquirir hardware y clientes para sus emprendimientos de inteligencia artificial. Junto con la startup 01.AI de Kai-Fu Lee, DeepSeek se destaca por su enfoque de código abierto, diseñado para reclutar la mayor cantidad de usuarios rápidamente antes de desarrollar estrategias de monetización sobre esa gran audiencia.

Debido a que los modelos de DeepSeek son más asequibles, ya han jugado un papel en ayudar a reducir los costos para los desarrolladores de IA en China, donde los actores más grandes se han involucrado en una guerra de precios que ha visto sucesivas oleadas de recortes de precios durante el último año y medio.

¿Cuáles son las implicaciones para el mercado global de IA de DeepSeek?

El éxito de DeepSeek puede impulsar a OpenAI y otros proveedores estadounidenses a reducir sus precios para mantener su liderazgo establecido. También pone en tela de juicio el enorme gasto de empresas como Meta y Microsoft Corp. (cada una de las cuales se ha comprometido a realizar gastos de capital de 65 mil millones de dólares o más este año, principalmente en infraestructura de IA) si los modelos más eficientes pueden competir con un desembolso mucho menor. Eso agitó los mercados bursátiles de Asia, ya que los inversores buscaron nombres chinos vinculados a DeepSeek, como Iflytek Co., y se alejaron de los nombres de la cadena de suministro de fabricación de chips como Advantest Corp. que pueden estar expuestos a cualquier déficit en la demanda esperada de semiconductores de IA.

Los desarrolladores de todo el mundo ya están experimentando con el software de DeepSeek y buscan crear herramientas con él. Eso podría acelerar la adopción de modelos avanzados de razonamiento de IA, al tiempo que podría generar una preocupación adicional sobre la necesidad de establecer límites en su uso. Los avances de DeepSeek pueden acelerar la regulación para controlar cómo se desarrolla la IA.

¿Cuáles son las deficiencias o problemas de DeepSeek?

Al igual que todos los demás modelos de inteligencia artificial chinos, DeepSeek se autocensura en temas considerados sensibles en China. Desvía consultas sobre la Plaza de Tiananmen o cuestiones geopolíticamente conflictivas como la posibilidad de que China invada Taiwán. En las pruebas, el bot DeepSeek es capaz de dar respuestas detalladas sobre figuras políticas como el primer ministro indio Narendra Modi, pero se niega a hacerlo sobre el presidente chino Xi Jinping.

Es probable que la infraestructura en la nube de DeepSeek se vea puesta a prueba por su repentina popularidad. La empresa sufrió una breve interrupción importante el 27 de enero y tendrá que gestionar aún más tráfico a medida que los usuarios nuevos y antiguos envíen más consultas a su chatbot.