Deepseek AI: no asequible, cuesta $ 1.6 mil millones para desarrollar
Deepseek, una startup china destacada, ha hecho olas significativas en la industria de la IA con su último chatbot, que cuenta con una introducción única: "Hola, fui creado para que puedas preguntar cualquier cosa y obtener una respuesta que incluso te sorprenda". Esta audaz declaración refleja las tecnologías innovadoras detrás de los modelos IA de Deepseek, que han contribuido a una de las mayores caídas de precios de las acciones de NVIDIA debido a su ventaja competitiva en el mercado.
Las características destacadas de la IA de Deepseek incluyen:
- Predicción de múltiples token (MTP) : a diferencia de los modelos tradicionales que predicen una palabra a la vez, el modelo de Deepseek pronostica múltiples palabras simultáneamente, mejorando tanto la precisión como la eficiencia mediante el análisis de diferentes partes de una oración.
- Mezcla de expertos (MOE) : esta arquitectura aprovecha 256 redes neuronales, con ocho activadas para cada tarea de procesamiento de tokens, acelerando la capacitación de IA y mejorando el rendimiento.
- Atención latente múltiple (MLA) : este mecanismo se centra en partes cruciales de una oración, extrayendo repetidamente detalles clave para minimizar la posibilidad de faltar información importante, capturando así los datos matizados de manera efectiva.
Deepseek afirma haber capacitado a su poderosa red neuronal, Deepseek V3, por solo $ 6 millones utilizando solo 2048 procesadores gráficos. Sin embargo, una investigación más profunda por semianálisis reveló una infraestructura más extensa, que incluye aproximadamente 50,000 GPU de tolva NVIDIA en varios centros de datos. Esto incluye 10,000 unidades H800, 10,000 H100 y GPU H20 adicionales, utilizadas no solo para la capacitación de IA sino también para la investigación y el modelado financiero. La inversión total de la compañía en servidores alcanza alrededor de $ 1.6 mil millones, con gastos operativos estimados en $ 944 millones.
Como subsidiaria del Fondo de cobertura chino High-Flyer, Deepseek opera de forma independiente, posee sus centros de datos. Esta autonomía permite una innovación e implementación más rápidas, ya que la empresa se autofinancia y no se atasca por procesos burocráticos externos. Deepseek también atrae al máximo talento de las principales universidades chinas, con algunos investigadores ganando más de $ 1.3 millones anuales.
A pesar del reclamo de un costo de capacitación de $ 6 millones, esta cifra solo cubre el uso de la GPU durante la capacitación previa y no incluye gastos más amplios como investigación, refinamiento modelo, procesamiento de datos o costos de infraestructura. Desde su inicio, Deepseek ha invertido más de $ 500 millones en desarrollo de IA, aprovechando su estructura compacta para impulsar innovaciones efectivas de IA.
El viaje de Deepseek destaca cómo una compañía de IA independiente y bien financiada puede desafiar a los gigantes de la industria. Sin embargo, el éxito de la compañía se atribuye a inversiones sustanciales, avances técnicos y un equipo fuerte, en lugar de un "presupuesto revolucionario". Si bien los costos de los competidores son notablemente más altos, DePseek gastó $ 5 millones en R1 en comparación con los $ 100 millones de ChatGPT4O, DePseek sigue siendo un jugador formidable en el panorama de IA.
Imagen: ensigame.com
Imagen: ensigame.com
Imagen: ensigame.com
Imagen: ensigame.com
-
Apr 15,25"The Last of Us Temporada 2: Fecha de lanzamiento y Guía de transmisión" Como un programa de horario estelar de HBO se despide (adiós, el loto blanco), otro se dirige ansiosamente al centro de atención. Dos años después del debut de The Last of Us on Max, esta aclamada adaptación de videojuegos con la aclamación crítica con Pedro Pascal y Bella Ramsey se está preparando para su muy esperada segunda
-
Jan 22,25Kingdom Hearts 4 Will Reboot the Series Kingdom Hearts creator Tetsuya Nomura recently hinted at a pivotal shift for the series with the upcoming fourth mainline installment. This article delves into his revelations about this crucial new chapter. Nomura Hints at a Series Conclusion with Kingdom Hearts 4 Kingdom Hearts 4: A Story Reset,
-
Jan 20,25Se anuncia 'Dungeons of Dreadrock 2', que se lanzará en Nintendo Switch en noviembre y le seguirán las versiones para dispositivos móviles y PC Hace aproximadamente dos años y medio, quedamos cautivados por el encantador juego de exploración de mazmorras, Dungeons of Dreadrock, desarrollado por Christoph Minnameier. Este juego de perspectiva de arriba hacia abajo, que recuerda a clásicos como Dungeon Master y Eye of the Beholder, ofrecía una experiencia única de resolución de acertijos.
-
Dec 10,24Cosplay Marvel emerge: Mohg de Elden Ring impresiona Un impresionante cosplay de Mohg, sorprendentemente similar al jefe de Elden Ring, se ha compartido en línea, cautivando a la comunidad de jugadores. Mohg, Lord of Blood, un jefe semidiós crucial para acceder al reciente DLC Shadow of the Erdtree, ha disfrutado rde una nueva prominencia. Elden Ring, un triunfo de FromSoftware rlanzado en