Tutoriales y Manuales
Entradas Mensuales
-
▼
2025
(Total:
189
)
-
▼
febrero
(Total:
24
)
- Todos los modelos de IA de OpenAI
- Las impresoras 3D en Estados Unidos podrían ser in...
- El Pentágono bloquea DeepSeek en menos de una sema...
- Limpieza y mantenimiento de una tarjeta gráfica
- Conectores PCI Express x16, x8, x4 y x1: diferenci...
- Reportan algunos problemas para las GeForce RTX 5090
- Microsoft presenta el Surface USB4 Dock por 99$
- NVIDIA Studio Voice convierte el mediocre micrófon...
- OpenAI quiere diseñar robots humanoides impulsados...
- Europa anuncia OpenEuroLLM, su plan para plantarle...
- OpenAI quiere reemplazar los smartphones con un di...
- Análisis de las principales vulnerabilidades explo...
- WhatsApp detecta un ataque de spyware tipo Pegasus...
- El coste real de DeepSeek no fue de 6 millones de ...
- Windows Paint tendrá un botón de Copilot para acel...
- Guía DeepSeek: funciones y cosas que puedes hacer ...
- Cómo utilizar un SSD NVMe en Raspberry Pi
- OpenAI responde a DeepSeek publicando o3 para todos
- Cómo crear gráficos a partir de datos con ChatGPT
- App falsa de DeepSeek roba datos en Mac
- Deep Research, nueva herramienta de investigación ...
- NoName057 realiza nuevos ataques DDoS España: a la...
- Detenida en Valencia una pareja clave en la gestió...
- Manual funcionamiento GParted (edita, modifica y r...
-
▼
febrero
(Total:
24
)
-
►
2024
(Total:
1110
)
- ► septiembre (Total: 50 )
-
►
2023
(Total:
710
)
- ► septiembre (Total: 65 )
-
►
2022
(Total:
967
)
- ► septiembre (Total: 72 )
-
►
2021
(Total:
730
)
- ► septiembre (Total: 56 )
-
►
2020
(Total:
212
)
- ► septiembre (Total: 21 )
-
►
2019
(Total:
102
)
- ► septiembre (Total: 14 )
-
►
2017
(Total:
231
)
- ► septiembre (Total: 16 )
-
►
2016
(Total:
266
)
- ► septiembre (Total: 38 )
-
►
2015
(Total:
445
)
- ► septiembre (Total: 47 )
-
►
2014
(Total:
185
)
- ► septiembre (Total: 18 )
-
►
2013
(Total:
100
)
- ► septiembre (Total: 3 )
-
►
2011
(Total:
7
)
- ► septiembre (Total: 1 )
Blogroll
Etiquetas
Entradas populares
-
Cómo instalar DeepSeek en tu ordenador , para poder utilizarlo cuando quieras. Hay varias maneras de hacerlo, pero nosotros vamos a intentar...
-
Solo hizo falta una Raspberry Pi Pico de 12 euros y 43 segundos para que un hacker se saltara la seguridad de BitLocker para acceder a todos...
-
No solo debemos tener cuidado con los enlaces a los que accedemos o las apps que instalamos en nuestros móviles: también hay que extremar la...
El coste real de DeepSeek no fue de 6 millones de dólares
DeepSeek sacudió los cimientos de la IA porque, en teoría, se trataba de un LLM muy avanzado que había tenido un coste total de solo 6 millones de dólares. Suena bien, quizá demasiado bien para ser verdad, y los datos de un estudio compartido por SemiAnalysis han confirmado que todo ha sido una mentira que nos hemos querido creer.
El estudio que han elaborado parte de una clave tan básica como importante, el coste del hardware necesario para entrenar a DeepSeek. Para sacar adelante ese entrenamiento se utilizaron GPUs NVIDIA, concretamente bloques de modelos H800 y H100, cuyo coste total es de unos 1.600 millones de dólares. A esto debemos sumar el coste operativo de mantener y utilizar esos bloques, que sería de unos 944 millones de dólares.
En total, para entrenar a DeepSeek se habrían utilizado alrededor de 60.000 GPUs NVIDIA, y el coste final acumulado habría sido, según los datos de SemiAnalysis, de 2.573 millones de dólares. A todo esto debemos sumar algo muy importante, y es el coste relacionado con los datos necesarios para poder «alimentar» a un modelo como este.
Según las últimas informaciones los responsables de esta IA podrían haber robado datos a OpenAI, y habrían entrenado a DeepSeek utilizando lo que se conoce como destilación de resultados. Este tipo de prácticas violan las políticas de uso de de la API OpenAI, aunque permiten reducir significativamente los costes de entrenamiento de una IA.
Esos 6 millones de dólares se atribuye únicamente al coste a nivel GPU de la ronda de pre-entrenamiento de la IA, que representa únicamente una pequeña parte del coste total del modelo, y que deja fuera del coste total cosas tan importantes como los gastos necesarios para el proceso de I+D y el coste total de propiedad del hardware.
En resumen, y dicho de una manera simplista, no representa el coste real. Por otro lado, que DeepSeek haya sido capaz de tener acceso a un bloque de GPUs tan impresionante para entrenar IA confirma que algo está mal en la aplicación de las políticas de restricción de este tipo de hardware a China, un tema que ya está siendo objeto de una investigación.
¿Realmente es DeepSeek tan impresionante?
No hay duda de que a nivel técnico representa un avance importante en el mundo de la inteligencia artificial, pero también depende de con qué lo comparemos. En relación coste por millón de tokens ofrece un valor muy buen frente a determinados modelos, como GPT-4o-0513, pero queda por detrás de GPT-4o-mini y de Llama 3.2 70B.
Iremos viendo cómo sigue evolucionando este tema, y cómo termina toda la polémica que se ha generado alrededor de este modelo, pero una cosa podemos tener clara, y es la llegada de DeepSeek al final será muy beneficiosa de cara a incrementar la competencia entre modelos de IA avanzada, y esto debería tener un impacto positivo en el sector.
Fuentes:
0 comentarios :
Publicar un comentario
Los comentarios pueden ser revisados en cualquier momento por los moderadores.
Serán publicados aquellos que cumplan las siguientes condiciones:
- Comentario acorde al contenido del post.
- Prohibido mensajes de tipo SPAM.
- Evite incluir links innecesarios en su comentario.
- Contenidos ofensivos, amenazas e insultos no serán permitidos.
Debe saber que los comentarios de los lectores no reflejan necesariamente la opinión del STAFF.