Entradas Mensuales

Síguenos en:

Canal Oficial Telegram de elhacker.NET Grupo Facebook elhacker.NET Twitter elhacker.NET Canal Youtube elhacker.NET Comunidad Steam: Grupo elhacker.NET Mastodon

Entradas populares

PostHeaderIcon DeepSeek presenta un nuevo modelo de inteligencia artificial que cambia la manera en que se entrena y responde


En 2002 se produjo el primer lanzamiento relevante, ChatGPT, y desde entonces hemos visto una evolución sin precedentes, con varios hitos entre los que destaca Deepseek.




 


Este proyecto chino ha destacado por su eficiencia y potencia, y ahora han anunciado un nuevo modelo llamado DeepSeek-V3.2-Exp que promete un cambio en la forma de entrenar este tipo de IAs.

No se trata de un modelo radicalmente nuevo, ya que se basa en DeepSeek 3.1 Terminus, el modelo anterior.

Pero sí que tiene algo que lo hace importante, un cambio que podría ser algo constante en los futuros desarrollos de la empresa china.

 

DeepSeek Sparse Attention

Se trata de DeepSeek Sparse Attention, un mecanismo de atención difusa diseñado para explorar y validar optimizaciones para la capacitación y la eficiencia de inferencia en escenarios de contexto largo.

Es decir, cuando el modelo ha de ser entrenado, es capaz de validar por sí mismo ciertos parámetros, que hacen que el proceso sea mucho más eficaz.

En vez de centrarse en una sola "línea de pensamiento", DeepSeek 3.2 podrá utilizar varias simultáneamente, con lo que la fiabilidad debería verse aumentada.

Además, la compañía ha confirmado que esta nueva versión de su modelo está ya disponible en la aplicación, la web y mediante el uso de su API.

Y esta ha bajado sus precios drásticamente nada menos que un 50%, lo que tiene que suponer un dolor de cabeza para sus competidores.

 

El impacto del código abierto

Al ser un modelo de código abierto, DeepSeek AI permite que investigadores, desarrolladores y empresas de todo el mundo puedan utilizar, estudiar y modificar libremente su código.

Esta filosofía contrasta con los modelos "cerrados" de grandes corporaciones, democratizando el acceso a la inteligencia artificial de última generación, y dándole a China una ventaja importante.

El carácter "experimental" de esta versión indica que es un vistazo al futuro de la tecnología de DeepSeek.

Con este lanzamiento, DeepSeek AI no solo presenta un modelo más, sino que redefine lo que es posible en el equilibrio entre potencia, eficiencia y accesibilidad en el campo de la inteligencia artificial.

 

Fuentes:

https://www.elespanol.com/elandroidelibre/noticias-y-novedades/20250929/deepseek-lanza-nuevo-modelo-inteligencia-artificial-cambia-manera-entrena-responde/1003743946291_0.amp.html


0 comentarios :

Publicar un comentario

Los comentarios pueden ser revisados en cualquier momento por los moderadores.

Serán publicados aquellos que cumplan las siguientes condiciones:
- Comentario acorde al contenido del post.
- Prohibido mensajes de tipo SPAM.
- Evite incluir links innecesarios en su comentario.
- Contenidos ofensivos, amenazas e insultos no serán permitidos.

Debe saber que los comentarios de los lectores no reflejan necesariamente la opinión del STAFF.