Blog elhacker.NET: DeepSeek, la herramienta china que revoluciona la IA mundial

DeepSeek, la herramienta china que revoluciona la IA mundial

lunes, 27 de enero de 2025 | Publicado por el-brujo | Editar entrada

Con una inteligencia artificial cada vez más presente en nuestros dispositivos, hay una aplicación que está rompiendo moldes actualmente. Y no es ChatGPT: DeepSeek, una app basada en los modelos chinos de ese mismo nombre, brinda una herramienta realmente completa, potente y sin coste. Encima, es Open Source. Y se puede descargar al móvil.

El mayor rival de ChatGPT tenía que venir de China: he probado DeepSeek, una IA generativa que lo ofrece todo gratis

DeepSeek es un modelo de lenguaje a lo GPT o Llama que también tiene aplicación
La app Android es gratis y no tiene limitaciones
Una IA generativa que rivaliza contra Gemini o ChatGPT que destaca por contar con una arquitectura MoE (Mixture of Experts) que está revolucionando el campo de las IA.
Está sometida a la regulación de China, y esto quiere decir que no puede hablar de ciertos temas en concreto. El conflicto entre Taiwán y China o Tiananmen son temas vetados, y es que aunque genera el texto de respuesta, al terminar decide borrarlo por completo y mostrar un mensaje en el que avisa que no puede ayudarnos con este tema.

MoE es una gran novedad, puesto que implica a diferentes modelos que están especializados en una tarea concreta. Esto hace que cada orden de entrada se vaya a asignar "a un experto" en concreto para ofrecer un resultado muy preciso. Además, también integra LLM (Large Language Model) para brindar unos resultados mucho más naturales en sus respuestas.

DeepSeek es el nombre de una empresa china especializada en inteligencia artificial. También es el nombre de su chat de IA, una alternativa propia a Copilot, Gemini y compañía. Por lo tanto, puedes escuchar y leer menciones a DeepSeek refiriéndote a ambas cosas.

Su modelo más avanzado de razonamiento, R1, con 671,000 millones de parámetros, es más potente que ChatGPT o1, la versión más potente hasta el momento de OpenAI, pero gratuito en su uso casual y mucho más barato en uso corporativo. Para entrenarlo, la compañía ha empleado únicamente seis millones de dólares, un 3% del coste de modelos comparables como el de OpenAI. Pero además, es de código abierto, con una licencia MIT, te lo puedes instalar en tu propio entorno, y ha hecho que muchas compañías de inteligencia artificial que estaban pagando tokens carísimos a OpenAI hayan dejado inmediatamente de hacerlo para pasarse a Deepseek R1.

La cronología de los hechos

A finales del año pasado, empezó a destacar DeepSeek, una startup china de IA que sorprendió el sector con el lanzamiento de un modelo de IA de código abierto con 685.000 millones de parámetros. Lo que fue titular no fue solo su escalera, sino su rendimiento: superó los últimos modelos de OpenAI y Meta mientras se desarrollaba a una fracción del coste. DeepSeek llamó la atención por primera vez después de que un informe de la CNBC revelara que su modelo DeepSeek V3 había superado el Llama 3.1 de Meta, el GPT-4o de OpenAI y el Qwen 2.5 de Alibaba en puntos de referencia de terceros.

DeepSeek v3 se entrenó con un presupuesto de solo 5,6 millones de dólares, un presupuesto del cual Meta gasta para todos sus proyectos de IA. Eso ha provocado frustración interna, especialmente con el equipo de dirección de Meta, que ahora se ve presionada para justificar sus presupuestos. Algunas personas incluso han señalado que los sueldos de ciertos líderes de IA en Meta superan todo el presupuesto de formación de DeepSeek.

Los dos modelos disponibles de DeepSeek: V3 y R1

Solo un mes después de lanzar DeepSeek V3, la compañía subió todavía más el listón con el lanzamiento de DeepSeek-R1, un modelo de razonamiento posicionado como una alternativa creíble al modelo o1 de OpenAI. Con licencia del MIT, DeepSeek-R1 permite a los desarrolladores destilar y comercializar sus capacidades libremente. Esta accesibilidad lo ha convertido en una opción atractiva para equipos y desarrolladores más pequeños que trabajan con presupuestos ajustados que todavía necesitan soluciones de IA de alto rendimiento.

Sobre DeepSeek r1, se rumorea que incluye innovaciones que podrían interrumpir la industria de la IA. Aunque los detalles específicos permanecen en secreto, otros expertos aseguran que este desarrollo ha sacudido no solo Meta, sino también rivales como Google, OpenAI y Anthropic. El enfoque único de DeepSeek para el aprendizaje de refuerzo y otras técnicas de IA está forzando a los competidores a repensar sus estrategias. Los empleados de Meta hablan en línea sobre el caos de la división de IA generativa de la empresa. El OP incluso la describió como una situación de "demasiados cocineros", con prioridades conflictivas entre los equipos de ingeniería y de producto.

Preguntarle cualquier cosa a la IA es posible desde hace más de dos años, la idea de aplicar un chatbot a los modelos de lenguaje hizo que Open AI sentase las bases de una industria que no hizo más que crecer. Y claro, fueron surgiendo numerosas alternativas, algunas tan o más buenas como el original. Porque, ¿necesitas un chatbot con el LLM más reciente y que no ofrezca limitaciones de uso? Dale una oportunidad a DeepSeek.

DeepSeek es un chatbot con IA muy potente, fiable y de código libre

DeepSeek V3 es el último modelo de lenguaje creado por DeepSeek. Según los benchmarks, dicho LLM supera a contrincantes tan establecidos como Llama 3.1 405B o GPT-4o. Ofrece 671.000 millones de parámetros (671B) y hasta 60 tokens por segundo. Dispone de razonamiento aplicado y es multimodal.

Aparte de la pertinente API para que cualquiera pueda integrar DeepSeek en sus aplicaciones y servicios, los desarrolladores ofrecen aplicaciones móviles y un cliente a través de la web (es necesario una cuenta de usuario). Los tres son gratuitos en el uso y no restan posibilidades al modelo; por lo que DeepSeek ofrece un servicio más amplio que el propio ChatGPT, esto es muy interesante para quienes necesiten un chatbot sin limitaciones (la API sí está disponible bajo pago). En línea de Gemini, aunque con toda la potencia del modelo más reciente.

¿Y qué se puede hacer con DeepSeek? Una vez instalada la aplicación en Android, y tras el registro de usuario (con la cuenta de Google es suficiente), la app muestra una ventana de conversación con el clásico cuadro de texto desde el que introducir las órdenes o prompts. Podemos preguntarle de todo: desde cuestiones de información general a pedir que componga código. Con un botón de pensamiento profundo (R1) que activa un modo bastante similar a los modelos o1 de Open AI.

Activando el modo de razonamiento profundo o R1 DeepSeek se tomará más tiempo para responder mostrando en pantalla todos los pasos por los que camina su respuesta

Los resultados me han parecido excelentes: como norma general, incluso mejores que los de Gemini y ChatGPT. Muy rápido, con respuestas muy naturales, entiende perfectamente el español, su razonamiento avanzado me ha parecido muy natural y no he podido pillarle ni con problemas de razonamiento abstracto. Me ha sorprendido mucho la eficacia de DeepSeek.

Totalmente gratis, incluido el razonamiento avanzado

DeepSeek puede responder preguntas, resolver problemas y puzzles, analizar textos y resumirlos, leer documentos, permite la búsqueda en web, es multiplataforma y guarda los chats para permitir el acceso a ellos con independencia del dispositivo. Según su política de privacidad, DeepSeek registra los datos de uso y determinada información de usuario. Esta información se guarda en servidores chinos, hay que tenerlo en cuenta.

La información, incluida la de usuario, se guarda en servidores chinos

El chatbot tiene un potencial enorme y carece de las limitaciones habituales de herramientas como ChatGPT o Gemini: DeepSeek admite el uso de los modelos más avanzados sin límite de acceso. DeepSeek V3 con R1 está disponible de forma abierta.

Bajo mis pruebas, me ha parecido una aplicación a tener muy en cuenta para quienes utilizamos de manera habitual las herramientas de IA. Para revisar textos, buscar información o resumir el contenido de documentos gigantescos, por ejemplo. Como todas las apps de este estilo, hay que tomarse sus respuestas con cautela: DeepSeek puede cometer errores. La percepción que tengo es que su nivel de alucinaciones está bastante contenido. Su conocimiento alcanza hasta julio de 2014.

Para acceder a DeepSeek sólo hay que descargar la aplicación desde Google Play. Necesita un registro de usuario, es gratuita, carece de anuncios y tampoco tiene suscripciones. Esto puede hacer que el servicio no funcione debido a la alta demanda.

La aplicación de DeepSeek R1 se ha convertido en la aplicación más descargada en la Apple App Store. Superando así competidores establecidos, como ChatGPT, y aumentando la preocupación entre los inversores sobre la posible interrupción en el sector de la IA. Y es que claro, te ofrece lo mismo o más, sin pagar los 20 dólares al mes de la versión de pago de ChatGPT.

La falta de medios agudiza el ingenio

Hasta ahora, el objetivo de la mayoría de IAs era hacerlo todo más grande para así tener más potencia y poder analizarlo todo de una forma mucho más eficiente. Sin embargo, Estados Unidos vetó a China del hardware necesario para llevar a su IA a un nuevo nivel, o esa era la intención. Realmente han conseguido hacer que la IA sea más eficiente.

Desde 2022, China no tiene acceso a chips avanzados con tecnología propietaria de EE. UU. lo que hizo que se vieran obligados a optimizar sus métodos de entrenamiento para llevarlos a un nuevo nivel.

El equipo de desarrollo, lleno de jóvenes talentos recién salidos de universidades técnicas en Pekín o Tsinghua han hecho lo que a priori parecía imposible, batir de la nada a Estados Unidos con un enfoque de código abierto y con la capacidad de ser más eficiente en su uso. Y es que solo costaría un 5% del precio total de las soluciones de IA que ofrece OpenAI.

Y es que, hasta ahora, las IAs chinas se habían quedado rezagadas respecto al potencial de Estados Unidos, pero parece que esto ha cambiado con el lanzamiento de la versión R1 de DeepSeek. Para ello, utilizaron sistemas con esquemas de comunicación personalizados entre chips para que los modelos consumieran mucho menos recursos. Las tecnologías clave para esto han sido la Multi-head Latent Attention (MLA) y la Mixture-of-Experts.

Su creador está ligado al Partido Comunista

Aunque el desarrollo de DeepSeek está garantizado por los fondos de High-Flyer, algunos han señalado que existe un tercero en discordia: el gobierno de China. Un reporte afirma que Liang Wenfeng tiene un estrecho vínculo con el Partido Comunista Chino y que DeepSeek contó con apoyos estatales para acelerar el desarrollo de la IA.

Si bien esto no es extraño en una empresa china de tecnología, expertos en seguridad afirman que DeepSeek podría ser usado para identificar vulnerabilidades en sistemas de países enemigos. Esta capacidad para procesar y analizar conjuntos de datos masivos sería clave para usar los exploits como arma contra infraestructura de Estados Unidos. La IA también serviría para tareas de espionaje, crear campañas de desinformación y otros usos para los que no fue diseñada.

Aunque algunas de estas críticas tienen sustento, lo cierto es que ChatGPT, Gemini y otras IA occidentales ya son utilizadas para este fin. A eso se suma que Project Stargate de OpenAI tiene apoyo abierto del gobierno de Estados Unidos para impulsar al país como potencia en el desarrollo de esta tecnología.

Fuentes:
https://www.xatakandroid.com/aplicaciones-android/mayor-rival-chatgpt-tenia-que-venir-china-he-probado-deepseek-ia-generativa-que-ofrece-todo-gratis

https://www.elnacional.cat/oneconomia/es/on-ia/meta-ay-entra-en-panico-con-china-deepseek-mas-barata-facil-potente_1351804_102.html

Etiquetas: china , deepseek , inteligencia artificial , LLM

0 comentarios :

Publicar un comentario

Los comentarios pueden ser revisados en cualquier momento por los moderadores.

Serán publicados aquellos que cumplan las siguientes condiciones:
- Comentario acorde al contenido del post.
- Prohibido mensajes de tipo SPAM.
- Evite incluir links innecesarios en su comentario.
- Contenidos ofensivos, amenazas e insultos no serán permitidos.

Debe saber que los comentarios de los lectores no reflejan necesariamente la opinión del STAFF.

Productos FTTH

Tutoriales y Manuales

Entradas Mensuales

Síguenos en:

Blogroll

Etiquetas

Entradas populares