Entradas Mensuales

Síguenos en:

Canal Oficial Telegram de elhacker.NET Grupo Facebook elhacker.NET Twitter elhacker.NET Canal Youtube elhacker.NET Comunidad Steam: Grupo elhacker.NET Mastodon

Entradas populares

PostHeaderIcon Kimi K2 es un potente modelo de IA chino que sobresale en razonamiento complejo


Kimi K2 es un nuevo LLM de la empresa china Moonshot AI, con un billón de parámetros y 32.000 millones por inferencia. Es sorprendentemente bueno en razonamiento y chat. Me atrevería a decir que su versión más potente, Kimi K2 Thinking, está al nivel de un ChatGPT-5 (Plus) que es el buque insignia de OpenAI que lleva décadas de trabajo a sus espaldas. Aunque algo lento, Kimi me ha llamado la atención sobremanera y ya lo tengo guardado en «Herramientas IA».

 



Una startup china llamada Moonshot acaba de lanzar Kimi K2 Thinking, un gigantesco  modelo abierto con un billón de parámetros que ha hecho algo que parecía casi imposible: superar a los mejores modelos propietarios de empresas como OpenAI, Google o Anthropic. Si creíamos que los modelos "Open Source" jamás podrían competir con GPT-5, Gemini 2.5 Pro o Claude, estábamos equivocados.

 Los benchmarks. Los responsables de Moonshot explicaban cómo Kimi K2 Thinking logra las puntuaciones más altas en Humanity's Last Exam (conocimientos generales, 44,9%) y en BrowserComp (navegadores agénticos, 60,2%). Está casi al nivel de Claude en el test de desarollo software SWE, y también es casi el mejor en otro de esos benchmarks, LiveCodeBench v6. Es cierto que en algunos test sigue estando ligeramente por detrás de sus rivales "occidentales", pero el logro es espectacular.

A todas luces, la versión chat de Kimi K2 es un calco de ChatGPT-5, con prácticamente las mismas funciones, excepto la generación de imágenes, de las que de momento carece. Las preguntas se hacen igual, se puede ver la cadena de razonamiento, pararla, editar, y hay un histórico de chats. Registrarse es gratis y solo hace falta una cuenta de Google o un teléfono.




A pensar tranquilamente

Según sus creadores, lo más destacable de Kimi K2-Thinking son sus capacidades de razonamiento paso a paso y el uso autónomo de herramientas. Puede realizar entre 200 y 300 llamadas secuenciales a herramientas internas sin intervención humana, demostrando una capacidad excepcional para resolver problemas complejos a través de razonamientos largos, algo de lo que otros modelos adolecen. La versión K2-Instruct es más para chats generales sin tanta floritura.


En términos de rendimiento, mis humildes pruebas caseras lo sitúan en lo más alto, a rebufo de ChatGPT, tanto en pruebas de lógica, palabras y cuestiones comunes como cuando preguntas con trampa para «pillar». Como plus, parece tener menos filtros de seguridad que GPT, así que por ejemplo te explica cómo robar un banco por diversos métodos, si le preguntas («a punta de pistola», «montando un Ponzi», «con cheques falsos»…) Por otro lado, no está sesgado a lo Grok y también te dice que la homeopatía son paparruchas, que lo de las visitas a la Tierra de los ovnis es algo anticientífico y sin pruebas y que lo de que Bill Gates quiera dominar el mundo le parece una leyenda urbana.

El caso es que según sus creadores Kimi K2 alcanza cifras destacadas en las principales pruebas comparativas de la industria: un 44,9 % en el Humanity’s Last Exam, que incluye miles de preguntas en más de 100 materias; un 60,2% en BrowseComp de OpenAI y un 71,3% en SWE-Bench (programación), aunque queda por debajo de Claude, GPT y otros. No lo he probado en esa vertiente, pero dicen que es bueno creando interfaces con HTML y React.

 

De momento está disponible en su web en modo chat y en versión gratuita, también mediante API y pronto saldrá la versión completa en modo agente, que esperemos también llegue a Europa. Además de la versión de andar por casa hay disponibles versiones más rápidas y potentes (Turbo ×4 y más allá) e incluso la más potente da prioridad «en horas punta», así que todo eso va a gusto del consumidor. Si se quiere algo más rápido se puede usar el Kimi 1.5 también gratis. Los precios para sacarle más partido son de 19, 39 y 199 dólares al mes para chat, y otros precios para la API.

Alibaba está detrás. Aunque el modelo está desarrollado por una startup independiente llamada Moonshot, dicha firma ha sido apoyada económicamente por Alibaba, que se está convirtiendo en una absoluta potencia en este ámbito. Ya no solo se conforma con desarrollar sus propios modelos, que son sobresalientes (Qwen es el claro ejemplo), sino que además está financiando el desarrollo de otros modelos como Kimi K2/Thinking.

China y su amor por los modelos de IA abiertos. Durante los últimos meses hemos comprobado como China dominaba en el ámbito de los modelos de IA abiertos —que no "Open Source"—. El gigante asiático ha adoptado una filosofía arrolladora con modelos cada vez mejores pero que hasta ahora parecían ir varios pasos por detrás de los grandes modelos propietarios de OpenAI, Anthropic o Google. Esto ya no es así.


 Fuentes

https://www.microsiervos.com/archivo/ia/kimi-k2-llm-razonamiento-ia.html

https://github.com/MoonshotAI/Kimi-K2 


0 comentarios :

Publicar un comentario

Los comentarios pueden ser revisados en cualquier momento por los moderadores.

Serán publicados aquellos que cumplan las siguientes condiciones:
- Comentario acorde al contenido del post.
- Prohibido mensajes de tipo SPAM.
- Evite incluir links innecesarios en su comentario.
- Contenidos ofensivos, amenazas e insultos no serán permitidos.

Debe saber que los comentarios de los lectores no reflejan necesariamente la opinión del STAFF.