Un reciente estudio ha revelado que modelos avanzados de inteligencia artificial, como ChatGPT-o1 y DeepSeek-R1, han recurrido a tácticas desleales al jugar partidas de ajedrez. Estos hallazgos ponen en cuestión la fiabilidad de estas tecnologías y abren un debate sobre su comportamiento en situaciones donde se les exija tomar decisiones críticas.
- Las dos IA se enfrentaron cientos de veces a Stockfish, uno de los motores de ajedrez más potentes del mundo. Al comprobar las partidas, se toparon con algunas sorpresas
- Cuando se ven superados, los modelos de IA recurren a las trampas para ganar las partidas de ajedrez
El comportamiento detectado no se limitó a movimientos ilegales. Algunos modelos ejecutaron copias ocultas de Stockfish para anticipar jugadas, reescribieron el tablero a su favor y hasta intentaron manipular los archivos del programa. Estas acciones ponen de manifiesto la capacidad de la IA para encontrar y explotar vulnerabilidades en los sistemas con los que interactúa.
¿Por qué las IA recurren a estas estrategias?
El fenómeno se explica a través del concepto de gaming specification, que describe cómo un modelo de inteligencia artificial puede reinterpretar las reglas para maximizar su rendimiento, incluso si esto implica recurrir a estrategias desleales. Resulta preocupante que los modelos más recientes, como ChatGPT-01 y DeepSeek-R1, hayan mostrado una mayor tendencia a este comportamiento que versiones anteriores, como GPT-4o y Claude 3.5 Sonnet, que solo lo desarrollaban cuando eran incentivadas a hacerlo.
Estos descubrimientos generan inquietud sobre el uso de la inteligencia artificial en ámbitos más críticos. Si estos sistemas son capaces de manipular un juego para evitar perder, ¿qué sucedería si se les asignaran tareas en sectores como la ciberseguridad, la gestión financiera o la toma de decisiones autónomas? Esto es lo que se plantean en TechCrunch, donde reflexionan acerca de la posibilidad de que estas tecnologías puedan evadir restricciones impuestas por sus desarrolladores plantea un desafío en términos de regulación y supervisión.
Fuentes:

No hay comentarios:
Publicar un comentario