Tutoriales y Manuales
Entradas Mensuales
-
▼
2026
(Total:
3843
)
-
▼
mayo
(Total:
540
)
-
ChatGPT ahora gestiona tu dinero
-
Acelera internet desactivando este ajuste de Windows
-
Google Live Translate llegaría al modo offline
-
Claude Code revisa el código antes de entregarlo
-
Crackean Pragmata sin hipervisor
-
Samsung lanza One UI 9 Beta
-
Microsoft advierte que atacantes usan agente de HP...
-
Intel prepara su APU más bestia con Razor Lake-AX:...
-
Cuatro vulnerabilidades en OpenClaw permiten el ro...
-
Filtración de token de GitHub en Grafana permitió ...
-
ASUS entra al mercado de la memoria RAM con su pri...
-
Intel prepara una tercera subida del 20% en sus Xe...
-
Xbox Series X superaría a PS5 en FSR 4.1
-
Apple planea AirPods con IA y cámaras
-
Programadores advierten que la IA atrofia el cerebro
-
Microsoft detalla la arquitectura modular y botnet...
-
ASUS ROG Crosshair 2006: llamativa placa base que ...
-
Explotan vulnerabilidad 0-day en Cisco Catalyst SD...
-
Expertos en seguridad dudan que los atacantes de C...
-
OpenAI confirma brecha de seguridad por ataque de ...
-
Windows 11 y Microsoft Edge, hackeados en Pwn2Own ...
-
Privacidad de tus archivos en NotebookLM
-
Windows 11 mantiene una app de Windows 95
-
ChatGPT busca gestionar tus finanzas
-
Ninguna IA vence al ajedrez
-
Gmail reduce espacio de 15 a 5 GB en cuentas nuevas
-
Vulnerabilidad crítica de Next.js expone credencia...
-
Google presenta la función Puntero mágico para tra...
-
Explotan vulnerabilidad CVE-2026-42897 en Microsof...
-
Meta agota agua en Georgia y apunta a Talavera
-
Vulnerabilidad crítica en el plugin Funnel Builder...
-
CISA incluye la vulnerabilidad CVE-2026-20182 de C...
-
Aprovechan vulnerabilidad de bypass de autenticaci...
-
ChatGPT ahora es tu gestor financiero
-
Explotados Zero-Days de Microsoft Exchange, Window...
-
Grupo Sandworm pasan de sistemas IT a activos OT c...
-
Grupos chinos vulneran sector energético vía Micro...
-
ClickFix evoluciona con proxy SOCKS5 de Python de ...
-
Fallo crítico de Linux ‘ssh-keysign-pwn’ expone cl...
-
PSN: Cuentas vulnerables pese a seguridad avanzada
-
Bienvenidos al vulnpocalipsis, donde la IA acelera...
-
Apple critica la normativa de IA de la UE
-
Explotan 0-day en PAN-OS de Palo Alto para ejecuta...
-
OpenAI amenazaría con demandar a Apple
-
Vulnerabilidad crítica en plugin de WordPress ➡️ F...
-
Cisco alerta sobre vulnerabilidad crítica de SD-WA...
-
Todo sobre el iPhone 18 Pro
-
CNMV advierte riesgos de la IA como asesor financiero
-
La NASA sube a Internet más de 11.000 imágenes tom...
-
Claude Code anticipará tus necesidades antes que tú
-
FBI advierte sobre peligros de puertos USB públicos
-
Grupo kTeamPCP y BreachForums ofrecen 1.000 $ por ...
-
Vulneran 170 paquetes npm para robar secretos de G...
-
Explotan vulnerabilidad de salto de autenticación ...
-
NVIDIA crea IA que aprende sola
-
IA de Anthropic halla fallos de seguridad en macOS
-
Paquete node-ipc de npm comprometido en ataque de ...
-
OpenAI confirma brecha de seguridad por ataque a l...
-
Fallos en el plugin Avada Builder de WordPress per...
-
Nuevo malware permite control de pantalla, acceso ...
-
Vulnerabilidad crítica en Canon MailSuite permite ...
-
Descubren una nueva amenaza que pone en riesgo Mic...
-
Hackean Microsoft Edge, Windows 11 y LiteLLM en Pw...
-
Vibeathon: el hackathon donde no hace falta programar
-
Vulnerabilidades en el controlador JDBC de Amazon ...
-
Microsoft: la IA puede generar líneas de comandos ...
-
Ghostwriter lanza ataques de phishing con PDF geol...
-
Alumno hackea a profesor para entrar en EducaMadrid
-
IA Claude recupera 350.000 euros en Bitcoin olvida...
-
Vulnerabilidades críticas en GitLab permiten ataqu...
-
Alza de precios en DRAM y NAND Flash
-
Fedora Hummingbird busca un sistema operativo dist...
-
Shai-Hulud: ataque a la cadena de suministro compr...
-
Nueva vulnerabilidad en Fragnesia Linux permite ob...
-
Hermes: el nuevo agente de IA open source
-
IA: el riesgo energético equivale a 23 bombas nucl...
-
Madrid impulsa su conexión y se consolida como hub...
-
Para obtener acceso de root en esta empresa, un in...
-
3 fallos graves en bases de datos MCP, uno de ello...
-
Vulnerabilidad en Cliente DNS de Windows permite e...
-
Vulnerabilidad de día cero en Windows BitLocker pe...
-
Cisco despedirá a 4.000 empleados y les ofrecerá c...
-
NVIDIA llevará centros de datos de IA al espacio
-
The Gentlemen RaaS usa dispositivos Cisco y Fortin...
-
Error de Amazon Quick expuso chats de IA a usuario...
-
WhatsApp añade conversaciones privadas con la IA
-
Actualizaciones de Dell SupportAssist causan bucle...
-
Vulnerabilidad crítica de NGINX de 18 años permite...
-
NVIDIA consigue el permiso de Trump para vender la...
-
Vulnerabilidad crítica de MongoDB permite ejecutar...
-
PS5 y Xbox Series X: ¿agotadas o infrautilizadas?
-
Configura varias VLAN para segmentar la red en un ...
-
En Japón, los SSD han aumentado su precio en casi ...
-
Un exploit zero-day llamado YellowKey permite abri...
-
Packagist pide actualizar Composer tras filtración...
-
Demanda colectiva a OpenAI por compartir datos de ...
-
Vulnerabilidad Fragnesia en Linux permite acceso r...
-
Microsoft prioriza Windows 11 sobre Windows 12
-
Un buen relato biográfico de Kevin Mitnick, probab...
-
Móviles de 2.000 euros por el nuevo Snapdragon 8 E...
-
-
▼
mayo
(Total:
540
)
-
►
2025
(Total:
2103
)
- ► septiembre (Total: 148 )
-
►
2024
(Total:
1110
)
- ► septiembre (Total: 50 )
-
►
2023
(Total:
710
)
- ► septiembre (Total: 65 )
-
►
2022
(Total:
967
)
- ► septiembre (Total: 72 )
-
►
2021
(Total:
730
)
- ► septiembre (Total: 56 )
-
►
2020
(Total:
212
)
- ► septiembre (Total: 21 )
-
►
2019
(Total:
102
)
- ► septiembre (Total: 14 )
-
►
2017
(Total:
231
)
- ► septiembre (Total: 16 )
-
►
2016
(Total:
266
)
- ► septiembre (Total: 38 )
-
►
2015
(Total:
445
)
- ► septiembre (Total: 47 )
-
►
2014
(Total:
185
)
- ► septiembre (Total: 18 )
-
►
2013
(Total:
100
)
- ► septiembre (Total: 3 )
-
►
2011
(Total:
7
)
- ► septiembre (Total: 1 )
Blogroll
Etiquetas
Entradas populares
-
Noctua presenta el nuevo ventilador NF-A12x25 G2 chromax.black , que combina un diseño elegante en negro con la máxima refrigeración y baj...
-
Es muy probable que el próximo email que recibas no esté escrito por una persona. Da igual si usas Gmail, Outlook o cualquier alternativa si...
-
Un ataque de cadena de suministro a gran escala ha alertado a los desarrolladores de software en todo el mundo, después que comprometieran ...
Claude Code revisa el código antes de entregarlo
Optimización de programación con Claude Code
En el desarrollo de software asistido por inteligencia artificial, es común encontrar errores que solo aparecen al ejecutar el programa. Para solucionar esto, Claude Code ha implementado una herramienta denominada Outcomes.
Gracias a esta novedad, la IA ya no se limita a generar el código, sino que es capaz de verificar que el resultado final cumpla estrictamente con los criterios establecidos antes de realizar la entrega, asegurando así que el funcionamiento sea el correcto.

Uno de los problemas más frecuentes cuando trabajas con IA para escribir código es que el resultado parece correcto hasta que lo pruebas. Claude Code acaba de añadir una función llamada Outcomes que cambia esa dinámica para bien. Ahora, el sistema puede verificar si el resultado cumple con los criterios que definiste desde un principio.
Outcomes forma parte de la API de Managed Agents de Claude y representa un salto respecto a cómo funcionaban los agentes de código. Cuando lo activas, el flujo cambia de una conversación a una sesión en donde se le asigna a la IA un trabajo con condiciones claras de aceptación. El usuario define cómo tiene que ser el resultado final y el agente trabaja hacia ese objetivo, autoevaluándose e iterando hasta que lo cumple.
De acuerdo con la documentación técnica, el mecanismo central es el evento user.define_outcome. Cuando lo envías, la plataforma pone en marcha un segundo agente independiente llamado "grader" (o evaluador), cuyo único trabajo es comprobar. Este basa su trabajo en una rúbrica definida por ti, en donde se especifica cómo debería ser un trabajo bien hecho y el modo de verificarlo.

El evaluador corre en su propia ventana de contexto para que el agente escritor no pueda influenciarlo, y uno nuevo revisa el artefacto completo en cada iteración. Después de cada turno del agente principal, el evaluador devuelve un desglose por criterios que confirma que el artefacto cumple la rúbrica, o señala los huecos específicos entre el trabajo actual y los requisitos. Esa retroalimentación vuelve al agente para la siguiente iteración.
La rúbrica es el elemento clave de todo el sistema. La forma en que está redactada determina si el evaluador comprueba algo de verdad. Una rúbrica que dice "comprueba que el código cubre el manejo de errores" permite al evaluador hojear el código, ver un bloque try-catch, y escribir una confirmación sin ejecutar nada.
Cómo configurar Outcomes paso a paso
Para activar Outcomes necesitas la cabecera beta managed-agents-2026-04-01 en tus llamadas a la API. El SDK de Anthropic la incluye automáticamente, así que si ya lo tienes instalado no tienes que hacer nada adicional.

El primer paso es crear la rúbrica. Esto se logra a través de un documento en Markdown donde describes, criterio por criterio, qué cuenta como resultado válido. Puedes pasarla como texto en línea directamente en el evento user.define_outcome, o subirla a través de la Files API para reutilizarla en distintas sesiones (esto requiere la cabecera adicional files-api-2025-04-14).
Una vez que tienes la rúbrica, creas la sesión y envías el evento user.define_outcome con dos campos fundamentales: description, que el agente escritor leerá para saber qué tiene que construir, y rubric, que es lo que usará el evaluador para juzgar el resultado. También puedes definir max_iterations para controlar cuántas rondas de revisión permite el sistema antes de detenerse.

El agente comenzará a trabajar en cuanto reciba el evento, sin necesidad de ningún mensaje adicional. Puedes enviar mensajes user.message mientras el trabajo avanza para dar indicaciones más específicas, pero no son imprescindibles. El agente sabrá que debe continuar hasta que se quede sin iteraciones o alcance el resultado.
Así puedes revisar si tu código funciona en Claude Code
Para seguir el progreso, los eventos span.outcome_evaluation_start y span.outcome_evaluation_end te indican cuándo el evaluador está revisando y qué encontró. El campo iteration dentro de esos eventos es un contador que empieza en cero: el cero corresponde a la primera evaluación, el uno a la revisión tras la primera corrección, y así sucesivamente.

Cuando un ciclo termina, la sesión vuelve a ser conversacional y el siguiente user.define_outcome arranca uno nuevo. Solo se admite un Outcome activo a la vez, pero puedes encadenarlos en secuencia. Eso te permite encomendar la escritura de una función con criterios de corrección, y luego arrancar un segundo Outcome que verifique la cobertura de tests.
El resultado final es que dejarás de ser el revisor de turno en cada iteración. Claude Code no te entregará código que parece funcionar, sino código que ha pasado los criterios que tú mismo definiste.
Fuentes:
https://hipertextual.com/inteligencia-artificial/como-configurar-outcomes-claude-code/


Entrada más reciente
0 comentarios :
Publicar un comentario
Los comentarios pueden ser revisados en cualquier momento por los moderadores.
Serán publicados aquellos que cumplan las siguientes condiciones:
- Comentario acorde al contenido del post.
- Prohibido mensajes de tipo SPAM.
- Evite incluir links innecesarios en su comentario.
- Contenidos ofensivos, amenazas e insultos no serán permitidos.
Debe saber que los comentarios de los lectores no reflejan necesariamente la opinión del STAFF.