Tutoriales y Manuales
Entradas Mensuales
-
▼
2026
(Total:
5069
)
-
▼
junio
(Total:
686
)
-
QNAP corrige fallos de inyección que permiten ejec...
-
El fallo Squidbleed, un error de 29 años en el pro...
-
pgAdmin 4 lanza correcciones de seguridad y nuevas...
-
Brasil inicia indagación por falla en sistema de a...
-
Consejos para optimizar Mozilla Firefox
-
Vulnerabilidad en Apple Beats Studio Buds permite ...
-
Cloudflare se alía con los principales navegadores...
-
La agencia de inteligencia de Canadá empleó una or...
-
Headroom reduce hasta un 92% los tokens de LLM
-
Lectores de Gizmodo reciben avisos de malware Clic...
-
Apps de iOS con IA filtran credenciales de API de LLM
-
WhatsApp quiere que otros sepan fácilmente si está...
-
Comentario de 13 palabras en Reddit puede envenena...
-
Muere Claude Guillemot fundador de Ubisoft
-
Infectan más de 10.000 repositorios de GitHub para...
-
Enfría su GPU con hielo y baja 40 grados
-
China creará centros de IA espaciales para rivaliz...
-
Una GeForce RTX 4070 SUPER sobrevive a una novia y...
-
Intel y AMD preparan ACE: nueva extensión x86 para...
-
CyberSentinel AI: 33 herramientas de seguridad con...
-
Miles de routers D-Link en todo el mundo fueron in...
-
Modelo Mythos de Anthropic vulneró sistemas clasif...
-
HDMI 2.2 en camino
-
INTERPOL alerta sobre el aumento de estafas con IA...
-
China crea supercomputadora sin GPU
-
Una ASUS ROG Astral RTX 5090 deja marcas de calor ...
-
Un Ryzen 9 9900X deja de funcionar tras usar una B...
-
Ransomware GentleKiller anula más de 400 procesos ...
-
Guía de Gemma 4 12B para programar gratis
-
Noruega prohíbe la IA en primaria
-
AutoJack: una web puede secuestrar tu agente de IA...
-
Chatbots en EE.UU. generan desconfianza social
-
Microsoft dará fin al soporte de Office 2021
-
De programar a guiar la IA
-
Guía elección CPU y GPU
-
Joven hacker empleó Tailscale y OpenSSH para mante...
-
Trump exige a Anthropic bloquear jailbreaks o elim...
-
Vulnerabilidad en Splunk AI Toolkit permite ejecuc...
-
IA de NVIDIA aprende a instalar GPUs
-
Análisis del router ASUS ProArt PRT-BE5000: Wi-Fi ...
-
Un SSD SATA II de hace 16 años sobrevive a 1 PB de...
-
Microsoft limita Copilot
-
Tesla lanza aspiradoras en sus Supercargadores de ...
-
Reserva restaurantes con Alexa y The Fork
-
AutoJack Attack: Una sola página web puede secuest...
-
EE.UU. avisa a ASML de que una de sus máquinas lit...
-
Gafas de Snapchat: caras e inútiles
-
Truco para evitar límites de uso en Claude Code
-
Vulnerabilidad en plugin Avada (Fusion) de WordPre...
-
OpenAI lanza Codex y nuevas funciones en Europa
-
Microsoft bloquea acceso de Copilot a documentos O...
-
NotebookLM suma la mejor función de Gemini
-
Muere Bobby Prince compositor de Doom y Duke Nukem 3D
-
Flipper One vs Flipper Zero
-
PlayStation detendrá ports a PC
-
Banco de España advierte burbuja de IA
-
Subleq+: Linux para preservar software por 1.000 años
-
Ubuntu exigirá betas para lanzamientos oficiales
-
Ransomware INC usa cifradores de Rust en nuevos at...
-
Sistema antidrones portátil y rápido con IA
-
Usan herramientas RMM para mantener acceso y evadi...
-
Vulnerabilidades en Firefox 152 permiten ejecución...
-
Nueva vulnerabilidad de BootROM de iPhone comprome...
-
El supervisor de privacidad británico dimite tras ...
-
LeCun tilda de fracaso a xAI de Musk
-
Raven Prism: gafas con Linux y control ocular
-
Google redefine la búsqueda con IA y Live
-
SonicDE: KDE Plasma para X11
-
SK Hynix memoria HBM4E de 12 capas con una velocid...
-
Microsoft detalla campaña de malware Windows Clipp...
-
Photoshop es un 20% más rápido en Windows 11
-
Router gaming ASUS ROG Strix GS-BE7200: Wi-Fi 7 do...
-
Desbloquean potencia oculta de IA en chips M4
-
Pueden usar la IA de SQL Server 2025 para robar da...
-
Rufus ya permite instalar Windows 11 de forma sile...
-
Nueva ley de IA en España con multas de 35 millones
-
La vigilancia con IA y datos biométricos amplían e...
-
AMD e Intel juntos apenas superan el 50% de los in...
-
Firefox quiere recuperar terreno y lanza mejoras d...
-
Hombre de Nueva York imputado por acosar a estudia...
-
Estafadores venden GPU NVIDIA RTX con chips falsif...
-
Salesforce desactiva la integración con Klue tras ...
-
Llega la operadora premium de Bertín Osborne
-
China sufrirá menos la escasez de RAM y SSD: el Go...
-
Autoridades desmantelan red de malware SocGholish:...
-
Bezos: La IA causará escasez de mano de obra
-
Apple corrige fallo en Beats Studio Buds que permi...
-
Ubuntu: sin beta no hay lanzamiento
-
Acelera el Explorador de archivos de Windows
-
Raven Prism: gafas inteligentes con Linux autónomo
-
Amazon venderá sus chips Trainium de IA
-
Europa crea cohete láser barato contra drones
-
WhatsApp puede ocultar hasta 40 GB de basura en tu...
-
Gigantes de la IA buscan crear una coalición de co...
-
Ataque Evilginx AiTM roba credenciales, MFA y sesi...
-
Secuestrador de portapapeles en Rust usa falsos vo...
-
Vulnerabilidad crítica de Cisco ISE permite ejecuc...
-
Qualcomm lleva las gafas XR a la era de la Intelig...
-
Meta ve todo lo que graban sus gafas inteligentes
-
Epic Games lanza Lore
-
«El mercado minorista de los SSD casi ha desaparec...
-
La policía sanea casi 15.000 sitios infectados con...
-
Microsoft lanza PowerToys 0.100
-
IA crea escáner corporal completo en 60 segundos
-
Vulnerabilidad Gravity SMTP plugin de WordPress pa...
-
ChatGPT pierde el liderazgo del mercado ante Gemin...
-
La mejor herramienta de ChatGPT hasta ahora
-
Gusano de USB propaga malware para robar criptomon...
-
Microsoft confirma exploit 0-day en Defender y pre...
-
Publicado exploit PoC para vulnerabilidad DoS de H...
-
La mejor IA desconocida de Google: NotebookLM
-
Teleco para mascotas con apoyo de gigantes español...
-
Reino Unido ahora va a por las VPN, quieren bloque...
-
Apple subirá precios por la IA
-
Fan lanza PC Fútbol y PC Basket gratis en navegado...
-
Rufus 4.15 optimiza la instalación de Windows 11
-
Teams registrará tu llegada a la oficina
-
Claude gana terreno mientras ChatGPT cae
-
Samsung elimina app Max (VPN) con 50 millones de u...
-
Spotify cambia su inicio de sesión en septiembre
-
WhatsApp Web ya permite llamadas grupales
-
Stop Killing Games falla
-
OpenAI al borde del abismo por pérdidas millonarias
-
La intuición y la IA salvaron a un desarrollador d...
-
Grupo China-Nexus usan módulos PAM vulnerables par...
-
iRhythm admite filtración de datos y robo de infor...
-
Python bate récord histórico de Java
-
Material desconocido sube 40% precio de placas base
-
-
▼
junio
(Total:
686
)
-
►
2025
(Total:
2103
)
- ► septiembre (Total: 148 )
-
►
2024
(Total:
1110
)
- ► septiembre (Total: 50 )
-
►
2023
(Total:
710
)
- ► septiembre (Total: 65 )
-
►
2022
(Total:
967
)
- ► septiembre (Total: 72 )
-
►
2021
(Total:
730
)
- ► septiembre (Total: 56 )
-
►
2020
(Total:
212
)
- ► septiembre (Total: 21 )
-
►
2019
(Total:
102
)
- ► septiembre (Total: 14 )
-
►
2017
(Total:
231
)
- ► septiembre (Total: 16 )
-
►
2016
(Total:
266
)
- ► septiembre (Total: 38 )
-
►
2015
(Total:
445
)
- ► septiembre (Total: 47 )
-
►
2014
(Total:
185
)
- ► septiembre (Total: 18 )
-
►
2013
(Total:
100
)
- ► septiembre (Total: 3 )
-
►
2011
(Total:
7
)
- ► septiembre (Total: 1 )
Blogroll
Etiquetas
Entradas populares
-
Una exhaustiva campaña de ciberespionaje denominada "FortiBleed" ha comprometido silenciosamente más de 73,932 URLs únicas de fi...
-
Resumen: Un estudio revela que el Wi-Fi con buena señal consume menos batería que el 4G o 5G, mientras que el 5G puede agotar más la bater...
-
TestDisk es una utilidad multiplataforma para la recuperación de datos desarrollado principalmente para ayudar a recuperar datos perdidos e...
Headroom reduce hasta un 92% los tokens de LLM
Headroom: la iniciativa de código abierto para optimizar el consumo de tokens en IA
Ha nacido Headroom, un proyecto open source diseñado para solucionar la saturación de la ventana de contexto en modelos de lenguaje como GPT o Claude. Esta herramienta actúa como una capa intermedia que permite reducir hasta en un 92% la cantidad de tokens enviados, evitando que el historial, los logs y los datos de API congestionen las sesiones de trabajo con la inteligencia artificial.
El proyecto Headroom llega para atajar un problema muy conocido por todo aquel que use la Inteligencia Artificial actual: cada agente, cada herramienta y cada sesión larga termina llenando la ventana de contexto con logs, resultados de búsqueda, respuestas de API, fragmentos RAG, archivos e historial de conversación. El proyecto se presenta como una capa de compresión de contexto para agentes de IA, con una promesa muy directa: enviar entre un 60% y un 95% menos de tokens al LLM manteniendo las mismas respuestas, según los datos publicados por sus responsables. ¿Es acaso esto posible?
La propuesta encaja especialmente en flujos donde usamos Claude Code, Cursor, Codex, Aider, Copilot, LangChain, Agno, Strands o aplicaciones propias conectadas a proveedores como OpenAI, Anthropic, Google, Bedrock u otros servicios compatibles. Como las promesas son muy grandes, veamos el contexto para discernir si, efectivamente, cumple la barbaridad que prometen.
Headroom, el proyecto que busca abaratar la IA a base de enviar hasta un 95% menos de tokens en las principales plataformas
Según sus desarrolladores, Headroom puede utilizarse como librería en Python o TypeScript, como proxy HTTP sin tocar apenas el código, como wrapper para agentes y como servidor MCP con herramientas específicas para comprimir, recuperar contenido original y consultar estadísticas de sesión.
El funcionamiento se basa en colocar, nunca mejor dicho, Headroom entre la aplicación y el proveedor LLM. Primero intercepta los mensajes, después analiza el contenido, aplica compresión según el tipo de dato y finalmente envía al modelo una petición optimizada. La documentación describe un flujo con CacheAligner, ContentRouter y CCR, junto a SmartCrusher para JSON, CodeCompressor para código mediante AST y Kompress base para texto, con los originales guardados localmente para poder recuperarlos cuando el modelo necesite más detalle.
Aterrizando todo, Headroom funciona como un filtro entre la aplicación de IA y el modelo, por ejemplo, Claude o GPT, donde antes de enviar todo el contexto, revisa el contenido, comprime lo menos importante y manda una versión más ligera para gastar menos tokens, pero guarda el original en local por si el modelo necesita recuperar algún detalle.
Hasta un 92% de menos tokens gastados
Your agent / app
(Claude Code, Cursor, Codex, LangChain, Agno, Strands, your own code…)
│ prompts · tool outputs · logs · RAG results · files
▼
┌────────────────────────────────────────────────────┐
│ Headroom (runs locally — your data stays here) │
│ ──────────────────────────────────────────────── │
│ CacheAligner → ContentRouter → CCR │
│ ├─ SmartCrusher (JSON) │
│ ├─ CodeCompressor (AST) │
│ └─ Kompress-base (text, HF) │
│ │
│ Cross-agent memory · headroom learn · MCP │
└────────────────────────────────────────────────────┘
│ compressed prompt + retrieval tool
▼
LLM provider (Anthropic · OpenAI · Bedrock · …)
Los datos de rendimiento publicados por el propio repositorio hablan de reducciones del 92% en una búsqueda de código con 100 resultados (17.765 tokens frente a 1.408), 92% en depuración de un incidente SRE (65.694 frente a 5.118), 73% en triage de issues de GitHub (54.174 frente a 14.761) y 47% en exploración de una base de código (78.502 frente a 41.254). También se indican resultados conservando precisión en GSM8K, TruthfulQA, SQuAD v2 y BFCL, aunque esos datos salen del propio proyecto y deben tratarse como benchmarks internos.
De hecho, la versión 0.27.0, publicada el 22 de junio de 2026, añade diagnóstico con headroom doctor, comando de actualización, métricas de throughput en tokens por segundo, reducción de tokens de salida, compresión de tablas y hojas .xlsx o .xls, soporte para Cortex Code y mejoras en CCR y Claude Code con Vertex.
Como vemos, no solamente es un proyecto que busca que el usuario optimice tus tokens al máximo para que gaste menos dinero, sino que esto también está siendo usado ya por varias empresas para lograr reducir sus facturas, así que les está haciendo “la puñeta” a todas las grandes desde fuera.
Igualmente, Headroom no sirve igual en todos los casos, porque la propia documentación marca como escenarios fuertes los JSON grandes, logs, salidas de build, resultados de herramientas y sesiones largas de agentes, mientras que las conversaciones cortas, las sesiones centradas solo en código, los contextos RAG documentales y las peticiones de un solo turno apenas aportan margen o pasan prácticamente sin compresión. No iba a ser todo tan magnífico, pero sea como fuere, para altas cargas de trabajo representa una salida tremenda al gasto actual, donde se pueden optimizar muchísimo los tokens que finalmente consumimos.
Fuentes:
https://elchapuzasinformatico.com/2026/06/headroom-proyecto-open-source-reducir-tokens-claude-gpt/



Entrada más reciente
0 comentarios :
Publicar un comentario
Los comentarios pueden ser revisados en cualquier momento por los moderadores.
Serán publicados aquellos que cumplan las siguientes condiciones:
- Comentario acorde al contenido del post.
- Prohibido mensajes de tipo SPAM.
- Evite incluir links innecesarios en su comentario.
- Contenidos ofensivos, amenazas e insultos no serán permitidos.
Debe saber que los comentarios de los lectores no reflejan necesariamente la opinión del STAFF.