Tutoriales y Manuales
Entradas Mensuales
-
▼
2026
(Total:
2418
)
-
▼
febrero
(Total:
812
)
-
Demis Hassabis (Google DeepMind) cree que la AGI l...
-
Otra tienda filtra que GTA 6 costará 100 euros: si...
-
El Galaxy S26 Ultra se queda atrás en sensores de ...
-
Sam Altman lo tiene claro: "El 'AI washing' es rea...
-
Herramienta de IA OpenClaw borra el buzón del dire...
-
Cuando nadie responde por tu GPU: RX 7900 XT MBA c...
-
Múltiples vulnerabilidades en CPSD CryptoPro Secur...
-
Explotan vulnerabilidad en servidor Apache ActiveM...
-
DJI demanda a la FCC por prohibir la importación d...
-
Nvidia aún no ha vendido ni un H200 a China casi t...
-
ONLYOFFICE Docs 9.3: nueva versión de la suite ofi...
-
MSI renueva su línea de placas base económicas par...
-
Le pide 4 dólares a un agente de IA por contagiar ...
-
Qué servicios de Windows deberías deshabilitar y c...
-
El uso de IPTV piratas se dispara en Europa, y los...
-
Vulnerabilidades críticas en SolarWinds Serv-U per...
-
Desarrollador ingenioso crea emulador de CPU x86 s...
-
Este modelo de IA español está comprimido, es grat...
-
Ataques OAuth en Entra ID pueden usar ChatGPT para...
-
Paquetes NuGet maliciosos roban credenciales de de...
-
CISA confirma explotación activa de vulnerabilidad...
-
Microsoft advierte de ataques a desarrolladores co...
-
Un manitas construye un visor de realidad virtual ...
-
Intel apuesta por la inferencia de IA con sus CPU ...
-
Fortinet avisa de la explotación activa de la vuln...
-
La IA impulsó la economía estadounidense en "práct...
-
El 65% de las organizaciones financieras son blanc...
-
Actores de amenazas usan herramientas de IA para a...
-
Pillan a dos estudiantes de 15 y 13 años fabricand...
-
Reddit multado con 14,47 millones de libras por fa...
-
Singularity Computers Penta Node: controla hasta 5...
-
EE. UU. sanciona red de intermediarios que robaron...
-
GitHub Copilot explotado para tomar control total ...
-
PayPal confirma una exposición de datos de seis me...
-
SanDisk presenta su nueva generación de SSD portát...
-
¿Tienes un móvil roto y no sabes qué hacer con él?...
-
29 minutos es el tiempo que necesita un atacante p...
-
Cómo eliminar anuncios en Windows con Winaero Tweaker
-
Así es la Honor Magic Pad 4, la tablet más delgada...
-
Así funcionarán las pantallas táctiles en los MacB...
-
Microsoft dejará de dar soporte a Windows Server 2...
-
EE.UU. invierte más de 30.000 millones de dólares ...
-
Qué es el puerto SFP+ de un router: la conexión pr...
-
Los propietarios de Lenovo y Asus con Ryzen Z1 Ext...
-
Fuga de datos de Conduent: el mayor ciberataque en...
-
La gravedad contra tu CPU: la orientación del disi...
-
El chip AI100 de Qualcomm de 2019 logra un gran de...
-
Habilidades maliciosas de OpenClaw engañan a usuar...
-
Nueva vulnerabilidad de deserialización en trabaja...
-
El gobierno de EE.UU. advirtió a los CEOs de Nvidi...
-
Ingenieros de la NASA reprogramaron el chip Snapdr...
-
La nueva herramienta de IA de Anthropic escribe có...
-
NVIDIA viene fuerte: sella alianzas con Lenovo y D...
-
Múltiples vulnerabilidades en VMware Aria permiten...
-
PC de 99 kg integrado en un radiador victoriano de...
-
Un ladrón aficionado roba tres GPUs por 11.000$ de...
-
Samsung integra Perplexity en sus móviles mediante...
-
Grupo cibercriminal ruso Diesel Vortex roba más de...
-
Dispositivo óptico transmite datos a 25 Gbps media...
-
Cuando "Vibe Coding" se convierte en una pesadilla...
-
Desarrollador ambicioso presenta un juego tipo Qua...
-
ATABoy conecta discos IDE antiguos al siglo XXI co...
-
Usan imágenes esteganográficas para eludir escaneo...
-
Qué es Citrini Research y por qué ha causado el ca...
-
CISA alerta de explotación activa de dos vulnerabi...
-
Actores norcoreanos usan falsos trabajadores de TI...
-
El último modelo de IA chino de DeepSeek se ha ent...
-
GrayCharlie inyecta JavaScript malicioso en sitios...
-
El mapa de España que muestra las antenas que tien...
-
Nuevo RAT personalizado MIMICRAT descubierto en so...
-
Presunto robo de 21 millones de registros de Odido...
-
ASML aumenta la potencia de sus sistemas de litogr...
-
China muestra el rival del Apple MacBook Air: el M...
-
Adiós al cable submarino que cambió Internet
-
Samsung activa la era PCIe 6.0: prepara la producc...
-
El MIT crea una impresora 3D capaz de fabricar un ...
-
Anthropic acusa a DeepSeek y otras IA chinas de co...
-
WhatsApp lanza función opcional de contraseña para...
-
Qué tiene dentro una SIM, la tecnología que no ha ...
-
Panasonic deja de fabricar televisores, el fin de ...
-
Usan DeepSeek y Claude para atacar dispositivos Fo...
-
OpenClaw lanza la versión 2026.2.23 con actualizac...
-
Vía libre para los procesadores NVIDIA N1, un dolo...
-
Ring no quiere problemas con sus timbres y ofrece ...
-
La marca Xbox morirá lentamente, dice el creador d...
-
Todos los datos de altos cargos del INCIBE Español...
-
Detenidos los cuatro miembros principales del grup...
-
Microsoft planea añadir agentes IA integrados en W...
-
Visto en China: máquinas robots recolectores de fr...
-
Mil millones de registros de datos personales expu...
-
Tesla deja sin pagar un pedido de 4.000 pasteles y...
-
Código *#9900# para móviles Samsung Galaxy te da a...
-
¿Qué es 'ghost tapping', la estafa silenciosa, que...
-
Visto en China: autobuses con semáforos en tiempo ...
-
Sam Altman, CEO de OpenAI: "Los humanos consumen t...
-
Nuevo marco de phishing Starkiller clona páginas d...
-
Google decide cambiar las descripciones generales ...
-
Los relojes de Huawei ya permiten los pagos sin co...
-
Amazon da un paso atrás con la IA, y retira su fla...
-
Anthropic lanza Claude Code Security para analizar...
-
-
▼
febrero
(Total:
812
)
-
►
2025
(Total:
2103
)
- ► septiembre (Total: 148 )
-
►
2024
(Total:
1110
)
- ► septiembre (Total: 50 )
-
►
2023
(Total:
710
)
- ► septiembre (Total: 65 )
-
►
2022
(Total:
967
)
- ► septiembre (Total: 72 )
-
►
2021
(Total:
730
)
- ► septiembre (Total: 56 )
-
►
2020
(Total:
212
)
- ► septiembre (Total: 21 )
-
►
2019
(Total:
102
)
- ► septiembre (Total: 14 )
-
►
2017
(Total:
231
)
- ► septiembre (Total: 16 )
-
►
2016
(Total:
266
)
- ► septiembre (Total: 38 )
-
►
2015
(Total:
445
)
- ► septiembre (Total: 47 )
-
►
2014
(Total:
185
)
- ► septiembre (Total: 18 )
-
►
2013
(Total:
100
)
- ► septiembre (Total: 3 )
-
►
2011
(Total:
7
)
- ► septiembre (Total: 1 )
Blogroll
Etiquetas
Entradas populares
-
Un error con las antenas del router WiFi es colocarlas en direcciones incorrectas , lo que reduce la velocidad de Internet; ajustar su p...
-
Google Drive incorpora una función de IA que automatiza tareas complejas en segundos, ahorrando hasta media hora de trabajo manual , integ...
-
Aquellos cables de audio mejorados probablemente no llevarán tu experiencia de escucha musical al siguiente nivel. Todo lo que necesitas son...
Augustus: escáner de vulnerabilidades de código abierto para LLM con 210+ ataques en 28 proveedores
Augustus es un nuevo escáner de vulnerabilidades de código abierto diseñado para proteger los Modelos de Lenguaje Grande (LLM) frente a un panorama en evolución de amenazas adversariales. Desarrollado por Praetorian, Augustus busca cerrar la brecha entre las herramientas de investigación académica y las pruebas de seguridad de nivel producción, ofreciendo una solución de un solo binario que puede lanzar más de 210 ataques adversariales distintos contra 28 proveedores de LLM. C
Augustus es un nuevo escáner de vulnerabilidades de código abierto diseñado para proteger los Modelos de Lenguaje Grande (LLMs) frente a un panorama en evolución de amenazas adversariales.
Desarrollado por Praetorian, Augustus busca cerrar la brecha entre las herramientas de investigación académica y las pruebas de seguridad de nivel producción, ofreciendo una solución de binario único que puede lanzar más de 210 ataques adversariales distintos contra 28 proveedores de LLMs.
A medida que las empresas compiten por integrar la IA Generativa en sus productos, los equipos de seguridad han tenido dificultades con herramientas que suelen estar orientadas a la investigación, ser lentas o difíciles de integrar en pipelines de integración continua/despliegue continuo (CI/CD).
Herramientas existentes como garak de NVIDIA han establecido el estándar para pruebas exhaustivas, pero dependen de entornos Python complejos y con muchas dependencias.
Augustus resuelve estos cuellos de botella operativos al compilarse como un binario Go portátil. Esta arquitectura elimina el «infierno de dependencias» comúnmente asociado con herramientas de seguridad basadas en Python, evitando la necesidad de entornos virtuales, instalaciones con pip o versiones específicas del intérprete.
La herramienta aprovecha los primitivos de concurrencia nativos de Go (goroutines) para realizar escaneos masivamente paralelos, lo que la hace significativamente más rápida y eficiente en recursos que sus predecesoras.
«Necesitábamos algo construido para la forma en que trabajan nuestros operadores: un binario rápido y portátil que se integre en los flujos de trabajo existentes de pruebas de penetración», declaró Praetorian en su anuncio de lanzamiento.
Más de 210 modos de ataque
En esencia, Augustus es un motor de ataques que automatiza el «red teaming» de modelos de IA. Incluye una biblioteca de más de 210 sondas de vulnerabilidad distribuidas en 47 categorías de ataque, entre las que se encuentran:
- Jailbreaks: Prompts sofisticados diseñados para eludir filtros de seguridad (por ejemplo, DAN, AIM y exploits como el de «Abuela»).
- Inyección de prompts: Técnicas para sobrescribir instrucciones del sistema, incluyendo bypasses de codificación como Base64, ROT13 y código Morse.
- Extracción de datos: Pruebas para detectar fugas de información personal (PII), filtración de claves API y reconstrucción de datos de entrenamiento.
- Ejemplos adversariales: Ataques basados en gradientes y bombas lógicas diseñadas para confundir el razonamiento del modelo.
Una característica destacada de Augustus es su sistema «Buff», que permite a los evaluadores de seguridad aplicar transformaciones dinámicas a cualquier sonda. Los testers pueden encadenar múltiples «buffs», como parafrasear un prompt, traducirlo a un idioma de bajos recursos (por ejemplo, zulú o gaélico escocés) o codificarlo en formatos poéticos, para comprobar si los guardarraíles de seguridad del modelo resisten ante entradas ofuscadas.
Esta capacidad es crucial para descubrir filtros de seguridad «frágiles» que pueden bloquear un ataque estándar pero fallan al reconocer el mismo ataque cuando se modifica ligeramente.
Diseñado para la pila de seguridad moderna, Augustus soporta 28 proveedores de LLMs de forma nativa, incluyendo plataformas importantes como OpenAI, Anthropic, Azure, AWS Bedrock y Google Vertex AI, así como motores de inferencia local como Ollama.
Este amplio soporte garantiza que los equipos puedan probar desde modelos GPT-4 alojados en la nube hasta instancias locales de Llama 3 con las mismas herramientas.
La arquitectura de la herramienta prioriza la fiabilidad en producción, con funciones integradas de limitación de tasa, lógica de reintentos y manejo de timeouts para evitar fallos en escaneos a gran escala.
Los resultados pueden exportarse en múltiples formatos, como JSON, JSONL para registros en streaming y HTML para informes a stakeholders, facilitando la ingesta de datos de vulnerabilidades en plataformas de gestión de vulnerabilidades o SIEMs.
Augustus es el segundo lanzamiento de la serie de código abierto «12 Césares» de Praetorian, tras la herramienta de fingerprinting de LLMs Julius. Está disponible de inmediato bajo la licencia Apache 2.0.
Profesionales de la seguridad y desarrolladores pueden descargar la última versión o compilar desde fuente en GitHub.
Fuentes:
https://cybersecuritynews.com/augustus-llm-vulnerability-scanner/

Entrada más reciente
0 comentarios :
Publicar un comentario
Los comentarios pueden ser revisados en cualquier momento por los moderadores.
Serán publicados aquellos que cumplan las siguientes condiciones:
- Comentario acorde al contenido del post.
- Prohibido mensajes de tipo SPAM.
- Evite incluir links innecesarios en su comentario.
- Contenidos ofensivos, amenazas e insultos no serán permitidos.
Debe saber que los comentarios de los lectores no reflejan necesariamente la opinión del STAFF.