Tutoriales y Manuales
Entradas Mensuales
-
▼
2026
(Total:
981
)
-
▼
enero
(Total:
680
)
-
Cuidado con la extensión de VS Code ClawdBot Agent...
-
Barco ruso merodeando cerca de cables de datos tra...
-
BlackIce: kit de herramientas Red Team basado en c...
-
Nuevo capítulo de escasez por culpa de la IA: prim...
-
El CEO de Nvidia niega que EE.UU. quiera trasladar...
-
Microsoft elimina el soporte para módems de acceso...
-
Directorio abierto expuesto filtra marco BYOB en W...
-
Meta corrige un grave fallo de seguridad en Whats...
-
NASA estrena Athena, el superordenador capaz de ha...
-
Adiós suscripciones: editor de video gratuito KDEn...
-
Los discos duros suben de precio primero en Corea ...
-
IBM 3380, el primer disco duro de 1 GB: tan grande...
-
3,280,081 dispositivos Fortinet en línea con propi...
-
Wireshark 4.6.3 lanzado con corrección de vulnerab...
-
Qué es Azure Linux, la apuesta de Microsoft por la...
-
GIGABYTE X870E AORUS XTREME X3D AI TOP, caracterís...
-
GIGABYTE afina su BIOS para exprimir el nuevo Ryze...
-
Google pagará 135 millones de dólares a usuarios d...
-
El nuevo Intel Panther Lake supera a AMD Zen 5 en ...
-
Las GPU Intel Arc Alchemist ganan hasta un 260% de...
-
AMD Ryzen 7 9850X3D en Single Channel vs Dual Chan...
-
Ataque DDoS de 31,4 Tbps mediante la botnet Aisuru...
-
Mejores servicios de eliminación de datos personales
-
Microsoft 365: complementos de Outlook se usan par...
-
Las ventas de Xbox Series S y Series X se hunden, ...
-
Explotan vulnerabilidad de FreePBX para desplegar ...
-
Herramienta Swarmer elude EDR con modificación sig...
-
ONLYOFFICE DocSpace: la mejor alternativa a Google...
-
¿Es inseguro utilizar Microsoft Teams y Zoom? En F...
-
Vulnerabilidad crítica en cámaras IP IDIS permite ...
-
Microsoft Exchange Online eliminará la autenticaci...
-
Vulnerabilidad crítica en SolarWinds permite ejecu...
-
Microsoft en el punto de mira: sus centros de IA p...
-
Estafadores están enviando spam desde un correo re...
-
Televés lanza el Booster 3, un dispositivo profesi...
-
El chip Apple M6 debutará a finales de año
-
Vulnerabilidad crítica en vm2 (Node.js) permite es...
-
LaLiga ofrece 50 euros a quien denuncie a los bare...
-
Fallo crítico WinRAR
-
El precio de la memoria RAM DDR4 está aumentando d...
-
Costco quita de sus ordenadores preensamblados la ...
-
El jefe de la CISA subió documentos sensibles a Ch...
-
Copia de seguridad de mi móvil, ¿mejor hacerla en ...
-
ASUS CROSSHAIR X870E DARK HERO y CROSSHAIR X870E G...
-
Fuga de datos en SoundCloud expone detalles de 29,...
-
Incidente en GitHub de ClawdBot acaba en estafa Cr...
-
Samsung confirma que el Galaxy S26 Ultra incluirá ...
-
Asistente de IA viral "Clawdbot" puede filtrar men...
-
Nike investiga filtración de datos tras reclamo de...
-
FRITZ!Box 5690 XGS llega a España, un router perfe...
-
La Comisión Europea revisará la petición «Dejad de...
-
Google filtra su sistema operativo para PC: Alumi...
-
Actualización de seguridad de Chrome corrige vulne...
-
Sabotajes en cables submarinos llevan a Finlandia ...
-
Google anuncia función de protección contra robos ...
-
Google desmantela la mayor red de proxies residenc...
-
Ataques de eSkimming impulsados por amenazas persi...
-
Pedido masivo de NVIDIA H200 de China: más de 2 mi...
-
Estos son los precios de los portátiles con Intel ...
-
Un equipo de ciberseguridad asistido por IA descub...
-
Micron anuncia inversión de 24.000 millones de dól...
-
Intel y AMD subirán los precios de sus CPU para IA...
-
Samsung ultima un Galaxy Wide Fold para triunfar f...
-
NVIDIA dividirá la fabricación de sus sistemas de ...
-
SEGA Meganet: así fue la gran pionera del juego on...
-
Uber presenta robotaxi sin conductor gracias a la ...
-
Realme bate todos los récords con la batería Titan...
-
Prosegur anuncia un sistema de defensa antidrones ...
-
La visión agéntica que Google ha estrenado en Gemi...
-
La OCU de España denuncia una nueva estafa telefón...
-
El director de videojuegos de Google Cloud dice qu...
-
El aumento de los precios de componentes como CPU,...
-
El Reloj del Juicio Final marca 85 segundos en 202...
-
PS5 se actualiza con funciones sociales: ya puedes...
-
Microsoft mejora la sincronización entre Windows 1...
-
HDMI 2.2: el doble de velocidad, 4K a 480 Hz y com...
-
¿Habrá que pagar por usar WhatsApp? Versiones de s...
-
LaLiga lleva sus bloqueos a las IPTV fuera de Espa...
-
Ciudadano chino condenado a 46 meses por lavar mil...
-
Ataque con CAPTCHA falso usa App-V de Microsoft pa...
-
Canva, Atlassian y Epic Games entre más de 100 emp...
-
Los nuevos satélites de Amazon Leo son demasiado b...
-
Alemania es el país europeo con la mitad de los ho...
-
Un activista británico demanda a Valve por 903 mil...
-
Vulnerabilidades en OpenSSL permiten a atacantes r...
-
Google advierte sobre vulnerabilidad en WinRAR exp...
-
El 64% de las aplicaciones de terceros acceden a d...
-
Intel XeSS 3 con Multi-Frame Generation ya está di...
-
Instagram, Facebook y WhatsApp probarán nuevas sus...
-
Valve se enfrenta a una demanda multimillonaria po...
-
Atacantes secuestran repositorio oficial de GitHub...
-
Más de 6.000 servidores SmarterMail vulnerables ex...
-
AMD Gorgon Point no presentará batalla frente a Pa...
-
Tarjetas gráficas NVIDIA y AMD: Guía de equivalencias
-
Vulnerabilidad 0-day en Gemini MCP permite a ataca...
-
Vulnerabilidad en TP-Link Archer permite a atacant...
-
Dario Amodei, CEO Anthropic, sobre el incierto fut...
-
ASML despedirá empleados pese al auge de chips de ...
-
El CEO de Cisco advierte: “la IA será más grande q...
-
Samsung crea un nuevo cartel inteligente de tinta ...
-
-
▼
enero
(Total:
680
)
-
►
2025
(Total:
2103
)
- ► septiembre (Total: 148 )
-
►
2024
(Total:
1110
)
- ► septiembre (Total: 50 )
-
►
2023
(Total:
710
)
- ► septiembre (Total: 65 )
-
►
2022
(Total:
967
)
- ► septiembre (Total: 72 )
-
►
2021
(Total:
730
)
- ► septiembre (Total: 56 )
-
►
2020
(Total:
212
)
- ► septiembre (Total: 21 )
-
►
2019
(Total:
102
)
- ► septiembre (Total: 14 )
-
►
2017
(Total:
231
)
- ► septiembre (Total: 16 )
-
►
2016
(Total:
266
)
- ► septiembre (Total: 38 )
-
►
2015
(Total:
445
)
- ► septiembre (Total: 47 )
-
►
2014
(Total:
185
)
- ► septiembre (Total: 18 )
-
►
2013
(Total:
100
)
- ► septiembre (Total: 3 )
-
►
2011
(Total:
7
)
- ► septiembre (Total: 1 )
Blogroll
Etiquetas
Entradas populares
-
ClothOff es una app que utiliza inteligencia artificial generativa para desnudar a cualquier persona a partir de fotografías con ropa que...
-
nmapUnleashed se presenta como un potente envoltorio CLI que mejora las capacidades de Nmap para penetration testers y auditores de redes ....
-
Symbian , el sistema operativo de Nokia, volverá a estar disponible en 2026 tras años de dominio en móviles, reviviendo uno de sus modelos ...
Samsung presenta su tecnología de SSD KV Cache Offloading para aumentar la rapidez de la inferencia IA en hasta un 95% a la vez que reduce el consumo a la mitad
Estamos en una época donde la IA se considera que puede alcanzar el pináculo de la tecnología y para muchas empresas está por encima de todo, por lo que invierten una mayor cantidad de recursos en esta. Aquí tenemos compañías de todo tipo, pues están las que se encargan de desarrollar modelos de IA, otras que desarrollan el hardware que se usará en tareas de inteligencia artificial y otras que simplemente invierten para usar estas herramientas. Samsung se situaría más respecto al hardware, pues aprovechando su liderazgo en el mundo de la memoria, ahora ha anunciado una tecnología KV Cache Offloading para SSD para mejorar el rendimiento y eficiencia en inferencia de IA.
Samsung es conocida por ser una empresa de Corea del Sur que se dedica a crear todo tipo de dispositivos y en cierta parte nos recuerda a Apple por el hecho de que suele triunfar y quedar entre las primeras en ventas. Así pues, es la marca más vendida de móviles Android, está la primera en términos de cuota de mercado en TV y sus electrodomésticos inteligentes también son populares. No solo eso, sino que Samsung es también la líder en el sector de la memoria y esto incluye tanto DRAM para memoria RAM como NAND Flash para SSD, USB o tarjetas microSD.
Samsung anuncia su tecnología para SSD KV Cache Offloading que permite reutilizar los datos y evitar volver a calcularlos para acelerar los procesos de inferencia IA
Ya vimos hace unos meses la gran subida de precio de la memoria RAM, donde todos y cada uno de los fabricantes anunciaron que era inevitable el incremento de los precios ante una alta demanda y posibilidad de escasez. Samsung fue una de estas y anunció que aumentaría el precio en más de un 100% en Q1 2026, pues aún queda mucho hasta que todo se normalice. Mientras tanto, nos toca dejar de lado la DRAM y centrarnos en la NAND Flash y los SSD, pues lo último de Samsung es la tecnología KV Cache Offloading que mejorará el rendimiento de la inferencia de IA.
Si no conoces la inferencia, esta es fundamental, pues esta llega tras el entrenamiento previo del modelo de IA y pasa así a una etapa donde toma decisiones en tiempo real y demuestra su capacidad en pruebas reales. Esto nos deja con el concepto del KV Cache, el cual es usado por los LLM para acelerar los procesos de inferencia y este cache funciona almacenando los tensor key y value para reutilizarlos y no volver a recalcularlos en cada nuevo token. Ahora entra el concepto del KV Cache Offloading de Samsung, el cual permite "descargar y reutilizar" ese caché KV haciendo que sea más eficiente y rápido el proceso, sobre todo en tareas con IA agencial.
Esta tecnología se puede usar en SSD como el Samsung PM1753 con hasta 14,5 GB/s y 3.3 millones de IOPS en lectura aleatoria. Samsung ha utilizado estos SSD en varias pruebas y empezando con la primera, se ha analizado como afecta el I/O o entradas/salidas de información con LMCache (KV Cache Open Source). Tenemos así el uso en el sistema donde dominado mayoritariamente por la lectura aleatoria con un 58% y la lectura secuencial con un 34%. Si pasamos a procesos, vemos que el 78% corresponde a la lectura secuencial y el 96% de los bloques son grandes, de más de 1 MB.
El KV Caché es hasta un 95% más rápido, permite un 70% más usuarios y reduce el consumo de energía a la mitad
Tras esto pasamos a las métricas de rendimiento que es lo que más nos interesa, pues aquí comparamos que cambia el utilizar esta tecnología de Samsung. Como podemos ver en el gráfico, estableciendo 1 segundo como el tiempo para generar el primer token, sin KV Cache Offloading tenemos a 140 usuarios y con este cache activado pasamos a 240 usuarios manteniendo ese segundo de tiempo, así que tiene un 70% más de capacidad. A su vez, podemos ver que con 240 usuarios es capaz de generar el primer token un 95% más rápido, pues sin el cache tarda 22 segundos. Si ahora pasamos a los tokens de salida, con la tecnología de Samsung podemos conseguir un 50% en los 240 usuarios y hay aún más diferencia a mayor número de estos.
En cuanto al consumo de energía, esta tecnología es muy eficaz para reducir el consumo de todo el sistema más que del propio SSD. Así es como vemos que el uso de la GPU pasa de un 77,2% a un 37,5%, los ventiladores bajan de 14.990 RPM a 8.764 RPM y el consumo total pasa de 6.400W a 3.400W, aproximadamente la mitad. Por último en cuanto a eficiencia relacionada con el coste, aquí tenemos una mejora de un 50% aproximadamente y si tenemos en cuenta que el SSD solo representa un 4% del valor total del sistema (casi todo se va en la GPU para IA), podemos concluir que es una tecnología fantástica para acelerar las tareas de inteligencia artificial.
Fuentes:
https://elchapuzasinformatico.com/2026/01/samsung-kv-cache-offloading-ia/




Entrada más reciente
0 comentarios :
Publicar un comentario
Los comentarios pueden ser revisados en cualquier momento por los moderadores.
Serán publicados aquellos que cumplan las siguientes condiciones:
- Comentario acorde al contenido del post.
- Prohibido mensajes de tipo SPAM.
- Evite incluir links innecesarios en su comentario.
- Contenidos ofensivos, amenazas e insultos no serán permitidos.
Debe saber que los comentarios de los lectores no reflejan necesariamente la opinión del STAFF.