Tutoriales y Manuales
Entradas Mensuales
-
▼
2026
(Total:
553
)
-
▼
enero
(Total:
553
)
-
El presidente del consejo de administración de Ope...
-
Samsung presenta su tecnología de SSD KV Cache Off...
-
Instala y configura Home Assistant en tu router AS...
-
Comparativa servicios VPN
-
Cientos de puertas de enlace Clawdbot expuestas de...
-
La Intel Arc B390 de iGPU en Panther Lake: rendimi...
-
12 años después Apple actualiza el iPhone 5s y otr...
-
MITRE lanza nuevo marco de ciberseguridad para pro...
-
Nuevo kit de malware redirige a usuarios a sitios ...
-
Apple presenta el AirTag 2: más alcance, localizac...
-
China amenaza con un enjambre de 200 drones con IA...
-
Clawdbot: Qué es, cómo se usa y cuáles son los pel...
-
Android 17 apostará por las transparencias inspira...
-
Intel va en serio con la IA local en 2026: las Arc...
-
Curl pondrá fin a su programa de recompensas por e...
-
Si WhatsApp es gratis, ¿cómo gana dinero Meta?
-
Lazarus atacan activamente empresas europeas de dr...
-
El lanzamiento de GTA 6 será exclusivamente digital
-
Explotan vulnerabilidad en telnetd para acceso roo...
-
Qué es la indexación de Windows 11 y cómo activarl...
-
Ciberdelincuentes usan Gemini para robar datos de ...
-
Trabajador estadounidense Robert Williams fue el p...
-
Navegador ChatGPT Atlas ahora puede entender vídeo...
-
Por qué algunas baterías externas son más baratas
-
El disco duro de mi PC con Windows era un caos has...
-
Weaponizing IA para crear malware
-
76 vulnerabilidades de día cero descubiertas por h...
-
Pueden convertir una página limpia en maliciosa en...
-
MacSync roba datos de macOS con ataque estilo Clic...
-
WhatsApp ofrecerá un plan de suscripción en Europa...
-
Red Dead Redemption 2 llegará a PS5 y Xbox Series ...
-
ChatGPT saca 15 sobresalientes en el examen de acc...
-
Demandan al sistema de contratación por IA utiliza...
-
Usan truco de error tipográfico "rn" para suplanta...
-
Neurophos Tulkas T110, así es la OPU a 56 GHz, con...
-
Usan archivos LNK para desplegar el malware MoonPe...
-
El RE Engine suppera al motor gráfico de Unreal En...
-
La Comisión Europea abre una investigación a X y G...
-
Para encender este PC tienes que echar una moneda,...
-
Meta impide que los niños y adolescentes de todo e...
-
Un modder convierte una PlayStation 4 Slim en una ...
-
Actores de amenazas simulan pantallazos azules y h...
-
Richard Stallman, el inventor del código abierto: ...
-
PlayStation 6: especificaciones, tecnologías, fech...
-
Final Fantasy VII Remake Part 3: motor gráfico y p...
-
Grupo APT Sandworm ataca la red eléctrica de Polon...
-
48 millones de cuentas de Gmail y 6,5 millones de ...
-
NVIDIA impulsa la generación de imagen y vídeo con...
-
¿El fin de los humanos? Así son las «fábricas oscu...
-
AMD Gorgon Halo: nueva APU Ryzen AI MAX+ 495 a mod...
-
El laboratorio secreto de OpenAI está enseñando a ...
-
Geoffrey Hinton, "padrino de la IA", reconoce esta...
-
Elon Musk da un consejo: "Zonas despobladas de Esp...
-
Elon Musk quiere colonizar Marte, pero primero deb...
-
El gestor de contraseñas 1Password tiene una noved...
-
Hackers norcoreanos usan IA para crear malware que...
-
Zen Browser es el navegador más limpio que puedes ...
-
WhatsApp: puedes seguir leyendo los mensajes aunqu...
-
20.000 sitios de WordPress afectados por vulnerabi...
-
Demandan a NVIDIA por haber recurrido a 500 TB de ...
-
IKEA inventa el enchufe "mágico": por menos de 10€...
-
Construye un Lamborghini impreso en 3D en su jardí...
-
ZAP publicado extensión de navegador OWASP PenTest...
-
Intel no consigue reconducir su rumbo en CPU: pier...
-
Europa quiere acabar con el ADSL en 2035
-
Fabricación del escáner de litografía EUV (Extreme...
-
LaLiga podría enfrentarse a un aluvión de demandas...
-
Grupo Everest filtra 72 millones de registros de U...
-
El color de tu cable Ethernet tiene un significado...
-
GitHub, Dropbox y DefendNot utilizados como arma
-
Un documento interno de Google revela que los Chro...
-
Hackers ganaron 516.500$ por 37 vulnerabilidades 0...
-
Satya Nadella, CEO de Microsoft, también teme a la...
-
La IA se integra en Sarco, la polémica cápsula de ...
-
AMD Ryzen 7 9850X3D: el nuevo rey del gaming podrí...
-
Nuevo malware de IA-Android que hace clics automát...
-
StackWarp, la vulnerabilidad que afecta a todas la...
-
Elon Musk pasa a la guerra total contra OpenAI: pi...
-
Construye un micrófono espía como el que usa la CI...
-
LastPass advierte sobre mensaje falso de mantenimi...
-
Experto en ciberseguridad: "Deja de usar WhatsApp ...
-
Microsoft lanza WinApp CLI de código abierto para ...
-
Microsoft compartió claves de BitLocker con el FBI...
-
Raspberry presenta un pendrive para Raspberry Pi 5
-
Los 10 videojuegos más esperados en 2026
-
Panel de afiliados y variantes de cifrado más reci...
-
Malware basado en Python SolyxImmortal roba datos ...
-
Nuevo ataque de phishing con Google Ads para distr...
-
Nuevo ataque Magecart inyecta JavaScript malicioso...
-
El SEPE de España advierte de una nueva estafa tel...
-
El NexPhone recupera Windows Phone, además de corr...
-
Vulnerabilidad en BIND 9 permite a atacantes bloqu...
-
NexPhone: el smartphone que combina Android, Linux...
-
Competencia para Starlink: Blue Origin lanza TeraW...
-
Adiós al remake de Prince of Persia
-
Hace 10 años robó 120.000 Bitcoins, hoy es un hack...
-
Nueva actualización de Bloc de notas y Paint de Wi...
-
Vulnerabilidad en SSO de Fortinet es explotada par...
-
ASUS se pronuncia ante los Ryzen 7 9800X3D dañados...
-
Arduino UNO Q se actualiza a una nueva versión con...
-
-
▼
enero
(Total:
553
)
-
►
2025
(Total:
2103
)
- ► septiembre (Total: 148 )
-
►
2024
(Total:
1110
)
- ► septiembre (Total: 50 )
-
►
2023
(Total:
710
)
- ► septiembre (Total: 65 )
-
►
2022
(Total:
967
)
- ► septiembre (Total: 72 )
-
►
2021
(Total:
730
)
- ► septiembre (Total: 56 )
-
►
2020
(Total:
212
)
- ► septiembre (Total: 21 )
-
►
2019
(Total:
102
)
- ► septiembre (Total: 14 )
-
►
2017
(Total:
231
)
- ► septiembre (Total: 16 )
-
►
2016
(Total:
266
)
- ► septiembre (Total: 38 )
-
►
2015
(Total:
445
)
- ► septiembre (Total: 47 )
-
►
2014
(Total:
185
)
- ► septiembre (Total: 18 )
-
►
2013
(Total:
100
)
- ► septiembre (Total: 3 )
-
►
2011
(Total:
7
)
- ► septiembre (Total: 1 )
Blogroll
Etiquetas
Entradas populares
-
IKEA lanza el enchufe inteligente INSPELNING , por menos de 10 euros , que reduce la factura de luz al medir el consumo eléctrico y es com...
-
El Kode Dot es un dispositivo portátil que asusta a expertos en ciberseguridad por su capacidad para controlar casi cualquier sistema , f...
-
Un proyecto permite actualizar Windows 7 hasta enero de 2026 , añadiendo soporte para SSDs NVMe y USB 3.x , mejorando su seguridad y compati...
Samsung presenta su tecnología de SSD KV Cache Offloading para aumentar la rapidez de la inferencia IA en hasta un 95% a la vez que reduce el consumo a la mitad
Estamos en una época donde la IA se considera que puede alcanzar el pináculo de la tecnología y para muchas empresas está por encima de todo, por lo que invierten una mayor cantidad de recursos en esta. Aquí tenemos compañías de todo tipo, pues están las que se encargan de desarrollar modelos de IA, otras que desarrollan el hardware que se usará en tareas de inteligencia artificial y otras que simplemente invierten para usar estas herramientas. Samsung se situaría más respecto al hardware, pues aprovechando su liderazgo en el mundo de la memoria, ahora ha anunciado una tecnología KV Cache Offloading para SSD para mejorar el rendimiento y eficiencia en inferencia de IA.
Samsung es conocida por ser una empresa de Corea del Sur que se dedica a crear todo tipo de dispositivos y en cierta parte nos recuerda a Apple por el hecho de que suele triunfar y quedar entre las primeras en ventas. Así pues, es la marca más vendida de móviles Android, está la primera en términos de cuota de mercado en TV y sus electrodomésticos inteligentes también son populares. No solo eso, sino que Samsung es también la líder en el sector de la memoria y esto incluye tanto DRAM para memoria RAM como NAND Flash para SSD, USB o tarjetas microSD.
Samsung anuncia su tecnología para SSD KV Cache Offloading que permite reutilizar los datos y evitar volver a calcularlos para acelerar los procesos de inferencia IA
Ya vimos hace unos meses la gran subida de precio de la memoria RAM, donde todos y cada uno de los fabricantes anunciaron que era inevitable el incremento de los precios ante una alta demanda y posibilidad de escasez. Samsung fue una de estas y anunció que aumentaría el precio en más de un 100% en Q1 2026, pues aún queda mucho hasta que todo se normalice. Mientras tanto, nos toca dejar de lado la DRAM y centrarnos en la NAND Flash y los SSD, pues lo último de Samsung es la tecnología KV Cache Offloading que mejorará el rendimiento de la inferencia de IA.
Si no conoces la inferencia, esta es fundamental, pues esta llega tras el entrenamiento previo del modelo de IA y pasa así a una etapa donde toma decisiones en tiempo real y demuestra su capacidad en pruebas reales. Esto nos deja con el concepto del KV Cache, el cual es usado por los LLM para acelerar los procesos de inferencia y este cache funciona almacenando los tensor key y value para reutilizarlos y no volver a recalcularlos en cada nuevo token. Ahora entra el concepto del KV Cache Offloading de Samsung, el cual permite "descargar y reutilizar" ese caché KV haciendo que sea más eficiente y rápido el proceso, sobre todo en tareas con IA agencial.
Esta tecnología se puede usar en SSD como el Samsung PM1753 con hasta 14,5 GB/s y 3.3 millones de IOPS en lectura aleatoria. Samsung ha utilizado estos SSD en varias pruebas y empezando con la primera, se ha analizado como afecta el I/O o entradas/salidas de información con LMCache (KV Cache Open Source). Tenemos así el uso en el sistema donde dominado mayoritariamente por la lectura aleatoria con un 58% y la lectura secuencial con un 34%. Si pasamos a procesos, vemos que el 78% corresponde a la lectura secuencial y el 96% de los bloques son grandes, de más de 1 MB.
El KV Caché es hasta un 95% más rápido, permite un 70% más usuarios y reduce el consumo de energía a la mitad
Tras esto pasamos a las métricas de rendimiento que es lo que más nos interesa, pues aquí comparamos que cambia el utilizar esta tecnología de Samsung. Como podemos ver en el gráfico, estableciendo 1 segundo como el tiempo para generar el primer token, sin KV Cache Offloading tenemos a 140 usuarios y con este cache activado pasamos a 240 usuarios manteniendo ese segundo de tiempo, así que tiene un 70% más de capacidad. A su vez, podemos ver que con 240 usuarios es capaz de generar el primer token un 95% más rápido, pues sin el cache tarda 22 segundos. Si ahora pasamos a los tokens de salida, con la tecnología de Samsung podemos conseguir un 50% en los 240 usuarios y hay aún más diferencia a mayor número de estos.
En cuanto al consumo de energía, esta tecnología es muy eficaz para reducir el consumo de todo el sistema más que del propio SSD. Así es como vemos que el uso de la GPU pasa de un 77,2% a un 37,5%, los ventiladores bajan de 14.990 RPM a 8.764 RPM y el consumo total pasa de 6.400W a 3.400W, aproximadamente la mitad. Por último en cuanto a eficiencia relacionada con el coste, aquí tenemos una mejora de un 50% aproximadamente y si tenemos en cuenta que el SSD solo representa un 4% del valor total del sistema (casi todo se va en la GPU para IA), podemos concluir que es una tecnología fantástica para acelerar las tareas de inteligencia artificial.
Fuentes:
https://elchapuzasinformatico.com/2026/01/samsung-kv-cache-offloading-ia/




Entrada más reciente
0 comentarios :
Publicar un comentario
Los comentarios pueden ser revisados en cualquier momento por los moderadores.
Serán publicados aquellos que cumplan las siguientes condiciones:
- Comentario acorde al contenido del post.
- Prohibido mensajes de tipo SPAM.
- Evite incluir links innecesarios en su comentario.
- Contenidos ofensivos, amenazas e insultos no serán permitidos.
Debe saber que los comentarios de los lectores no reflejan necesariamente la opinión del STAFF.