Tutoriales y Manuales
Entradas Mensuales
-
▼
2025
(Total:
270
)
-
▼
febrero
(Total:
105
)
-
Clonación de llaves electrónicas permite robar veh...
-
GPU NVIDIA A100 para IA
-
Grupo Lazarus de Corea del Norte se hace con un bo...
-
OWASP Top 10 para aplicaciones de modelos de lengu...
-
En México usan citas falsas del SAT para propagar ...
-
Ciberataque en México: grupo de ransomware Lockbit...
-
Microsoft está probando una versión de Office para...
-
Los servicios de VPN podrían abandonar Francia si ...
-
Google presenta Gemini Code Assist, una IA gratuit...
-
Ella tiene un tórrido romance con ChatGPT
-
NVIDIA Tesla P40 en un ordenador personal para IA LLM
-
Hackean a Comisiones Obreras - CCOO y amenazan con...
-
Gmail reemplaza los SMS por códigos QR para aument...
-
Anthropic presenta Claude 3.7 Sonnet: la primera I...
-
Un banco Argentino deberá devolverle $140 millones...
-
RAID 10: la combinación de RAID entre espejo y str...
-
Elon Musk pide destruir la Estación Espacial Inter...
-
Detenido por hackear al Betis. Su objetivo: conseg...
-
El primer SSD PCIe Gen5 de Micron con una velocida...
-
Activación permanente de Windows y Office con una ...
-
Cloudflare emprende acciones legales contra LaLiga...
-
Microsoft presenta Muse, un modelo de IA generativ...
-
Ingeniería Social orientada a engañar usuarios par...
-
Vulnerabilidades de seguridad de OpenSSH hace que ...
-
DeepSeek-V3 vs DeepSeek-R1: cuáles son las diferen...
-
GPU: VRAM y FPS ¿Qué relación tienen en el rendimi...
-
PHP: mod_php vs CGI vs FastCGI vs FPM
-
RansomHub fue el principal grupo de ransomware de ...
-
Microsoft bloquea 7.000 ataques a contraseñas por ...
-
Trucos para Telegram
-
Vulnerabilidad crítica en FortiOS Security Fabric ...
-
Steam sufrió un ataque DDoS sin precedentes aunque...
-
Docker Desktop para Windows con WSL o Hyper-V
-
Filtración masiva de datos de IoT con 2.734 millon...
-
Guía de compra GPU - Nomenclatura Tarjetas Gráfica...
-
WhatsApp se integra con Instagram para mostrar enl...
-
Android System SafetyCore
-
Google usará la IA para conocer tu edad y modifica...
-
Apple soluciona una vulnerabilidad Zero-Day explot...
-
Ataques de phishing en imágenes SVG
-
¿Qué es la generación aumentada de recuperación (R...
-
Goku AI: la inteligencia artificial china de códig...
-
AMD prepara una Radeon RX 9070 XTX con 32 GB de me...
-
Tutorial: SSH en Windows (Servidor y Cliente)
-
Túnel TCP con Cloudflare Tunnel
-
"Cambio automático de contraseñas" en Google Chrom...
-
La Unión Europea busca movilizar 200.000 millones ...
-
Microsoft elimina una página de ayuda para desinst...
-
Cloudflare Tunnels
-
¿Qué es una shell inversa?
-
Le Chat, la IA más avanzada hecha en Europa
-
Google Gemini 2.0 Pro IA
-
ChatGPT en WhatsApp
-
Filtrados los datos personales de 3 millones de us...
-
Movistar España bloquea internet en un intento por...
-
Thunderbolt vs USB-C: qué son, diferencias y cómo ...
-
El Reino Unido ordena a Apple que le permita acced...
-
Inteligencia artificial en local en tu PC
-
Qué fuente de alimentación elegir según la tarjeta...
-
Tecnología RTX Neural de nvidia
-
Mizuno confirma ataque ransomware BianLian con fil...
-
Múltiples vulnerabilidades críticas en productos d...
-
WinScript permite personalizar, optimizar y config...
-
Cloudflare Turnstile: una nueva alternativa a reCA...
-
NanaZip 5.0: todas las novedades del mejor compres...
-
Barcelona Supercomputing Center (BSC) estrena prim...
-
Cisco corrige vulnerabilidades críticas de ISE que...
-
Logran ejecutar DOOM en un adaptador de Lightning ...
-
Aprovechan vulnerabilidad de IIS de hace 6 años pa...
-
Exingeniero de Google es acusado en EEUU de robar ...
-
Vulnerabilidad zero-day crítica en Android
-
Verificación de identidad o 'Identity check' : la ...
-
Europa quiere prohibir el envío de consolas a Rusi...
-
La Comisión Europea quiere acabar con la exención ...
-
DeepSeek: Una investigación revela a dónde van tus...
-
Google cambia las directrices de su IA y elimina u...
-
Detenido en Alicante 'Natohub,' de 18 años que hac...
-
Diferencias y velocidades entre PCIe Gen 4 y PCIe ...
-
OCuLink, el mejor conector para gráficas externas ...
-
Así es la pila atómica que ha presentado China cap...
-
Instalar DeepSeek en local en Android con Termux
-
Todos los modelos de IA de OpenAI
-
Las impresoras 3D en Estados Unidos podrían ser in...
-
El Pentágono bloquea DeepSeek en menos de una sema...
-
Limpieza y mantenimiento de una tarjeta gráfica
-
Conectores PCI Express x16, x8, x4 y x1: diferenci...
-
Reportan algunos problemas para las GeForce RTX 5090
-
Microsoft presenta el Surface USB4 Dock por 99$
-
NVIDIA Studio Voice convierte el mediocre micrófon...
-
OpenAI quiere diseñar robots humanoides impulsados...
-
Europa anuncia OpenEuroLLM, su plan para plantarle...
-
OpenAI quiere reemplazar los smartphones con un di...
-
Análisis de las principales vulnerabilidades explo...
-
WhatsApp detecta un ataque de spyware tipo Pegasus...
-
El coste real de DeepSeek no fue de 6 millones de ...
-
Windows Paint tendrá un botón de Copilot para acel...
-
Guía DeepSeek: funciones y cosas que puedes hacer ...
-
Cómo utilizar un SSD NVMe en Raspberry Pi
-
OpenAI responde a DeepSeek publicando o3 para todos
-
Cómo crear gráficos a partir de datos con ChatGPT
-
-
▼
febrero
(Total:
105
)
-
►
2024
(Total:
1110
)
- ► septiembre (Total: 50 )
-
►
2023
(Total:
710
)
- ► septiembre (Total: 65 )
-
►
2022
(Total:
967
)
- ► septiembre (Total: 72 )
-
►
2021
(Total:
730
)
- ► septiembre (Total: 56 )
-
►
2020
(Total:
212
)
- ► septiembre (Total: 21 )
-
►
2019
(Total:
102
)
- ► septiembre (Total: 14 )
-
►
2017
(Total:
231
)
- ► septiembre (Total: 16 )
-
►
2016
(Total:
266
)
- ► septiembre (Total: 38 )
-
►
2015
(Total:
445
)
- ► septiembre (Total: 47 )
-
►
2014
(Total:
185
)
- ► septiembre (Total: 18 )
-
►
2013
(Total:
100
)
- ► septiembre (Total: 3 )
-
►
2011
(Total:
7
)
- ► septiembre (Total: 1 )
Blogroll
Etiquetas
Entradas populares
-
Gracias a un nuevo método de activación permanente, han conseguido eludir por completo el sistema de protección de derechos digitales (DRM) ...
-
Una semana para pagar el rescate. Ese es el plazo que ha dado al sindicato Comisiones Obreras el grupo Hunter International , una de las or...
-
Después de ver qué es una vCPU y la diferencia entre núcleos (cores) e hilos en los procesadores, pasamos a explicar toda la nomenclatura d...
NVIDIA Tesla P40 en un ordenador personal para IA LLM
La NVIDIA Tesla P40, que en su día fue una potencia en el ámbito de las GPU de servidor, está diseñada principalmente para tareas de aprendizaje profundo e inteligencia artificial. Equipada con 24 GB de VRAM GDDR5, esta GPU es una opción interesante para quienes deseen ejecutar modelos de generación local de texto, como los basados en arquitecturas GPT (Generative Pre-trained Transformer). Este artículo explora la viabilidad, las posibles ventajas y el proceso de instalación de la Tesla P40 en un ordenador de consumo.
¿Por qué alguien haría esto?
Coste, coste y curiosidad. P40s usados en eBay se venden alrededor de 400$ (antes por 170$). Son lentas en el cálculo frente a las tarjetas gráficas modernas RTX 30, 40 pero 24GB VRAM es difícil de ignorar y con un coste mucho menor. Una RTX 4090 de 24 GB usada en eBay podía costar entre 1.500 y 2.000 dólares, ahora unos 600$
Entendiendo la NVIDIA Tesla P40
Antes de sumergirnos en la instalación y aplicación de la Tesla P40, vamos a entender sus especificaciones y capacidades:
- - Arquitectura de la GPU: Basada en la arquitectura Pascal
- - Memoria: 24 GB de VRAM GDDR5 es una de sus características más destacadas, ya que permite gestionar grandes conjuntos de datos y redes neuronales complejas sin el cuello de botella que suele provocar una memoria insuficiente en la GPU.
- - Rendimiento: Diseñado para la IA y la computación de alto rendimiento, ofrece un impulso significativo en tareas de inferencia, lo que resulta crítico para aplicaciones como la generación de texto en tiempo real. Cuando era nuevo...
El valor de 24 GB de VRAM para modelos de generación de texto
La principal ventaja de disponer de 24 GB de VRAM en la NVIDIA Tesla P40 para modelos de generación de texto reside en su capacidad para manejar cómodamente modelos de gran tamaño. Los modelos de generación de texto modernos, especialmente los de la serie GPT, son conocidos por su gran número de parámetros:
- Modelos grandes: Modelos como GPT-3 o GPT-4 pueden tener miles de millones de parámetros, lo que requiere una cantidad considerable de memoria para cargarlos y ejecutarlos con eficacia.
- Procesamiento por lotes: Más VRAM permite tamaños de lote más grandes durante el entrenamiento o la inferencia, lo que puede acelerar significativamente el proceso.
¿Se puede instalar una Tesla P40 en un ordenador personal?
Aunque la Tesla P40 se utiliza normalmente en centros de datos y entornos de servidor, es técnicamente posible instalarla en un ordenador de sobremesa de nivel de consumidor, siempre que se cumplan varias condiciones:
Requisitos de alimentación: La Tesla P40 consume hasta 250 vatios, por lo que se necesita una fuente de alimentación (PSU) robusta, preferiblemente con una capacidad de al menos 750-1000 vatios y los conectores adecuados. Requiere un conector especial que utiliza dos cables de alimentación PCI juntos para suministrar los 250 vatios. Adaptador CPU 8 (Pin) Macho a Dual PCIe 8 Pin Hembra ($6.98)
Sistema de refrigeración: Las GPU de servidor como la P40 no vienen con sistemas de refrigeración activos. Por lo tanto, tendrás que garantizar una refrigeración adecuada en tu sistema. Y aquí viene lo complicado. Las pocas soluciones que encontré no eran adecuadas para mí. Tengo algunos viejos equipos de refrigeración por agua por si todo lo demás falla, pero quería ver si podía encontrar una solución basada en ventiladores. Primero diseñé una cubierta que aceptaba un ventilador de alta presión estática de 120 mm. Le hice unos agujeros que coincidían con los tornillos PCI de la caja que estaba usando e hice que su anchura coincidiera con la sección PCI de la caja para que encajara a presión y luego quedara sujeto por los tres tornillos PCI. El ventilador, un NZXT RF-AP120-FP que encontré en una pila de hardware antiguo, puede ofrecer 2.000 RPM, 73,11 CFM y 2,93 mm/H2O
Espacio físico: Asegúrate de que la caja de tu ordenador puede alojar la tarjeta, que es físicamente más grande y está diseñada para bastidores de servidores. Yo utilicé un ordenador antiguo que había construido hace unos años.
Conclusión
Aunque poco convencional, la integración de una Tesla P40 en un ordenador de consumo para tareas de generación de texto local ofrece importantes ventajas, principalmente debido a su gran capacidad de VRAM. Esta configuración resulta especialmente ventajosa para quienes deseen experimentar con la IA sin el coste de las GPU de gama alta.
Sin embargo, los usuarios potenciales deben tener en cuenta los retos logísticos y técnicos, como garantizar una fuente de alimentación, refrigeración y alojamiento físico adecuados. Si se tienen en cuenta estos factores, la Tesla P40 puede mejorar la capacidad de un sistema de consumo para realizar tareas de IA de alto nivel tradicionalmente reservadas a hardware más especializado. Además, el hardware de consumo puede no tener el mismo nivel de fiabilidad y soporte que el hardware de servidor y el hardware de consumo puede no estar optimizado para cargas de trabajo de IA, lo que podría provocar problemas de rendimiento.
La verdadera pregunta es: ¿funciona bien? Aún es pronto para saberlo. Tengo una configuración similar que utiliza una RTX 3060 de 12 GB y la velocidad de procesamiento es bastante comparable, según las pocas pruebas que he realizado. Sin embargo, puede cargar modelos mucho más grandes y es más barata.
En general, se trata de una prueba para ver si podría hacer esto para otros componentes de servidor más caros en el futuro. En este momento, la respuesta a esa pregunta es SÍ.
3x Nvidia Tesla P40 24GB
0 comentarios :
Publicar un comentario
Los comentarios pueden ser revisados en cualquier momento por los moderadores.
Serán publicados aquellos que cumplan las siguientes condiciones:
- Comentario acorde al contenido del post.
- Prohibido mensajes de tipo SPAM.
- Evite incluir links innecesarios en su comentario.
- Contenidos ofensivos, amenazas e insultos no serán permitidos.
Debe saber que los comentarios de los lectores no reflejan necesariamente la opinión del STAFF.