Entradas Mensuales

Síguenos en:

Canal Oficial Telegram de elhacker.NET Grupo Facebook elhacker.NET Twitter elhacker.NET Canal Youtube elhacker.NET Comunidad Steam: Grupo elhacker.NET Mastodon

Entradas populares

PostHeaderIcon NVIDIA presenta los modelos de razonamiento de IA Llama Nemotron


NVIDIA (NASDAQ:NVDA), el gigante de semiconductores  ha anunciado el lanzamiento de su familia de modelos Llama Nemotron, diseñados para mejorar las capacidades de razonamiento de IA para desarrolladores y empresas. Se dice que los nuevos modelos mejoran las tareas matemáticas de varios pasos, codificación, razonamiento y toma de decisiones complejas, con mejoras de precisión de hasta un 20% y optimizaciones de velocidad de inferencia 5 veces superiores en comparación con los modelos existentes.





 

 

¿Qué es Llama Nemotron?

NVIDIA Llama Nemotron es una familia de modelos avanzados que destacan en materia de razonamiento y un conjunto diverso de tareas de IA autónoma. Los modelos están optimizados para plataformas —desde centros de datos hasta ordenadores— y destacan a nivel de razonamiento científico de posgrado, matemáticas avanzadas, codificación, seguimiento de instrucciones y llamadas a herramientas.


 

Estos modelos tienen la capacidad de activar y desactivar las capacidades de razonamiento, lo cual reduce los costos de inferencia cuando las tareas no requieren un pensamiento profundo.

Familia de modelos de razonamiento NVIDIA Llama Nemotron


NVIDIA acaba de presentar NVIDIA Llama Nemotron, una familia abierta de los principales modelos de IA que ofrecen capacidades de razonamiento excepcionales, eficiencia computacional y una licencia abierta para uso empresarial.

La familia se presenta en tres tamaños, lo que proporciona a los desarrolladores el tamaño de modelo adecuado en función de sus necesidades de uso, disponibilidad de cálculo y precisión.
  • Nano: 8B destilado de Llama 3.1 8B para la máxima precisión en PC y edge.
  • Super: 49B destilados de Llama 3.3 70B para obtener la mayor precisión con el mayor rendimiento en una GPU de un centro de datos
  • Ultra: 253B destilados de Llama 3.1 405B para la máxima precisión agéntica en servidores de centros de datos multi-GPU (próximamente).



Los modelos de razonamiento Llama Nemotron están disponibles en tamaños Nano, Super y Ultra, cada uno optimizado para diferentes escenarios de implementación. El modelo Nano está diseñado para PC y dispositivos periféricos, el modelo Super para configuraciones de una sola GPU y el modelo Ultra para servidores multi-GPU.

Empresas como Accenture, Amdocs, Atlassian, Box, Cadence, CrowdStrike, Deloitte, IQVIA, Microsoft, SAP y ServiceNow están colaborando con NVIDIA para integrar estos modelos de razonamiento en sus servicios. Por ejemplo, Microsoft planea incorporar los modelos Llama Nemotron en su Azure AI Foundry, y SAP está utilizando los modelos para mejorar sus soluciones Business AI y el copiloto Joule AI.


 

NVIDIA también ha introducido nuevas herramientas y software para respaldar la implementación de estos modelos, incluyendo los microservicios NVIDIA NIM para optimizar la inferencia y permitir el aprendizaje continuo, así como el NVIDIA AI-Q Blueprint y la Plataforma de Datos de IA de NVIDIA para ayudar en la construcción de sistemas de IA colaborativos.

Los modelos Llama Nemotron Nano y Super, junto con los microservicios NIM, están actualmente disponibles para desarrollo, pruebas e investigación a través del Programa para Desarrolladores de NVIDIA. Las empresas pueden implementar estos modelos en producción con NVIDIA AI Enterprise en infraestructuras de centros de datos y en la nube. Se espera que el NVIDIA AI-Q Blueprint esté disponible en abril, y el kit de herramientas NVIDIA AgentIQ ya es accesible en GitHub.

En otras noticias recientes, NVIDIA ha presentado una serie de avances tecnológicos significativos destinados a mejorar las capacidades de IA y robótica. La compañía introdujo el modelo GR00T N1, un modelo fundacional para robots humanoides, durante su evento GTC. Este modelo está diseñado para mejorar el razonamiento y las habilidades de los robots humanoides y está disponible para desarrolladores de todo el mundo. NVIDIA también lanzó las GPUs RTX PRO Blackwell, que se espera mejoren la productividad en varios campos profesionales al acelerar los flujos de trabajo en sectores de IA, técnicos, creativos y de ingeniería.


 

Adicionalmente, NVIDIA anunció el lanzamiento de dos supercomputadoras de IA personales, la DGX Spark y la DGX Station, que llevan la arquitectura NVIDIA Grace Blackwell a los escritorios, permitiendo a los desarrolladores construir e implementar grandes modelos de IA. La compañía también introdujo switches de fábrica de IA energéticamente eficientes, el NVIDIA Spectrum-X y Quantum-X, para optimizar las redes en centros de datos de IA. Estos switches prometen reducir significativamente el consumo de energía y los costos operativos.

Además, NVIDIA reveló la plataforma Blackwell Ultra, diseñada para mejorar el razonamiento de IA y las capacidades de inferencia de escala, que se espera entregue 1,5 veces el rendimiento de IA de su predecesor. La plataforma incluye los sistemas GB300 NVL72 y HGX B300 NVL16, destinados a mejorar la calidad del servicio de IA. Las colaboraciones continuas de NVIDIA con socios como Google DeepMind y Disney Research siguen apoyando el desarrollo de tecnologías avanzadas de IA y robótica.

Fuentes:

https://developer.nvidia.com/blog/build-enterprise-ai-agents-with-advanced-open-nvidia-llama-nemotron-reasoning-models/

https://build.nvidia.com/nvidia/llama-3_3-nemotron-super-49b-v1


0 comentarios :

Publicar un comentario

Los comentarios pueden ser revisados en cualquier momento por los moderadores.

Serán publicados aquellos que cumplan las siguientes condiciones:
- Comentario acorde al contenido del post.
- Prohibido mensajes de tipo SPAM.
- Evite incluir links innecesarios en su comentario.
- Contenidos ofensivos, amenazas e insultos no serán permitidos.

Debe saber que los comentarios de los lectores no reflejan necesariamente la opinión del STAFF.