Tutoriales y Manuales
Entradas Mensuales
-
▼
2024
(Total:
1090
)
- ► septiembre (Total: 50 )
-
▼
julio
(Total:
104
)
- Los actores de doblaje de videojuegos, en huelga c...
- Intel confirma daños permanentes en los Core Gen 1...
- Un fallo en Google Password Manager dejó sin contr...
- Múltiples malware y ransomware aprovechan vulnerab...
- Estafas del CEO mediate IA
- Nicolás Maduro declara a Elon Musk «archienemigo» ...
- Las ganancias de Tesla caen un 45 %, mientras Elon...
- Suiza exigirá que todo el software gubernamental s...
- Secure Boot está roto en más de 200 modelos de 5 g...
- Cómo evitar que X (Twitter) use tus publicaciones ...
- Elon Musk se enfrenta a nuevas sanciones por entre...
- Error en WhatsApp para Windows permite ejecución d...
- Compañía de seguridad de EEUU contrató un ingenier...
- Cómo funciona DDoSia: la herramienta DDoS utilizad...
- Grindr bloquea algunas funciones en la Villa Olímp...
- Apple Maps lanza, por fin, una versión web para co...
- Modus operandi de un ataque del ransomware Akira
- Suplantación de archivos en WhatsApp para Android
- CrowdStrike ofrece un vale de 10€ en UberEats para...
- AMD retrasa ligeramente el lanzamiento de los Ryze...
- El CNI de España coordina una respuesta al ataque ...
- Photoshop permite crear imágenes con IA desde sus ...
- Meta presenta Llama 3.1, su IA de código abierto q...
- Grupo pro ruso NoName057(16) realiza ataques DDoS ...
- Windows 11 funciona en un iPhone 15 Pro, aunque mu...
- Compañía aérea se salva del desastre de CrowdStrik...
- Facebook quiere gastarse 87.000 millones en ‘Ray-B...
- Google eliminará acortador de URLs goo.gl en 2025
- Microsoft culpa a la UE de lo sucedido con CrowdSt...
- Process Hollowing: una técnica de evasión utilizad...
- 0-Day en Telegram permitía enviar archivos dañinos...
- Herramienta de Microsoft para recuperar equipos da...
- China tiene un equipo de ciberseguridad que se enc...
- La nueva normativa pide usar botones físicos en lo...
- La Guardia Civil detiene a tres prorrusos en Españ...
- Caída global por culpa de CrowdStrike: un apagón c...
- OpenAI presenta GPT-4o mini, una IA más potente y ...
- Filtración de datos de empresa espía mSpy, revela ...
- Armas biológicas diseñadas por IA
- Hack WPA / WPA2 fácilmente sin fuerza bruta con Fl...
- Configurar Telegraf, InfluxDBv2 y Grafana para mon...
- Caddy: un servidor web con funciones de proxy inverso
- Windows resolverá el problema de las actualizacion...
- Apple y otras empresas usaron videos de YouTube pa...
- Vulnerabilidad crítica en GeoServer GeoTools explo...
- El FBI logra acceso al móvil del atacante de Donal...
- Las guerras de Unix: Un capítulo crucial en la his...
- Europa dice que X (Twitter) engaña a los usuarios ...
- Detenidos tres menores por difundir por Whatsapp f...
- Google quiere comprar la startup de ciberseguridad...
- Explotación de vulnerabilidades tan solo 22 minuto...
- 0-Day en Windows MSHTML utilizado en ataques de ma...
- HardBit ransomware version 4.0
- Fábrica de Xiaomi abierta 24/7 en la que todos los...
- Alemania dejará gradualmente sin uso de las redes ...
- Detenido de nuevo Alcasec por robar los datos de 3...
- Vulnerabilidad crítica en Exim expone a millones d...
- Cómo la desinformación rusa terminó en el top de l...
- Excel incluye un editor para programar en Python
- Parche de Microsoft para grave vulnerabilidad acce...
- Vulnerabilidad crítica en GitLab Community y Enter...
- Cómo roban cuentas de YouTube con infostealers
- Función de WhatsApp transcribe las notas de voz pa...
- The Harvester: herramienta OSINT para analizar los...
- AMD compra la finlandesa Silo AI para impulsar su ...
- Windows 10 recibe Copilot como parte de una actual...
- Samsung Galaxy Ring, un anillo cuantificador con a...
- Microsoft abandona la junta directiva de OpenAI en...
- Elon Musk es acusado de hacer trampa con el sistem...
- Vulnerabilidad crítica en libreria Ghostscript en ...
- Youtuber muestra cómo conseguir juegos gratis en S...
- La computadora cuántica de Google es humillada por...
- Fossify es una suite Open Source, gratis y sin anu...
- Nothing desvela el CMF Phone 1, un sorprendente sm...
- Google Maps introducirá anuncios en la navegación
- Todo lo que necesitas saber sobre puertos USB y ve...
- El Dorado ransomware: objetivo máquinas virtuales ...
- Batocera es una retroconsola para PC y Android
- Recopilación de 10 mil millones de contraseñas
- Limitar el ancho de banda en Linux
- Rack SSD
- Servidor Blade vs. Servidor de Rack vs. Servidor d...
- ChatGPT para Mac expuso las conversaciones de mill...
- Roban 33 millones de números de teléfono del famos...
- La UE podría eliminar la exención aduanera a los p...
- Google Drive ahora es Booteable
- Organismo rector de la Fórmula 1 revela una filtra...
- Google Chrome bloqueará los certificados TLS de En...
- Apple veta la emulación de PCs «retro» en iOS
- 54 detenidos por estafar más de 2 millones de euro...
- YouTube permite solicitar el borrado de vídeos gen...
- Primer cable Thunderbolt 5 con una velocidad 120 G...
- Los adultos Españoles que quieran entrar en webs p...
- Japón bate el récord de banda ancha superando los ...
- Wise alerta de un hackeo masivo con robo de datos ...
- Detenido autor puntos de acceso Wifi falsos en aer...
- regreSSHion: 14 millones de servidores OpenSSH vul...
- NFC - ¿Qué es, cómo funciona y qué riesgos de segu...
- WhatsApp publica su planificador de eventos para g...
- Meta deja de publicar parches de seguridad para el...
-
►
2023
(Total:
710
)
- ► septiembre (Total: 65 )
-
►
2022
(Total:
967
)
- ► septiembre (Total: 72 )
-
►
2021
(Total:
730
)
- ► septiembre (Total: 56 )
-
►
2020
(Total:
212
)
- ► septiembre (Total: 21 )
-
►
2019
(Total:
102
)
- ► septiembre (Total: 14 )
-
►
2017
(Total:
231
)
- ► septiembre (Total: 16 )
-
►
2016
(Total:
266
)
- ► septiembre (Total: 38 )
-
►
2015
(Total:
445
)
- ► septiembre (Total: 47 )
-
►
2014
(Total:
185
)
- ► septiembre (Total: 18 )
-
►
2013
(Total:
100
)
- ► septiembre (Total: 3 )
-
►
2011
(Total:
7
)
- ► septiembre (Total: 1 )
Blogroll
Etiquetas
Entradas populares
-
Después de ver qué es una vCPU y la diferencia entre núcleos (cores) e hilos en los procesadores, pasamos a explicar toda la nomenclatura d...
-
iperf3 es la última versión del popular programa iperf para medir el ancho de banda entre dos o más equipos en red local o Internet . Es...
-
A finales del mes de agosto hablábamos de que los legisladores estadounidense habían solicitado la investigación de TP-Link . Y así, ya ten...
Meta presenta Llama 3.1, su IA de código abierto que compite con GPT-4o
La apuesta de Meta por los modelos de lenguaje a gran escala se distingue por ser de código abierto, lo que facilita ganar el título de más grande y mejor en su sector. Sin embargo, la compañía liderada por Mark Zuckerberg no quiere quedarse ahí, así que ha presentado Llama 3.1, la nueva generación de su modelo de IA que "rivaliza con los mejores modelos de código cerrado". Meta se refiere a GPT-4o de OpenAI y Claude 3.5 Sonnet de Anthropic, que están apoyados por Microsoft y Amazon, respectivamente.
Meta presentó Llama 3.1 405B, el primer modelo abierto capaz de competir con GPT-4o.
El gigante tecnológico no quiere quedar rezagado en la carrera de la
inteligencia artificial, aunque ha optado por un camino distinto a
OpenAI y Google. En lugar de desarrollar modelos cerrados como Gemini o
GPT-4, apuesta por el código abierto para potenciar sus aplicaciones.
- Llama 3.1 tiene 405.000 millones de parámetros
- Destaca en conocimientos generales, matemáticas, uso de herramientas y traducción multilingüe
"Llama
3.1 405B es el primer modelo de código abierto que compite con los
principales modelos de IA en lo que respecta a las funciones más
avanzadas de conocimientos generales, capacidad de conducción,
matemáticas, uso de herramientas y traducción multilingüe", dice Meta.
Esta nueva versión del modelo también permite que el asistente Meta AI
basado en Llama esté disponible en nuevos países e idiomas, incluyendo
México y varios territorios de América del Sur como Argentina, Perú y
Chile.
La expansión de Meta AI permitirá a los usuarios usar este
modelo (ahí donde esté disponible) en español a través de Facebook,
Instagram, Messenger, WhatsApp y en la web meta.ai. Meta anunció hace
pocos días que no tiene la intención de lanzar sus modelos de IA más avanzados en Europa debido al "impredecible entorno regulatorio".
Llama 3.1 es un modelo notablemente más complejo que los Llama 3 vistos
hasta ahora. Su versión más grande tiene 405.000 millones de parámetros o
elementos modificables y ha sido entrenado con más de 16.000 GPU H100
de Nvidia, lo que según Meta convierte a este modelo en el primero
entrenado a esta escala. Los modelos más pequeños de Llama 3.1 suman
8.000 y 70.000 millones de parámetros. Los tres son multilingües, tienen
una longitud de contexto de 128K y su ecosistema está configurado y
listo para funcionar en los servicios de Amazon Web Services, Microsoft
Azure, Google Cloud entre otros socios.
Meta confía que al ser de
código abierto Llama seduzca a los desarrolladores que lo quieran
integrar en sus productos. Llama es un modelo que se puede descargar,
personalizar en función de las necesidades y aplicaciones, entrenar con
nuevos conjuntos de datos y realizar ajustes adicionales. "Los
desarrolladores pueden personalizar completamente sus aplicaciones y
ejecutarlas en cualquier entorno, ya sea en las instalaciones, en la
nube o incluso localmente en un portátil, todo ello sin compartir datos
con Meta", dice la compañía. Además, Meta sostiene que Llama ofrece uno
de los costes por token más bajos del sector.
De acuerdo con Meta, Llama 3.1 405B es el modelo fundacional más grande y con más capacidades del mundo. La tecnológica ha entrenado a su IA con más de 15 billones de tokens, priorizando tanto la cantidad como la calidad de los datos. El modelo rivaliza con GPT-4o en conocimientos generales, matemáticas o traducción a múltiples idiomas, por nombrar algunas.
Llama 3.1 405B cuenta con una arquitectura de modelo de transformador con un solo decodificador estándar. Meta señala que el proceso de entrenamiento fue uno de sus retos más grandes a la fecha debido a la cantidad de datos. La compañía optimizó la pila de entrenamiento y adoptó un proceso iterativo posterior para mejorar las respuestas al usuario y garantizar la seguridad.
"Equilibramos cuidadosamente los datos para producir un modelo de alta calidad en todas las capacidades", mencionó la empresa. "Nuestro modelo continúa brindando respuestas de máxima utilidad, incluso cuando agregamos mitigaciones de seguridad".
Comparado con las versiones anteriores, Llama 3.1 405B está en el siguiente nivel. Meta afirma que las primeras evaluaciones muestran que su IA puede competir de frente con modelos de gran calibre, como GPT-4, GPT-4o y Claude 3.5 Sonnet. La compañía ha puesto énfasis en su conjunto de datos, con una curación más cuidadosa previo al entrenamiento, así como también un filtrado y control de calidad más riguroso para las etapas posteriores.
Con Llama 3.1 405B, Meta sigue apostando por las IA de código abierto
Una de las características que distinguen a los modelos de lenguaje de Meta es que son de código abierto. Con Llama 3.1 405B se mantienen en el mismo camino, ya que según Mark Zuckerberg, es el único modo en que nos beneficiaremos todos. El cofundador de Facebook publicó una carta en la que explica por qué el código abierto es importante y hace referencia a Linux.
De acuerdo con Zuckerberg, el código abierto es necesario para un futuro positivo de la inteligencia artificial. El jefe de Meta indica que la IA tiene un potencial único para aumentar la productividad, creatividad y calidad de vida de las personas. De igual modo, puede ser un catalizador para la investigación científica y el crecimiento económico.
Zucks tira un gancho a OpenAI, Google y otras empresas que desarrollan modelos de código cerrado. "Muchas organizaciones no quieren depender de modelos que no pueden ejecutar ni controlar por sí mismas. Tampoco quieren quedar atrapados en una única nube que tenga derechos exclusivos sobre un modelo."
A diferencia de GPT-4o, Llama 3.1 405B no es pieza clave en el modelo de negocio de Meta. Mark Zuckerberg añade que hacer su IA de código abierto no socava los ingresos, sostenibilidad o la capacidad de invertir en investigación. El directivo señala que esta es la razón por la que las empresas critican los modelos open source, sin embargo, la IA de código abierto será la mejor opción en un futuro.
Meta considera que el lanzamiento de Llama 3.1 405B será un punto de inflexión en la industria. La compañía está enfocándose en construir un ecosistema más amplio para que más desarrolladores y empresas utilicen sus modelos de IA. Los usuarios pueden probar gratis el nuevo modelo a través de meta.ai en la web.
Fuentes:
https://hipertextual.com/2024/07/meta-llama-3-1-405b-codigo-abierto-open-ai-gpt-4o
https://www.elotrolado.net/noticias/tecnologia/meta-modelo-llama-codigo-abierto
0 comentarios :
Publicar un comentario
Los comentarios pueden ser revisados en cualquier momento por los moderadores.
Serán publicados aquellos que cumplan las siguientes condiciones:
- Comentario acorde al contenido del post.
- Prohibido mensajes de tipo SPAM.
- Evite incluir links innecesarios en su comentario.
- Contenidos ofensivos, amenazas e insultos no serán permitidos.
Debe saber que los comentarios de los lectores no reflejan necesariamente la opinión del STAFF.