Tutoriales y Manuales
Entradas Mensuales
-
▼
2024
(Total:
1019
)
- ► septiembre (Total: 50 )
-
▼
febrero
(Total:
102
)
- El DJ serbio que se ha forrado recuperando dominio...
- La plaga de anuncios trampa con imágenes de famoso...
- Con una Raspberry Pi y un algoritmo de IA bloquea ...
- Hackean remotamente las impresoras 3D de Anycubic
- Disponible Kali Linux 2024.1 con 4 nuevas herramie...
- El ransomware Rhysida pide 3,6 millones de dólares...
- Browser In The Browser (BitB) sin marcos
- Botnet con Ubiquity EdgeRouter infectados
- Epic Games ha sido hackeada por Mogilevich: han ro...
- Amazon Prime Video incluirá anuncios en España a p...
- Samsung presenta una tarjeta microSD capaz de alca...
- El Bitcoin alcanza su valor más alto de los último...
- PlayStation despide a cientos de empleados y cance...
- Universal Music retira más canciones de TikTok e i...
- Novedades Tails 6.0
- Configurar una VPN con WireGuard y WireGuard-UI en...
- Configurar una VPN Site-to-Site con IPsec
- Influencers "Los Petazetaz" detenidos por violar y...
- Filtración datos personales titulares de las tarje...
- Energizer P28K: el móvil con la batería más grande...
- Lenovo presenta un prototipo de portátil con una p...
- Oppo presenta las Air Glass 3, sus gafas de realid...
- ¿Puede un malware ocultarse en una foto?
- Vulnerabilidades más aprovechadas para realizar at...
- Microsoft se une al club de Apple: diseñará sus pr...
- Nvidia supera las expectativas y sus ventas para c...
- Vuelve el grupo de ransomware LockBit
- Windows 11 aún no es compatible ni con Wi-Fi 7 ni ...
- Avast antivirus multada con 16,5 millones por alma...
- El cristal de las Apple Vision Pro se agrieta sin ...
- Consiguen hackear PlayStation Portal y ejecutar un...
- Google usará Reddit para entrenar su inteligencia ...
- Gemma, la nueva IA de código abierto de Google
- Menores de edad “venden” sus datos biométricos a W...
- Un pasajero en pleno vuelo publica en Reddit una i...
- Filtración programa integral de vigilancia global ...
- Un error en las cámaras domóticas Wyze permitió qu...
- Condenan a prisión en EE.UU. a una popular youtube...
- Más de 28.500 servidores correo Microsoft Exchange...
- Europol confisca los sitios del mayor grupo de ran...
- Microsoft anuncia su mayor inversión en España: 1....
- La Comisión Europea abre una investigación a TikTok
- Comisiones Obreras de España sufre un hackeo con l...
- La UE multará a Apple Music con 500 millones de eu...
- GhostTask: crea tareas programadas de forma sigilo...
- Acusan a X (Twitter) de recibir dinero de grupos t...
- LineageOS 21, la mejor ROM alternativa llega actua...
- KeyTrap: Vulnerabilidad crítica de diseño en DNS
- Europa dictamina que las puertas traseras en siste...
- Nothing Phone 2a: especificaciones, precio y diseño
- Se casa la pareja que solo se podía comunicar medi...
- Microsoft presenta su aplicación PC Manager para m...
- NVIDIA Chat with RTX, un chatbot de IA que se ejec...
- OpenAI presenta Sora, su nueva herramienta para ge...
- El ‘boom’ de los influencers de 10 años: el reto d...
- Suplantación del CEO utilizando la técnica de inte...
- Cuidado con enamorarte de una IA: son una trampa p...
- ChatGPT es el nuevo aliado de los grupos cibercrim...
- Las empresas empiezan a usar una herramienta de IA...
- Vuelve la fiebre por el Bitcoin: alcanza su máximo...
- Google, Meta y OpenAI anuncian medidas para identi...
- Vulnerabilidad crítica en Docker permite escapar d...
- Vulnerabilidad en el software Magician de Samsung SSD
- IA, pérdidas de trabajo y los despidos
- Filtrados los datos de 33 millones de pacientes fr...
- OnlyFake: identidades falsas de cualquier país
- Ovrdrive USB, el pendrive que se autodestruye
- Amazon es acusada de recomendar los productos más ...
- Descubren malware en mini-ordenadores vendidos en ...
- El cursor de tu ratón está torcido, y ha estado as...
- La telco mexicana Claro reconoce haber sufrido un ...
- Según Estados Unidos, los coches eléctricos chinos...
- Vulnerabilidad en productos Ivanti expone a miles ...
- Empresa de recuperación de datos avisa: «Pendrives...
- Rompen el cifrado BitLocker de Windows 10 y Window...
- Vulnerabilidad crítica que afecta a la mayoría de ...
- Apple presenta una IA de código abierto para edita...
- ¿Una botnet de DDoS con cepillos de dientes? No es...
- Vulnerabilidades en Cisco, Fortinet, VMware y QNAP
- Cómo ver todas las contraseñas de conexiones WiFi ...
- Google advierte por la creciente amenaza de empres...
- Operación Synergia de la Interpol arresta a 31 per...
- Roban 24 millones a una empresa suplantando al CEO...
- España gana el Ambassador World Cup 2023
- Cómo banear miles de direcciones IP's con ipset
- Facebook cumple 20 años
- Condenan a 40 años de cárcel al hacker que filtró ...
- Vulnerabilidad 0-day en el registro de eventos de ...
- Roban 15 millones de registros de Trello a través ...
- AnyDesk sufre una brecha de seguridad y recomienda...
- Importantes vulnerabilidades en el syslog() de la ...
- En España un ciberataque de ransomware deja sin si...
- Google cambiará el nombre de Bard a Gemini
- Google presenta ImageFX, su generador de imágenes ...
- Amazon anuncia el chatbot Rufus, un asistente de c...
- Demandan en España a Worldcoin, la empresa que esc...
- Binance filtra su código fuente e información conf...
- Microsoft ignoró avisos sobre un exploit de DALL-E...
- El impacto de la IA le está reportando millones de...
- Las SSD de 16 TB llegarán pronto
-
►
2023
(Total:
710
)
- ► septiembre (Total: 65 )
-
►
2022
(Total:
967
)
- ► septiembre (Total: 72 )
-
►
2021
(Total:
730
)
- ► septiembre (Total: 56 )
-
►
2020
(Total:
212
)
- ► septiembre (Total: 21 )
-
►
2019
(Total:
102
)
- ► septiembre (Total: 14 )
-
►
2017
(Total:
231
)
- ► septiembre (Total: 16 )
-
►
2016
(Total:
266
)
- ► septiembre (Total: 38 )
-
►
2015
(Total:
445
)
- ► septiembre (Total: 47 )
-
►
2014
(Total:
185
)
- ► septiembre (Total: 18 )
-
►
2013
(Total:
100
)
- ► septiembre (Total: 3 )
-
►
2011
(Total:
7
)
- ► septiembre (Total: 1 )
Blogroll
Etiquetas
Entradas populares
-
Después de ver qué es una vCPU y la diferencia entre núcleos (cores) e hilos en los procesadores, pasamos a explicar toda la nomenclatura d...
-
En el panorama en constante evolución de la seguridad de redes, OpnSense se ha convertido en una formidable solución de firewall. Nacido de...
-
Pese a que Gemini ofrece multitudes de opciones, recientemente, se ha dado a conocer una situación fuera de lo común. Hace unos días, un es...
Apple presenta una IA de código abierto para editar imágenes con lenguaje natural
Los esfuerzos de Apple en el campo de la inteligencia artificial avanzan a paso firme, pese a que muchos piensen lo contrario. Investigadores de la firma de Cupertino se aliaron con la Universidad de California en Santa Bárbara (UCSB) para crear MGIE, un nuevo modelo de código abierto que permite editar imágenes usando lenguaje natural.
- Investigadores de Apple y la Universidad de California en Santa Bárbara han lanzado MGIE, un nuevo modelo de inteligencia artificial de código abierto que permite editar imágenes usando lenguaje natural.
Es cierto que la web hoy se encuentra abarrotada de herramientas que permiten crear imágenes a partir de la inteligencia artificial generativa. Sin embargo, el esfuerzo de Apple y los expertos de la citada Universidad se ha enfocado en la "edición guiada", sacando provecho de los modelos de lenguaje multimodales de gran escala (MLLM, por sus sigas en inglés).
De acuerdo con los desarrolladores de esta herramienta, MGIE interpreta la imagen y la orden que el usuario ingresa y procede a realizar la edición, incluso sin poseer mayor contexto sobre el material o la solicitud en sí misma. Así, por ejemplo, uno de los casos presentados es el de la fotografía de una pizza. Utilizando solamente la descripción "hazla más saludable", la inteligencia artificial de Apple modificó la imagen para incluir tomates y hierbas sobre ella.
"MGIE consta de un MLLM y un modelo de difusión. El MLLM aprende a derivar instrucciones expresivas concisas y ofrece orientación visual explícita. El modelo de difusión se actualiza conjuntamente y realiza la edición de imágenes con la imaginación latente del objetivo previsto mediante un entrenamiento de extremo a extremo. De esta manera, MGIE se beneficia de la derivación visual inherente y aborda comandos humanos ambiguos para lograr una edición razonable. En el ejemplo [...], es difícil captar lo que significa "saludable" sin un contexto adicional. Nuestro MGIE puede conectar con precisión 'ingredientes vegetales' con la pizza y conducir a la edición correspondiente según las expectativas humanas".
Investigadores de Apple y la Universidad de California en Santa Bárbara.
De la mano de MGIE, los investigadores de Apple y la UCSB quieren demostrar que los modelos de lenguaje multimodales de gran escala pueden ayudar a que la edición de imágenes con inteligencia artificial sea más sencilla. En especial, facilitando las instrucciones necesarias para obtener los resultados deseados.
La nueva inteligencia artificial de Apple puede editar imágenes con lenguaje natural
Los responsables del proyecto indican que las instrucciones humanas suelen ser demasiado breves para que los actuales métodos de edición con IA las entiendan y procesen correctamente. Así, afirman que usar un MLLM para esta tarea "mejora el control y la flexibilidad" al editar imágenes, sin necesidad de máscaras regionales o descripciones demasiado elaboradas.
Los ejemplos que han presentado hacen más sencillo comprender de qué se trata toda esta historia. Además de lo que ya mencionamos de la pizza, la inteligencia artificial de Apple puede realizar ediciones al estilo Photoshop. En una imagen se ve a un hombre en primer plano y a una mujer detrás de él, a lo lejos, sentada en un sillón. Con el comando "elimina a la mujer en el fondo", MGIE modifica la foto para que solo el sujeto en primer plano sea visible. Pero no se limita a borrar a la mujer; también cambia el enfoque y lo centra en la expresión en el rostro del hombre.
Los expertos de UCSB y Apple han logrado, además, que la inteligencia artificial realice ediciones locales. Por ejemplo, que cambie lo que aparece en la pantalla de la foto de un ordenador, sin tocar el resto de la imagen. Como así también que pueda concretar optimizaciones globales, como subir el brillo o ajustar la definición del material, entre otras posibilidades.
Al tratarse de un proyecto de investigación, todavía no se sabe si Apple planea incorporar esta inteligencia artificial en su software disponible al público. No obstante, como indicamos al comienzo, deja en claro que los de Cupertino están prestándole cada vez más atención a este tipo de tecnologías. No olvidemos que los de la manzana introdujeron recientemente MLX, una herramienta que permite crear modelos de aprendizaje automático.
Si desean probar MGIE, pueden hacerlo directamente desde esta versión de prueba en Hugging Face Spaces. Aunque al ser un proyecto de código abierto, pueden descargar información, código y modelos preentrenados desde este repositorio en GitHub y probarlo por ustedes mismos.
Fuentes:
https://hipertextual.com/2024/02/mgie-inteligencia-artificial-apple
0 comentarios :
Publicar un comentario
Los comentarios pueden ser revisados en cualquier momento por los moderadores.
Serán publicados aquellos que cumplan las siguientes condiciones:
- Comentario acorde al contenido del post.
- Prohibido mensajes de tipo SPAM.
- Evite incluir links innecesarios en su comentario.
- Contenidos ofensivos, amenazas e insultos no serán permitidos.
Debe saber que los comentarios de los lectores no reflejan necesariamente la opinión del STAFF.