Tutoriales y Manuales
Entradas Mensuales
-
▼
2024
(Total:
953
)
- ► septiembre (Total: 50 )
-
▼
abril
(Total:
123
)
- Reino Unido prohíbe vender dispositivos inteligent...
- Infostealers: malware que roba información
- Vulnerabilidades Zero-Day en firewalls Cisco ASA
- Volkswagen hackeada: roban 19.000 documentos del s...
- Vulnerabilidad grave en GNU C Library (glibc) de 2...
- TikTok dejará de pagar a sus usuarios para evitar ...
- Windows 11 empieza a mostrar anuncios en el menú d...
- El malware RedLine Stealer abusa de repos de Githu...
- ¿Qué es el eSIM swapping?
- Ransomware en México
- Crean un perro robot con lanzallamas
- PartedMagic, Rescatux, SystemRescueCD, distros Lin...
- TikTok podrá clonar tu voz con inteligencia artifi...
- Ex director de ciber política de la Casa Blanca ta...
- Nuevo Chromecast 4K con Google TV
- Europa abre una investigación contra TikTok por su...
- El senado de Estados Unidos vota contra TikTok, so...
- El fabricante de tu móvil estará obligado a arregl...
- Procesadores de Intel Core i9 13-14th pierden hast...
- Vulnerabilidad crítica en VirtualBox para Windows
- Estados Unidos ha librado una batalla aérea simula...
- La Policía Europea (Europol) quiere eliminar el ci...
- Bruselas amenaza con suspender la nueva versión de...
- La Audiencia Nacional de España niega a EEUU una e...
- Desarrollan en Japón inteligencia artificial que p...
- ¿Cómo se cuelan las aplicaciones maliciosas en la ...
- Telefónica cierra todas sus centrales de cobre y E...
- Configurar correo electrónico aún más seguro con A...
- Samsung aumenta la jornada laboral a 6 días para “...
- LaLiga pide imputar a directivos de Apple, Google ...
- Windows 11 le daría la espalda a Intel y AMD con s...
- Desmantelada la plataforma de phishing LabHost
- Microsoft Office 2016 y 2019 sin soporte a partir ...
- Blackmagic Camera, la app para Android para grabar...
- Apple permite instalar aplicaciones para iOS como ...
- Filtrados casi 6 millones de archivos con fotos de...
- Versión con malware de Notepad++
- PuTTY corrige una vulnerabilida en el uso de clave...
- 54 mil millones de cookies robadas
- Cómo detectar la autenticidad de fotografías y vídeos
- CISA presenta su sistema de análisis de malware
- Un ciberataque deja al descubierto los datos perso...
- La única persona que se conecta a Steam en la Antá...
- DiskMantler: así es «el destructor de discos duros...
- ¿Qué es el PPPoE (Protocolo Punto a Punto over Eth...
- ¿Qué es POE? ¿Cuáles son las diferencias entre POE...
- IPsec Passthrough y VPN Passthrough
- La gran pregunta del mundo del gaming: ¿Los juegos...
- Cómo cambiar el puerto por defecto 3389 de RDP
- Inteligencia artificial Grok usa protocolo Torrent...
- Cómo instalar programas o reinstalar Windows con W...
- Intel descataloga por sorpresa los chips Core de 1...
- El fabricante de accesorios Targus interrumpe sus ...
- Filtran base con datos personales de 5.1 millones ...
- Hollywood carga contra la piratería y propone una ...
- Google Fotos revela que el Borrador Mágico será un...
- Empleado de Microsoft expone un servidor sin contr...
- Cómo configurar un proxy o VPN para Telegram
- Sierra Space quiere entregar suministros bélicos d...
- El PSG reconoce un ciberataque contra su sistema d...
- Descubiertas varias vulnerabilidades de seguridad ...
- P4x: el hacker justiciero que tumbó internet en Co...
- Amazon consigue cerrar un canal de Telegram que pr...
- Elon Musk cree que la IA superará a la inteligenci...
- Ciberdelincuentes chinos usan la IA generativa par...
- Estos son todos los datos que recopila ChatGPT cad...
- Ofrecen 30 millones de dólares por encontrar explo...
- Se busca director para la Agencia Española de Supe...
- Find My Device de Android permite "Encontrar mi di...
- Google resenta Axion, su primer procesador basado ...
- A la venta por 10.000$ base de datos con de 39,8 m...
- Despedido el CEO de la productora de 'Got Talent' ...
- Spotify presenta AI Playlist: crea listas de repro...
- Elon Musk contra un juez de Brasil por el bloqueo ...
- OpenAI usó videos robados de YouTube para entrenar...
- Apple firma con Shutterstock un acuerdo de entre 2...
- MTA-STS: Strict Transport Security
- Si coges el metro en San Francisco, es gracias a u...
- La app de control parental KidSecurity expone dato...
- Stability AI en crisis tras incumplir pagos a prov...
- Tu número de móvil podría valer 14.000 euros: así ...
- Vulnerabilidad crítica de Magento permite robar da...
- Los atacantes que hackearon el Consorcio Regional ...
- Cómo se forjó el backdoor en xz (librería Linux)
- Cómo saber cuándo pasará el coche de Google Street...
- Dos hermanos se han hecho millonarios desarrolland...
- El Gobierno de España encarga a IBM crear un model...
- Google tiene la solución al gran problema del JPEG...
- Twitter regala verificaciones azules a cuentas que...
- La trampa de los cursos para aprender a programar ...
- Android 15 permitirá tener un espacio privado para...
- Google limitará los bloqueadores de anuncios en Ch...
- Microsoft bloqueará las actualizaciones de Windows...
- YouTube lanza una advertencia a OpenAI: usar sus v...
- Patente busca inyectar anuncios por HDMI cuando ju...
- Apple, cerca de sufrir escasez de chips por culpa ...
- La Guardia Civil detiene a un pasajero que extravi...
- Un estado alemán se aleja de Microsoft y usará Lin...
- Todo lo que necesitas saber sobre las VLANs en redes
- Documentos judiciales revelan que Facebook permiti...
-
►
2023
(Total:
710
)
- ► septiembre (Total: 65 )
-
►
2022
(Total:
967
)
- ► septiembre (Total: 72 )
-
►
2021
(Total:
730
)
- ► septiembre (Total: 56 )
-
►
2020
(Total:
212
)
- ► septiembre (Total: 21 )
-
►
2019
(Total:
102
)
- ► septiembre (Total: 14 )
-
►
2017
(Total:
231
)
- ► septiembre (Total: 16 )
-
►
2016
(Total:
266
)
- ► septiembre (Total: 38 )
-
►
2015
(Total:
445
)
- ► septiembre (Total: 47 )
-
►
2014
(Total:
185
)
- ► septiembre (Total: 18 )
-
►
2013
(Total:
100
)
- ► septiembre (Total: 3 )
-
►
2011
(Total:
7
)
- ► septiembre (Total: 1 )
Blogroll
Etiquetas
Entradas populares
-
Después de ver qué es una vCPU y la diferencia entre núcleos (cores) e hilos en los procesadores, pasamos a explicar toda la nomenclatura d...
-
Loki es un sistema de agregación de logs creado por GrafanaLabs, es escalable horizontalmente, puede contar con alta disponibilidad y está i...
-
Si estos días vas a cualquiera de las plataformas de venta que hay en internet y buscas un USB probablemente te encuentras con no pocos con ...
OpenAI usó videos robados de YouTube para entrenar a GPT-4
OpenAI habría entrenado sus modelos de inteligencia artificial a partir de videos de YouTube. Un reporte afirma que la empresa desarrolló una herramienta para transcribir el audio de los videos YouTube. El texto serviría para nutrir el conjunto de datos que utiliza OpenAI en GPT-4 y otros modelos de lenguaje.
- Un informe asegura que OpenAI desarrolló una herramienta que transcribe videos de YouTube en datos para entrenar modelos de inteligencia artificial.
De acuerdo con The New York Times, OpenAI diseñó e implementó una herramienta de reconocimiento de voz llamada Whisper, con la cual transcribió más de un millón de horas de videos de YouTube. El reporte menciona que el presidente de la empresa, Greg Brockman, habría recopilado los videos para entrenar GPT-4, uno de sus modelos más avanzados de inteligencia artificial.
La idea de transcribir videos de YouTube formó parte de una estrategia de OpenAI para nutrir su conjunto de datos de entrenamiento. De acuerdo con fuentes, Sam Altman y compañía estaban desesperados por obtener datos para desarrollar GPT-4, puesto que habían agotado sus suministros desde 2021. Varios empleados discutieron alternativas, entre las que se encontraba comprar empresas con enormes bases de datos o transcribir videos y audiolibros.
El resultado de estas conversaciones fue Whisper, una herramienta de reconocimiento de voz capaz de transcribir videos y podcasts. "Estudiamos las capacidades de los sistemas de procesamiento del habla entrenados simplemente para predecir grandes cantidades de transcripciones de audio en Internet", menciona un documento técnico. "Logramos nuestros resultados sin la necesidad de técnicas de autosupervisión y auto entrenamiento que han sido un pilar del reciente trabajo de reconocimiento de voz a gran escala".
En el documento de Whisper figuran nombres como Greg Brockman, presidente de OpenAI, e Ilya Sutskever, cofundador de la empresa. Este último fue artífice de la revuelta que ocasionó el despido de Sam Altman a finales 2023.
No solo OpenAI, Google también entrenó su IA con videos de YouTube
Aunque OpenAI nunca se ha distinguido por contar con una brújula moral, el transcribir videos para convertirlos en datos de entrenamiento no fue exclusivo de la empresa.
Según el reporte del NYT, empleados de OpenAI discutieron cómo Whisper violaría los términos de uso YouTube y, aun así, siguieron adelante. Tal vez lo más sorprendente es que algunos empleados de Google estaban al tanto de estas prácticas y no lo impidieron, puesto que la tecnológica hizo lo mismo para entrenar sus modelos de inteligencia artificial.
La transcripción de videos de YouTube para entrenar GPT-4 y otros modelos de lenguaje ha abierto una caja de Pandora. Algunos cuestionan la legalidad de utilizar estos datos como base de entrenamiento sin contar con la aprobación de sus autores. Sin embargo, un abogado de propiedad intelectual expresó al diario que las reglas sobre el uso de las transcripciones son ambiguas.
Un portavoz de Google mencionó que la empresa no estaba al tanto de las prácticas de OpenAI y prohíbe la exploración o descarga de contenido. Desde hace unos meses, la compañía modificó las condiciones del servicio para impedir este comportamiento. Al mismo tiempo, los de Mountain View aprovechan los huecos legales para extraer datos de Docs o Maps que pudieran servir para entrenar a Gemini.
Al igual que OpenAI, Google y otras compañías buscan nutrir su conjunto de datos para los modelos de lenguaje. Esto ha generado críticas de artistas, escritores y diseñadores, quienes consideran que las grandes tecnológicas roban su trabajo a una escala masiva. Las demandas no se han hecho esperar, por lo que es posible que veamos a youtubers sumándose al movimiento de protesta contra la IA.
Fuentes:
https://hipertextual.com/2024/04/openai-entreno-su-inteligencia-artificial-con-videos-youtube
0 comentarios :
Publicar un comentario
Los comentarios pueden ser revisados en cualquier momento por los moderadores.
Serán publicados aquellos que cumplan las siguientes condiciones:
- Comentario acorde al contenido del post.
- Prohibido mensajes de tipo SPAM.
- Evite incluir links innecesarios en su comentario.
- Contenidos ofensivos, amenazas e insultos no serán permitidos.
Debe saber que los comentarios de los lectores no reflejan necesariamente la opinión del STAFF.