Tutoriales y Manuales
Entradas Mensuales
-
▼
2025
(Total:
1694
)
-
▼
octubre
(Total:
198
)
-
Ccrear personajes de tu mascota o cualquier objeto...
-
YouTube usará la IA para remasterizar tus videos a...
-
OpenAI lanza modelos abiertos de seguridad “gpt‑os...
-
El navegador ChatGPT Atlas puede ser engañado medi...
-
GlassWorm: un gusano se propaga a través de extens...
-
Un detenido en Italia por generar con IA más de 90...
-
Las copias de seguridad de WhatsApp añaden las pas...
-
La IA no sería capaz de crear GTA VI
-
NEO, el robot doméstico con IA ya está disponible ...
-
Los motivos de la subida abrupta del precio de la ...
-
Samsung quiere evitar una subida en el precio de l...
-
Windows 11 escaneará la memoria de forma proactiva...
-
Google Chrome para Android se actualiza a lo grand...
-
Load Balancing (Balanceo de carga) y failover con ...
-
Disponible distro Linux: Fedora 43: novedades y de...
-
China presenta superordenador de inteligencia arti...
-
China crea una medusa biónica que puede espiar a s...
-
Filtración masiva de 183 millones de correos elect...
-
Lo despidieron tras 6 años sin trabajar: así logró...
-
Qualcomm reta a Nvidia en chips para IA y se dispa...
-
Muchas personas creían que era gratis hasta que le...
-
Drones, hackers, virus informáticos... Defensa Esp...
-
La IA aumentará la carga de trabajo en lugar de re...
-
40 años del mítico Intel 80386: uno de los procesa...
-
Oracle EBS corrige silenciosamente un exploit Zero...
-
Vulnerabilidad crítica en tiendas Adobe Magento
-
Hackearon una planta de armas nucleares de EE. UU....
-
Parches de emergencia de Windows Server corrigen u...
-
Suplantan “microsoft.com” con “rnicrosoft.com” (ho...
-
Nike crea unas zapatillas con motor que hacen corr...
-
Chip M5: Todas las novedades que necesitas saber d...
-
Google va a actualizar la GPU de tu Pixel 10 perió...
-
Samsung Galaxy XR, un rival para Apple Vision Pro ...
-
Fedora permitirá contribuciones de código generada...
-
Anthropic gasta más dinero del que ingresa
-
Prohíben a NSO atacar a usuarios de WhatsApp con e...
-
Google ha resuelto en 2 horas problemas que en un ...
-
Nvidia cree tener la llave para resolver la gran b...
-
Nestlé anuncia el despido masivo de 16.000 emplead...
-
Investigador consigue acceso administrador en la w...
-
Samsung añadirá la IA de Perplexity en todos sus t...
-
Reddit demanda a Perplexity y otras empresas de IA...
-
DeepSeek OCR: Reconocimiento de texto avanzado con...
-
Amazon reemplazará medio millón de empleados por r...
-
OpenAI presenta Atlas, un navegador web impulsado ...
-
KDE Plasma 6.5: un «punto de inflexión» repleto de...
-
Deberías ser más borde con ChatGPT: un estudio con...
-
La última locura de la IA: instalar una cámara en ...
-
La mejor IA para programar ya está disponible en l...
-
ClothOff, una app que usa IA para desnudar a otros...
-
La tarjeta SIM esconde un computador retro capaz d...
-
"Buscar mi iPhone" ayuda a desmantelar una red de ...
-
Los discos duros cada vez son más fiables
-
La última actualización de Windows 11 incluye múlt...
-
Un paciente desvela cómo la inteligencia artificia...
-
Una universidad acusó al 90% de sus alumnos de usa...
-
GIMP se hace cargo del paquete Snap
-
Vulnerabilidad en Microsoft IIS
-
Cuidado con la pasta térmica SGT-4 de AMeCh: produ...
-
Reinstala Windows 11 para arreglar la lentitud de ...
-
China acusa a EEUU de un ciberataque a sus centros...
-
China despliega su nuevo caza sin piloto
-
ASUS ROG Magic 9, ahora con CPU de AMD
-
Encuentran la tarjeta de memoria SanDisk intacta t...
-
Filtración masiva en Telegram expone datos de func...
-
Europol desmantela una red de granjas de tarjetas ...
-
Valero, el nuevo dron 'made in Spain' que se está ...
-
Windows 11 pierde su localhost tras una actualización
-
Así puedes pedirle a un amigo que te ayude a recup...
-
Caída mundial nube de Amazon Web Services: está pr...
-
Nvidia presenta su primer superordenador personal ...
-
Intel sube el precio de los procesadores Core i3, ...
-
Casio celebra el 40 aniversario de 'Regreso al fut...
-
El Parlamento Europeo pide prohibir el acceso a re...
-
Microsoft bloquea el modo IE después de que atacan...
-
F5 confirma ciberataque: un actor estatal accedió ...
-
Vulnerabilidades críticas en Veeam y Fortinet
-
Windows 11 estrena Copilot Voice y Copilot Vision ...
-
Símbolo doble de Wi-Fi en tu teléfono: por qué apa...
-
Qué significa el icono de la 'N' en tu teléfono An...
-
Google Veo 3.1 supera a Sora 2 en realismo y contr...
-
Anthropic presenta Claude Haiku 4.5, la IA más bar...
-
El grupo Qilin afirma haber comprometido los siste...
-
Alemania inicia su independencia de Microsoft con ...
-
Países Bajos interviene una empresa de chips de pr...
-
Gana un premio de más de 130.000 euros en la loter...
-
Microsoft presenta su primera IA para generar imág...
-
Llamaron a 50 taxis autónomos a una calle sin sali...
-
Cómo saber si nos están grabando la llamada telefó...
-
ChatGPT se volverá más «humano» y tendrá un modo e...
-
Apple presenta el M5, un SoC con CPU de 10 núcleos...
-
El fundador de Telegram denuncia que Macron está p...
-
EE.UU. quiere convertir la guerra en un videojuego...
-
ONLYOFFICE Docs 9.1: la suite ofimática mejora el ...
-
Amazon llena los Echo Show de anuncios invasivos
-
Sora, la app de generación de video de OpenAI, sup...
-
Spotify amplía las cuentas familiares gestionadas ...
-
La última filtración desnuda a la 'Zarzuela' marro...
-
Zorin OS 18 ya está disponible: la distro perfecta...
-
Google regala Gemini 2.5 Pro, Veo 3 y 2 TB de alma...
-
- ► septiembre (Total: 148 )
-
▼
octubre
(Total:
198
)
-
►
2024
(Total:
1110
)
- ► septiembre (Total: 50 )
-
►
2023
(Total:
710
)
- ► septiembre (Total: 65 )
-
►
2022
(Total:
967
)
- ► septiembre (Total: 72 )
-
►
2021
(Total:
730
)
- ► septiembre (Total: 56 )
-
►
2020
(Total:
212
)
- ► septiembre (Total: 21 )
-
►
2019
(Total:
102
)
- ► septiembre (Total: 14 )
-
►
2017
(Total:
231
)
- ► septiembre (Total: 16 )
-
►
2016
(Total:
266
)
- ► septiembre (Total: 38 )
-
►
2015
(Total:
445
)
- ► septiembre (Total: 47 )
-
►
2014
(Total:
185
)
- ► septiembre (Total: 18 )
-
►
2013
(Total:
100
)
- ► septiembre (Total: 3 )
-
►
2011
(Total:
7
)
- ► septiembre (Total: 1 )
Blogroll
Etiquetas
Entradas populares
-
ClothOff es una app que utiliza inteligencia artificial generativa para desnudar a cualquier persona a partir de fotografías con ropa que...
-
Un agente de IA de Google llamado Antigravity eliminó accidentalmente todos los datos del disco duro de un desarrollador. Después de la eli...
-
A partir de 2026, la validez de los certificados digitales disminuirá gradualmente, pasando de 398 días a 47 días para 2029 . Let's Encr...
DeepSeek OCR: Reconocimiento de texto avanzado con IA open source
Analizar documentos antiguos, mediante fotografías o archivos digitalizados, son un reto pero una necesidad para preservar la historia. La compañía china DeepSeek, popular por su motor de IA que hace competencia a ChatGPT, lanzó DeepSeek-OCR, un sistema basado en inteligencia artificial que promete la compresión de contextos históricos largos, permitiendo la digitalización y el procesamiento eficientes de materiales de archivo sin requerir almacenamiento masivo o recursos computacionales.
DeepSeek lanza IA que procesa hasta 200,000 páginas para entrenar otros modelos
- Procesa 33 millones de páginas al día
DeepSeek vuelve a desafiar los límites de la inteligencia artificial con un avance técnico que podría redefinir la manera en que los modelos procesan información. Su nueva tecnología, denominada “vision-text compression”, convierte texto y documentos complejos en imágenes, reduciendo el consumo de recursos hasta 20 veces menos tokens sin sacrificar la comprensión del contenido.
El sistema se integra en el modelo DeepSeek-OCR (Optical Character Recognition), que aprovecha capacidades multimodales para transformar grandes volúmenes de texto en imágenes de alta resolución. Posteriormente, un decodificador especializado —el DeepSeek3B-MoE-A570M— interpreta esas imágenes, extrayendo los datos textuales con una eficiencia significativamente superior a la de los modelos tradicionales basados solo en texto.
Según los desarrolladores, el proceso alcanza una reducción de tokens de entre 7 y 20 veces, con una precisión de hasta 97% cuando la compresión es moderada. Sin embargo, al aumentar la compresión a los niveles más extremos, la exactitud baja al 60%, lo que sugiere un equilibrio clave entre ahorro computacional y fidelidad del contenido. Aun así, incluso una compresión de 2 a 3 veces podría representar un ahorro sustancial en los costos de operación de modelos de gran contexto.
Este enfoque aprovecha la fortaleza de la IA visual para manejar tablas, gráficos o datos estructurados, lo que lo hace especialmente útil en ámbitos científicos, financieros y médicos, donde la interpretación de información visual es crucial. Además, el modelo emplea una arquitectura basada en subredes y expertos especializados para procesar diferentes tipos de datos dentro de una misma tarea, mejorando su capacidad de análisis.
También hay una versión de código abierto, que permite a los investigadores y desarrolladores reproducir y validar los resultados de sus investigaciones, así como desarrollar la arquitectura DeepSeek-OCR para aplicaciones personalizadas o para casos de uso de producción.¿Qué es DeepSeek OCR?
DeepSeek OCR es una innovadora solución de código abierto para el reconocimiento óptico de caracteres (OCR) que aprovecha los últimos avances en modelos de lenguaje y visión computacional. Desarrollado por DeepSeek AI, una compañía líder en inteligencia artificial fundada en 2023, este modelo representa un significativo avance en la extracción automatizada de texto a partir de imágenes y documentos.
Características principales
El sistema se distingue por integrar:
- Arquitectura basada en modelos de lenguaje de gran escala (LLM) para mejor comprensión contextual
- Compatibilidad con vLLM y Transformers para procesamiento eficiente
- Soporte para múltiples modos de operación y casos de uso
- Licencia MIT que permite uso comercial y modificaciones
Casos de uso prácticos
DeepSeek OCR está especialmente optimizado para:
- Digitalización de documentos empresariales
- Automatización de procesos administrativos
- Extracción de datos de facturas y recibos
- Procesamiento de documentos legales
- Análisis de textos en imágenes y diagramas
Integración y deployment
La implementación de DeepSeek OCR se caracteriza por su flexibilidad:
- Instalación sencilla mediante gestores de paquetes estándar
- Integración con flujos de trabajo basados en PyTorch
- Opciones de procesamiento por lotes y en tiempo real
- Documentación técnica detallada y ejemplos de código
Ventajas para startups y empresas
Las startups pueden beneficiarse especialmente de:
- Reducción significativa en costos de procesamiento documental
- Escalabilidad del sistema según necesidades
- Código abierto que permite personalización
- Comunidad activa de desarrolladores
- Actualizaciones regulares y mejoras continuas
Arquitectura y rendimiento
El modelo utiliza una arquitectura avanzada que incluye:
- Tecnología de Mixture-of-Experts (MoE) para procesamiento eficiente
- Capacidades de comprensión multimodal
- Optimización para recursos computacionales diversos
- Alta precisión en reconocimiento de caracteres
Conclusión
DeepSeek OCR representa una solución moderna y eficiente para la automatización del procesamiento de documentos, especialmente valiosa para startups que buscan optimizar sus operaciones. Su naturaleza de código abierto, junto con su robusta arquitectura técnica, lo posiciona como una herramienta fundamental para la transformación digital empresarial.
Fuentes:
github.com/deepseek-ai/DeepSeek-OCR
deepseekaiapi.com/image-to-text-converter
https://huggingface.co/deepseek-ai/DeepSeek-OCR






Entrada más reciente
0 comentarios :
Publicar un comentario
Los comentarios pueden ser revisados en cualquier momento por los moderadores.
Serán publicados aquellos que cumplan las siguientes condiciones:
- Comentario acorde al contenido del post.
- Prohibido mensajes de tipo SPAM.
- Evite incluir links innecesarios en su comentario.
- Contenidos ofensivos, amenazas e insultos no serán permitidos.
Debe saber que los comentarios de los lectores no reflejan necesariamente la opinión del STAFF.