Planeta Red
  • Inicio
  • Dispositivos
  • Noticias
  • Reviews
  • Manuales
  • Aplicaciones
Sin resultados
Ver todos los resultados
Planeta Red
Sin resultados
Ver todos los resultados
Planeta Red
Inicio Noticias

DeepSeek-OCR: el modelo de IA que convierte texto en píxeles

Por Hidalgo O_L
21/10/2025
en Noticias
1
DeepSeek-OCR
Compartir en FacebookCompartir en Twitter

La empresa DeepSeek ha presentado DeepSeek-OCR, un modelo de inteligencia artificial de código abierto que propone un enfoque inédito para el procesamiento del lenguaje. En lugar de analizar texto de forma tradicional, este sistema lo convierte en imágenes y lo interpreta a través de una técnica de compresión visual.

El modelo se basa en la tecnología de reconocimiento óptico de caracteres (OCR), pero lleva el concepto un paso más allá: transforma el texto en un mapa de píxeles y lo estudia visualmente. Este método, denominado Context Optical Compression, convierte grandes volúmenes de texto en una representación más compacta llamada “tokens visuales”, reduciendo drásticamente la carga de memoria y aumentando la capacidad de razonamiento del modelo.


Cómo funciona DeepSeek-OCR

El proceso comienza con la captura de un documento en forma de imagen. Luego, un módulo de visión propio de DeepSeek analiza la imagen, la divide en fragmentos y la transforma en un conjunto reducido de tokens visuales. Posteriormente, un decodificador reconstruye el contenido textual a partir de esas unidades comprimidas.

Gracias a esta técnica, un texto de 1.000 palabras puede comprimirse en solo 100 tokens visuales, lo que permite a los modelos de lenguaje manejar documentos más extensos y mantener un contexto más amplio sin perder coherencia ni precisión.

El resultado es un sistema capaz de procesar información más rápido, con una mayor eficiencia y menor consumo de recursos. Además, al basarse en la interpretación visual del texto, la IA logra detectar relaciones contextuales y patrones que los métodos tradicionales suelen pasar por alto.


Un paso adelante para la IA generativa

DeepSeek-OCR representa una evolución significativa en el procesamiento de lenguaje natural. Su arquitectura híbrida entre visión y texto podría allanar el camino hacia modelos que comprendan la información de forma más similar al cerebro humano.

El modelo se encuentra disponible en GitHub, bajo una licencia MIT, lo que permite su uso tanto en proyectos académicos como comerciales. En menos de un día, ha despertado un gran interés en la comunidad tecnológica por su enfoque disruptivo y su potencial para optimizar el rendimiento de los grandes modelos de lenguaje.

Con DeepSeek-OCR, el futuro del texto digital parece estar más cerca de la imagen que de la palabra.

Etiquetas: DeepSeek-OCR
Artículo anterios

Hemos jugado Borderlands 4 y te lo contamos todo

Siguiente artículo

Microsoft lanza una actualización urgente para reparar Windows 11

Hidalgo O_L

Escritor, apasionado del gaming, la comedia y la fantasía medieval.

Siguiente artículo
Microsoft lanza una actualización urgente para reparar Windows 11

Microsoft lanza una actualización urgente para reparar Windows 11

Apple prepara AppMigrationKit para transferir datos entre iOS y Android

Apple prepara AppMigrationKit para transferir datos entre iOS y Android

Samsung conserva su línea tradicional con el Galaxy S26, S26+ y S26 Ultra

Samsung conserva su línea tradicional con el Galaxy S26, S26+ y S26 Ultra

Comentarios 1

  1. John says:
    1 mes hace

    Gracias

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Este sitio usa Akismet para reducir el spam. Aprende cómo se procesan los datos de tus comentarios.

TOPANÁLISIS/REVIEW

SoundPeats Air5 Pro+

SoundPeats Air5 Pro+

SoundPeats nos presenta unos nuevos auriculares que son todo lo que €72
KROM Kabala Kit

KROM Kabala

KROM Kabala Kit: incluye un teclado RGB, un ratón de 4800 €27
CORSAIR VOID v2

CORSAIR VOID v2

Conoce los auriculares inalámbricos CORSAIR VOID v2: doble conectividad 2.4 GHz €119
Fifine M9

Fifine M9

Un micrófono "GIGANTE" pero de pequeño tamaño... €63
NK Mando Switch Inalámbrico

NK Mando Switch Inalámbrico

NK Mando Switch Inalámbrico: ergonómico, con giroscopio, vibración, LED RGB y €20

TE INTERESA

Nuevo TCL NXTPAPER 60 Ultra 5G Smartphone Android, Pantalla FHD+ de 7,2 Pulgadas, 12 GB de RAM + 512 GB de ROM, teléfono con protección Ocular, Color Blanco Lunar, con Funda Flip y lápiz óptico.
TCL NXTPAPER 60 Ultra 5G Smartphone Android, Pantalla FHD+ de 7,2 Pulgadas, 12 GB de RAM + 512 GB de ROM, teléfono con protección Ocular, Color Blanco Lunar, con Funda Flip y lápiz óptico.
537,18 EUR
Comprar en Amazon
Nuevo XIAOMI Redmi 15C - Smartphone de 4+256GB, Cámara Dual con IA de 50 MP, Pantalla inmersiva de 6,9' 120 Hz, Potente procesador octacore, Carga rápida de 33W, Cargador no Incluido, Naranja (Versión ES)
XIAOMI Redmi 15C - Smartphone de 4+256GB, Cámara Dual con IA de 50 MP, Pantalla inmersiva de 6,9" 120 Hz, Potente procesador octacore, Carga rápida de 33W, Cargador no Incluido, Naranja (Versión ES)
145,56 EUR
Comprar en Amazon
RebajasNuevo XIAOMI Redmi 15C - Smartphone de 4+256GB, Cámara Dual con IA de 50 MP, Pantalla inmersiva de 6,9' 120 Hz, Potente procesador octacore, Carga rápida de 33W, Cargador no Incluido, Verde (Versión ES)
XIAOMI Redmi 15C - Smartphone de 4+256GB, Cámara Dual con IA de 50 MP, Pantalla inmersiva de 6,9" 120 Hz, Potente procesador octacore, Carga rápida de 33W, Cargador no Incluido, Verde (Versión ES)
128,99 EUR
Comprar en Amazon

Artículos Recientes

Xiaomi 17 Ultra: el nuevo diseño de cámara que cambia las reglas

Xiaomi 17 Ultra: el nuevo diseño de cámara que cambia las reglas

04/12/2025
Xiaomi Mix Trifold

Xiaomi Mix Trifold: el futuro tri-plegable que ya prepara Xiaomi

04/12/2025
  • Quienes somos
  • Publicidad
  • Política de Privacidad
  • Aviso Legal
  • Contacto

Sin resultados
Ver todos los resultados
  • Inicio
  • Dispositivos
  • Noticias
  • Reviews
  • Manuales
  • Aplicaciones