Revista nueva: proyecto de corrección de OCR

Resultados

¡PROYECTO COMPLETADO!

Proyecto de corrección de textos transcritos a través de tecnología OCR, en la Revista nueva (Madrid).

Revista nueva (Madrid) es considerada como la más representativa y arquetípica revista de la generación del 98, en cuyas páginas se presentan las más diferentes y opuestas posiciones intelectuales y de pensamiento entre sus miembros, y en la que se pueden rastrear también los orígenes del modernismo en España.

Sus contenidos son ensayos y artículos varios de filosofía, política, educación, lengua, asuntos sociales, etc. Da cobijo además a numerosos textos de creación literaria, con narraciones, cuentos, siendo abundante la narrativa teatral, así como las composiciones poéticas.

Este proyecto de ComunidadBNE permitirá descubrir y sumergirnos en esta interesante publicación de nuestra colección de prensa histórica, y proponemos hacerlo contribuyendo a una mejor localización y recuperación de los textos que incluye, mediante la corrección colaborativa del texto obtenido por OCR.

¿Qué es el OCR (Optical Character Recognition)?

En el proceso de digitalización de documentos, los impresos son en primer lugar digitalizados y convertidos a imagen. Posteriormente, el texto es extraído de manera automatizada gracias a la tecnología de reconocimiento óptico de caracteres (OCR). Pero este proceso automático genera errores (por motivos diversos: contraste, tipografías y caracteres o disposición del texto, etc.). Revisar y corregir este texto permitirá búsquedas más precisas, contribuirá a crear un corpus textual “limpio”, o facilitará la producción de otros formatos como el ePub, y ponerlo a disposición de todos.

Consulta el siguiente videotutorial con las pautas básicas para empezar a corregir.

Las cookies nos ayudan a ofrecer nuestros servicios. Al usar nuestros servicios, usted acepta nuestro uso de cookies.