Proyecto de corrección de textos transcritos a través de tecnología OCR, en la publicación El duende satírico del día.
El duende satírico del día fue el primer proyecto periodístico de una de las más destacadas figuras del romanticismo y el costumbrismo español, Mariano José de Larra (1809-1837).
A la edad de diecinueve años, en 1828, Larra dará a la estampa un total de cinco cuadernos bajo esta cabecera, utilizando para ello hasta cuatro imprentas (las de José del Collado, Norberto Llorenci, Repullés y L. Amarita), y entre 36 y 72 páginas cada uno. En la línea de la revista inglesa The Spectator, contiene una serie de artículos de costumbres y de crítica literaria y teatral, entre los que destacan “Diálogo: el duende y el librero”, “Corridas de toros”, “El café” o “Donde las dan las toman”, escritos en un estilo sarcástico, crítico y mordaz.
Este proyecto de ComunidadBNE permitirá descubrir y sumergirnos en esta interesante publicación de nuestra colección de prensa histórica, y proponemos hacerlo contribuyendo a una mejor localización y recuperación de los textos que incluye, mediante la corrección colaborativa del texto obtenido por OCR.
¿Qué es el OCR (Optical Character Recognition)?
En el proceso de digitalización de documentos, los impresos son en primer lugar digitalizados y convertidos a imagen. Posteriormente, el texto es extraído de manera automatizada gracias a la tecnología de reconocimiento óptico de caracteres (OCR). Pero este proceso automático genera errores (por motivos diversos: contraste, tipografías y caracteres o disposición del texto, etc.). Revisar y corregir este texto permitirá búsquedas más precisas, contribuirá a crear un corpus textual “limpio”, o facilitará la producción de otros formatos como el ePub, y ponerlo a disposición de todos.
Consulta el siguiente videotutorial con las pautas básicas para empezar a corregir.
En esta página podrás buscar una tarea mediante el uso del cuadro de búsqueda y pulsando el botón "Buscar" o si lo prefieres, podrás acceder directamente a una tarea de forma aleatoria pulsando el botón "Modo aleatorio"