¡PROYECTO COMPLETADO!
Con las colaboraciones de este proyecto, hemos podido elaborar y publicar el texto transcrito en versión ePub, disponible en la Biblioteca Digital Hispánica.
Proyecto de corrección de textos transcritos a través de tecnología OCR, en A través de la metralla, de Armand Guerra (1886-1939).
José Estívalis Cabo, más conocido por sus pseudónimos Armand Guerra y José Silavitse, fue un director de cine, escritor y periodista español, de ideología anarquista. Sobre su experiencia en la Guerra civil, filmó Carne de fieras (1936) y escribió, en 1937, A través de la metralla. Escenas vividas en los frentes y en la retaguardia.
Fallecido en 1939, forma parte de los autores que han pasado al dominio público en 2020. Este proyecto de ComunidadBNE permitirá descubrir y sumergirnos en esta interesante publicación y os proponemos hacerlo contribuyendo a una mejor recuperación del texto que incluye, mediante la corrección colaborativa del texto obtenido por OCR.
¿Qué es el OCR (Optical Character Recognition)?
En el proceso de digitalización de documentos, los impresos son en primer lugar digitalizados y convertidos a imagen. Posteriormente, el texto es extraído de manera automatizada gracias a la tecnología de reconocimiento óptico de caracteres (OCR). Pero este proceso automático genera errores (por motivos diversos: contraste, tipografías y caracteres o disposición del texto, etc.). Revisar y corregir este texto permitirá búsquedas más precisas, contribuirá a crear un corpus textual “limpio”, o facilitará la producción de otros formatos como el ePub, y ponerlo a disposición de todos.
Consulta el siguiente videotutorial con las pautas básicas para empezar a corregir.
En esta página podrás buscar una tarea mediante el uso del cuadro de búsqueda y pulsando el botón "Buscar" o si lo prefieres, podrás acceder directamente a una tarea de forma aleatoria pulsando el botón "Modo aleatorio"