La Biblioteca Nacional de España anunció que el texto completo de las publicaciones de dominio público de la Hemeroteca Digital puede descargarse en formatos abiertos libres y reutilizables**. Gratis, por supuesto.
La institución cuenta con una página a su web en la que se recoge un listado de los título de dominio público cuyo texto al completo puede ser descargado. Estos textos se obtienen a partir de un proceso de reconocimiento óptico de caracteres u OCR. Lo que implica que su calidad pueda variar en función de la tipografía y condiciones del documento original.
Los textos pueden ser utilizados libremente para su análisis, procesamiento o reutilización
{"videoId":"x80rho1","autoplay":true,"title":"9 LECTORES PDF GRATIS_ EDITA, CONVIERTE Y AÑADE archivos PDF con ESTOS PROGRAMAS"}
Más de 2.000 cabeceras de prensa en dominio público
La Hemeroteca Digital cuenta con miles de cabeceras de prensa, entre ellas más de 2.000 en dominio público, cuyos números se ofrecen ahora como ficheros descargables para que puedan ser utilizados libremente "para su análisis, procesamiento o reutilización", explican desde la BNE.
"Disponer de estos los textos permite aplicar sobre ellos tecnologías de procesamiento de lenguaje natural y otras nuevas herramientas propias de las llamadas humanidades digitales, cuyo uso está cada vez más generalizado".
En Genbeta
Biblioteca Digital Hispánica, la biblioteca digital y gratuita de la Biblioteca Nacional de España
…