El COVID-19 en el Archivo de la Web Española: la ingente labor de BNE

Carmen Menchero de los Ríos    10 marzo, 2021

Nadie pudo imaginar el impacto que tendría la situación de emergencia decretada en España la semana del 10 de marzo de 2020. Y menos aún que, un año después, el COVID-19 continúe formando parte de nuestras vidas. Todos los ciudadanos del planeta, de cualquier edad o condición social, padecemos los coletazos de la pandemia y solo esto es suficiente para convertirlo en un hecho histórico, al margen de sus consecuencias a corto y largo plazo.

Sin duda, se trata de un acontecimiento cuya huella rastrearán en el futuro investigadores con distintos perfiles científicos e intereses. Pero nuestro tiempo es más digital que nunca y las fuentes navegan en el efímero universo de Internet. Nos enfrentamos al riesgo de que la historia del siglo XXI se esté escribiendo sobre la arena, si tenemos en cuenta que el pulso real de nuestra sociedad se palpa a través de las redes sociales y un sinfín de contenidos creados al margen de la producción impresa o de los medios de comunicación convencionales.

La labor de BNE frente a la “edad oscura digital”

Por ello, desde 1996 iniciativas como Internet Archive se han propuesto la misión de ahuyentar el fantasma de una edad oscura digital que relegue al olvido el testimonio de estas convulsas décadas. La Biblioteca Nacional de España (BNE) comenzó a abordar esta tarea en 2009 y recibió el impulso definitivo con la normativa de Depósito Legal Electrónico.

Ésta permitió crear el Archivo de la Web Española, cuya primera recolección de datos con recursos propios se realizó en 2016. Por aquel entonces, se rastrearon 1.800.000 dominios .es registrados y se almacenaron alrededor de 20 TB de información. A día de hoy el volumen de datos se ha duplicado. La última recolección masiva realizada por BNE en 2020 sobre el mismo dominio ha archivado alrededor de 50 TB de contenidos recopilados a partir de 1.930.000 sitios web.

Archivo de la Web Española: un colosal fondo documental

Todo este esfuerzo ha permitido crear un colosal fondo documental. Según datos que fuentes de la BNE han tenido la amabilidad de facilitarnos, a finales del año pasado el Archivo de la Web Española contaba con la friolera de  971 terabytes de información. Procede de recolecciones masivas sobre sitios del dominio .es y recolecciones selectivas, que atienden al emisor (medios de comunicación y fuentes oficiales) o a temáticas concretas. Éstas últimas se refieren a acontecimientos señalados o de especial relevancia social, como es el caso del cambio climático o el movimiento feminista, última colección incorporada el año pasado y que ya cuenta con 1,34 TB de información. 

Las herramientas que lo hacen posible

Para el rastreo de la Red se utiliza Heritrix, un software de recolección automático que captura los enlaces que encuentra y su contenido. Posteriormente permite recrear el sitio web aunque ya haya desaparecido de Internet, de forma que no solo es posible recuperar un portal desaparecido, sino recrear su apariencia en un momento determinado. Para ello se utiliza una aplicación llamada OpenWayback, que permite al usuario seleccionar qué versión quiere consultar. Esta búsqueda debe realizarse a través de los terminales habilitados en la propia Biblioteca Nacional.

Una colección exhaustiva de recursos web de la pandemia

La vocación por facilitar una foto fidedigna de la Red en distintos momentos puso en marcha toda su maquinaria a mediados de febrero de 2020, cuando las alarmantes noticias sobre la pandemia llevaron al Consorcio Internacional para la Preservación de Internet (IIPC) a alertar a las Bibliotecas Nacionales de los distintos países para que recopilaran la información que se estaba generando sobre el COVID-19.

BNE decidió entonces realizar una recolección selectiva con mayor exhaustividad de la requerida. Comenzó el 10 de marzo con la colaboración de las bibliotecas regionales, a través del Consejo de Cooperación Bibliotecaria, y apeló además a la colaboración ciudadana, para lo que se habilitó un formulario online, que continúa abierto, en el que se invitaba a notificar cualquier web con información relevante que mereciera ser preservada.

Gracias a ello se está creando una de las colecciones de recursos web más importantes de nuestra historia, que permitirá rescatar del olvido multitud de sitios que, cuando termine la pandemia, desaparecerán para siempre. Incluye contenidos nacionales y locales y se completa con la aportación de unos mil sitios web que aportan vídeos musicales, audios y cuentos con el coronavirus como tema, junto a ruedas de prensa, campañas de sanidad, programas de radio, podcast y entrevistas a científicos.

Todo ello permitirá rastrear en el futuro el estado del conocimiento sobre el virus en cada momento y el sentir de la población en las diferentes fases por las que hemos pasado desde el confinamiento hasta la desescalada.

Fuentes múltiples y diversas

Si a comienzos de noviembre de 2020 la BNE contabilizaba en este fondo documental unos 5.000 sitios web y 50 terabytes de datos, a 31 de diciembre su volumetría ascendía a 69 terabytes y 5.437 URL (“semillas”) recolectadas en colaboración con las Comunidades Autónomas, con un importante incremento también en la colección de audiovisuales.

No solo incluye información oficial sobre la enfermedad y sus consecuencias, sino también iniciativas particulares de todo tipo (en el ámbito vecinal o asociativo y propuestas para resistir el confinamiento). Recoge, asimismo, perfiles e hilos de discusión creados en redes sociales que permitirán reconstruir el impacto cultural de este episodio, que resultará mucho más difícil de rastrear en el futuro que el impacto sanitario, económico o político, cuyos datos pueden obtenerse por otras fuentes.

Cuando nuestros nietos se interesen por lo que estamos viviendo, no solo podrán rescatar esas escalofriantes imágenes de los hospitales abarrotados de enfermos o de las calles de las grandes metrópolis desiertas. Encontrarán también el testimonio gráfico de paseantes ataviados con mascarillas, podrán escuchar las declaraciones de los expertos sanitarios y consultar las noticias de los principales medios de comunicación en cada momento.

La recolección selectiva de prensa, radio y televisión generó solo en 2020 nada menos que 27 terabytes de contenido, lo que representa casi un 29 por ciento del total de este fondo desde su creación en 2015. Asimismo, han quedado recogidos los datos que han ido proporcionando a la opinión pública los distintos organismos oficiales, tanto de la administración central, como del ámbito autonómico y municipal.

Un cuadro impresionista del COVID-19 para la posteridad, que incluye memes y hashtags

Todas estas capturas, masivas y selectivas, representan las pinceladas de un cuadro impresionista cuyo efecto final permite recrear momentos concretos en la historia, con un enfoque tridimensional, basado en datos, pero también en declaraciones oficiales y percepción de la ciudadanía, a través de las reacciones recogidas en blogs y redes sociales. Con este fin se están archivando además memes y hashtags, que pueden parecer triviales y efímeros, pero sin los que se perderían matices esenciales para comprender las sensaciones que estamos experimentando y nuestro estado anímico.

Como veis, se trata de un esfuerzo ingente y silencioso por parte de BNE, que ha tenido el mérito de articularse en un tiempo récord y condiciones adversas. Ha sido necesario coordinar a los equipos responsables de esta labor a través de videoconferencia y teletrabajo y actuar acuciados por la premura de salvaguardar al vuelo el contenido que se estaba generando.

Por eso estoy segura de que coincidís conmigo en pensar que todos los implicados en esta iniciativa también son héroes de esta pandemia y merecen nuestro aplauso por crear una cápsula del tiempo, como les gusta llamar a este proyecto, que permitirá a las generaciones futuras navegar hasta nuestros días, rescatándonos del olvido de esa temida “edad oscura”. Un fondo documental, lamentablemente aún vivo, que todos tenemos la esperanza de que se pueda cerrar cuanto antes.

Imagen: geralt/pixabay

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *