La información digital, la web y la permanencia
15 Jan 2025No es que sea un fanático de mantener las webs a cualquier precio; de hecho el sitio anterior a este apenas tenía acceso desde Google y no pasaba nada. No sólo eso, estuvo caído varias semanas y la vida siguió. Pero eso no me impide asombrarme cuando muchas organizaciones e instituciones tienen tan poco aprecio por su página: miras el historial de actividades y no existe (utilizan la web para publicitar algo, pero lo borran cuando ya pasó, como si el rastro que dejaran les preocupara).
El tema de la persistencia del contenido web está siendo tratado últimamente y me dejó preocupado (aunque ya lo estaba) leer When Online Content Disappears que resumen un informe que ha elaborado la consultora Pew Research y que nos da unas cifras llamativas:
- Una cuarta parte de las páginas que existían entre 2013 y 2023 ya no están disponibles.
A quarter of all webpages that existed at one point between 2013 and 2023 are no longer accessible, as of October 2023. In most cases, this is because an individual page was deleted or removed on an otherwise functional website.
- Para contenido más antiguo, el porcentaje es peor, un 38%.
For older content, this trend is even starker. Some 38% of webpages that existed in 2013 are not available today, compared with 8% of pages that existed in 2023.
- Un 23% de las páginas tienen, al menos, un enlace roto.
23% of news webpages contain at least one broken link, as do 21% of webpages from government sites.
- El 54% de las páginas de Wikipedia contienen algún enlace en ‘Recursos’ que apunta a una página que ya no existe.
54% of Wikipedia pages contain at least one link in their “References” section that points to a page that no longer exists.
En las redes sociales la cosa no es mucho mejor:
- Casi uno de cada cinco tuits ya no son visibles públicamente solo unos meses después de publicarse.
Nearly one-in-five tweets are no longer publicly visible on the site just months after being posted.
- Algunos tipos de tuits desaparecen más rápido que otros (por ejemplo, más del 40% de los que están escritos en turco o árabe ya no son visibles tres meses después).
Certain types of tweets tend to go away more often than others. More than 40% of tweets written in Turkish or Arabic are no longer visible on the site within three months of being posted. And tweets from accounts with the default profile settings are especially likely to disappear from public view.
El texto proporciona algunos detalles más pero creo que los titulares ya nos hacemos una idea.
Yo entiendo que haya gente que tenga miedo a su pasado (no te pueden atacar por algo que no se puede encontrar en tu web, o en tus redes sociales) pero como sociedad vamos a tener un problema si el medio elegido de publicación es la web y lo que ponemos luego desaparece.
Es cierto, como dicen en How to disappear completely que a veces se trata simplemente de un cambio de dirección (URL).
This happens because pages are taken down, URLs are changed, and entire websites vanish, as in the case of dozens of scientific journals and all the critical research they contained.
Y me recuerda lo frívolas que son algunas organizaciones con estas cuestiones.
Como decíamos, esto es particularmente preoupante para organizaciones gubernamentales, bibliotecas, pero también revistas científicas… Si no guardamos recuerdo de algunas cuestiones estamos perdiendo algo que en el futuro puede ser valioso.
Historical content can be an incredibly informative resource, telling us how people lived and thought. But we must remember that it’s a small fraction of contemporaneous material that survives, even as we hope, of course, that it’s our own existence that is ultimately memorialized.
¿Deberíamos estar pensando mejor cómo archivar alguna información digital valiosa (o no tanto) en previsión de que sus creadores decidan eliminarla o la pierdan por cualquier motivo?
Aún iré más allá y es otro defectillo que tiene la información digital: si solo está en el sitio del proveedor puede que tenga la tentación de modificar cosas, cambiar versiones y que en su web empiecen a perderse ‘detalles’ que eran relevantes pero que por algún motivo no interesa preservar. ¿Estaremos viendo en los sitios de series y películas las versiones que hicieron sus autores o terminaremos teniendo esas versiones recortadas y adaptadas que eliminan los detalles que pueden perjudicar su difusión a públicos más amplios?