Bitácora de fernand0 Cambiando de aires

Internet y la preservación de información

Biblioteca Nacional

No me gusta mucho enlazar artículos que están detrás de un muro (aunque sea registrarse) pero en este caso haré una excepción porque es un tema que me llama la atención. Tengo la teoría de que cuando pase el tiempo veremos que hay etapas sobre las que habrá muy poca documentación: en mi cabeza esa etapa tiene que ver con los momentos de digitalización masiva, donde mucha información ya no se guarda en bibliotecas, archivos,… pero tampoco se conserva adecuadamente (y mucho menos se publica o se pone a disposición de otras personas en la red). Por eso guardo muchas de las cosas que voy leyendo en digital (utilizando sistemas imperfectos, pero que me permiten conservar los textos; por cierto, si alquien quiere este texto también lo tengo).

Y por eso me gustó leer Why the Internet Era Might Be History’s Least-Documented Period donde se hablaba un poco del tema.

Comenzaba hablando de las fotos de su graduación, que estaban en alguna cuenta de algún servicio, en un disco duro roto y por otros diversos lugares….

Last week, I tried to find some photos from my college graduation. Despite being only fifteen years ago, they proved surprisingly elusive – trapped on a defunct Photobucket account, lost to a crashed hard drive, and scattered across social media platforms that no longer exist.

Luego nos recuerda como las empresas deciden cerrar servicios y dejar perder un montón de información (en las próximas semanas ocurrirá con el contenido de Pocket, por ejemplo). Geocities, MySpace, Google+, …

Remember Geocities? Yahoo shut it down in 2009, taking with it millions of early websites – a unique snapshot of early internet culture. The Internet Archive managed to save some pages, but most are gone forever. MySpace lost 12 years of music uploads during a server migration. Google+ vanished, taking with it communities and conversations. Vine? Gone.

Sin embargo, nos recuerda, seguimos pudiendo tener acceso a documentos muy antiguos conservados en diveras bibliotcas, o pinturas de hace mucho tiempo.

We can still read Egyptian hieroglyphics carved 5,000 years ago. We can examine medieval manuscripts, Renaissance paintings, and Victorian photographs. These analog formats have proven remarkably durable.

Es cierto que estos argumentos son trampososo, porque tenemos acceso a unos pocos textos y a unas pocas imágenes, que por muchas y diversas circunstancias se han conservado. ¿Cuántas fotografías analógicas de nuestros padres y abuelos se habrán perdido igualmente que las de la autora?

Luego nos recuerda que los medios digitales son muy frágiles: se rompen los discos duros, los datos se corrompen….

Y la pregunta es evidente, ¿hay alguien conservado estas cosas? La respuesta es, claro, sí y no. El Internet Archive hace un esfuerzo notable (uno de los pocos proyectos a los que dono de vez en cuando algo de dinero). Pero su capacidad llega hasta donde llega, incluso con amenazas legales de vez en cuando.

The Internet Archive does heroic work, but they can only save a fraction of the web and they do so under constant, desperate, grasping legal threat.

También es cierto que uno tenía un libro, o unos documentos y los dejaba en cualquier lado. Con que no tuviera mala suerte, los medios en los que estaban almacenados resistían bastante bien el paso del tiempo. Esto es algo que no sucede tan fácilmente con medios más modernos.

In contrast, a book on a shelf just needs to be kept dry and (preferably) away from fire.

También ocurre que en la actualidad guardamos mucha información en medios diversos que cuando ya no estemos puede desaparecer de manera casi inevitable (los servicios desaparecen, pero aunque no lo hagan, la información está protegida por contraseñas en alguna nube….).

Today, we send ephemeral messages and store photos in the cloud. When we die, our digital presence often dies with us - locked behind passwords or lost to obsolete services.

Las soluciones que propone tienen que ver con aproximaciones híbridas (versiones analógicas de los documentos e imágenes más valiosos), mejorar nuestras habilidades de archivado e instituciones que se encarguen de la preservación a largo plazo.

Perhaps we need a hybrid approach. Critical records could be preserved in both digital and analog formats. Personal archiving could become a emphasized skill, like digital literacy. We might need new institutions dedicated to long-term digital preservation.

Pero sobre todo, nos decía, lo primero es darnos cuenta del problema para poder empezar a actuar.

But first, we need to recognize that the problem actually exists. The digital age promised to make everything accessible, but instead made everything ephemeral. Unless we act, we risk becoming an unexpected dark age - not for lack of records, but for lack of readable ones.

Desde luego, deberíamos invertir más esfuerzo en esto y uno se sorprende al ver como muchas instituciones (para la gente particular es todo más complicado) están ignorando este problema y dejando el tiempo pasar con pérdidas que pueden ser irreparables.

Las definiciones son importantes: IAs 'open source'

Muro de generadores y teclado

Llevamos una (larga) temporada hablando de inteligencia artificial (fundamentalmente modelos gigantes de lengugaje LLMs) y una de las iniciativas que ha proliferado es la posibilidad de descargar los modelos para ejecutarlos localmente (buena noticia desde el punto de vista, al menos, de la privacidad); además, se proporciona información acerca de como se han desarrollado (con la idea de poder intentar reproducirlos), origen de los datos, para qué se pueden utilizar, posibilidad de modificarlos e incluso redistribuir estas modificaciones.

En The Open Source AI Definition Is Out nos hablan justamente de eso: recientemente se publicó la versión 1.0 de la definición de lo que se consideraría una IA ‘open source’, según la Open Source Initiative.

Básicamente la definición dice lo que hemos puesto arriba.

- Provide sufficient information about its design to allow substantial recreation - Disclose pertinent details about training data, including provenance and processing methods - Allow usage for any purpose without permission - Permit studying of the system’s inner workings - Enable modification for any purpose - Allow sharing of the original or modified version.

El problema es que la mayoría de las IAs que ofrecen las empresas llamándolas ‘open source’ no cumplen las condiciciones.

Spoiler alert: Many won’t. The open-wash releases from AI companies such as OpenAI and Meta don’t make the OSAID grade.

Mientras que con el código todo estaba claro, en este caso nos movemos en terrenos más pantanosos, puesto que se incluye código, datos, técnicas, sesgos…

... analyst Stephen O’Grady ... Their scope blends software, data, techniques, biases and more. AI is inarguably a fundamentally different asset than software alone.”

Está claro que un estándar como el propuesto puede servir de referencia y para aclarar el panorama, aunque no sea lo que elijan las empresas relevantes.

No matter where you land on this issue, this new standard could have significant implications for companies that have been marketing their AI models as “open source.”

Desde la iniciativa están abiertos al cambio, pero consideran la propuesta como una primera versión (que no es beta) y esperan que se utilice, se comprenda mejor y se pueda hablar de estas cosas con más precisión a partir de ahora.

Piana explained, being open to change is an “acknowledgment that our collective understanding of what AI does, what’s required to modify language models is limited now. The more we use it, the more we’ll understand. Right now our understanding is limited, and we don’t know yet what the technology will look like in one year, two years, or three years.” Thus the OSAID is leaving room for future flexibility.

Ya era hora.

Las aplicaciones pueden delatar tu posición. O la de alguien con el que vas

Mapa publicitario

Casi a título de inventario, Location of world leaders including Putin, Trump and Macron ‘revealed by security teams’ Strava’ aunque es interesante por el máximo perfil de las personas implicadas.

Y el problema no son ellos mismos, que probablemente están protegidos, sino su personal de seguridad (no informática, claro). Por un lado, agentes del Servicio Secreto de EEUU, que harían de escolta y que tendrían instalada la conocida aplicación deportiva.

A report by French newspaper Le Monde said several US Secret Service agents use the Strava fitness app, which has revealed highly confidential movements of US president Joe Biden, presidential rivals Donald Trump and Kamala Harris and other world leaders.

Pero lo mismo parece que sucede (o sucedía) con el personal de seguridad de Macron, Putin, …

The investigation also identified Strava users among the security personnel for French president Emmanuel Macron and Russian president Vladimir Putin.

Estos dispositivos están prohibidos cuando están trabajando, pero no cuando están en su tiempo de descanso.

In a statement to the newspaper, the Secret Service said its staff aren’t allowed to use personal electronic devices while on duty during protective assignments but “we do not prohibit an employee’s personal use of social media off-duty.”

La clave estaría en identificar a las personas ‘interesantes’, y luego encontrar sus perfiles en las aplicaciones.

Tampoco estoy muy seguro de que esto sea un problema tan grave, teniendo en cuenta todo el personal que mueven a su alrededor (no solo las aplicaciones podrían delatarles). Es algo parecido a lo que dicen desde el gabinete de Macron, por ejemplo, aunque es bueno ser conscientes del problema.

Macron’s office said on Monday that the consequences of the issues reported by Le Monde “are very slight and in no way affect the security of the president of the republic.” But, it added: “A reminder was nevertheless issued to agents by the chief of staff asking them not to use this app.”

En la web de RTVE hablando sobre redes sociales

Hace unos días me contactó Eva Cezón de RTVE para una nota que estaba elaborando con motivo del día de las redes sociales (que, se ve, se celebraba el lunes padasado día 30 de junio).

Las preguntas se centraban en cómo las redes van evolucionando y algunas de ellas van perdiendo fuerza (o son abandonadas). El resultado se ha publicado en Auge y olvido de las redes sociales: la comunicación humana al servicio de ciclos de usar y tirar.

No sé si tiene mucho interés, pero como suele pasar, intercambiamos bastantes ideas y al final salen unas pocas frases, así que copio aquí lo que le mandé. Sobre todo porque en un artículo de estas características no es posible poner todo lo que se habla y creo que hay un buen resumen de algunas de mis ideas fundamentales en estos temas.

Sobre la evolución y obsolescencia en la tecnología digital y algunas redes que han sido predomimantes han sido reemplazadas o absorbidas.

Hay una inevitable renovación generacional que muchas veces aparece como intento por parte de las empresas de captar nuevos clientes y también por los usuarios que las adoptan por reacción a lo que utilizan las generaciones anteriores. En algunos casos los viejos usuarios acuden a las nuevas redes por su valor o interés (los casos de instagram y TikTok donde se puede ver a gente más mayor) y en otros casos se quedan donde están los ‘amigos’ que han conocido (y también, claro, por la familiaridad con el uso, porque no todo el mundo es tan hábil adaptándose a las nuevas interfaces (aspecto y forma de interactuar). Eso se mezcla con la habilidad/capacidad de algunas de las viejas para captar un número suficiente de usuarios que les permita sobrevivir.

Sobre la innovación rápida y los ciclos de vida:

Las nuevas redes traen nuevas características, pero cada vez es más rápida la adopción de estas en las viejas (podemos ver publicaciones del tipo de las de TikTok o los Reels de Instagram en Facebook, en YouTube e incluso en LinkedIn). A veces eso les permite mantener a los viejos usuarios y otras veces les hace perder identidad. Lo que sí que es cierto es que todas las empresas tratan de activar características que les diferencien y las hagan más atractivas.

Sobre la inmediatez y lo desechable:

En muchos casos, cuando estamos en casa aburridos con el teléfono, lo único que queremos es una distracción ligera que nos ayude a pasar el rato. Y siempre hay gente dispuesta a darnos ese contenido que sirva para eso y, de paso, ganar dinero ellos y la red social. Esto ocasiona que, a veces, invirtamos ese tiempo en pura distracción de usar y tirar en lugar de otras tareas más provechosas. No obstante, sostengo desde hace tiempo que casi en cualquiera de las redes sociales podemos encontrar personas afines y que hacen cosas muy interesantes; incluso aprender. Pero hace falta una cierta voluntad de no dejarse llevar y tratar de llevar lo que nos sugieren hacia terrenos que nos pueden interesar más. Y no es difícil, basta con dar me gusta o saltar las publicaciones en los momentos adecuados.

Sobre la adaptación de las redes a las nuevas peticiones de los usuarios y cómo influye en su supervivencia o extinción:

Es cierto que los usuarios pedimos novedades y muchas veces estas hacen que cambiemos (o que empecemos a usar) los sitios que frecuentamos. Pero no hay que despreciar la costumbre y lo que sabemos manejar, que nos permite movernos con cierta confianza y soltura. Aquĺ podríamos poner el ejemplo de X (Twitter), que a pesar de su degradación no está sufriendo una desbandada total porque mucha gente todavía encuentra valor allí y es a lo que está acostumbrado.

Factores que pueden influir en la muerte de una red, como los cambios de propietarios.

El cambio de propiedad puede ser un momento decisivo para una red: los nuevos propietarios no se adaptan bien a la cultura del sitio, o ya tienen algún producto que desempeña el mismo papel y no quieren esa competencia ‘interna’ …. Hemos visto cambios notables en eso, como sucedió con una red de IRC, Freenode, que fue adquirida por alguien que no fue recibido y en pocos días la mayoría de la gente se había ido a una nueva red (Libera Chat). En este caso se trataba de usuarios más o menos avanzados, que no tuvieron ninguna dificultad en coordinarse, dejar el viejo sitio e irse al nuevo sin problemas. Finalmente, tenemos casos como Instagram, que fue adquirido por Facebook (Meta) y que han sabido mantener el espíritu original (más o menos) y también conservar una convivencia adecuada con el viejo producto.

Sobre la falta de actualización y la reacción de la gente joven:

La falta de actualización puede tener efectos en la entrada de nuevos usuarios, pero no hay que despreciar nunca a los antiguos: casos como el del IRC (que sigue vivo y en uso), o Facebook nos enseñan que puedes mantener un producto antiguo, donde las nuevas generaciones ya no entran, pero que goce de buena salud.

Sobre la competencia.

Siempre hay emprendedores intentando dar con la nueva idea que haga que los usuarios se cambien a sus redes y eso hace que todo avance. La competencia es, como dices, feroz, pero ya no hay duda de que hay un buen número de personas intentándolo e inversores apoyándoles.

Sobre las consecuencias, en particular la pérdida de nuestra huella digital.

Esto es algo que todavía no sé si somos capaces de examinar: efectivamente hay un riesgo de perder nuestros mensajes, fotos e identidades en esa eterna migración hacia nuevas redes. En muchos casos puede ser hasta bueno, porque siempre habrá etapas de nuestra vida que no queremos recordar, pero también deberíamos evaluar qué guardamos, cómo y dónde para poder mostrar, dentro de unos años aquellas fotografías de los sitios que visitamos, o los encuentros memorables. Quién más quién menos ya ha perdido algunas fotos que apreciaba, aunque no sé hasta que punto eso es diferente a cuando teníamos las fotos en papel y tampoco las volvíamos a ver nunca más.

Y la nostalgia digital.

Yo no soy muy nostálgico, pero veo a veces a la gente recordar sus buenos momentos en MySpace, o en Tuenti y, efectivamente, existe esa nostalgia. Supongo que se parece a la nostalgia ‘analógica’ de los recuerdos de los buenos ratos vividos. También hay que reconocer que esos momentos se quedan allí en muchas ocasiones y que los contactos y las relaciones dejan de existir por algún motivo (no siempre desagradable).

Sobre la superficialidad de los vínculos digitales y el cambio constante. ¿Estamos condenados a empezar de cero de manera permanente?

Yo creo que no. Las redes digitales precisamente nos permiten establecer vínculos más profundos y cercanos que sus contrapartes analógicas: cuando la única posibilidad que tenías de hablar con alguien que estaba lejos era una carta o una (cara) llamada de teléfono, en muchas ocasiones una mudanza era el fin de muchas relaciones. Eso ya no tiene por qué ser así, si las relaciones son auténticas. Y no sólo eso, sino que con personas cercanas, pero que no podemos ver todos los días por diversos motivos, estas redes nos permiten tener una cercanía que de otro modo sería imposible.

Sobre la posibilidad de mantener una red social permanente.

La red social permanente es la que mantenemos las personas, mediante las herramientas que tenemos a mano: es nuestra tarea conservarla, mantenerla y gestionarla. Y las herramientas nos permiten, de vez en cuando, ampliarla y mejorarla.

Lo que pueden aprender las nuevas plataformas de las que ya están consolidadas.

Respetar a los usuarios, ayudarles a mejorar su vida y ofrecerles valor. En muchas ocasiones vemos como las empresas solo buscan el beneficio económico y mejorar la cuenta de resultados y eso termina siendo un problema, cuando los usuarios encuentran la siguiente red social más divertida y ‘mejor’.

¿Cómo debemos relacionarnos en el entorno digital?

Efectivamente, para mi esa es la clave y lo digo siempre que me dejan: puedes dejarte llevar y puede que te entretengas un rato, o puedes tratar de buscar valor en lo que ves y haces. No se trata de (exagerando) buscar fuentes de conocimiento profundo (o sí, si ese es nuestro interés, claro), pero si tienes una afición, o hay algo que te gusta, puedes enfocar tu actividad en las redes a la búsqueda de ‘almas gemelas’, gente de la que aprender, e información valiosa. Es un poco más de esfuerzo que dejarse llevar, pero en mi opinión es mucho más satisfactorio.

Sobre las expectativas y repensar lo que las redes sociales deben ofrecernos.

Así es. Debemos tratar de hacer cosas que tengan sentido; aunque soy pesimista. La realidad nos muestra cómo nos dejamos llevar y hay gente que dedica horas y horas a actividades que sólo son entretenimiento.

Publicado originalmente en En la web de RTVE hablando sobre redes sociales.

Lo que importa (en internet y la indie web)

Torre del Castillo Imperial

Hace algún tiempo vi Hugs of Death: How should we think about resilience in the IndieWeb? y a pesar del título llamativo y que empieza con una parte algo técnica, me pareció interesante por lo que dice un poco más abajo.

Todo empieza porque una entrada del sitio llega a un agregador importante (Hacker News) y su proveedor parece que no aguanta la carga.

Either way, it’s clear that this little VPS couldn’t handle the load of the HN post getting popular.

Soluciones técnicas hay para evitar estos problemas, pero el autor se pregunta si realmente es importante.

Does it actually matter?

Al cabo de poco tiempo la página volvía a estar disponible y la cuestión era, ¿para qué tenemos un sitio como este? Se trata de compartir ideas, pensamientos y conocimientos al mundo, manteniendo la propiedad y el control de todo. Y esto es posible con pocos recursos (aunque podamos tener algún inconveniente de vez en cuando).

I like the fact that the IndieWeb can empower smaller creators to share their interests and creations with the world, while owning their own corner of the internet. I like the idea that the barrier to entry can be quite low, starting with something like a 512 MB VPS that someone can manage themselves. Maybe even something more DIY like a Raspberry Pi.

Nos dice también que estos problemas son preferibles a la centralización que supone utilizar ese otro tipo de servicios.

If there’s a bit of downtime or some teething problems, or a hug of death or two, is that preferable to adopting the centralised providers like GitHub and Cloudflare as the “default”, or giving newbies the idea that there’s no way to publish good content without an overkill auto-scaling setup?

Interesante.

Lo cierto es que este sitio está alojado ahora en Github Pages, aunque mantenemos el control (dominio y todo) para moverlo en cualquier momento a otro lugar. Tal vez lo pensemos.