Bitácora de fernand0 Cambiando de aires

Las IAs como consejeras o ayudantes

El carro y los ayudantes

Algo que parece que no está claro para todo el mundo es que la IA no sirve para todo (hasta ahora) y mucho menos los LLMs (modelos de lenguaje gigantes), que hacen algunas cosas muy bien y otras no tanto.

En Why ChatGPT is a uniquely terrible tool for government ministers nos cuentan el caso de Peter Kyle, Secretario de Estado de Ciencia y Tecnología en Gran Bretaña (UK), que habría estado usando una de estas IAs como consejera para cuestiones de su negociado. En concreto, borradores de discursos, pero también sugerencias sobre a qué podcasts acudir y recomendaciones sobre su gestión.

Kyle apparently used the AI tool to draft speeches and even asked it for suggestions about which podcasts he should appear on. But he also sought advice on his policy work, apparently including questions on why businesses in the UK are not adopting AI more readily. He asked the tool to define what "digital inclusion" means.

Pero, nos dicen, esto tiene muchos problemas:

  • Las IAs miran el pasado (los datos con los que han sido entrenadas, que son los que había disponibles en ese momento, y no el futuro.

No sería un problema solo por tratarse del pasado, sino también por el sesgo en los datos acerca de lo que había: un gobierno conservador.

... that means that not only will a Labor minister be accessing information from the past, but he'll be advised by an algorithm leaning heavily on advice given to Conservative governments.
  • Prejuicios.

Cuando uno de estos modelos no puede dar una buena respuesta basa las suyas en lo que se llama su ‘modelo de verdad’, que típicamente considera el consenso como el valor aceptable. El problema es que la verdad es la que es, independientemente de lo que la mayoría de la gente piense (no estamos hablando, claro, del consenso científico o de los especialistas).

For us, the truth is what best corresponds to reality in the physical world. The divergence between the truth models could be consequential in many ways.

Por este motivo pueden aparecer problemas relacionados con prejuicios, sexismo, racismo ..

Social prejudices, including sexism and racism, are easily internalized under the consensus model.
  • Narrativas complacientes

Los modelos proporcionan, típicamente, historias atractivas y elegantes cuando responden. El objetivo es responder, pero también que los usuarios sigan teniendo interés en usarlas.

These poetic pieces of writing work well for engagement and help OpenAI to keep users hooked on their product.

Lamentablemente, el mundo real no siempre es bonito ni atractivo: complejidad, contradicciones, dilemas morales… que en muchos casos ni siquiera tienen solución.

But the real world is not a story. It is a constant swirl of political complexities, social contradictions and moral dilemmas, many of which can never be resolved.

La verdad es que, al final, el uso de Kyle no es más que una excusa para introducir algunos arumentos que a mi me han parecido interesantes, y que mucha gente ignora cuando utiliza este tipo de herramientas.

Buscando sitios cómodos en internet

Bar

El consultor Venkatesh Rao ha acuñado el término cozy web, que podríamos traducir por web acogedora o algo parecido. En The Dark Forest and the Cozy Web es donde lei el término y nos dicen que se trata de la parte de la web privada, protegida por distintos mecanismos donde nos hemos recogido en muchos casos en los últimos años. La definición del término apareció en The Extended Internet Universe.

The cozy web is Venkatesh Rao ’s term for the private, gatekeeper-bounded spaces of the internet we have all retreated to over the last few years.

Se trataría de una analogía con la teoría de la web como bosque oscuro, que parece inquietantemente silencioso y desprovisto de vida, porque las criaturas que lo habitan están escondidas por miedo.

The “dark forest” is a place that seems eerily quiet and devoid of life. All the living creatures within it are hiding.

Los depredadores serían los anunciantes, herramientas de seguimiento, creadores de cebos, atractores de atención, gente que responde, …. Parece poco seguro mostrarnos de manera genuina y por eso nos retiramos a espacios privados.

The predators here are the advertisers, tracking bots, clickbait creators, attention-hungry influencers, reply guys, and trolls. It’s unsafe to reveal yourself to them in any authentic way. So we retreat into private spaces.

Luego muestra una figura donde esa web más acogedora serían los grupos de whatsapp, slack, discord, telegram, …. donde podemos encontrar gente que se parece a nosotros y mantener conversaciones más controladas y civilizadas.

We create tiny underground burrows of Slack channels, Whatsapp groups, Discord chats, and Telegram streams that offer shelter and respite from the aggressively public nature of Facebook, Twitter, and every recruiter looking to connect on LinkedIn.

En la historia original se contraponen los protocolos ‘humanos’ de los usuarios pinchando enlaces de sitios públicos creados por editoriales (publishers) frente a los protocolos humanos basados en personas intercambiando lo que sea que quieren compartir.

Unlike the main public internet, which runs on the (human) protocol of “users” clicking on links on public pages/apps maintained by “publishers”, the cozyweb works on the (human) protocol of everybody cutting-and-pasting bits of text, images, URLs, and screenshots across live streams

La verdad es que no lo había visto así (porque sigo creyendo en la internet abierta), pero desde luego me parece una explicación bastante razonable de algunas de las cosas que vemos que están pasando.

Las inteligencias artificiales, la web abierta y nosotros

Arcos y rejas

Por aquí ya llevamos tiempo hablando del mal estado de la web: sigue siendo fácil crear páginas, mantenerlas, gestionarlas … El único límite es el interés de la gente por crearlas. Pero también es verdad que ahora hay herramientas mucho más sencillas para publicar en internet (no siempre en la web) y mucha gente no se da cuenta de las limitaciones de ese modelo hasta que ya es tarde (te borran la cuenta, quieres encontrar algo, …). En el acceso pasa algo parecido: es más cómodo entrar en esos sitios donde es fácil publicar y dejarnos llevar por el flujo de imágenes/contenidos que se nos van mostrando.

El otro día leía ¿Está llegando el fin de la web abierta? El control de la IA y la desaparición de los pequeños en favor de los gigantes donde se habla de un nuevo ‘enemigo’: si las inteligencias artificiales nos van a dar los datos que necesitamos, ¿quién va a navegar por la web buscando información?

Hoy en día, cuando hacemos una búsqueda, esperamos recibir una lista de enlaces con páginas que contienen información relevante. Pero cada vez más, las IAs están eliminando ese paso intermedio y ofreciéndonos la respuesta directamente.

Claro, eso puede ser un problema porque nada ni nadie nos garantiza que la información que proporcionarán esas IAs será la que necesitamos sin censura ni transformaciones de conveniencia.

Si las IAs controlan el acceso al conocimiento, surge un problema aún mayor: unas pocas empresas decidirán qué información es relevante y cuál no.

Por lo tanto David nos recuerda que parte de la solución está en nuestras manos: las IAs abiertas y descentralizadas, fomento de plataformas alternativas (no solo las nacidas de las grandes empresas), regulación del acceso (protección del acceso para todo el mundo), y fortalecer la web abierta.

Veo difícil las tres primeras, fundamentalmente porque la historia nos demuestra que en estos juegos el ganador se lo lleva (casi) todo y es muy difícil romper esas dinámicas (tampoco es que haya grandes esfuerzos en ese sentido). Sobre la cuarta, aquí estamos (seguimos) tratando de mantener un espacio y, tal vez, animar a otras personas a tenerlo. Pero casi reconociendo desde el inicio que no vamos a ganar, ni siquiera a ser suficientemente relevantes.

Como dice David:

¿Estamos listos para dejar que esto ocurra? Si queremos un futuro digital libre, ahora es el momento de actuar.

La gobernanza de las universidades y la política (en EEUU)

Gaudeamus Igitur

En EEUU las universidades están atravesando momentos difíciles (por aquí también hay casos, porque, como ya hemos dicho en otras ocasiones y aunque los modelos son bastante diferentes, los políticos -pero no solo ellos, el entorno también marca direcciones- influyen mucho en lo que puede pasar).

En Who actually runs Columbia University? hablan del caso de la Universidad de Columbia y sus problemas de gobierno. La cuestión es algo ténica, pero esencialmente parece que uno de los miembros de la junta directiva (compuesta por personas que no son académicos) sin consultar a las personas de la universidad.

For a member of the board of trustees to assume leadership of the university, without even the fig leaf of faculty consultation, has never occurred in the 271-year history of Columbia.

Todo esto se desarrolla en el contexto de la amenaza del presidente de seguir sus directrices o perder financiación (aunque, como decimos, no son públicas reciben fondos federales y de diversos organismos públicos).

Y, nos dicen, esto afecta a la libertad académica y a la propia gobernanza.

American universities, in their recent dealings with the federal government – and with their own trustees – have repeatedly shown themselves incapable of preserving the core values of academic freedom and shared governance.

Estas juntas directivas desempeñan un papel fundamental en asegurar la salud financiera y la estabilidad, pero en tiempos donde el gobierno quire influir en las universidades esto puede ser un problema grave, afectando a quién se contrata, qué líneas de trabajo se favorecen, incluso con motivaciones políticas de los propios directivos.

Trustees (sometimes called governors, regents, visitors or “members of the corporation”) have a lofty function: to ensure the financial health and stability of the institution, partly through their own donations. ... In our fraught times, these levers are in increasing use, especially by the Trump-driven Republican party, to target disciplines, departments and individual professors. Many boards have become political wolves in the guise of fiduciary sheep.

Habla un poco de las características de estos comités (formados por hombres blancos exitosos, en su mayoría) y sus sesgos e intereses, pero no entraremos en ello.

Sí, claro, dicen que esto es un caso en una Universidad concreta, pero que no es un caso único y por eso debería preocuparnos. La universidades públicas de allá tampoco se salvan.

The Columbia board is by no means unique. ... As far as public universities are concerned, ... In these regards, they are very much like their private counterparts.

Finalmente habla del contrato social de estos directivos y cómo deberían responsabilizarse de sus decisiones y recibir la adecuada vigilancia así como asegurarse de que siguen los valores y principios correctos.

Creating this new social contract will require two crucial steps. The first is to bring the full force of public scrutiny to bear on boards, their membership, their accountability and the checks on their powers. The second is to demand that all academic governing boards both reflect and defend the fundamental values of universities in a liberal democracy: freedom of academic speech, opinion and inquiry; procedural transparency; and demographic diversity.

Para no perder de vista.

La preservación digital y los riesgos actuales

Incunables en su contenedor

De vez en cuando hablamos de preservación digital y, en particular, de la web. En As the Trump administration purges web pages, this group is rushing to save them nos recuerdan que una parte de la web está siendo borrada de manera activa.

No solo páginas federales, que en algunos casos volvían modificadas, sino también conjuntos de datos (fundamentalmente relacionados con ciencia y medio ambiente).

After President Trump's inauguration in January, some federal web pages vanished. While some pages were removed entirely, many came back online with changes that the new administration's officials said were made to conform to Trump's executive orders to remove "diversity, equity, inclusion, and accessibility policies." Thousands of datasets were wiped — mostly at agencies focused on science and the environment — in the days following Trump's return to the White House.

Nos recuerdan de la existencia del Internet Archive y de su valioso trabajo, preservando sitios que van desapareciendo con el tiempo.

The nonprofit, founded in 1996, is a digital library of internet sites and cultural artifacts. This includes hundreds of billions of copies of government websites, news articles and data. The Wayback Machine is the archive's access point to nearly three decades of web history.

Cada día descargan varios teras de información, que archivan adecuadamente y luego ofrecen para su revisión.

Every day, about 100 terabytes of material are uploaded to the Internet Archive, or about a billion URLs, with the assistance of automated crawlers. Most of that ends up in the Wayback Machine, while the rest is digitized analog media — books, television, radio, academic papers — scanned and stored on servers.

Creo que es un proyecto que merece la pena apoyar (independientemente de quién sea el presidente de turno de los EEUU, su trabajo sería valioso aunque no hubiera alguien tratando de borrar información).

Y nos recuerdan que, incluso pasa en la Wikipedia: un número importante de sus enlaces corresponden a páginas que ya no existen, pero cuyo contenido se puede conocer gracias a este proyecto.

"I don't remember the page but, you know, a significant percentage of the links that were on the Wikipedia article are Internet Archive links," he said. "That is really sad — that what people view as a primary source is something that doesn't exist anymore."

También tienen amenazas legales, que pretenden desanimar el archivado y la labor de esta organización.

Founder Kahle said the costly lawsuits — which legal experts say are meant to be a deterrent — threaten the future of the archive.