Bitácora de fernand0 Cambiando de aires

Las definiciones son importantes: IAs 'open source'

Muro de generadores y teclado

Llevamos una (larga) temporada hablando de inteligencia artificial (fundamentalmente modelos gigantes de lengugaje LLMs) y una de las iniciativas que ha proliferado es la posibilidad de descargar los modelos para ejecutarlos localmente (buena noticia desde el punto de vista, al menos, de la privacidad); además, se proporciona información acerca de como se han desarrollado (con la idea de poder intentar reproducirlos), origen de los datos, para qué se pueden utilizar, posibilidad de modificarlos e incluso redistribuir estas modificaciones.

En The Open Source AI Definition Is Out nos hablan justamente de eso: recientemente se publicó la versión 1.0 de la definición de lo que se consideraría una IA ‘open source’, según la Open Source Initiative.

Básicamente la definición dice lo que hemos puesto arriba.

- Provide sufficient information about its design to allow substantial recreation - Disclose pertinent details about training data, including provenance and processing methods - Allow usage for any purpose without permission - Permit studying of the system’s inner workings - Enable modification for any purpose - Allow sharing of the original or modified version.

El problema es que la mayoría de las IAs que ofrecen las empresas llamándolas ‘open source’ no cumplen las condiciciones.

Spoiler alert: Many won’t. The open-wash releases from AI companies such as OpenAI and Meta don’t make the OSAID grade.

Mientras que con el código todo estaba claro, en este caso nos movemos en terrenos más pantanosos, puesto que se incluye código, datos, técnicas, sesgos…

... analyst Stephen O’Grady ... Their scope blends software, data, techniques, biases and more. AI is inarguably a fundamentally different asset than software alone.”

Está claro que un estándar como el propuesto puede servir de referencia y para aclarar el panorama, aunque no sea lo que elijan las empresas relevantes.

No matter where you land on this issue, this new standard could have significant implications for companies that have been marketing their AI models as “open source.”

Desde la iniciativa están abiertos al cambio, pero consideran la propuesta como una primera versión (que no es beta) y esperan que se utilice, se comprenda mejor y se pueda hablar de estas cosas con más precisión a partir de ahora.

Piana explained, being open to change is an “acknowledgment that our collective understanding of what AI does, what’s required to modify language models is limited now. The more we use it, the more we’ll understand. Right now our understanding is limited, and we don’t know yet what the technology will look like in one year, two years, or three years.” Thus the OSAID is leaving room for future flexibility.

Ya era hora.

Las aplicaciones pueden delatar tu posición. O la de alguien con el que vas

Mapa publicitario

Casi a título de inventario, Location of world leaders including Putin, Trump and Macron ‘revealed by security teams’ Strava’ aunque es interesante por el máximo perfil de las personas implicadas.

Y el problema no son ellos mismos, que probablemente están protegidos, sino su personal de seguridad (no informática, claro). Por un lado, agentes del Servicio Secreto de EEUU, que harían de escolta y que tendrían instalada la conocida aplicación deportiva.

A report by French newspaper Le Monde said several US Secret Service agents use the Strava fitness app, which has revealed highly confidential movements of US president Joe Biden, presidential rivals Donald Trump and Kamala Harris and other world leaders.

Pero lo mismo parece que sucede (o sucedía) con el personal de seguridad de Macron, Putin, …

The investigation also identified Strava users among the security personnel for French president Emmanuel Macron and Russian president Vladimir Putin.

Estos dispositivos están prohibidos cuando están trabajando, pero no cuando están en su tiempo de descanso.

In a statement to the newspaper, the Secret Service said its staff aren’t allowed to use personal electronic devices while on duty during protective assignments but “we do not prohibit an employee’s personal use of social media off-duty.”

La clave estaría en identificar a las personas ‘interesantes’, y luego encontrar sus perfiles en las aplicaciones.

Tampoco estoy muy seguro de que esto sea un problema tan grave, teniendo en cuenta todo el personal que mueven a su alrededor (no solo las aplicaciones podrían delatarles). Es algo parecido a lo que dicen desde el gabinete de Macron, por ejemplo, aunque es bueno ser conscientes del problema.

Macron’s office said on Monday that the consequences of the issues reported by Le Monde “are very slight and in no way affect the security of the president of the republic.” But, it added: “A reminder was nevertheless issued to agents by the chief of staff asking them not to use this app.”

En la web de RTVE hablando sobre redes sociales

Hace unos días me contactó Eva Cezón de RTVE para una nota que estaba elaborando con motivo del día de las redes sociales (que, se ve, se celebraba el lunes padasado día 30 de junio).

Las preguntas se centraban en cómo las redes van evolucionando y algunas de ellas van perdiendo fuerza (o son abandonadas). El resultado se ha publicado en Auge y olvido de las redes sociales: la comunicación humana al servicio de ciclos de usar y tirar.

No sé si tiene mucho interés, pero como suele pasar, intercambiamos bastantes ideas y al final salen unas pocas frases, así que copio aquí lo que le mandé. Sobre todo porque en un artículo de estas características no es posible poner todo lo que se habla y creo que hay un buen resumen de algunas de mis ideas fundamentales en estos temas.

Sobre la evolución y obsolescencia en la tecnología digital y algunas redes que han sido predomimantes han sido reemplazadas o absorbidas.

Hay una inevitable renovación generacional que muchas veces aparece como intento por parte de las empresas de captar nuevos clientes y también por los usuarios que las adoptan por reacción a lo que utilizan las generaciones anteriores. En algunos casos los viejos usuarios acuden a las nuevas redes por su valor o interés (los casos de instagram y TikTok donde se puede ver a gente más mayor) y en otros casos se quedan donde están los ‘amigos’ que han conocido (y también, claro, por la familiaridad con el uso, porque no todo el mundo es tan hábil adaptándose a las nuevas interfaces (aspecto y forma de interactuar). Eso se mezcla con la habilidad/capacidad de algunas de las viejas para captar un número suficiente de usuarios que les permita sobrevivir.

Sobre la innovación rápida y los ciclos de vida:

Las nuevas redes traen nuevas características, pero cada vez es más rápida la adopción de estas en las viejas (podemos ver publicaciones del tipo de las de TikTok o los Reels de Instagram en Facebook, en YouTube e incluso en LinkedIn). A veces eso les permite mantener a los viejos usuarios y otras veces les hace perder identidad. Lo que sí que es cierto es que todas las empresas tratan de activar características que les diferencien y las hagan más atractivas.

Sobre la inmediatez y lo desechable:

En muchos casos, cuando estamos en casa aburridos con el teléfono, lo único que queremos es una distracción ligera que nos ayude a pasar el rato. Y siempre hay gente dispuesta a darnos ese contenido que sirva para eso y, de paso, ganar dinero ellos y la red social. Esto ocasiona que, a veces, invirtamos ese tiempo en pura distracción de usar y tirar en lugar de otras tareas más provechosas. No obstante, sostengo desde hace tiempo que casi en cualquiera de las redes sociales podemos encontrar personas afines y que hacen cosas muy interesantes; incluso aprender. Pero hace falta una cierta voluntad de no dejarse llevar y tratar de llevar lo que nos sugieren hacia terrenos que nos pueden interesar más. Y no es difícil, basta con dar me gusta o saltar las publicaciones en los momentos adecuados.

Sobre la adaptación de las redes a las nuevas peticiones de los usuarios y cómo influye en su supervivencia o extinción:

Es cierto que los usuarios pedimos novedades y muchas veces estas hacen que cambiemos (o que empecemos a usar) los sitios que frecuentamos. Pero no hay que despreciar la costumbre y lo que sabemos manejar, que nos permite movernos con cierta confianza y soltura. Aquĺ podríamos poner el ejemplo de X (Twitter), que a pesar de su degradación no está sufriendo una desbandada total porque mucha gente todavía encuentra valor allí y es a lo que está acostumbrado.

Factores que pueden influir en la muerte de una red, como los cambios de propietarios.

El cambio de propiedad puede ser un momento decisivo para una red: los nuevos propietarios no se adaptan bien a la cultura del sitio, o ya tienen algún producto que desempeña el mismo papel y no quieren esa competencia ‘interna’ …. Hemos visto cambios notables en eso, como sucedió con una red de IRC, Freenode, que fue adquirida por alguien que no fue recibido y en pocos días la mayoría de la gente se había ido a una nueva red (Libera Chat). En este caso se trataba de usuarios más o menos avanzados, que no tuvieron ninguna dificultad en coordinarse, dejar el viejo sitio e irse al nuevo sin problemas. Finalmente, tenemos casos como Instagram, que fue adquirido por Facebook (Meta) y que han sabido mantener el espíritu original (más o menos) y también conservar una convivencia adecuada con el viejo producto.

Sobre la falta de actualización y la reacción de la gente joven:

La falta de actualización puede tener efectos en la entrada de nuevos usuarios, pero no hay que despreciar nunca a los antiguos: casos como el del IRC (que sigue vivo y en uso), o Facebook nos enseñan que puedes mantener un producto antiguo, donde las nuevas generaciones ya no entran, pero que goce de buena salud.

Sobre la competencia.

Siempre hay emprendedores intentando dar con la nueva idea que haga que los usuarios se cambien a sus redes y eso hace que todo avance. La competencia es, como dices, feroz, pero ya no hay duda de que hay un buen número de personas intentándolo e inversores apoyándoles.

Sobre las consecuencias, en particular la pérdida de nuestra huella digital.

Esto es algo que todavía no sé si somos capaces de examinar: efectivamente hay un riesgo de perder nuestros mensajes, fotos e identidades en esa eterna migración hacia nuevas redes. En muchos casos puede ser hasta bueno, porque siempre habrá etapas de nuestra vida que no queremos recordar, pero también deberíamos evaluar qué guardamos, cómo y dónde para poder mostrar, dentro de unos años aquellas fotografías de los sitios que visitamos, o los encuentros memorables. Quién más quién menos ya ha perdido algunas fotos que apreciaba, aunque no sé hasta que punto eso es diferente a cuando teníamos las fotos en papel y tampoco las volvíamos a ver nunca más.

Y la nostalgia digital.

Yo no soy muy nostálgico, pero veo a veces a la gente recordar sus buenos momentos en MySpace, o en Tuenti y, efectivamente, existe esa nostalgia. Supongo que se parece a la nostalgia ‘analógica’ de los recuerdos de los buenos ratos vividos. También hay que reconocer que esos momentos se quedan allí en muchas ocasiones y que los contactos y las relaciones dejan de existir por algún motivo (no siempre desagradable).

Sobre la superficialidad de los vínculos digitales y el cambio constante. ¿Estamos condenados a empezar de cero de manera permanente?

Yo creo que no. Las redes digitales precisamente nos permiten establecer vínculos más profundos y cercanos que sus contrapartes analógicas: cuando la única posibilidad que tenías de hablar con alguien que estaba lejos era una carta o una (cara) llamada de teléfono, en muchas ocasiones una mudanza era el fin de muchas relaciones. Eso ya no tiene por qué ser así, si las relaciones son auténticas. Y no sólo eso, sino que con personas cercanas, pero que no podemos ver todos los días por diversos motivos, estas redes nos permiten tener una cercanía que de otro modo sería imposible.

Sobre la posibilidad de mantener una red social permanente.

La red social permanente es la que mantenemos las personas, mediante las herramientas que tenemos a mano: es nuestra tarea conservarla, mantenerla y gestionarla. Y las herramientas nos permiten, de vez en cuando, ampliarla y mejorarla.

Lo que pueden aprender las nuevas plataformas de las que ya están consolidadas.

Respetar a los usuarios, ayudarles a mejorar su vida y ofrecerles valor. En muchas ocasiones vemos como las empresas solo buscan el beneficio económico y mejorar la cuenta de resultados y eso termina siendo un problema, cuando los usuarios encuentran la siguiente red social más divertida y ‘mejor’.

¿Cómo debemos relacionarnos en el entorno digital?

Efectivamente, para mi esa es la clave y lo digo siempre que me dejan: puedes dejarte llevar y puede que te entretengas un rato, o puedes tratar de buscar valor en lo que ves y haces. No se trata de (exagerando) buscar fuentes de conocimiento profundo (o sí, si ese es nuestro interés, claro), pero si tienes una afición, o hay algo que te gusta, puedes enfocar tu actividad en las redes a la búsqueda de ‘almas gemelas’, gente de la que aprender, e información valiosa. Es un poco más de esfuerzo que dejarse llevar, pero en mi opinión es mucho más satisfactorio.

Sobre las expectativas y repensar lo que las redes sociales deben ofrecernos.

Así es. Debemos tratar de hacer cosas que tengan sentido; aunque soy pesimista. La realidad nos muestra cómo nos dejamos llevar y hay gente que dedica horas y horas a actividades que sólo son entretenimiento.

Publicado originalmente en En la web de RTVE hablando sobre redes sociales.

Lo que importa (en internet y la indie web)

Torre del Castillo Imperial

Hace algún tiempo vi Hugs of Death: How should we think about resilience in the IndieWeb? y a pesar del título llamativo y que empieza con una parte algo técnica, me pareció interesante por lo que dice un poco más abajo.

Todo empieza porque una entrada del sitio llega a un agregador importante (Hacker News) y su proveedor parece que no aguanta la carga.

Either way, it’s clear that this little VPS couldn’t handle the load of the HN post getting popular.

Soluciones técnicas hay para evitar estos problemas, pero el autor se pregunta si realmente es importante.

Does it actually matter?

Al cabo de poco tiempo la página volvía a estar disponible y la cuestión era, ¿para qué tenemos un sitio como este? Se trata de compartir ideas, pensamientos y conocimientos al mundo, manteniendo la propiedad y el control de todo. Y esto es posible con pocos recursos (aunque podamos tener algún inconveniente de vez en cuando).

I like the fact that the IndieWeb can empower smaller creators to share their interests and creations with the world, while owning their own corner of the internet. I like the idea that the barrier to entry can be quite low, starting with something like a 512 MB VPS that someone can manage themselves. Maybe even something more DIY like a Raspberry Pi.

Nos dice también que estos problemas son preferibles a la centralización que supone utilizar ese otro tipo de servicios.

If there’s a bit of downtime or some teething problems, or a hug of death or two, is that preferable to adopting the centralised providers like GitHub and Cloudflare as the “default”, or giving newbies the idea that there’s no way to publish good content without an overkill auto-scaling setup?

Interesante.

Lo cierto es que este sitio está alojado ahora en Github Pages, aunque mantenemos el control (dominio y todo) para moverlo en cualquier momento a otro lugar. Tal vez lo pensemos.

Las inteligencias artificiales y la revisión por pares

Pasaba por allí. Jardín Botánico Alfonso XIII.

Tenía guardado para comentar ChatGPT is transforming peer review — how can we use it responsibly? (lamentablemente no está en abierto, si alguien lo quiere que lo diga) y casualmente compartí en redes sociales el otro día este otro Using AI for Reviews, de uno de los fijos en mi lector de RSS, Lance Fortnow.

Decían en Nature que estaban observando un número significativo de revisiones hechas por IAs.

At major computer-science publication venues, up to 17% of the peer reviews are now written by artificial intelligence.

Como en tantas ocasiones, no es difícil del todo darse cuenta de la situación: el tono es formal y muy ‘verboso’, con palabras como ‘meticuloso’ y ‘encomiable’ apareciendo diez veces más que antes.

Y la cuestión es, claro, que nos guste o no estas herramientas han venido y están para quedarse (aunque se habla muy poco de qué sucedería si los proveedores deciden cortarnos el grifo o subir los precios, claro).

El razonamiento típico para adoptar estas herramientas tiene que ver con la ‘productividad’: falta de tiempo para hacerlo por métodos más tradicionales.

También hay otro razonamiento habitual y es si se puede restringir a tareas que sean ‘las correctas’ (corrección de texto, gramática, responder a preguntas simples sobre el manuscrito,…). Pero también puede suceder que este proceso haga todavía peor el (ya maltrecho) sistema de publicaciones científicas. Sin olvidar los temas de propiedad intelectual y la privacidad, claro.

Otra queja habitual de los que reciben este tipo de revisiones es la falta de profundidad y las alucinaciones.

Alguna ventaja más, por el otro lado, podría ser que la inteligencia artificial se fije en cosas que un revisor tradicional pasaría por alto.

Como solución, nos dicen, la que estamos adoptando en otros campos: añadir más interacciones al proceso; si los revisores y los autores pueden debatir probablemente haya más incentivos para hacer las cosas correctamente.

En cualquier caso, no podemos cerrar los ojos y pensar que nada pasa (con inconvenientes y ventajas).

Por su parte Fortnow comenta como tuvo que aceptar la norma de no utilizar IA para una revisión que tuvo que hacer.

I reviewed a paper recently and I had to agree not to use AI in any aspect of the reviewing process.

Lo hizo, nos dice, pero se sintió raro: al final, sería como tener prohibido usar una calculadora para revisar los cálculos que puedan aparecer. También dice que los modelos gigantes de lenguaje (LLMs, Large Language Models) tienen sus inconvenientes, pero también sus ventajas.

So I didn't but it felt strange, like I wouldn't be able to use a calculator to check calculations in a paper. Large language models aren't perfect but they've gotten very good and while we shouldn't trust them to find issues in a paper, they are certainly worth listening to.

La idea sería que la IA no escriba la revisión completa, o eso es lo que parece que están tratando de evitar.

Las inteligencias artificiales van siendo cada vez más capaces y resuelven problemas, al menos los habituales y comunes. Nada que hacer (ni se espera mucho) en el caso de los problemas interesantes.

It solves all my old homework problems and cuts through purported P v NP proofs like butter. I've tried it on some of my favorite open problems where it doesn't make new progress but it doesn't create fake proofs and does a good job giving the state of the art, some of which I didn't even know about beforehand.

Podríamos decir que tenemos inteligencias artificiales del nivel de un estudiante universitario y, por lo tanto, deberíamos tratar sus respuestas de esta forma.

We now have AI at the level of new graduate students. We should treat them as such.

También habla de los problemas de privacidad, puesto que los artículos que revisamos no deberían ser accesibles para nadie más y con estos procedimientos podrían terminar siendo material de entrenamiento de las inteligencias artificiales. Esto podría llevar a la divulgación de información secreta, si se hacen las preguntas adecuadas.

We do have a privacy issue. Most papers under review are not for public consumption and if uploaded into a large-language model they could become training data and be revealed if someone asks a relevant question.

La recomendación que nos hace es, cuandos seamos los autores, pasar una revisión del artículo con una IA, pidiéndole una revisión crítica y sugerencias. ¿Llegaremos a tener que remitir artículos certificados por alguna IA?

If you are an author, have AI review your paper before you submit it. Make sure you ask AI to give you a critical review and make suggestions. Maybe in the future we'd required all submitted papers to be AI-certified.

Y la conclusión es que, por ahora, una revisión hecha solo por un humano, o solo por una IA es peor que si se hace conjuntamente pero, ¿quién sabe qué sucederá en el futuro?

For now, humans alone or AI alone is just not the best way to do conference reviews. For now when you do a review, working with an AI system as an assistant will lead to a stronger review. I suspect in the future, perhaps not that far, AI alone might do a better job.

Por mi parte, he revisado unos cuantos artículos en los últimos meses y todavía no me he atrevido a lanzarlos contra una IA (me puede la prevención de mandar a estas cosas el trabajo de otros) pero creo que, efectivamente, las IAs nos ayudan a realizar parte de nuestro trabajo (alguna prueba estoy haciendo en otros ámbitos) y podemos tener un asistente que no deberíamos despreciar.

Eso sí, como el texto que escribimos aquí es completamente manual, llevamos una temporada flojeando. Siempre que alguien me pregunta por tener una bitácora le digo que tiene que adaptarse a su forma de pensar, trabajar y también integrarse en sus rutinas. Esto último es lo que se me ha roto con los horarios que he tenido este curso y he perdido el ritmo que ya veremos si consigo recuperar.