Bitácora de fernand0 Cambiando de aires

Creatividad y reseñas de internet. No todo está perdido.

Biblioteca

Me gustó leer A Portrait of the Artist as an Amazon Reviewer porque en estos tiempos de pura búsqueda del beneficio y la obtención der resultados nos habla de Kevin Killian, que publicó entre los años 2003 y 2019 una buena cantidad de revisiones (más de 2400) pero con un enfoque un poco diferente del habitual.

Between 2003 and 2019, Kevin Killian published almost twenty-four hundred reviews on the site. Can they be considered literature?

Y no es porque haya evaluado productos raros o buscando la notoriedad: revisaba DVDs, biografías literarias, pero también productos de baño….

The products he evaluated included DVDs of classic twentieth-century cinema, literary biographies, and experimental poetry collections—but also toiletries, Halloween costumes, and a chestnut tree.

¿La diferencia? Un tono exhuberante, incluso melodramático (nos dicen) pero que van más allá de la parodia.

His reviews, usually five stars, are often exaggeratedly gushing, even melodramatic, but they are not mere parodies.

Aunque hemos dicho que no buscaba notoriedad, lo cierto es que llegó a publicar un libro con una selección, Selected Amazon Reviews que tiene, en este momento, 18 reseñas y una puntuación de 4.8.

Luego nos cuentan la vida de este personaje y su comienzo como revisor, después de un ataque al corazón en el año 2003. La medicación le impediría seguir con su carrera de escritor.

This productive period was interrupted when, in 2003, Killian had a heart attack. His medication regimen destroyed his will to write.

Aunque la sugerencia de otra escritora, Dodie Bellamy, le inició en la tarea de mantener su arte de escritor a través de reseñas breves.

Bellamy suggested that brief Amazon reviews might provide a gentle reëntry. Killian began tentatively, punching single words into the site’s review form.

Vale la pena leer el artículo para hacerse una idea del estilo de las reseñas de este personaje, pero no las reproduciremos aquí.

Y, como decíamos arriba, no se puede reducir todo a una parodia o burla, sino que parece un interés genuino en la plataforma, por su uso y como herramienta de publicación.

Killian, like so many of us on social media, seemed to love his platform of choice—the Amazon review section—despite its complicity in a techno-capitalist system that he abhorred.

La plataforma ha evolucionado, nos dicen, y ahora la IA (¿creían que no hablaríamos de ella aquí?) elabora resúmenes a partir de las reseñas de los usuarios, domesticándolas en cierto modo.

Each product page now features an A.I.-generated summary of the existing customer reviews, smoothing out the heterogeneity of human taste into an algorithmic average.

Aunque esto tiene sus propias consecuencias, puesto que hay gente tratando de scar partido de esto, con timadores llenando las páginas de reseñas y haciendo que pierdan buena parte de su valor.

Now scammers are flooding the Web site with A.I.-generated listings, and then using bots to generate favorable reviews to artificially boost them.

El fallecimiento de Killian hizo que dejara de publicar, claro. Y también que se perdiera los momentos de gloria que proporcionan estas herramientas automatizasdas.

Un ejemplo, sin traducir.

“As an AI language model, I don’t have a body,” one recent review for a pair of maternity shorts reads. “But I understand the importance of comfortable clothing during pregnancy.”

Seguro que dentro de algún tiempo descubriremos otros usos creativos de estas nuevas herramientas y gente ingeniosa.

Tengo que reconocer que sin considerarme escritor ni de lejos, he sucumbido en alguna ocasión a escribir una reseña en este estilo (no sé si mi subconsciente recordó esta historia, o fue la insistencia de los mapas de Google en invitarme a escribir reseseñas sobre cosas un poco absurdas).

Cuando la música se convierte en una forma de ganar dinero se buscan medios para conseguirla más barata

Banda

No es la primera vez que alguien engaña a la industria musical o al público (incluso cuando había editores y muchas más posibilidades de control). Hace unos meses podíamos leer The Ghosts in the Machine donde se cuenta el caso de algunos llamados artistas fantasmas que estarían llenando las listas del servicio musical Spotify, incluso con la especulación de que fuera la propia empresa la promotora. El artículo está detrás de un muro, si alguien lo quiere …

Some even speculated that Spotify might be making the tracks itself. At a time when playlists created by the company were becoming crucial sources of revenue for independent artists and labels, this was a troubling allegation.

Aunque Spotify negaba tener nada que ver en ello, lo cierto es que está ocurriendo: artistas y listas con miles de canciones (incluso millones) incluso con su biografía como si realmente existieran de los que no se puede averiguar nada.

One of the tracks had more than three million streams; at the time of this writing, the number has surpassed four million. Larsson was amused by the elaborate artist bio, which he read aloud.

Lo cierto es que parece que Spotify sí que tiene interés en estas cosas: un equipo dedicado a rebajar sus costes, en donde encajarían este tipo de producciones.

Spotify, I discovered, not only has partnerships with a web of production companies, which, as one former employee put it, provide Spotify with "music we benefited from financially," but also a team of employees working to seed these tracks on playlists across the platform.

Sería lo que llaman, el contenido perfectamente ajustado.

The programa's name: Perfect Fit Content (PFC). The PFC program raises troubling prospects for working musicians.

Y, por otro lado, ¿esto es un engaño? Parece que mucha gente acude al servicio sin buscar artistas ni músicas específicos: simplemente quieren tener una banda sonora para su día a día (música de fondo).

... many users were not coming to the platform to listen to specific artists or albums; they just needed something to serve as a soundtrack for their days, like a study playlist or maybe a dinner soundtrack.

Pero sí que es verdad que esto afecta a los productores tradicionales, algunos de los cuales se beneficiaban de esta búsqueda de música de fondo, como jazz, clásica, ambiente, …

These higher-ups were well versed in the business of major-label hitmaking, but not necessarily in the cultures or histories of genres like jazz, classical, ambient, and lo-fi hip-hop' music that tended to do well on playlists for relaxing, sleeping, or focusing.

Incluso algunos músicos también habrían empezado a colaborar en este tipo de apuestas, dedicándose a crear música para este tipo de intereses.

But our conversation soon turned to something else: his most recent side gig, making jazz for a company that was described, in one internal Spotify document, as one of its "high margin (PFC) licensors."

Esencialmente, haciendo música anónima que se distribuiría según este modelo.

He had signed a one-year contract to make anonymous tracks for a production company that would distribute them on Spotify.

En definitiva, viejos profesionales encontrando nuevas formas de ganarse la vida.

He was just someone who, like other working musicians today, was trying to cobble together a living.

Nada impedirá, claro, que aparezca la música generada por IA y que cumpla también este papel.

Spotify, for its part, has been open about its willingness to allow AI music on the platform.

A mi me gusta la música, y suelo poner música de fondo. Pero pongo cosas que quiero escuchar por un motivo u otro, aunque no le preste toda la atención que merece. No todo el mundo hace lo mismo. Tampoco es nueva la idea de la música de fondo (música de ascensor) o de relleno y la historia de artistas que se han dedicado a ella a lo largo del tiempo existe y se puede investigar.

Algunos cambios en la forma de contratar con las IAs

Lupa de Lavoisier

En How GenAI is reshaping tech hiring un análisis de cómo está cambiando la contratación en el ámbito de la tecnología a causa de la IA.

Tienen en común con lo que escribíamos la semana pasada, porque habla del sobreesfuerzo que supone detectar a la gente que miente.

Impact on recruitment. More focus on catching “fakers,” recruitment becomes more effort, and more demand for interview questions that LLMs cannot assist efficiently with.

No sólo por las preguntas, que hay que tratar de hacerlas para que no sea fácil que la IA nos las resuelva, sino también en las entrevistas remotas, donde los candidatos pueden recibir ayudas no esperadas. Los puntos principales son los siguientes.

“Faking it” with GenAI tools. Candidates can get away easier with seeking unauthorized LLM help on remote interviews – while interviewers are increasingly suspicious.

También afecta en el tratamiendo de los currículums donde, a lo mejor, los peor escritos son de candidatos mejores, favoreciendo también el historial frente a un currículum muy bien escrito.

Impact on resume screening. Weaker resumes and cover letters, pedigree becoming more important than a well-written resume...

Las entrevistas basadas en trabajo para llevar a casa pueden perder completamente el sentido (si es que lo tenían).

Changing take-homes and coding interviews. Exercises to evaluate candidates beyond their coding skills will likely spread...

También cambiarán las entrevistas: más reuniones en persona, y para el resto entrevistas asistidas por la IA.

Effects on the interview process. Some companies will push for more in-person interviews, while others will integrate LLM usage into the interview process.

Rediseño del proceso.

Redesigning the interview process ...

Integración de la IA en el proceso.

Integrating GenAI into the interview process

Luego desarrolla algunos de ellos, aunque me temo que una parte importante es de pago. El resumen me parece valioso, en cualquier caso.

La IA como ayudante y la sospecha sobre quién ha trabajado

Juan dibuja en nuestra pizarra

Seguimos con la inteligencia artificial (generativa, que es el sabor actual). Seguro que todos estamos más o menos cansados del mantra sobre si la IA nos va a sustituir o no, si va a hacer nuestros negocios mejores o peores y todas esas cosas.

En Universities in the age of AI comentan sobre el artículo ‘I received a first but it felt tainted and undeserved’: inside the university AI cheating crisis sobre algunos aspectos que me han parecido interesantes (pero, ya se sabe, hagamos lo que hagamos estará mal, tampoco pasa nada).

La cuestión comienza con lo que casi todo el mundo hace: usar alguna IA para alguna parte de su trabajo; por supuesto, encontrar usos más que útiles y, tal vez, tener cuidado con los resultados o directamente no utilizarlas para algunas partes que consideramos especialmente críticas.

I use genAI in client work, and also in my academic studies. It’s incredibly useful as a kind of ‘thought partner’ and particularly handy in doing a RAG analysis of essays in relation to assignments. Do I use it to fabricate the answers to assessed questions which I then submit as my own work? No, of course not.

A nivel institucional las aproximaciones son diversas y muchos preferiríamos que fueran positivas, con cuidado.

Different institutions are approaching the issue differently, as you would expect. The answer, I would suggest, is something akin to Cambridge University’s AI-positive approach, outlined in the quoted text below.

Porque utiliar las herramientas de forma adecuada puede ser una experiencia enriquecedora.

It’s been my experience that using genAI in appropriate ways is an incredibly enriching experience.

Pero sin olvidar que lo que hacemos (en la Universidad y en otros sitios) es aprender para nuestro propio beneficio, estudiar con IA puede ser mejor que hacerlo sin ella.

At the end of the day, I’m studying for my own benefit, and I know that studying with genAI is better than studying without it.

Pero también que el objetivo es aprender y hacer cosas mejores, no sustituir nuestro propio trabajo.

Por su parte en el artículo referenciado hablan de cómo muchos estudiantes utilizan IA y se enfrentan a situaciones donde las personas que les evalúan creen que han utilizados estas herramientas más allá de lo debido.

Albert, a 19-year-old undergraduate English student, scanned the content, stunned. He had been accused of using artificial intelligence to complete a piece of assessed work.

Las universidades se encuetran, nos dice, en una escalada de ‘armamento’, incluso utiliando la IA para detectar usos fraudulentos de la IA.

In the struggle to stuff the genie back in the bottle, universities have become locked in an escalating technological arms race, even turning to AI themselves to try to catch misconduct.

Con sus propios problemas, puesto que estas herramientas tienen sus propios sesgos, al señalar como copiadas con mayor frecuencia las entregas de personas que no hablan el idioma (el inglés, en este caso) frente a las que lo dominan.

One study at Stanford found that a number of AI detectors have a bias towards non-English speakers, flagging their work 61% of the time, as opposed to 5% of native English speakers

Y, claro, esto provoca un ambiente de sospecha: cualquier cosa extraña puede ser calificada e investigada como posible mala conducta.

Cheating or not, an atmosphere of suspicion has cast a shadow over campuses.

Problema que se extiende incluso entre los propios estudiantes cuando tienen que colaborar.

Students are also turning on each other. David, an undergraduate student who also requested to remain anonymous, was working on a group project when one of his course mates sent over a suspiciously polished piece of work.

Aunque también existen las políticas favorables hacia la IA, por ejemplo para descubrir conceptos nuevos, colaborador, o apoyo en la gestión del tiempo.

At Cambridge University, for example, appropriate use of generative AI includes using it for an “overview of new concepts”, “as a collaborative coach”, or “supporting time management”.

Avisando, eso sí, de que un exceso de confianza en las herramientas puede llevar a un desarrollo limitado de las capacidades del estudiantado en cuanto a la posibilidad de desarrollar habilidades de pensamiento crítico.

The university warns against over-reliance on these tools, which could limit a student’s ability to develop critical thinking skills.

Aunque esto seguramente nos llevará a modificar los sistemas de evaluación (entrevistas de uno en uno, exámenes orales, …)

They all agreed that a shift to different forms of teaching and assessment – one-to-one tuition, viva voces and the like...

Sin olvidarnos de que la obtención de un título es algo tan mercantilizado (en países donde la financiación depende de las matrículas, pero, como siempre, también en otros modelos) que tampoco se puede ser demasiado exigente, porque los ‘clientes’ eligen otros sitios donde lo son menos.

If anything, the AI cheating crisis has exposed how transactional the process of gaining a degree has become. Higher education is increasingly marketised; universities are cash-strapped, chasing customers at the expense of quality learning.

Mis recomendaciones a mis estudiantes es utilizar las IAs, pero no para que realicen su trabajo, sino para consultarles dudas, pedirles explicaciones, comprender cómo funcionan y qué debilidades tienen, analizar críticamente lo que responden…. Y, sí, claro: también hemos encontrado casos de estudiantes que envían como resultado de su trabajo el que ha hecho una de estas cosas (aunque antes tampoco tenían problema en enviar lo que había hecho alguno de sus compañeros). Hemos descubierto, por ejemplo, como dos estudiantes pueden encontrarse con que su trabajo es copiado aunque ni siquiera se conozcan entre sí: la IA les ha dado a ambos un resultado muy similar (y con defectos que permiten detectar que no lo habían hecho ellos).

Información, datos y sus límites

Mar, tierra y cielo

Para cualquier persona mínimamente interesada e informada debería estar claro lo que son las inteligencias artificiales que tanto nos deslumbran: una forma muy inteligente (e interesante) de sacar partido de toda la información que han sido capaces de ingerir, con un mecanismo para recuperarla de forma que se ajuste a lo que les hemos pedido. Pero esa información viene en forma de datos que alguien ha puesto en algún sitio de alguna manera.

En The Limits of Data C. Thi Nguyen aprovecha para recordarnos que esta aproximación tiene sus propios límites y comienza con el arte.

Nos habla de un experimento para crear arte basándose en los datos de interés/enganche (engagement) de Netflix.

I asked one researcher about the training data. How did they choose to operationalize “good art”? Their reply: they used Netflix data about engagement hours.

Pero claro, nos recuerda, hora de interés no representan calidad artística (o no tienen por qué representarla).

The problem is that engagement hours are not the same as good art.

Y no sólo eso, sino que el arte puede ser importante para nosotros de formas muy diversas: emocionarnos, removernos, enseñarnos, …

There are so many ways that art can be important for us. It can move us, it can teach us, it can shake us to the core.

La conclusión surge por si sola, si entrenamos a la IA para que valore ese interés obtendremos justamente eso: productos que generen ese tipo de atracción.

Cambiando de enfoque, nos habla de las políticas y su lenguaje, que actualmente parecen ser los datos. La mayoría de las administraciones quieren tener éxito en las medidas sobre los datos, para demostrar su eficacia y eficiencia en términos claros, objetivos y fáciles de comprender.

Government agencies, corporations, and other policymakers all want to make decisions based on clear data about positive outcomes. They want to succeed on the metrics—to succeed in clear, objective, and publicly comprehensible terms.

Pero, nuevamente, la conclusión es clara: los datos y sus medidas son incompletos por su propia naturaleza.

But metrics and data are incomplete by their basic nature.

Y hay muchas cuestiones importantes que no salen en los datos (o que son difíciles de medir): podemos medir la salud, por ejemplo, en términos de longevidad, vidas salvadas,…. Pero es más difícil medir la felicidad, comunidad, tradición, belleza, comodidad, …

It’s easier to justify health care decisions in terms of measurable outcomes: increased average longevity or increased numbers of lives saved in emergency room visits, for example. But there are so many important factors that are far harder to measure: happiness, community, tradition, beauty, comfort, and all the oddities that go into “quality of life.”

Pone más ejemplos y da algunas ideas más, pero podemos saltar a la parte donde nos cuenta cómo hay gente estudiando en los datos que recolectamos, cómo lo hacemos para tomar las decisiones.

A small group of scholars have been working on understanding this, mostly in science and technology studies—an interdisciplinary field focused on how science works that conducts studies across philosophy, history, anthropology, sociology, and more. This work offers an understanding of the intrinsic limitations on the process of data collection and on the contents of big datasets.

Porque, nos dice luego, no todos los tipos de conocimiento, ni todas las clases de comprensión pueden considerarse información y datos.

Not all kinds of knowledge, and not all kinds of understanding, can count as information and as data.

Por no hacer esto muy largo, luego llega a la cuestión de que la cuantificación (información, datos, …) trabaja de manera inevitable eliminando información importante del contexto, porque el objetivo es conseguir información portable, que se pueda comparar, examinar,…

Quantification, as used in real-world institutions, works by removing contextually sensitive information. The process of quantification is designed to produce highly portable information,...

Así que ese es el compromiso: recolectamos datos, ganamos en portabilidad y podremos agregar esa información, pero perdemos información.

So here is the first principle of data: collecting data involves a trade-off. We gain portability and aggregability at the price of context-sensitivity and nuance.

Cuando hay información, y se manejan datos hay otro esfuerzo más, que es el de la clasificación. Una cosa es decir cuál es tu raza con tus propias palabras y otra diferente es incluirte en la categoría que alguien ha definido para poder transformar eso en datos, porque un análisis de la descripción que pudiera hacer caada persona de sí misma sería difícil de manejar.

Data collection efforts require classification, which is a second kind of filter. Imagine a US census form where everybody simply wrote into a blank space their racial identity, in their own terms. There would be no way to aggregate this easily. Collectors need to sort information into preprepared buckets to enable aggregation. So there are distinct buckets—white, Black, American Indian, Asian, and, ...

Pero claro, esas clasificaciones las prepara alguien y no tienen por qué describir bien lo que alguien piensa de sí mismo. Y esas categorías no son neutras. No solo eso, también deciden antes de empezar qué recordar y qué olvidar.

Classification systems decide ahead of time what to remember and what to forget.

Y es verdad que podemos anotar esos datos en muchos casos (una casilla para poner información adicional), pero es igual de cierto que esa parte de la información se ‘mueve’ peor que los datos sin más.

ometimes information infrastructures do offer a place for unstructured notes. When I’m entering my grades into the school’s database, I get a little blank box for other notes. The information is collected in some sense, but it doesn’t really move well; it doesn’t aggregate.

El problema de estas limitaciones tiene que ver, ahora, con que justamente esos valores filtrados (y refiltrados) son los que se integran en los sistemas de decisión automatizados.

And now, in the algorithmic era, there’s a new version of this problem: these filtered values will be built so deeply into the infrastructure of our technological environment that we will forget that they were filtered in the first place.

No deberíamos por ello dejar de entrenar y utilizar este tipo de sistemas, puesto que nos han permitido avanzar mucho en muchas ocasiones.

My point isn’t that we should stop using data-based methods entirely. The key features of data-based methodologies—decontextualization, standardization, and impersonality—are precisely what permit the aggregation of vast datasets and are crucial to reap the many rewards of data-based methodologies.

Pero hay que tener en cuenta las limitaciones, puesto que los sistemas construidos de esta forma tendrán sesgos de manera inevitable.

But policymakers and other data users need to keep in mind the limitations baked into the very essence of this powerful tool. Data-based methods are intrinsically biased toward low-context forms of information.

Y, por lo tanto, deberemos preguntarnos ¿quién recolectó los datos? ¿Quién creó las categorías? ¿Qué información se enfatiza y cuál se pierde? ¿A qué intereses sirve el sistema de filtrado?

This suggests at least two responses to the limitations of data. First, when confronted with any large dataset, the user should ask: Who collected it? Who created the system of categories into which the data is sorted? What information does that system emphasize, and what does it leave out? Whose interests are served by that filtration system?

Y no olvidar que no todos los problemas se pueden tratar solo con los datos, así que no deberíamos dejar que estos ahoguen a los otros modelos de comprensión.

Second, policymakers and data users should remember that not everything is as tractable to the methodologies of data. [...] Data is powerful but incomplete; don’t let it entirely drown out other modes of understanding.

Muy interesante lectura, vale la pena leerlo completo y con calma.