Bitácora de fernand0 Cambiando de aires

Algunos cambios en la forma de contratar con las IAs

Lupa de Lavoisier

En How GenAI is reshaping tech hiring un análisis de cómo está cambiando la contratación en el ámbito de la tecnología a causa de la IA.

Tienen en común con lo que escribíamos la semana pasada, porque habla del sobreesfuerzo que supone detectar a la gente que miente.

Impact on recruitment. More focus on catching “fakers,” recruitment becomes more effort, and more demand for interview questions that LLMs cannot assist efficiently with.

No sólo por las preguntas, que hay que tratar de hacerlas para que no sea fácil que la IA nos las resuelva, sino también en las entrevistas remotas, donde los candidatos pueden recibir ayudas no esperadas. Los puntos principales son los siguientes.

“Faking it” with GenAI tools. Candidates can get away easier with seeking unauthorized LLM help on remote interviews – while interviewers are increasingly suspicious.

También afecta en el tratamiendo de los currículums donde, a lo mejor, los peor escritos son de candidatos mejores, favoreciendo también el historial frente a un currículum muy bien escrito.

Impact on resume screening. Weaker resumes and cover letters, pedigree becoming more important than a well-written resume...

Las entrevistas basadas en trabajo para llevar a casa pueden perder completamente el sentido (si es que lo tenían).

Changing take-homes and coding interviews. Exercises to evaluate candidates beyond their coding skills will likely spread...

También cambiarán las entrevistas: más reuniones en persona, y para el resto entrevistas asistidas por la IA.

Effects on the interview process. Some companies will push for more in-person interviews, while others will integrate LLM usage into the interview process.

Rediseño del proceso.

Redesigning the interview process ...

Integración de la IA en el proceso.

Integrating GenAI into the interview process

Luego desarrolla algunos de ellos, aunque me temo que una parte importante es de pago. El resumen me parece valioso, en cualquier caso.

La IA como ayudante y la sospecha sobre quién ha trabajado

Juan dibuja en nuestra pizarra

Seguimos con la inteligencia artificial (generativa, que es el sabor actual). Seguro que todos estamos más o menos cansados del mantra sobre si la IA nos va a sustituir o no, si va a hacer nuestros negocios mejores o peores y todas esas cosas.

En Universities in the age of AI comentan sobre el artículo ‘I received a first but it felt tainted and undeserved’: inside the university AI cheating crisis sobre algunos aspectos que me han parecido interesantes (pero, ya se sabe, hagamos lo que hagamos estará mal, tampoco pasa nada).

La cuestión comienza con lo que casi todo el mundo hace: usar alguna IA para alguna parte de su trabajo; por supuesto, encontrar usos más que útiles y, tal vez, tener cuidado con los resultados o directamente no utilizarlas para algunas partes que consideramos especialmente críticas.

I use genAI in client work, and also in my academic studies. It’s incredibly useful as a kind of ‘thought partner’ and particularly handy in doing a RAG analysis of essays in relation to assignments. Do I use it to fabricate the answers to assessed questions which I then submit as my own work? No, of course not.

A nivel institucional las aproximaciones son diversas y muchos preferiríamos que fueran positivas, con cuidado.

Different institutions are approaching the issue differently, as you would expect. The answer, I would suggest, is something akin to Cambridge University’s AI-positive approach, outlined in the quoted text below.

Porque utiliar las herramientas de forma adecuada puede ser una experiencia enriquecedora.

It’s been my experience that using genAI in appropriate ways is an incredibly enriching experience.

Pero sin olvidar que lo que hacemos (en la Universidad y en otros sitios) es aprender para nuestro propio beneficio, estudiar con IA puede ser mejor que hacerlo sin ella.

At the end of the day, I’m studying for my own benefit, and I know that studying with genAI is better than studying without it.

Pero también que el objetivo es aprender y hacer cosas mejores, no sustituir nuestro propio trabajo.

Por su parte en el artículo referenciado hablan de cómo muchos estudiantes utilizan IA y se enfrentan a situaciones donde las personas que les evalúan creen que han utilizados estas herramientas más allá de lo debido.

Albert, a 19-year-old undergraduate English student, scanned the content, stunned. He had been accused of using artificial intelligence to complete a piece of assessed work.

Las universidades se encuetran, nos dice, en una escalada de ‘armamento’, incluso utiliando la IA para detectar usos fraudulentos de la IA.

In the struggle to stuff the genie back in the bottle, universities have become locked in an escalating technological arms race, even turning to AI themselves to try to catch misconduct.

Con sus propios problemas, puesto que estas herramientas tienen sus propios sesgos, al señalar como copiadas con mayor frecuencia las entregas de personas que no hablan el idioma (el inglés, en este caso) frente a las que lo dominan.

One study at Stanford found that a number of AI detectors have a bias towards non-English speakers, flagging their work 61% of the time, as opposed to 5% of native English speakers

Y, claro, esto provoca un ambiente de sospecha: cualquier cosa extraña puede ser calificada e investigada como posible mala conducta.

Cheating or not, an atmosphere of suspicion has cast a shadow over campuses.

Problema que se extiende incluso entre los propios estudiantes cuando tienen que colaborar.

Students are also turning on each other. David, an undergraduate student who also requested to remain anonymous, was working on a group project when one of his course mates sent over a suspiciously polished piece of work.

Aunque también existen las políticas favorables hacia la IA, por ejemplo para descubrir conceptos nuevos, colaborador, o apoyo en la gestión del tiempo.

At Cambridge University, for example, appropriate use of generative AI includes using it for an “overview of new concepts”, “as a collaborative coach”, or “supporting time management”.

Avisando, eso sí, de que un exceso de confianza en las herramientas puede llevar a un desarrollo limitado de las capacidades del estudiantado en cuanto a la posibilidad de desarrollar habilidades de pensamiento crítico.

The university warns against over-reliance on these tools, which could limit a student’s ability to develop critical thinking skills.

Aunque esto seguramente nos llevará a modificar los sistemas de evaluación (entrevistas de uno en uno, exámenes orales, …)

They all agreed that a shift to different forms of teaching and assessment – one-to-one tuition, viva voces and the like...

Sin olvidarnos de que la obtención de un título es algo tan mercantilizado (en países donde la financiación depende de las matrículas, pero, como siempre, también en otros modelos) que tampoco se puede ser demasiado exigente, porque los ‘clientes’ eligen otros sitios donde lo son menos.

If anything, the AI cheating crisis has exposed how transactional the process of gaining a degree has become. Higher education is increasingly marketised; universities are cash-strapped, chasing customers at the expense of quality learning.

Mis recomendaciones a mis estudiantes es utilizar las IAs, pero no para que realicen su trabajo, sino para consultarles dudas, pedirles explicaciones, comprender cómo funcionan y qué debilidades tienen, analizar críticamente lo que responden…. Y, sí, claro: también hemos encontrado casos de estudiantes que envían como resultado de su trabajo el que ha hecho una de estas cosas (aunque antes tampoco tenían problema en enviar lo que había hecho alguno de sus compañeros). Hemos descubierto, por ejemplo, como dos estudiantes pueden encontrarse con que su trabajo es copiado aunque ni siquiera se conozcan entre sí: la IA les ha dado a ambos un resultado muy similar (y con defectos que permiten detectar que no lo habían hecho ellos).

Información, datos y sus límites

Mar, tierra y cielo

Para cualquier persona mínimamente interesada e informada debería estar claro lo que son las inteligencias artificiales que tanto nos deslumbran: una forma muy inteligente (e interesante) de sacar partido de toda la información que han sido capaces de ingerir, con un mecanismo para recuperarla de forma que se ajuste a lo que les hemos pedido. Pero esa información viene en forma de datos que alguien ha puesto en algún sitio de alguna manera.

En The Limits of Data C. Thi Nguyen aprovecha para recordarnos que esta aproximación tiene sus propios límites y comienza con el arte.

Nos habla de un experimento para crear arte basándose en los datos de interés/enganche (engagement) de Netflix.

I asked one researcher about the training data. How did they choose to operationalize “good art”? Their reply: they used Netflix data about engagement hours.

Pero claro, nos recuerda, hora de interés no representan calidad artística (o no tienen por qué representarla).

The problem is that engagement hours are not the same as good art.

Y no sólo eso, sino que el arte puede ser importante para nosotros de formas muy diversas: emocionarnos, removernos, enseñarnos, …

There are so many ways that art can be important for us. It can move us, it can teach us, it can shake us to the core.

La conclusión surge por si sola, si entrenamos a la IA para que valore ese interés obtendremos justamente eso: productos que generen ese tipo de atracción.

Cambiando de enfoque, nos habla de las políticas y su lenguaje, que actualmente parecen ser los datos. La mayoría de las administraciones quieren tener éxito en las medidas sobre los datos, para demostrar su eficacia y eficiencia en términos claros, objetivos y fáciles de comprender.

Government agencies, corporations, and other policymakers all want to make decisions based on clear data about positive outcomes. They want to succeed on the metrics—to succeed in clear, objective, and publicly comprehensible terms.

Pero, nuevamente, la conclusión es clara: los datos y sus medidas son incompletos por su propia naturaleza.

But metrics and data are incomplete by their basic nature.

Y hay muchas cuestiones importantes que no salen en los datos (o que son difíciles de medir): podemos medir la salud, por ejemplo, en términos de longevidad, vidas salvadas,…. Pero es más difícil medir la felicidad, comunidad, tradición, belleza, comodidad, …

It’s easier to justify health care decisions in terms of measurable outcomes: increased average longevity or increased numbers of lives saved in emergency room visits, for example. But there are so many important factors that are far harder to measure: happiness, community, tradition, beauty, comfort, and all the oddities that go into “quality of life.”

Pone más ejemplos y da algunas ideas más, pero podemos saltar a la parte donde nos cuenta cómo hay gente estudiando en los datos que recolectamos, cómo lo hacemos para tomar las decisiones.

A small group of scholars have been working on understanding this, mostly in science and technology studies—an interdisciplinary field focused on how science works that conducts studies across philosophy, history, anthropology, sociology, and more. This work offers an understanding of the intrinsic limitations on the process of data collection and on the contents of big datasets.

Porque, nos dice luego, no todos los tipos de conocimiento, ni todas las clases de comprensión pueden considerarse información y datos.

Not all kinds of knowledge, and not all kinds of understanding, can count as information and as data.

Por no hacer esto muy largo, luego llega a la cuestión de que la cuantificación (información, datos, …) trabaja de manera inevitable eliminando información importante del contexto, porque el objetivo es conseguir información portable, que se pueda comparar, examinar,…

Quantification, as used in real-world institutions, works by removing contextually sensitive information. The process of quantification is designed to produce highly portable information,...

Así que ese es el compromiso: recolectamos datos, ganamos en portabilidad y podremos agregar esa información, pero perdemos información.

So here is the first principle of data: collecting data involves a trade-off. We gain portability and aggregability at the price of context-sensitivity and nuance.

Cuando hay información, y se manejan datos hay otro esfuerzo más, que es el de la clasificación. Una cosa es decir cuál es tu raza con tus propias palabras y otra diferente es incluirte en la categoría que alguien ha definido para poder transformar eso en datos, porque un análisis de la descripción que pudiera hacer caada persona de sí misma sería difícil de manejar.

Data collection efforts require classification, which is a second kind of filter. Imagine a US census form where everybody simply wrote into a blank space their racial identity, in their own terms. There would be no way to aggregate this easily. Collectors need to sort information into preprepared buckets to enable aggregation. So there are distinct buckets—white, Black, American Indian, Asian, and, ...

Pero claro, esas clasificaciones las prepara alguien y no tienen por qué describir bien lo que alguien piensa de sí mismo. Y esas categorías no son neutras. No solo eso, también deciden antes de empezar qué recordar y qué olvidar.

Classification systems decide ahead of time what to remember and what to forget.

Y es verdad que podemos anotar esos datos en muchos casos (una casilla para poner información adicional), pero es igual de cierto que esa parte de la información se ‘mueve’ peor que los datos sin más.

ometimes information infrastructures do offer a place for unstructured notes. When I’m entering my grades into the school’s database, I get a little blank box for other notes. The information is collected in some sense, but it doesn’t really move well; it doesn’t aggregate.

El problema de estas limitaciones tiene que ver, ahora, con que justamente esos valores filtrados (y refiltrados) son los que se integran en los sistemas de decisión automatizados.

And now, in the algorithmic era, there’s a new version of this problem: these filtered values will be built so deeply into the infrastructure of our technological environment that we will forget that they were filtered in the first place.

No deberíamos por ello dejar de entrenar y utilizar este tipo de sistemas, puesto que nos han permitido avanzar mucho en muchas ocasiones.

My point isn’t that we should stop using data-based methods entirely. The key features of data-based methodologies—decontextualization, standardization, and impersonality—are precisely what permit the aggregation of vast datasets and are crucial to reap the many rewards of data-based methodologies.

Pero hay que tener en cuenta las limitaciones, puesto que los sistemas construidos de esta forma tendrán sesgos de manera inevitable.

But policymakers and other data users need to keep in mind the limitations baked into the very essence of this powerful tool. Data-based methods are intrinsically biased toward low-context forms of information.

Y, por lo tanto, deberemos preguntarnos ¿quién recolectó los datos? ¿Quién creó las categorías? ¿Qué información se enfatiza y cuál se pierde? ¿A qué intereses sirve el sistema de filtrado?

This suggests at least two responses to the limitations of data. First, when confronted with any large dataset, the user should ask: Who collected it? Who created the system of categories into which the data is sorted? What information does that system emphasize, and what does it leave out? Whose interests are served by that filtration system?

Y no olvidar que no todos los problemas se pueden tratar solo con los datos, así que no deberíamos dejar que estos ahoguen a los otros modelos de comprensión.

Second, policymakers and data users should remember that not everything is as tractable to the methodologies of data. [...] Data is powerful but incomplete; don’t let it entirely drown out other modes of understanding.

Muy interesante lectura, vale la pena leerlo completo y con calma.

¿Qué escuchas en el coche?

Auriculares. Después. Opá yo vi a escuchar un podcast.

Hace tiempo que no comentamos estadísticas (numerología). En In-Car Listening on Mobile Phones nos hablaban de la escucha de dispositivos móviles en el coche.

This week’s insight takes a closer look at in-car listening specifically on mobile devices.

Yo pensaba que sería un número mayor, pero nos dicen que un 29% de las personas de 13 años y más escuchan audio en el coche en un teléfono móvil.

Today that number has nearly doubled, and now 29% of the U.S. population age 13+ who listen to audio in-car do so on a mobile phone.

De ellos, un 53% escucharían música, un 17% podcasts y un 14% música que tienen en el dispositivo. Detrás vendría YouTube (14%) y finalmente audiolibros, con un 4%

The majority of time listening in-car on a phone, 53%, is spent listening to streaming music services. ... ... podcasts at 17%, and owned music such as downloaded digital files at 14%. Listening to music and music videos on YouTube accounts for 9% of listening on a phone in-car. Audiobooks clock in with 4% of the total.

A mi me parece poco, si miro a las personas jóvenes que tengo alrededor y echo de menos en la estadística las redes sociales (la nueva televisión: los reels de Instagram y TikTok). También puede ser que los jóvenes van poco en coche y prefieren (o solo pueden acceder a) otros medios de transporte.

Desde luego, lo que sí que ha pasado ya son los tiempos de escucha única, con un equipo centralizado que era la única posibilidad.

Yo suelo escuchar música (que tengo en un disco portátil). Los podcasts los dejo para pasear.

Internet y la preservación de información

Biblioteca Nacional

No me gusta mucho enlazar artículos que están detrás de un muro (aunque sea registrarse) pero en este caso haré una excepción porque es un tema que me llama la atención. Tengo la teoría de que cuando pase el tiempo veremos que hay etapas sobre las que habrá muy poca documentación: en mi cabeza esa etapa tiene que ver con los momentos de digitalización masiva, donde mucha información ya no se guarda en bibliotecas, archivos,… pero tampoco se conserva adecuadamente (y mucho menos se publica o se pone a disposición de otras personas en la red). Por eso guardo muchas de las cosas que voy leyendo en digital (utilizando sistemas imperfectos, pero que me permiten conservar los textos; por cierto, si alquien quiere este texto también lo tengo).

Y por eso me gustó leer Why the Internet Era Might Be History’s Least-Documented Period donde se hablaba un poco del tema.

Comenzaba hablando de las fotos de su graduación, que estaban en alguna cuenta de algún servicio, en un disco duro roto y por otros diversos lugares….

Last week, I tried to find some photos from my college graduation. Despite being only fifteen years ago, they proved surprisingly elusive – trapped on a defunct Photobucket account, lost to a crashed hard drive, and scattered across social media platforms that no longer exist.

Luego nos recuerda como las empresas deciden cerrar servicios y dejar perder un montón de información (en las próximas semanas ocurrirá con el contenido de Pocket, por ejemplo). Geocities, MySpace, Google+, …

Remember Geocities? Yahoo shut it down in 2009, taking with it millions of early websites – a unique snapshot of early internet culture. The Internet Archive managed to save some pages, but most are gone forever. MySpace lost 12 years of music uploads during a server migration. Google+ vanished, taking with it communities and conversations. Vine? Gone.

Sin embargo, nos recuerda, seguimos pudiendo tener acceso a documentos muy antiguos conservados en diveras bibliotcas, o pinturas de hace mucho tiempo.

We can still read Egyptian hieroglyphics carved 5,000 years ago. We can examine medieval manuscripts, Renaissance paintings, and Victorian photographs. These analog formats have proven remarkably durable.

Es cierto que estos argumentos son trampososo, porque tenemos acceso a unos pocos textos y a unas pocas imágenes, que por muchas y diversas circunstancias se han conservado. ¿Cuántas fotografías analógicas de nuestros padres y abuelos se habrán perdido igualmente que las de la autora?

Luego nos recuerda que los medios digitales son muy frágiles: se rompen los discos duros, los datos se corrompen….

Y la pregunta es evidente, ¿hay alguien conservado estas cosas? La respuesta es, claro, sí y no. El Internet Archive hace un esfuerzo notable (uno de los pocos proyectos a los que dono de vez en cuando algo de dinero). Pero su capacidad llega hasta donde llega, incluso con amenazas legales de vez en cuando.

The Internet Archive does heroic work, but they can only save a fraction of the web and they do so under constant, desperate, grasping legal threat.

También es cierto que uno tenía un libro, o unos documentos y los dejaba en cualquier lado. Con que no tuviera mala suerte, los medios en los que estaban almacenados resistían bastante bien el paso del tiempo. Esto es algo que no sucede tan fácilmente con medios más modernos.

In contrast, a book on a shelf just needs to be kept dry and (preferably) away from fire.

También ocurre que en la actualidad guardamos mucha información en medios diversos que cuando ya no estemos puede desaparecer de manera casi inevitable (los servicios desaparecen, pero aunque no lo hagan, la información está protegida por contraseñas en alguna nube….).

Today, we send ephemeral messages and store photos in the cloud. When we die, our digital presence often dies with us - locked behind passwords or lost to obsolete services.

Las soluciones que propone tienen que ver con aproximaciones híbridas (versiones analógicas de los documentos e imágenes más valiosos), mejorar nuestras habilidades de archivado e instituciones que se encarguen de la preservación a largo plazo.

Perhaps we need a hybrid approach. Critical records could be preserved in both digital and analog formats. Personal archiving could become a emphasized skill, like digital literacy. We might need new institutions dedicated to long-term digital preservation.

Pero sobre todo, nos decía, lo primero es darnos cuenta del problema para poder empezar a actuar.

But first, we need to recognize that the problem actually exists. The digital age promised to make everything accessible, but instead made everything ephemeral. Unless we act, we risk becoming an unexpected dark age - not for lack of records, but for lack of readable ones.

Desde luego, deberíamos invertir más esfuerzo en esto y uno se sorprende al ver como muchas instituciones (para la gente particular es todo más complicado) están ignorando este problema y dejando el tiempo pasar con pérdidas que pueden ser irreparables.