Bitácora de fernand0 Cambiando de aires

La IA y algunos argumentos en contra (respondidos)

Molinillos de café

En el uso de la IA estamos viendo todas las posiciones: defensores y creyentes acérrimos, y también enemigos absolutos, que creen que es una (otra) moda que pasará en algún momento.

En My AI Skeptic Friends Are All Nuts el autor comenta precisamente esto, por un lado jefes obligando a sus empleados a utilizar la IA:

Tech execs are mandating LLM adoption. That’s bad strategy. But I get where they’re coming from.

Y otra gente (muy inteligente, según el texto) anunciando que se trata de otra moda más, como lo fueron los NFTs.

Some of the smartest people I know share a bone-deep belief that AI is a fad — the next iteration of NFT mania.

La posición del autor es que podrían dejar de desarrollarse los LLMs (la IA de la que se habla fundamentalmente hoy en día) y aún así seguirían siendo un resultado importante.

Concreta un poco que está hablando de las arquitecturas de agentes: ya no se trata solo de una ventana de preguntas y respuestas, sino de habla de estos programitas que pueden actuar de manera autónoma sobre nuestro código, ejecutar herramientas comunes e integrarse en el flujo de desarrollo habitual de cualquier desarrollador competente.

People coding with LLMs today use agents. Agents get to poke around your codebase on their own. They author files directly. They run tools. They compile code, run tests, and iterate on the results. They also:

Los LLMs pueden escribir una parte muy importante de la parte más aburrida del código, reducir nuestras consultas en el buscador, …. y no se cansan.

LLMs can write a large fraction of all the tedious code you’ll ever need to write. And most code on most projects is tedious. LLMs drastically reduce the number of things you’ll ever need to Google. They look things up themselves. Most importantly, they don’t get tired; they’re immune to inertia.

No están exentos de problemas, claro, a veces hay que meterse en el código y arreglar cosas. Pero siempre es posible indicar al sistema lo que no nos gusta, e indicarle que lo tiene que arreglar (y, tal vez, darle alguna pista).

But an LLM can be told to go refactor all your unit tests. An agent can occupy itself for hours putzing with your tests in a VM and come back later with a PR. If you listen to me, you’ll know that.

Otra crítica que podemos hacer es que no tendremos ni idea de lo que hace el código pero, nos dice: claro que puedes leer el código, y ver lo que está pasando: no sólo puedes, deberías hacerlo, si lo que generas va a ser utilizado por alguien más que tú.

If you build something with an LLM that people will depend on, read the code. In fact, you’ll probably do more than that. You’ll spend 5-10 minutes knocking it back into your own style. LLMs are showing signs of adapting to local idiom, but we’re not there yet.

¿Habrá alucinaciones? Es posible, pero nuevamente hay herramientas que nos ayudarán a detectarlas y resolverlas.

Agents lint. They compile and run tests. If their LLM invents a new function signature, the agent sees the error. They feed it back to the LLM, which says “oh, right, I totally made that up” and then tries again.

¡El código es malo! Pero tú estás allí para vigilar, igual que harías con un programador joven, y no deberías estar dejando el control

Maybe the current confusion is about who’s doing what work. Today, LLMs do a lot of typing, Googling, test cases †, and edit-compile-test-debug cycles. But even the most Claude-poisoned serious developers in the world still own curation, judgement, guidance, and direction.

Estos sistemas no funcionan bien en mi lenguaje favorito. Entonces la decisión es tuya: uno de los motivos para elegir un lenguaje u otro puede ser lo productivos que lleguemos a ser con ello.

All this is to say: I write some Rust. I like it fine. If LLMs and Rust aren’t working for you, I feel you. But if that’s your whole thing, we’re not having the same argument.

¿Y el oficio? Probablemente estemos hablando de cosas diferentes: la comparación que haces es con un mueble hecho a mano, artesano y de mucha calidad en oposición a lo que necesita para realizar su trabajo (una mesa más o menos corriente, que compra en cualquier sitio y no nos la construimos).

I have a basic wood shop in my basement. I could get a lot of satisfaction from building a table. And, if that table is a workbench or a grill table, sure, I’ll build it. But if I need, like, a table? For people to sit at? In my office? I buy a fucking table.

Los desarrolladores resuelven problemas en un tiempo razonable y con un coste adecuado: no son artesanos ni artistas.

Professional software developers are in the business of solving practical problems for people with code. We are not, in our day jobs, artisans.

El código será mediocre. Esto se dice como si el código no fuera ya mediocre (justo estos días salta la terrible amenaza de un sistema que es capaz de encontrar fallos de seguridad y encuentra muchos: Claude’s Mythos). Llevamos mucho tiempo desarrollando programas bastante mal. O sea, que en el peor caso tendremos algo parecido a lo que ya teníamos.

But I’m getting ahead of myself. It doesn’t matter. If truly mediocre code is all we ever get from LLMs, that’s still huge. It’s that much less mediocre code humans have to write.

Esto no es inteligencia artificial general. Claro que no lo es: resuelve una serie de problemas y hay otros en los que no podemos ni pensar.

Things either work or they don’t, no matter what Jensen Huang has to say about it.

Destruye empleo. Y eso es exactamente lo que hace la sociedad de hoy en día: optimizar, producir las mismas cosas (o más) con menos esfuerzo…

LLMs really might displace many software developers. That’s not a high horse we get to ride. Our jobs are just as much in tech’s line of fire as everybody else’s have been for the last 3 decades. We’re not East Coast dockworkers; we won’t stop progress on our own.

Esto es copiar. Pero justamente eso es lo que hacen la mayoría de los profesionales, no solo eso: se oponen a cualquier tipo de protección que pudiera evitar el problema, en código, pero también en el arte y en el entretenimiento.

The great cultural project of developers has been opposing any protection that might inconvenience a monetizable media-sharing site. When they fail at policy, they route around it with coercion. They stand up global-scale piracy networks and sneer at anybody who so much as tries to preserve a new-release window for a TV show.

Estoy harto de oir hablar de ello. Y vas a seguir oyendo: todavía podemos ver nuevos usos, mejores características y más atención.

But AI is also incredibly — a word I use advisedly — important. It’s getting the same kind of attention that smart phones got in 2008, and not as much as the Internet got. That seems about right.

Nombrando amenazas: Microsoft y la meteorología

La niebla en Zaragoza, es una pasta pegajosa

Alguna vez hemos hablado de los nombres con que identificamos las cosas y, a veces, las consecuencias que eso tiene. Por eso me hizo gracia leer How Microsoft names threat actors.

Tienen una clasificación para los nombres de los agentes que suponen una amenaza que utiliza la temática del tiempo meteorológico (weather).

Microsoft uses a naming taxonomy for threat actors aligned with the theme of weather.

Para los diferentes tipos de agentes utilizan cinco grupos:

  • Estados nación
  • Agentes con motivación económica
  • Actores ofensivos privados
  • Operaciones de influencia
  • Grupos en desarrollo.

De esta manera, asignan nombres a cada uno de los actores o agentes y la combinación de varios de ellos nos da información de su tipología, origen, etc…

Por ejemplo, tifón indicaría que el origen es China (sucesos meteorológicos representan países o regiones) y tempestad indicaría que se trata de un actor movido por objetivos financieros (en este caso, el nombre representa una motivación).

In this taxonomy, a weather event or family name represents one of the above categories. For nation-state actors, we assigned a family name to a country/region of origin tied to attribution. For example, Typhoon indicates origin or attribution to China. For other actors, the family name represents a motivation. For example, Tempest indicates financially motivated actors.

Como curiosidad, el nombre asignado a España es derecho que, en meteorología, y según la Wikipedia es un fenómeno meteorológico al estilo de una tormenta de viento en línea recta, extensa y de larga duración. China, como decíamos sería tifón, y Alemania un temporal. Ninguno de nuestros vecinos tiene nombre específico.

Los grupos en desarrollo serían tormentas y las operaciones de influencia serían inundaciones.

Curioso.

Por cierto, como la imagen representa una escena con niebla estaríamos hablando de Gran Bretaña, claro.

Un poco de soberanía tecnológica: ejecuta una IA en tu PC

Desde que descubrí la cosa vengo haciendo pruebas con IAs locales: esto es, inteligencias artificiales de las que llaman abiertas open que, esencialmente, permiten descargar un modelo y ejecutarlo en nuestro propio sistema. Las ventajas son claras: adiós a la contabilidad de tokens y privacidad, fundamentalmente. Los inconvenientes también: raramente tendremos un sistema tan potente como necesitaríamos, los modelos ocupan espacio (desde muchos megas, a bastante gigas), …

Para darle más emoción yo lo tengo en una Raspberry Pi con 4 procesadores y 8Gb de RAM (los modelos tienen que ‘caber’ en memoria) pero para algunas tareas puedo esperar la respuesta (minutos, típicamente) y no expongo la información a ningún servicio externo.

Por eso guardé Run Your Own AI que explica como hacerlo y que recomiendo a cualquiera que quiera probar.

El siguiente paso en esta ‘soberanía’ tecnológica sería entrenar nuestros propios modelos, pero eso es algo que todavía no hemos mirado con detalle y que suena mucho más complicado.

Mi elección para estas pruebas ha sido:

Y he probado algunos modelos. Los que mejor resultado me han dado:

Se pueden ver algunas pruebas que he ido haciendo en este hilo de X:

Como dice allí mismo una parte está dedicada a sistemas de Apple, pero se puede hacer en sistemas que no lo sean:

On a PC, skip the steps about MLX and use Ollama to download a model. Then install the llm-ollama plugin instead of llm-mlx.

Como dice el autor, otra de las fuentes de inspiración ha sido Simon Willison y todos esperamos el día en que podamos correr uno de estos LLMs en nuestro teléfono móvil.

Fatiga regulatoria, riesgos y consecuencias

Obligación estadística

Cuando hablamos de seguridad (aunque también si hablamos solo de llevar adelante nuestro trabajo) aparecen los aspectos de las regulaciones: muchas veces nos parecen un inconveniente y un freno, pero la realidad es que a veces hay que hacer normas para que determinadas operaciones (que parecen de lógica) se lleven adelante: las operaciones son lo importante, y hacer las cosas ‘bien’ siempre es algo que puede esperar.

Otra coas es el exceso de regulaciones y, claro, el exceso de tareas asociadas. En Compliance Fatigue Is Real—And It’s Putting Cybersecurity at Risk se habla del tema como un riesgo más.

Se basa en un estudio de una consultora (Bridewell Consulting) que afirma que el 44% de las empresas financieras en Gran Bretaña señalan las tareas relacionadas con el cumplimiento normativo (compliance) como uno de los principales retos para la ciberseguridad. No solo por la propia, sino por las obligaciones relacionadas con su operación en diferentes países del mundo.

New research by Bridewell Consulting revealed that 44% of all financial services institutions in the UK listed compliance as the top cybersecurity challenge their organizations currently face. And it may be no surprise as many financial institutions do business in other countries, making them subject to not only UK-based cybersecurity law but those established around the world.

Cuando el cumplimiento se convierte en una tarea más, y es de las importantes, puede ocurrir que otras se dejen de lado. Por ejemplo, gestión de vulnerabilidades, actualización de sistemas y reducción en los equipos de respuesta a incidentes.

When inundated with a lot of Governance, Risk, and Compliance (GRC) documentation, it can all start to blur. Compliance fatigue is the result of such overwhelm and can ironically jeopardize security measures at the helm.

Luego lista una serie de regulaciones de Gran Bretaña que incluye cinco de estas normas y que no es completa.

This list is not comprehensive; other frameworks like NIS2, AML/CTF regulations, and more widely apply as well.

Interesante.

Lo que decía arriba de la necesidad de regulaciones no es solo mi idea. Un experto como Bruce Schneier ya lleva tiempo diciéndolo en artículos como Why Was SolarWinds So Vulnerable to a Hack? donde habla de incentivos, asimetría de la información y otras cuestiones que muchas veces se pasan por alto.

Así que: desregular no, regular sí, pero con cuidado.

En Buenos Días Aragón hablando de reconocimiento automático de contenido (ACR)

Parece que en EEUU ha habido una demanda contra algunos fabricantes de aparatos de televisión sobre el espionaje que hacen estos aparatos de nuestros hábitos de uso Texas sues TV makers for taking screenshots of what people watch . En particular, por el uso del ACR (reconocimiento automático del contenido) que saca imágenes de nuestro aparato de TV, extrae algunas características relevantes y contrasta esos datos con los de su base de datos, para saber qué es lo que estamos viendo.

Para hablar un poco de este tema me llamaron de Aragón TV y el resultado puede verse (por unos días) en BUENOS DÍAS ARAGÓN - 28/01/2026 08:01, alrededor del minuto 41. Luego salió también una parte en las noticias (al menos por la noche), y puede verse en ARAGÓN NOTICIAS 2 - 28/01/2026 20:29 , alrededor del minuto 35,20.

Hablamos del sistema en sí que, efectivamente, elige fragmentos de lo que vemos y los envía para identificar lo que vemos (con fines publicitarios, perfilado, recomendaciones …). Una televisión moderna se parece mucho a un teléfono móvil porque es un ordenador donde se pueden instalar aplicaciones, tiene micrófono, algunas veces cámara… La ley obliga a que los fabricantes incluyan mecanismos para evitar ese seguimiento, y los fabricantes deberían respetarlo. No debemos olvidar que estos aparatos tienen características avanzadas: este sistema en sí no parece la puerta de entrada a ningún ataque, pero los ataques con sistemas informáticos siempre son posibles.

Publicado originalmente en En Buenos Días Aragón hablando de reconocimiento automático de contenido (ACR).

Añadido para este sitio: me llama la atención cómo una industria que está en todos los hogares, con poca discusión, haya llevado una adaptación tan mala a los tiempos. Aparatos lentos, incómodos, difíciles de configurar y encima con características que mucha gente no aprecia de ninguna manera.