OpenCode, context infinit i la temptació de simplificar

La sensació estranya

Avui he passat una bona estona parlant amb IA sobre IA.

No sobre productes espectaculars ni AGI màgica. Més aviat sobre la sensació rara que deixen moltes eines modernes: enormes, opaques, carregades de context i aparentment eficients... però amb una quantitat bastant salvatge de complexitat amagada.

Tot ha començat revisant OpenCode i la seva manera de treballar amb agents.

El xoc amb el context infinit

La primera sensació ha estat gairebé física: sembla que cada operació torni a enviar una muntanya de text al model.

Prompts. Context. Historial. Instruccions. Més prompts. Més context.

I la pregunta surt sola:

de debò cal enviar tot això cada vegada?

Quan mires alguns prompts interns la sensació és bastant bèstia. Fins i tot coses aparentment simples —com generar el títol d’una conversa— poden acabar implicant crides addicionals al model.

La conclusió provisional és curiosa: gran part de l’ecosistema actual d’agents funciona perquè els models són absurdament bons tolerant caos i redundància.

No perquè el sistema sigui elegant.

Agents, scaffolding i "enganxar coses"

També ha aparegut una altra idea recurrent: moltes eines modernes semblen més una capa de scaffolding enganxada sobre un LLM que no pas una arquitectura especialment neta.

Prompt aquí. Tool allà. Context injectat. RAG. Més middleware. Més memòria. Més JSON.

I malgrat tot...

funciona.

Aquesta és probablement la part més desconcertant.

Com a desenvolupador amb anys fent arquitectura tradicional, hi ha una part del cervell que espera veure estructures més sòlides, més deterministes, més petites.

Però el món actual d’IA sembla haver acceptat una altra realitat:

si el model aguanta el caos, el caos es converteix en arquitectura.

El debat intern: simplificar o seguir la moda

També ha sortit la temptació constant de "fer-ho bé".

Multiidioma. Specs. Agents. Pipelines. Estructures infinites. Editors intel·ligents. Integracions.

I al final apareix una pregunta molt més pràctica:

això ajuda realment a publicar, pensar o construir?

O només estic construint una infraestructura més gran que les ganes reals d’utilitzar-la?

La conclusió d’avui ha estat bastant simple:

prefereixo una bitàcola viva i imperfecta abans que una plataforma perfecta però morta.

La IA com a editor tècnic

Curiosament, una de les idees que sí sembla útil és la més senzilla.

No fer servir IA per substituir l’escriptura.

Fer-la servir per reduir fricció.

Parlar en brut. Explicar caos. Enganxar logs. Renegar una mica. I deixar que el model ordeni el material suficientment bé perquè acabi convertit en una nota tècnica.

No tant "AI writer".

Més aviat:

copiloto editorial per a desenvolupadors cansats.

Alignment, models gegants i realitat

També ha aparegut un altre contrast interessant: la diferència entre la percepció pública de la recerca en IA i la realitat.

Quan llegeixes fòrums d’alignment sembla que tothom tingui un datacenter secret.

Però gran part de la investigació real es fa amb:

APIs;
models open-weight;
GPUs cloud puntuals;
eines locals;
evals;
prompting;
interpretability petita;
i molta experimentació artesanal.

No tot és entrenar un GPT des de zero.

De fet, probablement avui hi ha més espai per entendre sistemes, controlar fluxos i investigar comportaments emergents que no pas per competir en força bruta.

Potser la lliçó és aquesta

Potser el més interessant de tot això és veure com el software està entrant en una etapa estranya.

Durant anys intentàvem reduir complexitat.

Ara sembla que moltes eines modernes simplement la desplacen dins del model.

El prompt es converteix en codi. El context es converteix en runtime. I els errors deixen de ser completament deterministes.

Encara no tinc clar si això és brillant o terrorífic.

Probablement una mica de les dues coses.