Enginyeria de prompts per a aplicacions enterprise — plantilles, guardrails i avaluació

Per què l'enginyeria de prompts és enginyeria

En el primer contacte amb models de llenguatge, el prompting sembla una conversa — escrius, el model respon. En producció, aquesta intuïció resulta engañosa. Els prompts són codi: tenen versions, dependències, proves i documentació. El canvi d'una sola frase en un prompt pot canviar radicalment el comportament del sistema per a subconjunts de dades que no van ser considerats en les proves manuals. Sense un enfocament d'enginyeria, els sistemes d'IA es tornen imprevisibles en producció.

Anatomia d'un prompt enterprise

Un prompt de sistema madur per a aplicacions enterprise consta de diverses capes:

Definició de rol i context — qui és el model en el context donat, quins són els límits de les seves competències i quan ha de refusar respondre.
Instruccions de comportament — estil de comunicació, format de resposta, manera de tractar consultes ambigues o potencialment perjudicials.
Context de domini — definicions específiques, procediments i terminologia de l'organització que el model no coneix de l'entrenament.
Exemples (few-shot) — parells representatius pregunta-resposta que defineixen el comportament esperat en casos difícils.
Instruccions de format — estructura de la resposta, longitud, ús de llistes i encapçalaments.

Plantilles amb control de versions

Els prompts s'han d'emmagatzemar en un sistema de control de versions de la mateixa manera que el codi. Això implica un repositori git, revisions de canvis (code review), etiquetes de versió i CHANGELOG. Un canvi de prompt en producció sense traçabilitat és un canvi de codi productiu sense documentació — en un entorn enterprise és inadmissible.

Per a sistemes regulats, on el prompt influeix en decisions que afecten persones, el control de versions es converteix en un requisit de compliance: el regulador pot preguntar quin prompt es va utilitzar en una decisió concreta de fa sis mesos.

Guardrails — proteccions contra comportaments no desitjats

Els guardrails són mecanismes que limiten l'àmbit d'actuació del model. En el context enterprise, les categories clau són:

Temàtics — un model d'assistent legal no hauria d'emetre recomanacions mèdiques.
Formals — la resposta sempre ha d'incloure un avís legal o informació sobre limitacions.
De privacitat — detecció automàtica i redacció de dades personals en respostes generades a partir de documents interns.
De coherència factual — verificació que les afirmacions del model es puguin atribuir a fragments concrets dels documents font.

Avaluació sistemàtica

Les proves manuals de prompts no escalen. L'avaluació sistemàtica requereix un conjunt de proves compost per centenars o milers de parells pregunta-resposta esperada, que cobreixin els casos d'ús típics, escenaris límit i intents de circumval·lar els guardrails. Les mètriques automàtiques — rellevància de la cerca, fidelitat factual, compliment del format — complementen les avaluacions humanes periòdiques per als casos més difícils.

A/B testing de prompts

En sistemes amb gran trànsit, és possible testar en paral·lel variants de prompts en subconjunts d'usuaris i comparar els resultats segons mètriques de negoci definides. Aquest enfocament trasllada la metodologia d'optimització coneguda del màrqueting digital a l'enginyeria de sistemes d'IA i permet un perfeccionament iteratiu dels prompts basat en dades, no en la intuïció.