Què és el Computer Use?
El Computer Use és la capacitat dels models d'IA per controlar directament la interfície de l'ordinador: moure el cursor, fer clic a botons, escriure text, navegar per llocs web i aplicacions d'escriptori. El model «veu» la pantalla (captura de pantalla) i realitza accions com un humà.
Com funciona?
Un model multimodal analitza una captura de pantalla, reconeix elements de la interfície (botons, camps, menús), planifica una seqüència d'accions i emet ordres. Entre cada pas, analitza el nou estat de la pantalla i ajusta el pla.
Aplicacions d'automatització
El Computer Use permet l'automatització de processos en sistemes heretats sense APIs: introducció de dades en aplicacions antigues, navegació per portals de proveïdors, emplenament de formularis administratius. És l'«última milla» de l'automatització — allà on la integració API tradicional és impossible o antieconòmica.