¿Qué es Computer Use?
Computer Use es la capacidad de los modelos de IA para controlar directamente la interfaz del ordenador: mover el cursor, hacer clic en botones, escribir texto, navegar por sitios web y aplicaciones de escritorio. El modelo «ve» la pantalla (captura de pantalla) y realiza acciones como un humano.
¿Cómo funciona?
Un modelo multimodal analiza una captura de pantalla, reconoce elementos de la interfaz (botones, campos, menús), planifica una secuencia de acciones y emite comandos. Entre cada paso, analiza el nuevo estado de la pantalla y ajusta el plan.
Aplicaciones de automatización
Computer Use permite la automatización de procesos en sistemas legacy sin APIs: introducción de datos en aplicaciones antiguas, navegación por portales de proveedores, cumplimentación de formularios administrativos. Es la «última milla» de la automatización — donde la integración API tradicional es imposible o antieconómica.