Aprendizaje Zero-Shot

¿Qué es el aprendizaje zero-shot?

El aprendizaje zero-shot se refiere a la capacidad de un modelo de IA para abordar tareas para las que no ha visto ejemplos específicos durante el entrenamiento. El modelo transfiere conocimiento general a nuevas tareas mediante la comprensión semántica de las descripciones de tareas, la analogía con tareas relacionadas y la capacidad de seguir instrucciones en lenguaje natural.

Zero-Shot vs. Few-Shot

El prompting zero-shot proporciona al modelo solo la descripción de la tarea sin ejemplos. El prompting few-shot proporciona de 1 a 5 ejemplos de demostración en el prompt. One-shot proporciona exactamente un ejemplo. Zero-shot es más eficiente (menos tokens), mientras que few-shot a menudo ofrece resultados más precisos. Para muchas tareas, los LLMs modernos tienen suficiente conocimiento general para un rendimiento zero-shot a nivel humano.

Aplicaciones empresariales

Las capacidades zero-shot son fundamentales para aplicaciones empresariales flexibles que deben adaptarse rápidamente a nuevos requisitos. Las tareas de clasificación (sentimiento, categoría, intención), la extracción de información y las salidas estructuradas a menudo pueden resolverse sin datos de entrenamiento específicos de la tarea mediante prompts zero-shot bien formulados. Esto acelera considerablemente el desarrollo de prototipos y reduce la necesidad de datos para los proyectos de IA.

¿Qué es el aprendizaje zero-shot?

Zero-Shot vs. Few-Shot

Aplicaciones empresariales

Términos relacionados