Volver al glosario Tecnología

LLM Routing

Dirección inteligente de consultas al modelo de lenguaje adecuado según la complejidad, el coste y la calidad de respuesta requerida.

¿Qué es el LLM Routing?

El LLM Routing es la técnica de dirigir automáticamente las consultas al modelo de IA más apropiado según la complejidad de la tarea, la calidad requerida y el presupuesto. En lugar de enviar cada consulta al modelo más caro, el enrutador analiza el contenido y selecciona el destino óptimo.

¿Cómo funciona el enrutamiento multinivel?

El sistema clasifica las consultas entrantes y las dirige al nivel correspondiente. Las preguntas FAQ sencillas van a modelos rápidos y económicos. Las tareas de complejidad media son procesadas por modelos de nivel intermedio. Solo los problemas realmente complejos que requieren razonamiento profundo llegan a los modelos premium más costosos.

Ahorro de costes

El enrutamiento multinivel puede reducir los costes de API entre un 60 y un 80 % sin pérdida de calidad. La clave es la clasificación correcta — el sistema debe reconocer que «¿qué tiempo hace?» no requiere el mismo modelo que «prepara un análisis de due diligence».