Защо повторно класиране
Системите за първоначално извличане - обикновено въз основа на сходство на вектори или пълнотекстово търсене - се квалифицират въз основа на изчислителна ефективност, но не винаги класират най-добрите резултати. Повторното класиране разглежда тази първоначална група и я пренарежда, използвайки по-интензивен модел, оценяващ по-сложна уместност.
Внедряване
Типичните тръбопроводи за повторно класиране работят: Бързо извличане (k=50-100 документа от векторно търсене), Повторно класиране (използване на модел за класиране за избор на топ 5-10), Генериране (подаване на повторно класираните резултати към генератора на LLM). Специализирани модели за повторно класиране, като Cohere Rerank или cross-encoders, предоставят значително превъзходство, но на цената на допълнителна латентност.
Избор
Не всеки RAG тръбопровод се нуждае от повторно класиране. Обмислете го при: критична точност при класирането на уместност, достатъчно голям набор от векторно сходство и когато тестването показва значително подобрение на оценката.