Обратно към речника Технологии

Извличане на информация за AI

Извличането на информация за AI е процесът, намиращ релевантни документи, пасажи или факти от голям корпус за предоставяне на контекст за генериране на отговори или директни заявки.

Точно срещу семантично търсене

Традиционното търсене по ключови думи съпоставя точни токени. Семантичното търсене разширява това чрез вграждания, представляващи смисъл - фраза може да съответства на синоним. Хибридното търсене комбинира и двата подхода, като обикновено превъзхожда само един от тях.

Технически компоненти

Инфраструктурата за извличане на информация за AI включва модели за вграждане (конвертиране на текст в вектори), векторни бази данни (предоставяне на ефективно търсене по близост) и модели за вграждане (конвертиране на текст в вектори). И трите са критични за RAG.

Оценка

Оценявайте системите за извличане с точни метрики: recall@k (дали топ k резултата съдържат релевантния), MRR (Mean Reciprocal Rank) и NDCG (Normalized Discounted Cumulative Gain).