Основи на компютърното зрение
Компютърното зрение следва обучение върху милиони маркирани изображения. Историята на областта е тясно свързана с подобренията в дълбоките невронни мрежи, особено конволюционните невронни мрежи (CNN) и по-късно Transformers.
Основни задачи
Основните задачи включват класификация (какво е на изображението?), детекция на обекти (къде са конкретни обекти?), сегментация (точната граница около всеки обект) и верификация. Приложенията варират от индустрия до медицина.
Съвременни тенденции
Мултимодалните модели, като CLIP и неговите наследници, позволяват естествено-езиково търсене в зрителни корпуси и генериране на изображения от текстови описания.