Обратно към речника MLOps & Жизнен цикъл

Инженеринг на характеристики

Инженерингът на характеристики е процесът на използване на знания за домейна за трансформиране на суровите данни в информативни представяния, работещи по-добре в модели за машинно обучение.

Защо инженерингът на характеристики е важен

Въпреки че дълбоките модели автоматично извличат характеристики, повечето бизнес случаи все още работят с таблични данни, при които инженерингът на характеристики значително повишава производителността на модела. Дори за дълбоките приложения, добре проектираните представяния на данни могат да подобрят производителността.

Общи техники

Общите техники включват категориално кодиране (за категориални данни в машинно обучение), мащабиране на характеристики (стандартизация и нормализация), времеви характеристики (извличане на сезонни, закъснителни и трендови характеристики от времеви марки) и комбинации от характеристики.

Автоматизиран инженеринг на характеристики

Инструментите за автоматизиран инженеринг на характеристики (AutoFE) се опитват да открият ефективни характеристики автоматично. Въпреки че не заместват знанията за домейна, те могат да осигурят изходни точки и да идентифицират полезни характеристики.