Vissza a szójegyzékhez Mesterséges intelligencia

AI-illesztés (AI Alignment)

Az a kihívás, hogy az AI-rendszerek az emberi értékekkel, szándékokkal és biztonsági követelményekkel összhangban viselkedjenek.

Az illesztési probléma

Az AI-illesztés az a kihívás, hogy az AI-rendszerek olyan célokat kövessenek, amelyek összhangban vannak az emberi értékekkel, szándékokkal és biztonsági követelményekkel. Ahogy az AI-rendszerek egyre képesebbé válnak, az összehangolás hiányának kockázata — amikor egy rendszer olyan célt optimalizál, amely eltér attól, amit az emberek valójában akarnak — egyre jelentősebbé válik.

Miért fontos az illesztés a vállalatok számára?

A vállalati AI-illesztés gyakorlati kihívásokban nyilvánul meg: annak biztosítása, hogy az ajánlórendszerek ne diszkrimináljanak, az optimalizáló rendszerek ne aknázzák ki a kiskapukat, az automatizált döntések összhangban legyenek a vállalati értékekkel és a szabályozási követelményekkel.

Illesztési megközelítések

Gyakorlati illesztési stratégiák: gondos célspecifikáció több korláttal és guardrailsszel, RLHF az AI-viselkedés formálásához, alkotmányos AI-megközelítések, átfogó tesztelés különböző forgatókönyvekben, robusztus monitorozás emberi felügyelettel. Az illesztést folyamatos folyamatként kell kezelni.