Dėmesio mechanizmas (Attention Mechanism)

Dėmesio supratimas neuroniniuose tinkluose

Dėmesio mechanizmas yra technika, leidžianti neuroniniams tinklams selektyviai sutelkti dėmesį į konkrecias įvesties sekos dalis generuojant kiekvieną išvesties elementą. Užuot suspaudęs visą įvestį į vieną fiksuoto dydžio vektorių, dėmesys apskaičiuoja svortinį visų įvesties elementų kombinaciją, kurioje svoriai nustatomi pagal jų aktualumą esamai užduociai.

Savi-dėmesys (self-attention), naudojamas Transformer architektūroje, apskaičiuoja ryšius tarp visų pozicijų vienoje sekoje. Kiekvienas žetonas generuoja tris vektorius: užklausą, raktą ir reikšmę. Sandauga tarp užklauso ir raktų nustato, kiek dėmesio kiekvienas žeetonas skiria kiekvienam kitam žetonui, ir šie svoriai naudojami kontekstui jautriems atvaizdavimams kurti.

Daugiagalvis dėmesys (Multi-Head Attention)

Daugiagalvis dėmesys vykdo kelias dėmesio operacijas lygiagrec̆iai, kiekvieną su skirtingomis išmoktomis projekcijomis. Tai leidžia modeliui vienu metu fiksuoti skirtingo tipo ryšius, pavyzdžiui, sintaksinę struktūrą vienoje galvoje ir semantinę reikšmę kitoje. Išvesties rezultatai susiejami ir projektuojami galutiniam rezultatui gauti.

Verslo taikymas

Dėmesio mechanizmai yra kritiiniai įmoninėms NLP užduotims, įskaitant dokumentų santraukas, vertimą ir informacijos išgavimą. Dėmesio svoriai taip pat suteikia tam tikrą interpretavimo lygį, rodydami, kurie įvesties žetonai labiausiai įtakojo kiekvieną išvesties sprendimą. Šis skaidrumas yra vertingas reguliuojamose pramonėse, kur modelio samprotavimo supratimas svarbus atitikčiai ir pasitikėjimui.

Dėmesio supratimas neuroniniuose tinkluose

Daugiagalvis dėmesys (Multi-Head Attention)

Verslo taikymas

Susiję terminai