Grįžti į žodyną Technologijos

Temperatūra ir Top-P atranka

DI modelių parametrai, valdantys atsakymų atsitiktinumą, kūrybiškumą ir nuspriojamumą.

Išvesties atsitiktinumo valdymas

Temperatūra ir Top-P (branduolio atranka) yra du pagrindiniai parametrai, valdantys, kiek atsitiktinumo DI modelis įtraukia į savo išvestis. Jie veikia kaip „kūrybiškumo rankenėlės“ – žemi vertės sukuria nusppriojamus, determinisdinius atsakymus, o aukštos – įvairesnius, kūrybiškesnius rezultatus.

Temperatūra keičia tikimybių paskirstymą per visą žodiiną. Prie temperatūros 0 modelis visada renkasi labiausiai tikėtiną kitą žetoną. Prie temperatūros 1,0 tikimybės nekeiciaamos. Virš 1,0 paskirstymas tampa lygesnis, padidindamas rečesnių žetonnų tikimybę. Top-P filtruoja žetonus, išlaikydamas tik tuos, kurių kumuliatyvinė tikimybė pasiekia P slenksitį, tada atranka vyksta iš šio sumažinto rinkimo.

Praktinės gairės

Faktinių klausimams, kodo generavimui ir duomenų išgavimui naudokite žema temperatūrą (0–0,3) – čia svarbu tikslumas ir nuoseklumas. Kūrybiškoms užiduotims, tokioms kaip turinio kūrimas, įidėjų generavimas ir straipsniai, naudokite vidutiines vertes (0,5–0,8). Poezijai, scenarijams ir atviriam kūrybiškumui naudokite aukštesnes vertes (0,8–1,2). Venkite naudoti tiek temperatūrą, tiek Top-P vienu metu – paprastai koreguokite vieną iš jų, kitą palikdami numatytosiiomis vertėmis.

Verslo įgyvendinimas

Sukurkite organizacines gaires skirtingiems naudojiimo atvejams su rekomenduojamais parametrų diapazonais. Klientų aptarnavimo robotai turėtų naudoti žemia temperatūrą patikimiems atsakymams. Turinio kūrimo asistentai gali naudoti aukštesnę temperatūrą kūrybiškumuui. Kritiniams verslo procesams (teisiniai, medicininniai) visada naudokite žemesnes vertes. Testuokite skirtingu parameterų derinius su savo konkrecčiais naudojimo atvejais – optimalios vertės priklauso nuo modelio, užduoties ir kokybės reikalavimų.