Kas ir Chain of Thought?
Chain of Thought (CoT) ir tehnika, kurā MI modelis risina problēmu soli pa solim, skaidri atspoguļojot savu argumentāciju. Tā vietā, lai sniegtu tūlītēju gala atbildi, modelis sadala uzdevumu posmos, pārbauda starprezultātus un veido loģisku secinājumu ķēdi.
Kāpēc CoT uzlabo rezultātus?
Valodas modeļi ir autoregresīvi — ģenerē tekstu žetonu pa žetonam. Kad modelis "izraksta" savu argumentāciju, katram nākamajam žetonam ir vairāk konteksta. Jaunākie modeļi (o3, Claude ar paplašinātu domāšanu) ir ar iebūvētu CoT, kas krasi uzlabo kvalitāti sarežģītām problēmām.
Pielietojumi MI aģentos
Daudzu aģentu sistēmās CoT ir izšķirošs: plānošanas aģentam jā"pārdomā" stratēģija pirms uzdevumu deleģēšanas. Redzama argumentācija arī nodrošina auditējamību — varat pārbaudīt, kāpēc aģents pieņēma konkrētu lēmumu.