Co je NLP?
Spracovanie prirodzeneho jazyka (Natural Language Processing, NLP) je disciplina na priesecniku lingvistiky, informatiky a strojoveho ucenia. Cieli na to, aby pocitace rozumeli a pracovali s ludskym jazykom – nielen ako s postupnostou znakov, ale aj s jeho vyznamom, kontextom a zamermi.
NLP je zakladom vacsiny modern AI aplikacii – od chatbotov a vyhladavacov az po automaticky preklad a analyzu sentimentu.
Klucovedve ulohy NLP
NLP zahrnuje siroky spektrum uloh: tokenizacia (rozdelovanie textu na slovne jednotky), POS tagging (oznacovanie slovnych druhov), NER (rozpoznavanie pomenovan entit), sentiment analysis, summarizacia, strojovy preklad a otazko-odpovedajuce systemy.
Pred naastupom Transformer architektury sa NLP spolahalo na rucne inziniering features, recurrent siete (RNN, LSTM) a n-gramove modely. Deep learning, posebne BERT a GPT rady modelov, revolucionalizovalo schopnosti odboru.
Suvysne temy a sucastnost
Moderni Large Language Models (LLMs) su de facto NLP systemy schopne nula-shotovych a few-shot uloh bez specialized finetuning. Napriek tomu specificke NLP benchmarky ako GLUE, SuperGLUE a BIG-bench stale merajú robustnost a generalnost modelov na presne definovanych jazykovych uloach.