Επιστροφή στο γλωσσάριο Τεχνητή Νοημοσύνη

Θεμελιώδες Μοντέλο

Μεγάλο, προεκπαιδευμένο μοντέλο ΤΝ που χρησιμεύει ως βάση — προσαρμόζεται μέσω fine-tuning για συγκεκριμένες εφαρμογές.

Τι είναι ένα Θεμελιώδες Μοντέλο;

Ένα θεμελιώδες μοντέλο είναι ένα μεγάλο μοντέλο ΤΝ προεκπαιδευμένο σε τεράστια σύνολα δεδομένων (κείμενο, εικόνες, κώδικα, ήχο) χωρίς εξειδίκευση. Παραδείγματα: GPT-4, Claude, Gemini, Llama. Το θεμελιώδες μοντέλο είναι μια «βάση» που στη συνέχεια προσαρμόζεται για συγκεκριμένες εφαρμογές.

Από τη βάση στην εξειδίκευση

Ένα γυμνό θεμελιώδες μοντέλο είναι γενικός. Η προσαρμογή γίνεται μέσω: fine-tuning (επανεκπαίδευση σε δεδομένα τομέα), RAG (παροχή πλαισίου από βάσεις γνώσης), prompt engineering (οδηγίες συστήματος που ορίζουν ρόλο και περιορισμούς) και RLHF (μάθηση από ανθρώπινη ανατροφοδότηση).

Ανοιχτά vs κλειστά μοντέλα

Τα θεμελιώδη μοντέλα είναι ανοιχτά (Llama, Mistral — μεταφορτώσιμα, εκτελέσιμα στους δικούς σας διακομιστές) και κλειστά (GPT-4, Claude — προσβάσιμα μόνο μέσω API). Η επιλογή επηρεάζει κόστος, ιδιωτικότητα, ευελιξία προσαρμογής και κίνδυνο εξάρτησης από πάροχο.