Επιστροφή στο γλωσσάριο Τεχνολογία

Streaming Εξόδου ΤΝ

Τεχνική παράδοσης εξόδου LLM τμηματικά, σε πραγματικό χρόνο, καθώς παράγεται — βελτιώνοντας αντιληπτική απόκριση σε διαδραστικές εφαρμογές.

Τι είναι το Streaming Εξόδου;

Το streaming εξόδου ΤΝ αναφέρεται στην παράδοση παραγόμενου κειμένου από LLMs τμηματικά (token-by-token ή chunk-by-chunk) καθώς δημιουργείται, αντί να περιμένουμε ολόκληρη η απάντηση να είναι έτοιμη. Αυτό δημιουργεί την οικεία «δακτυλογράφηση» εμπειρία σε chatbots.

Χωρίς streaming, ο χρήστης περιμένει 5-30 δευτερόλεπτα για απάντηση. Με streaming, βλέπει πρώτες λέξεις σε < 1 δευτερόλεπτο.

Τεχνική Υλοποίηση

Server-Sent Events (SSE) ή WebSockets επιτρέπουν streaming από backend σε frontend. Τα LLM APIs (OpenAI, Anthropic) υποστηρίζουν streaming με παράμετρο `stream=true`. Το backend πρέπει να υποστηρίζει async streaming και το frontend να χειρίζεται ατελή κείμενα αδιάλειπτα.

UX Οφέλη

Streaming βελτιώνει σημαντικά αντιληπτή απόκριση — χρόνος μέχρι πρώτο token (TTFT) γίνεται η βασική μετρική UX. Χρήστες αντιλαμβάνονται το σύστημα ως πιο γρήγορο ακόμα και αν ο συνολικός χρόνος παραγωγής είναι ίδιος.