5 ΟΡΟΙ ΤΟΥ ΑΙ ΠΟΥ ΠΛΕΟΝ ΠΡΕΠΕΙ ΝΑ ΓΝΩΡΙΖΕΙΣ
Το ΑΙ έχει έρθει στη ζωή μας για να μείνε. Όσο καλύτερα μπορούμε να το καταλάβουμε, τόσο περισσότερη επαφή θα έχουμε με όσα συμβαίνουν στον κόσμο τα επόμενα χρόνια.
«Μαμά, το AI μού είπε να μην πίνουμε το νερό βρύσης στην Κέρκυρα. Και ότι το GPS δεν θα μας βοηθήσει πολύ στο κέντρο της πόλης. Τα έχω σημειώσει όλα εδώ». Αυτή είναι η 10χρονη κόρη μου, που πέτυχε τον υπολογιστή ανοιχτό στο ChatGPT, αφού η μεγάλη της αδερφή είχε μόλις τελειώσει με μια εργασία, και άρχισε να το ρωτά πληροφορίες για το επικείμενο ταξίδι μας.
Στη συνέχεια, του πρότεινε να της φτιάξει ένα παιχνίδι μυστηρίου με κάποιο αίνιγμα που θα μπορεί να λύσει (προφανώς το έκανε) και στο τέλος του είπε ότι έπρεπε να αποχαιρετιστούν γιατί ήταν ώρα για ύπνο, οπότε της επιβεβαίωσε τη σημασία του καλού βραδινού ύπνου και της πρότεινε να τα ξαναπούν την επόμενη μέρα.
Περάσαμε την επόμενη ώρα με εμένα να της εξηγώ πως όχι, δεν υπάρχει κάποιος άνθρωπος πίσω από το ΑΙ, παρά ένας δαιδαλώδης αλγόριθμος που ανταποκρίνεται σε κάθε της αίτημα. Πως το ΑΙ δεν είναι «φίλος» της και πως δεν θα περιμένει να ξημερώσει η επόμενη μέρα για να του στείλει ένα νέο μήνυμα. Και πως οπωσδήποτε μπορεί να κάνει λάθη.
Ήξερα πώς ακριβώς να απαντήσω σε κάθε της ερώτηση; Όχι βέβαια. Με έκανε αυτό να δαιμονοποιήσω το ΑΙ και να της απαγορεύσω να το ξαναχρησιμοποιήσει; Επίσης, όχι. Το αντίθετο, μάλιστα: Με έκανε για μια ακόμη φορά να συνειδητοποιήσω πως τα συστήματα αυτά αποτελούν πλέον αναπόσπαστο κομμάτι της ζωής μας. Και πως όσο οι γνώσεις μας για το πώς λειτουργούν παραμένουν περιορισμένες, τόσο θα μεγαλώνει το χάσμα μεταξύ ημών και των επόμενων γενεών – άρα μεταξύ ημών και όσων συμβαίνουν στον κόσμο.

Ο στόχος του ΑΙ είναι να υπάρχουν ευφυείς «μηχανές» που να μπορούν να εκτελούν εργασίες οι οποίες παραδοσιακά απαιτούν ανθρώπινη νοημοσύνη – και μέχρι στιγμής τα έχει καταφέρει αρκετά καλά, αν και όχι άριστα. Για να εξελιχθεί όλο αυτό, οι προγραμματιστές που βρίσκονται πίσω από τα συστήματα έχουν δημιουργήσει τη δική τους γλώσσα επικοινωνίας. Όπως συμβαίνει με κάθε γλώσσα, αν κάπως την κατανοήσουμε, θα έχουμε μια καλή εικόνα της «κουλτούρας» του νέου αυτού «κόσμου».
Ας δούμε, λοιπόν, 5 όρους που όποιος πειραματίζεται με το ΑΙ πρέπει να γνωρίζει.
Τα tokens
Το πρώτο πράγμα που ένας πληροφορικάριος θα σου πει για τα μοντέλα ΑΙ είναι πως αυτά δεν «διαβάζουν» λέξεις – δεν διαβάζουν καν γράμματα. «Διαβάζουν tokens».
Τα tokens στην Τεχνητή Νοημοσύνη (AI) είναι τα βασικά δομικά στοιχεία που χρησιμοποιούν τα μεγάλα γλωσσικά μοντέλα (LLMs), όπως το ChatGPT, για να επεξεργάζονται και να παράγουν κείμενο. Αντί να διαβάζουν ολόκληρες λέξεις ή προτάσεις, τα μοντέλα αυτά «σπάνε» το κείμενο σε μικρότερα κομμάτια, τα οποία ονομάζονται tokens.
Για παράδειγμα, token μπορεί να είναι η λέξη «γάτα» ή μπορεί να είναι μέρος μιας λέξης, π.χ. «κατά-…», ή μπορεί να είναι ένα σημείο στίξης. Όταν, λοιπόν, γράφουμε μια πρόταση σε κάποιο μοντέλο ΑΙ (π.χ. στο ChatGPT ή στο Gemini) όσο περισσότερα token χρησιμοποιούμε, τόσο περισσότερη επεξεργασία («δουλειά») έχει να κάνει για να παράγει μια απάντηση. Τα παλαιότερα μοντέλα μπορούσαν να «σηκώσουν» μόλις 4.000 tokens – πλέον έχουν ξεπεράσει το εκατομμύριο. Γι’ αυτό και μερικές φορές το ΑΙ «ξεχνάει» τα πρώτα μέρη μιας συζήτησης. Ή γι’ αυτό η τιμολόγηση κάποιων «μηχανών» ΑΙ έχει να κάνει με το πόσα tokens μπορούν να επεξεργαστούν.
Το context window
Το context window (παράθυρο πλαισίου) στο ΑΙ είναι η «βραχυπρόθεσμη μνήμη» του – αυτό, δηλαδή, που είπαμε παραπάνω: Το πόσες πληροφορίες (tokens, κώδικες ή εικόνες) μπορεί να επεξεργαστεί ένα μοντέλο σε μια συγκεκριμένη στιγμή.

Φαντάσου το σαν έναν πίνακα σχολικής τάξης: γράφεις όσο χωρά, όμως όταν γεμίσει πρέπει να αρχίσεις να σβήνεις για να γράψεις κάτι καινούργιο. Αυτό που θα σβήσεις έχει εξαφανιστεί για πάντα – το μοντέλο το ξέχασε.
Γι’ αυτό και όσοι χρησιμοποιούν το ΑΙ ενθουσιάζονται τόσο κάθε φορά που ένα μοντέλο ανακοινώνει πως μεγάλωσε το context window του (το Gemini φτάνει πλέον τα 1 εκατομμύριο tokens).
Συνεπώς, αν «δουλεύεις» στο ΑΙ με μεγάλα κείμενα, πρέπει να θυμάσαι πως ενδέχεται να «ξεχνά» τα πρώτα μέρη τους, γιατί το context window του έχει περιοριστεί.
Τι είναι η θερμοκρασία στο ΑΙ;
Η θερμοκρασία είναι μια παράμετρος που ρυθμίζει πόσο «δημιουργικό», «τυχαίο» ή «προβλέψιμο» θα είναι το κείμενο που παράγει το μοντέλο.
Είναι κάτι σαν διακόπτης «ντίμερ» που ελέγχει την ισορροπία μεταξύ ακριβείας και φαντασίας.
- Στη χαμηλή θερμοκρασία (κοντά στο 0) το ΑΙ θα είναι προβλέψιμο. Θα επιλέξει την πιο πιθανή και αναμενόμενη απάντηση ή λέξη. Θα δώσει ένα συνεπές και ακριβές αποτέλεσμα.
- Στην υψηλή θερμοκρασία (πιο κοντά στο 1 ή και περισσότερο), η Τεχνητή Νοημοσύνη παίρνει ρίσκα. Επιλέγει εντυπωσιακές λέξεις, ασυνήθιστες ιδέες… μερικές φορές γίνεται εντυπωσιακή. Αλλά όχι πάντα!
Για παράδειγμα: Ζήτα από το ΑΙ να συμπληρώσει τη φράση «Η γάτα κάθισε στο…». Αν είσαι προγραμματιστής που χρησιμοποιεί ένα «αγορασμένο» μοντέλο ΑΙ, έχεις τη δυνατότητα να ρυθμίσεις τη «θερμοκρασία» ως εξής:
- Στη «χαμηλή» θερμοκρασία η φράση μπορεί να γίνει: «Η γάτα κάθισε στο χαλί».
- Στην «υψηλή» θερμοκρασία η φράση μπορεί να γίνει: «Η γάτα κάθισε στο φιλοσοφικό αυτό ζήτημα για μέρες».
Ανάλογα με την εργασία που θέλεις να κάνεις με το ΑΙ, η θερμοκρασία θα σε βοηθήσει με διαφορετικό τρόπο. Ωστόσο, αν το χρησιμοποιείς απλά ως καταναλωτής, το πιθανότερο είναι ότι δεν έχεις τη δυνατότητα να ρυθμίσεις το συγκεκριμένο εργαλείο.
To hallucination
Για τo hallucination στο ΑΙ μού έχει μιλήσει εδώ και καιρό η μεγάλη μου κόρη, που προειδοποίησε για το πόσα λάθη μπορεί να κάνει ένα μοντέλο. Hallucination είναι το φαινόμενο κατά το οποίο το σύστημα παράγει πληροφορίες λανθασμένες, ανύπαρκτες ή εντελώς παράλογες, κι όμως τις παρουσιάζει με μεγάλη αυτοπεποίθηση και πειστικότητα, σα να είναι αληθινές.

Συχνά, ένα μοντέλο όπως το ChatGPT μπορεί να «φαντάζεται» γεγονότα, δεδομένα ή πηγές που δεν υπάρχουν. Δεν το κάνει επειδή έχει πρόθεση εξαπάτησης, απλά δεν μπορεί πάντα να προβλέψει σωστά την επόμενη πιθανή λέξη ή το επόμενο πιθανό token μας.
Τι μας μαθαίνει αυτό; Να μην εμπιστευόμαστε ποτέ τυφλά την Τεχνητή Νοημοσύνη για γεγονότα, στατιστικά στοιχεία, ιατρικές συμβουλές, νομικές πληροφορίες ή οτιδήποτε άλλο όπου το λάθος μπορεί να έχει πραγματικές συνέπειες.
Μπορούμε να τη χρησιμοποιούμε ως ένα σημείο εκκίνησης, όμως στη συνέχεια πρέπει πάντα να επαληθεύουμε το αποτέλεσμα που θα δώσει.
Το RAG στο ΑΙ
RAG σημαίνει Retrieval-Augmented Generation (Παραγωγή με Επαυξημένη Ανάκτηση) και μην σου ακούγεται περίπλοκο: είναι στην πραγματικότητα μια πολύ απλή ιδέα. Πρόκειται ουσιαστικά για την τεχνική που βελτιώνει την ακρίβεια και την αξιοπιστία των μεγάλων γλωσσικών μοντέλων, όπως το ChatGPT, συνδέοντάς τα με εξωτερικές πηγές γνώσης.
Δηλαδή, αντί ένα μοντέλο ΑΙ να βασίζεται αποκλειστικά στις πληροφορίες με τις οποίες εκπαιδεύτηκε, που μπορεί να είναι παλιές, το RAG του επιτρέπει να αναζητά σε πραγματικό χρόνο έγγραφα, βάσεις δεδομένων ή αρχεία για να βρει τις πιο πρόσφατες και σχετικές πληροφορίες, πριν δημιουργήσει μια απάντηση.

Να στο κάνω πιο αναλυτικό; Όταν ανεβάζεις ένα έγγραφο στο ΑΙ, το σύστημα χωρίζει το έγγραφο σε κομμάτια και τα αποθηκεύει σε ένα είδος βάσης δεδομένων. Ονομάζεται διανυσματική βάση δεδομένων και κατανοεί το γενικότερο νόημα, όχι μόνο τις λέξεις-κλειδιά (και τα tokens).
Στη συνέχεια, όταν κάνεις μια ερώτηση, το σύστημα αναζητά απάντηση πρώτα από αυτή τη βάση δεδομένων, για τα πιο σχετικά κομμάτια. Ανακτά αυτά τα κομμάτια και στη συνέχεια τα τροφοδοτεί στην Τεχνητή Νοημοσύνη μαζί με την ερώτησή σου, λέγοντας: «Ακολουθεί ένα σχετικό πλαίσιο. Τώρα απάντησε στην ερώτηση χρησιμοποιώντας αυτό». Έτσι «τροφοδοτείται» η Τεχνητή Νοημοσύνη ώστε να δημιουργεί την πιο ακριβή για εσένα απάντηση.
Πρόκειται για τη ραχοκοκαλιά σχεδόν κάθε χρήσιμου προϊόντος ΑΙ που έχει κατασκευαστεί τα τελευταία δύο χρόνια και που μπορεί να φανεί χρήσιμο σε επαγγελματίες, π.χ. bots που μπορούν να απαντήσουν σε ερωτήσεις από νομικά έγγραφα που έχουν καταχωρηθεί σε ένα μοντέλο, εργαλεία που συνοψίζουν ερευνητικές εργασίες κ.ο.κ. Όλα αυτά βασίζονται στο RAG.
Όταν ένα μοντέλο τεχνητής νοημοσύνης γνωρίζει τα έγγραφά σου, μπορεί να εκτελέσει μια πολύ πιο έξυπνη αναζήτηση και να σε τροφοδοτεί με πιο σωστά αποτελέσματα.