ΡΙΖΟΣΠΑΣΤΗΣ
ΡΙΖΟΣΠΑΣΤΗΣ
Σάββατο 5 Απρίλη 2025 - Κυριακή 6 Απρίλη 2025
Σελ. /40
ΜΕΓΑΛΑ ΓΛΩΣΣΙΚΑ ΜΟΝΤΕΛΑ ΣΤΗ ΡΟΜΠΟΤΙΚΗ
Πρόοδοι, αδυναμίες και προοπτικές

Ρομποτικοί σκύλοι της «Boston Dynamics»
Ρομποτικοί σκύλοι της «Boston Dynamics»
Σε πολλά μέρη του κόσμου ρομπότ φτιάχνουν μπέργκερ, πίτσες και άλλα φαγητά με τον ίδιο τρόπο που το κάνουν τα τελευταία 50 χρόνια: Ακολουθώντας επακριβείς οδηγίες και επαναλαμβάνοντας τα ίδια βήματα ξανά και ξανά. Ενώ όμως και ένα παιδί μπορεί να ψάξει στο ψυγείο και στα ντουλάπια, να βγάλει απ' αυτά συστατικά και να φτιάξει ένα πρόχειρο γεύμα, ένα ρομπότ σήμερα δεν μπορεί να το κάνει. Ακόμα και μετά από πολλούς κύκλους δοκιμής και λάθους και χιλιάδες γραμμές κώδικα, ένα ρομπότ δεν θα μπορέσει να αντεπεξέλθει σε κάτι που το πρόγραμμά του δεν είχε προβλέψει.

Ενα ρομπότ παρασκευής γευμάτων, για παράδειγμα, θα έπρεπε να μπορεί να συντάξει ένα σχέδιο δράσης, που σημαίνει ότι θα έπρεπε να γνωρίζει από το τι σημαίνει πικάντικο στη συγκεκριμένη χώρα ή περιοχή και τη διαρρύθμιση της συγκεκριμένης κουζίνας όπου θα κάνει την παρασκευή, μέχρι για ποιους ανθρώπους προορίζεται το γεύμα και αν έχουν ιδιαίτερες γευστικές ή διαιτολογικές απαιτήσεις. Φυσικά, ένα τέτοιο ρομπότ σε σπίτι θα έκανε τη ζωή ευκολότερη, ενώ αν υπήρχε στον χώρο εργασίας θα άλλαζε πολλά, και σε συνθήκες καπιταλισμού όχι με θετικό τρόπο για τους εργαζόμενους στον κλάδο...

Χειριστές εργαλείων

Παρά τα εντυπωσιακά βίντεο στο YouTube, ρομπότ εργατών αποθήκης, ρομποτικών σκύλων, ρομποτικών νοσοκόμων και εντελώς αυτόματων αυτοκινήτων, καμία από τις μηχανές αυτές δεν διαθέτει ακόμα την ευελιξία και την ικανότητα προσαρμογής του ανθρώπου. Οι ρομποτιστές πρέπει να διδάξουν στο ρομπότ έναν χάρτη του κόσμου γύρω του, αλλά το περιβάλλον αλλάζει συνεχώς. Γι' αυτό, ανέκαθεν αναζητούσαν έναν πρακτικό «εγκέφαλο» που θα μπορούσαν να βάλουν μέσα στο ρομποτικό σώμα. Μέχρι το 2022, οι υπολογιστές ήταν το ίδιο άσχετοι στα ζητήματα αυτά όπως και τα ρομποτικά τους «ξαδέρφια». Ο ερχομός του ChatGPT και των άλλων Μεγάλων Γλωσσικών Μοντέλων (ΜΓΜ) που ακολούθησαν έδωσε στους υπολογιστές τη δυνατότητα να πραγματοποιούν διάλογο με τους ανθρώπους, και να παράγουν κείμενο μιμούμενοι τον ανθρώπινο λόγο και τη γραφή. Εχουν εκπαιδευτεί με τόσες πληροφορίες για γεύματα, κουζίνες και συνταγές, που μπορούν να απαντήσουν σχεδόν σε οποιαδήποτε ερώτηση θα μπορούσε να έχει ένα ρομπότ για το πώς να μετατρέψει συγκεκριμένα συστατικά σε μια συγκεκριμένη κουζίνα σε ένα γεύμα.

Ρομποτικός βραχίονας συνδεδεμένος με μεγάλο γλωσσικό μοντέλο, σε μια δοκιμή χειρισμού αντικειμένων
Ρομποτικός βραχίονας συνδεδεμένος με μεγάλο γλωσσικό μοντέλο, σε μια δοκιμή χειρισμού αντικειμένων
Τα ΜΓΜ έχουν πρόσβαση σε κάτι που δεν είχαν τα ρομπότ: Γνώση για σχεδόν τα πάντα που έχουν γράψει άνθρωποι, από την κβαντική φυσική μέχρι το φιλετάρισμα του σολωμού. Τα δε ρομπότ έχουν κάτι που δεν διαθέτουν τα ΜΓΜ: Σώματα που μπορούν να αλληλεπιδρούν με το περιβάλλον, συνδέοντας τις λέξεις με την πραγματικότητα. Μερικοί ρομποτιστές έχουν αρχίσει να τα βλέπουν ως τον τρόπο με τον οποίο τα ρομπότ θα σπάσουν τα όρια του προγραμματισμού τους. Ο ερχομός αυτών των μοντέλων, που ακούγονται ανθρώπινα, έχει πυροδοτήσει μια κούρσα για να βρεθούν οι καλύτεροι τρόποι διδασκαλίας των μοντέλων ώστε να μπορούν να χειρίζονται εργαλεία.

Ορισμένοι έχουν ενθουσιαστεί από την προοπτική ενός μεγάλου άλματος στην ικανότητα κατανόησης που διαθέτουν τα ρομπότ, άλλοι όμως είναι σκεπτικοί, επισημαίνοντας τα περιστασιακά παράδοξα λάθη των ΜΓΜ, την προκατειλημμένη, μεροληπτική γλώσσα και τις παραβιάσεις ιδιωτικότητας που εμφανίζουν. Τα ΜΓΜ μπορούν να μοιάζουν ανθρώπινα, αλλά απέχουν πολύ από τις ανθρώπινες ικανότητες. Συχνά έχουν «παραισθήσεις» ή εφευρίσκουν ψευδή δεδομένα, ενώ επανειλημμένα έχουν παρασυρθεί από κακοπροαίρετες παραινέσεις του χρήστη τους.

Ρομποτικοί σκύλοι

Η αμερικανική εταιρεία «Levatas», που ειδικεύεται σε λογισμικό για ρομπότ περιπολίας τα οποία φυλάνε βιομηχανικές εγκαταστάσεις, συνεργάστηκε με την «Boston Dynamics» (γνωστή για τα ρομποτικά μουλάρια, σκύλους και ανθρωποειδή της) με σκοπό να ενσωματώσουν τις δυνατότητες του ChatGPT σε έναν ρομποτικό σκύλο - φύλακα, ώστε οι εργαζόμενοι σε αυτές τις εγκαταστάσεις να μπορούν να του δίνουν εντολές μιλώντας του σε φυσική γλώσσα. Ο ρομποτικός σκύλος με επικοινωνία μέσω ΜΓΜ μπορεί να καταλάβει μια εντολή ακόμα κι αν διατυπωθεί με διαφορετικό τρόπο από διαφορετικούς ανθρώπους. Μπορεί ακόμα να απαντήσει στο ερώτημα: Τι εκτός του συνήθους παρατήρησες στην τελευταία σου περιπολία;

Αν και το λογισμικό της εταιρείας συνδέει όλα τα κομμάτια του συστήματος, πολλά απ' αυτά, όπως το σύστημα μετατροπής της ομιλίας σε κείμενο, το ChatGPT, το ίδιο το ρομπότ και το σύστημα μετατροπής του κειμένου σε ομιλία είναι ανεξάρτητα εμπορικά διαθέσιμα. Ολα αυτά δεν σημαίνουν ότι σύντομα θα μπορεί κανείς να έχει στο σπίτι του έναν ρομποτικό σκύλο για να του μιλάει. Η μηχανή της «Levatas» δουλεύει σωστά μόνο όσο βρίσκεται στο συγκεκριμένο βιομηχανικό περιβάλλον.

Ανεξάρτητα από την πολυπλοκότητα της συμπεριφοράς του, ένα ρομπότ έχει περιορισμένο αριθμό αισθητήρων που παίρνουν πληροφορίες από το περιβάλλον (κάμερες, ραντάρ, λίνταρ, μικρόφωνα, ανιχνευτές μονοξειδίου του άνθρακα κ.ο.κ.), τα οποία συνδέονται με περιορισμένο αριθμό βραχιόνων, ποδιών, αρπαγών, τροχών και άλλων μηχανισμών. Η σύνδεση ανάμεσα στις «αισθήσεις» και στις δράσεις του ρομπότ γίνεται μέσω του λογισμικού που εκτελείται στον υπολογιστή του. Το λογισμικό, με βάση το περιορισμένο ρεπερτόριο κινήσεων που μπορεί να κάνει το ρομπότ, διαλέγει εκείνες που ταιριάζουν καλύτερα στις εντολές που έχει λάβει, μετά στέλνει ηλεκτρικά σήματα στα μηχανικά του μέρη για να κινηθούν, και στη συνέχεια μαθαίνει από τους αισθητήρες του πώς επηρέασε το περιβάλλον, ώστε να αντιδράσει εκ νέου.

Νευρωνικά δίκτυα

Αντίθετα, η μηχανική μάθηση λειτουργεί με μεταφορές σε ένα εικονικό περιβάλλον. Υλοποιείται από ένα «νευρωνικό δίκτυο», αποτελούμενο από απλοποιημένα ψηφιακά ανάλογα των νευρώνων του εγκεφάλου, διαταγμένα σε στρώσεις. Κάθε «κύτταρο» στέλνει και λαμβάνει πληροφορίες από εκατοντάδες διασυνδέσεις. Σε καθεμιά διασύνδεση με άλλα «κύτταρα» προσδίδει ένα «βάρος». Το «κύτταρο» αθροίζει όλα αυτά τα βάρη για να αποφασίσει αν θα «πυροδοτήσει», αν θα στείλει το δικό του σήμα σε άλλα «κύτταρα» συνδεδεμένα με αυτό. Οπως όσο περισσότερα εικονοστοιχεία (pixel) έχει μια φωτογραφία τόσο πιο λεπτομερής είναι, έτσι και όσο περισσότερες συνδέσεις έχει ένα μοντέλο, τόσο πιο αναλυτικά είναι τα αποτελέσματά του. Η εκμάθηση στη «μηχανική μάθηση» είναι η προσαρμογή των βαρών από το μοντέλο καθώς πλησιάζει στο είδος της απάντησης που επιζητούν οι χρήστες του.

Τα ΜΓΜ έχουν χρησιμοποιηθεί με επιτυχία για εξειδικευμένες εργασίες, όπως η ανακάλυψη της τρισδιάστατης αναδίπλωσης των μορίων των πρωτεϊνών, αλλά μπορούν να μιλήσουν και για οτιδήποτε άλλο. Επειδή η απόκρισή τους είναι απλώς μια πρόβλεψη για το πώς συνδυάζονται οι λέξεις, στην πραγματικότητα δεν καταλαβαίνουν τίποτα απ' ό,τι λένε. Επειδή δουλεύουν με λέξεις, δεν χρειάζονται ειδική εκπαίδευση ή τεχνογνωσία μηχανικής. Οταν τους κάνεις μια ερώτηση ή τους δώσεις μια εντολή, μετατρέπουν τις λέξεις σε αριθμούς, ως μαθηματική αναπαράσταση των σχέσεων της μίας με την άλλη. Χρησιμοποιώντας αυτήν την αναπαράσταση, κάνουν στη συνέχεια μια πρόβλεψη για το ποια θα μπορούσε να είναι η απόκριση σε αυτά τα δεδομένα. Οι αριθμοί που προκύπτουν μετατρέπονται στη συνέχεια σε λέξεις. Οταν πρωτοεμφανίστηκε το GPT-1 το 2018, χρησιμοποιούσε 120 εκατομμύρια παραμέτρους (κυρίως «βάρη», αν και ο όρος περιλαμβάνει και ρυθμιζόμενες πλευρές ενός μοντέλου). Το σημερινό GPT-4 χρησιμοποιεί 1 τρισεκατομμύριο παραμέτρους και το Wu Dao 2.0, της Ακαδημίας Τεχνητής Νοημοσύνης του Πεκίνου, 1,75 τρισ.

Μονόπλευρο σύστημα

Ακριβώς επειδή έχουν τόσες πολλές παραμέτρους να ρυθμίσουν και τόσα γλωσσικά δεδομένα στο σώμα δεδομένων εκπαίδευσής τους, τα ΜΓΜ συχνά καταλήγουν σε πολύ καλές προβλέψεις, αρκετά καλές για να αντικαταστήσουν την κοινή λογική και τη γνώση υποβάθρου, που κανένα ρομπότ δεν διαθέτει. Ομως ένα ρομπότ συνδεδεμένο με ΜΓΜ είναι ένα μονόπλευρο σύστημα, καθώς απεριόριστη γλωσσική ικανότητα συνδέεται σε ένα σώμα που μπορεί να πραγματοποιήσει μόνο ένα κλάσμα όσων είναι ικανός να κάνει ένας άνθρωπος. Αν π.χ. το ρομπότ διαθέτει μόνο μία αρπάγη με δύο «δάχτυλα», δεν θα μπορέσει να πραγματοποιήσει πολλές από τις εργασίες που θα του ζητήσει το ΜΓΜ. Παραπέρα, το περιβάλλον αλλάζει συνεχώς και ακόμα και η αλλαγή φωτισμού εξαιτίας της εξωτερικής συννεφιάς μπορεί να κάνει το ρομπότ να μη βρίσκει το εργαλείο που χρειάζεται. Τα ρομπότ πρέπει να βελτιωθούν πολύ για να μπορούν να ανταποκριθούν στα ΜΓΜ.

Οι ερευνητές αναζητούν τρόπους διατύπωσης εντολών που θα λένε στο ΜΓΜ να περιορίζει τις απαντήσεις του σε πράγματα που το ρομπότ θα μπορεί να φέρει σε πέρας. Μια ερευνητική ομάδα εφηύρε μια τέτοια μέθοδο, που την ονόμασε ProgPrompt και η οποία δίνει εντολή στο ΜΓΜ να συντάξει κώδικα προγραμματισμού στη γλώσσα Python, δίνοντας απλές εντολές, που το ρομπότ μπορεί να ακολουθήσει και να πραγματοποιήσει. Η μέθοδος αυτή δοκιμάστηκε με επιτυχία τόσο σε εικονικό ρομπότ όσο και σε έναν ρομποτικό βραχίονα. Η «Physical Intelligence» σε συνεργασία με την «Google» έχει κατασκευάσει το σύστημα SayCan, που περιλαμβάνει μια λίστα από ενέργειες που το ρομπότ είναι σε θέση να επιτελέσει. Το ΜΓΜ, αντιδρώντας στην ανθρώπινη προτροπή, πρέπει να διαλέξει ανάμεσα σε αυτές για να καθοδηγήσει το ρομπότ στις κινήσεις του.

Παραισθήσεις και προκαταλήψεις

Είναι τα ΜΓΜ απλοί διατάκτες λέξεων που καταλήγουν να έχουν λογική έννοια, ή αναπτύσσεται κάποια συλλογιστική σε αυτά; Σε πείραμα που έγινε στο Πανεπιστήμιο Πρίνστον, η στρατηγική τού πώς να μαθαίνει από την προηγούμενη εμπειρία του δεν εισήχθη στο μοντέλο. Ωστόσο, ενδείξεις της ικανότητας να μαθαίνει πώς να μαθαίνει εμφανίστηκαν στην πορεία, όσο το μοντέλο μεγάλωνε σε μέγεθος. Είτε οι μηχανές ακολουθούν μια συνταγή είτε επιδεικνύουν αναδυόμενη συλλογιστική, οι ικανότητές τους δημιουργούν σοβαρές ανησυχίες για τις επιπτώσεις τους στον πραγματικό κόσμο. Τα ΜΓΜ είναι από τη φύση τους λιγότερο αξιόπιστα και λιγότερο διαφανή από τον κλασικό προγραμματισμό. Τι θα γίνει αν ένα ΜΓΜ μέσα σε ένα ρομπότ κατανοήσει λαθεμένα τις επιθυμίες του ανθρώπου, ή δεν υπολογίσει κάποιες συνέπειες των εντολών που θα δώσει στο ρομπότ; Ακόμα και ρομποτιστές δεν θεωρούν σκόπιμη την ενσωμάτωση των ΜΓΜ σε ρομπότ, ή θεωρούν απαραίτητο οι προτάσεις του ΜΓΜ να περνούν από το φίλτρο κλασικού προγραμματισμού ή παραδοσιακής Τεχνητής Νοημοσύνης, που θα εμποδίζει το ρομπότ να πραγματοποιήσει παράλογες εντολές του ΜΓΜ.

Ενα άλλο πρόβλημα των ΜΓΜ είναι οι προκαταλήψεις και η μεροληψία που τις συνοδεύει. Η «OpenAI» (του ChatGPT) το 2022 δήλωσε σε δημοσίευσή της ότι το ΜΓΜ CLIP, που έχει φτιάξει για ρομπότ, είναι «πιθανώς επιβλαβές» αν χρησιμοποιηθεί εκτός εργαστηρίου. Σε πείραμα με αυτό το ΜΓΜ, το ρομπότ διατάχτηκε να επιλέξει τυχαία φωτογραφίες εγκληματιών από ένα σύνολο με μισές φωτογραφίες λευκών και μισές μαύρων, αλλά επέλεξε 9% περισσότερο φωτογραφίες μαύρων. Καθώς τα ΜΓΜ εξελίσσονται ραγδαία, δεν είναι σαφές αν θα μπορέσουν να συμβαδίσουν οι έλεγχοι και οι περιορισμοί για τυχόν επιβλαβείς επιλογές τους. Για τις μηχανές, όπως και για τους ανθρώπους, οι λέξεις που ακούγονται ωραία στο αυτί είναι εύκολες αλλά η μετατροπή τους σε πράξη είναι πολύ πιο δύσκολη.


Επιμέλεια:
Σταύρος ΞΕΝΙΚΟΥΔΑΚΗΣ
Πηγή: «Scientific American»



Ευρωεκλογές Ιούνη 2024
Μνημεία & Μουσεία Αγώνων του Λαού
Ο καθημερινός ΡΙΖΟΣΠΑΣΤΗΣ 1 ευρώ