Nata Studio |
Στις 27 Γενάρη, μόλις μια βδομάδα μετά την ανακοίνωση της «DeepSeek», η συνειδητοποίηση στους οικονομικούς κύκλους των ΗΠΑ ότι αληθεύουν όσα ισχυρίστηκε η «DeepSeek», οδήγησε σε χρηματιστηριακό πατατράκ στη Νέα Υόρκη, με απώλεια χρηματιστηριακής αξίας 750 δισεκατομμυρίων δολαρίων των μεγαθηρίων της πληροφορικής στις ΗΠΑ (Microsoft-OpenAI, Google-DeepMind, Meta, Amazon κ.ά.), από τα οποία περίπου τα 600 δισεκατομμύρια (-18%) έχασε η Nvidia, κατασκευάστρια των πανάκριβων επεξεργαστών γραφικών (GPU), που χρησιμοποιούνται στην εκπαίδευση, αλλά και τη χρήση των Μεγάλων Γλωσσικών Μοντέλων (ΜΓΛ) τύπου ChatGPT. Στο 17,4% έφτασαν οι απώλειες της Broadcom, ανταγωνίστριας της Nvidia. Πολύ μεγαλύτερη ήταν η πτώση μετοχών εταιρειών ηλεκτρικής ενέργειας, που απαιτείται για τη λειτουργία των κέντρων δεδομένων (data centers) της ΤΝ. Μεγάλη πτώση σημείωσαν και στο χρηματιστήριο του Τόκιο οι μετοχές εταιρειών ημιαγωγών προμηθευτών της Nvidia. Η μέρα αυτή θα μπορούσε να ονομαστεί και «DeepSink» (βαθιά βύθιση), κάνοντας λογοπαίγνιο με το όνομα της «DeepSeek» (βαθιά αναζήτηση).
Ηδη από τον Δεκέμβρη του 2024, η «DeepSeek» είχε διαθέσει στο κοινό χωρίς κόστος το βασισμένο στο ΜΓΛ DeepSeek V3 chatbot της, στο οποίο έχει κανείς πρόσβαση μέσω της εφαρμογής για κινητά ή μέσω της ιστοσελίδας της εταιρείας. Το ΜΓΛ αυτό έχει βεβαιωμένες επιδόσεις παραπλήσιες, αν όχι λίγο καλύτερες από εκείνες των ισχυρότερων μοντέλων όλων των αμερικανικών εταιρειών.
Απροσδιόριστες προς το παρόν είναι οι μακροπρόθεσμες συνέπειες που μπορεί να έχει στον κλάδο παγκοσμίως η εντυπωσιακή προβολή διαφορετικού παραδείγματος στην ανάπτυξη ΤΝ, που έκανε η κινεζική εταιρεία, χρησιμοποιώντας πολύ λιγότερους οικονομικούς, υπολογιστικούς και ανθρώπινους πόρους (μόνο από 200 ερευνητές απαρτίζεται κατά δήλωση της «DeepSeek» η ομάδα κατασκευής της ΤΝ της) και μη προστατεύοντας τα εμπορικά της δικαιώματα, κρατώντας τον κώδικα κλειστό, όπως κάνουν οι αμερικανικές εταιρείες. Πώς η OpenAI, η Google και η Meta θα ανταγωνιστούν μια εταιρεία που προσφέρει δωρεάν στο κοινό την υψηλού επιπέδου ΤΝ της, και ακόμη και τη μίσθωση του μοντέλου της σε τρίτες εταιρείες την κάνει στο ένα εικοστό του κόστους συγκριτικά με αυτές, είναι κάτι προς το παρόν ασαφές.
Τις επόμενες δυο μέρες μετά την ανακοίνωση της «DeepSeek», στο πλαίσιο του ανταγωνισμού μέσα στην ίδια την Κίνα, άλλα κινεζικά μονοπώλια ανακοίνωσαν επίσης νέα και πιο ισχυρά ΜΓΛ. Η «Alibaba» ισχυρίστηκε ότι το δικό της Qwen 2.5 Max ξεπερνάει σχεδόν σε όλα το GPT-4o (OpenAI-Microsoft), το DeepSeek-V3 και το Llama-3.1-405B (της Meta-Facebook). Η επίσης κινεζική «ByteDance» (μητρική του TikTok) ανακοίνωσε κι αυτή μοντέλο ΤΝ, που όπως ισχυρίζεται ξεπερνά το o1 της OpenAI. Αυτές οι ανακοινώσεις έφεραν νέα ανησυχία στις ΗΠΑ και πολύ περισσότερο στην Ευρωπαϊκή Ενωση, που έχει μείνει πολύ πίσω στον τομέα, καθώς ο ανταγωνισμός μεγαλώνει και η Κίνα φαίνεται αν όχι να ξεπερνά, τουλάχιστον να φτάνει τις ΗΠΑ. Ανεξάρτητα από τον ενδομονοπωλιακό ανταγωνισμό, οι ανακοινώσεις αποτέλεσαν μια περαιτέρω κινεζική επίδειξη δύναμης, είτε ήταν ενορχηστρωμένες από την κυβέρνηση της Κίνας, είτε όχι.
Με βάση τις πληροφορίες που δημοσίευσε η «DeepSeek», η εκπαίδευση του V3 έγινε με κόστος 6 εκατομμυρίων δολαρίων χρησιμοποιώντας 2.000 επεξεργαστές παλιότερης γενιάς της Nvidia (τους H800), που η κινεζική εταιρεία είχε φροντίσει να εξασφαλίσει πριν την εφαρμογή της απαγόρευσης πώλησης τέτοιου εξοπλισμού από τις ΗΠΑ. Η «Meta» χρησιμοποίησε 8 φορές περισσότερους επεξεργαστές για την εκπαίδευση του τελευταίου μοντέλου της. Σύμφωνα με ανεπιβεβαίωτες πληροφορίες, η λειτουργία του εκπαιδευμένου μοντέλου της «DeepSeek», καθώς είναι λιγότερο απαιτητικό σε υπολογιστική ισχύ, στηρίζεται στους επεξεργαστές Ascend 910c της «Huawei», που είναι πολύ λιγότερο ισχυροί. Η «DeepSeek» ενδέχεται να εκπαιδεύσει το επόμενο μοντέλο ΤΝ, το V4 σε μερικές δεκάδες χιλιάδες επεξεργαστές της «Huawei», εφόσον γίνουν έγκαιρα διαθέσιμοι. Η «Huawei» έχει ανακοινώσει την κατασκευή του Ascend 920c, που στοχεύει να είναι ανάλογων επιδόσεων με τη σημερινή πανάκριβη ναυαρχίδα της Nvidia, το B200. Οπως αποδεικνύεται, οι περιορισμοί των ΗΠΑ στην εξαγωγή τεχνολογικών προϊόντων στην Κίνα έχουν μόνο βραχυπρόθεσμη αποτελεσματικότητα, ενώ παράλληλα ωθούν την Κίνα να κάνει τεχνολογικά άλματα στους σχετικούς τομείς, παράγοντας η ίδια τεχνολογικά προϊόντα υψηλού επιπέδου.
Για το πώς κατάφεραν το επίτευγμα, ο ιδρυτής της «DeepSeek», Λιανγκ Γουενφένγκ (συνιδρυτής του hedge fund High-Flyer), υποστήριξε πως η συγκέντρωση μη «φτασμένου» προσωπικού, με υψηλού επιπέδου γνώσεις και ικανότητες, ερευνητικό πάθος και φιλοδοξία και η καινοτόμα προσέγγιση ήταν η «συνταγή της επιτυχίας». Στο αντίπαλο στρατόπεδο, με προεξάρχοντα τον Σαμ Αλτμαν της OpenAI κατηγόρησαν την «DeepSeek» για αντιγραφή αμερικανικών εργαλείων και τεχνικών, ακόμη και για «απόσταξη» των αποτελεσμάτων που δίνει το ChatGPT (απορρόφηση της γνώσης του παλιού από το νέο μοντέλο) για την τροφοδοσία του R1 μοντέλου της.
Επιστήμονες της «Apple», που δεν επηρεάστηκε από την πτώση του χρηματιστηρίου καθώς δεν έχει εξαγγείλει μεγάλες επενδύσεις εξοπλισμού ανάπτυξης ΤΝ, μελέτησαν τις τεχνικές της κινεζικής εταιρείας, συμπεραίνοντας πως σημαντικός παράγοντας μείωσης των απαραίτητων πόρων εκπαίδευσης και λειτουργίας του V3 και του R1, που πέτυχε η «DeepSeek», ήταν η δημιουργική εφαρμογή της - από χρόνια γνωστής και μελετημένης από τη «Google» - τεχνικής sparsity, δηλαδή της απομόνωσης - αφαίρεσης τμημάτων του νευρωνικού δικτύου της ΤΝ, που δεν επηρεάζουν ουσιαστικά το παραγόμενο από το μοντέλο αποτέλεσμα. Ετσι δεν χρειάστηκε να περιορίσουν τον αριθμό των παραμέτρων εκπαίδευσης, κάτι που θα είχε συνέπεια στην ποιότητα των αποτελεσμάτων.
Οι μακροπρόθεσμες συνέπειες στις εταιρείες των ΗΠΑ της ΤΝ της «DeepSeek» και άλλων ανάλογων μοντέλων, που με βεβαιότητα θα εμφανιστούν σύντομα, καθώς δεκάδες ερευνητικά εργαστήρια σε όλο τον κόσμο δοκιμάζουν ήδη και τροποποιούν τον ανοιχτό της κώδικα, δεν είναι δυνατό να προβλεφθούν ακόμα. Η Nvidia μπορεί να έχασε δισεκατομμύρια, αλλά συνεχίζει να είναι ο παραγωγός των ισχυρότερων GPU. Ακόμη και τα λιγότερο απαιτητικά σε πόρους μοντέλα μπορούν να βελτιωθούν όταν αυξάνεται ο αριθμός των παραμέτρων της εκπαίδευσής τους και οι ισχυρότερες GPU επιτρέπουν αυτή την αύξηση. Σίγουρα πάντως το μότο «αγοράστε περισσότερες και ισχυρότερες GPU», ως μοναδικό τρόπο για ισχυρότερη ΤΝ, δέχτηκε μεγάλο χτύπημα. Μετά την «πράσινη ανάπτυξη» κινδυνεύει τώρα και η «διέξοδος» κερδοφόρας επένδυσης κεφαλαίων μέσω της ΤΝ. Από την άλλη μεριά, ενδεχόμενος πολλαπλασιασμός των μοντέλων λόγω του ανοιχτού κώδικα της «DeepSeek», μπορεί να οδηγήσει σε πολλαπλάσιες παραγγελίες μικρότερου αριθμού επεξεργαστών.
Η διεύρυνση της δυνατότητας ανάπτυξης ΤΝ που προσφέρει το μοντέλο της «DeepSeek» εγείρει ανησυχίες για ζητήματα ασφάλειας, καθώς διευρύνει τη δυνατότητα χρήσης από τον οποιονδήποτε για κακόβουλους σκοπούς, σαν αυτούς που γεννούν οι αντιθέσεις μέσα στο εκμεταλλευτικό σύστημα. Είτε πρόκειται για επιχειρήσεις μεσαίου - μεγάλου μεγέθους, είτε για κρατικούς οργανισμούς και παράγοντες, είτε ακόμη και για το οργανωμένο ποινικό έγκλημα, η εκπαίδευση μοντέλων ΤΝ για να εξαπατούν ή να επιτίθενται στα θύματά τους και τους αντιπάλους τους, γίνεται πιο προσεγγίσιμη. Εχουν εμφανιστεί ακόμη και μοντέλα ΤΝ που θα μπορούσαν με τη χρήση της κάμερας ενός smartphone να καθοδηγήσουν μη ειδικούς στην κατασκευή βιολογικού όπλου. Ταυτόχρονα η ένταση του ανταγωνισμού μεταξύ ΗΠΑ και Κίνας και μεταξύ των μονοπωλίων σε παγκόσμια κλίμακα πολλοί φοβούνται πως θα οδηγήσει σε μια αντιπαράθεση χωρίς όρια και χωρίς να παίρνεται κανένα μέτρο ασφάλειας, ώστε να μην ξεφύγει το πράγμα εκτός ελέγχου. Πολύ περισσότερο που τόσο ο Αλτμαν της OpenAI όσο και ο Γουενφένγκ της «DeepSeek» έχουν δηλώσει πως στόχος τους είναι η κατασκευή Γενικής Τεχνητής Νοημοσύνης, δηλαδή ΤΝ ανάλογης ή και ανώτερης του ανθρώπου, με δυνατότητα εφαρμογής σε πολλούς τομείς και όχι σε εξειδικευμένους, όπως οι τρέχουσες «στενές» μορφές ΤΝ.
Οι κίνδυνοι και τα προβλήματα αυτά σε τελευταία ανάλυση πηγάζουν από τις εκμεταλλευτικές σχέσεις παραγωγής, από την επιδίωξη της κυριαρχίας για την εξασφάλιση μεγαλύτερου κέρδους. Στην κοινωνία του σοσιαλισμού - κομμουνισμού, οι εργαζόμενοι έχοντας την εξουσία και την οικονομία στα χέρια τους, με κεντρικό σχεδιασμό, εργατικό έλεγχο και νέες σχέσεις παραγωγής, θα μπορέσουν να αναπτύξουν και να αξιοποιήσουν τις τεράστιες σημερινές παραγωγικές δυνατότητες - μέρος των οποίων είναι και η ΤΝ - με γνώμονα τις δικές τους ανάγκες και όχι τα κέρδη μιας χούφτας καπιταλιστών.