Από το bare metal στο γυαλί: ο τελικός σταθμός του AI
Φανταστείτε έναν κύβο από γυαλί, αρκετά μικρό για να χωρά σε μια παλάμη. Στο εσωτερικό του, σμιλεμένοι τρισδιάστατα σε κλίμακα νανομέτρων, βρίσκονται δισεκατομμύρια επί δισεκατομμυρίων οπτικοί κόμβοι — ένας για κάθε σύνδεση ενός μεγάλου γλωσσικού μοντέλου. Το φως που μεταφέρει την ερώτησή σας μπαίνει από τη μία έδρα και αρχίζει να περπατά. Σε κάθε κόμβο λυγίζει, διακλαδίζεται, εξασθενεί ή ενισχύεται, πηδώντας από κόμβο σε κόμβο μέσα στο βάθος του γυαλιού — ακριβώς όπως ένα σήμα διασχίζει ένα νευρωνικό δίκτυο. Η δέσμη που βγαίνει από την απέναντι πλευρά έχει διαμορφωθεί από κάθε κόμβο που άγγιξε: μεταφέρει την απάντηση. Καμία GPU, κανένα rack, καμία ψύξη, καθόλου ρεύμα πέρα από τη δέσμη. Το μοντέλο δεν τρέχει πάνω σε υλικό. Το μοντέλο είναι το υλικό — και η εξαγωγή συμπεράσματος είναι η διαδρομή του φωτός μέσα του.
Πρόκειται για νοητικό πείραμα, όχι για ανακοίνωση προϊόντος. Τίποτα τέτοιο δεν υπάρχει, και κομμάτια του ίσως να μην υπάρξουν ποτέ. Είναι όμως συναρμολογημένο από κομμάτια εκπληκτικά πραγματικά — και αν το ακολουθήσει κανείς ως το τέρμα του, λέει κάτι άβολο για τα εκατοντάδες δισεκατομμύρια που ρέουν αυτή τη στιγμή σε datacenters για AI.
Τα κομμάτια που υπάρχουν ήδη
Ο κύβος δεν είναι φτιαγμένος από επιστημονική φαντασία. Είναι φτιαγμένος από τρεις ερευνητικές γραμμές που δουλεύουν σήμερα — η καθεμία χωριστά.
Παθητική οπτική εξαγωγή συμπερασμάτων. Το 2018, ερευνητές στο UCLA παρουσίασαν ένα διαθλαστικό βαθύ νευρωνικό δίκτυο: μια στοίβα από τυπωμένα, εντελώς παθητικά στρώματα που ταξινομεί εικόνες καθώς το φως τα διαπερνά φυσικά. Κανένας επεξεργαστής, καθόλου ενέργεια πέρα από τον ίδιο τον φωτισμό. Ο υπολογισμός γίνεται με την ταχύτητα του φωτός μέσα στην ύλη, επειδή ο υπολογισμός είναι η ύλη. Νεότερες εργασίες επέκτειναν την ιδέα στο φυσικό, μη σύμφωνο φως. Για μικρά, σταθερά, εμπρόσθιας τροφοδότησης δίκτυα, ο κύβος υπάρχει ήδη.
Εγγραφή μέσα στο γυαλί με λέιζερ φεμτοδευτερολέπτων. Το Project Silica της Microsoft γράφει δεδομένα με παλμούς λέιζερ φεμτοδευτερολέπτων ως νανοσκοπικά voxel μέσα σε κοινό γυαλί — σύμφωνα με τις δημοσιεύσεις, αρκετά terabyte ανά πλάκα, με εκτιμώμενη διάρκεια ζωής γύρω στα δέκα χιλιάδες χρόνια. Οι παράμετροι ενός κορυφαίου μοντέλου θα χωρούσαν. Σήμερα αυτό είναι αποθήκευση, όχι υπολογισμός, και η εγγραφή είναι αργή: το γέμισμα μιας πλάκας θέλει μέρες. Όμως το εργαλείο που χρειάζεται ο κύβος — να σμιλεύει οπτική δομή βαθιά μέσα σε συμπαγές γυαλί, voxel προς voxel — είναι ακριβώς αυτό το εργαλείο.
Ο οπτικός πολλαπλασιασμός πινάκων ως βιομηχανία. Εταιρείες όπως η Lightmatter διαθέτουν ήδη υλικό φωτονικής πυριτίου που εκτελεί με φως τη γραμμική άλγεβρα στην καρδιά των νευρωνικών δικτύων, και έχουν επιδείξει φωτονικούς επεξεργαστές που τρέχουν πραγματικά δίκτυα όπως τα ResNet και BERT. Δεν πρόκειται πια για εργαστηριακή περιέργεια· είναι χρηματοδοτούμενος εμπορικός κλάδος που χτυπά ευθέως το ενεργειακό κόστος του υπολογισμού για AI.
Η παθητική οπτική εξαγωγή συμπερασμάτων υπάρχει. Το πυκνό, μόνιμο, γραμμένο με λέιζερ γυαλί υπάρχει. Ο οπτικός πολλαπλασιασμός πινάκων είναι επιχείρηση. Ο κύβος είναι αυτές οι τρεις γραμμές, προεκτεταμένες μέχρι να συναντηθούν.
Πού σπάει ο κύβος
Η ειλικρίνεια απαιτεί να ονομάσουμε τα σημεία όπου η προέκταση σπάει — γιατί δεν είναι μικρά.
- Τα γλωσσικά μοντέλα δεν είναι εμπρόσθιας τροφοδότησης. Η παραγωγή κειμένου είναι βρόχος: ένα token βγαίνει, ξαναμπαίνει, χιλιάδες φορές, με μια μνήμη της συζήτησης που μεγαλώνει. Ένα παθητικό κομμάτι γυαλιού δίνει ακριβώς ένα εμπρόσθιο πέρασμα. Ανακύκλωση του φωτός, διατήρηση οπτικής κατάστασης, επιλογή του επόμενου token — όλα αυτά είναι άλυτα, και κάθε μετατροπή πίσω σε ηλεκτρονικά επιστρέφει τη δουλειά σε ένα τσιπ.
- Το attention υπολογίζεται από την είσοδο. Η παθητική οπτική διαπρέπει στους σταθερούς μετασχηματισμούς — τα παγωμένα βάρη είναι ακριβώς ό,τι μπορεί να γραφτεί σε γυαλί. Ο μηχανισμός attention όμως πολλαπλασιάζει ενεργοποιήσεις με ενεργοποιήσεις· ο πίνακας αλλάζει με κάθε prompt. Αυτό απαιτεί ενεργή, ελεγχόμενη οπτική — και αυτό δεν είναι πια παθητικός κύβος.
- Το φως δεν αλληλεπιδρά εύκολα με το φως. Κάθε μη γραμμική ενεργοποίηση ανάμεσα στα στρώματα χρειάζεται είτε εξωτικά υλικά είτε μια οπτική-ηλεκτρονική-οπτική παράκαμψη. Αυτό είναι εδώ και δεκαετίες το σημείο συμφόρησης των οπτικών νευρωνικών δικτύων.
- Ακρίβεια. Η αναλογική οπτική αποδίδει ρεαλιστικά λίγα μόνο ενεργά bit. Η έρευνα στην κβαντοποίηση δείχνει ότι τα γλωσσικά μοντέλα το ανέχονται εκπληκτικά καλά — αλλά η διατήρηση οπτικής ακρίβειας φάσης σε δισεκατομμύρια voxel μέσα σε όγκο εκατοστών είναι πολύ πέρα από τη σημερινή κατασκευαστική τεχνολογία.
Και μια διόρθωση στο όνειρο: η ταχύτητα του φωτός είναι το λάθος επιχείρημα πώλησης. Η καθυστέρηση μιας GPU κυριαρχείται από τη μετακίνηση δεδομένων από και προς τη μνήμη, όχι από την ταχύτητα των σημάτων. Αυτό που προσφέρει πραγματικά η οπτική είναι διαφορετικό και καλύτερο — ενέργεια ανά πράξη που τείνει στο μηδέν για παθητικές δομές, και τεράστιος παραλληλισμός, αφού πολλοί υπολογισμοί μπορούν να μοιράζονται το ίδιο γυαλί σε διαφορετικά μήκη κύματος ταυτόχρονα.
Η εύλογη διαδρομή
Ο κύβος δεν φτάνει με τη μεταφορά ενός transformer μέσα σε γυαλί. Φτάνει — αν φτάσει — σε στάδια.
Το πρώτο στάδιο ήδη κυκλοφορεί: υβριδικά συστήματα όπου η φωτονική κάνει τη γραμμική άλγεβρα και τα ηλεκτρονικά κρατούν τον έλεγχο, τη μνήμη και τη μη γραμμικότητα. Το δεύτερο στάδιο είναι η παθητική οπτική εξαγωγή συμπερασμάτων για μικρά, σταθερά μοντέλα — προεπεξεργασία, ταξινόμηση, δρομολόγηση — όπου μια οπτική δομή γραμμένη μία φορά αντικαθιστά έναν επιταχυντή που δουλεύει συνεχώς. Το τρίτο στάδιο είναι το ενδιαφέρον: αρχιτεκτονικές μοντέλων σχεδιασμένες για το μέσο. Δίκτυα χωρίς attention, με βάρος στην εμπρόσθια τροφοδότηση, συν-σχεδιασμένα με την οπτική που θα τα ενσαρκώσει — όπως τα σημερινά μοντέλα συν-σχεδιάστηκαν με την GPU. Κάθε στάδιο είναι πιο υποθετικό από το προηγούμενο, και για το τελευταίο θα μιλούσαμε για δεκαετίες, όχι χρόνια — αν συμβεί ποτέ.
Το μοντέλο γίνεται αντικείμενο
Ας υποθέσουμε τώρα ότι κάποια εκδοχή του δουλεύει, έστω εν μέρει. Τότε συμβαίνει κάτι βαθύτερο από μια βελτίωση επιδόσεων: το μοντέλο μετατρέπεται από υπηρεσία ξανά σε αντικείμενο.
Ένα μοντέλο γραμμένο σε γυαλί είναι ένα τυπωμένο βιβλίο, ενώ το σημερινό φιλοξενούμενο μοντέλο είναι ένα τυπογραφείο που σας επιτρέπεται μόνο να το νοικιάζετε. Ένα αντικείμενο αγοράζεται μία φορά, ανήκει εξ ολοκλήρου, ταξιδεύει σαν δίσκος βινυλίου, κλειδώνεται σε ένα συρτάρι. Δεν καταναλώνει ρεύμα σε ηρεμία, δεν στέλνει τηλεμετρία, δεν χρειάζεται κλειδί API και κανείς δεν μπορεί να το ανατιμολογήσει, να το αποσύρει ή να το σβήσει. Για μια επιχείρηση, η νοημοσύνη παύει να είναι μετρούμενη υπηρεσία κοινής ωφέλειας με ξένους όρους χρήσης και γίνεται πάγιος εξοπλισμός — πιο κοντά σε μια μηχανή στο εργαστήριο παρά σε μια συνδρομή.
Αυτή η μία μετατόπιση — από το μετρούμενο στο ιδιόκτητο — είναι που κάνει τον κύβο κάτι παραπάνω από φυσική περιέργεια. Ξαναγράφει το ποιος κρατά την ισχύ στην οικονομία του AI.
Πώς σκάει η φούσκα
Και φτάνουμε στο άβολο κομμάτι. Οι προβλέψεις των αναλυτών τοποθετούν τις συνδυασμένες κεφαλαιουχικές δαπάνες των hyperscalers πάνω από τα 600 δισεκατομμύρια δολάρια για το 2026, με περίπου τα τρία τέταρτα δεμένα σε υποδομές AI, ολοένα και περισσότερο χρηματοδοτούμενα με δανεισμό, ξοδεμένα σε επιταχυντές που αποσβένονται σε λίγα χρόνια. Κάθε δολάριο αυτής της επέκτασης είναι αποτιμημένο πάνω σε μία υπόθεση: ότι η εξαγωγή συμπερασμάτων θα μείνει σπάνια, συγκεντρωμένη και μετρούμενη — ότι η νοημοσύνη θα συνεχίσει να ρέει μέσα από ξένα datacenters, χρεωμένη ανά token.
Η ιστορία της πληροφορικής δεν είναι ευγενική με αυτή την υπόθεση. Το timesharing των mainframes ήταν μια θαυμάσια μηχανή είσπραξης ενοικίων, ώσπου ο μικροϋπολογιστής μετέτρεψε την υπολογιστική ισχύ σε αντικείμενο πάνω σε ένα γραφείο. Το ρεύμα του δικτύου έμοιαζε απρόσβλητο, ώσπου άρχισαν να εμφανίζονται πάνελ στις στέγες. Και στις δύο περιπτώσεις, η κατεστημένη οικονομία δεν έσκασε επειδή η τεχνολογία απέτυχε — έσκασε επειδή η τεχνολογία πέτυχε τόσο καλά ώστε έπαψε να χρειάζεται τον κατεστημένο.
Ο γυάλινος κύβος είναι το ακραίο σημείο αυτού του μοτίβου, αλλά το μοτίβο δαγκώνει πολύ πριν υπάρξει οποιοσδήποτε κύβος. Φωτονικοί επιταχυντές που μειώνουν την ενέργεια της εξαγωγής συμπερασμάτων κατά μία τάξη μεγέθους ήδη διαβρώνουν την τάφρο. Μικρά μοντέλα σε ιδιόκτητο υλικό τη διαβρώνουν κι άλλο. Κάθε βήμα που μετακινεί την εξαγωγή συμπερασμάτων από τη νοικιασμένη σπανιότητα προς την ιδιόκτητη αφθονία ξεφουσκώνει το ίδιο περιουσιακό στοιχείο: την υπόθεση που είναι ψημένη μέσα σε δαπάνες 600 δισεκατομμυρίων δολαρίων τον χρόνο. Αν η φούσκα του AI σκάσει, η αφορμή ίσως να μην είναι η απογοήτευση από το AI. Ίσως να είναι ένα τσιπ — ή ένα κομμάτι γυαλί — που παραδίδει AI τόσο φτηνά, ώστε το μοντέλο του ενοικίου να μην επιβιώνει.
Ο τελικός σταθμός είναι η εξαφάνιση του υλικού
Το ένα συμπέρασμα: ο τελικός προορισμός του υλικού για AI είναι το υλικό να πάψει να είναι υπηρεσία και να διαλυθεί μέσα στην ύλη — και η σημερινή οικονομία του AI είναι αποτιμημένη πάνω στο στοίχημα ότι αυτό δεν θα συμβεί ποτέ. Ο κύβος, όπως τον περιγράψαμε, μάλλον δεν θα τρέξει ποτέ έναν κορυφαίο transformer· στην καθαρή εκδοχή μπαίνει εμπόδιο πραγματική φυσική. Όμως η κατεύθυνση που δείχνει — η εξαγωγή συμπερασμάτων να μεταναστεύει από τα μετρούμενα datacenters προς ιδιόκτητα αντικείμενα με οριακό κόστος σχεδόν μηδέν — στηρίζεται από κάθε ερευνητική γραμμή που μπορούμε να επαληθεύσουμε σήμερα.
Για μια επιχείρηση, το πρακτικό συμπέρασμα είναι πιο ήσυχο από το όραμα: μην αγκυρώνετε μια μακροπρόθεσμη στρατηγική στην υπόθεση ότι η νοημοσύνη θα μείνει ακριβή και νοικιασμένη. Χτίστε τις διαδικασίες σας έτσι ώστε το μοντέλο πίσω τους να αντικαθίσταται — γιατί θα αντικατασταθεί, πιθανώς από κάτι που θα σας ανήκει. Αν θέλετε να σκεφτούμε μαζί τι σημαίνει αυτό για τα δικά σας συστήματα, μιλήστε μας.