Η Anthropic σχεδιάζει δικούς της επεξεργαστές AI για να «χτυπήσει» τη Nvidia

Σύνοψη

Η Anthropic βρίσκεται σε προχωρημένες συζητήσεις με τη Samsung για την κατασκευή ενός custom AI chip.
Ο νέος επεξεργαστής αναμένεται να βασιστεί στην κορυφαία αρχιτεκτονική των 2 νανομέτρων (2nm) του τμήματος Samsung Foundry.
Η εταιρεία προσέλαβε πρόσφατα τον Clive Chan, πρώην μηχανικό της OpenAI, για να ηγηθεί του τεχνικού σχεδιασμού.
Στόχος είναι η μείωση της εξάρτησης από τη Nvidia και η βελτιστοποίηση του λειτουργικού κόστους (inference) των μοντέλων Claude.
Η κίνηση έπεται της πρόσφατης παρουσίασης του επεξεργαστή "Jalapeño" από την ανταγωνίστρια OpenAI, επιβεβαιώνοντας τη στροφή των εταιρειών AI στο in-house hardware.

Η Anthropic, η εταιρεία πίσω από τη δημοφιλή οικογένεια μοντέλων τεχνητής νοημοσύνης Claude, προχωρά στον σχεδιασμό των δικών της, προσαρμοσμένων (custom) επεξεργαστών AI.

Σύμφωνα με πηγές από το The Information, η εταιρεία βρίσκεται ήδη σε πρώιμες συζητήσεις με τη Samsung, η οποία αναμένεται να αναλάβει τον ρόλο του βασικού κατασκευαστικού εταίρου. Η στρατηγική αυτή επιλογή υποδηλώνει την ξεκάθαρη πρόθεση της Anthropic να αυτονομηθεί σταδιακά από την κυριαρχία της Nvidia και να ελέγξει πλήρως το hardware που τροφοδοτεί τα πολύπλοκα συστήματά της.

Η κατασκευή ενός αποκλειστικού chip δεν αποτελεί απλώς μια δοκιμή, αλλά μια απόλυτη τεχνική αναγκαιότητα. Η πρόσφατη πρόσληψη του Clive Chan, ενός κορυφαίου μηχανικού που προηγουμένως εργαζόταν στο αντίστοιχο πρόγραμμα ανάπτυξης επεξεργαστών της OpenAI, σηματοδοτεί τη μετάβαση της Anthropic από το στάδιο της διερεύνησης στην ενεργή ανάπτυξη hardware. Αν και το έργο βρίσκεται σε αρχικό στάδιο και ο ακριβής σχεδιασμός, η αρχιτεκτονική συνόλου εντολών ή η συνολική ισχύς του chip δεν έχουν οριστικοποιηθεί, οι μακροπρόθεσμες προθέσεις είναι σαφείς.

Η τεχνολογία των 2nm και το ανταγωνιστικό πλεονέκτημα της Samsung

Η επιλογή της Samsung ως πιθανού κατασκευαστή βασίζεται καθαρά σε τεχνικά και επιχειρηματικά κριτήρια. Οι συζητήσεις επικεντρώνονται στη χρήση της προηγμένης διαδικασίας κατασκευής των 2 νανομέτρων (2nm) του τμήματος Samsung Foundry. Η συγκεκριμένη λιθογραφία προσφέρει δραματική αύξηση στην πυκνότητα των τρανζίστορ σε σχέση με τους σημερινούς κόμβους των 4nm ή 3nm. Πρακτικά, αυτό μεταφράζεται σε σημαντικά υψηλότερη επεξεργαστική ισχύ με ταυτόχρονη, εντυπωσιακή μείωση της κατανάλωσης ενέργειας.

Παράλληλα, η Anthropic εξετάζει την αξιοποίηση των κορυφαίων τεχνολογιών συσκευασίας (advanced packaging) της νοτιοκορεατικής εταιρείας. Οι τεχνικές αυτές (όπως το X-Cube της Samsung) επιτρέπουν την τοποθέτηση του κύριου επεξεργαστή εξαιρετικά κοντά στα chips μνήμης υψηλού εύρους ζώνης (HBM). Το αποτέλεσμα είναι η κατακόρυφη αύξηση των ταχυτήτων μεταφοράς δεδομένων και η ελαχιστοποίηση των σημείων συμφόρησης (bottlenecks) κατά τη διάρκεια απαιτητικών εργασιών inferencing.

Αξίζει να σημειωθεί πως οι δεσμοί μεταξύ των δύο εταιρειών διαθέτουν ήδη γερά θεμέλια. Τον περασμένο Μάιο, η Anthropic ολοκλήρωσε έναν τεράστιο γύρο χρηματοδότησης (Series H) ύψους 65 δισεκατομμυρίων δολαρίων όπου συμμετείχαν ως «στρατηγικοί εταίροι υποδομών» οι τρεις μεγαλύτεροι κατασκευαστές μνήμης παγκοσμίως: η Samsung, η SK Hynix και η Micron. Το γεγονός ότι η Samsung είναι η μοναδική από τις τρεις που διαθέτει ταυτόχρονα τμήμα κατασκευής μνήμης και υπερσύγχρονο τμήμα foundry, της δίνει ένα αδιαμφισβήτητο πλεονέκτημα για την ανάληψη αυτού του κρίσιμου έργου, αφήνοντας την TSMC εκτός κάδρου για τη συγκεκριμένη συμφωνία.

Ο ανταγωνισμός και η απάντηση στην OpenAI

Η στροφή προς το custom hardware αποτελεί πλέον μονόδρομο για τις κορυφαίες εταιρείες τεχνητής νοημοσύνης. Η Nvidia εξακολουθεί να ελέγχει το συντριπτικά μεγαλύτερο μερίδιο της αγοράς με τις κορυφαίες GPUs της, ωστόσο η υψηλή ζήτηση, το τεράστιο κόστος απόκτησης και οι διαρκείς περιορισμοί στην εφοδιαστική αλυσίδα αναγκάζουν τους ισχυρούς "παίκτες" να αναζητήσουν εναλλακτικές διαδρομές.

Μόλις τον περασμένο μήνα, η OpenAI, ο μεγαλύτερος ανταγωνιστής της Anthropic, παρουσίασε το "Jalapeño", το πρώτο in-house AI inference chip που ανέπτυξε σε συνεργασία με την Broadcom (ύστερα από κύκλο ανάπτυξης μόλις εννέα μηνών) και το οποίο κατασκευάζεται από την TSMC. Το chip αυτό προορίζεται αποκλειστικά για εσωτερική χρήση, βελτιστοποιώντας τον χρόνο απόκρισης του ChatGPT και των σχετικών API. Παράλληλα, τεχνολογικοί κολοσσοί όπως η Google με τους Tensor Processing Units (TPUs), η Amazon με τους επεξεργαστές Trainium και Inferentia, η Microsoft με το Maia accelerator και η Meta με τα MTIA chips, έχουν ήδη επενδύσει δισεκατομμύρια δολάρια στο δικό τους, απόλυτα ελεγχόμενο hardware.

Μέχρι σήμερα, πάντως, η Anthropic ακολουθεί μια ισχυρή στρατηγική διαφοροποίησης. Συνεργάζεται στενά με την Google και την Amazon, χρησιμοποιώντας TPUs και AWS chips αντίστοιχα, παράλληλα με τις GPUs της Nvidia (διαθέτει ήδη πρόσβαση σε περίπου 3.5 gigawatts υπολογιστικής χωρητικότητας μέσω συμφωνιών). Ένα δικό της custom chip θα προσθέσει τον απόλυτο έλεγχο στην υποδομή της, επιτρέποντας την τέλεια και στοχευμένη ευθυγράμμιση μεταξύ του λογισμικού (των μοντέλων Claude) και του υλικού.

Τα οικονομικά του AI Inference και το κόστος ανάπτυξης

Ο θεμελιώδης λόγος πίσω από την κοστοβόρα ανάπτυξη αυτών των μικροεπεξεργαστών είναι καθαρά η μακροπρόθεσμη οικονομική βιωσιμότητα. Ενώ η αρχική εκπαίδευση (training) των Μεγάλων Γλωσσικών Μοντέλων (LLMs) απαιτεί ασύλληπτη υπολογιστική ισχύ και διαρκεί μήνες, το μεγαλύτερο λειτουργικό κόστος προέρχεται από το inference. Η εξυπηρέτηση εκατομμυρίων χρηστών καθημερινά, όπου κάθε μεμονωμένο ερώτημα (prompt) στο chatbot καταναλώνει σημαντικούς υπολογιστικούς πόρους, εκτινάσσει τα λειτουργικά έξοδα στα ύψη.

Ο σχεδιασμός ενός κορυφαίου AI chip από το μηδέν αποτελεί μια επένδυση υψηλού ρίσκου που μπορεί να κοστίσει περίπου 500 εκατομμύρια δολάρια. Απαιτείται εξειδικευμένο ταλέντο, εργαλεία αυτοματοποίησης ηλεκτρονικού σχεδιασμού (EDA), εκτεταμένες δοκιμές και αυστηροί έλεγχοι παραγωγής για την αποφυγή κατασκευαστικών ελαττωμάτων. Ωστόσο, η απόσβεση είναι συνήθως ταχύτατη. Η βελτιστοποίηση της αρχιτεκτονικής αποκλειστικά για τα συγκεκριμένα workloads των μοντέλων της εκάστοτε εταιρείας σημαίνει λιγότερη σπατάλη ενέργειας, ταχύτερους χρόνους απόκρισης και, τελικά, κάθετη μείωση του κόστους ανά παραγόμενο token. Η κίνηση της Anthropic είναι, επομένως, μια κίνηση εξασφάλισης της μελλοντικής της κερδοφορίας.