OpenAI Jalapeño: Το πρώτο custom AI chip σε συνεργασία με την Broadcom

Σύνοψη

Η OpenAI ανακοίνωσε επίσημα το Jalapeño, το πρώτο in-house AI chip που σχεδίασε η ίδια.
Ο επεξεργαστής κατασκευάστηκε σε συνεργασία με την Broadcom και εστιάζει αποκλειστικά στο LLM inference, όχι στην εκπαίδευση μοντέλων.
Ο χρόνος ανάπτυξης (από τον σχεδιασμό έως το tape-out) διήρκεσε μόλις εννέα μήνες, αποτελώντας ρεκόρ για τον κλάδο των ημιαγωγών.
Η παραγωγή θα ανατεθεί στην TSMC, ενώ η Celestica αναλαμβάνει τη δημιουργία των server συστημάτων.
Στόχος της OpenAI είναι να μειώσει την εξάρτησή της από την Nvidia, πετυχαίνοντας ταυτόχρονα τεράστια εξοικονόμηση στην κατανάλωση ενέργειας.

Η OpenAI προχώρησε στα επίσημα αποκαλυπτήρια του πρώτου της custom επεξεργαστή τεχνητής νοημοσύνης. Φέροντας την κωδική ονομασία Jalapeño, το νέο chip αναπτύχθηκε σε στενή συνεργασία με την Broadcom και αποτελεί τον ακρογωνιαίο λίθο της νέας υπολογιστικής πλατφόρμας που χτίζει η εταιρεία.

Η κίνηση της OpenAI να εισέλθει στην ανάπτυξη hardware υποδηλώνει τη σαφή πρόθεση της να ελέγξει ολόκληρη το πακέτο της τεχνολογίας της, μιας και μέχρι σήμερα, η εταιρεία βασιζόταν αποκλειστικά σε λύσεις τρίτων κατασκευαστών και κυρίως στις πανίσχυρες αλλά εξαιρετικά ακριβές και δυσεύρετες GPU της Nvidia. Με το Jalapeño, η OpenAI επιχειρεί να μεταβάλει τα οικονομικά δεδομένα της λειτουργίας των τεράστιων γλωσσικών μοντέλων (LLMs), προσφέροντας ταχύτερη, πιο αξιόπιστη και κυρίως πιο προσιτή νοημοσύνη στους τελικούς χρήστες και τις επιχειρήσεις.

Αρχιτεκτονική εστιασμένη στην παραγωγή απαντήσεων

Το βασικό χαρακτηριστικό του Jalapeño είναι ότι δεν πρόκειται για έναν επεξεργαστή γενικής χρήσης, ούτε δημιουργήθηκε για να εκπαιδεύει νέα μοντέλα. Αντιθέτως, έχει σχεδιαστεί από το μηδέν αποκλειστικά για τη διαδικασία του inference, δηλαδή τη διαδικασία κατά την οποία ένα ήδη εκπαιδευμένο μοντέλο λαμβάνει το ερώτημα του χρήστη και παράγει την απάντηση. Ενώ η εκπαίδευση μοντέλων απαιτεί ωμή υπολογιστική ισχύ, το inference εξαρτάται σε τεράστιο βαθμό από το εύρος ζώνης της μνήμης (memory bandwidth) και τη χαμηλή καθυστέρηση (latency) στη μεταφορά των δεδομένων.

Η OpenAI οπτικοποίησε την αρχιτεκτονική του Jalapeño με βάση την καθημερινή εμπειρία της από τη λειτουργία του ChatGPT, του Codex και των API της. Το chip σχεδιάστηκε για να διαχειρίζεται με κορυφαία αποδοτικότητα τα key-value (KV) caches που απαιτούνται στις αρχιτεκτονικές transformer, μειώνοντας την άσκοπη μετακίνηση δεδομένων. Σύμφωνα με τα πρώτα στοιχεία, το Jalapeño προσφέρει κορυφαία απόδοση ανά watt, επιτρέποντας στα data centers να διαχειρίζονται πολύ μεγαλύτερο όγκο υπολογισμών εντός του ίδιου ενεργειακού προϋπολογισμού.

Ήδη, στα εργαστήρια της εταιρείας, ορισμένα πρωτότυπα του Jalapeño εκτελούν φόρτους εργασίας μηχανικής μάθησης, συμπεριλαμβανομένου του μοντέλου GPT-5.3-Codex-Spark, λειτουργώντας εντός των προβλεπόμενων στόχων κατανάλωσης ενέργειας και συχνότητας.

Αξιοσημείωτο είναι το γεγονός ότι ο κύκλος ανάπτυξης του chip, από τον αρχικό σχεδιασμό μέχρι το στάδιο ετοιμότητας για κατασκευή, ολοκληρώθηκε σε μόλις εννέα μήνες. Για τα δεδομένα της βιομηχανίας των προηγμένων ημιαγωγών, όπου οι κύκλοι ανάπτυξης μετρώνται σε χρόνια, πρόκειται για ένα ασύλληπτα σύντομο χρονικό διάστημα. Η επιτάχυνση αυτή κατέστη δυνατή χάρη στην ίδια την τεχνητή νοημοσύνη, αφού η OpenAI χρησιμοποίησε τα δικά της μοντέλα AI για να συνδράμει τη Broadcom στη βελτιστοποίηση και τον σχεδιασμό τμημάτων του επεξεργαστή.

Η Broadcom συνεισέφερε την πολύτιμη τεχνογνωσία της στην υλοποίηση του πυριτίου, καθώς και κορυφαίες τεχνολογίες δικτύωσης, συμπεριλαμβανομένων των Tomahawk δικτυακών chips, τα οποία είναι απαραίτητα για την κλιμάκωση του συστήματος σε επίπεδο τεράστιων data centers. Παράλληλα, η εταιρεία Celestica ανέλαβε την κατασκευή των motherboards και την ολοκλήρωση των server racks. Το τελικό προϊόν θα κατασκευαστεί από την ταϊβανέζικη TSMC, η οποία αποτελεί σταθερά τον αδιαμφισβήτητο ηγέτη στην παραγωγή προηγμένων ημιαγωγών.

Το οικοσύστημα και η αγορά

Η δημιουργία του Jalapeño τοποθετεί την OpenAI σε ένα κλειστό γκρουπ τεχνολογικών κολοσσών που σχεδιάζουν τα δικά τους chips, όπως η Google (με τα TPUs), η Amazon (με τα Trainium/Inferentia), η Microsoft (με τον Maia) και η Meta (με το MTIA). Η μετάβαση αυτή επιβεβαιώνει πως η αγορά off-the-shelf επεξεργαστών δεν επαρκεί πλέον για να καλύψει τις εξειδικευμένες ανάγκες και το τεράστιο λειτουργικό κόστος των εταιρειών που ηγούνται της κούρσας της τεχνητής νοημοσύνης.

Οι πρώτες εγκαταστάσεις υπολογιστικών συστημάτων εξοπλισμένων με Jalapeño αναμένεται να τεθούν σε λειτουργία στα τέλη του 2026, αρχικά μέσω των data centers της Microsoft, βασικού συνεργάτη της OpenAI. Ο μακροπρόθεσμος στόχος είναι εξαιρετικά φιλόδοξος με κλιμάκωση της υποδομής σε επίπεδο gigawatt και ορίζοντα υλοποίησης τα τέλη της δεκαετίας.