Colossus: Σε λειτουργία ο υπερυπολογιστής του Elon Musk, στόχος οι 1 εκατομμύριο GPUs!

Η πρώτη φάση του υπερφιλόδοξου υπερυπολογιστικού κέντρου τεχνητής νοημοσύνης της εταιρείας xAI, με την επωνυμία Colossus, τέθηκε σε πλήρη λειτουργία στο Μέμφις του Τενεσί, σύμφωνα με ρεπορτάζ του Tom’s Hardware. Το σύστημα έχει πλέον συνδεθεί στο κύριο δίκτυο ηλεκτροδότησης της πόλης, αποκτώντας πρόσβαση σε ισχύ 150 μεγαβάτ (MW), απαραίτητη για τη λειτουργία του κέντρου που τρέχει ήδη 200.000 GPU της Nvidia.

Η xAI, που ιδρύθηκε από τον Elon Musk το καλοκαίρι του 2023 με στόχο, όπως δήλωσε, «την κατανόηση της πραγματικότητας», κινείται με καταιγιστικούς ρυθμούς στον χώρο της Τεχνητής Νοημοσύνης. Μέσα σε λιγότερο από δύο χρόνια, η εταιρεία έχει κατασκευάσει έναν από τους μεγαλύτερους και πιο ισχυρούς υπερυπολογιστές στον κόσμο, με σκοπό να ανταγωνιστεί κολοσσούς όπως το Oracle Cloud Infrastructure (OCI), που διαθέτει περισσότερες από 131.000 GPU.

Το Colossus ξεκίνησε με 100.000 Nvidia H100 Hopper AI accelerators και διπλασίασε τον αριθμό σε 200.000 μέσα σε μόλις 92 ημέρες. Σύμφωνα με την ίδια την xAI, το project κατασκευάστηκε αρχικά σε μόλις 122 ημέρες, γεγονός που αποτελεί εξαιρετικά ταχύ ρυθμό για τέτοιου μεγέθους έργο τεχνολογικής υποδομής.

Ένα από τα σημαντικότερα εμπόδια που κλήθηκε να αντιμετωπίσει η xAI ήταν η ηλεκτρική τροφοδοσία ενός τόσο ενεργοβόρου συστήματος. Κατά την έναρξη λειτουργίας, το Colossus λάμβανε μόλις 7MW από το τοπικό δίκτυο, με αποτέλεσμα να καταφύγει στη χρήση γεννητριών φυσικού αερίου για την κάλυψη των αναγκών του. Η επιλογή αυτή προκάλεσε αντιδράσεις από κατοίκους της περιοχής, κυρίως για λόγους περιβαλλοντικής όχλησης.

Ωστόσο, με την επίσημη σύνδεση στο δίκτυο της πόλης του Μέμφις, η κατάσταση έχει πλέον εξομαλυνθεί. Το κέντρο λαμβάνει πλέον τα 150MW που χρειάζεται, γεγονός που επέτρεψε τη δραστική μείωση χρήσης των γεννητριών. Επιπλέον, διαθέτει εφεδρικό ενεργειακό απόθεμα ισχύος 150MW σε μπαταρίες Tesla, το οποίο ενεργοποιείται σε περίπτωση ανάγκης.

Η δεύτερη φάση του Colossus, που αναμένεται να ξεκινήσει το φθινόπωρο, θα απαιτήσει 300MW ισχύος, με μια νέα υποσταθμική μονάδα να είναι ήδη στα σκαριά για να καλύψει τις αυξημένες ενεργειακές ανάγκες. Στόχος της xAI είναι η σταδιακή αύξηση των GPU σε 1 εκατομμύριο μονάδες, εδραιώνοντας τη θέση της ως κορυφαίου παίκτη στην κούρσα της τεχνητής νοημοσύνης.

Το Colossus χρησιμοποιείται ήδη για την εκπαίδευση μεγάλων γλωσσικών μοντέλων (LLMs), τόσο για εμπορική χρήση όσο και για τις δικές του εφαρμογές, με χαρακτηριστικότερο παράδειγμα τον Grok, τον AI βοηθό που είναι ενσωματωμένος στο X (πρώην Twitter). Η xAI κυκλοφόρησε πρόσφατα την beta έκδοση του Grok 3, η οποία επιτρέπει στους χρήστες να βλέπουν όχι μόνο την απάντηση που δίνει η AI, αλλά και τη λογική που ακολουθήθηκε για την εξαγωγή της.

Το εγχείρημα του Musk, που ξεκίνησε με φιλόδοξες δηλώσεις και σκεπτικισμό, εξελίσσεται ταχύτατα σε μία από τις πλέον επιδραστικές προσπάθειες στον τομέα της Τεχνητής Νοημοσύνης, τόσο σε επίπεδο υποδομών όσο και εφαρμογών. Η ολοκλήρωση και ανάπτυξη του Colossus αναμένεται να αλλάξει τα δεδομένα στην παγκόσμια αγορά AI, ενώ φέρνει τον ανταγωνισμό με εταιρείες όπως η OpenAI και η Google σε νέο επίπεδο.

[via]

Loading