Ο ανθρώπινος κυτταρικός κόσμος είναι ένας λαβύρινθος απίστευτης πολυπλοκότητας. Μέσα σε κάθε κύτταρο, τρισεκατομμύρια μόρια –μεταξύ τους πάνω από 40 εκατομμύρια πρωτεΐνες– κινούνται, αντιδρούν και αναδιοργανώνονται σε μια συνεχή χημική καταιγίδα. Το κυτταρόπλασμα λειτουργεί σαν ένα μικροσκοπικό εργαστήριο, όπου κάθε δευτερόλεπτο εκτυλίσσονται χιλιάδες αλυσιδωτές αντιδράσεις. Και στο κέντρο αυτής της θύελλας, ο πυρήνας ενεργοποιεί και απενεργοποιεί γονίδια με απόλυτη ακρίβεια, συντονίζοντας τη ζωή του κυττάρου.
Η πολυπλοκότητα αυτή υπερβαίνει, προς το παρόν, τη δυνατότητα πλήρους κατανόησης από τον ανθρώπινο νου. Ωστόσο, πολλοί ερευνητές πιστεύουν ότι η τεχνητή νοημοσύνη (AI) ίσως αποτελέσει το κλειδί που θα ανοίξει αυτή την πόρτα. Με τη δύναμη επεξεργασίας και μάθησης που έχει ήδη αποδείξει με μοντέλα όπως το GPT-5, η AI ίσως καταφέρει να μοντελοποιήσει τη λειτουργία ενός ανθρώπινου κυττάρου σε υπολογιστικό επίπεδο.
Η προσπάθεια να αναπαρασταθεί ένα κύτταρο ψηφιακά ξεκίνησε πριν από περίπου 25 χρόνια, με μαθηματικά μοντέλα βασισμένα σε εξισώσεις που περιέγραφαν βασικές βιοχημικές διεργασίες. Ένα σημαντικό βήμα έγινε το 2012, όταν ο Jonathan Karr και η ομάδα του στο Stanford παρουσίασαν το πρώτο «ολόκληρο κύτταρο» σε υπολογιστική μορφή, ένα μοντέλο του μικροβίου Mycoplasma genitalium. Αν και πρωτόγονο, το επίτευγμα αυτό έδειξε ότι η προσομοίωση ζωής, έστω και σε απλή μορφή, ήταν εφικτή.
Δέκα χρόνια αργότερα, οι εξελίξεις στους υπολογιστές και στα δεδομένα επέτρεψαν πιο σύνθετες και ρεαλιστικές προσεγγίσεις. Το 2022, η Zan Luthey-Schulten του University of Illinois παρουσίασε ένα τρισδιάστατο μοντέλο βασισμένο σε ένα «ελάχιστο» βακτήριο με μόλις 493 γονίδια. Για να προσομοιωθούν 20 λεπτά ζωής του κυττάρου απαιτήθηκαν σχεδόν 10 ώρες επεξεργασίας σε ισχυρά GPUs. Το αποτέλεσμα, όμως, ήταν μια πρωτόγνωρη ματιά στο εσωτερικό ενός ζωντανού οργανισμού.
Η πραγματική επανάσταση ξεκίνησε με την είσοδο της τεχνητής νοημοσύνης στο πεδίο. Όπως τα γλωσσικά μοντέλα που «μαθαίνουν» τη γλώσσα μέσα από τεράστιες ποσότητες δεδομένων, έτσι και τα λεγόμενα AI cell models εκπαιδεύονται με δεδομένα γονιδιακής δραστηριότητας από εκατομμύρια κύτταρα. Δεν βασίζονται σε εξισώσεις, αλλά σε μάθηση μέσω παρατήρησης, εξάγοντας κανόνες και σχέσεις χωρίς ανθρώπινη καθοδήγηση.
Ένα από τα πρώτα τέτοια μοντέλα, το Geneformer, παρουσιάστηκε το 2023 από την Christina Theodoris του University of California, San Francisco. Εκπαιδεύτηκε σε δεδομένα από 30 εκατομμύρια ανθρώπινα κύτταρα και κατάφερε να προβλέψει ποια γονίδια σχετίζονται με καρδιομυοπάθειες. Η ομάδα χρησιμοποίησε στη συνέχεια το CRISPR για να «απενεργοποιήσει» δύο από αυτά, διαπιστώνοντας ότι η καρδιακή λειτουργία των καλλιεργημένων κυττάρων βελτιώθηκε, μια ένδειξη ότι τέτοιες AI προσεγγίσεις μπορούν να επιταχύνουν την ανακάλυψη νέων φαρμάκων.
Άλλο εντυπωσιακό παράδειγμα είναι το TranscriptFormer, ένα AI μοντέλο που εκπαιδεύτηκε σε δεδομένα από 112 εκατομμύρια κύτταρα 12 διαφορετικών ειδών. Το μοντέλο κατάφερε όχι μόνο να ταξινομήσει σπάνιους τύπους ανθρώπινων κυττάρων, αλλά και να προβλέψει πώς επηρεάζονται από ιούς όπως ο SARS-CoV-2 ή από φάρμακα, χωρίς πρόσθετη εκπαίδευση. Οι ερευνητές το χαρακτήρισαν ικανό για “zero-shot learning”, δηλαδή τη δυνατότητα να εξάγει σωστά συμπεράσματα για εντελώς νέα δεδομένα.
Η προοπτική είναι τεράστια. Αν αυτά τα μοντέλα αποδειχθούν αξιόπιστα, θα μπορούσαν να μεταμορφώσουν τη βιοϊατρική έρευνα. Οι φαρμακευτικές εταιρείες θα μπορούν να δοκιμάζουν εικονικά χιλιάδες υποψήφιες ουσίες πριν καν προχωρήσουν σε πειράματα. Οι γιατροί ίσως αποκτήσουν τη δυνατότητα να δημιουργούν ένα ψηφιακό αντίγραφο των κυττάρων ενός ασθενούς, ώστε να επιλέγουν εξατομικευμένες θεραπείες.
Ταυτόχρονα, πρωτοβουλίες όπως το Virtual Cell Challenge επιχειρούν να επιταχύνουν την πρόοδο. Ο διαγωνισμός, που συγκέντρωσε πάνω από 1000 ομάδες από όλο τον κόσμο, ζητά από τα AI μοντέλα να προβλέψουν τις επιπτώσεις της «σιγής» συγκεκριμένων γονιδίων σε ανθρώπινα βλαστικά κύτταρα. Οι νικητές θα λάβουν 100.000 δολάρια και χρόνο σε GPUs προσφορά της Nvidia, αλλά το πραγματικό έπαθλο είναι η βελτίωση της επιστημονικής γνώσης.
Παρά τη φρενίτιδα, οι ερευνητές παραδέχονται ότι τα περισσότερα AI κυτταρικά μοντέλα δεν έχουν ακόμη φτάσει τις προσδοκίες. Πολλές φορές αποδίδουν χειρότερα από απλούστερες μαθηματικές μεθόδους, ενώ η έλλειψη επαρκών και ενοποιημένων δεδομένων αποτελεί σοβαρό εμπόδιο. Ο Jonathan Karr τονίζει την ανάγκη για μια κεντρική βάση δεδομένων, αντίστοιχη με το Protein Data Bank που επέτρεψε την επιτυχία του AlphaFold, του AI συστήματος που προβλέπει τη δομή των πρωτεϊνών και χάρισε στους δημιουργούς του το Νόμπελ Χημείας το 2024.
[source]