Το Project Opal ενσωματώθηκε στο Gemini και ο καθένας μπορεί να φτιάξει AI-powered εφαρμογές

Η τεχνολογία, στην πιο αγνή της μορφή, έχει πάντα στόχο τον εκδημοκρατισμό των δυνατοτήτων. Αν η πρώτη φάση της τεχνητής νοημοσύνης ήταν η πληροφορία και η συνομιλία, η επόμενη φάση είναι αναμφίβολα η δημιουργία.

Η Google, αντιλαμβανόμενη αυτή τη στροφή, κάνει ένα αποφασιστικό βήμα που αλλάζει τα δεδομένα στο οικοσύστημα του Android και του web: ενσωματώνει το πειραματικό εργαλείο Opal απευθείας στο περιβάλλον του Gemini. Τι σημαίνει πρακτικά αυτό; Ότι πλέον, η δημιουργία εφαρμογών δεν απαιτεί γνώσεις κώδικα, αλλά απλώς τη φαντασία και τη φυσική γλώσσα του χρήστη.

Από το chat στην ανάπτυξη εφαρμογών

Μέχρι πρότινος, η αλληλεπίδραση με τα Μεγάλα Γλωσσικά Μοντέλα (LLMs) περιοριζόταν κυρίως σε ερωταπαντήσεις ή τη δημιουργία κειμένου. Η νέα κίνηση της Google να φέρει το Opal, ένα project που γεννήθηκε στα εργαστήρια του Google Labs τον περασμένο Ιούλιο, μέσα στην καρδιά του Gemini στο web, μετατρέπει τον απλό χρήστη από καταναλωτή περιεχομένου σε αρχιτέκτονα λογισμικού.

Το Opal λειτουργεί ως ένα νέο είδος «Gem», επιτρέποντας στους χρήστες να κατασκευάζουν μικρο-εφαρμογές (mini apps) «στο φτερό». Δεν μιλάμε απλώς για προσαρμοσμένες οδηγίες (custom instructions), αλλά για λειτουργικά εργαλεία που μπορούν να εκτελέσουν σύνθετες διεργασίες, συνδυάζοντας εντολές (prompts), μοντέλα και εργαλεία. Είναι η επιτομή του "no-code" κινήματος, ενισχυμένη με την ισχύ της γενετικής τεχνητής νοημοσύνης.

Πώς λειτουργεί: Η λογική πίσω από το μηχανισμό

Η διαδικασία σχεδιάστηκε για να είναι διαισθητική. Ο χρήστης περιγράφει σε απλά ελληνικά (ή αγγλικά) τι θέλει να κάνει η εφαρμογή του. Το σύστημα αναλαμβάνει τα υπόλοιπα. Ωστόσο, η πραγματική καινοτομία που φέρνει η τρέχουσα αναβάθμιση βρίσκεται στον οπτικό επεξεργαστή (visual editor).

Η Google εισάγει μια νέα προβολή που μεταφράζει τις προτροπές του χρήστη σε μια λίστα βημάτων. Αυτό είναι εξαιρετικά σημαντικό για τη δομημένη σκέψη. Αντί ο χρήστης να παλεύει με παραγράφους κειμένου προσπαθώντας να μαντέψει πώς θα συμπεριφερθεί το μοντέλο, βλέπει τη λογική ροή της εφαρμογής του. Μπορεί να επεμβαίνει σε συγκεκριμένα στάδια, να διορθώνει τη λειτουργικότητα και να βελτιστοποιεί το αποτέλεσμα με χειρουργική ακρίβεια. Η πρόσβαση γίνεται εύκολα μέσω του μενού επιλογών (hamburger menu) στο Gemini, στην ενότητα "Gems".

Η κουλτούρα του Remixing

Ένα από τα πιο ενδιαφέροντα στοιχεία της ανακοίνωσης είναι η δυνατότητα του «remixing». Οι χρήστες δεν είναι αναγκασμένοι να ξεκινούν από το μηδέν. Μπορούν να περιηγηθούν σε μια λίστα από Gems που έχουν δημιουργηθεί από τα Labs της Google, να δουν πώς λειτουργούν και να τα τροποποιήσουν σύμφωνα με τις δικές τους ανάγκες.

Αυτή η προσέγγιση θυμίζει έντονα την open-source κοινότητα προγραμματιστών, αλλά προσαρμοσμένη για το ευρύ κοινό. Ένας εκπαιδευτικός, για παράδειγμα, θα μπορούσε να πάρει ένα mini app που δημιουργεί κουίζ ιστορίας και να το μετατρέψει σε εργαλείο εκμάθησης φυσικής, αλλάζοντας απλώς τις παραμέτρους και τα δεδομένα εισόδου, χωρίς να γράψει ούτε μια γραμμή κώδικα Python ή JavaScript.

Loading