ChatGPT Agent: Το νέο AI εργαλείο που ολοκληρώνει διεργασίες στον δικό του εικονικό υπολογιστή!

Η OpenAI ανακοίνωσε επίσημα τη διάθεση του νέου της ChatGPT agent, μιας καινοτόμας λειτουργίας που συνδυάζει τις δυνατότητες περιήγησης στο διαδίκτυο, επεξεργασίας δεδομένων και διαλόγου, σε μία ενιαία και πανίσχυρη τεχνητή νοημοσύνη. Η εξέλιξη αυτή σηματοδοτεί ένα σημαντικό βήμα προς τη δημιουργία ενός AI που όχι μόνο συνομιλεί με τον χρήστη, αλλά μπορεί πλέον να φέρει εις πέρας ολόκληρες εργασίες χρησιμοποιώντας το δικό του εικονικό υπολογιστικό σύστημα.

Η νέα λειτουργία φέρνει μαζί της τον συνδυασμό τριών βασικών τεχνολογιών της OpenAI: τον Operator, που έχει τη δυνατότητα περιήγησης και ανάληψης ενεργειών μέσω web, το Deep Research, που ειδικεύεται στην ανάλυση και σύνθεση μεγάλου όγκου πληροφοριών, και φυσικά το ήδη δημοφιλές ChatGPT, με τις εξελιγμένες διαλογικές του ικανότητες. Το αποτέλεσμα είναι ένας "πράκτορας" που μπορεί να αναλάβει πολύπλοκες αποστολές, όπως αναζητήσεις, λήψη αρχείων, δημιουργία παρουσιάσεων, προγραμματισμό, στατιστική ανάλυση και πολλά ακόμη — χωρίς ανθρώπινη παρέμβαση.

Ο ChatGPT agent διαθέτει πρόσβαση σε μια σειρά από εργαλεία που του επιτρέπουν να εκτελεί αυτά τα καθήκοντα. Μεταξύ αυτών περιλαμβάνονται ένας γραφικός web browser, ένας απλός text-based browser για πιο "λογικές" αναζητήσεις, πρόσβαση σε terminal, άμεση χρήση APIs, καθώς και ενσωμάτωση με connectors του ChatGPT. Αυτή η υποδομή επιτρέπει στο agent να χειρίζεται ολόκληρες ροές εργασίας με πλήρη κατανόηση του πλαισίου και των ενδιάμεσων βημάτων.

Ενδεικτικά, ο agent μπορεί να επισκεφθεί μια ιστοσελίδα, να κατεβάσει ένα αρχείο, να το επεξεργαστεί μέσω terminal και να παρουσιάσει το αποτέλεσμα στο γραφικό περιβάλλον περιήγησης, όλα αυτά αυτόνομα, χωρίς την ανάγκη εναλλαγής εργαλείων από τον χρήστη. Η OpenAI υποστηρίζει πως αυτός ο συνδυασμός εργαλείων επιτρέπει στο ChatGPT agent να επιτυγχάνει κορυφαίες επιδόσεις σε δοκιμές που αφορούν τόσο την περιήγηση στο διαδίκτυο όσο και την ολοκλήρωση πολύπλοκων, πραγματικών εργασιών.

Τα αποτελέσματα των εσωτερικών και εξωτερικών αξιολογήσεων είναι εντυπωσιακά. Σε τεστ όπως το Humanity’s Last Exam, ο agent πέτυχε νέο υψηλό ρεκόρ (SOTA) με σκορ 41.6, το οποίο ανεβαίνει στο 44.4 όταν εκτελείται πολλαπλά και επιλέγεται η πιο «σίγουρη» απάντηση. Στο FrontierMath, έφτασε το 27.4% σε ακρίβεια. Στο εσωτερικό benchmark της OpenAI για εργασίες υψηλής οικονομικής και γνωσιακής αξίας, η απόδοση του agent ισοδυναμεί ή ξεπερνά την ανθρώπινη σε περίπου τις μισές περιπτώσεις.

Επιπλέον, σε ειδικά τεστ όπως το DSBench για επιστήμη δεδομένων και το SpreadsheetBench για υπολογιστικά φύλλα, ο ChatGPT agent ξεπερνά ξεκάθαρα τις επιδόσεις άλλων συστημάτων. Ενδεικτικά, στο SpreadsheetBench πέτυχε σκορ 45.5%, έναντι μόλις 20% του Copilot in Excel. Στο BrowseComp, κατέρριψε το προηγούμενο ρεκόρ φτάνοντας στο 68.9%, ενώ στο WebArena σημείωσε 65.4%.

Ο agent είναι ήδη διαθέσιμος στη λίστα εργαλείων του ChatGPT μέσα από τη νέα λειτουργία agent mode. Κατά τη διάρκεια εκτέλεσης μιας εργασίας, οι χρήστες μπορούν να βλέπουν περιγραφική αφήγηση στην οθόνη και να παρεμβαίνουν οποτεδήποτε κρίνουν απαραίτητο, αναλαμβάνοντας τον έλεγχο του browser.

Όσον αφορά τη διαθεσιμότητα, η OpenAI ανακοίνωσε ότι η νέα δυνατότητα θα είναι διαθέσιμη αρχικά για τους χρήστες του ChatGPT Pro μέχρι το τέλος της ημέρας. Οι χρήστες των εκδόσεων ChatGPT Plus και Team θα έχουν πρόσβαση τις επόμενες ημέρες, ενώ οι πελάτες Enterprise και Education θα ακολουθήσουν τις προσεχείς εβδομάδες.

Οι χρήστες Pro θα έχουν στη διάθεσή τους 400 μηνύματα τον μήνα για χρήση του agent, ενώ οι υπόλοιποι επί πληρωμή χρήστες θα έχουν περιορισμό στα 40 μηνύματα. Υπάρχει πάντως η δυνατότητα αγοράς επιπλέον χρήσης μέσω ευέλικτων επιλογών με credits, προσφέροντας έτσι μεγαλύτερη ελευθερία σε όσους θέλουν να αξιοποιήσουν περισσότερο τις δυνατότητες του συστήματος.

[via]

Loading