Google Gemini: Πλέον μπορείς να τροφοδοτείς το AI εργαλείο και με αρχεία ήχου

Μετά από μήνες αναμονής και αμέτρητα αιτήματα χρηστών, η Google ανακοίνωσε ότι η εφαρμογή Gemini αποκτά πλέον υποστήριξη για αρχεία ήχου. Μέχρι σήμερα, το AI εργαλείο μπορούσε να επεξεργάζεται εικόνες, PDFs, ακόμα και βίντεο, αλλά η απουσία του ήχου αποτελούσε ένα εμφανές κενό. Τώρα όμως, η λειτουργία ενεργοποιήθηκε σε Android, iOS και web, φέρνοντας το Gemini πιο κοντά στις δυνατότητες των ανταγωνιστών του.

Ο Josh Woodward, Αντιπρόεδρος του Google Labs και επικεφαλής του Gemini, ανακοίνωσε μέσω X ότι πρόκειται για το «νούμερο ένα αίτημα» των χρηστών. Η νέα επιλογή εμφανίζεται στο γνώριμο μενού “Upload files” και υποστηρίζει τους πιο συνηθισμένους τύπους αρχείων, όπως MP3 και WAV, διευρύνοντας σημαντικά τα σενάρια χρήσης.

Η λειτουργία συνοδεύεται από ορισμένους περιορισμούς, οι οποίοι διαφοροποιούνται ανάλογα με το συνδρομητικό πακέτο. Οι δωρεάν χρήστες μπορούν να ανεβάσουν έως δέκα αρχεία κάθε φορά, με συνολική διάρκεια που δεν ξεπερνά τα δέκα λεπτά. Αντίθετα, οι συνδρομητές των πακέτων Gemini Advanced μέσω AI Pro ή AI Ultra αποκτούν πολύ μεγαλύτερη ευελιξία, καθώς το όριο ανεβαίνει στις τρεις ώρες συνολικού ήχου.

Αν και δεν πρόκειται για απεριόριστη χρήση, τα όρια κρίνονται γενναιόδωρα. Για παράδειγμα, τα βίντεο εξακολουθούν να έχουν πιο αυστηρό πλαφόν: μόλις πέντε λεπτά για δωρεάν χρήστες και μία ώρα για όσους πληρώνουν. Με τον ήχο, η Google δίνει διπλάσιο χρόνο στη δωρεάν εκδοχή και τριπλάσιο εύρος στα επί πληρωμή πακέτα, κάτι που κάνει τη λειτουργία ιδανική για μεταγραφές, ανάλυση συναντήσεων ή επεξεργασία αποσπασμάτων podcast.

Η απουσία υποστήριξης ήχου φαινόταν παράδοξη, δεδομένου ότι το Gemini μπορούσε ήδη να συνοψίζει βίντεο από το YouTube και να χειρίζεται μικρά κλιπ. Ωστόσο, η δυνατότητα επεξεργασίας φωνητικών σημειώσεων ή ηχογραφήσεων δεν ήταν διαθέσιμη, περιορίζοντας τις επιλογές των χρηστών. Με την προσθήκη αυτή, ανοίγονται νέες προοπτικές στην καθημερινή χρήση: από φοιτητές που θέλουν να μετατρέψουν ένα κομμάτι διάλεξης σε σημειώσεις, μέχρι επαγγελματίες που χρειάζονται απομαγνητοφώνηση μιας συνάντησης.

Η κίνηση αυτή φέρνει το Gemini πιο κοντά στο ChatGPT της OpenAI, το οποίο υποστηρίζει uploads ήχου και απομαγνητοφωνήσεις εδώ και αρκετούς μήνες. Παρόλα αυτά, η Google φαίνεται να χρησιμοποιεί τα όρια διάρκειας ως μοχλό για την ενίσχυση των συνδρομών της. Δέκα λεπτά μπορεί να αρκούν για τους περιστασιακούς χρήστες, αλλά όσοι χρειάζονται εκτενέστερη χρήση είναι πιθανό να στραφούν στις επί πληρωμή εκδόσεις.

Loading