Gemini Live: Ο έξυπνος βοηθός γίνεται πιο φυσικός και πιο χρήσιμος

Η Google συνεχίζει να εξελίσσει το Gemini, το εργαλείο τεχνητής νοημοσύνης που φιλοδοξεί να μετατραπεί στον απόλυτο προσωπικό βοηθό. Με την έλευση του Gemini Live πέρυσι, οι χρήστες των Pixel 9 είχαν την ευκαιρία να συνομιλούν με το σύστημα σε πιο φυσικό, ρέοντα διάλογο. Σήμερα, η εταιρεία παρουσιάζει ένα σύνολο αναβαθμίσεων που δίνουν στον ψηφιακό βοηθό περισσότερες δυνατότητες, πιο φυσική φωνή και βαθύτερη σύνδεση με τις εφαρμογές που χρησιμοποιούν οι χρήστες στην καθημερινότητά τους.

Οπτική καθοδήγηση σε πραγματικό χρόνο

Μία από τις πιο εντυπωσιακές προσθήκες είναι η δυνατότητα οπτικής βοήθειας μέσα από την κάμερα του κινητού. Όταν ο χρήστης μοιράζεται την εικόνα με το Gemini Live, η εφαρμογή δεν περιορίζεται στο να αναγνωρίζει τα αντικείμενα, αλλά τα επισημαίνει πάνω στην οθόνη με γραφικά στοιχεία. Αυτό ανοίγει νέους δρόμους στη μάθηση και στην επίλυση καθημερινών αποριών.

Για παράδειγμα, αν κάποιος διστάζει ανάμεσα σε δύο ζευγάρια αθλητικά παπούτσια, το Gemini μπορεί να τα συγκρίνει και να υποδείξει ποιο ταιριάζει καλύτερα με το ντύσιμο που έχει στο μυαλό του. Αντίστοιχα, αν κάποιος δείχνει με την κάμερα τα εργαλεία στο συρτάρι του, ο βοηθός μπορεί να τον κατευθύνει προς εκείνο που χρειάζεται για μια συγκεκριμένη δουλειά.

Η δυνατότητα αυτή θα διατεθεί αρχικά στη σειρά Pixel 10 με την κυκλοφορία της στις 28 Αυγούστου, ενώ μέσα στην ίδια εβδομάδα θα αρχίσει να επεκτείνεται και σε άλλες Android συσκευές. Σύντομα θα ακολουθήσουν και οι χρήστες iOS.

Ενσωμάτωση με περισσότερες εφαρμογές

Ένας πραγματικός ψηφιακός βοηθός δεν πρέπει μόνο να απαντά σε ερωτήσεις, αλλά και να διευκολύνει την οργάνωση της ζωής του χρήστη. Το Gemini Live κάνει αυτό το βήμα, φέρνοντας περισσότερες εφαρμογές της Google μέσα στην εμπειρία συνομιλίας.

Στην πράξη, κάποιος μπορεί να συζητά με το Gemini για το πρόγραμμά του στο Google Calendar και να ζητήσει να προστεθεί υπενθύμιση στο Google Tasks ώστε να προλάβει να πάρει τα φάρμακά του πριν κλείσει το φαρμακείο. Ή, αν ψάχνει τι να μαγειρέψει για βραδινό, μπορεί να ζητήσει από τον βοηθό να δημιουργήσει λίστα με όλα τα υλικά στο Google Keep.

Αυτές οι δυνατότητες είναι ήδη διαθέσιμες, ενώ σύντομα θα ενταχθούν και οι εφαρμογές Messages, Phone και Clock, καθώς και νέες υπηρεσίες μέσω του Google Maps. Έτσι, ο χρήστης θα μπορεί να ζητήσει από το Gemini να καλέσει κάποιον συγγενή για να συζητήσει μια ιδέα δώρου ή να στείλει μήνυμα σε φίλο ότι θα καθυστερήσει, χωρίς να χρειάζεται να εγκαταλείψει τη συνομιλία του με τον βοηθό.

Μια πιο φυσική φωνή

Η συνομιλία με έναν ψηφιακό βοηθό δεν είναι μόνο υπόθεση κατανόησης των λέξεων, αλλά και του τρόπου που αυτές ακούγονται. Γι’ αυτό η Google παρουσιάζει νέες αναβαθμίσεις στο ηχητικό μοντέλο του Gemini Live, οι οποίες υπόσχονται πιο εκφραστική και πιο ανθρώπινη ομιλία.

Σύντομα, το Gemini θα αξιοποιεί στοιχεία όπως η χροιά, ο ρυθμός και οι αλλαγές τόνου, ώστε η συνομιλία να μοιάζει πιο αυθόρμητη και λιγότερο μηχανική. Αν ο χρήστης μιλά για ένα αγχωτικό θέμα, ο βοηθός θα ανταποκρίνεται με πιο ήρεμη φωνή. Επιπλέον, θα υπάρχει η δυνατότητα προσαρμογής: μπορεί κανείς να ζητήσει από το Gemini να μιλήσει πιο αργά για να κρατήσει σημειώσεις, πιο γρήγορα αν βιάζεται ή ακόμη και με μια διασκεδαστική προφορά για πιο χαλαρή διάθεση.

Ακόμη, οι δημιουργικές εφαρμογές είναι αμέτρητες. Ο χρήστης θα μπορεί, για παράδειγμα, να ζητήσει μια αφήγηση για τη Ρωμαϊκή Αυτοκρατορία μέσα από τα μάτια του Ιούλιου Καίσαρα, ακούγοντας μια ιστορία με χαρακτήρες που μιλούν με διαφορετικές φωνές, σαν θεατρική παράσταση.

Ένα βήμα πιο κοντά στον «καθολικό βοηθό»

Με τις νέες δυνατότητες, το Gemini Live προσεγγίζει ολοένα και περισσότερο το όραμα της Google για έναν βοηθό που δεν περιορίζεται σε τυπικές απαντήσεις, αλλά συμμετέχει ενεργά στην καθημερινότητα του χρήστη. Από την οργάνωση του προγράμματος έως την επίλυση πρακτικών προβλημάτων και από την ψυχαγωγία έως τη δημιουργικότητα, ο στόχος είναι ένας: να κάνει τη σχέση με την τεχνητή νοημοσύνη πιο φυσική, πιο ανθρώπινη και τελικά πιο χρήσιμη.

Η Google δηλώνει ενθουσιασμένη με τις δυνατότητες που ανοίγονται και τονίζει ότι η εξέλιξη του Gemini δεν είναι στατική, αλλά μια διαδικασία που θα συνεχίσει να ενσωματώνει νέες λειτουργίες και βελτιώσεις.

Loading