
14 Δεκ Η OpenAi κυκλοφόρησε το Advanced Voice Mode με Vision για το ChatGPT
Κατηγορία: Προϊόν
1. Η OpenAi κυκλοφόρησε το Advanced Voice Mode με Vision για το ChatGPT
Η OpenAi ανακοίνωσε την κυκλοφορία της πολυαναμενόμενης δυνατότητας Advanced Voice Mode με Vision για το ChatGPT, επιτρέποντας στους χρήστες να αλληλεπιδρούν σε πραγματικό χρόνο μέσω βίντεο. Αυτή η νέα δυνατότητα που είχε παρουσιαστεί πριν 7 μήνες φέρνει επαναστατικές λειτουργίες στο ChatGPT, όπως την αναγνώριση αντικειμένων μέσω κάμερας και την ανάλυση οθόνης μέσω screen sharing.
2. Τι είναι το Advanced Voice Mode με Vision;
Το Advanced Voice Mode με Vision προσθέτει όραση στις ανθρώπινου τύπου φωνητικές δυνατότητες του ChatGPT. Οι συνδρομητές των προγραμμάτων ChatGPT Plus, Team ή Pro μπορούν να:
- Χρησιμοποιούν την κάμερα της συσκευής τους για αναγνώριση των αντικειμένων σε πραγματικό χρόνο.
- Μοιράζονται την οθόνη τους για βοήθεια σε ρυθμίσεις, επίλυση προβλημάτων ή ανάλυση μαθηματικών εξισώσεων.
Για πρόσβαση:
- Πατήστε το εικονίδιο φωνής δίπλα στη γραμμή συνομιλίας του ChatGPT.
- Επιλέξτε το εικονίδιο του βίντεο κάτω αριστερά για ενεργοποίηση της κάμερας.
- Για screen sharing, πατήστε το μενού 3 κουκίδων και επιλέξτε Share Screen.
3. Χρονοδιάγραμμα Κυκλοφορίας
Η διάθεση ξεκίνησε την Πέμπτη και θα ολοκληρωθεί μέσα σε μία εβδομάδα, ωστόσο:
Οι συνδρομητές Enterprise και Edu θα αποκτήσουν πρόσβαση τον Ιανουάριο.
Η λειτουργία δεν είναι ακόμα διαθέσιμη σε χρήστες από την ΕΕ, την Ελβετία, την Ισλανδία, την Νορβηγία και το Λιχτενστάιν.
4. Επιδείξεις και Δυνατότητες
Κατά τη διάρκεια πρόσφατης επίδειξης το Advanced Voice Mode με Vision έδειξε τις δυνατότητές του:
Στην εκπομπή “60 Minutes” το ChatGPT αναγνώριζε και διόρθωνε αυτά που σχεδίαζε ο Anderson Cooper σε μαυροπίνακα. Το ChatGPT απαντούσε με επιτυχία στα σχέδια του κάθε υποτιθέμενου οργάνου που πρόσθετε και επίσης διόρθωσε και τον Anderson Cooper όταν τοποθέτησε το συκώτι στην λάθος μεριά του σκίτσου.
5. Καθυστερήσεις και Σχόλια Ανταγωνιστών
Η κυκλοφορία της συγκεκριμένης δυνατότητας είχε καθυστερήσει επανειλημμένα κυρίως λόγω του ότι είχε ανακοινωθεί πριν να είναι έτοιμη για παραγωγή. Η OpenAi αρχικά είχε υποσχεθεί την κυκλοφορία τον Απρίλιο, αλλά οι προσπάθειες επικεντρώθηκαν στη διάθεση της φωνητικής λειτουργίας σε περισσότερες περιοχές και πλατφόρμες.
Ανταγωνιστές όπως η Google και η Meta, εργάζονται επίσης σε αντίστοιχες τεχνολογίες. Αυτή την εβδομάδα η Google έκανε διαθέσιμο το Project Astra, μία δυνατότητα ανάλυσης βίντεο σε πραγματικό χρόνο.
Πρόσθετες Λειτουργίες Santa Mode
Παράλληλα, ή ΟpenAi κυκλοφόρησε το Santa Mode, μία εορταστική δυνατότητα που προσθέτει τη φωνή του Άγιου Βασίλη ως προεπιλογή στο ChatGPT. Οι χρήστες μπορούν να την ενεργοποιήσουν πατώντας την ενεργοποίηση φωνητικής συζήτησης και πάνω δεξιά το εικονίδιο της χιονονιφάδας.
6. Συμπέρασμα
Η OpenAi κάνει ένα μεγάλο βήμα εμπρός με την ενσωμάτωση όρασης στις φωνητικές λειτουργίες του ChatGPT, φέρνοντας την τεχνητή νοημοσύνη πιο κοντά σε πραγματικές αλληλεπιδράσεις. Παρότι υπάρχουν περιορισμοί και καθυστερήσεις, η δυνατότητα αυτή ανοίγει νέους ορίζοντες στη χρήση Ai, ενισχύοντας παράλληλα το ανταγωνισμό στον τομέα.