Το OpenAI ανακοίνωσε τα πρώτα αποτελέσματα δοκιμών μιας εφαρμογής που μπορεί να διαβάζει λέξεις δυνατά με μια πειστική ανθρώπινη φωνή, θέτοντας νέα όρια για την τεχνητή νοημοσύνη και αυξάνοντας την απειλή των ψεύτικων ειδήσεων.
Η εταιρεία κυκλοφόρησε τα πρώτα demo μιας μικρής έκδοσης προεπισκόπησης του μοντέλου σύνθεσης ομιλίας της που ονομάζεται Voice Engine, το οποίο έχει διαθέσει σε 10 προγραμματιστές μέχρι στιγμής, δήλωσε εκπρόσωπος της εταιρείας. Το OpenAI αποφάσισε να μην συνεχίσει να κάνει μια συγκεκριμένη εφαρμογή ευρύτερα διαθέσιμη, μια εξέλιξη για την οποία ενημέρωσε τους δημοσιογράφους νωρίτερα αυτό το μήνα.
Ένας εκπρόσωπος του OpenAI είπε ότι η εταιρεία αποφάσισε να περιορίσει την κυκλοφορία της νέας της εφαρμογής μετά από σχόλια που έλαβε από ενδιαφερόμενους φορείς, συμπεριλαμβανομένων πολιτικών, ειδικών του κλάδου, εκπαιδευτικών και καλλιτεχνών. Σύμφωνα με την προηγούμενη ενημέρωση, η εταιρεία σχεδίαζε αρχικά να διαθέσει το νέο της εργαλείο σε έως και 100 προγραμματιστές.
«Γνωρίζουμε ότι η δημιουργία ομιλίας που μοιάζει με την ανθρώπινη φωνή εγκυμονεί σημαντικούς κινδύνους, οι οποίοι είναι ιδιαίτερα σημαντικοί κατά τη διάρκεια μιας εκλογικής χρονιάς», έγραψε η εταιρεία σε μια ανάρτηση στο blog της. «Συνεργαζόμαστε με κυβερνητικούς εταίρους των Η.Π.Α και διεθνών, τα μέσα ενημέρωσης, την ψυχαγωγία, την εκπαίδευση, την κοινωνία των πολιτών και πολλά άλλα για να διασφαλίσουμε ότι λαμβάνουμε υπόψη τις απόψεις τους καθώς χτίζουμε το μοντέλο μας».
Απειλές
Υπενθυμίζεται ότι ορισμένες τεχνολογίες τεχνητής νοημοσύνης έχουν ήδη χρησιμοποιηθεί για την παραποίηση ψήφων. Τον Ιανουάριο, η προσοχή τράβηξε την προσοχή σε ένα ψεύτικο αλλά πραγματικό τηλεφώνημα που υποτίθεται ότι ο Πρόεδρος Τζο Μπάιντεν φαινόταν να παροτρύνει τους ψηφοφόρους του Νιου Χάμσαϊρ να μείνουν μακριά από τις προκριματικές εκλογές, προκαλώντας ανησυχίες για εφαρμογές τεχνητής νοημοσύνης ενόψει των προεδρικών εκλογών στις ΗΠΑ. .
Σε αντίθεση με τις προηγούμενες προσπάθειες του OpenAI να δημιουργήσει περιεχόμενο ήχου, η εφαρμογή Voice Engine μπορεί να δημιουργήσει ομιλία που ακούγεται σαν την πραγματική ομιλία κάθε ατόμου, με τον συγκεκριμένο ρυθμό και τον τονισμό της. Για να επιτευχθεί αυτό το αποτέλεσμα, το λογισμικό χρειάζεται μόνο 15 δευτερόλεπτα από την ηχογραφημένη ομιλία του ομιλητή και χάρη σε αυτό το υλικό είναι σε θέση να αναπαράγει τη φωνή του.
Bloomberg: 100% επιτυχία
Κατά τη διάρκεια μιας επίδειξης του εργαλείου, το Bloomberg άκουσε τον ήχο του CEO του OpenAI, Sam Altman, να εξηγεί εν συντομία την τεχνολογία με μια φωνή που κανείς δεν μπορούσε να διακρίνει από την πραγματική του ομιλία, αλλά δημιουργήθηκε εξ ολοκλήρου από τεχνητή νοημοσύνη.
“Εάν έχετε τη σωστή ρύθμιση ήχου, θα είναι βασικά μια φωνή ανθρώπινου διαμετρήματος”, δήλωσε ο Jeff Harris, επικεφαλής προϊόντων στο OpenAI. “Έχει εντυπωσιακή τεχνική ποιότητα.”