Google: Με μια ανανεωμένη έκδοση, το Gemini ανταποκρίνεται στο ChatGPT

Με στόχο να γίνει η τεχνητή νοημοσύνη χρήσιμη σε όλους, Google έκανε ορισμένες ανακοινώσεις στο πλαίσιο του φετινού συνεδρίου Google I/O που πραγματοποιείται στην Καλιφόρνια. Βρέθηκε στο επίκεντρο των διαφημίσεων δίδυμαένα εργαλείο AI που είναι η απάντηση της Google στο ChatGPT.

Σύμφωνα με την εταιρεία, πριν από ένα χρόνο στη σκηνή I/O, η Google μοιράστηκε για πρώτη φορά τα σχέδιά της για τους Gemini, μια οικογένεια πολυτροπικών μοντέλων τεχνητής νοημοσύνης για απεικόνισηπου μπορεί να αιτιολογήσει χρησιμοποιώντας κείμενο, εικόνες, βίντεο, κώδικα και άλλα.

Όπως διαβάζουμε στην ανακοίνωση, κατά τη διάρκεια του φετινού Google I/O, «η Google έδειξε πώς είναι πλήρως λειτουργική στην εποχή των Διδύμων, παρουσιάζοντας καινοτόμες λύσεις τεχνητής νοημοσύνης σε προϊόντα, έρευνα και υποδομές και πώς μας φέρνει πιο κοντά στον απώτερο στόχο να κάνει την τεχνητή νοημοσύνη χρήσιμη για όλους».

Όπως αναφέρθηκε, όλα τα προϊόντα Google με πάνω από δύο δισεκατομμύρια χρήστεςκατασκευάζονται με την τεχνολογία Gemini.

Η εκδήλωση επικεντρώθηκε στον τρόπο με τον οποίο το Gemini βοηθά τους πολίτες να δημιουργήσουν νέες εμπειρίες και να κάνουν τις υπηρεσίες Google πιο χρήσιμες.

Google: Με μια ανανεωμένη έκδοση, το Gemini ανταποκρίνεται στο ChatGPT-1
AP Photo/Jeff Chiu

Τι ανακοίνωσε η Google

«Επέκταση των κριτικών τεχνητής νοημοσύνης για να συμπεριλάβει την αναζήτηση. Με το νέο προσαρμοσμένο μοντέλο Gemini – ικανό για συλλογισμό πολλαπλών βημάτων, σχεδιασμό και πολυτροπικότητα – σε συνδυασμό με την καλύτερη μηχανή αναζήτησης στην κατηγορία, σύντομα θα μπορείτε να κάνετε σύνθετες ερωτήσεις πολλαπλών βημάτων, να προσαρμόζετε τα αποτελέσματα αναζήτησης και ακόμη και να κάνετε ερωτήσεις βίντεο.

Σας παρουσιάζουμε το Ask Photos. Περισσότερες από έξι δισεκατομμύρια φωτογραφίες ανεβαίνουν στο Google Photos κάθε μέρα. Χάρη στις πολυτροπικές δυνατότητες του Gemini, επαναπροσδιορίζουμε τον τρόπο αναζήτησης φωτογραφιών και βίντεο. Θέλετε να βρείτε μια συγκεκριμένη μνήμη ή πληροφορίες ανάκλησης που είναι κρυμμένες στη συλλογή σας; Απλώς ρωτήστε το Ask Photos.

Νέοι τρόποι αλληλεπίδρασης με τους Διδύμους στο Workspace. Οι λειτουργίες Gemini θα κυκλοφορήσουν σε περισσότερους χρήστες και θα ενσωματωθούν στις πλευρικές γραμμές Gmail, Έγγραφα, Drive, Παρουσιάσεις και Υπολογιστικά φύλλα. Επιπλέον, οι λειτουργίες Gemini θα προστεθούν επίσης στην εφαρμογή Gmail για κινητά.

Η Google εξετάζει το ενδεχόμενο να χρεώσει για αναζητήσεις

Gemini για Android. Χτίζουμε τεχνολογία AI απευθείας στο λειτουργικό σύστημα Android. Οι μαθητές μπορούν πλέον να λάβουν βοήθεια με τις ασκήσεις τους κυκλώνοντας προβλήματα στην εφαρμογή Circle to Search. Η επικάλυψη Gemini θα εμφανίζει δυναμικές προτάσεις για ό,τι υπάρχει στην οθόνη σας. Για παράδειγμα, μπορείτε να ζητήσετε μια σύνοψη PDF ή να χρησιμοποιήσετε την επιλογή “Ρωτήστε για αυτό το βίντεο”. Επιπλέον, το TalkBack με υποστήριξη Gemini θα μπορεί να παρέχει ακόμη πιο λεπτομερείς περιγραφές εικόνων.»

Gemini 1.5 Pro για συνδρομητές Gemini Advanced

Επιπλέον, η Google ανακοίνωσε ότι λανσάρει το “Συνδρομητές Gemini 1.5 Pro και Gemini Advanced σε περισσότερες από 35 γλώσσες, μαζί με μια σειρά από ένα εκατομμύριο ακολουθίες χαρακτήρων κειμένου που τα εργαλεία LLM μετατρέπουν σε αριθμητικές αναπαραστάσεις. Το Gemini 1.5 Pro είναι το μεγαλύτερο ευρέως διαθέσιμο chatbot για καταναλωτές στον κόσμο. Αυτό σημαίνει ότι μπορεί να κατανοήσει περισσότερες πληροφορίες από ποτέ, όπως ένα αρχείο PDF 1.500 σελίδων, και σύντομα θα μπορεί να κατανοήσει 30.000 γραμμές κώδικα και μια ταινία διάρκειας μιας ώρας».

Οι συνδρομητές του Gemini Advanced θα έχουν σύντομα πρόσβαση στο Live, μια νέα συνομιλία μέσω κινητού. «Με το Live, θα μπορείτε να μιλήσετε με τους Gemini και να επιλέξετε από μια μεγάλη γκάμα διαφορετικών, φυσικών φωνών. Θα μπορείτε επίσης να μιλάτε με τον δικό σας ρυθμό, με τη δυνατότητα να διακόπτετε με ερωτήσεις, κάνοντας τις συνομιλίες πιο κατανοητές», λέει η Google.

Veo

Ανακοινώθηκε επίσης ότι η Google συνεργάζεται στενά με τη δημιουργική κοινότητα για να διερευνήσει πώς η παραγωγική τεχνητή νοημοσύνη μπορεί να υποστηρίξει καλύτερα τη δημιουργική διαδικασία και να διασφαλίσει ότι τα εργαλεία AI είναι όσο το δυνατόν πιο χρήσιμα σε κάθε στάδιο:

Συγκεκριμένα, παρουσιάστηκαν το Veo, το πιο ισχυρό μοντέλο για τη δημιουργία βίντεο υψηλής ανάλυσης, και το Imagen 3, ένα μοντέλο που χαρακτηρίζεται από την υψηλότερη ποιότητα μετατροπής κειμένου σε εικόνα. Επιπλέον, πολλές νέες ηχογραφήσεις – με καλλιτέχνες από όλο τον κόσμο – που δημιουργήθηκαν χρησιμοποιώντας το sandbox Music AI.

Τεχνητή νοημοσύνη: καταπολέμηση του λόμπι για τα ευρωπαϊκά δίχτυα ασφαλείας

Φυσικά, η ανάπτυξη της τεχνητής νοημοσύνης μπορεί να επιτευχθεί μόνο με μια πραγματικά καινοτόμο τεχνολογική υποδομή. Η εκπαίδευση μοντέλων αιχμής απαιτεί μεγάλη υπολογιστική ισχύ.

Στο Trillium

Παρουσιάστηκε το Trillium, ένα TPU έκτης γενιάς που προσφέρει 4,7x βελτίωση στην υπολογιστική απόδοση ανά τσιπ σε σύγκριση με την προηγούμενη γενιά TPU v5e. Θα είναι διαθέσιμο στους πελάτες του Cloud αργότερα φέτος.

«Ένα βασικό στοιχείο της τολμηρής καινοτομίας είναι η υπεύθυνη καινοτομία. Αυτός είναι ο λόγος για τον οποίο αναπτύσσουμε τεχνολογία αιχμής που ονομάζεται “AI-assisted red teaming” βασισμένη σε καινοτόμες λειτουργίες gaming από το Google DeepMind όπως το AlphaGo, επεκτείνοντας τις τεχνικές μας καινοτομίες υδατογράφησης όπως το SynthID σε δύο νέες μορφές – κείμενο και βίντεο – έτσι ώστε το περιεχόμενο που δημιουργείται από την τεχνητή νοημοσύνη θα είναι πιο εύκολο να βρεθεί».

Τρεις κίνδυνοι της τεχνητής νοημοσύνης αν πέσει σε λάθος χέρια

«Αξιοποιώντας τη δύναμη των Διδύμων, στόχος μας είναι να κάνουμε την τεχνητή νοημοσύνη χρήσιμη σε όλους. Η αποστολή της Google είναι να οργανώσει τις πληροφορίες του κόσμου από κάθε πηγή, να τις κάνει προσβάσιμες όπως θέλετε και να συνδέσει τις πληροφορίες του κόσμου με τις δικές σας με τρόπο που είναι πραγματικά χρήσιμος για εσάς. Οι Δίδυμοι θα μας βοηθήσουν να πετύχουμε αυτόν τον στόχο» τονίζει επίσης.

Με βάση πληροφορίες του ΑΠΕ-ΜΠΕ