back to top

Google I/O 2024, la sfida di Google a ChatGPT e al Web

Data:

Google I/O 2024 introduce Gemini nel suo ampio ecosistema. Si apre la sfida a ChatGPT di OpenAI. Le novità presentate puntano a trasformare la ricerca, le foto e la produttività con AI avanzata. Si ridisegna il web che va quindi ripensato.

Non era facile catturare l’attenzione dopo il grande annuncio di OpenAI del giorno prima. Del resto, Sam Altman e tutta l’azienda ha anticipato l’annuncio proprio per cercare di rubare la ribalta a Google con il suo grande evento annuale Google I/O 2024.

E possiamo dire che OpenAI è in parte riuscita nel suo intento.

E cioè che alla fine alcune cose annunciate da Google suonavano meno esaltanti. Sarà che ormai ci stiamo abituando ad annunci di questo genere, sempre orientati sull’Intelligenza Artificiale.

Guardiamo insieme gli annunci più importanti.

google i_o 2024 IA gemini franz russo

Gemini, l’IA dell’ecosistema Google

Al centro dell’ecosistema IA di Google c’è Gemini.

Gemini rappresenta la nuova frontiera dell’intelligenza artificiale per Google. Sundar Pichai, CEO di Google, ha introdotto Gemini come un modello multimodale, capace di comprendere e generare testo, immagini e audio, codice.

Questa capacità consente a Gemini di eseguire una vasta gamma di compiti, dall’elaborazione del linguaggio naturale alla riconoscimento delle immagini, migliorando l’interazione utente-tecnologia in modo significativo.

Una delle caratteristiche particolari di Gemini è la sua capacità di operare con un contesto esteso fino a 1 milione di token, con piani per espandere a 2 milioni di token. Questo significa che Gemini può gestire informazioni più complesse e articolate, fornendo risposte più precise e contestuali.

Ad esempio, in Google Search, Gemini può offrire risultati di ricerca più pertinenti e completi, migliorando l’esperienza di ricerca degli utenti.

E a proposito di ricerca, sappiamo bene che Google è ormai sinonimo di ricerca online, il motore di ricerca per antonomasia. Anche Google quindi si appresta a fare quello che già Bing di Microsoft fa con Copilot (ChatGPT integrato al motore di ricerca). E quindi, anche Gemini sarà integrato all’interno di Google

Il video qui in alto mostra benissimo come funzionerà.

Al momento, questa novità arriverà inizialmente negli Usa per poi propagarsi in altri paesi. Google non ha illustrato una tempistica a riguardo.

La sfida di Google e l’impatto della IA sul web

Ma c’è una breve considerazione, veloce, da fare.

Sono sempre convinto dell’idea che lo sviluppo dell’Intelligenza Artificiale Generativa sia uno strumento dal potenziale enorme. Proprio perché si tratta di uno strumento che può fare davvero la differenza per ciò che riguarda la creatività e il supporto alla generazione di contenuti.

Però c’è una considerazione da fare. La continua integrazione IA+ricerca online finirà per ridisegnare la ricerca stessa. I motori di ricerca non saranno più gli stessi, ma saranno un enorme portale di chat con la IA per la ricerca di informazioni online.

Di conseguenza, se questo si dovesse avverare, verrà ridisegnato il web, quindi indicizzazione e posizionamento dei contenuti.

Banalmente, dalla progressiva introduzione di questi modelli IA all’interno dei motori di ricerca, ad essere penalizzati saranno i creatori di contenuti. Quindi siti di informazione, blog, siti di notizie. Perché l’utente si interfaccerà ponendo una richiesta (prompt) che sempre meno sarà approfondita attraverso un link.

Questa è solo una mia ipotesi che potrebbe portare ad una riduzione di Internet per come l’abbiamo sempre conosciuta e usata. Per dare vita ad una IA sempre più intelligente, capace di sostituire anche la ricerca online.

Di questo ne parleremo ancora.

Andiamo con le novità di Search.

In pratica con Gemini il motore di ricerca, ad ogni richiesta, fornirà delle previ panoramiche.

Queste panoramiche sono brevi riassunti generati dall’IA che forniscono una sintesi chiara e concisa delle informazioni chiave. Una modalità che potrebbe tornare utile per query complesse che richiedono una comprensione approfondita.

Ad esempio, se un utente cerca informazioni su una malattia rara, l’IA generativa può fornire una panoramica delle cause, dei sintomi e dei trattamenti disponibili, il tutto in un unico blocco di testo.

L’IA generativa migliora anche la capacità di Google di fornire risultati contestuali. Invece di presentare semplicemente un elenco di link, l’IA può comprendere l’intenzione dietro la query e fornire risposte che tengono conto del contesto.

Questo significa che se un utente cerca “migliori ristoranti a Roma”, l’IA può offrire suggerimenti basati su recensioni, menù e la posizione attuale dell’utente.

Integrazione Gemini e Google Foto

Gemini è integrato in altri prodotti come Google Foto.

In Google Foto, ad esempio, Gemini migliora la capacità di riconoscimento delle immagini, permettendo agli utenti di cercare foto basate su descrizioni complesse e contesti specifici.

Google Foto è stato uno dei pionieri nell’uso dell’intelligenza artificiale con l’obiettivo di migliorare l’esperienza degli utenti nella gestione delle foto.

“Chiedi a Foto”

Con l’introduzione di “Chiedi a Foto” alimentato dal modello Gemini, Google sta portando questa esperienza a un livello decisamente nuovo. Questa funzionalità sperimentale permette agli utenti di trovare foto specifiche e recuperare informazioni dalla loro galleria in modo naturale e intuitivo.

“Chiedi a Foto” utilizza il modello di intelligenza artificiale Gemini per rendere la ricerca più naturale e meno frustrante. Gli utenti possono porre domande complesse come “Mostrami la foto migliore tra quelle dei parchi nazionali che ho visitato” e ricevere immediatamente le immagini pertinenti, eliminando la necessità di scorrere manualmente.

Questa funzionalità è particolarmente utile per ricordare momenti specifici o dettagli importanti che potrebbero essere difficili da ritrovare. Per esempio, chiedendo “Quali sono stati i temi usati per le feste di compleanno di Lena?”, l’IA analizzerà le decorazioni e gli oggetti nelle foto per fornire una risposta accurata.

Le potenti funzionalità multimodali di Gemini permettono di comprendere il contesto e il soggetto delle foto. Quindi, oltre a identificare persone e luoghi, l’IA può estrarre dettagli dai testi presenti nelle immagini o identificare temi specifici, come decorazioni di feste.

Come cambia Google Workplace con Gemini

Gemini è anche in Google Workplace

google i_o 2024 IA gemini franz russo

Google Workspace continua a evolversi per migliorare la produttività e l’efficienza degli utenti. Con l’introduzione di nuove funzionalità basate su Gemini, Google offre strumenti ancora più potenti per semplificare le attività quotidiane. Questo articolo esplorerà dettagliatamente le nuove funzionalità di Gemini per Google Workspace, evidenziando come queste innovazioni possono aiutare utenti e aziende a ottenere il massimo dalle loro app Google.

Gemini 1.5 Pro è ora integrato nel pannello laterale di Google Workspace, offrendo una finestra contestuale più estesa e capacità di ragionamento avanzate. Questo permette a Gemini di rispondere a una gamma più vasta di domande e di fornire risposte più dettagliate e approfondite.

Gemini adesso può riassumere email e documenti. Ad esempio, gli utenti possono chiedere a Gemini di riassumere tutte le email provenienti da una specifica fonte, come una scuola o un’organizzazione, ottenendo immediatamente i dettagli più rilevanti.

Utilizzando il pannello laterale di Gmail, gli utenti possono facilmente accedere a documenti su Google Drive, chiedere informazioni specifiche e inserire i risultati direttamente nelle email. Questa integrazione rende il flusso di lavoro più efficiente e organizzato.

Gemini nel pannello laterale di Workspace è ora disponibile per gli utenti di Workspace Labs e Gemini per Workspace Alpha. Sarà presto disponibile su desktop per aziende e consumatori tramite i piani Gemini per Workspace e Google One AI Premium.

Gemini e le traduzioni

Gemini è utile per le traduzioni in continuo miglioramento.

Recentemente, Google ha introdotto “Traduci per me” su Google Meet, con rilevamento automatico della lingua e sottotitoli tradotti in più di 60 lingue. Ora, questa funzionalità si espande a “Aiutami a scrivere” in Gmail e Documenti, con supporto iniziale per spagnolo e portoghese.

Google continua ad aggiungere supporto per altre lingue, facilitando la connessione e la collaborazione tra persone di diverse nazionalità. Questa espansione linguistica permette agli utenti di scrivere e ricevere assistenza nelle loro lingue native, migliorando la comunicazione e la produttività.

Gli utenti possono accedere a queste nuove funzionalità attraverso i componenti aggiuntivi di Gemini per Workspace per clienti aziendali e il piano Google One AI Premium per gli utenti. Per massimizzare l’uso di Gemini per Workspace, Google offre una serie di risorse e guide sul blog di Workspace.

Android e Gemini, coppia perfetta

Ma Gemini diventa uno strumento fondamentale anche per Android. Google, da questo punto di vista ha già fatto passi in avanti, ma adesso aumenta l’estensione.

L’integrazione dell’intelligenza artificiale (AI) nel sistema operativo Android rappresenta un’evoluzione significativa nell’interazione quotidiana con gli smartphone. Le ultime innovazioni di Google AI offrono funzionalità avanzate che migliorano la produttività e la creatività, rendendo l’uso dello smartphone più intuitivo e potente.

“Cerchia e cerca”

“Cerchia e Cerca” è una funzione che consente agli utenti di selezionare qualsiasi cosa visualizzata sullo schermo del proprio smartphone per avviare una ricerca.

Questo può essere fatto senza dover interrompere l’attività corrente o cambiare applicazione, rendendo il processo di ricerca fluido e continuo.

Recentemente, questa funzionalità è stata potenziata per aiutare gli studenti con i compiti. Gli studenti possono cerchiare problemi di matematica o fisica e ricevere istruzioni dettagliate per risolverli. Questo è particolarmente utile per problemi complessi che coinvolgono formule, diagrammi e grafici. Utilizzando il modello LearnLM, ottimizzato per l’apprendimento, “Cerchia e Cerca” può affrontare una vasta gamma di problemi legati al mondo dell’istruzione.

“Cerchia e Cerca” è attualmente disponibile su oltre 100 milioni di dispositivi, con l’obiettivo di raddoppiare questo numero entro la fine dell’anno.

Questa funzionalità è stata estesa a vari dispositivi Samsung e Pixel, migliorando l’accessibilità e l’utilità per un numero sempre maggiore di utenti.

Gemini è quindi un assistente AI generativo integrato in Android, progettato per migliorare la creatività e la produttività degli utenti. Questa esperienza AI è in grado di comprendere il contesto delle attività svolte sullo schermo e delle app in uso, offrendo suggerimenti e risposte pertinenti.

Presto sarà possibile spostare l’overlay di Gemini sopra le app aperte per utilizzare l’AI in vari modi. Gli utenti potranno trascinare e rilasciare immagini generate da Gemini in app come Gmail e Google Messaggi, o chiedere informazioni su video di YouTube. Con un abbonamento a Gemini Advanced, sarà possibile chiedere informazioni su documenti PDF e ricevere risposte rapide senza dover scorrere molte pagine.

Gemini continuerà a migliorarsi, offrendo suggerimenti dinamici basati sui contenuti mostrati sullo schermo. Questa evoluzione costante mira a rendere l’assistente IA sempre più utile e integrato nelle attività quotidiane degli utenti.

Gemini Nano

E poi c’è Gemini Nano.

Android è il primo sistema operativo mobile a includere un modello di base integrato e on-device. Con Gemini Nano, gli utenti possono usufruire di esperienze AI avanzate mantenendo le loro informazioni completamente private. Gemini Nano è in grado di elaborare non solo input di testo, ma anche comprendere luoghi, suoni e linguaggio parlato.

Una delle applicazioni principali di Gemini Nano sarà su Talkback, uno strumento progettato per aiutare le persone cieche o ipovedenti. Grazie alle funzionalità multimodali, Talkback potrà fornire descrizioni più chiare e dettagliate dei contenuti delle immagini, migliorando l’accessibilità e l’inclusione.

Secondo un recente report, oltre mille miliardi di dollari sono stati persi a causa di frodi telefoniche in un periodo di 12 mesi. Per affrontare questo problema, Google sta testando una nuova funzionalità che utilizza Gemini Nano per fornire avvisi in tempo reale durante le chiamate telefoniche.

Questa funzionalità rileva schemi di conversazione comunemente associati a frodi, come richieste urgenti di trasferimenti di fondi o informazioni personali. Gli utenti riceveranno avvisi se vengono rilevate richieste insolite da parte delle banche o altre istituzioni, proteggendoli da potenziali truffe.

Come funziona Gemini 1.5 Pro

Alcune veloci novità che riguardano Gemini 1.5 Pro.

Con l’evoluzione continua dell’intelligenza artificiale, Google introduce Gemini 1.5 Pro, un modello avanzato progettato per migliorare l’efficienza e la produttività degli utenti. Questa versione offre una finestra contestuale estesa, nuove funzionalità di analisi dei dati, capacità multimodali e opzioni di personalizzazione. In questo articolo, esploreremo in dettaglio tutte le novità di Gemini 1.5 Pro e le sue potenzialità.

Gemini 1.5 Pro introduce una finestra contestuale che può gestire fino a 1 milione di token, la più ampia mai offerta da un chatbot consumer.

Questo permette di comprendere e analizzare documenti di grandi dimensioni, come PDF di 1500 pagine, e riassumere rapidamente centinaia di email. Presto sarà in grado di gestire anche contenuti video di un’ora e codici con oltre 30.000 righe.

Gli utenti possono caricare file su Gemini Advanced tramite Google Drive o direttamente dal dispositivo. Questa funzionalità permette di ricevere risposte dettagliate su documenti complessi e di confrontare argomenti chiave di vari articoli di ricerca. Inoltre, Gemini sarà presto in grado di analizzare dati e creare visualizzazioni grafiche da fogli di lavoro caricati.

Tutti i file e le conversazioni con Gemini sono privati e non vengono utilizzati per addestrare altri modelli di intelligenza artificiale di Google. Questo garantisce che le informazioni degli utenti rimangano confidenziali e protette.

Gemini 1.5 Pro è nativamente multimodale, il che significa che può comprendere e rispondere a input che combinano testo, immagini e suoni. Ad esempio, gli utenti possono scattare una foto di un piatto e chiedere la ricetta, oppure fotografare un problema matematico per ricevere una spiegazione dettagliata.

Questa capacità multimodale rende Gemini particolarmente utile in contesti educativi e creativi. Ad esempio, gli studenti possono utilizzare Gemini per risolvere problemi complessi, mentre i creativi possono chiedere suggerimenti per migliorare le loro opere basandosi su input visivi.

Arriva Gemini Live

Nei prossimi mesi, Google lancerà Gemini Live, un’esperienza conversazionale mobile che sfrutta la tecnologia vocale avanzata di Google. Con Gemini Live, gli utenti possono parlare direttamente a Gemini, che risponderà con voci naturali e personalizzabili.

Gemini Live permette conversazioni più naturali, con la possibilità di parlare alla velocità desiderata o interrompere la risposta per chiedere chiarimenti. Questa funzionalità è ideale per prepararsi a colloqui di lavoro, discorsi importanti o per ottenere consigli su public speaking.

In futuro, sarà possibile utilizzare la fotocamera su Gemini Live per avviare conversazioni basate su ciò che viene inquadrato, migliorando ulteriormente l’interazione contestuale e multimodale.

Ecco, questo era il resoconto, sperando utile nei dettagli, di interesse rilevante. Perché tutte queste novità evidenziate interessano più o meno tutti.

Ricordiamoci che Google è il motore di ricerca più usato e Android il sistema operativo mobile più adottato sui dispositivi mobili.

Quindi parliamo di novità sul mondo di intendere l’IA di Google che riguarderà la grand parte delle persone.

Questo era solo un rapido sguardo alle novità annunciate a Google I/O più interessanti per gli utenti.

È il segno che da adesso in poi l’intelligenza artificiale sarà sempre più alla portata di tutti ed è sempre più vero che tutto questo deve essere gestito con consapevolezza e responsabilità.

avatar dell'autore
Franz Russo Blogger, Digital Strategist
Franz Russo, fondatore, nel 2008, del blog InTime, ho collaborato con grandi aziende nazionali e internazionali, come consulente per strategie di comunicazione e come divulgatore. Da sempre impegnato nella comunicazione digitale, cerco di unire sempre una profonda passione per l’innovazione tecnologica a una visione olistica dell’evoluzione dei social media e degli strumenti digitali. Il mio percorso professionale in questo campo, iniziato nel 2007, è stato caratterizzato da un costante impegno nel raccontare e interpretare i cambiamenti nel panorama digitale. Il mio approccio si basa su un mix di analisi strategica, creatività e un profondo impegno per il racconto e la divulgazione.
La tua iscrizione non può essere convalidata.
La tua iscrizione è avvenuta correttamente.

InTime Blog Newsletter

Abbonati alla newsletter e resta aggiornato su articoli e approfondimenti 

Utilizziamo Brevo come piattaforma di marketing. Inviando questo modulo, accetti che i dati personali da te forniti vengano trasferiti a Brevo per il trattamento in conformità all'Informativa sulla privacy di Brevo.

Scrivimi

Se ti piace quello che scrivo e se vuoi conoscermi meglio, clicca il bottone qui di fianco.

LASCIA UN COMMENTO

Per favore inserisci il tuo commento!
Per favore inserisci il tuo nome qui

lunedì, 16 Settembre, 2024

Ultimi articoli

InTime Podcast

spot_img

Articoli correlati
Related

City Transformer CT-2, piccola citycar elettrica che rivoluziona la mobilità

La City Transformer CT-2 è una citycar elettrica rivoluzionaria, con dimensioni compatte e larghezza variabile per affrontare il traffico urbano. Autonomia fino a 180 km e design innovativo.

Su Bluesky adesso si possono caricare i video

Su Bluesky è finalmente possibile caricare video fino a 60 secondi. La piattaforma, sull'onda della crescita degli utenti abilità la funzionalità tanto attesa.

Taylor Swift e il suo appoggio a Kamala Harris su Instagram

Taylor Swift annuncia il suo supporto a Kamala Harris su Instagram e condanna l'uso dell'intelligenza artificiale da parte di Trump per diffondere disinformazione elettorale. Non è la prima volta per Taylor Swift, ma evidenzia come l'uso delle piattaforme digitali da parte di star globali possa influenza l'opinione pubblica.

Su Bluesky aumentano gli utenti dopo il divieto di X in Brasile

Il divieto di X in Brasile ha spinto circa 3 milioni di utenti verso Bluesky, che ha visto una crescita della base utenti del 50% in una settimana. Arrivando a superare i 9 milioni in totale.