AGI – Bard, lo strumento gratuito di intelligenza artificiale di Google, sarà disponibile in 180 Paesi in inglese, giapponese e coreano. Nella sua presentazione all’evento annuale degli sviluppatori di Google, Google I/O 2023, Sundar Pichai, ceo di Google e Alphabet, ha detto di voler rendere l’intelligenza artificiale uno strumento utile per tutti.
Google continua così nella sua competizione con Microsoft, società che la scorsa settimana ha aperto a tutti la sua intelligenza artificiale, Bing, in grado di generare testi e immagini.
Da parte sua, Sissie Hsiao, vicepresidente di Google e direttore generale di Google Assistant e Bard, ha anticipato che “molto presto” Bard sarà disponibile nelle “40 lingue principali” del mondo.
Un’altra novità è che gli utenti potranno esportare le risposte ottenute da Bard su Gmail e Google Docs, “poiché le persone spesso chiedono aiuto a Bard per scrivere email e documenti”, ha detto Hsiao.
Proprio come Microsoft ha annunciato la scorsa settimana, il chatbot di Google fornirà “presto” risposte multimodali, ovvero non risponderà solo con testo, ma anche con immagini.
Questa nuova attività funzionerà in due modi: da un lato incorporerà immagini nelle risposte, ma dall’altro saranno gli utenti stessi a poter porre a Bard domande con foto.
Un esempio di quest’ultimo caso è che un utente può caricare una foto -con riconoscimento dell’immagine di Google Lens- di un cassetto pieno di materiali artistici e chiedere al chatbot di preparare un elenco di attività che possono essere praticate con i bambini con i materiali che ha davanti.
“Nei prossimi mesi, integreremo Adobe Firefly, che consente di generare immagini utilizzando il testo, in Bard. Pertanto, le persone saranno in grado di generare nuove immagini”, ha detto.
La sfida con Microsoft
La scorsa settimana Microsoft ha integrato la tecnologia DALL-E 2 di Open AI (creatori di ChatGPT e DALL-E) per consentire ai suoi utenti di creare immagini utilizzando anche il testo.
Ma è su uno dei temi più caldi nel dibattito sull’AI – la trasparenza delle fonti – che si differenzia la strategia di Google. “A partire dalla prossima settimana, renderemo le sezioni di codice ancora più precise visualizzando i blocchi di codice specifici che vengono recuperati insieme a qualsiasi informazione di licenza pertinente. E questo si applicherà anche alla citazione di contenuti narrativi su tutta la linea” ha annunciato.
Le novità, in breve
- Bard si sta espandendo in 180 paesi, aggiungendo tra le proprie lingue anche il giapponese e il coreano. Si integrerà anche con servizi di terze parti, tra cui Adobe, Instacart, Wolfram, Khan Academy.
- Con Magic Editor sarà possibile apportare modifiche complesse senza competenze di editing di livello professionale. L’utilizzo di una combinazione di tecniche di intelligenza artificiale, inclusa l’IA generativa, consentirà di apportare modifiche a parti specifiche di un’immagine, come il soggetto, il cielo o lo sfondo,.
- Duet AI for Workspace integra la potenza dell’IA generativa in tutte le app di Workspace. Queste funzionalità aiuteranno a scrivere, organizzare, visualizzare, accelerare i flussi di lavoro, partecipare a riunioni. L’integrazione di Duet AI in Presentazioni renderà possibile generare facilmente immagini con poche parole di input, permetterà di analizzare e classificare dati in Fogli
- Le estensioni Bard saranno disponibili in molte delle app e dei servizi di Google, come Maps, Gmail e Documenti.
Un altro annuncio della giornata è stato il lancio di PaLM 2, il nuovo modello linguistico (LLM) di Google, anch’esso alla base di Bard. Si tratta di un aggiornamento che consentirà molti miglioramenti, come migliori capacità matematiche, logiche e di ragionamento e, più recentemente, capacità di programmazione. PaLM 2 include più di 100 lingue ed è stato addestrato su 20 linguaggi di programmazione.
La rivoluzione nelle foto
Anche il nuovo editor di foto ‘Magic Editor’ di Google è alimentato dall’intelligenza artificiale e può trasformare le immagini senza strumenti professionali, In un paio di esempi mostrati alla conferenza, Pichai ha mostrato una foto di una persona davanti a una cascata e come usando si può spostare il soggetto, cancellare la tracolla di una borsa e rendere il cielo meno nuvoloso.
In un altro esempio, Magic Editor è stato in grado di spostare un bambino su una panchina più vicino al centro della foto, generando una “nuova” parte della panchina su cui era seduto e dei palloncini che teneva in mano. Alcuni telefoni Pixel avranno accesso anticipato a Magic Editor entro la fine dell’anno.
Il chatbot medico
PaLM 2, il nuovo modello linguistico (LLM) di Google, che è alla base di 25 dei prodotti dell’azienda, è “più forte nella logica e nel ragionamento, grazie a un’ampia formazione”, L’ampio set di dati di PaLM 2 include articoli scientifici e pagine Web contenenti espressioni matematiche.
Supporta più di 100 lingue e non solo è in grado di eseguire traduzioni letterali, ma è anche in grado di comprendere e tradurre modi di dire, poesie e indovinelli.
È stato anche addestrato in 20 linguaggi di programmazione e ciò significa che “eccelle” in linguaggi di programmazione popolari come Python e JavaScript, ma può anche generare codice specializzato in linguaggi come Prolog, Fortran e Verilog.
Google afferma che il ramo sanitario di questo LLM, chiamato Med-PaLM 2, raggiunge risultati all’avanguardia nella competenza medica e può rispondere a domande di esami medici a “livello di medico esperto” tanto da risultare accurato l’85% delle volte. Inoltre, Google sta addestrando questo strumento in modo che possa sintetizzare informazioni come raggi X e mammografie.
Lo smartphone pieghevole di Google
La Conferenza degli sviluppatori è stata anche l’occasione per Google di presentare il suo nuovo telefono pieghevole, Pixel Fold, che si chiude orizzontalmente come un libro.
Uno smartphone, dice l’azienda, che è “il meglio di entrambi i mondi”, in quanto può essere utilizzato come tablet quando è aperto o come telefono con lo schermo anteriore quando è piegato, Costerà 1.799 dollari e per il momento non sarà disponibile in Italia.
Nel nostro Paese sarà invece disponibile a poco più di 500 euro il Pixel 7a, nuova versione della fortunata serie di smartphone, che presto monterà anche Photo Editor, il software per la modifica delle immagini alimentato dall’intelligenza artificiale dell’azienda.
Monta un chip Google Tensor G2 e la VPN integrata di Google One protegge l’ attività online. Il display da 6,1 pollici ha una frequenza di aggiornamento fino a 90 Hz e la ram è da 8 GB.
Il chip è lo stesso di Pixel 7 e Pixel 7 Pro che fa funzionare il machine learning e il riconoscimento vocale di Google, nonché l’AI di Google e l’elaborazione avanzata delle immagini riprese con la doppia fotocamera posteriore. La batteria adattiva di Pixel 7a ha un’autonomia di oltre 24 ore, fino a 72 in modalità risparmio energetico. Come con i modelli precedenti, però, è sulla sicurezza che il Pixel si distingue grazie al chip Titan M2.
Scoprire Venezia e Firenze con Maps imersivo
Esplorare Venezia e Firenze come se si camminasse peri vicoli o si navigasse per i canali: Maps di Google reinventa il modo di muoversi con un sistema che diventa più che un navigatore rendendo l’esperienza ‘più visiva’ con funzionalità come la ricerca con Live View e la visualizzazione immersiva.
Immersive View utilizza la computer vision e l’intelligenza artificiale per fondere insieme miliardi di Street View e immagini aeree per creare un ricco modello digitale del mondo. Ottenendo indicazioni stradali si visualizzeranno in anteprima piste ciclabili, marciapiedi, incroci e parcheggi lungo il viaggio. Con il dispositivo di scorrimento temporale, si avrà accesso alle informazioni sulla qualità dell’aria e l’aspetto del percorso man mano che il tempo cambia durante il giorno. E indipendentemente dalla modalità che si sceglie, l’intelligenza artificiale e le tendenze di guida storiche simulano quante auto potrebbero essere sulla strada in un determinato momento.
L’implementazione di Immersive View partirà nei prossimi mesi da Amsterdam, Berlino, Dublino, Firenze, Las Vegas, Londra, Los Angeles, New York, Miami, Parigi, Seattle, San Francisco, San Jose, Tokyo e Venezia.