Microsoft porta DALL-E 3 di OpenAI su Bing, disponibile gratuitamente per tutti. L’evoluzione di DALL-E offre immagini creative e fotorealistiche con un modello più grande e una migliore capacità generativa.
Microsoft ha annunciato che l’ultimo modello Dall-E 3 di OpenAI è ora disponibile gratuitamente per tutti gli utenti di Bing Chat e Bing Image Creator. Si tratta di un importante aggiornamento per il generatore di immagini all’interno della chat di Bing alimentato dall’intelligenza artificiale, che ora è in grado di generare immagini più creative e fotorealistiche.
Dall-E 3 è la terza versione del modello di generazione di immagini di OpenAI. La società di Redmond afferma che comprende le richieste molto meglio di prima. E può creare immagini più creative e molto più fotorealistiche.
Lo strumento è anche progettato per essere molto più facile da usare, cosa che possiamo confermare dalla nostra veloce prova.
Dall-E 3 è dunque integrato in Bing Image Creator e arriverà su ChatGPT durante questo mese. Su ChatGPT sarà a pagamento.
Microsoft vuole comunque andare avanti con il processo di integrazione degli strumenti. E infatti è in programma lo sviluppo di uno strumento di creazione di immagini AI nell’app Paint chiamata Paint Cocreator che porterà il modello Dall-E direttamente dentro Windows.
Cosa cambia con DALL-E 3, le caratteristiche
Oltre alle nuove funzionalità e miglioramenti, Dall-E 3 presenta anche una serie di differenze tecniche rispetto alla versione precedente.
Ecco le principali:
- Dimensione del modello: DALL-E 3 ha un modello più grande di DALL-E 2, con 1,6 trilioni di parametri rispetto ai 12 miliardi di DALL-E 2. Questo significa che DALL-E 3 è in grado di generare immagini più realistiche e complesse.
- Tecnologia di generazione: DALL-E 3 utilizza una nuova tecnologia di generazione chiamata Diffusion Models, che è più efficiente e produce immagini di migliore qualità.
- Capacità di modifica: DALL-E 3 è in grado di modificare le immagini esistenti, mentre DALL-E 2 era in grado solo di generare immagini nuove.
DALL-E 3 per tutti su Bing, la prova
Dalla nostra breve prova, possiamo affermare che DALL-E 3 aderisce quasi fedelmente a istruzioni (prompt) complesse. Infatti, DALL E 3 può rappresentare accuratamente scene con oggetti specifici.
Dall-E 2 spesso rendeva immagini con evidenti dettagli artefatti.
Nella nostra prova abbiamo usato prompt molto veloci e quasi basici. Tipo: “cane che fa il bagno in una cascata“, oppure “una donna che passeggia a New York con capelli castani“; o ancora, “uomo che dimentica di fare backup“; e poi ancora, “uomo che passeggia a new york“.
Il risultato è evidentemente superiore rispetto all’esperienza precedente.
Un particolare che abbiamo notato è che quando Dall-E 3 si imbatte nella realizzazione di una immagine con un testo, questo viene adesso scritto in maniera quasi corretta e leggibile. A differenza di Dall-E 2 che spesso creava testi illeggibili.
Dunque, l’introduzione di Dall-E 3 all’interno di Bing evidenzia momento fondamentale per la tecnologia di generazione di immagini AI, e Microsoft non vuole perdere l’occasione. Soprattutto con la crescita di potenziali concorrenti come Google, con Bard, Midjourney e Stability AI.
Dall-E 3, attenzione agli aspetti etici
Come abbiamo già detto, lo strumento è ora disponibile a un pubblico più ampio e offre una serie di nuove funzionalità e miglioramenti. Tra cui una dimensione del modello più grande, una nuova tecnologia generativa e la capacità di modificare le immagini esistenti.
Grande attenzione per tutto ciò che riguarda l’aspetto etico dell’utilizzo di strumenti come questi. Questo per i rischi che si corrono, di cui si è molto discusso con i modelli precedenti. L’azienda si dice impegnata nel rispetto dei diritti d’autore, della privacy e della sicurezza degli utenti.
Microsoft, inoltre, afferma di aver implementato dei meccanismi per prevenire la generazione di immagini inappropriate o offensive. Inoltre, afferma di monitorare costantemente le opinioni degli utenti al fine di migliorare il servizio.
[L’immagine di copertina è stata realizzata con Bing Image Creator con tecnologia Dall-E 3]
Buongiorno. Ho provato Dall-E 3 sia su ChatGPT-4 Plus (a pagamento) che su Bing Image Creator, ed entrambi si sono rifiutati di aggiungere elementi generati da un prompt, dentro un’immagine fornita da me. Nel caso di ChatGPT-4 mi è stato risposto chiaramente dal bot che non è possibile, mentre per Bing non c’è un tasto od icona per farlo. Al contrario di quello che dici in questo articolo.
Oggi è il 3 novembre 2023.
Grazie
Giovanni
Buongiorno a te!
Rispetto alla modifica di immagini esistenti, ChatGPT 4 risponde “Sì, posso fare modifiche di base all’immagine, come ridimensionare, ruotare, ritagliare, e alcune altre operazioni. Carica l’immagine e dimmi che modifica vuoi apportare, e farò del mio meglio per aiutarti!”. La mia domanda era “se ti carico un’immagine, puoi modificarla?”.
Quindi sì, ChatGPT 4 modifica immagini esistenti che si possono caricare aprendo una conversazione di base. Ti invito a fare una prova adesso.
Diversamente Bing Image Creator che al momento non permette la modifica, ma non è detto che ciò non possa avvenire nelle prossime settimane o mesi.
Spero di aver risposto :)