Meta presenta Llama 3.1 405B, un modello di IA generativa open-source con 405 miliardi di parametri. E supera la concorrenza di GPT-4 e Claude 3.5 in prestazioni e accessibilità. Entro fine anno sarà il chatbot più usato al mondo.
Non passa giorno che non ci sia un annuncio riguardante l’intelligenza artificiale e il lancio di un nuovo modello sempre più performante. L’ultimo annuncio di rilievo proviene da Meta. Si tratta di un modello che rappresenta un ulteriore passo avanti nel campo degli LLM (Large Language Model). E si distingue per essere open-source.
È evidente che la IA generativa è la tecnologia del momento. E le aziende puntano sempre di più a prevalere in un settore sempre più all’avanguardia.
E dal punto di vista degli annunci, non passa inosservato quello di Meta. L’azienda guidata da Mark Zuckerberg ha annunciato Llama 3.1 405B. Una novità questa che era attesa dal mese di aprile. Quando Meta disse di aver iniziato a lavorare su un modello più performante e innovativo.
E in effetti da quello che si conosce rispetto a questo modello l’elemento di novità risiede, secondo il punto di vista di molti, nel fatto che si tratta un modello open-source.
Ecco Llama 3.1 405B
Prima di vedere bene cosa significa portare il concetto di open source in un modello di IA generativa, cerchiamo di conoscere meglio le caratteristiche di Llama 3.1 405B.
Intanto va dello subito che si tratta del più grande modello LLM, open source, mai rilasciato. E Meta sostiene anche che questo suo modello sia superiore a modelli come GPT-4o e Claude 3.5 Sonnet di Anthropic rispetto a diverse prestazioni.
In generale, un LLM di grandi dimensioni con un gran numero di parametri può svolgere compiti più complessi rispetto a LLM più piccoli. Come comprendere il contesto in lunghi flussi di testo; risolvere complesse equazioni matematiche. E, persino, generare dati sintetici che possono presumibilmente essere utilizzati per migliorare modelli di intelligenza artificiale più piccoli.
Modello addestrato sui chip Nvidia
Ora, il modello di Meta è stato addestrato su oltre 16.000 GPU NVIDIA H100. Allo stato attuale, stiamo parlando dei chip più veloci disponibili che arrivano a costare circa 25.000 dollari ciascuno. Meta sostiene che questo modello può battere i rivali rispetto a oltre 150 benchmark.
Il numero “405B” sta per 405 miliardi di parametri. Ossia variabili interne che un modello di IA utilizza per ragionare e prendere decisioni. Più grande è il numero di parametri di un modello di IA e più intelligente questo modello viene percepito.
Meta ha anche rilasciato versioni aggiornate di modelli Llama esistenti che contengono 70 miliardi e 8 miliardi di parametri ciascuno.
“Le capacità di ragionamento migliorate di Llama 405B consentono a Meta AI di comprendere e rispondere alle tue domande più complesse, in particolare sugli argomenti di matematica e programmazione“, è scritto all’interno del post del blog di Meta. “Puoi ottenere aiuto per i tuoi compiti di matematica con spiegazioni e feedback passo dopo passo, scrivere codice più velocemente con supporto e ottimizzazione del debug“.
L’estensione di Llama 3.1 405B
L’azienda di Mark Zuckerberg sta estendendo l’accesso a Meta AI ad altre sette regioni: Argentina; Cile; Colombia; Ecuador; Messico; Perù; e Camerun. Queste sono le ultime ad avere accesso al chatbot in-app di Meta.
Inoltre, gli utenti ora possono interagire con il bot in sette nuove lingue: francese; tedesco; hindi; hindi-romanizzato; italiano; portoghese; spagnolo.
Llama 3.1 sarà quindi integrato all’interno delle piattaforme di Meta. Lo si troverà su Instagram, Facebook, Messenger e WhatsApp.
A partire da questa settimana, Llama 3.1 sarà accessibile prima tramite WhatsApp e il sito web di Meta AI negli Stati Uniti, seguito da Instagram e Facebook nelle prossime settimane.
La versione Llama 3.1 sulle altre piattaforme sarà quella da 70 miliardi di parametri.
Mentre il modello di parametri più avanzato di Llama 3.1 da 405 miliardi è gratuito da usare sul sito Meta AI, l’assistente passerà al modello più ridotto da 70 miliardi dopo aver superato un numero non specificato di prompt in una determinata settimana.
Un’azione suggerita dal fatto il modello da 405 miliardi è troppo costoso per Meta e che difficilmente può essere eseguito da subito su ampia scala.
Visualizza questo post su Instagram
Llama 3.1 e la posizione di predominio sulla IA generativa
Ciò detto, Llama 3.1 con i suoi 405 miliardi di parametri e in una versione open source si pone in una posizione di predominio assoluta nel panorama della IA generativa.
Questo perché solo Meta è in grado di arrivare a miliardi di persone attraverso le sue piattaforme. Cosa che ancora riesce difficile a ChatGPT o a Claude.
E questo è spiegato dal fatto che Meta, a differenza degli altri modelli, attraverso Llama 3.1 non intende fare soldi vendendo l’accesso ai loro LLM proprietari o offrendo servizi per aiutare i clienti a utilizzare la tecnologia. L’intento di Meta è quello di arrivare a dominare la scena del panorama della IA generativa. E questo è possibile attraverso un modello open-source.
Llama 3.1 modello “democratico” open source
Si tratta di una scelta mira a rendere più “democratico” l’accesso alle tecnologie avanzate di IA, consentendo a ricercatori e sviluppatori di tutto il mondo di contribuire e migliorare il modello.
L’approccio open-source di Meta si distingue dalle politiche più restrittive di altre grandi aziende, come OpenAI e Anthropic, che mantengono i loro modelli proprietari e chiusi al pubblico.
Questa apertura mira a promuovere l’innovazione e la collaborazione. Ma, allo stesso tempo, solleva anche interrogativi sul controllo e la sicurezza delle tecnologie avanzate di IA.
La disponibilità di modelli open-source così potenti può accelerare il progresso tecnologico, ma richiede anche una gestione attenta per evitare usi impropri.
Nella sua lettera, pubblicata ieri, Mark Zuckerberg ha sostenuto che un approccio open source allo sviluppo dell’intelligenza artificiale garantirà un accesso più ampio ai vantaggi della tecnologia; impedirà la concentrazione del potere nelle mani di poche grandi aziende; e consentirà un’implementazione più sicura dell’intelligenza artificiale nella società.
Meta e la collaborazione con grandi aziende
Meta ha realizzato questo progetto con la collaborazione di grandi aziende tech che hanno preso parte a vario titolo. Tra queste, vanno citate Nvidia, IBM, Amazon Web Services, Google Cloud, Dell, Microsoft e altre.
Non vi è dubbio che entro la fine dell’anno Llama 3.1 sarà il modello IA generativa più usato al mondo.
Al momento il sito web non è disponibile per l’Italia, sebbene l’italiano sia una delle lingue aggiunte. Non si conoscono ancora i tempi dell’arrivo di Llama 3.1 in UE, anche perché poi tutto questo deve superare la fase di valutazione rispetto alla nuova norma UE, IA Act.
Quello che è sicuro è che Meta da oggi si appresta a dominare un settore, come quello della IA generativa, sempre più strategico.