La Cina batte GPT-Tre con un modello di linguaggio AI ancora più ambizioso

La Cina batte GPT-Tre con un modello di linguaggio AI ancora più ambizioso
Un istituto cinese di intelligenza artificiale ha svelato un nuovo modello di elaborazione del linguaggio naturale (NLP) ancora più complesso di quelli creati da Google e OpenAI. Il modello WuDao Twenty è stato creato dalla Beijing Academy of Artificial Intelligence (BAAI) e sviluppato con l'aiuto di oltre un centinaio di scienziati di diverse organizzazioni. Ciò che rende così unico questo modello di intelligenza artificiale precedentemente addestrato è il fatto che ne utilizza uno con XNUMX miliardi di configurazioni per simulare conversazioni, comprendere immagini, comporre poesie e persino creare ricette. I fattori sono variabili definite dai modelli di apprendimento automatico e, man mano che questi modelli si evolvono, anche i fattori stessi migliorano per consentire a un algoritmo di trovare meglio il risultato giusto nel tempo. Una volta che un modello è stato addestrato su un set specifico di dati, come i campioni di parlato umano, il risultato può essere applicato per risolvere altri problemi correlati. I modelli con più fattori tendono ad essere più complessi, ma ciò richiede di investire più tempo e denaro nel loro sviluppo.

Modello WuDao 2.0

Nel primo mese dell'anno in corso, Switch Transformer di Google ha stabilito un nuovo record per i modelli di linguaggio AI con 6 miliardi di fattori, XNUMX volte in più rispetto ai XNUMX miliardi di fattori trovati nel modello GPT.-Tre di OpenAI rilasciati lo scorso anno. Tuttavia, ora con il rilascio del suo modello WuDao venti, BAAI ha battuto i record stabiliti da Google e OpenAI. WuDao XNUMX è in grado di comprendere sia il cinese che l'inglese, mentre il nuovo modello di intelligenza artificiale si è formato attraverso lo studio di uno con due Terabyte di testo in ogni lingua e quattro con nove Terabyte di immagini e testo insieme. . Finora ha ventidue partner, tra cui Xiaomi, Meituan e Kuaishou in Cina. Lo studioso di intelligenza artificiale cinese Blake Yan ha dichiarato al post del blog South China Morning come questi geniali modelli di linguaggio di intelligenza artificiale possono utilizzare le conoscenze che hanno per apprendere nuovi compiti, dicendo: "Questi modelli complessi, addestrati su set di dati giganti richiedono solo una piccola quantità di nuovi dati quando utilizzati per una specifica funzionalità, perché possono trasferire le conoscenze già acquisite a nuovi compiti, proprio come gli esseri umani. I modelli pre-addestrati su larga scala sono oggi una delle migliori scorciatoie per l'intelligenza artificiale generale. L'intelligenza generale artificiale, che si riferisce all'ipotetica capacità di una macchina di apprendere qualsiasi compito come un essere umano, è l'obiettivo finale dell'addestramento di questi fantastici modelli di linguaggio AI e con il rilascio di WuDao venti, sembra che siamo solo un passo più vicini a raggiungerlo. Tramite il post sul blog South China Morning