banner
Casa / Blog / La nuova partnership con Microsoft accelera lo sviluppo dell’intelligenza artificiale generativa
Blog

La nuova partnership con Microsoft accelera lo sviluppo dell’intelligenza artificiale generativa

Jan 28, 2024Jan 28, 2024

Unisciti ai massimi dirigenti a San Francisco l'11 e il 12 luglio per scoprire come i leader stanno integrando e ottimizzando gli investimenti nell'intelligenza artificiale per il successo. Saperne di più

Una delle tendenze più in voga nel campo dell’intelligenza artificiale (AI) quest’anno è stata l’emergere di popolari modelli di intelligenza artificiale generativa. Con tecnologie come DALL-E e Stable Diffusion, stanno emergendo un numero crescente di startup e casi d’uso.

L’intelligenza artificiale generativa si basa su una serie di tecnologie fondamentali, compreso l’uso di modelli di trasformatori. L’uso di trasformatori per l’intelligenza artificiale generativa e altri casi d’uso può richiedere un uso intensivo delle risorse sul lato dell’inferenza, dove i sistemi prevedono e costruiscono i risultati di un modello.

Tra i fornitori che stanno sviluppando tecnologia per aiutare ad accelerare l'inferenza dell'intelligenza artificiale per i modelli di trasformatori c'è la startup d-Matrix, che ha raccolto 44 milioni di dollari in una serie di finanziamenti in aprile per aiutare a sviluppare la sua tecnologia hardware di accelerazione dell'intelligenza artificiale. L'azienda ha sviluppato una tecnologia DIMC (Digital In-Memory Compute) che non è ancora disponibile al pubblico, ma ha già attirato l'attenzione di Microsoft.

Microsoft e d-Matrix hanno annunciato oggi che l'apprendimento di rinforzo di Microsoft Project Bonsai sarà supportato dalla tecnologia d-Matrix DIMC, che i due fornitori sperano possa fornire un'accelerazione significativa per l'inferenza dell'intelligenza artificiale.

Trasforma il 2023

Unisciti a noi a San Francisco l'11 e il 12 luglio, dove i massimi dirigenti condivideranno come hanno integrato e ottimizzato gli investimenti nell'intelligenza artificiale per raggiungere il successo ed evitare le insidie ​​​​comuni.

"Project Bonsai è una piattaforma che abilita la nostra versione dell'apprendimento profondo per rinforzo e lo chiamiamo insegnamento automatico", ha detto a VentureBeat Kingsuk Maitra, principale ingegnere di intelligenza artificiale applicata presso Microsoft. "Abbiamo addestrato un compilatore per la tecnologia di calcolo digitale in-memory unica nel suo genere di d-Matrix e i primi risultati sono molto incoraggianti."

Project Bonsai è stato sviluppato presso Microsoft negli ultimi anni ed è attualmente disponibile in anteprima.

Maitra ha affermato che l’obiettivo dello sforzo è quello di eliminare le complessità associate alle reti di apprendimento per rinforzo profondo. Un obiettivo iniziale per Project Bonsai sono i controlli industriali, compresa la progettazione e la produzione dei chip. Parte della tecnologia è la capacità di addestrare modelli utilizzando un linguaggio di alto livello sviluppato presso Microsoft Project Bonsai chiamato Inkling per addestrare agenti di rinforzo profondo a svolgere compiti di controllo.

L’apprendimento per rinforzo profondo non richiede dati etichettati, ha spiegato Maitra. Piuttosto, apprende essenzialmente con il feedback dell’ambiente, che può essere emulato con un simulatore. Alla fine di un ciclo di addestramento, il risultato è un agente addestrato per l'apprendimento per rinforzo (RL), che Microsoft definisce "cervello". Il cervello, una volta schierato, può intraprendere azioni significative per completare il compito da svolgere.

"Stiamo eseguendo carichi di lavoro attivi nella vita reale e addestrando il compilatore, rispetto a quei carichi di lavoro nella vita reale, la maggior parte dei quali con modelli linguistici di grandi dimensioni ben noti con diversi cervelli Bonsai", ha detto Maitra.

Attualmente d-Matrix non ha chip disponibili al pubblico, ma il primo, nome in codice Corsair, debutterà nel 2023.

"Stiamo costruendo una piattaforma informatica accelerata per trasformatori e focalizzata specificamente sull'intelligenza artificiale generativa", ha detto a VentureBeat Sudeep Bhoja, cofondatore e CTO di d-Matrix.

Bhoja ha spiegato che i chip che d-Matrix sta sviluppando possono essere costruiti in modo molto modulare e potrebbero essere assemblati insieme a una CPU o integrati su una scheda PCI che si collega a un server nel cloud. La tecnologia d-Matrix è progettata per aiutare ad accelerare l'inferenza dell'intelligenza artificiale, con la sua tecnologia DIMC che fornisce prestazioni elevate e bassa latenza.

Con Project Bonsai di Microsoft, d-Matrix ha ora un compilatore in grado di creare strumenti di apprendimento per rinforzo profondo per il suo silicio. Uno degli obiettivi finali principali di d-Matrix è contribuire a supportare la crescita e l'implementazione continue di modelli di intelligenza artificiale generativa.

"Vogliamo abilitare [modelli di intelligenza artificiale generativa] perché richiede molta potenza di elaborazione, ci sono vincoli di latenza ed è rivolto all'utente", ha affermato Bhoja. "Devi essere in grado di farlo in modo molto efficiente dal punto di vista energetico in modo che i data center non debbano apportare più energia...."