De la lansarea ChatGPT de către OpenAI acum mai bine de doi ani, producătorii de cipuri s-au concentrat pe dezvoltarea de hardware capabil să ruleze eficient codul necesar pentru ca milioane de oameni să utilizeze instrumente de IA. Deoarece modelele de bază trebuie să răspundă unui număr tot mai mare de solicitări pentru a alimenta aplicații de IA precum chatboții și motoarele de căutare, MLCommons a dezvoltat două noi versiuni ale benchmark-urilor MLPerf pentru a evalua viteza acestora.
Un nou benchmark bazat pe modelul Meta
Unul dintre noile benchmark-uri este bazat pe modelul de IA al Meta, denumit Llama 3.1, care are 405 miliarde de parametri. Testul vizează răspunsurile la întrebări generale, matematica și generarea de cod. Noul format testează capacitatea unui sistem de a procesa cereri voluminoase și de a sintetiza date provenite din multiple surse.
Nvidia a supus mai multe dintre cipurile sale acestui test de referință, la fel ca și producători de sisteme precum Dell Technologies. Conform datelor furnizate de MLCommons, Advanced Micro Devices (AMD) nu a trimis nicio componentă pentru testul major de 405 miliarde de parametri.
Performanța serverelor Nvidia
Pentru noul test, ultima generație de servere de inteligență artificială de la Nvidia – denumită Grace Blackwell și echipată cu 72 unități de procesare grafică (GPU) – a fost de 2,8 până la 3,4 ori mai rapidă decât generația anterioară. Această comparație a fost realizată utilizând doar opt GPU-uri din noul server pentru a asigura o paralelă directă cu modelul precedent, a declarat compania într-o conferință de presă marți.
Nvidia lucrează pentru a accelera conexiunile dintre cipurile din interiorul serverelor sale, un aspect crucial pentru activitățile de inteligență artificială, în care un chatbot funcționează simultan pe mai multe cipuri.
Un al doilea benchmark pentru răspunsuri instantanee
Cel de-al doilea benchmark este, de asemenea, bazat pe un model de IA open-source dezvoltat de Meta. Testul își propune să simuleze mai fidel așteptările privind performanța aplicațiilor de IA utilizate de publicul larg, precum ChatGPT.
Obiectivul acestuia este de a reduce timpul de răspuns al benchmark-ului și de a-l apropia cât mai mult de o reacție instantanee.
Abonează-te la canalul nostru WhatsApp pentru mai multe știri
Fiți la curent cu ultimele noutăți. Urmăriți DCBusiness și pe Google News
Ţi s-a părut interesant acest articol?
Urmărește pagina de Facebook DCBusiness pentru a fi la curent cu cele mai importante ştiri despre evoluţia economiei, modificările fiscale, deciziile privind salariile şi pensiile, precum şi alte analize şi informaţii atât de pe plan intern cât şi extern.
Săptămâna viitoare, UE va decide cu privire la răspunsul...
Acțiunile companiilor din sectorul Pharma au cunoscut un...
Prețurile petrolului au scăzut...
Reacția producătorilor auto nu...
România riscă să piardă...
Agenția Națională pentru Plăți...
Leul s-a apreciat, joi, 3...
Executivul a aprobat joi...
Dolarul s-a prăbușit, joi, la o...
Bursele europene ating minimul...
Tarifele lui Trump zguduie...
Industria diamantelor și a...
Leonardo Badea, viceguvernator...
Parlamentarii absenți riscă să piardă 5% din...
Analistul financiar Adrian...