Acasă Tech, IT & Mobile Tech AMD lansează Instinct™ MI350P PCIe®: AI enterprise pe infrastructura deja existentă

AMD lansează Instinct™ MI350P PCIe®: AI enterprise pe infrastructura deja existentă

0
6
Ascultă acest articol


Pe măsură ce organizațiile adoptă AI, multe dintre acestea descoperă că infrastructura lor are dificultăți în a ține pasul cu modernizarea. Rularea AI în cloud reprezintă o opțiune, însă cloudul poate introduce riscuri privind confidențialitatea și costuri imprevizibile. Modernizarea infrastructurii locale este o altă opțiune, însă suportul pentru platforme mari de accelerare GPU poate necesita reproiectări costisitoare ale alimentării și răcirii din centrele de date. Noile plăci AMD Instinct™ MI350 PCIe® oferă întreprinderilor o a treia opțiune: performanță AI de vârf, proiectată să se potrivească infrastructurii de centru de date pe care o dețineți deja.

Performanță AI care se instalează direct în infrastructura actuală

Concepute pentru a pregăti companiile pentru era AI agentic, plăcile AMD Instinct MI350P PCIe sunt plăci dual-slot, ușor de integrat, pentru servere standard cu răcire pe aer. Acestea permit implementarea inferenței on-prem prin folosirea infrastructurii actuale de alimentare, răcire și rack-uri din centrele de date. GPU-urile AMD Instinct, disponibile sub formă de plăci PCIe eficiente din punct de vedere al costurilor, completează portofoliul AMD de calcul AI și oferă o gamă largă de opțiuni pentru întreprinderi, pe măsură ce parcurg propriul traseu de adopție AI.

Formatul de placă PCIe reprezintă o alegere excelentă pentru întreprinderile care au nevoie de mai multă putere de calcul AI decât pot oferi CPU-urile, dar nu sunt încă pregătite să investească în platforme dedicate de accelerare GPU. Disponibile în sisteme cu răcire pe aer, cu până la opt plăci acceleratoare, plăcile AMD Instinct MI350P PCIe sunt ideale pentru modele AI mici, medii și mari utilizate în inferență și în pipeline-uri RAG.

Scalați inteligent. Maximizați ROI‑ul.

Plăcile AMD Instinct MI350P PCIe sunt proiectate pentru a oferi performanțe AI excepționale, cu un echilibru excelent între cost și performanță de lider. Caracteristicile cheie cresc performanța, simplifică implementarea și reduc costurile, astfel încât să puteți trece de la evaluare la rezultate concrete:

    • Suport nativ pentru preciziile MXFP6 și MXFP4, care permit un nivel ridicat de performanță și un debit de date crescut.
    • Accelerare suplimentară prin suport pentru optimizare, compatibilă cu cele mai utilizate precizii pe 8 și 16 biți.
    • Performanță estimată de până la 2.299 teraflopi (TFLOPS) și până la 4.600 TFLOPS de vârf în MXFP4, cel mai înalt nivel de performanță disponibil în prezent pentru o placă PCIe destinată mediului enterprise.
    • Până la 144 GB de memorie HBM3E cu lățime mare de bandă, care atinge viteze de până la 4 TB/s.
  • Un ecosistem deschis, cu opțiuni de stack de dezvoltare cu costuri reduse sau fără costuri, care facilitează implementarea și contribuie la reducerea cheltuielilor operaționale.

Software AI enterprise – Libertatea de a folosi stack‑ul AI ales

Plăcile AMD Instinct MI350P PCIe sunt proiectate pe baza standardelor deschise, pentru a asigura interoperabilitatea între platforme. Această abordare continuă strategia companiei AMD de a susține un ecosistem AI complet deschis și de a oferi clienților libertate de alegere în mediile enterprise.

Stack-ul AMD Enterprise AI funcționează ca o componentă fundamentală, care se integrează perfect cu un ecosistem larg de software și instrumente AI. Acesta include Kubernetes GPU Operator pentru managementul complet al ciclului de viață, AMD Inference Microservices native cloud și suport nativ pentru framework-uri AI precum PyTorch. Toate acestea permit migrarea sarcinilor de inferență cu modificări minime de cod.

AMD Enterprise AI Reference Stack este open-source și se oferă partenerilor fără costuri de licențiere. Acesta asigură o transparență mai mare a codului și contribuie la reducerea cheltuielilor operaționale. Atunci când se combină cu plăcile GPU AMD Instinct MI350P PCIe și cu soluțiile livrate de parteneri, stack-ul permite organizațiilor să implementeze rapid sisteme AI locale, fără costuri recurente per token.

Optimizare nativă pentru nivelurile de precizie AI enterprise

Plăcile AMD Instinct MI350P PCIe suportă întregul spectru de niveluri de precizie pe care se bazează majoritatea modelelor AI enterprise. În timp ce preciziile scăzute MXFP6 și MXFP4 maximizează performanța exprimată în TFLOPS și eficiența implementării modelelor, formatele cu precizie mai ridicată, cum ar fi INT8 și BF16, beneficiază de suportul pentru sparsitate al GPU-ului AMD Instinct MI350P, pentru a oferi performanțe eficiente. Indiferent de nivelul de precizie, plăcile AMD Instinct MI350P PCIe oferă un throughput GPU maxim și un consum redus de memorie, ceea ce contribuie la scăderea cerințelor de alimentare și răcire.

Suportul pentru FP8, MXFP8 și MXFP4 reprezintă un motiv major pentru care plăcile AMD Instinct MI350P PCIe pot procesa sarcinile AI actuale în centre de date standard, cu răcire pe aer.

Implementați AI pentru întreprinderi pe infrastructura actuală

Cu plăcile AMD Instinct MI350P PCIe, întreprinderile pot trece rapid de la infrastructura fizică existentă la sisteme AI pregătite pentru producție, construite pe o bază solidă. Aceste plăci permit migrarea workload-urilor fără rescriere de cod, integrarea cu pipeline-urile AI existente și scalarea în funcție de evoluția sarcinilor de lucru.

Adoptarea AI nu presupune reconstruirea infrastructurii de la zero. Cu plăcile AMD Instinct MI350P PCIe, întreprinderile pot rula mai multe modele și pot deservi mai mulți utilizatori în cadrul centrelor de date existente.

LĂSAȚI UN MESAJ

Please enter your comment!
Please enter your name here

This site uses Akismet to reduce spam. Learn how your comment data is processed.

Ascultă acest articol