NVIDIA aduce inteligența artificială generativă pentru milioane de oameni prin plăci video cu nuclee Tensor, LLM-uri, instrumente pentru PC-uri și stații de lucru RTX

Platforma AI de top primește un impuls accelerat RTX de la noile plăci video GeForce RTX SUPER, laptopuri AI de la toți producătorii de top și multe altele

0
299
Ascultă acest articol


NVIDIA a anunțat astăzi noile plăci video GeForce RTX™ SUPER pentru desktop care oferă performanțe AI generative supraalimentate, noi laptopuri AI de la toți producătorii de top alături de software și instrumente AI accelerate de NVIDIA RTX™ atât pentru dezvoltatori, cât și pentru consumatori.

Bazându-se pe decenii de leadership în domeniul PC-urilor, cu peste 100 de milioane de GPU-uri RTX care au condus era PC-urilor cu inteligență artificială, NVIDIA oferă acum aceste instrumente pentru a îmbunătăți experiențele pe PC cu inteligență artificială generativă: Accelerarea prin NVIDIA TensorRT™ a popularului model Stable Diffusion XL pentru fluxurile de lucru text-imagine, NVIDIA RTX Remix cu instrumente de textură AI generativ, microservicii NVIDIA ACE și mai multe jocuri care folosesc tehnologia DLSS 3 cu Frame Generation.

În plus, NVIDIA TensorRT-LLM (TRT-LLM), o bibliotecă open-source care accelerează și optimizează performanța de inferență a celor mai recente modele de limbaj de mari dimensiuni (LLM), suportă acum mai multe modele pre-optimizate pentru PC-uri. Accelerat de TRT-LLM, Chat with RTX, un demo tehnologic NVIDIA lansat luna aceasta permite entuziaștilor AI să interactioneze cu notele, documentele și alte tipuri de conținut.

“Inteligența artificială generativă este cea mai importantă tranziție de platformă din istoria calculului procesat și va transforma toate industriile, inclusiv gaming-ul,” a spus Jensen Huang, founder and CEO la NVIDIA. “Cu peste 100 de milioane de PC-uri și stații de lucru RTX AI, NVIDIA reprezintă o bază de instalare masivă pentru ca dezvoltatorii și jucătorii să se bucure de magia inteligenței artificiale generative.”

Rularea AI generativă la nivel local pe un PC este esențială pentru aplicațiile sensibile la confidențialitate, latență și costuri. Este nevoie de o bază de instalare mare de sisteme pregătite pentru AI, precum și de instrumente de dezvoltare adecvate pentru a regla și optimiza modelele de AI pentru platforma PC.

Pentru a veni în întâmpinarea acestor nevoi, NVIDIA oferă inovații în întreaga plajă tehnologică, generând noi experiențe și dezvoltând cele peste 500 de aplicații și jocuri pentru PC cu inteligență artificială deja accelerate de tehnologia NVIDIA RTX.

Stații de lucru și PC-uri

GPU-urile NVIDIA RTX – capabile să ruleze o gamă largă de aplicații la cea mai înaltă performanță – deblochează întregul potențial al inteligenței artificiale generative pe PC-uri. Nucleele Tensor din aceste GPU-uri accelerează dramatic performanța AI în cele mai solicitante aplicații pentru muncă și joacă.

Noile plăci grafice din seria GeForce RTX 40 SUPER, anunțate de asemenea astăzi la CES, includ GeForce RTX 4080 SUPER, 4070 Ti SUPER și 4070 SUPER pentru performanțe AI de top. GeForce RTX 4080 SUPER generează video AI de 1,5 ori mai rapid – și imagini de 1,7 ori mai rapid – decât GPU-ul GeForce RTX 3080 Ti. Nucleele Tensor din GPU-urile SUPER oferă până la 836 trilioane de operații pe secundă, aducând capabilități transformative de AI în jocuri, creație și productivitatea zilnică.

Producători de top — Acer, ASUS, Dell, HP, Lenovo, MSI, Razer și Samsung lansează o nouă serie de laptopuri RTX AI care oferă un set complet de capabilități cu AI generative imediat de cum sunt scoase din cutie. Noile sisteme care livrează o performanță de 20-60x mai mare prin comparație cu procesarea neurală vor fi expediate începând de luna aceasta.

Stațiile de lucru mobile cu GPU RTX pot rula software NVIDIA AI Enterprise, inclusiv TensorRT și NVIDIA RAPIDS™ pentru dezvoltarea simplificată și sigură a inteligenței artificiale generative și date. O licență pe trei ani pentru NVIDIA AI Enterprise este inclusă cu fiecare NVIDIA A800 40GB Active GPU, oferind o platformă de lucru de dezvoltare pentru AI și date.

Noi instrumente de dezvoltare pentru dezvoltatori pentru modele AI

Pentru a ajuta dezvoltatorii să creeze, testeze și personalizeze rapid modele AI generative preantrenate și LLM-uri folosindu-se de performanța unui PC și amprenta de memorie, NVIDIA a anunțat recent NVIDIA AI Workbench, un set de instrumente unificat și ușor de folosit.

AI Workbench care va fi lansat luna aceasta în beta oferă access la arhive populare precum Hugging Face, GitHub și NVIDIA NGC™ alături de o interfață simplificată care permite dezvoltatorilor să reproducă, colaboreze și migreze proiecte.

Proiectele pot fi scalate oriunde – fie că este vorba de un centru de date, un cloud public sau NVIDIA DGX™ Cloud — iar apoi aduse înapoi la un sistem RTX local de pe un PC sau stație de lucru pentru inferență și personalizare ușoară.

De asemenea, în colaborare cu HP, NVIDIA simplifică și dezvoltarea de modele AI prin integrarea NVIDIA AI Foundation Models and Endpoints, care include modele AI accelerate de RTX și kit-uri de dezvoltare software în HP AI Studio, o platformă centralizată pentru date. Acest lucru permite utilizatorilor să caute, importe și lanseze cu ușurință modele optimizate pe mai multe PC-uri și în cloud. 

După construirea modelelor AI pentru cazuri de utilizare pe PC dezvoltatorii le pot optimiza folosind TensorRT pentru a beneficia de întregul avantaj al nucleelor Tensor aflate pe plăcile video RTX. 

NVIDIA a extins recent TensorRT la aplicațiile bazate pe text cu TensorRT-LLM pentru Windows, o librărie open-source library pentru accelerarea LLM-urilor. Cel mai recent update al TensorRT- LLM disponibil acum adaugă Phi-2 la lista de modele pre-optimizate pentru PC care rulează de până la 5x mai rapid comparativ cu alte backedd-uri de inferență. 

AI Generativ accelerat de RTX alimentează noi experiențe pe PC

În cadrul CES, NVIDIA și dezvoltatorii lansează noi aplicații și servicii generative bazate pe inteligență artificială pentru PC-uri, inclusiv:

  • NVIDIA RTX Remix, o platformă pentru crearea de remasterizări RTX uimitoare ale jocurilor clasice. Lansată în versiune beta la sfârșitul acestei luni, aceasta oferă instrumente de inteligență artificială generativă care pot transforma texturile de bază din jocurile clasice în materiale de randare moderne, la rezoluție 4K, bazate pe fizică.
  • Microserviciile NVIDIA inclusiv modele de vorbire și de animație cu inteligență artificială generativă, care permit dezvoltatorilor să adauge avataruri digitale inteligente și dinamice în jocuri.
  • Accelerare TensorRT pentru Stable Diffusion XL (SDXL) Turbo și modelele de consistență latentă, două dintre cele mai populare metode de Stable Diffusion. TensorRT îmbunătățește performanța pentru ambele cu până la 60% în comparație cu cea mai rapidă implementare anterioară. O versiune actualizată a extensiei Stable Diffusion WebUI TensorRT este, de asemenea, disponibilă acum, incluzând accelerarea pentru SDXL, SDXL Turbo, LCM – Low-Rank Adaptation (LoRA) și un suport îmbunătățit pentru LoRA.
  • NVIDIA DLSS 3 cu Frame Generation, care folosește inteligența artificială pentru a crește ratele de cadre de până la 4 ori în comparație cu randarea nativă, va fi prezentă în multe dintre cele 14 noi jocuri RTX anunțate, inclusiv Horizon Forbidden West, Pax Dei și Dragon’s Dogma 2.
  • Chat with RTX, un demo tehnologic NVIDIA disponibil la sfârșitul acestei luni, le permite pasionaților de inteligență artificială să conecteze cu ușurință PC LLM-urile la propriile date folosind o tehnică populară cunoscută sub numele de retrieval-augmented generation (RAG). Demo-ul, accelerat de TensorRT-LLM, le permite utilizatorilor să interacționeze rapid cu notițele, documentele și alte tipuri de conținut. De asemenea, va fi disponibil ca proiect de referință open-source, astfel încât dezvoltatorii să poată implementa cu ușurință aceleași capacități în propriile aplicații.

Aflați mai multe despre cele mai recente descoperiri în materie de inteligență artificială generativă de la NVIDIA la CES.

LĂSAȚI UN MESAJ

Please enter your comment!
Please enter your name here

This site uses Akismet to reduce spam. Learn how your comment data is processed.