Ce serie are geforce 9600 gt? Determinarea seriei de produse de plăci video Nvidia

A noua generație de plăci video de la Nvidia s-a născut la începutul anului 2008. În centrul atenției va fi chipsetul cu preț mediu - GeForce 9600 GT. Caracteristici, rezultate ale testelor, impresie generală de stabilitate - toate acestea le găsiți mai jos. Drept urmare, veți putea face o alegere

Istoria apariției

În 2008, când AMD era ocupat cu producția de plăci video de buget, Nvidia avea doar copii ale versiunii de top. Astfel, s-au lipsit de cel mai mare segment de consumatori. A apărut întrebarea despre crearea unui concurent pentru seria Radeon 3800. În primul rând, am încercat să umplem această nișă cu ajutorul unei versiuni mai slabe a plăcii video de top GeForce 8800. A fost redusă la 256 MB ridicoli. Și placa a fost scoasă la vânzare. Cu toate acestea, această modificare a plăcii video nu a câștigat popularitate în rândul utilizatorilor de computere.

Profitul din vânzări a fost neglijabil. Acest lucru se datorează faptului că costul unui astfel de cip de top este suficient de mare pentru a-i reduce performanța și a-l vinde la un preț scăzut. Ca urmare, episodul nouă a ieșit în prim-plan. Inițial, producția era planificată să înceapă nu mai devreme de un an mai târziu. Acest lucru se aplică în special primului GT. Caracteristicile plăcii video sunt la un nivel mediu: între 8600 și 8800 GTS. Din gama de modele AMD, seria 3800 a devenit un concurent.

Motto-ul pentru creșterea vânzărilor lui 9600 GT a fost următoarea frază: performanță bună pentru bani puțini. Din recenzie veți afla dacă afirmația a fost confirmată sau nu cu privire la placa video Nvidia 9600 GT, ale cărei caracteristici sunt impresionante. Acest cip grafic a devenit adevăratul fondator al unei întregi generații de noi chipset-uri, care au adus și mai multă popularitate companiei și au extins semnificativ baza de clienți atât în ​​rândul cumpărătorilor de hardware de ultimă generație, cât și în segmentul de preț mediu.

Nvidia 9600 GT: specificații tehnice

Deci, să ne dăm seama ce este această placă video. Baza a fost chipsetul 8800 GTS. Doar redus în parametri. Deoarece 8800 GTS a fost doar o dezvoltare intermediară, ale cărei tehnologii au fost utilizate mai târziu în 9800. Baza pentru card a fost chipsetul G94, la fel ca în seria 8800. Vă puteți întreba: de ce atunci costă mult mai puțin și pe ce economisește producătorul? Răspunsul este destul de simplu. 9600 GT a redus la jumătate numărul de procese de filetare în comparație cu modelul mai vechi. Acest lucru ne-a permis să reducem semnificativ prețul. Dar creșterea performanței a fost obținută prin utilizarea magistralelor identice cu o lățime de 256 de biți. Acest lucru ne-a permis să atingem frecvențe mai mari ale procesorului și rate de procesare a shaderului.

Conform modelului 9600 GT, ale cărui caracteristici au fost reduse, este mai productiv decât seria 8800 cu până la 15%. Ce progres în tehnologie! Puțin mai târziu vom stabili prin teste practice dacă acest lucru este adevărat sau nu. Placa video este echipata si cu 512 MB de memorie interna, suport pentru modul SLI (conexiune simultana la sistemul a pana la trei placi video identice care functioneaza in paralel). Are o interfață DirectX 10 și toți conectorii necesari pentru conectarea monitoarelor, ieșirea imaginilor către un televizor și așa mai departe.

Prezentare de ansamblu externă a plăcii video

Placa a devenit ceva mai mică decât predecesorul său, în principal datorită tehnologiei simplificate. Acest lucru îi permite să fie instalat în spații destul de înguste. clădiri bugetare. La urma urmei, 9600 GT (caracteristici de mijloc) ar trebui să corespundă clasei sale, indiferent de cum îl priviți. Există multe găuri în întreaga zonă a plăcii, care sunt concepute pentru a îmbunătăți disiparea căldurii. Partea superioară este acoperită cu o carcasă din plastic cu un radiator și un răcitor. Acest lucru este suficient pentru a menține o temperatură constant scăzută chiar și la sarcini mari.

Rezultatele testelor

Pentru a efectua teste în jocuri, a fost instalat următorul stand. Procesul de la Intel este Core 2 Duo, dual-core cu o frecvență de 3 Hz pentru fiecare nucleu. În plus, erau 4 GB RAM, un hard disk de 750 GB și o sursă de alimentare Acbel de 500 W. Testarea a fost efectuată în acele jocuri care erau relevante la momentul lansării plăcii video 9600 GT. Caracteristicile calculatorului de bancă corespund, de asemenea, acelei perioade.

Indicatorii din jocurile Crysis, Call of Duty 4, Bioshock, Lost Planet sunt luați ca bază. Toate au fost lansate cu suport DirectX 10 și la setări maxime cu Rezoluție Full-HD. Primul joc (Crysis) s-a comportat foarte prost - doar 10 cadre pe secundă. Bugetul modelului de placă video are impact. În Call of Duty 4 și Bioshock, jocul produce 40 de cadre pe secundă stabil la setările maxime. Acest lucru este deja bun pentru segmentul de preț mediu al cipurilor video. Lost Planet a fost confortabil de jucat la setări medii sau scăzute cu rezoluția maximă a ecranului.

Consumul de energie și overclockarea

Să trecem la consumul de energie. Inginerii Nvidia au reușit să reducă consumul de energie cu până la 15%. Creatorii arată în toate privințele că plăcile video Nvidia 9600 GT aparțin clasei de mijloc: caracteristicile, consumul de energie, performanța sunt exact la nivelul nivel bun pentru pretul ei. Creatorii plăcii video nu au uitat de cei cărora le place să experimenteze cu hardware-ul lor. Am decis să nu atingem capacitățile de overclocking. Prin urmare, pe riscul și riscul lor, proprietarii pot încerca să creeze un adevărat monstru și cuceritor al jocurilor moderne dintr-o tablă cu performanțe medii.

Modelele de plăci video apărute pe piață în urmă cu mai bine de 10 ani încă nu își pierd relevanța. Principalul lor avantaj față de modelele moderne este costul redus. Nvidia Geforce 9600 GT este unul dintre cei mai străluciți reprezentanți ai unor astfel de acceleratoare video. Modelul a apărut pe piață în 2008 și era un dispozitiv de clasă de mijloc. De-a lungul timpului, placa video nu se poate lăuda cu performanțe ridicate. Dar, chiar și în ciuda acestui fapt, acest model este o soluție bună pentru îndeplinirea sarcinilor de birou: lucrul cu Microsoft Office și editori grafici simpli.

Pentru a înțelege ce oferă exact acceleratorul video al acestui model, este necesar să aruncăm o privire mai atentă Specificatii Nvidia GeForce 9600 GT.

  • Procesor placa video: G94;
  • Frecvența de ceas GPU: 650MHz;
  • Tehnologia procesului: 65 nanometri;
  • Capacitate memorie accelerator video: 512 MB;
  • Tip RAM: GDDR3;
  • Lățime de bandă: 57 Gbps;
  • Frecvența tacului RAM: 1800 MHz;
  • Frecvența SPU: 1625 MHz;
  • Număr de blocuri de rasterizare: 16;
  • Blocuri de textura: 32;
  • Număr de SPU: 64;
  • Număr de tranzistori: 505 milioane.

Recenzie GeForce 9600 GT

Această placă grafică nu necesită scump sau procesoare puternice. Cea mai bună opțiune pentru munca confortabilă ar fi modelele de la Intel și AMD din segmentul de buget.

Consumul de energie al modelului 9600GT este de 96 de wați. Prin urmare, atunci când alegeți o sursă de alimentare, va fi suficient un model cu o capacitate de 300 de wați sau mai mult, chiar și ținând cont de faptul că procesorul și placa de bază consumă și puterea sursei de alimentare instalate pe computer.


În stare de funcționare, placa video se încălzește până la 50-60 de grade. Acest indicator este temperatura normală a plăcii video GeForce 9600 GT în timpul funcționării. Uneori se poate ridica la 80 de grade atunci când rulează aplicații „grele”: programe de editare video sau jocuri moderne.

Dacă observați o astfel de creștere a temperaturii în timp ce este inactiv sau când efectuați sarcini simple, atunci ar trebui să înlocuiți pasta termică a plăcii video și să vă asigurați că răcitorul funcționează.

Cum să overclockați o placă video Nvidia Geforce 9600 GT

Dacă doriți să îmbunătățiți parametrii de bază și să creșteți viteza acceleratorului video, atunci trebuie să faceți overclock pe placa video Nvidia Geforce 9600 GT.

Pentru a efectua procesul, veți avea nevoie de trei utilități:

  1. Funmark.
  2. GPU-Z.
  3. MSI Afterburner.

În primul program, creșteți viteza de ceas a acceleratorului video GPU și a memoriei video. Memory Clock și Core Clock din interfața programului sunt responsabile pentru acești doi indicatori.

Important! Pentru acest model de placă video, nu trebuie să măriți acești indicatori cu mai mult de 15% la un moment dat. Măriți-le treptat.

După ce creșteți Core Clock de la 650 MHz la 800 MHz și Memory Clock la 1900 MHz, rulați utilitarul Funmark. Folosind acest program, efectuați un test de stres al acceleratorului video. Dacă utilitarul Funmark nu detectează nicio problemă, continuați Overclocking Nvidia GeForce 9600 GT.

La finalizarea procesului de creștere a nivelului de bază parametrii tehnici deschideți programul GPU-Z. Este conceput pentru a monitoriza performanța curentă a dispozitivului dvs.

Este posibilă mineritul pe 9600 GT? Cu o probabilitate de 95%, placa video nu va face față sarcinii de extragere a criptomonedei. Motivul principal pentru acest lucru este cantitatea mică de memorie video, care nu este suficientă pentru un proces de extragere confortabil.

Ce jocuri poate gestiona Nvidia Geforce 9600 GT?

Să testăm GeForce 9600 GT în jocuri și să vedem de ce este capabilă placa video.

Crysis 3. În sus setări graficeși o rezoluție de 1920x1080 pixeli, indicatorul FPS a fost destul de instabil. În unele locații și scene a scăzut de la 30 de cadre la 22. Astfel de scăderi se datorează cantității reduse de memorie video. Cât despre frize, nu am văzut niciuna în timpul jocului.

The Witcher 2. Lansarea de test a fost realizată în format FullHD (1920×1080 pixeli) și setări grafice ridicate. Numărul de cadre a fost de 37 FPS. Nu au fost observate frize în locații cu predominanță a vegetației sau în timpul scenelor de schimburi de focuri.

Assassin's Creed 2. Un alt proiect de joc de la studioul Ubisoft. Jocul a fost testat la setări grafice medii. Indicatorul FPS a fost la un nivel destul de acceptabil - 30-34 de cadre. Nu a scăzut sub acest nivel nici în orașele mari.

Dezonorat. Jocul a fost testat la setări grafice minime la o rezoluție de 1280x720. Indicatorul FPS a fost la nivelul de 22-25 de cadre pe secundă. De aici rezultă că puterea acestui accelerator video nu este suficientă pentru joc confortabil

în Dezonorat.

Marginea oglinzii.

La setări grafice ridicate și rezoluție FullHD, Mirror’s Edge a arătat stabil 38-40 de cadre pe secundă. Acest indicator nu a scăzut nici măcar în momentele de scene de acțiune serioase și o mare abundență de obiecte în locația jocului.

GTA 4. Cantitatea de memorie video nu este suficientă pentru un joc confortabil în GTA 4. În medie, indicatorul FPS a fost la nivelul de 24-26 de cadre. Unele setări grafice au fost setate la mediu, altele la scăzut. În unele locații, numărul de cadre a fost redus la 22. Motivul a fost aglomerația acestor locații. Unul dintre aspectele pozitive este absența frizelor în timpul jocului. Răul dinăuntru. Testarea a fost efectuată la setări medii la o rezoluție de 1280x720 pixeli. FPS-ul nu a crescut peste 20 de cadre. După reducerea calității graficii la setările minime, numărul de cadre a fost la un nivel acceptabil de 23 de cadre.

Pe baza testului plăcii video din jocuri, rezultă că 9600 GT nu este

cea mai buna varianta pentru lansare și joc confortabil în jocurile moderne lansate acum 2-4 ani. Comparație între diferiți producători

În producția acestui model de placă video sunt implicate cinci companii mari. Înainte de a alege un producător, vom faceanaliză comparativăfiecare model în format tabel.ProducătorMSIAsus
PalitZotacZotacZotacZotacZotac
GigabyteGPUGPUGPUGPUGPU
G94Proces tehnicProces tehnicProces tehnicProces tehnicProces tehnic
65 nm16 16 16 16 16
Numărul de tranzistori32 32 32 32 32
505 milioaneUnități de rasterizareUnități de rasterizareUnități de rasterizareUnități de rasterizareUnități de rasterizare
Numărul de blocuri de textură512 512 512 512 512
Frecvența SPU1625 MHz1625 MHz1625 MHz1625 MHz1625 MHz
Capacitatea memoriei video (MB)700 600 650 675 650
Tipul memoriei video100 100 100 100 100
GDDR3Frecvența GPU (MHz)Frecvența GPU (MHz)Frecvența GPU (MHz)Frecvența GPU (MHz)Frecvența GPU (MHz)
Limita de temperatură a procesorului (°C)1800 1800 1800 1800 1800
Latimea anvelopei57 57 57 57 57
256 de biți96 96 96 96 96
Frecvența memoriei (MHz)4100 3900 4200 4000 4150

Lățime de bandă (GB/s)

Este foarte important să actualizați driverele video pentru acceleratorul dvs. video. Acestea optimizează acceleratorul video, care îmbunătățește performanța în diverse aplicații.

Accesați site-ul web al producătorului pentru a descărca driverul pentru Nvidia Geforce 9600GT. Procesul de descărcare este disponibil pentru cele mai populare sisteme de operare, de la cel mai recent Windows 10 și popularul Windows 7 până la versiunea XP.

Când a fost pus în vânzare la începutul lui 2008, acceleratorul grafic GeForce 9600 de la NVidia aparținea unei soluții de clasă de mijloc și putea rezolva majoritatea problemelor. În același timp, utilizarea celui mai avansat proces tehnologic a redus semnificativ consumul de energie al acestuia. Ei bine, costul unor astfel de adaptoare a fost destul de accesibil și le-a permis să fie utilizate ca parte a acestora sisteme de calcul nivel mediu.

Accelerator Nișă

Acceleratoarele grafice NVidia la începutul anului 2008 au fost distribuite după cum urmează:

    Soluțiile entry-level au inclus 8600 GT. Caracteristici foarte modeste și viteze foarte mici de ceas au asigurat nivelul minim acceptabil de performanță. În același timp, costul unor astfel de plăci video a variat între 100 și 120 de dolari.

    Soluțiile de clasă de mijloc au inclus 8800GT, 8800GTS și GeForce 9600 cu prefixul GT. Aceste adaptoare aveau caracteristici și costuri destul de asemănătoare, dar utilizarea unei tehnologii de fabricație îmbunătățite și viteze crescute de ceas au permis soluției în cauză să fie probleme speciale rămâneți înaintea concurenților dvs.

    Acceleratorul emblematic a fost 8800 Ultra. Soluțiile din clasa de mijloc nu puteau concura cu el, dar costul lor a fost semnificativ mai mare.

Echipamente

În acest caz, NVidia a inclus următoarele în pachet:

    Adaptor grafic.

    Card de garantie.

    CD-ul pe care întregul software-ul necesarși documentație în formă electronică.

    Ghidul utilizatorului.

    Adaptor DVI LA HDMI.

    Un adaptor special pentru organizarea alimentării cu energie a acceleratorului printr-un conector suplimentar cu 6 pini.

Specificații chip

G94 este desemnarea codului cip grafic, care a stat la baza GeForce 9600. Caracteristicile sale indică faptul că includea 505 milioane de componente de tranzistor. Frecvența de ceas a acestui element semiconductor a fost de 650 MHz și a fost fabricat conform standardelor tehnologiei de proces de 65 nm. Predecesorii săi, seria 8ХХХ, la rândul lor, au fost produse conform standardelor de 80 nm și aveau caracteristici mai proaste în ceea ce privește eficiența energetică. Numărul de unități de procesare shader a fost de 64, iar frecvența lor în modul nominal a fost de 1625 MHz. Un total de 16 module de rasterizare au fost incluse în adaptor, iar numărul de TMU pentru fiecare conductă a fost de 32.

Memorie

Singurul tip de memorie cu care ar putea funcționa acceleratorul grafic în cauză era GDDR3. Frecvența efectivă nominală a microcircuitelor a fost de 1800 MHz. Volumul memoriei tampon video poate fi de 512 MB sau 1 GB. Lățimea magistralei pentru conectarea memoriei RAM la GPU a fost de 256 de biți. Toate cele enumerate anterior ne-au permis să obținem un debit de 57,6 Gb/sec.

Comunicatii

Adaptorul GeForce 9600 este instalat în slot Extensii PCI Express în versiunea 16X. În versiunea de bază, un astfel de adaptor trebuie să fie echipat cu două digitale porturi DVI. Dar și unii producători le-ar putea completa cu VGA analogic sau HDMI digital. Așadar, echipamentul în ceea ce privește porturile depinde de modelul specific, iar această nuanță trebuie luată în considerare înainte de cumpărare.

Consumul de energie. Temperatură

Utilizarea tehnologiei avansate pentru producerea bazei semiconductoare a procesorului a făcut posibilă reducerea semnificativă a nivelului de consum de energie. Placa video NVidia GeForce 9600 GT are un pachet termic de 95 W. Desigur, acest număr nu se încadrează în cei 75 W recomandati, suficient pentru a opera subsistemul video fără sursă de alimentare suplimentară, dar pentru soluțiile grafice din această clasă această sursă de alimentare este tipică. Temperatura maxima pentru acest produs, acesta este setat de producător la 105 0 C. În modul normal, această valoare nu depășește 60 0 C, dar în modul overclocking și la rezolvarea celor mai solicitante sarcini, poate crește până la 75 0 C.

Teste. Comparație cu analogii

Placa video GeForce 9600 este o soluție de nivel mediu și este cel mai rațional să o comparăm cu soluții similare. Întrucât concurenții direcți de la AMD au fost produși folosind un proces tehnic învechit la acea vreme, nu este recomandabil să-i comparăm cu 9600 GT pentru că, cu performanțe comparabile, consumul lor de energie va fi semnificativ mai mare. Din lista NVidia, acest adaptor poate fi comparat doar cu 8800 GTS și 8800 GT. Bancul de testare a fost bazat pe setul logic al sistemului P35, memoria RAM era standard DDR2 cu o frecvență de 800 MHz, iar volumul său era egal cu 2 GB (2 module de câte 1 GB fiecare, astfel încât controlerul RAM funcționa în modul dual-channel). , datorită acestui fapt o creștere a performanței de aproximativ 10-15%). În testul sintetic 3DMark06, adaptoarele au obținut următoarele scoruri condiționate în modul 1600X1200:

Cel mai probabil, la momentul acestui test, driverele nu fuseseră pe deplin optimizate, iar performanța plăcii video ulterioare a fost ușor subestimată din această cauză. Pe de altă parte, diferența nu este atât de mare între ele. Echilibrul de putere în jocul Gears Of War se schimbă dramatic. În acest caz, obținem următorul număr de fps la 1280X1024:

Diferența, desigur, de un cadru pe secundă nu este atât de mare, dar tot face ca acceleratorul mai nou să fie lider în acest test. Rezultatele anterioare indică faptul că în spatele lui 9600 GT se află un 8800 GT ușor modificat, care este fabricat folosind un nou proces de fabricație. Diferența dintre aceste plăci video este minimă. Mai mult, în unele cazuri, un reprezentant al unei generații anterioare ocolește modificarea actualizată.

Preţ

La începutul vânzărilor, NVidia GeForce 9600 putea fi achiziționată pentru 150-170 USD. Având în vedere poziționarea și specificațiile tehnice, această abordare a prețurilor a fost justificată. Acum un astfel de accelerator poate fi achiziționat la un preț care variază de la 1.500 (soluții folosite) la 3.000 (acceleratoare complet noi) de ruble. Achiziționarea unui astfel de adaptor pentru un computer nou este acum imposibilă. Noile acceleratoare video integrate au același nivel de performanță și nu este nevoie să le achiziționați suplimentar. Dar puteți cumpăra în continuare un astfel de accelerator pentru a repara un computer vechi.

Pe 21 februarie 208, compania canadiană a introdus oficial placa video 9600 GT. A fost conceput pentru a trimite modelul 8600 GTS la „odihna sa meritată” în segmentul mediu din categoria de preț până la 0. Noul nucleu G94 diferă de „fratele” său mai vechi G92 doar prin caracteristicile cantitative și scop functional iar principiul de funcționare al unităților executive a rămas fără niciuna schimbări semnificative. În ceea ce privește caracteristicile cantitative, 9600 GT are 64 de procesoare universale - acestea sunt de două ori mai multe decât „bătrânul” 8600 GTS și de două ori mai puțin decât GeForce 8800 GTS (G92) sau GeForce 8800 GTX. De data aceasta, să sperăm că nu va exista un decalaj atât de colosal în performanță în comparație cu soluțiile mai vechi, așa cum a fost între 8800 și 8600.

Deci, noul nucleu G94 este format din 505 milioane de tranzistori (pentru comparație: G86 a avut 210 milioane, G92 a avut 754 milioane, iar G80 a avut 681 milioane). Funcționează la o frecvență nominală de 650 MHz pentru NVIDIA GeForce 9600 GTS. GPU folosește o arhitectură shader unificată care sa dovedit excelentă în cipurile G80/84/92. Ideea unificării blocurilor funcționale GPU este următoarea: anterior erau împărțite în blocuri vertex și shader, iar acum blocurile universale sunt capabile să proceseze orice tip de instrucțiuni fără pierderi semnificative de performanță. Acest lucru vă va permite să modificați dinamic performanța nucleului prin redistribuirea resurselor pentru ceea ce este necesar în acest moment sarcini. Ca rezultat, obținem o încărcare completă a cipului și, ca urmare, performanța crește.

În cazul lui G94, vedem o reducere elementară - 4 unități shader, fiecare dintre ele conținând 16 procesoare de flux (Streaming Processor) și 8 unități de textură (TMU). Se obțin un total de 64 de procesoare de flux și 32 de unități de textură. Toate procesoarele G94, ca și în cipurile anterioare, funcționează la viteze de ceas mai mari față de GPU. În special, pentru 9600 GT este de 1650 MHz. În cele din urmă, să notăm blocurile de înregistrare cadru tampon (ROP), dintre care există 4 în acest caz (blocuri albastre lângă memoria cache L2 din diagramă). NVIDIA nu a făcut nicio modificare în funcționarea și conceptul de construire a procesoarelor de flux (SP) de la cipurile G84.

Pentru fiecare patru procesoare de flux există două module de adresare a texturii TA și două module de filtrare a texturii TF. Prin urmare, acum fiecare unitate de textură, datorită creșterii numărului de adrese de textură calculate, va putea procesa de două ori mai multe mostre decât, de exemplu, G80. Fiecare unitate de shader are propriul cache L1. Poate stoca nu numai texturi, ci și datorită unificării blocurilor în sine diverse feluri date. Toate procesoare de flux(SP) pe care se bazează arhitectura G94 sunt scalare. De ce nu vector? Motivul constă în faptul că, pe baza studiilor programelor shader ale dezvoltatorilor NVIDIA, s-a constatat că arhitectura vectorială utilizează resurse de calcul destul de neeconomic atunci când sunt procesate instrucțiuni complexe - de exemplu, scalare și vector în același timp (în general vorbind, calculele scalare pe procesoare vectoriale sunt efectuate foarte ineficient). În lumina celor emergente în ultima vreme tendința către o tranziție tot mai mare de la calculul vectorial la cel scalar, strategia dezvoltatorilor NVIDIA devine probabil clară. Ei bine, ce să faci cu vectorul codul programului? Totul este foarte simplu: este convertit în operații scalare direct de cipul G94 însuși. După cum am menționat deja, GeForce 9600 are 4 blocuri de înregistrare în buffer de cadre (ROP). Ele nu au suferit modificări în raport cu arhitectura G92 și acceptă următoarele metode de antialiasing: multisampling, supersampling și anti-aliasing adaptiv.

Caracteristicile NVIDIA GeForce 9600 GT

Nume GeForce 9600 GT
Miez G94 (D9P)
Tehnologia procesului (µm) 0.065
Tranzistoare (milioane) 505
Frecvența miezului 650
Frecvența de operare a memoriei (DDR) 900
Autobuz și tip de memorie GDDR3 pe 256 de biți
Lățime de bandă (Gb/s) 57.60
Unități de umbrire unificate 64
Frecvența unității de shader unificat 1625
TMU pe transportor 32
ROP 16
Modelul Shaders 4.0
Rata de umplere (Mpix/s) 10400
Rata de umplere (Mtex/s) 20800
DirectX 10.0
Capacitatea memoriei 512/1024
Interfață PCI-E 2.0
tehnologie (nm)90 80 65/55 tranzistoare (M)681 289 210 754 505 314 procesoare universale128 32 16 128 64 32 blocuri de textură32 16 8 64 32 16 amestecarea blocurilor24 8 16 8 magistrala de memorie384 (64x6)128 (64x2)256 (64x4)128 (64x2) tipuri de memorieDDR, GDDR2, GDDR3, GDDR4 magistrală de sistem cu cipPCI-Express 16xPCI-Express 2.0 16x RAMDAC2 x 400MHz interfețeIeșire TV
TV-In (necesită cip de captare)
2 x DVI Dual Link
Ieșire HDTVIeșire TV
TV-In (necesită cip de captare)
2 x DVI Dual Link
Ieșire HDTV
HDMIIeșire TV
TV-In (necesită cip de captare)
2 x DVI Dual Link
Ieșire HDTV
HDMI
DisplayPort umbritoare de vârfuri4.0 pixel shaders4.0 precizia calculului pixelilorFP32 precizia calculului vârfurilorFP32 formate de texturăFP32)
FP16
I8
DXTC, S3TC
3Dc formate de randareFP32
FP16
I8
10
alte MRTExistă AntialiasingTAA (poligon transparent AA)
CSAA 2x-16x
generația Z2x în modul fără culoare tampon de șablonbilateral tehnologia umbreihărți umbre hardware
optimizarea umbrelor geometrice

Specificațiile cardurilor de referință bazate pe familia G8X

hartăcip
obosi
Blocuri ALU/TMUfrecvența de bază (MHz)frecvența memoriei (MHz)capacitate de memorie (MB)PSP (GB)Rata Texel (Mtex)umple
rata (Mpix)
GeForce 8500 GTG86
PEG16x
16/8 450 400(800) 256 DDR212.8
(128)
3600
GeForce 8600 GTG84
PEG16x
32/16 540 700(1400) 256 GDDR322.4
(128)
8600 4300
GeForce 8600 GTSG84
PEG16x
32/16 675 1000(2000) 256 GDDR332.0
(128)
10800 5400
GeForce 8800 GTS 320MBG80
PEG16x
96/24 500 800(1600) 320GDDR364.0
(320)
12000 10000
GeForce 8800 GTS 640MBG80
PEG16x
96/24 500 800(1600) 640 GDDR364.0
(320)
12000 10000
GeForce 8800 GTXG80
PEG16x
128/32> 575 900(1800) 768 GDDR386.4
(384)
18400 13800
GeForce 8800 UltraG80
PEG16x
128/32 612 1080(2160) 768 GDDR3104.0
(384)
19600 14700
GeForce 8800 GT 256 MBG92
PEG16x
112/56 600 700(1400) 256 GDDR344.8
(256)
33600 9600
GeForce 8800 GT 512MBG92
PEG16x
112/56 600 900(1800) 512 GDDR357.6
(256)
33600 9600
GeForce 8800 GTS 512MBG92
PEG16x
128/64 650 1000(2000) 512 GDDR364.0
(256)
41600 10400
GeForce 8800GSG92
PEG16x
96/48 550 800(1600) 384 GDDR338.4
(192)
26400 6600
GeForce 9400 GTG96
PEG16x
16/8 550 800(1600) 256/512 GDDR225.6
(128)
4400 4400
GeForce 9500 GTG96
PEG16x
32/16 550 800(1600) 256/512 GDDR2/GDDR325.6
(128)
8800 4400
GeForce 9600 GSOG92
PEG16x
96/48 550 800(1600) 384 GDDR338.4
(192)
26400 6600
GeForce 9600 GTG94
PEG16x
64/32 650 900(1800) 512 GDDR357.6
(256)
20800 10400
GeForce 9800 GTG92
PEG16x
112/56 600 900(1800) 512 GDDR357.6
(256)
33600 9600
GeForce 9800 GTXG92
PEG16x
128/64 675 1100(2200) 512 GDDR370.4
(256)
43200 10800
GeForce 9800 GTX+G92
PEG16x
128/64 738 1100(2200) 512/1024 GDDR370.4
(256)
47200 11800
GeForce 9800 GX22xG92
PEG16x
2x(128/64)600 1000(2000) 2x512 GDDR32x64.0
(2x256)
76800 19200
GeForce GTS 250G92
PEG16x
128/64 738 1100(2200) 512/1024 GDDR370.4
(256)
47200 11800
hartăcip
obosi
Blocuri ALU/TMUfrecvența de bază (MHz)frecvența memoriei (MHz)capacitate de memorie (MB)PSP (GB)Rata Texel (Mtex)umple
rata (Mpix)

Detalii: G80, familia GeForce 8800

Specificații G80

  • Numele oficial al cipului GeForce 8800
  • Nume de cod G80
  • tehnologie 90 nm
  • 681 milioane de tranzistori
  • Arhitectură unificată cu o serie de procesoare partajate pentru procesarea fluxului de vârfuri și pixeli, precum și alte tipuri posibile de date
  • Suport hardware pentru cele mai recente inovații DirectX 10, inclusiv noul model de shader - Shader Model 4.0, generarea geometriei și înregistrarea datelor intermediare de la shader (ieșire flux)
  • Bus de memorie pe 384 de biți, 6 controlere independente pe 64 de biți, suport GDDR4
  • Frecvența de bază 575 GHz (GeForce 8800 GTX)
  • 128 ALU-uri scalare în virgulă mobilă (formate întregi și flotante, suport IEEE 754 FP de precizie pe 32 de biți, MAD+MUL fără pierdere de ceas)
  • ALU-urile funcționează la o frecvență mai mult decât dublă (1,35 GHz pentru 8800 GTX)
  • 32 de unități de textură, suport pentru componentele FP16 și FP32 în texturi
  • 64 de unități de filtrare biliniară (adică, este posibilă filtrarea triliniară gratuită, precum și filtrarea anizotropă care este de două ori mai rapidă ca viteză)
  • - dimensiunea blocului de planificare - 8x4 (32) pixeli.
  • 6 blocuri ROP largi (24 pixeli) cu suport pentru moduri de antialiasing de până la 16 mostre per pixel, inclusiv cu formatul cadru tampon FP16 sau FP32 (adică HDR+AA este posibil). Fiecare bloc constă dintr-o serie de ALU configurabile în mod flexibil și este responsabil pentru generarea și compararea Z, MSAA și blending. Performanța maximă a întregului subsistem este de până la 96 de mostre MSAA (+ 96 Z) pe ciclu de ceas, în modul fără culoare (numai Z) - 192 de mostre pe ciclu.
  • Toate interfețele sunt furnizate pe un cip NVIO extern suplimentar (2 RAMDAC, 2 Dual DVI, HDMI, HDTV)
  • Scalabilitate foarte bună a arhitecturii, puteți bloca sau elimina memoria și controlerele ROP pe rând (6 în total), unități shader (8 unități TMU+ALU în total)

Specificațiile plăcii de referință GeForce 8800 GTX

  • Frecvența de bază 575 MHz
  • Frecvența procesorului universal 1350 MHz
  • Număr de blocuri de textură - 32, blocuri de amestecare - 24
  • Capacitate de memorie 768 megabytes
  • Lățimea de bandă a memoriei 86,4 gigaocteți pe secundă.
  • Rata maximă de umplere teoretică este de 13,8 gigapixeli pe secundă.
  • Viteza teoretică de eșantionare a texturii este de 18,4 gigatexeli pe secundă.
  • conector SLI
  • Bus PCI-Express 16x
  • RRP 599 USD

Specificațiile cardului de referință GeForce 8800 GTS

  • Frecvența miezului 500 MHz
  • Frecvența procesorului universal 1200 MHz
  • Număr de procesoare universale 96
  • Număr de blocuri de textură - 24, blocuri de amestecare - 20
  • Tip de memorie GDDR3, 1,1 ns (frecvență standard 2*900 MHz)
  • Capacitate de memorie 640 megaocteți
  • Rata maximă de umplere teoretică este de 10,0 gigapixeli pe secundă.
  • Viteza teoretică de eșantionare a texturii este de 12,0 gigatexeli pe secundă.
  • Doi conectori DVI-I (Dual Link, acceptă rezoluții de ieșire de până la 2560x1600)
  • conector SLI
  • Bus PCI-Express 16x
  • Suport TV-out, HDTV-Out, HDCP
  • RRP 449 USD

Arhitectură

Așteptăm de mult timp trecerea la arhitecturi grafice unificate. Acum putem afirma un fapt - odată cu apariția GeForce 8800, această tranziție a avut loc, iar vârful critic a fost deja depășit. Aceasta va fi urmată de o coborâre treptată a arhitecturilor similare în segmentele medii și bugetare și de dezvoltarea lor ulterioară, până la fuziunea lor cu arhitecturi de procesoare multi-core pe termen lung. Deci, haideți să facem cunoștință cu prima arhitectură unificată de la NVIDIA:

Avem în față întreaga diagramă a cipului. Cipul este format din 8 unități de calcul universale (procesoare shader) și deși NVIDIA vorbește despre 128 de procesoare, afirmând că fiecare ALU este unul, acest lucru este oarecum incorect - unitatea de execuție a comenzii este o astfel de unitate de procesor, în care sunt 4 TMU și 16 ALU. grupate. În total, așadar, avem 128 de ALU și 32 de TMU, dar granularitatea de execuție este de 8 blocuri, fiecare dintre acestea la un moment dat își poate face treaba, de exemplu, executa o parte dintr-un vertex, sau pixel sau geometrie shader peste un bloc de 32 de pixeli (sau bloc al numărului corespunzător de vârfuri și alte primitive). Toate ramurile, tranzițiile, condițiile etc. sunt aplicate în întregime unui bloc și, prin urmare, este cel mai logic să-l numim procesor shader, deși unul foarte larg.

Fiecare astfel de procesor este echipat cu propriul cache de prim nivel, care acum stochează nu doar texturi, ci și alte date care pot fi solicitate de procesorul shader. Este important să înțelegeți că fluxul principal de date, cum ar fi pixeli sau vârfuri, care sunt procesate, se deplasează într-un cerc sub control eminenta grise(blocul marcat pe diagrama Thread Processor) - nu sunt stocate în cache, ci merg într-un flux, ceea ce este principala frumusețe a arhitecturilor grafice de astăzi - absența unui acces complet aleatoriu la nivelul primitivelor procesate.

Pe lângă unitatea de control și 8 procesoare compute shader, există 6 unități ROP care efectuează detectarea vizibilității, scrierea în frame-buffer și MSAA (albastru, lângă blocurile cache L2) grupate cu controlere de memorie, cozi de scriere și un al doilea cache de nivel.

Astfel, am primit o arhitectură foarte largă (8 blocuri care procesează porțiuni de câte 32 de pixeli fiecare) capabilă să se scaleze fără probleme în ambele direcții. Adăugarea sau eliminarea controlerelor de memorie și a procesoarelor shader va scala debitul întregului sistem în consecință, fără a dezechilibra sau a crea blocajele. Aceasta este o soluție logică și frumoasă care implementează principalul avantaj al arhitecturii unificate - echilibru automat și ridicat Eficiența utilizării resursele disponibile.

Pe lângă blocurile shader și ROP-uri, există un set de blocuri de control și administrative:

  • Blocurile care lansează date de anumite formate (Vertex, Geometry și Pixel Thread Issue) pentru execuție sunt un fel de gatekeeper care pregătesc date pentru zdrobitorul de numere în procesoarele shader în conformitate cu formatul de date, shader-ul curent și starea acestuia, condițiile de ramificare, etc.
  • Setup/Raster/ZCull - un bloc care transformă vârfurile în pixeli - aici se realizează instalarea, rasterizarea triunghiului în blocuri de 32 de pixeli, bloc preliminar HSR.
  • Input Assembler este un bloc care selectează date geometrice și alte date inițiale din memoria sistemului sau memoria locală, colectând structuri de date inițiale din fluxuri care vor merge din exterior la intrarea „caruselului” nostru. Și la sfârșit, după multe cercuri sub controlul setărilor de vârf, geometrie, pixel shader și blending, vom obține pixeli gata (și neteziți, dacă este necesar) din blocurile ROP.

Apropo, o mică digresiune: se vede clar că în viitor aceste blocuri vor dobândi mai multe caracter generalși nu va fi atât de legat de anumite tipuri de shadere. Aceste. se va transforma pur și simplu în blocuri universale care lansează date pentru calcularea și conversia formatelor - de exemplu, de la un shader la altul, de la vertex la pixel etc. Acest lucru nu va aduce modificări fundamentale arhitecturii; diagrama va arăta și va funcționa aproape la fel, cu excepția unui număr mai mic de blocuri „gri” speciale. Deja, toate cele trei blocuri Thread Issue sunt cel mai probabil (într-adevăr) un bloc cu funcționalități comune și adăugiri contextuale:

Procesorul Shader și TMU/ALU

Deci, în fiecare dintre cele 8 unități shader există 16 ALU scalare. Ceea ce, din nou, ne oferă potențiala oportunitate de a le crește eficiența încărcării până la 100%, indiferent de codul shader. ALU-urile funcționează la o frecvență dublă și astfel se potrivesc sau depășesc (în funcție de operațiunile shader) 8 ALU-uri vector cu patru căi de stil vechi (G70) la aceeași frecvență de bază de bază. NVIDIA oferă următorul calcul de performanță maximă:

Este valabil însă pentru varianta cea mai dezavantajoasă pentru alții, când au loc două înmulțiri. ÎN viata reala merită împărțit acest avantaj la o dată și jumătate sau cam așa ceva. Dar, în orice caz, aceste ALU scalare, datorită vitezei de ceas mai mari și numărului lor, vor depăși toate cipurile existente anterior. Cu posibila excepție a configurației SLI a lui G71, în cazul shader-urilor care nu sunt cele mai avantajoase pentru noua arhitectură.

Interesant este că precizia tuturor ALU-urilor este FP32 și, având în vedere noua arhitectură, nu prevedem niciun beneficiu pentru shadere-urile FP16 cu precizie redusă. Altul punct interesant- suport pentru calcule în format întreg. Acest articol este necesar pentru implementarea SM4. Implementarea aritmeticii respectă standardul IEEE 754, ceea ce o face potrivită pentru calcule serioase non-game - științifice, statistice, economice etc.

Acum despre interacțiunea unităților de textură și ALU într-o unitate de umbrire:

Operația de eșantionare și filtrare a texturilor nu necesită resurse ALU și acum poate fi realizată complet în paralel cu calculele matematice. Generarea coordonatelor texturii (în diagramă - O) încă ocupă o parte din timpul ALU. Acest lucru este logic dacă dorim să folosim 100% tranzistorii cipului, deoarece generarea coordonatelor texturii necesită operații standard flotante și ar fi imprudent să avem ALU separate pentru aceasta.

Modulele de textură în sine au următoarea configurație:

Există 4 module pentru adresarea texturilor TA (determinarea adresei exacte pentru eșantionare prin coordonate) și de două ori mai multe module pentru filtrarea TF biliniară. De ce este așa? Acest lucru permite, cu un consum moderat de tranzistor, să se ofere o filtrare triliniară gratuită, cinstită sau să se reducă la jumătate scăderea vitezei în timpul filtrării anizotrope. Viteza la rezoluții obișnuite, cu filtrare regulată și fără AA a fost de mult timp lipsită de sens - iar generația anterioară de acceleratoare se descurcă bine în astfel de condiții. Noul cip acceptă atât formatele de textură FP16/FP32, cât și corecția gamma SRGB la intrare (TMU) și la ieșire (ROP).

Iată specificațiile modelului shader al noilor procesoare care îndeplinesc cerințele SM4:

Există schimbări cantitative și calitative semnificative - din ce în ce mai puține restricții pentru shadere, tot mai multe în comun cu CPU-ul. Până acum, fără nici un acces aleatoriu special (o astfel de operație a apărut în SM4 - elementul Load Op din diagramă, dar eficiența sa în scopuri generale este încă îndoielnică, mai ales în primele implementări), dar nu există nicio îndoială că acest aspect va va fi dezvoltat în curând, deoarece suportul pentru formatele FP a fost dezvoltat de-a lungul acestor 5 ani - de la primele mostre din NV30 până la o conductă totală, de la capăt la cap la FP32, în toate modurile, acum în G80.

După cum ne amintim, pe lângă cele 8 unități shader, există 6 unități ROP:

Diagrama arată două căi separate pentru Z și C, dar în realitate este doar un set de ALU care se împarte în două grupuri atunci când procesează pixeli de culoare sau acționează ca un singur grup atunci când procesează în modul Z-Only, dublând astfel debitul. În zilele noastre, nu are rost să numărăm pixeli individuali - sunt deja destui, este mai important să se calculeze câte mostre MSAA pot fi procesate pe ciclu de ceas. În consecință, cu MSAA 16x, cipul poate produce 6 pixeli întregi pe ciclu de ceas, cu 8x - 12 etc. Interesant este că scalabilitatea lucrului cu frame-buffer este excelentă - după cum ne amintim, fiecare unitate ROP funcționează cu propriul controler de memorie și nu interferează cu cele vecine.

Și, în cele din urmă, există suport complet pentru formatele de buffer de cadre FP32 și FP16, împreună cu antialiasing, acum nu există restricții asupra imaginației dezvoltatorilor, iar HDR de-a lungul întregii conducte nu necesită modificarea secvenței generale a construcției cadrelor, chiar și în modul AA. .

CSAA

A apărut și metoda noua netezire - CSAA. Un studiu detaliat al acestuia va fi în curând pe site, dar deocamdată observăm că această metodă este în multe privințe similară cu abordarea ATI și se ocupă, de asemenea, de modele pseudo-stochastice și de răspândirea eșantioanelor în zonele geometrice adiacente (pixelul este mânjiți, pixelii nu au o limită ascuțită, dar par să se deplaseze unul la altul cu TZ AA, acoperind o anumită zonă). Mai mult, culorile mostrelor și adâncimea sunt stocate separat de informațiile despre locația lor și, astfel, pot exista 16 mostre pe pixel, dar, de exemplu, doar 8 valori de adâncime calculate - ceea ce economisește și mai mult lățimea de bandă și ciclurile de ceas.

Se știe că MSAA clasic în moduri mai mari de 4x devine foarte solicitant din punct de vedere al memoriei, în timp ce calitatea crește din ce în ce mai puțin. Noua metodă corectează acest lucru, permițând ca antialiasing de 16x să fie considerabil mai bun decât MSAA de 16x, cu un cost de calcul comparabil cu MSAA de 4x.

NVIO

O altă inovație în G80 este interfețele plasate în afara cipului principal de accelerație. Un cip separat numit NVIO este acum responsabil pentru ele:

Acest cip integrează:

  • 2 * 400 MHz RAMDAC
  • 2 * Dual Link DVI (sau LVDS)
  • Ieșire HDTV

Subsistemul de ieșire arată astfel:

Precizia este întotdeauna de 10 biți pe componentă. Desigur, în segmentul mijlociu și cu atât mai mult în decizii bugetare un cip extern separat poate să nu fie păstrat, dar pt carduri scumpe Există mai multe argumente pro decât dezavantaje ale acestei decizii. Interfețele ocupă o zonă semnificativă a cipului, depind foarte mult de interferențe și necesită o sursă de alimentare specială. Prin eliminarea tuturor acestor probleme cu un cip extern, puteți câștiga calitatea semnalului de ieșire și flexibilitatea configurației și, de asemenea, nu complicați proiectarea unui cip deja complex, ținând cont de modurile optime pentru RAMDAC-urile pe cip.

Detalii: familiile G84/G86, GeForce 8600 și 8500

Specificații G84

  • Numele oficial al cipului este GeForce 8600
  • Nume de cod G84
  • tehnologie 80 nm
  • 289 de milioane de tranzistori
  • Ceas de bază de până la 675 MHz (GeForce 8600 GTS)
  • ALU-urile funcționează la o frecvență mai mult decât dublă (1,45 GHz pentru GeForce 8600 GTS)
  • 16 unități de textură, suport pentru componentele FP16 și FP32 în texturi
  • 16 blocuri de filtrare biliniare (comparativ cu G80, nu există o filtrare triliniară gratuită și o filtrare anizotropă care să fie mai eficientă ca viteză)
  • Posibilitatea de ramuri dinamice în pixeli și vertex shaders
  • Înregistrați rezultatele de la până la 8 cadre tampon simultan (MRT)

Specificațiile cardului de referință GeForce 8600 GTS

  • Frecvența de bază 675 MHz
  • Frecvența procesorului universal 1450 MHz
  • Tip de memorie GDDR3
  • Capacitate de memorie 256 megabytes
  • Lățimea de bandă a memoriei 32,0 gigaocteți pe secundă.
  • Rata maximă de umplere teoretică este de 5,4 gigapixeli pe secundă.
  • Viteza teoretică de eșantionare a texturii este de 10,8 gigatexeli pe secundă.
  • Consum de energie de până la 71 W
  • conector SLI
  • Bus PCI-Express 16x
  • Suport TV-out, HDTV-Out, HDCP
  • Preț recomandat 199-229 USD

Specificațiile cardului de referință GeForce 8600 GT

  • Frecvența miezului 540 MHz
  • Frecvența procesorului universal 1180 MHz
  • Număr de procesoare universale 32
  • Număr de blocuri de textură 16 (vezi sintetice), blocuri de amestecare 8
  • Tip de memorie GDDR3
  • Capacitate de memorie 256 megabytes
  • Lățimea de bandă a memoriei 22,4 gigaocteți pe secundă.
  • Rata maximă de umplere teoretică este de 4,3 gigapixeli pe secundă.
  • Viteza teoretică de eșantionare a texturii este de 8,6 gigatexeli pe secundă.
  • Consum de energie de până la 43 W
  • conector SLI
  • Bus PCI-Express 16x
  • Preț recomandat 149-159 USD

Specificații G86

  • Numele oficial al cipului este GeForce 8500
  • Nume de cod G86
  • tehnologie 80 nm
  • 210 milioane de tranzistori
  • Arhitectură unificată cu o serie de procesoare partajate pentru procesarea în flux a nodurilor și pixelilor, precum și a altor tipuri de date
  • Suport hardware pentru DirectX 10, inclusiv noul model de shader Shader Model 4.0, generarea geometriei și înregistrarea datelor intermediare din shader (ieșire flux)
  • Bus de memorie pe 128 de biți, două controlere independente de 64 de biți
  • Ceas de bază de până la 450 MHz (GeForce 8500 GT)
  • ALU-urile funcționează la frecvență dublă (900 MHz pentru GeForce 8500 GT)
  • 16 ALU-uri scalare în virgulă mobilă (formate întregi și flotante, suport FP de precizie IEEE 754 pe 32 de biți, MAD+MUL fără pierdere de ceas)
  • 8 unități de textură, suport pentru componente FP16 și FP32 în texturi
  • 8 blocuri de filtrare biliniare (comparativ cu G80, nu există o filtrare triliniară gratuită și o filtrare anizotropă mai eficientă din punct de vedere al vitezei)
  • Posibilitatea de ramuri dinamice în pixeli și vertex shaders
  • 2 blocuri ROP largi (8 pixeli) cu suport pentru moduri de antialiasing de până la 16 eșantioane per pixel, inclusiv cu formatul cadru tampon FP16 sau FP32. Fiecare bloc constă dintr-o serie de ALU configurabile în mod flexibil și este responsabil pentru generarea și compararea Z, MSAA și blending. Performanță maximă a întregului subsistem până la 32 de mostre MSAA (+ 32 Z) per ceas, în modul numai Z 64 de mostre pe ceas
  • Înregistrați rezultatele de la până la 8 cadre tampon simultan (MRT)
  • Toate interfețele (două RAMDAC, două Dual DVI, HDMI, HDTV) sunt integrate pe cip (spre deosebire de cele plasate pe un cip NVIO suplimentar extern în GeForce 8800)

Specificațiile cardului de referință GeForce 8500 GT

  • Frecvența miezului 450 MHz
  • Frecvența procesorului universal 900 MHz
  • Frecvența efectivă a memoriei 800 MHz (2*400 MHz)
  • Tip de memorie DDR2
  • Capacitate memorie 256/512 megabytes
  • Lățimea de bandă a memoriei 12,8 gigaocteți pe secundă.
  • Rata maximă de umplere teoretică este de 3,6 gigapixeli pe secundă.
  • Viteza teoretică de eșantionare a texturii este de 3,6 gigatexeli pe secundă.
  • Consum de energie până la 40 W
  • Doi conectori DVI-I Dual Link, acceptă rezoluții de ieșire de până la 2560x1600)
  • conector SLI
  • Bus PCI-Express 16x
  • Ieșire TV, ieșire HDTV, suport opțional HDCP
  • Preț recomandat 89-129 USD

Arhitectura G84 si G86

Deja din specificații este clar că G84 este ceva între un sfert și o treime din flagship-ul liniei G80. În ceea ce privește numărul de procesoare universale, este un sfert, iar în ceea ce privește numărul de unități ROP și controlere de memorie, este o treime. Este mai dificil cu unitățile de textură, nu pare să fie un sfert, dar nici jumătate, despre asta vom vorbi mai jos. G86, la rândul său, este în general ceva interesant - în ceea ce privește puterea de calcul este doar 1/8 din G80, iar în ceea ce privește ROP este tot același 1/3. Evident, NVIDIA nu se grăbește să lanseze cipuri low-end care sunt rapide din punct de vedere computațional.

Întrebarea principală aici este dacă același trimestru și 1/8 vor fi suficiente pentru a concura cu soluțiile actuale și viitoare cipuri AMD? NVIDIA a redus prea mult numărul de blocuri? Mai mult, nu se poate spune că ambele cipuri sunt prea mici ca număr de tranzistori... G84 are aproape jumătate din tranzistoarele G80, iar G86 are aproape o treime. Se pare că soluția este un compromis dacă ar fi lăsat jumătate din blocurile G80, cipul ar fi fost prea scump de produs și ar fi fost un concurent de succes pentru propriul GeForce 8800 GTS.

În viitorul apropiat, cel mai probabil, pe baza tehnologiei 65 nm va fi posibil să se realizeze cipuri mai productive pentru intervalele de preț medii și mai mici, dar deocamdată asta s-a întâmplat. Ne vom uita la performanța noilor cipuri în materiale sintetice și teste de jocuri, dar putem spune deja că G84 și G86 s-ar putea să nu fie prea rapide din cauza numărului mic de ALU-uri, cel mai probabil vor fi aproximativ la egalitate cu soluțiile actuale de un preț similar.

Nu ne vom opri asupra arhitecturii G84 și G86 în detaliu, există puține modificări în comparație cu G80; Revizuire GeForce 8800, ajustat pentru caracteristicile cantitative. Dar totuși, vom descrie principalele puncte care merită atenția noastră și vom prezenta câteva diapozitive dedicate specificațiilor arhitecturale ale noilor cipuri.

G80 este format din opt unități de calcul universale (procesoare shader), NVIDIA preferă să vorbească despre 128 de procesoare. Unitatea de execuție a comenzilor, aparent, este o întreagă unitate de procesor în care sunt grupate 4 TMU-uri și 16 ALU-uri. Fiecare dintre blocuri la un moment dat poate executa o parte dintr-un vertex, pixel sau geometrie shader peste un bloc de 32 de pixeli, vârfuri sau alte primitive și poate efectua și calcule fizice. Fiecare procesor are propriul cache de nivel 1, care stochează texturi și alte date. Pe lângă unitatea de control și procesoarele computaționale shader, există șase unități ROP care efectuează detectarea vizibilității, scrierea în frame-buffer și MSAA, grupate cu controlere de memorie, cozi de scriere și un cache de nivel al doilea.

Această arhitectură este capabilă să se scaleze în ambele direcții, ceea ce s-a făcut în noile soluții. Am menționat deja această soluție frumoasă, care implementează principalul avantaj al arhitecturii unificate - echilibrul automat și eficiența ridicată a utilizării resurselor disponibile în articolul despre GeForce 8800. De asemenea, sa presupus că soluția de nivel mediu ar consta din jumătate din unitățile de calcul, iar soluția ar fi bazată pe două procesoare shader și un ROP va deveni bugetar. Din păcate, în timp ce GeForce 8800 avea opt procesoare, alcătuind 32 de TMU și 128 de ALU, noile cipuri și-au redus numărul mai mult decât ne așteptam inițial. Aparent, circuitul G84 arată astfel:

Adică totul a rămas neschimbat, cu excepția numărului de blocuri și controlere de memorie. Există câteva modificări minore ale blocurilor de textură care sunt vizibile în această imagine, dar despre asta vom vorbi mai târziu. Curios, unde s-au dus atât de mulți tranzistori dacă în G84 rămâneau doar 32 de procesoare? G84 are aproape jumătate din tranzistori în comparație cu G80, cu un număr semnificativ redus de canale de memorie, ROP-uri și procesoare shader. Iar G86 are o mulțime de tranzistori, cu doar 16 procesoare...

De asemenea, este interesant cât de bine va fi echilibrată încărcarea în aplicațiile reale între execuția vertex-urilor, pixelilor și geometry shader, deoarece numărul de unități de execuție universale a devenit acum semnificativ mai mic. Mai mult decât atât, arhitectura unificată în sine pune noi provocări pentru dezvoltatori, atunci când o folosesc, aceștia vor trebui să se gândească la modul în care să utilizeze eficient puterea comună dintre vertex, pixel și geometrie shaders. Să dăm un exemplu simplu, concentrându-ne pe calculele pixelilor. În acest caz, o creștere a încărcării blocurilor de vârf într-o arhitectură tradițională nu va duce la o scădere a performanței, dar într-o arhitectură unificată va provoca o modificare a echilibrului și o scădere a cantității de resurse pentru calculele pixelilor. Ne vom uita cu siguranță la problema performanței, iar acum vom continua să studiem schimbările în arhitectura G84 și G86.

Procesor Shader și TMU/ALU

Schema unităților shader și o evaluare a performanței lor de calcul de vârf a G80 a fost prezentată în articolul corespunzător pentru G84 și G86, schema nu s-a schimbat, iar performanța lor este ușor de recalculat. ALU-urile din cipuri funcționează, de asemenea, la o frecvență dublă și sunt scalare, ceea ce permite o eficiență ridicată. Nu există diferențe de funcționalitate, acuratețea tuturor ALU-urilor este FP32, există suport pentru calcule în format întreg, iar implementarea respectă standardul IEEE 754, care este important pentru calcule științifice, statistice, economice și de altă natură.

Dar modulele de textură s-au schimbat în comparație cu cele utilizate în G80 NVIDIA asigură că s-au făcut modificări arhitecturale în noile cipuri pentru a crește performanța procesoarelor unificate. În G80, fiecare motor de textură ar putea calcula patru adrese de textură și poate efectua opt operații de filtrare a texturii pe ciclu de ceas. Se pretinde că în noile cipuri primul număr a fost dublat și este capabil să dubleze numărul de mostre de textură. Adică, modulele de textură G84 și G86 au următoarea configurație (pentru comparație, diagrama bloc G80 este afișată în stânga):

Potrivit NVIDIA, acum fiecare dintre blocuri are opt module de adresare a texturii (determinând adresa exactă pentru eșantionare prin coordonate) TA și exact același număr de module de filtrare biliniară (TF). G80 a avut patru module TA și opt TF, ceea ce a făcut posibilă furnizarea de filtrare triliniară „gratuită” cu un consum redus de tranzistor sau reducerea la jumătate a vitezei în timpul filtrării anizotrope, ceea ce este util în special pentru acceleratoarele de nivel superior, unde filtrarea anizotropă este aproape întotdeauna utilizate de utilizatori. Vom verifica corectitudinea acestor informații în partea practică; asigurați-vă că vă uitați la analiza testelor sintetice corespunzătoare, deoarece acestea contrazic aceste date.

Toate celelalte funcționalități ale unităților de textură sunt aceleași, formatele de textură FP16/FP32 și altele sunt acceptate Numai dacă pe G80 FP16 filtrarea texturii a fost și la viteză maximă din cauza numărului dublat de unități de filtrare, acest lucru nu mai este cazul la mijloc. - și soluții de nivel scăzut (din nou, cu condiția ca modificările de mai sus să existe efectiv).

Blocuri ROP, scrieri framebuffer, anti-aliasing

Blocurile ROP, dintre care au fost șase în G80 și două în noile cipuri, nu s-au schimbat:

Fiecare bloc procesează patru pixeli (16 subpixeli), pentru un total de 8 pixeli pe ceas pentru culoare și Z. În modul numai Z, sunt procesate de două ori mai multe mostre pe ceas. La MSAA 16x, cipul poate produce doi pixeli pe ciclu de ceas, la 4x × 8 etc. La fel ca și G80, există suport complet pentru formatele de buffer de cadre FP32 și FP16, împreună cu antialiasing.

Noua metodă de anti-aliasing cunoscută de la GeForce 8800 este Coverage Sampled Antialiasing (CSAA), care a fost descrisă în detaliu în materialul corespunzător:

Pe scurt, esența metodei este că culorile și adâncimea eșantionului sunt stocate separat de informațiile despre locația lor, un pixel poate avea 16 mostre și doar 8 valori de adâncime calculate, ceea ce economisește lățimea de bandă și ciclurile de ceas. CSAA vă permite să scăpați de transmiterea și stocarea unei singure culori sau valorii Z per subpixel, rafinând valoarea medie a pixelului ecranului cu informații mai detaliate despre modul în care acel pixel se suprapune marginilor triunghiurilor. Drept urmare, noua metodă ne permite să obținem un mod anti-aliasing de 16x, care este vizibil de calitate mai mare decât MSAA 4x, cu costuri de calcul comparabile cu acesta. Și în cazuri rare în care metoda CSAA nu funcționează, rezultatul este un MSAA normal de un grad mai mic, mai degrabă decât absență completă antialiasing.

PureVideo HD

Să trecem la cele mai interesante schimbări. Se pare că G84 și G86 au inovații care le deosebesc chiar și de G80! Aceasta se referă la procesorul video încorporat, care în noile cipuri a extins suportul pentru PureVideo HD. Se afirmă că aceste cipuri ușurează complet procesorul central al sistemului atunci când decodează toate tipurile de date video comune, inclusiv cel mai „greu” format H.264.

Folosit în G84 și G86 model nou procesor video programabil PureVideo HD, mai puternic decât cel folosit la G80 și care include așa-numitul motor BSP. Procesor nou acceptă decodarea formatelor H.264, VC-1 și MPEG-2 cu rezoluții de până la 1920x1080 și rate de biți de până la 30-40 Mbps, face toată munca de decodare a datelor CABAC și CAVLC în hardware, ceea ce vă permite să redați toate HD existente -Discurile DVD și Blu-ray chiar și pe computerele cu un singur nucleu de putere medie.

Procesorul video din G84/G86 este format din mai multe părți: a doua generație de procesor video (VP2), care îndeplinește sarcinile de IDCT, compensarea mișcării și eliminarea artefactelor de blocare pentru formatele MPEG2, VC-1 și H.264, care acceptă decodarea hardware. a celui de-al doilea flux; procesor de flux (BSP), care efectuează sarcini de decodare statistică CABAC și CAVLC pentru formatul H.264, iar acestea sunt unele dintre cele mai consumatoare de timp calcule; Motor de decodare a datelor protejat AES128, al cărui scop este clar din numele său - decriptează datele video utilizate în protecția împotriva copierii pe Blu-ray și HD discuri DVD. Iată cum arată diferențele în gradul de suport hardware pentru decodarea video pe diferite cipuri video:

Sarcinile efectuate de cipul video sunt evidențiate cu albastru, iar sarcinile efectuate de procesorul central cu verde. După cum puteți vedea, dacă generația anterioară a ajutat procesorul doar cu unele sarcini, atunci noul procesor video folosit în ultimele cipuri face toate sarcinile în sine. Vom verifica eficacitatea soluțiilor în materiale viitoare privind cercetarea eficienței decodare hardware video, NVIDIA oferă următoarele cifre în materiale: atunci când utilizați un modern procesor dual coreși decodificarea datelor software, redarea discurilor Blu-ray și HD-DVD consumă până la 90-100% din timpul procesorului, cu decodarea hardware pe un cip video din generația anterioară pe același sistem - până la 60-70% și cu noul motor pe care l-au dezvoltat pentru G84 și G86 doar 20%. Aceasta, desigur, nu arată ca decodarea hardware completă revendicată, dar este totuși foarte, foarte eficientă.

La momentul anunțului, noile funcții introduse în PureVideo HD funcționează doar în versiunea pe 32 de biți Windows Vista, iar suportul pentru PureVideo HD în Windows XP va apărea numai în vară. În ceea ce privește calitatea redării video, post-procesare, deinterlacing etc., NVIDIA și-a îmbunătățit performanța chiar și în GeForce 8800, iar noile cipuri nu sunt diferite în acest sens.

CUDA, non-game and physics computing

Articolul despre GeForce 8800 a menționat că performanța de vârf crescută a aritmeticii flotante în noile acceleratoare și flexibilitatea arhitecturii unificate shader au devenit suficiente pentru calcularea fizicii în aplicațiile de jocuri și sarcini chiar mai serioase: modelare matematică și fizică, economice și statistice. modele și calcule, recunoaștere a imaginii, procesare a imaginilor, grafică științifică și multe altele. În acest scop, a fost lansat un API special orientat spre calcul, care este convenabil pentru adaptarea și dezvoltarea programelor care transferă calculele la GPU CUDA (Compute Unified Device Architecture).

Mai multe informații despre CUDA sunt scrise în articolul despre G80, ne vom concentra pe o altă tendință la modă recent - suportul pentru calcule fizice pe GPU; NVIDIA numește tehnologia sa similară Quantum Effects. Se declară că toate cipurile video de nouă generație, inclusiv G84 și G86 luate în considerare astăzi, sunt potrivite pentru calcule de acest fel, permițând transferarea unei părți din sarcină de la CPU la GPU. Exemplele specifice includ simulări de fum, foc, explozii, dinamica părului și îmbrăcămintei, blană și lichide și multe altele. Dar deocamdată vreau să scriu mai multe despre altceva. Faptul că până acum ni se arată doar poze din aplicații de testare cu un număr mare de obiecte fizice calculate prin cipuri video și nu există încă nici măcar un indiciu de jocuri cu astfel de suport.

Suport pentru interfețe externe

După cum ne amintim, în GeForce 8800 am fost oarecum surprinși de o altă inovație neașteptată - un cip suplimentar care acceptă interfețe externe. În cazul plăcilor video de top, aceste sarcini sunt gestionate de un cip separat numit NVIO, care integrează: două RAMDAC-uri de 400 MHz, două Dual Link DVI (sau LVDS), HDTV-Out. Chiar și atunci am presupus că un cip extern separat era puțin probabil să supraviețuiască în segmentele mijlocii și inferioare și asta este de fapt ceea ce s-a întâmplat. În G84 și G86, suportul pentru toate aceste interfețe este încorporat în cipul însuși.

GeForce 8600 GTS are două ieșiri Dual Link DVI-I cu suport HDCP, aceasta este prima placă video de pe piață cu capabilități similare (HDCP și Dual Link împreună). În ceea ce privește HDMI, suportul pentru acest conector este implementat integral în hardware și poate fi implementat de producători pe carduri special concepute. Dar suportul GeForce 8600 GT și 8500 GT pentru HDCP și HDMI este opțional, dar ele pot fi implementate de producători individuali în produsele lor.

Detalii: G92, familia GeForce 8800

Specificații G92

  • Nume cod cip G92
  • tehnologie 65 nm
  • 754 milioane de tranzistori (mai mult de G80)
  • Arhitectură unificată cu o serie de procesoare partajate pentru procesarea în flux a nodurilor și pixelilor, precum și a altor tipuri de date
  • Frecvența de bază 600 MHz (GeForce 8800 GT)
  • ALU funcționează la o frecvență mai mare decât dublă (1,5 GHz pentru GeForce 8800 GT)
  • 112 (aceasta este pentru GeForce 8800 GT, dar probabil 128 în total) ALU-uri scalare în virgulă mobilă (formate întregi și flotante, suport pentru precizie FP pe 32 de biți în standardul IEEE 754, MAD+MUL fără pierderi de ceas)
  • 56 (64) unități de adresare a texturii cu suport pentru componente FP16 și FP32 în texturi (vezi explicația de mai jos)
  • 56 (64) unități de filtrare biliniare (cum ar fi G84 și G86, fără filtrare triliniară gratuită și filtrare anizotropă mai eficientă)
  • Posibilitatea de ramuri dinamice în pixeli și vertex shaders
  • Înregistrați rezultatele de la până la 8 cadre tampon simultan (MRT)
  • Toate interfețele (două RAMDAC, două Dual DVI, HDMI, HDTV) sunt integrate pe cip (spre deosebire de cele plasate pe un cip NVIO suplimentar extern în GeForce 8800)

Specificațiile plăcii de referință GeForce 8800 GT 512MB

  • Frecvența miezului 600 MHz
  • Frecvența efectivă a memoriei 1,8 GHz (2*900 MHz)
  • Tip de memorie GDDR3
  • Capacitate de memorie 512 megabytes
  • Consum de energie de până la 110 W
  • Doi conectori DVI-I Dual Link, acceptă rezoluții de ieșire de până la 2560x1600
  • conector SLI
  • Bus PCI Express 2.0
  • Suport TV-out, HDTV-Out, HDCP
  • RRP 249 USD

Specificațiile cardului de referință GeForce 8800 GT 256MB

  • Frecvența miezului 600 MHz
  • Frecvența procesorului universal 1500 MHz
  • Număr de procesoare universale 112
  • Numărul de blocuri de textură 56, blocuri de amestecare 16
  • Frecvența efectivă a memoriei 1,4 GHz (2*700 MHz)
  • Tip de memorie GDDR3
  • Capacitate de memorie 256 megabytes
  • Lățimea de bandă a memoriei este de 44,8 gigaocteți pe secundă.
  • Rata de umplere maximă teoretică este de 9,6 gigapixeli pe secundă.
  • Viteza teoretică de eșantionare a texturii de până la 33,6 gigatexeli pe secundă.
  • Consum de energie de până la 110 W
  • Doi conectori DVI-I Dual Link, acceptă rezoluții de ieșire de până la 2560x1600
  • conector SLI
  • Bus PCI Express 2.0
  • Suport TV-out, HDTV-Out, HDCP
  • RRP 199 USD

Specificațiile cardului de referință GeForce 8800 GTS 512MB

  • Frecvența miezului 650 MHz
  • Număr de procesoare universale 128
  • Frecvența efectivă a memoriei 2,0 GHz (2*1000 MHz)
  • Tip de memorie GDDR3
  • Capacitate de memorie 512 megabytes
  • Lățimea de bandă a memoriei 64,0 gigaocteți pe secundă.
  • Viteza teoretică de eșantionare a texturii de până la 41,6 gigatexeli pe secundă.
  • Doi conectori DVI-I Dual Link, acceptă rezoluții de ieșire de până la 2560x1600
  • conector SLI
  • Bus PCI Express 2.0
  • Suport TV-out, HDTV-Out, HDCP
  • Preț recomandat 349-399 USD

Arhitectura chip G92

Din punct de vedere arhitectural, G92 nu este foarte diferit de G80. Din câte știm, putem spune că G92 este flagship-ul liniei (G80), transferat la un nou proces tehnologic, cu mici modificări. NVIDIA indică în materialele sale că cipul are 7 unități de shader mari și, în consecință, 56 de unități de textură, precum și patru ROP-uri largi, numărul de tranzistori din cip ridică suspiciuni că nu spun ceva. Soluțiile anunțate inițial nu implică toate blocurile care există fizic în cip numărul lor în G92 este mai mare decât cel activ în GeForce 8800 GT. Deși complexitatea crescută a cipului se explică prin includerea unui cip NVIO anterior separat, precum și a unui procesor video de nouă generație. În plus, numărul de tranzistori a fost influențat și de unitățile TMU mai complexe. De asemenea, este probabil ca cache-urile să fi fost mărite pentru a crește eficiența utilizării magistralei de memorie pe 256 de biți.

De data aceasta, pentru a concura cu cipurile AMD corespunzătoare, NVIDIA a decis să plece destul de mult număr mare blocuri. Presupunerea noastră din revizuirea G84 și G86 a fost confirmată că cipuri mult mai puternice pentru gama de prețuri medii vor fi lansate pe baza tehnologiei de 65 nm. Există puține modificări arhitecturale în cipul G92 și nu ne vom opri asupra acestui lucru în detaliu. Tot ce s-a spus mai sus despre solutii de la Seria GeForce 8 rămâne în vigoare, vom repeta doar câteva dintre principalele puncte ale specificațiilor arhitecturale ale noului cip.

Pentru noua soluție, NVIDIA oferă următoarea diagramă în documentele sale:

Adică, dintre toate modificările, doar un număr redus de blocuri și unele modificări în TMU, care sunt descrise mai jos. După cum sa indicat mai sus, există îndoieli că acesta este cazul fizic, dar oferim o descriere bazată pe ceea ce scrie NVIDIA. G92 este format din șapte unități de calcul universale (procesoare shader), NVIDIA vorbește în mod tradițional despre 112 procesoare (fiecare cel puţin, în primele soluții GeForce 8800 GT). Fiecare dintre blocuri, în care sunt grupate 8 TMU-uri și 16 ALU-uri, poate executa o parte dintr-un vertex, pixel sau geometry shader peste un bloc de 32 de pixeli, vârfuri sau alte primitive și poate efectua și alte calcule (negrafice). Fiecare procesor are propriul cache de nivel 1, care stochează texturi și alte date. Pe lângă unitatea de control și procesoarele de shader de calcul, există patru unități ROP care efectuează detectarea vizibilității, scrierea în buffer-ul de cadre și MSAA, grupate cu controlere de memorie, cozi de scriere și un cache de nivel al doilea.

Procesoare de uz general și TMU

Diagrama unităților de shader și o evaluare a performanței lor de calcul de vârf a G80 a fost prezentată în articolul corespunzător pentru G92, nu s-a schimbat, performanța lor este ușor de recalculat pe baza modificărilor; frecvența ceasului. ALU-urile din cipuri funcționează la o frecvență mai mare decât dublă, sunt scalare, ceea ce permite o eficiență ridicată. Încă nu se știe despre diferențele funcționale, dacă acuratețea calculelor FP64 este disponibilă în acest cip sau nu. Cu siguranță există suport pentru calcule în format întreg, iar implementarea tuturor calculelor respectă standardul IEEE 754, care este important pentru calcule științifice, statistice, economice și de altă natură.

Unitățile de textura din G92 nu sunt aceleași cu cele din G80, ele urmează soluția TMU din G84 și G86, cărora li s-au făcut modificări arhitecturale pentru a crește performanța. Să ne reamintim că în G80 fiecare unitate de textură ar putea calcula patru adrese de textură și poate efectua opt operații de filtrare a texturii pe ceas, iar în G84/G86 TMU-urile sunt capabile de două ori mai multe mostre de textură. Adică, fiecare dintre blocuri are opt module de adresare a texturii (determinând adresa exactă pentru eșantionare prin coordonate) TA și exact același număr de module de filtrare biliniară (TF):

Să nu credeți că cele 56 de blocuri ale GeForce 8800 GT în aplicații reale vor fi mai puternice decât cele 32 de blocuri ale GeForce 8800 GTX. Cu filtrarea triliniară și/sau anizotropă activată, aceasta din urmă va fi mai rapidă, deoarece pot lucra puțin la filtrarea probelor de textură. Vom verifica aceste informații în partea practică analizând rezultatele testelor sintetice corespunzătoare. Toate celelalte funcționalități ale blocurilor de textură nu s-au schimbat formatele de textură FP16, FP32 și altele.

Blocuri ROP, scrieri framebuffer, anti-aliasing

Nici blocurile POR în sine nu s-au schimbat, dar numărul lor s-a schimbat. G80 a avut șase ROP-uri, iar în noua soluție există patru dintre ele, pentru a reduce costul producției de cipuri și PCB-uri pentru plăcile video. Această reducere poate fi, de asemenea, pentru a evita crearea unei concurențe prea mari cu soluțiile existente de top.

Fiecare bloc procesează patru pixeli sau 16 sub-pixeli, pentru un total de 16 pixeli pe ceas pentru culoare și Z. Modul numai Z procesează de două ori mai multe mostre pe ceas. La MSAA 16x, cipul poate produce doi pixeli pe ciclu de ceas, la 4x × 8 etc. La fel ca G80, formatele cadru tampon FP32 și FP16 sunt pe deplin acceptate împreună cu antialiasing.

Noua metodă de anti-aliasing, Coverage Sampled Antialiasing (CSAA), cunoscută din cipurile anterioare din serie, este acceptată. O altă inovație este că GeForce 8800 GT a actualizat algoritmul de antialiasing al transparenței. Utilizatorului i s-au oferit două opțiuni: multisampling (TRMS) și supersampling (TRSS), prima a avut performanțe foarte bune, dar nu a funcționat eficient în toate jocurile, iar a doua a fost de înaltă calitate, dar lentă. GeForce 8800 GT introduce o nouă metodă de eșantionare multiplă a suprafețelor translucide, care îi îmbunătățește calitatea și performanța. Acest algoritm oferă aproape aceeași îmbunătățire a calității ca și supraeșantionarea, dar are performanțe ridicate - doar cu câteva procente mai proaste pentru modul fără anti-aliasing al suprafețelor translucide activat.

PureVideo HD

Una dintre schimbările așteptate la G92 a fost procesorul video încorporat de a doua generație, cunoscut de la G84 și G86, care a primit suport extins pentru PureVideo HD. Se știe deja că această versiune a procesorului video ușurează aproape complet CPU atunci când decodifică toate tipurile de date video, inclusiv formatele „grele” H.264 și VC-1.

La fel ca G84/G86, G92 folosește un nou model de procesor video programabil PureVideo HD, care include așa-numitul motor BSP. Noul procesor acceptă decodarea formatelor H.264, VC-1 și MPEG-2 cu rezoluții de până la 1920x1080 și rate de biți de până la 30-40 Mbps, realizând munca de decodare a datelor CABAC și CAVLC în hardware, ceea ce vă permite să redați toate cele existente. Discuri HD-DVD și Blu-ray chiar și pe computere cu un singur nucleu de putere medie. Decodarea VC-1 nu este la fel de eficientă ca H.264, dar este suportată în continuare de noul procesor.

Puteți citi mai multe despre procesorul video de a doua generație în partea dedicată cipurilor G84 și G86. Performanța soluțiilor video moderne a fost parțial testată în cel mai recent material privind studiul eficienței decodării video hardware.

PCI Express 2.0

Printre inovațiile reale ale modelului G92 se numără suportul pentru magistrala PCI Express 2.0. Versiunea 2 a PCI Express dublează debitul standard de la 2,5 Gbps la 5 Gbps, permițând conectorului x16 să transfere date cu până la 8 GB/s în fiecare direcție, de la 4 GB/s pentru versiunea 1.x. Este foarte important ca PCI Express 2.0 să fie compatibil cu PCI Express 1.1, iar plăcile video vechi vor funcționa pe plăcile de bază noi, iar plăcile video noi cu suport pentru a doua versiune vor rămâne funcționale în plăcile fără suportul acesteia. Cu condiția să existe suficientă putere externă și fără creșterea lățimii de bandă a interfeței, desigur.

Pentru a asigura compatibilitatea cu soluțiile existente PCI Express 1.0 și 1.1, specificația 2.0 acceptă rate de transfer de 2,5 Gbps și 5 Gbps. Compatibilitatea cu versiunea inversă PCI Express 2.0 permite ca soluțiile vechi de 2,5 Gb/s să fie utilizate în sloturi de 5,0 Gb/s care vor funcționa la viteze mai mici, iar un dispozitiv proiectat conform specificațiilor versiunii 2.0 poate suporta atât viteze de 2,5 Gb/s, cât și 5 Gb/s. În teorie, compatibilitatea este bună, dar în practică pot apărea probleme cu unele combinații de plăci de bază și plăci de expansiune.

Suport pentru interfețe externe

După cum era de așteptat, cipul NVIO suplimentar disponibil pe plăcile GeForce 8800, care acceptă interfețe externe situate în afara celei principale (două RAMDAC de 400 MHz, două DVI Dual Link (sau LVDS), HDTV-Out), în acest caz a fost inclus în cipul în sine, suportul pentru toate aceste interfețe este încorporat în G92 însuși.

Plăcile video GeForce 8800 GT au de obicei două ieșiri Dual Link DVI-I cu suport HDCP. În ceea ce privește HDMI, suportul pentru acest conector este implementat pe deplin, acesta poate fi implementat de producători pe carduri special concepute, care pot fi lansate puțin mai târziu. Deși prezența unui conector HDMI pe o placă video este complet opțională, acesta poate fi înlocuit cu succes de un adaptor de la DVI la HDMI, care este inclus cu majoritatea plăcilor video moderne.

Spre deosebire de plăcile video din seria RADEON HD 2000 de la AMD, GeForce 8800 GT nu conține un cip audio încorporat necesar pentru a suporta transmisia audio DVI folosind un adaptor HDMI. Această capacitate de a transmite semnale video și audio printr-un singur conector este solicitată în primul rând pe cardurile de gamă medie și inferioară care sunt instalate în carcase medii mici, iar GeForce 8800 GT este cu greu potrivită pentru acest rol.

Detalii: G94, familia GeForce 9600

Specificații G94

  • Nume de cod al cipului G94
  • tehnologie 65 nm
  • 505 milioane de tranzistori
  • Arhitectură unificată cu o serie de procesoare partajate pentru procesarea în flux a nodurilor și pixelilor, precum și a altor tipuri de date
  • Suport hardware pentru DirectX 10, inclusiv modelul shader Shader Model 4.0, generarea geometriei și înregistrarea datelor intermediare din shader (ieșire flux)
  • Bus de memorie pe 256 de biți, patru controlere independente de 64 de biți
  • Frecvența de bază 650 MHz (GeForce 9600 GT)
  • ALU-urile funcționează la o frecvență mai mult decât dublă (1,625 GHz pentru GeForce 9600 GT)
  • 64 ALU-uri scalare în virgulă mobilă (formate întregi și flotante, suport FP de precizie IEEE 754 pe 32 de biți, MAD+MUL fără pierderi de ceas)
  • 32 de unități de adresare a texturii cu suport pentru componentele FP16 și FP32 în texturi
  • 32 de unități de filtrare biliniare (ca și în G84 și G92, aceasta oferă un număr crescut de probe biliniare, dar fără filtrare triliniară gratuită și filtrare anizotropă eficientă)
  • Posibilitatea de ramuri dinamice în pixeli și vertex shaders
  • 4 blocuri ROP largi (16 pixeli) cu suport pentru moduri de antialiasing de până la 16 mostre per pixel, inclusiv cu formatul cadru tampon FP16 sau FP32. Fiecare bloc constă dintr-o serie de ALU configurabile în mod flexibil și este responsabil pentru generarea și compararea Z, MSAA și blending. Performanță maximă a întregului subsistem de până la 64 de mostre MSAA (+ 64 Z) per ceas, în modul numai Z 128 de mostre pe ceas
  • Înregistrați rezultatele de la până la 8 cadre tampon simultan (MRT)

Specificațiile cardului de referință GeForce 9600 GT

  • Frecvența miezului 650 MHz
  • Frecvența procesorului universal 1625 MHz
  • Număr de procesoare universale 64
  • Număr de blocuri de textură 32, blocuri de amestecare 16
  • Frecvența efectivă a memoriei 1,8 GHz (2*900 MHz)
  • Tip de memorie GDDR3
  • Capacitate de memorie 512 megabytes
  • Lățimea de bandă a memoriei 57,6 gigaocteți pe secundă.
  • Rata maximă de umplere teoretică este de 10,4 gigapixeli pe secundă.
  • Viteza teoretică de eșantionare a texturii de până la 20,8 gigatexeli pe secundă.
  • Doi conectori DVI-I Dual Link, acceptă rezoluții de ieșire de până la 2560x1600
  • conector SLI
  • Bus PCI Express 2.0
  • Consum de energie de până la 95 W
  • Preț recomandat 169-189 USD

Arhitectura G94

Din punct de vedere arhitectural, G94 se deosebește de G92 doar prin caracteristici cantitative are un număr mai mic de unități de execuție: ALU și TMU. Și nu există multe diferențe față de G8x. După cum a fost scris în materialele anterioare, linia de cipuri G9x este o linie G8x ușor modificată, transferată la o nouă tehnologie de proces cu modificări arhitecturale minore. Noul cip mid-end are 4 unități mari de shader (64 ALU-uri în total) și 32 de unități de textură, precum și patru ROP-uri largi.

Deci, există puține modificări arhitecturale în cip, aproape toate sunt descrise mai sus și tot ceea ce a spus anterior pentru soluțiile anterioare rămâne valabil. Și aici vă prezentăm doar diagrama principală a cipului G94:

Unitățile de textură din G94 sunt exact aceleași ca în G84/G86 și G92, ele pot selecta de două ori mai multe eșantioane filtrate biliniar din texturi comparativ cu G80. Dar 32 de unități de textură ale GeForce 9600 GT în aplicațiile reale nu vor funcționa mai repede decât 32 de unități ale GeForce 8800 GTX doar din cauza dimensiunii mai mari. frecventa de functionare GPU Acest lucru poate fi observat numai atunci când filtrarea triliniară și anizotropă sunt dezactivate, ceea ce este extrem de rar, doar în acei algoritmi care folosesc eșantioane nefiltrate, de exemplu, în maparea paralaxă.

Un alt avantaj al G9x și al GeForce 9600 GT în special, NVIDIA consideră un anumit tehnologie nouă compresie implementată în blocurile ROP, care, conform estimărilor lor, funcționează cu 15% mai eficient decât cea folosită în cipurile anterioare. Aparent, acestea sunt exact aceleași modificări arhitecturale la G9x, concepute pentru a asigura o eficiență mai mare a magistralei de memorie pe 256 de biți în comparație cu cea pe 320/384 de biți despre care am scris mai devreme. Desigur, în aplicațiile reale nu va exista o diferență atât de mare, chiar și conform NVIDIA în sine, creșterea de la inovații în ROP este cel mai adesea de doar aproximativ 5%.

În ciuda tuturor modificărilor din arhitectura G9x care adaugă complexitate cipului, despre care vom vorbi mai jos, numărul de tranzistori de pe cip este destul de mare. Probabil, această complexitate a GPU-ului se explică prin includerea unui cip NVIO anterior separat, a unui procesor video de nouă generație, a complicațiilor blocurilor TMU și ROP, precum și a altor modificări ascunse: modificări ale dimensiunilor cache-ului etc.

PureVideo HD

G94 are același procesor video de a doua generație cunoscut de la G84/G86 și G92, care oferă suport îmbunătățit pentru PureVideo HD. Descarcă aproape complet CPU atunci când decodează cele mai comune tipuri de date video, inclusiv H.264, VC-1 și MPEG-2, cu rezoluții de până la 1920x1080 și rate de biți de până la 30-40 Mbps, făcând munca de decodare în întregime în hardware. Și deși decodificarea VC-1 soluții NVIDIA nu la fel de eficient ca H.264, o mică parte a procesului utilizează energie procesor central, dar acest lucru vă permite totuși să redați toate HD DVD-urile și discurile Blu-Ray existente chiar și pe computere cu putere medie. Puteți citi mai multe despre procesorul video de a doua generație în recenziile noastre despre G84/G86 și G92, link-uri către care sunt oferite la începutul articolului.

Ei bine, vom observa îmbunătățirile software aduse PureVideo HD, care au fost programate să coincidă cu lansarea GeForce 9600 GT. Cele mai recente inovații în PureVideo HD includ decodarea dual-stream, modificări dinamice ale contrastului și saturația culorilor. Aceste modificări nu sunt exclusive pentru GeForce 9600 GT, iar în noile versiuni de drivere, începând cu ForceWare 174, sunt introduse pentru toate cipurile care acceptă complet accelerare hardware folosind PureVideo HD. Pe lângă placa video pe care o luăm în considerare astăzi, această listă include: GeForce 8600 GT/GTS, GeForce 8800 GT și GeForce 8800 GTS 512.

Îmbunătățirea dinamică a contrastului este destul de comună în electronicele de larg consum, televizoarele și playerele video și poate îmbunătăți imaginile cu o expunere suboptimă (combinație de viteză a obturatorului și diafragmă). Pentru a face acest lucru, după decodificarea fiecărui cadru, histograma acestuia este analizată, iar dacă cadrul are un contrast slab, histograma este recalculată și aplicată imaginii. Iată un exemplu (în stânga este imaginea inițială, în dreapta este cea procesată):

Același lucru este valabil și pentru ceea ce a apărut în PureVideo HD îmbunătățire dinamică saturația culorii. Aparatele electrocasnice au folosit, de asemenea, unii algoritmi de îmbunătățire a imaginii de foarte mult timp, spre deosebire de monitoare de calculator, care reproduc totul așa cum este, ceea ce în multe cazuri poate face ca imaginea să fie prea plictisitoare și lipsită de viață. Echilibrul automat al componentelor de culoare din datele video, calculat și pentru fiecare cadru nou, îmbunătățește percepția umană asupra imaginii prin ajustarea ușoară a saturației culorilor acesteia:

Decodificarea dual-stream vă permite să accelerați decodarea și post-procesarea a două fluxuri video diferite simultan. Acest lucru poate fi util în moduri de ieșire, cum ar fi imagine în imagine, care sunt utilizate în unele discuri Blu-Ray și HD DVD (de exemplu, a doua imagine poate arăta regizorul filmului comentându-și scenele prezentate în fereastra principală ), edițiile filmelor RĂZBOI și Resident Evil: Extinction sunt echipate cu astfel de capabilități.

O altă inovație utilă ultima versiune PureVideo HD face posibilă operarea simultană a carcasei Aero în sala de operație sistem Windows Vista în timp ce redați videoclipuri accelerate hardware modul ferestre, ceea ce nu era posibil anterior. Nu pot spune că acest lucru îi îngrijorează foarte mult pe utilizatori, dar este o oportunitate bună.

Suport pentru interfețe externe

Suportul pentru interfețele externe pe GeForce 9600 GT este similar cu GeForce 8800 GT, cu excepția, probabil, a suportului DisplayPort integrat. Cipul NVIO suplimentar disponibil pe plăcile GeForce 8800, care acceptă interfețe externe în afara celei principale din G94, a fost inclus și în cip în sine.

Placile video GeForce 9600 GT de referinta au doua iesiri DVI Dual Link cu suport HDCP. Suportul HDMI și DisplayPort este implementat în hardware pe cip, iar aceste porturi pot fi implementate de partenerii NVIDIA pe carduri special concepute. În plus, așa cum asigură NVIDIA, spre deosebire de G92, suportul DisplayPort este acum încorporat în cip și nu sunt necesare transmițătoare externe. În general, conectorii HDMI și DisplayPort de pe o placă video sunt opționali, pot fi înlocuiți cu adaptoare simple de la DVI la HDMI sau DisplayPort, care sunt uneori incluse cu plăcile video moderne;

Detalii: familiile G96, GeForce 9400 și 9500

Specificații G96

  • Nume de cod al cipului G96
  • tehnologie 65 nm
  • 314 milioane de tranzistori
  • Arhitectură unificată cu o serie de procesoare partajate pentru procesarea în flux a nodurilor și pixelilor, precum și a altor tipuri de date
  • Suport hardware pentru DirectX 10, inclusiv modelul shader Shader Model 4.0, generarea geometriei și înregistrarea datelor intermediare din shader (ieșire flux)
  • Bus de memorie pe 128 de biți, două controlere independente de 64 de biți
  • Frecvența miezului 550 MHz
  • ALU-urile funcționează la o frecvență mai mare decât dublă (1,4 GHz)
  • 32 ALU-uri scalare în virgulă mobilă (formate întregi și flotante, suport IEEE 754 FP de precizie pe 32 de biți, MAD+MUL fără pierderi de ceas)
  • 16 unități de adresare a texturii cu suport pentru componente FP16 și FP32 în texturi
  • 16 unități de filtrare biliniare (ca și în cazul G92, aceasta oferă un număr crescut de probe biliniare, dar fără filtrarea triliniară gratuită și filtrarea anizotropă eficientă)
  • Posibilitatea de ramuri dinamice în pixeli și vertex shaders
  • 2 blocuri ROP largi (8 pixeli) cu suport pentru moduri de antialiasing de până la 16 eșantioane per pixel, inclusiv cu formatul cadru tampon FP16 sau FP32. Fiecare bloc constă dintr-o serie de ALU configurabile în mod flexibil și este responsabil pentru generarea și compararea Z, MSAA și blending. Performanță maximă a întregului subsistem până la 32 de mostre MSAA (+ 32 Z) per ceas, în modul numai Z 64 de mostre pe ceas
  • Înregistrați rezultatele de la până la 8 cadre tampon simultan (MRT)
  • Toate interfețele (două RAMDAC, două Dual DVI, HDMI, DisplayPort) sunt integrate pe cip

Specificațiile cardului de referință GeForce 9500 GT

  • Frecvența miezului 550 MHz
  • Număr de procesoare universale 32
  • Număr de blocuri de textură 16, blocuri de amestecare 8
  • Frecvența efectivă a memoriei 1,6 GHz (2*800 MHz)
  • Tip de memorie GDDR2/GDDR3
  • Capacitate memorie 256/512/1024 megabytes
  • Viteza teoretică de eșantionare a texturii de până la 8,8 gigatexeli pe secundă.
  • Doi conectori DVI-I Dual Link, acceptă rezoluții de ieșire de până la 2560x1600
  • conector SLI
  • Bus PCI Express 2.0
  • Suport TV-Out, HDTV-Out, HDMI și DisplayPort cu HDCP

Specificațiile cardului de referință GeForce 9400 GT

  • Frecvența miezului 550 MHz
  • Frecvența procesorului universal 1400 MHz
  • Numărul de procesoare universale 16
  • Număr de blocuri de textură 8, blocuri de amestecare 8
  • Frecvența efectivă a memoriei 1,6 GHz (2*800 MHz)
  • Tip de memorie GDDR2
  • Capacitate memorie 256/512 megabytes
  • Lățimea de bandă a memoriei 25,6 gigaocteți pe secundă.
  • Rata maximă de umplere teoretică este de 4,4 gigapixeli pe secundă.
  • Viteza teoretică de eșantionare a texturii de până la 4,4 gigatexeli pe secundă.
  • Doi conectori DVI-I Dual Link, acceptă rezoluții de ieșire de până la 2560x1600
  • conector SLI
  • Bus PCI Express 2.0
  • Suport TV-Out, HDTV-Out, HDMI și DisplayPort cu HDCP

Arhitectura G96

Din punct de vedere arhitectural, G96 este exact jumătate din cipul G94, care, la rândul său, diferă de G92 doar prin caracteristicile cantitative. G96 are jumătate din numărul tuturor unităților de execuție: ALU, TMU și ROP. Noul cip video este conceput pentru soluții din cel mai mic interval de preț și are două unități mari de shader (32 ALU în total) și 16 unități de textură, precum și opt ROP-uri. De asemenea, are o magistrală de memorie redusă, de la 256 de biți la 128 de biți, în comparație cu G94 și G92. Toate capabilitățile hardware rămân neschimbate, singurele diferențe sunt în performanță.

Detalii: G92b, familia GeForce GTS 200

Specificațiile plăcii video de referință GeForce GTS 250

  • Frecvența de bază 738 MHz
  • Frecvența procesorului universal 1836 MHz
  • Număr de procesoare universale 128
  • Număr de blocuri de textură 64, blocuri de amestecare 16
  • Frecvența efectivă a memoriei 2200 (2*1100) MHz
  • Tip de memorie GDDR3
  • Capacitate memorie 512/1024/2048 megaocteți
  • Lățimea de bandă a memoriei 70,4 GB/s
  • Rata de umplere maximă teoretică este de 11,8 gigapixeli pe secundă.
  • Viteza teoretică de eșantionare a texturii de până la 47,2 gigatexeli pe secundă.
  • Doi conectori DVI-I Dual Link, acceptă rezoluții de ieșire de până la 2560x1600
  • Conector SLI dual
  • Bus PCI Express 2.0
  • Suport TV-out, HDTV-Out, HDCP, HDMI, DisplayPort
  • Consum de energie de până la 150 W (un conector cu 6 pini)
  • Versiune cu două sloturi
  • RRP 129 USD/149 USD/169 USD

În general, această „nouă” placă video bazată pe cipul G92 de 55 nm nu este diferită de GeForce 9800 GTX+. Lansarea noului model poate fi parțial justificată prin instalarea nu a 512 megaocteți de memorie video, precum 9800 GTX+, ci a unui gigabyte, care afectează foarte mult performanța în modurile grele cu setări maxime calitate, rezoluții înalte cu anti-aliasing pe ecran complet activat. Există și opțiuni de doi gigabyte, dar acesta este mai mult un avantaj de marketing decât unul real.

În asemenea condiții, bătrâni versiuni GeForce GTS 250 ar trebui să fie într-adevăr vizibil mai rapid decât GeForce 9800 GTX+ datorită memoriei crescute. Și unele dintre cele mai moderne jocuri vor avea un avantaj chiar și în cele mai multe rezoluții înalte. Totul ar fi bine, dar unii producători de carduri au lansat GeForce 9800 GTX+ cu un gigaoctet de memorie chiar mai devreme...

Producția de cipuri video G92b folosind standarde tehnologice de 55 nm și o simplificare vizibilă a designului PCB a permis NVIDIA să creeze o soluție similară GeForce 9800 GTX din punct de vedere al caracteristicilor, dar cu un preț mai mic și consum redus de energie și disipare a căldurii. Și acum, pentru a furniza energie GeForce GTS 250, pe placă este instalat un singur conector de alimentare PCI-E cu 6 pini. Acestea sunt toate diferențele principale față de 9800 GTX+.