Czech English
 
Úvodní stránka|Produkty a služby|Reference|Konference|Školení|Partneři|Kontakt

NVIDIA Fermi
architektura


 


Produkty a služby > TESLA GPUs > Fermi architektura

Další generace CUDA s označením "Fermi" od NVIDIA

 
Architektura Fermi je nejvýznamnější krok vpřed v GPU architektuře od původní G80. G80 byla naše první představu o tom, jak by jednotné grafické a výpočetní paralelní procesory měly vypadat. GT200 rozšířila výkon a funkčnost G80. S Fermi jsme se poučili z předchozích dvou generací procesorů a všech aplikací, které byly pro obě generace napsány, a proto jsme vytvořili zcela nový přístup k návrhu tak, abychom vytvořili první výpočetní GPU na světě. Když jsme začali pokládat základy pro Fermi, shromáždili jsme rozsáhlé uživatelské zpětné vazby na GPU od uvedení G80 a GT200, a se zaměřili jsme se na tyto klíčové oblasti pro zlepšení:
• Zlepšit výkon v dvojité přesnosti — výkon jednotkové přesnosti s plovoucí desetinnou byl požadován na úrovni  desetinásobku výkonu desktopového CPU, některé GPU aplikace žádaly větší výkon i ve dvojité přesnosti.
 
ECC podpora — ECC umožňuje GPU uživatelům bezpečně nasadit velké množství GPU v datových centrech, a také zajišťuje datově citlivé aplikace, jako jsou lékařské zobrazování a ocenění opcí ve finacích jsou chráněny před chybami paměti.
 
• Skutečná hierarchie vyrovnávací paměť — některé paralelní algoritmy nebyly schopné využít sdílenou paměť v GPU a uživatelé žádali o skutečnou architekturu vyrovnávací paměti, která by jim pomohla.
 
• Více sdílené paměti — mnoho CUDA programátorů požaduje více než 16 kB SM sdílené paměti pro urychlení jejich aplikací.
 
• Rychlejší přepínání kontextu — uživatelé požadovali rychlejší přepínání  kontextu mezi aplikacemi a rychlejší grafickou a výpočetní interoperabilitu.
 
• Rychlejší atomické operace — uživatelů požadovali rychlejší atomiceké operace jako čti-modifikuj-zapiš pro jejich paralelní algoritmy.
 
S těmito požadavky na mysli, tým Fermi navrhl takový procesor, který významně zvyšuje hrubý výpočetní výkon  a přes architektonické inovace, rovněž nabízí výrazně větší programovatelnost a výpočetní účinnost. Klíčová architektonická zlepšení Fermi procesoru jsou:
 
Třetí generace Streaming Multiprocesoru  (SM)
o 32 CUDA jáder na SM, 4x více než u GT200
o 8x větší výkon v dvojité přesnosti s plovoucí desetinné čárce než u  GT200
o Dvojitý Warp Plánovač současně plánuje a odesílá pokyny od dvou nezávislých smrští (“warpů“)
o 64 KB RAM s konfigurovatelným rozdělením sdílené paměti a L1 cache
 
• Druhá generace paralelního spouštění vláken ISA
o Unifikovaný adresní prostor s plnou C++ podporou
o Optimalizováno pro OpenCL a DirectCompute
o Plné IEEE 754-2008 ve 32-bitové a 64-bitové přesnosti
o Plná 32-bitová celočíselná cesta s 64-bitovými rozšířeními
o Instrukce přístupu do paměti k podpoře přechodu na 64-bitové adresování
o Zlepšená výkonnost prostřednictvím odhadů
 
• Zlepšení paměťový subsystém
o NVIDIA paralelní DataCacheTM hierarchie s nastavitelnými L1 a unifikovanými L2 cachemi
o První GPU s ECC paměťovou podporou
o Výrazné zlepšení atomické paměťové operační výkonnosti
 
• NVIDIA GigaThread Engine
o 10x rychlejší aplikační přepínání kontextu
o Konkuretní exekuce jádra
o Exekuce vláknového bloku mimo pořadí
o Duální překrývající se paměťové posuvné „enginy“ 
© 2011 Sprinx Systems, a.s. Pokud Vás naše nabídka zaujala a chcete se dozvědět více podrobností, neváhejte nás
kontaktovat na emailové adrese hpc@sprinx.cz nebo na telefonu +420 251 014 211.