Video: NVIDIA GTC May 2020 Keynote Pt5: NVIDIA Jarvis for Conversational AI (Decembris 2024)
Kaut arī lielu daļu mikroshēmu satraukuma pagājušajā nedēļā radīja Intel Broadwell paziņojums, bija arī vairākas citas mikroshēmas, kas tika detalizēti apspriestas ikgadējā karsto mikroshēmu konferencē, kurai galvenokārt bija tendence koncentrēties uz mikroshēmām, kas paredzētas serveriem un datu centriem.
Izrāde ir pazīstama ar augstākās klases mikroshēmām, Intel, Oracle un IBM apspriež savus jaunākos ierakstus, taču tikai Oracle Sparc M7 bija patiešām jauns. Tā vietā liela daļa šova beidzās ar koncentrāciju uz ARM balstītiem produktiem, ieskaitot pirmās ziņas par Nvidia gaidāmo 64 bitu "Denver" versiju par tā Tegra K1 procesoru.
Oracle, Intel un IBM mērķis ir augsts ar servera mikroshēmām
No augstākās klases mikroshēmām visiespaidīgākās ziņas nāca no Oracle, kas apsprieda sava SPARC procesora nākamās paaudzes, kas pazīstams kā M7. Šai mikroshēmai būs 32 S4 SPARC kodoli (katrs ar līdz astoņiem dinamiskiem pavedieniem), 64 MB L3 kešatmiņu, astoņi DDR4 atmiņas kontrolieri (līdz 2 TB vienam procesoram un 160 GBps atmiņas joslas platuma ar DDR4-2133) un astoņi datu analītikas paātrinātāji. mikroshēmas tīkls.
Mikroshēma ir sadalīta astoņos klasteros ar četriem kodoliem katrā ar kopīgu L2 kešatmiņu un sadalītu 8 MB L3 kešatmiņu ar vairāk nekā 192 GBps joslas platumu starp kodolu klasteru un tā vietējo L3 kešatmiņu. Salīdzinājumā ar M6 (28nm mikroshēma ar 12 3, 6 GHz SPARC S3 kodoliem), M7 nodrošina 3-3, 5 reizes labāku veiktspēju ar atmiņas joslas platumu, veselu skaitļu caurlaides spēju, OLTP, Java, ERP sistēmām un caurplūdes komatu. Stīvens Filips, Oracle SPARC arhitektūras vecākais direktors, sacīja, ka mērķis ir veiktspējas palielināšana, nevis pakāpenisks pieaugums.
M7 var mērogot līdz 8 ligzdām bez līmes (līdz 256 kodoliem, 2000 pavedieniem un 16 TB atmiņas) un ar ASIC slēdzi, lai pārvaldītu satiksmi starp tām SMP konfigurācijā, līdz 32 procesoriem, lai jūs varētu galu galā ar sistēmu ar 1024 kodoliem, 8192 pavedieniem un līdz 64TB atmiņu. Diezgan iespaidīgi. Oracle teica, ka tas piedāvā no 3 līdz 3, 5 reizēm labāku sniegumu dažādiem testiem, salīdzinot ar pagājušā gada SPARC M6. Uzņēmums sacīja, ka tas tiks optimizēts pašas Oracle programmatūras paketei, kas tiek ražota 20 nm procesa laikā un būs pieejama sistēmās kaut kad nākamajā gadā.
IBM arī sniedza sīkāku informāciju par savu Power8 līniju, par kuru tā paziņoja pagājušā gada izstādē. Šajā mikroshēmas versijā bija 12 kodoli, katrā no tiem bija līdz astoņiem pavedieniem ar 512 KB SRAM 2. līmeņa kešatmiņu uz vienu serdi (6 MB kopējais L2) un 96 MB kopēju iegulto DRAM kā 3. līmeņa kešatmiņu. Šī milzīgā mikroshēma, kuras izmērs ir 650 kvadrātmilimetri ar 4, 2 miljardiem tranzistoru, tiek ražota IBM 22nm SOI procesā un sāka piegādāt jūnijā, saskaņā ar IBM.
Pirms dažiem mēnešiem IBM paziņoja par versiju ar sešiem kodoliem, kuras izmērs ir 362 mm 2. Šī gada saruna bija par to, kā IBM var apvienot divas no sešu kodolu versijām vienā paketē ar 48 joslu PCIe Gen 3. IBM sacīja, ka divu ligzdu versija ar kopumā 24 kodoliem un 192 pavedieniem pārspēs divu procesoru darbību. Xeon Ivy Bridge serveris ar 24 kodoliem (ar 48 pavedieniem). IBM pārdod jaudu galvenokārt augstas veiktspējas un specializētās tirdzniecības vietās, tāpēc vairums cilvēku šos divus nesalīdzinās, taču tas ir interesanti. Cenšoties padarīt Power arhitektūru plašāku, IBM pagājušajā gadā paziņoja par Open Power Consortium, un šogad uzņēmums paziņoja, ka tai ir pilna platformas atvērtā pirmkoda programmatūras kaudze. Bet līdz šim neviens cits kā IBM nav paziņojis par platformu balstītu serveri.
Intel runāja par “Ivytown”, Ivy Bridge servera versiju, kurā ietilpst Xeon E5 versijas, kas ieviestas pirms gada, un Xeon E7, kas tika ieviestas februārī. Šī gada saruna koncentrējās uz to, kā Intel tagad principā ir viena arhitektūra, kas var aptvert abus tirgus, ar mikroshēmām, kas atļauj līdz 15 kodoliem, diviem DDR3 atmiņas kontrolieriem, trim QPI saitēm un 40 PCI Gen 3 joslām, kas ir izvietotas modulārā grīdā. plāns, kuru var pārvērst trīs dažādos veidos, katrs paredzēts dažādām kontaktligzdām, kopā vairāk nekā 75 varianti. To var izmantot divu, četru un astoņu kontaktligzdu serveros bez īpašiem savienojumiem.
Šīs mikroshēmas, protams, šajās dienās veido lielāko daļu serveru pirkumu, jo Intel veido lielāko daļu servera vienību. Bet liela daļa informācijas iepriekš tika ietverta ISSCC, un tiek gaidīts, ka Intel ļoti drīz iepazīstinās ar nākamo E5 saimes versiju (E5-1600v3 un E5-2600 v3), kuras pamatā ir atjaunināta versija, izmantojot Hasvelas arhitektūra ar nosaukumu Haswell-EP. (Pagājušajā nedēļā Dell paziņoja par jaunām darbstacijām, kuru pamatā ir šīs jaunās mikroshēmas.)
Intel arī apsprieda savu Atom C2000, kas pazīstams kā Avoton, kurš sāka ražošanu 2013. gada beigās. Šī mikroshēma, kā arī Ivy Bridge un Haswell mikroshēmas ir balstītas uz Intel 22nm procesu.
Nvidia, AMD, lietišķais mikro mērķis jaunos tirgos ARM
Izrādes lielākais pārsteigums, iespējams, bija koncentrēšanās uz ARM balstītām tehnoloģijām, ieskaitot ARM skaļruņu galvenās atsauksmes un Nvidia detalizēto informāciju par tā gaidāmās Tegra K1 procesora "Denver" versiju.
Atsauces rakstā ARM CTO Maiks Mullers apsprieda jaudas ierobežojumus visā, sākot no sensoriem un beidzot ar serveriem, un koncentrējās uz to, kā ARM mēģināja izvērsties uzņēmumā. Mullers arī izvirzīja ideju par ARM sensoru mikroshēmu izmantošanu lietu internetam - tēma, kas tika atkārtota arī Qualcomm Rob Rondhok ievadrakstā. Bet neviens uzņēmums nepaziņoja par jauniem kodoliem vai pārstrādātājiem.
Tā vietā lielās ziņas šajā frontē nāca no Nvidia, kas sniedza daudz sīkāku informāciju par sava K1 procesora jauno versiju. Kad pirmo reizi tika paziņots par uzņēmuma Denveras projektu, izklausījās, ka šī mikroshēma būs paredzēta augstas veiktspējas skaitļošanas tirgum, bet tagad uzņēmums, šķiet, vairāk koncentrējās uz tādām lietām kā planšetdatori un autobūves tirgus. Tegra K1 būs divas versijas. Pirmajam, kas tika paziņots šī gada sākumā un tagad tiek piegādāts uzņēmuma Shield planšetdatorā, ir četri 32 bitu ARM Cortex-A15 serdeņi un mazjaudas "pavadošais kodols" 4 + 1 konfigurācijā, ko Nvidia ir ieviešis tā Tegra līnija vairākus gadus.
Denveras versija ir diezgan atšķirīga ar diviem jauniem patentētiem 64 bitu kodoliem, ko izstrādājusi Nvidia, un uzņēmums patiešām cenšas iegūt ieguvumus no veiktspējas. Kodols ir septiņu virzienu superskalāra (tas nozīmē, ka tas vienlaikus var izpildīt līdz septiņiem mikro-ops), un tam ir 128KB četrvirzienu L1 norādījumu kešatmiņa un 64KB četrvirzienu L1 datu kešatmiņa. Mikroshēmā ir apvienoti divi no šiem kodoliem, kā arī 2 MB 2. līmeņa kešatmiņa, kas kalpo abiem kodoliem, kā 192 “CUDA kodoli” (grafikas kodoli), ko tā dala ar 32 bitu K1. Kā tāds tas nozīmē lielu atkāpšanos no 4 + 1 arhitektūras.
Viena no lielām izmaiņām ietver to, ko Nvidia sauc par "dinamisku koda optimizāciju", kas ir paredzēta, lai ņemtu bieži izmantoto ARM kodu un pārveidotu to mikrokodā, kas ir īpaši optimizēts procesoram. Tas tiek saglabāts 128 MB kešatmiņā (izdalīts no tradicionālās sistēmas galvenās atmiņas). Mērķis ir dot tai izpildi ārpus pasūtījuma, nepieprasot tik daudz enerģijas, cik šī tehnika parasti izmanto. Koncepcija nav jauna - Transmeta to izmēģināja pirms gadiem ar savu Crusoe mikroshēmu -, taču Nvidia saka, ka tagad tas darbojas ievērojami labāk.
Nvidia parādīja vairākus etalonus, kuros tā apgalvoja, ka jaunā mikroshēma var sasniegt ievērojami augstāku veiktspēju nekā esošie četru vai astoņu kodolu mobilie CPU - īpaši atsaucoties uz Qualcomm Snapdragon 800 (MSM8974), Apple A7 (dažreiz sauktu par ciklonu), ko izmanto iPhone. 5s - un pat daži galvenie datoru procesori. Nvidia sacīja, ka tas pārspēj Atom (Bay Trail) procesoru un ir līdzīgs Intel 1, 4 GHz divkodolu Celeron (Haswell) procesoram. Protams, man ir tendence ņemt pārdevēju darbības rādītājus ar sāls graudu: pārdevēji ne tikai izvēlas etalonus, bet nemaz nav skaidrs, vai mēs runājam par vienādiem pulksteņa ātrumiem vai vienādu enerģijas patēriņu.
Tikmēr mikroshēmās, kas vairāk paredzētas serveriem, AMD vairāk runāja par savu Opteron A1100, kas pazīstams kā "Sietla", ar kompāniju, sakot, ka pašlaik tā veic paraugu ņemšanu un tai vajadzētu būt pieejamai serveros ap šī gada beigām. Šai mikroshēmai ir astoņi 64 bitu Cortex A57 CPU kodoli; 4 MB L2 kešatmiņas un 8 MB L3 kešatmiņas; divi atmiņas kanāli līdz 128GB DDR3 vai DDR4 atmiņai ar kļūdu labošanu; daudz integrētu I / O (8 joslas katrā no PCIe Gen3 un 6 Gbps SATA un divi 10 Gbps Ethernet porti); Cortex A5 "sistēmas vadības procesors" drošai sāknēšanai; un paātrinātājs šifrēšanas un atšifrēšanas paātrināšanai. Tas tiek ražots pēc GlobalFoundries 28 nm procesa. AMD vēl nav sniegusi sīkāku informāciju par mikroshēmas frekvenci, jaudu vai veiktspēju, taču parādīja mikroshēmas pamata diagrammu. (virs)
Applied Micro jau sen apgalvo, ka tirgū ir pirmā ARM servera mikroshēma ar savu X-Gene 1 (pazīstamu kā Storm), kas satur 8 2, 4GHZ patentētus ARMv8 kodolus, četrus DDR3 atmiņas kontrolierus, PCIe Gen3 un 6Gbps SATA, kā arī 10 Gbps Ethernet.. Pašlaik tas tiek ražots TSMC 40 nm procesā, saka uzņēmums.
Karstā mikroshēmā Applied Micro uzstāja savu X-Gene 2 (Shadowcat) dizainu, kas būs pieejams ar astoņiem vai 16 "uzlabotiem" kodoliem, kas darbosies ar ātrumu no 2, 4 līdz 2, 8 GHz, kā arī pievieno RoCE (RDMA over Converged Ethernet) resursdatoru. Kanālu adapteris kā starpsavienojums, kas izveidots, lai nodrošinātu mazas latentuma savienojumus starp mikroserveru kopām. Tas ir paredzēts izmantošanai klasteros ar vienu servera plauktu, kas atbalsta līdz 6480 pavedieniem un 50TB atmiņu, visiem koplietojot vienu krātuves baseinu. Uzņēmums saka, ka X-Gene 2 piedāvās par aptuveni 60 procentiem labāku skaitļu veiktspēju, divreiz lielāku par Memcache un par aptuveni 25 procentiem labāku Apache Web apkalpošanu. Tas tiek ražots, izmantojot 28 nm procesu, un šobrīd tajā notiek paraugu ņemšana.
Applied Micro saka, ka X-Gene 2 aizpilda plaisu starp konkurējošajiem mikro serveriem (Cavium ThunderX, Intel Atom C2000 "Avoton" un AMD Opteron A1100 "Seattle") un pilna izmēra Xeon serveriem. Tajā tika sniegta sīka informācija par nākamo paaudzi, X-Gene 3 (Skylark), kurai paredzēts sākt paraugu ņemšanu nākamajā gadā. Šai mikroshēmai būs 16 ARMv8 serdeņi ar ātrumu līdz 3 GHz, un tā tiks ražota, izmantojot 16nm FinFet tehnoloģiju.