Video: Understanding The FinFet Semiconductor Process (Decembris 2024)
Kaut arī mikroshēmu pārdevēji ikgadējā Starptautiskajā cietvielu shēmu konferencē (ISSCC) neieviesa jaunas mikroshēmas, viņi bieži sniedz sīkāku informāciju par jau izziņoto produktu iekšējo darbību. Šīs ir dažas lietas, kas man šķita interesantas šīs nedēļas šovā.
Intel Ivytown servera arhitektūra
Intel apsprieda savas Xeon E7 procesoru saimes jaunāko versiju - mikroshēmu ar līdz 15 kodoliem un 30 pavedieniem, kas pazīstama kā Ivytown. Tas ir balstīts uz Ivy Bridge EP arhitektūru, ko izmanto Xeon E5 2600 V2. Procesors ir veidots, izmantojot Intel 22nm procesu tehnoloģiju ar Tri-Gate tranzistoriem (spuras ir 34nm augstas un 8nm platas), un tas aizstās pašreizējo Westmere EX bāzes Xeon E7. Salīdzinājumam - pašreizējam Xeon E7, kas tiek ražots uz 32nm plakanā HKMG procesora, ir 10 kodoli un 20 pavedieni, un tam ir 30 MB L3 kešatmiņas, salīdzinot ar 37, 5 MB Ivytown versijā.
Viena no interesantākajām šīs jaunās procesoru saimes īpašībām ir tās modulārā arhitektūra. Grīdas plāns sastāv no trim piecu serdeņu kolonnām, katrai no tām ir sava L3 kešatmiņas šķēle, iegultas gredzenu kopnes un speciāla IO kolonnu augšdaļā un apakšā (QPI saites augšpusē un atmiņas kontrolieris apakšā). Intel plāno izveidot 10 kodolu versiju, noņemot labās puses kolonnu; un izveidot 6 kodolu versiju, vēl vairāk noņemot divas rindas.
15 kodolu versijai ir 4, 31 miljards tranzistoru - kas, pēc Intel domām, ir vislielākais jebkuram mikroprocesoram - un tā izmērs ir 541 kvadrātmilimetrs. 10 kodolu versijai ir 2, 89 miljardi tranzistoru, un tās izmēri ir 341 kvadrātmilimetri. 6 kodolu variantam ir 1, 86 miljardi tranzistoru, un tā izmērs ir 257 kvadrātmilimetri. Darbības frekvences svārstās no 1.4GHz līdz 3.8GHz ar TDP diapazonā no 40W līdz 150W.
Otrs interesants Ivytown aspekts ir tā atmiņas bufera arhitektūra. Tajā pašā versijā tiek atbalstīta standarta četrkanālu DDR3 atmiņa, kas darbojas ar ātrumu līdz 1867MT / s, un jauna četru kanālu Voltage-Mode Single-Ended (VMSE) saskarne līdz atmiņas paplašināšanas buferim, kas darbojas ar ātrumu 2667 MT / s. Kopumā tas var atbalstīt līdz 12TB atmiņas 8 ligzdas serverī, kas trīs reizes pārsniedz Westmere EX atmiņas ietilpību. 15 kodolu versija būs pieejama divos dažādos komplektos: viens, kas ir savietojams ar esošo Romley platformu (Socket-R), lai viegli atjauninātu, un otra, kas ļauj izveidot jaunu platformu, izmantojot atmiņas buferus.
Vairāk Haswell Details
Intel arī sniedza vairākas detaļas par Hasvela arhitektūru, ko izmanto pašreizējā Core saimē. Tam tiek izmantoti arī 22 nm tri-vārtu tranzistori. Intel sacīja, ka Hasvells integrē vairākas jaunas tehnoloģijas, ieskaitot pilnībā integrētu sprieguma regulatoru vai FIVR (platformas apvienošanu no pieciem sprieguma regulatoriem līdz vienam), iegulto DRAM kešatmiņu, lai nodrošinātu labāku grafikas veiktspēju, mazākas enerģijas stāvokļus, optimizētas IO, AVX2 instrukcijas un plašāks SIMD vesels skaitlis.
Pastāv trīs Hasvelas pamatvariācijas: Pirmkārt, ir četrkodols, kas sazinās ar atsevišķu PCH (platformas kontroliera centrmezglu) ar ātrāku grafiku (no diviem līdz četriem kodoliem). Otrkārt, ir ultrabook platforma, kas apvieno divu kodolu Haswell un PCH vienā, vairāku mikroshēmu paketē. Procesors atbalsta zemākas jaudas stāvokļus, PCH ir modificēts, lai iegūtu mazāku jaudu, un abi sazinās, izmantojot mazjaudas kopni, tas viss samazina gaidīšanas režīma jaudu par 95 procentiem. Visbeidzot, tajā pašā paketē ir versija ar Iris Pro grafiku un 128 MB eDRAM kešatmiņu. Vairāku mikroshēmu pakotnēs tiek izmantots iesaiņojuma IO, kas nodrošina lielu joslas platumu ar mazu jaudu starp CPU un PCH un eDRAM.
Atkarībā no CPU kodolu skaita un grafikas (GT2 vai GT3) Hasvelam ir jebkur no 960 miljoniem līdz 1, 7 miljardiem tranzistoru, un izciļņa izmērs ir no 130 līdz 260 kvadrātmetriem. Tas ir paredzēts darbam ar 0, 7 līdz 1, 1 voltu ar plašu frekvenču diapazonu no 1, 1 līdz 3, 8 GHz.
128 GB eDRAM ietveres izmērs ir 77 kvadrātmilimetri, un maksimālais joslas platums ir 102 GBps. Intel sacīja, ka salīdzinājumā ar to pašu sistēmu bez eDRAM papildu kešatmiņa nodrošina veiktspējas pieaugumu līdz 75 procentiem, lai gan kopējais sniegums tiek palielināts par 30 līdz 40 procentiem.
AMD tvaicētāja pilnvaras Kaveri
AMD, kas mēdz ievietot vairāk grafikas tam, ko tā sauc par paātrinātajiem procesora blokiem (APU vai procesoriem, kas apvieno CPU un grafiku), koncentrējās uz savu jauno CPU kodolu, kas pazīstams kā Steamroller, kas tiek izmantots uzņēmuma jaunajās Kaveri procesora sērijās. Steamroller kodolā, kas ražots 28 nm lielu CMOS procesā, ir 236 miljoni tranzistoru 29, 47 kvadrātmilimetru platībā. Tas ietver divus veselu skaitļu serdeņus, divas komandu atšifrēšanas vienības un vairākus koplietotus elementus, ieskaitot instrukcijas ienešanu, peldošā komata vienību un 2 MB L2 kešatmiņu. AMD parasti izmanto vienu no šiem Steamroller moduļiem savās "divkodolu" mikroshēmās (atspoguļojot 2 veselus kodolus); un divi tās "četrkodolu" mikroshēmās.
Salīdzinot ar iepriekšējo Piledriver kodolu, kas tika ražots 32nm SOI procesā, Steamroller pievieno otru instrukciju atšifrēšanas vienību, lielāku 96 KB koplietoto instrukciju kešatmiņu un citus uzlabojumus. AMD sacīja, ka tas noveda pie līdz 14, 5 procentiem vairāk instrukciju vienā ciklā, kas nozīmē, ka viena vītņa lietojumprogrammas ir par 9 procentiem labākas un divvītņu lietotnēm - par 18 procentiem labāka. Tas var darboties arī ar 500MHz lielāku frekvenci ar tādu pašu jaudu vai arī sniegt gandrīz tādu pašu veiktspēju ar 38% jaudas samazinājumu. Steamroller kodols ir paredzēts darbībai diapazonā no 0, 7 līdz 1, 45 voltiem.
Mobilie procesori no MediaTek, Renesas un Qualcomm
Vairāki uzņēmumi sniedza prezentācijas par saviem ARM balstītajiem procesoriem.
MediaTek runāja par savu 28 nm heterogēno daudzkodolu procesoru (HMP) ar četrkodolu CPU un duālo GPU. MediaTek mikroshēmai ir divi Cortex A15 serdeņi ar ātrumu 1, 8 GHz un divi Cortex A7 serdeņi, kas darbojas ar frekvenci 1, 4 GHz, apvienojumā ar Imagination G6200 400MHz divkodolu GPU. Tam ir arī pilns HD aparatūras video kodeks un 13 megapikseļu attēla sensora procesors.
MediaTek runāja arī par PTP (Performance, Thermal un Power) tehnoloģiju, kas uzrauga mikroshēmu un kontrolē jaudu. Šajā gadījumā uzņēmums sacīja, ka PTP pieļauj pulksteņa ātruma palielināšanu par 23 procentiem vai enerģijas ietaupījumu līdz 41 procentiem.
Šajā mikroshēmā tiek izmantota ARM patiesā HMP apstrāde, kas nozīmē, ka jebkura lielu un mazu kodolu kombinācija no viena līdz četriem var darboties atkarībā no darba slodzes. MediaTek sacīja, ka, izmantojot īstu HMP, mikroshēma var nodrošināt par 33-51 procentiem labāku veiktspēju lielās slodzēs vai 2-5x labāku energoefektivitāti nelielās slodzēs, bet adaptīvā termiskā vadība nodrošina vēl 10 procentus lielākas veiktspējas.
Renesas prezentēja "ierosināto" 28 nm HPM astoņu kodolu heterogēnu procesoru, kas paredzēts mobilajām ierīcēm un automašīnu informācijas un izklaides sistēmām. Mikroshēmā tiek izmantoti četri 2 GHz Cortex A15 serdeņi un četri 1 GHz Cortex A7 serdeņi. Tas spēj vienlaikus darbināt visus 8 serdeņus, lai sasniegtu augstāko veiktspēju, taču izmanto arī neviendabīgas arhitektūras un enerģijas pārvaldības paņēmienus, lai optimizētu veiktspēju noteiktai darba slodzei vai enerģijas aploksnēm.
Qualcomm aprakstīja savu Hexagon digitālā signāla procesoru, ko mobilajos SoC izmanto dažādiem multimediju un modemu lietojumiem. Pašreizējā versija tiek ražota 28 mm HKMG beztaras CMOS procesā. Šis dizains ir vērsts uz augstām instrukcijām stundā, nevis uz augstām darbības frekvencēm.
ARM servera pusē Applied Micro runāja par uzņēmuma pirmās paaudzes 64 bitu ARMv8 procesoru, kas pirmo reizi tika paziņots nesenā Open Compute samita laikā. Tas ir balstīts uz "Potenza" procesora moduli (PMD), kas ietver divus serdeņus, kas koplieto L6 kešatmiņu 256 KB. Potenza ir izgatavota 40 nm lielos daudzumos CMOS, un katrs PMD satur 84 miljonus tranzistoru, un tajā tiek izmantots 14, 8 kvadrātmilimetru presēšanas laukums. Tas var darboties līdz 3GHz ar 0, 9 voltu jaudu, bet vidējā darba slodze ir vidēji 4, 5 W. X-Gene 3 servera platformā ietilpst četri PMD (astoņi kodoli), kopīgs 8 MB L3 kešatmiņa un četri DRAM atmiņas kanāli ap centrālo slēdzi. Tajā ir arī integrēts 10 GB Ethernet, SATA 2/3, PCIe Gen. 3 un USB 3.0.
Chip Process Tech nākamās paaudzes
Bija arī pāris prezentācijas par nākamās paaudzes mikroshēmu procesu tehnoloģiju, jo gandrīz visiem lielajiem mikroshēmu ražotājiem ir plāns pāriet uz 3D vai FinFET ražošanu 14 vai 16 nm mezglā (sekojot Intel, kas jau piegādā 22 nm mikroshēmas) ar šādu tehnoloģiju).
Samsung runāja par gaidāmo 14 nm FinFET procesu, parādot 128 MB 6T SRAM masīvu un testa mikroshēmu. Samsung sacīja, ka FinFET ir labs risinājums mazjaudas mobilajiem SoC, jo tie nodrošina labu mērogošanu, lielu strāvas stiprumu un mazu noplūdi, kā arī tiem ir laba īsa kanāla vadība.
Tas rada arī dažus izaicinājumus SRAM, jo SRAM barošanas spriegums nav bijis mērogojošs. SRAM tagad aizņem 20-30 procentus no SoC leņķa zonas, bet tas izmanto apmēram 40-50 procentus no jaudas. Lai risinātu šos jautājumus, Samsung ierosināja dažas jaunas metodes SRAM darbības nodrošināšanai, izmantojot FinFET tranzistorus ar zemāku barošanas spriegumu.
TSMC pievērsās līdzīgām problēmām, parādot savu 16nm 128Mb SRAM mikroshēmu. TSMC teica, ka FinFETs ir kļuvušas par galveno tehnoloģiju ražošanai, kas pārsniedz 20 nm, bet teica, ka kanāla platuma un garuma lielums ar FinFETs ir izaicinājums parasto 6T-SRAM un barošanas sprieguma mērogošanai. TSMC ierosināja divus rakstīšanas palīdzības paņēmienus, lai pārvarētu šos jautājumus.
Tās ir diezgan tehniskas problēmas, taču, lai nākotnē iegūtu blīvākas un energoefektīvākas mikroshēmas, ir ļoti svarīgi tos atrisināt.