Kysymys:
Kuinka suorittimet voivat olla vakaita, kun niillä on niin monta transistoria?
cpuer
2011-05-26 06:17:37 UTC
view on stackexchange narkive permalink

Koska tiedämme, että CPU on melkein miljardeja transistoreita yhdellä pikkukuvalla, entä jos jokin transistoreista rikkoutuisi?

Onko CPU: lla mitään automaattista palautusmekanismia?

Itse asiassa suuremmat sisältävät nykyään miljardeja transistoreita.
"vakaa" ei luultavasti ole oikea sana, koska se viittaa enemmän sellaisiin aiheisiin kuin metastabiilius. Parempi valinta tähän aiheeseen ovat sanat, kuten "virheetön" tai "tuotto". Tai voit kysyä valmistusprosessin vakaudesta eikä tuloksena olevista siruista.
@ChrisStratton, Luulen, että OP saattaa kysyä enemmän luotettavuudesta kuin tuotosta.
Jos jokin transistoreista rikkoutuu, heität sirun ulos.Ei ole redundanssia (lukuun ottamatta joitain erityissovelluksia) eikä korjausvaihtoehtoja.
Kymmenen vastused:
Taniwha
2011-05-26 14:53:16 UTC
view on stackexchange narkive permalink

Se on yksinkertaista, testaamme ne ennen kuin myymme ja heitämme huonot.

Tähän on monia tapoja - eri ihmiset tekevät erilaisia ​​asioita, käyttävät usein seuraavien yhdistelmiä:

  • jotkut testit ovat nopeita varmistaakseen, että ne menevät riittävän nopeasti.

  • muissa testeissä on tila, joka muuttaa osan tai kaikki sirun kiikkuista jättimäisiksi sarjasiirtorekistereiksi, kellotamme tunnetut tiedot näihin ketjuihin ja suoritamme sitten sirun yhdelle kello ja skannaa sitten uudet tulokset takaisin ja tarkista, että ne vastaavat ennustettuja tuloksia - automaattiset testityökalut tuottavat vähimmäisjoukon "skannausvektoreita", jotka testaavat kaikki sirun satunnaiset portit tai transistorit - muut vektorit tekevät erityisiä ram-lohkojen testejä ,

  • muut testaavat, että kaikki ulkoiset johdot on liitetty oikein

  • varmistamme, että se ei vedä epäterveellistä määrää virtaa

Ajan testaus maksaa rahaa, teemme joskus joitain yksinkertaisia ​​testejä selville kuolleille siruille ennen kuin ne pakataan pahojen hävittämiseksi, ja sitten lisää testejä pakkaamisen jälkeen

"Se on yksinkertaista, testaamme ne ennen kuin myymme ja heitämme pahat ulos." Jos tämä olisi ainoa laatujärjestelmä, tuotto on todennäköisesti 0,00000000001% 1 miljardilla transistorilaitteella
Se on todella niin yksinkertaista; temppu on erittäin suuri määrä simulaatioita ja sääntöjen tarkistamista etukäteen sen varmistamiseksi, että tuottosi on hyväksyttävä. Itse suorittimen logiikassa on harvoin redundanssia; joskus saat jonkin verran redundanssia siruilla olevissa RAM-muisteissa.
Jos muotoilu on oikea, yksittäiset epäonnistumiset johtuvat materiaalivirheistä, epäpuhtauksista, prosessivirheistä jne. Vaikka käytössä on vain muutama kiekkokoko, suuremmat mikropiirit ovat kalliimpia kuin niiden suhteellinen koko, koska virheen mahdollisuus kasvaa alueella. Joissakin tapauksissa sinulla voi olla siru, jossa on enemmän toiminnallisia yksiköitä kuin joskus myydään, joten se voi silti olla myyntikelpoinen, jos yksi on huono, mutta se on rajallinen. Joskus voit ostaa FPGA-levyjä alennuksella, jotka testataan vain toimimaan tietyn kokoonpanotiedoston käyttämän mielivaltaisen sijaan.
Luulen, että unohdit mainita valmistajat, kuten JA, jotka myyvät huonoja ytimiä sisältäviä prosessoreita, eri mallina, jossa huono ydin on lukittu.Se on eräänlainen irtisanominen tai ehkä älykäs markkinointi.
Jos joku on koskaan miettinyt, kuinka harmaita markkinoita toimitetaan, heidän ei pitäisi enää ihmetellä.Olen työskennellyt siru-fab-järjestelmien ohjelmistopäässä, ja tässä kuvattu automaattinen testaus on valtava osa kasvien aika- ja rahakustannuksia.
AndrejaKo
2011-05-26 12:52:48 UTC
view on stackexchange narkive permalink

Laajentamaan hieman sitä, mitä muut ovat sanoneet: Vahvistus tapahtuu ja sen jälkeen on sirujen luokittelu.

Suorittimien transistorit näyttävät yleensä ongelmansa korkeammilla taajuuksilla, joten on tavallista valmistaa yksi keskusyksikkö ja markkinoida sitä sitten useina eri tuotteina. Halvemmat suorittimet ovat itse asiassa vaurioituneita versioita kalliista suorittimista. Toinen vaihtoehto on poistaa tietyt suorittimen osat käytöstä. Esimerkiksi AMD valmisti prosessoreita, joissa oli BArton-ydin. Se myi myös prosessoreita, joissa oli Thorton-ydin. Thorton ei ollut uusi ydin. Sen sijaan puolet L2-välimuistista oli viallinen ja poistettu käytöstä. Tällä tavoin AMD toipui suorittimista, jotka olisivat muuten hukkaan menneet.

Sama tapahtui AMD: n kolmen ydinprosessorin kanssa. Ne olivat alun perin 4 ydinprosessoria, mutta yksi ytimistä todettiin vialliseksi, joten se poistettiin käytöstä.

ei ole harvinaista, että siru suunnitellaan ominaisuuksilla, jotka voit poistaa käytöstä sulakkeita puhaltamalla.Yksinkertainen sirutuotannon taloudellisuus, jos pystymme pelastamaan sirun tai sen osan suorittamalla sen hitaammin tai poistamalla testissä epäonnistuneen ominaisuuden käytöstä, voimme palauttaa osan kyseisen osan kustannuksista sen sijaan, että heittäisimme koko osan.Voit palata myös Intel 386 SX: n ja DX: n esimerkkeihin.ja melkein jokainen prosessori on nopeusluokiteltu.hitaammat ovat osia, jotka epäonnistuivat suuremmilla nopeuksilla.
Ei, ei 386SX / 386DX.Näillä siruilla on täysin erilainen väylärajapinta.Et vain poista osan 386DX: stä saadaksesi 386SX: n.Se, mitä sanot, on totta 486DX / 486SX: lle, jälkimmäisessä FPU on poistettu käytöstä.
Vintage
2011-05-27 01:13:37 UTC
view on stackexchange narkive permalink

Vastaus kysymykseesi on "Ei". Tällä hetkellä ei ole automaattisia palautusmenetelmiä laitteistovikoille.

Valmistajat suunnittelevat prosessinsa saadakseen parhaan mahdollisen tuoton (dollaria) kiekkoistaan. Kutistamalla transistoreita ne mahtuu enemmän toimintoja pienemmälle alueelle. Tämän voidaan ajatella olevan enemmän siruja (samalla toiminnallisuudella) kiekkoa kohti. Sirun koon pienentyessä voit saada enemmän niitä kiekosta, mutta kutistuessaan useampi niistä osoittautuu huonoksi. Valmistajat hyväksyvät tämän ja työntävät jatkuvasti teknologian kirjekuorta kutistamaan siruja. Asia, joka kertoo heille, että he ovat kirjekuoren reunalla, ovat huonoja pelimerkkejä.

Jos yritys voi pienentää ominaisuuden kokoa 70 prosenttiin vanhasta ominaisuuden koosta, hän voi saada noin kaksi kertaa sirujen määrän kiekolla. Jos heidän vanhan prosessinsaanto oli 95% (sanotaan, että 95 hyvää pelimerkkiä 100: sta kiekolla) ja niiden tuotto uudessa prosessissa on 75% (150 hyvää pelimerkkiä 200: sta kiekolla), he ansaitsivat rahaa uusi prosessi.

Joidenkin sirutyyppien, kuten NAND-flash-muistien, valmistajat työntävät kirjekuoren rutiininomaisesti yli pisteen, jossa nollavirheiset sirut olisivat normi, mutta suurimmalla osalla vikoista on jonkin verran ennustettavia ominaisuuksia, ja siruja käyttävien laitteiden odotetaan toimivan kiertää heidän ympärillään.
jbarlow
2016-02-28 15:35:30 UTC
view on stackexchange narkive permalink

Ajat ovat ilmeisesti muuttuneet. Monet tämän kysymyksen viiden vuoden ikäisistä vastauksista eivät enää heijasta tekniikan tasoa, ja jotkut eivät olleet silloin tarkkoja.

Transistorit ja muut piitä käyttävät laitteet ovat melko vakaat valmistuksen jälkeen edellyttäen, että mikropiiri ei ylikuumentu.

Tässä on asioita, jotka on nyt tehty nykyaikaisella mikropiirien valmistusprosessilla vikojen minimoimiseksi:

  • mikropiirejä testataan perusteellisesti sekä suunnittelun validoinnin että todentamisen ja yksittäisten näytteiden tasolla testit. Tässä artikkelissa kuvataan joitain Pentium 4: n testausmenetelmiä.
  • IC: n yleinen suunnittelu on nyt liian monimutkainen todentamaan kokonaan
  • IC: ssä on ohjelmoitava mikrokoodi, joka sallii rajoitetun ohjelmoitavuuden, jos vikoja havaitaan valmistuksen jälkeen.
  • Nykyaikaiset mikropiirit sisältävät redundantteja piikerroksia, jolloin valmistuksen aikana löydetyt viat voidaan korjata
  • monissa suorittimissa on turhaa laitteistomoduulia ovat suorittimen ytimiä, välimuistia tai muuta IP-osoitetta; jos kaikki yksiköt eivät ole toimivia, jotkut voidaan poistaa käytöstä ja "kiinnittää" halvempina osina. Yksi esimerkki on, että PS4-moniytiminen mikropiiri sisältää yhden redundantin ytimen, joka on poistettu käytöstä suuremman tuoton saavuttamiseksi.
  • jotkut suorittimet toimivat, mutta eivät huippunopeudella; näitä voidaan myydä pienemmillä nopeuksilla, edullisemmilla suorittimilla
  • monet suorittimet ja RAM käyttävät virheenkorjauskoodausta (ECC) tai suorittavat sanoman vahvistusvirheiden korjauksen tiedonsiirron eri vaiheissa eheyden varmistamiseksi
  • joskus prosessorit epäonnistuvat tavalla, joka aiheuttaa järjestelmän kaatumisen, mutta ei estä järjestelmää toimimasta uudelleen, jos uudelleenkäynnistys (CMOS-salpa)

Suorittimen virallisen määrityksen ohjelmointivirheet ovat todennäköisempiä kuin tietyn transistorin viat.

Vaikka tavallisilla suorittimilla ei ole minkäänlaista automaattisen palautuksen ominaisuutta, on myös tehty työtä itse palautuvien suorittimien parissa vastatoimenpiteenä kosmisille säteille. Kosmiset säteet voivat kerätä tarpeeksi energiaa keskusyksikköön tai RAM-muistiin aiheuttaakseen bittiä.

Kuten kommenteissa todettiin, toimintakriittiset järjestelmät ovat luottaneet useaan keskusyksikköön todentamiseksi pitkään. Avaruussukkula, vuonna 1976, käytti yhtenä esimerkkinä viittä tietokonetta, joista neljä käytti samaa ohjelmaa ja "äänesti" kaikista lennonohjauspäätöksistä turvallisuuden varmistamiseksi.

ECC: tä ja virheenilmaisua on käytetty jo jonkin aikaa (muistiin ja viestintään, aritmeettisiin ja vastaaviin logiikkatoimintoihin joissakin korkeamman tason järjestelmissä on ollut virheiden havaitseminen vuosia).Vastaavasti redundanttia suoritusta (spatiaalista tai ajallista) on käytetty virheiden havaitsemiseen jo jonkin aikaa järjestelmissä, joissa laitteisto- / toteutusajan kustannukset vaikuttavat perustelluilta.
@PaulA.Clayton, jos tekisit viestin Itaniumista ja myöhemmin Xeon RAS -ominaisuuksista, olisin varmasti iloinen voidessani äänestää sen puolesta.
b degnan
2016-03-01 01:58:55 UTC
view on stackexchange narkive permalink

Pienissä solmuissa jokainen "transistori" on 2 porttia, ellei sinulla ole muistia, kuten SRAM. Jos jokin ei toimi, sinulla on vain hidas kuljettaja. SRAM: n tapauksessa, jos se ei läpäise, "puhaltaa" vain rivin. Jos molemmat transistorin FETS epäonnistuvat, sinulla olisi erittäin kallis pala hiekkaa, mutta minulla ei ole henkilökohtaisesti koskaan tapahtunut sitä. Nykyaikaiset FinFETit ovat niin pieniä, litografian luonteesta ja todennäköisyydestä johtuen on joukko tuotanto-ongelmia (lähinnä hässäkkää). Tulet huomaamaan, että ensimmäiset asiat uusissa prosesseissa ovat FPGA: t, koska voit vain "puhaltaa" huonot solut ja muuttaa reitityskaaviota. En voi antaa sinulle numeroita, mutta voit arvata, kuinka x86-maailma yhdistää, asiat menevät harvoin täydellisesti.

Tässä on esimerkki XOR-solun asettelusta: XOR

Vihreät palkit vasemmalla / oikealla ovat eviä ja punainen on poly. Siniset ovat värillistä metallia tasolla 1.

Kaupallisissa suorittimissa ei ole automaattista palautusmekanismia, mutta akateemisessa ympäristössä kelluvat asiat ja erityiset sovellusprosessorit. Olen tehnyt joitain erikoistuneita komponentteja, jotka käyttävät asynkronisia arkkitehtuureja huonojen porttien takia syntyvien kello-ongelmien ratkaisemiseksi, vaikka reiän oksidin tuhoaminen kuumana kantajana, josta saat vain yhden todella hitaan transistorin.

Joe
2011-05-26 09:34:26 UTC
view on stackexchange narkive permalink

Useimmat nykyaikaiset prosessoritransistorit ovat FET: itä. Näiden etuna on lähde- / tyhjennysvastuksen saaminen ylikuormitusta aloitettaessa. Tämä on yksi tekijä, joka sallii suuritehoisten MOSFETien valmistamisen asettamalla monia rinnakkain. Kuorma jakautuu automaattisesti. Se voi olla tekijä ongelmien jakamisessa. Mutta mielestäni se on todella yksinkertaisempaa.

Kuten useimmissa elektronisissa osissa, jos ajaa niitä teknisten tietojen mukaisesti, ne kestävät vielä jonkin aikaa. Kun valmistetaan mikroprosessori, kustannuksiin on kaksi tekijää. Pelkästään piin tila ja monimutkaisuuden vuoksi todellinen saanto. Kaikki sirut eivät toimi valmistuksen jälkeen. Kuitenkin, kun se on tehty ja validointi on ohi, tiedät, että transistorit ovat hyviä. Jos ajetaan spesifikaation sisällä, on todennäköistä, että ne pysyvät hyvinä.

Pål-Kristian Engstad
2016-02-29 02:15:20 UTC
view on stackexchange narkive permalink

Oletko koskaan miettinyt, miksi samaa sirua joskus myydään eri nopeuksilla? Ja oletko huomannut, että joskus samaa GPU-siruarkkitehtuuria myydään eri määrällä sisäisiä yksiköitä?

Laitteiden vikoja ei voida korjata piitasolla, mutta ajan mittaan suunnittelijat ovat oppineet käsittelemään ongelmaa lisätä tuottoa . Ilman ennakointia saanto riippuu yksinomaan valmistuksen laadusta. Jos olet taitava, voit palauttaa joitain huonoja pelimerkkejä.

Oletetaan esimerkiksi, että sinulla on 18-ytiminen siru, joka toimii enemmän tai vähemmän itsenäisesti. Testauksen aikana lajitelet täydelliset sirut ja vapautat sen A18-mallina. Useimmissa epäonnistuneissa siruissa on vain yksi virhe, joten ne toimivat hyvin niin kauan kuin viallinen ydin on poistettu käytöstä. Myyt näitä A17-mallina hieman halvemmalla, ja ne, joissa on kaksi huonoa ydintä, myydään A16-mallina aina halvemmalla.

Sama pätee sirun nopeusluokkaan. Täysin valmistetut sirut pystyvät toimimaan suunnitellun nopeuden ylittävillä nopeuksilla, mutta ongelmalliset sirut eivät välttämättä. Näitä myydään pienemmillä nopeuksilla.

Tämä menetelmä lisää dramaattisesti kokonaistuottoa ja on siksi melko yleinen. Esimerkiksi PlayStation 3: lla on 8 SPE-yksikköä laitteistossa, mutta yksi on aina pois käytöstä tuoton ongelmien huomioon ottamiseksi.

Brian Carlton
2012-08-17 22:01:56 UTC
view on stackexchange narkive permalink

Onko CPU: lla mitään automaattista palautusmekanismia?

Ei, kuten yllä on selitetty. Niiden välimuistit, erityisesti L2 ja L3, voivat kuitenkin sisältää ylimääräistä RAM-muistia. Kun osa testataan tehtaalla, virheelliset RAM-lohkot voidaan poistaa ja käyttää ylimääräisiä RAM-lohkoja.

old_timer
2016-02-28 21:30:23 UTC
view on stackexchange narkive permalink

Yleensä ei, peität huonoja transistoreita sirunäytön kautta ja odotat suhteellisen pienen prosenttiosuuden tappioista sen jälkeen. Siruliiketoiminta on ollut olemassa vuosikymmenien ajan, ja heillä on paljon temppuja tämän hallitsemiseksi (ja kyllä, joskus yksi temppuista on vain antaa huonot osat pois ja vaihtaa ne ilmaiseksi tai antaa asiakkaiden olla onnettomia).

Säteilystä kovettuneissa ympäristöissä (avaruudessa) olet todennäköisesti kolminkertainen äänestys, jokaisella "bitillä" on itse asiassa kolme bittiä, jotka äänestävät yhden tekemiseen. bittiasetuksen määrittäminen vaatii vain kahden kolmasosan äänen. joten toisen kolmanneksen transistorit voivat mennä pieleen ja lopulta kokonaisannoksella. mutta ensisijainen huolenaihe on yksittäisen tapahtuman järkyttyminen. Nämä sirut ja järjestelmät on suunniteltu näihin ympäristöihin ylhäältä alas, piitä, laitteistoja, ohjelmistoja jne. Ja ne käyttävät vanhaa kokeiltua ja todellista tekniikkaa, ei huipputekniikkaa, joten transistoreiden määrä ja transistoreiden koko ovat vuosia sitten. / p>

COTSin odotetaan hikoilevan ja epäonnistuvan ajoittain.

sybreon
2011-05-26 07:23:15 UTC
view on stackexchange narkive permalink

Se saattaa tuntua ihmeeltä, mutta transistorin vikojen vähentämiseksi käytetään useita mekanismeja. Transistorin kokeman vikatyypin mukaan ja missä CPU voi kuitenkin olla tai olla edelleen käyttämätön joskus tietyissä olosuhteissa.

Tällä hetkellä ei ole usein sisäänrakennettua automaattista palautusmekanismia, mutta ongelman minimoimiseksi on tehty paljon tutkimuksia uudelleen konfiguroitavasta laskennasta, redundanssista ja muista tekniikoista.



Tämä Q & A käännettiin automaattisesti englanniksi.Alkuperäinen sisältö on saatavilla stackexchange-palvelussa, jota kiitämme cc by-sa 3.0-lisenssistä, jolla sitä jaetaan.
Loading...