Van Zebra tot BlueGene - krachtige rekenmachines bij de RUG
Rob de Bruin, HPC&V
Intercom 1995, aangevuld april 2005.
Ondanks de enorme hoeveelheid PCs en werkstations die men overal binnen de universiteit aantreft, blijft de behoefte aan krachtige rekenapparatuur onverminderd toenemen. Vanaf 1958, toen door de Faculteit der Wiskunde en Natuurwetenschappen een Stantec ZEBRA (Zeer Eenvoudige Binaire Reken Automaat) werd aangeschaft voor het destijds enorme bedrag van fl 150.000, tot de laatste aanwinst in 1995 van een 32-processor Cray J932, heeft de RUG steeds geavanceerde rekenapparatuur in huis gehad. Zij kon dan ook regelmatig, en ook nu weer, pronken met `de snelste computer van het land'. Mondiaal zwerft de RUG al jaren rond de 150-ste plaats met in 1993 een eervolle 125-ste plek met de CM5 en nu de 120-ste plaats met de Cray J932. Een overzicht.
Zie aanvulling over BlueGene hieronder.
Altijd meer
De RUG heeft een naam hoog te houden op het gebied van groot rekenwerk. Veel vakgebieden binnen de faculteit Wiskunde en Natuurwetenschappen, maar ook enkele daarbuiten, houden zich bezig met het modelleren of simuleren van rekenintensieve problemen: biofysische chemie, chemische fysica, polymeer chemie, theoretische fysica, astronomie, animale fysiologie, biofysica, informatica, wiskunde, farmacie, geneeskunde, vaste stof fysica en zo voort. Voor het zo realistisch mogelijk simuleren van bijvoorbeeld biochemische processen, het menselijk visueel systeem, quantum processen of het modelleren van vloeistofstromingen, van sterrenstelsels, van neurale systemen, kan men niet genoeg rekenkracht en geheugen aandragen. Onderzoek in deze vakgebieden vereist de beschikking hebben over krachtige rekenfaciliteiten. Al vanouds is de RUG zich bewust van het belang hiervan. Gemiddeld is over de afgelopen periode van 38 jaar elke twee jaar een verdubbeling van de snelheid en de geheugencapaciteit gerealiseerd.
Historie
Zoals gezegd werd in 1958 de ZEBRA aangeschaft, opgebouwd uit elektronenbuizen en een werkgeheugen bestaande uit een ronddraaiende trommel met 256 sporen en 256 koppen, goed voor 32 kBytes. Een goed werkende ZEBRA verving 10 tot 20 rekenaars maar had helaas een gelijk aantal mensen nodig om hem aan de praat te houden. De snelheid was, in de huidige terminologie, ongeveer 500 flops (zeg maar 500 optellingen per seconde). Vanwege de geringe betrouwbaarheid werden voor alle zekerheid de resultaten met de hand nagerekend. Het enthousiasme van de wetenschappers voor wat toen nog een computor heette werd er niet minder door.
In 1964 kon de toen al enige tijd, wat rekenkracht betreft, te kleine ZEBRA worden vervangen door een Telefunken TR4. Voor twintig keer zoveel geld, drie miljoen gulden, kreeg de RUG een bijna honderdvoudige vergroting van de rekenkracht (50 kflops). De kranten stonden er bol van: `Fabelachtig snel', `Superbrein', `4.800.000 zo snel als met een potlood', etc. Het geheugen van de TR4 bestond uit ferriet magneetringetjes, totaal ongeveer dertigduizend 48-bits woorden, 180 kBytes dus. Ponskaarten namen de rol van de ponsband over als invoermedium. Voor het externe geheugen kwamen nu de magneetbanden in zwang. Als uitvoerapparaat fungeerde een snelle regeldrukker (20 regels per seconde, toen al!). De architectuur van de TR4 voorzag in de mogelijkheid een achtergrondprogramma te laten werken op momenten dat het voorgrondprogramma resultaten wegschreef of invoer las.
In deze jaren zijn diverse vernieuwingen geïntroduceerd die jarenlang gezichtsbepalend zijn gebleven in het automatiseringswereldje. IBM introduceerde de 360 serie, met microcoded instructies en virtueel geheugen. DEC ontwikkelde de PDP serie waarmee het uiterst succesvol de laboratoria binnendrong (de eerste PDP-9 kwam in het Rekencentrum in 1969, PDP-11's staan nu nog her en der). In tegenstelling tot IBM en DEC die een complexe instructie set hadden, ontwikkelde Seymour Cray bij Control Data de CDC 6600 (later de Cyber 74 genoemd omdat in de zeventiger jaren nummers met een zes erin bejaard leken) op basis van een zeer eenvoudige instructie set, en met een volledig doorgevoerde scheiding tussen het rekengedeelte en het invoer/uitvoer deel. Cray wilde geen gedoe in de vorm van microcode of virtueel geheugen: dat kostte alleen maar snelheid. Verder vond hij dat kon worden volstaan met met slechts 64 6-bits tekens (Fortran heeft zelfs aan 48 tekens genoeg en daar ging en gaat het uiteindelijk om). Alleen op numeriek gebied ging Cray consciëntieus te werk: maar liefst 60-bits woorden, goed voor een nauwkeurigheid van 14 significante cijfers en een bereik van 10^{-300} tot 10^{300}.
Juist vanwege de geschiktheid voor numeriek werk werd deze machine (de Cyber 74) in 1972 aangeschaft voor het onwaarschijnlijk hoge bedrag van vijftien miljoen gulden (na een heftige concurrentiestrijd met IBM en UNIVAC). Voor de statistiek: het apparaat had een snelheid van 1 Mflops en een geheugen van 131.000 60-bits woorden (dus zoiets als 1 Mbyte). We zijn nu in de jaren beland met een steeds sterker wordende diversificatie: veel instituten schaften zelf rekenapparatuur aan. In die tijd kwam DEC ook met de uiterst succesvolle VAX-lijn. Hier gaan we verder met de krachtiger apparaten. De wensen van een steeds grotere groep gebruikers met niet-numerieke werk, tezamen met de dan al van overheidswege ingezette bezuinigingen, zorgden ervoor dat de opvolging van de Cyber 74 een spannende affaire werd. In feite waren alleen CDC en Burroughs serieuze kandidaten (IBM liet het wetenschappelijke wereldje links liggen, DEC kon de benodigde power niet leveren).
Uiteindelijk werd weer voor CDC gekozen: de Cyber 170/760 met een topsnelheid van 4 Mflops en een ferriet geheugen van ongeveer 2Mbyte (later vervangen door 4Mbyte halfgeleider geheugen waarmee het laatste ferriet kerngeheugen verdween). In de jaren zeventig werden verschillende experimentele machines ontworpen. De tijd was nog niet rijp voor parallel werkende processoren maar wel werd de vectorprocessor commercieel haalbaar. Een vectorprocessor voert eenzelfde bewerking op een rij getallen (vector) met relatief hoge snelheid uit (een vinding van Cray die, rudimentair, al in hardware van de Cyber 170/760 zat). Er heerste in die tijd verschil van inzicht over de richting die de vectorprocessorarchitectuur zou gaan: de ideeën van Cray volgen (vectorinstructies werkend op registers), of de vectorinstructies rechtstreeks op het geheugen laten werken. CDC koos voor het laatste. Cray begon daarop voor zichzelf, en rond 1977 was de Cray-1 onbetwist marktleider.
In de jaren tachtig komt Unix als bedrijfssysteem naar voren (daarvoor hield elke fabrikant er verschillende bedrijfssystemen op na: om gek van te worden); niet omdat Unix zo goed, gebruikersvriendelijk of efficient zou zijn, maar omdat het redelijk goedkoop op nieuwe hardware te implementeren viel. Als tweede belangrijke ontwikkeling moet genoemd worden het commercieel beschikbaar komen van parallelle architecturen (meerdere processoren die tegelijkertijd aan een taak werken). Het gebruik van meerdere processoren werd steeds gebruikelijker (Cray, Alliant, Convex). Alliant ging daarbij het verst door op Fortran DO-loop niveau de iteraties automatisch over de verschillende processoren te verdelen.
De tijd brak aan de Cyber 760 te vervangen. Overwogen werden IBM met de succesvolle 3090 serie, Cray (goed maar duur), Alliant (uiteindelijk door Sterrenkunde aangeschaft) Convex en CDC. Uiteindelijk zou in april 1989 voor fl 8.300.000 een Cyber 962 worden geleverd met een ETA10-P. De 962 was qua prestaties gelijk aan de te vervangen 760 maar had virtueel geheugen en een modern gebruikersvriendelijk bedrijfssysteem. De ETA diende als supercomputer extensie aan de 962. Echter, wat Burroughs begin jaren tachtig overkwam gebeurde nu met CDC: de complete supercomputertak werd afgestoten. De ETA is nooit verder gekomen dan Schiphol. De val van CDC betekende voor de RUG een kleine ramp: met veel moeite waren immers de faculteiten op een lijn gekomen voor de aanschaf van de 962/ETA combinatie. Hernieuwd overleg leidde tot de keus: handhaven van de 962 met als vectorsupercomputer de Convex (onder dezelfde financiële consequenties). In september 1989 kwam de Convex (aanvankelijk met twee processoren, uiteindelijk met vier processoren C240). De Convex heeft een topsnelheid van 200 Mflops en een intern geheugen van 256 Mbyte. In augustus van dit jaar zal deze zeer succesvolle machine buiten gebruik worden gesteld.
Vandaag
Daar waar in de jaren zestig en zeventig slechts numerieke problemen werden opgelost op computers, ziet men in de jaren tachtig een enorme diversificatie van het gebruik op de grote rekenmachines. Toch zijn het steeds de grote rekenaars die een onlesbare dorst zijn blijven houden naar meer rekenkracht: in 1992 blijkt de Convex C240 voor echte rekenkundige experimenten al niet meer voldoende en wordt de Connection Machine CM5 van Thinking Machines aangeschaft. Uiteraard weer sneller: 2 Gflops met 512 Mbyte geheugen. Ondanks het experimentele karakter van deze 16-processor vectorsupercomputer is de machine een succes. Zowel het gebruik als de wetenschappelijke resultaten resulterend in honderden artikelen zijn indrukwekkend. Ook valt voor een behoorlijk deel van de probleemgebieden de hoge prestatie van het apparaat op. Echt gemakkelijk te programmeren is deze machine echter niet. Bovendien maakt het gedistribueerde geheugen (elke processor heeft zijn eigen geheugen) veel tijd vretende communicatie tussen die processoren nodig. En - het wordt haast gebruikelijk - ook deze leverancier geraakt in ernstige financiële problemen.
Cray
De positieve ervaring en resultaten opgedaan op de Connection Machine CM5 leidden tot de wens van een nog krachtiger parallel vectorsupercomputer systeem zonder, als het even kon, de onaangenaamheden van een gedistribueerd geheugen. In 1994 werden hiervoor vier kandidaten beschouwd: de Exemplar van Convex, de Power Challenge van Silicon Graphics, de SP2 van IBM en de CrayJ90 van Cray. Alhoewel niet de snelste van het dit rijtje viel door zijn snelle gezamenlijke geheugen en de volwassen software tools uiteindelijk de keuze op de Cray J932. Deze 32-processor-machine heeft een topsnelheid van 6,4 Gflops met 4 Gbyte intern geheugen en 64 Gbyte disk. Voorlopig bestaat de machine nog slechts op papier. Tot het najaar moest de RUG het doen met een `halve Cray'. Deze machine, een Cray J916, werd in mei geïnstalleerd. In november 1995 werd uiteindelijk de CrayJ32 binnengereden De resultaten zijn uiterst bemoedigend: naast snel is deze computer ook in hoge mate gebruiksvriendelijk (alles natuurlijk relatief ten opzichte van andere parallelle systemen). Wederom heeft de RUG een fantastische rekenfaciliteit binnengehaald, die op een enthousiast gebruik kan rekenen.
Blue Gene in gebruik op 26 april 2005
Op 26 april 2005 werd de IBM BlueGene/L op feestelijke wijze, in aanwezigheid van veel hoogwaardigheidsbekleders, in werking gesteld. Deze computer werkt volgens de gridtechnologie en is opgebouwd uit meer dan 12.000 processoren met een peak performance van ongeveer 34.400.000.000.000 floating point operaties per sec.
Introductie | Systeem | Topsnelheid in flops | Geheugen in bytes |
---|---|---|---|
1958 | Stantec Zebra | 500 | 32.000 |
1964 | Telefunken TR4 | 50.000 | 180.000 |
1972 | CDC Cyber 74-16 | 1.000.000 | 1.000.000 |
1978 | CDC Cyber 170/760 | 4.000.000 | 4.000.000 |
1989 | CDC Cyber 962 | 5.000.000 | 60.000.000 |
1989 | Convex C240 | 200.000.000 | 250.000.000 |
1993 | Connection Machine CM5 | 2.000.000.000 | 500.000.000 |
1995 | Cray J932 | 6.000.000.000 | 4.000.000.000 |
2002 | Cray SV1e | 60.000.000.000 | 32.000.000.000 |
2005 | IBM BlueGene/L | 34.400.000.000.000 | 3.000.000.000.000 |
Tabel: De grote rekenmachines bij de RUG over een periode van 47 jaar. Ruwweg zien we elke twee jaar een verdubbeling in snelheid en in geheugen.
Laatst gewijzigd: | 04 oktober 2024 12:20 |