Cray-2 – Wikipedia

before-content-x4

Ein Cray-2 und sein Fluorinert-kühlender “Wasserfall”, früher Seriennummer 2101, das einzige 8-Prozessor-System, das jemals für NERSC hergestellt wurde

Ein Cray-2 der NASA

Detail des oberen Teils des Cray-2

Das Cray-2 ist ein Supercomputer mit vier Vektorprozessoren, die ab 1985 von Cray Research hergestellt wurden. Mit einer Spitzenleistung von 1,9 GFLOPS war es die schnellste Maschine der Welt, als es veröffentlicht wurde, und ersetzte an dieser Stelle den Cray X-MP. Es wurde seinerseits 1988 an dieser Stelle durch den Cray Y-MP ersetzt.

Der Cray-2 war das erste Design von Seymour Cray, bei dem mehrere CPUs erfolgreich eingesetzt wurden. Dies war in den frühen 1970er Jahren im CDC 8600 versucht worden, aber die Emitter-Coupled-Logic (ECL) -Transistoren der damaligen Zeit waren zu schwierig, um sie in eine Arbeitsmaschine zu packen. Der Cray-2 hat dies durch die Verwendung von integrierten ECL-Schaltkreisen behoben und diese in eine neuartige 3D-Verkabelung gepackt, die die Schaltkreisdichte erheblich erhöht.

Die dichte Verpackung und die daraus resultierenden Wärmebelastungen waren ein Hauptproblem für den Cray-2. Dies wurde auf einzigartige Weise gelöst, indem die elektrisch inerte Fluorinert-Flüssigkeit unter Druck durch die Schaltung gedrückt und dann außerhalb der Prozessorkiste gekühlt wurde. Das einzigartige “Wasserfall” -Kühlersystem stellte das Hochleistungsrechnen in der Öffentlichkeit dar und wurde für einige Zeit in vielen Informationsfilmen und als Filmrequisite gefunden.

Im Gegensatz zum ursprünglichen Cray-1 hatte der Cray-2 Schwierigkeiten, Spitzenleistungen zu erbringen. Andere Maschinen des Unternehmens, wie der X-MP und der Y-MP, verkauften den Cray-2 deutlich. Als Cray mit der Entwicklung des Cray-3 begann, entschied sich das Unternehmen stattdessen für die Entwicklung der Cray C90-Serie. Dies ist die gleiche Abfolge von Ereignissen, die bei der Entwicklung des 8600 aufgetreten sind, und wie in diesem Fall hat Cray das Unternehmen verlassen.

Ersten Entwurf[edit]

Mit dem erfolgreichen Start seines berühmten Cray-1 wandte sich Seymour Cray dem Design seines Nachfolgers zu. 1979 hatte er genug von Managementunterbrechungen in einem großen Unternehmen und beschloss, wie in der Vergangenheit, sein Managementamt niederzulegen und ein neues Labor zu gründen. Wie bei seinem ursprünglichen Umzug nach Chippewa Falls, Wisconsin, vom Control Data HQ in Minneapolis, Minnesota, verstand das Cray-Management seine Bedürfnisse und unterstützte seinen Umzug in ein neues Labor in Boulder, Colorado. Als unabhängiger Berater bei diesen neuen Cray Labs stellte er ab 1980 ein Team zusammen und begann mit einem völlig neuen Design. Dieses Labor würde später geschlossen und ein Jahrzehnt später würde eine neue Einrichtung in Colorado Springs eröffnet.

Cray hatte zuvor das Problem der höheren Geschwindigkeit mit drei gleichzeitigen Fortschritten angegriffen: mehr funktionale Einheiten, um dem System eine höhere Parallelität zu verleihen, eine engere Verpackung, um Signalverzögerungen zu verringern, und schnellere Komponenten, um eine höhere Taktrate zu ermöglichen. Das klassische Beispiel für dieses Design ist der CDC 8600, der vier CDC 7600-ähnliche Maschinen basierend auf ECL-Logik in einen 1 × 1-Meter-Zylinder packte und sie mit einer Zyklusgeschwindigkeit von 8 ns (125 MHz) betrieb. Leider führte die zur Erreichung dieser Zykluszeit erforderliche Dichte zum Ausfall der Maschine. Die Leiterplatten im Inneren waren dicht gepackt, und da selbst ein einzelner fehlerhafter Transistor zum Ausfall eines gesamten Moduls führen würde, erhöhte das Packen weiterer Leiterplatten auf die Karten die Ausfallwahrscheinlichkeit erheblich. Die Kühlung der dicht gepackten Einzelkomponenten war ebenfalls eine große Herausforderung.

Eine Lösung für dieses Problem, zu der die meisten Computerhersteller bereits gewechselt waren, bestand darin, integrierte Schaltkreise (ICs) anstelle einzelner Komponenten zu verwenden. Jeder IC enthielt eine Auswahl von Komponenten aus einem Modul, das durch den automatisierten Konstruktionsprozess in eine Schaltung vorverdrahtet wurde. Wenn ein IC nicht funktioniert, wird ein anderer ausprobiert. Zu der Zeit, als der 8600 entworfen wurde, bot die einfache MOSFET-basierte Technologie nicht die Geschwindigkeit, die Cray benötigte. Bis Mitte der 1970er Jahre änderten sich jedoch die Dinge, und der Cray-1 konnte neuere ICs verwenden und lief immer noch mit respektablen 12,5 ns (80 MHz). Tatsächlich war der Cray-1 etwas schneller als der 8600, da er aufgrund der geringen Größe der ICs erheblich mehr Logik in das System packte.

Obwohl sich das IC-Design weiter verbesserte, wurde die physikalische Größe der ICs weitgehend durch mechanische Grenzen eingeschränkt. Die resultierende Komponente musste groß genug sein, um in ein System eingelötet zu werden. Dramatische Verbesserungen der Dichte waren möglich, wie die rasche Verbesserung des Mikroprozessordesigns zeigte, aber für den von Cray verwendeten IC-Typ, der einen sehr kleinen Teil einer vollständigen Schaltung darstellt, war das Design auf einem Plateau. Um eine weitere 10-fache Leistungssteigerung gegenüber dem Cray-1 zu erzielen, dem Ziel, das Cray anstrebte, müsste die Maschine komplexer werden. Also wandte er sich erneut einer 8600-ähnlichen Lösung zu, verdoppelte die Taktrate durch erhöhte Dichte, fügte mehr dieser kleineren Prozessoren zum Basissystem hinzu und versuchte dann, das Problem zu lösen, Wärme aus der Maschine zu holen.

Ein weiteres Designproblem war die zunehmende Leistungslücke zwischen Prozessor und Hauptspeicher. In der Ära des CDC 6600 lief der Speicher mit der gleichen Geschwindigkeit wie der Prozessor, und das Hauptproblem bestand darin, Daten in ihn einzuspeisen. Cray löste dieses Problem, indem er dem System zehn kleinere Computer hinzufügte, die es ihnen ermöglichten, den langsameren externen Speicher (Festplatten und Bänder) zu verarbeiten und Daten in den Speicher zu “spritzen”, wenn der Hauptprozessor ausgelastet war. Diese Lösung bot keine Vorteile mehr; Der Speicher war groß genug, dass ganze Datensätze eingelesen werden konnten, aber die Prozessoren liefen so viel schneller als der Speicher, dass sie oft lange auf das Eintreffen von Daten warteten. Das Hinzufügen von vier Prozessoren verschlimmerte dieses Problem nur.

Um dieses Problem zu vermeiden, wurden der neu gestaltete Bankspeicher und zwei Registersätze (die B- und T-Register) durch einen 16-KWord-Block des schnellstmöglichen Speichers mit der Bezeichnung a ersetzt Lokaler Speicher, kein Cache, der die vier anhängt Hintergrundprozessoren dazu mit separaten Hochgeschwindigkeitsrohren. Dieser lokale Speicher wurde von einem dedizierten Benutzer mit Daten versorgt Vordergrundprozessor welches wiederum über einen Gbit / s-Kanal pro CPU mit dem Hauptspeicher verbunden war; Im Gegensatz dazu hatten X-MPs 3 für 2 gleichzeitige Ladevorgänge und ein Geschäft, und Y-MP / C-90s hatten 5 Kanäle, um den von Neumann-Engpass zu vermeiden. Es war die Aufgabe des Vordergrundprozessors, den Computer zu “betreiben”, den Speicher zu verwalten und die mehreren Kanäle im Hauptspeicher effizient zu nutzen. Es trieb die Hintergrundprozessoren an, indem es die Anweisungen übergab, die sie über acht 16-Wort-Puffer ausführen sollten, anstatt die vorhandenen Cache-Pipes an die Hintergrundprozessoren zu binden. Moderne CPUs verwenden ebenfalls eine Variation dieses Designs, obwohl der Vordergrundprozessor jetzt als der bezeichnet wird Lade- / Lagereinheit und ist keine vollständige Maschine für sich.

Die Hauptspeicherbänke wurden in Quadranten angeordnet, auf die gleichzeitig zugegriffen werden konnte, sodass Programmierer ihre Daten über den Speicher verteilen konnten, um eine höhere Parallelität zu erzielen. Der Nachteil dieses Ansatzes ist, dass die Kosten für die Einrichtung des Scatter / Gather-Einheit im Vordergrund war der Prozessor ziemlich hoch. Schrittkonflikte, die der Anzahl der Speicherbänke entsprechen, erlitten einen Leistungsverlust (Latenz), wie er gelegentlich bei Power-of-2-FFT-basierten Algorithmen auftrat. Da der Cray 2 einen viel größeren Speicher als der Cray 1 oder X-MP hatte, konnte dieses Problem leicht behoben werden, indem einem Array ein zusätzliches nicht verwendetes Element hinzugefügt wurde, um die Arbeit zu verteilen.

Verpackte Leiterplatten und neue Designideen[edit]

Frühe Cray-2-Modelle entschieden sich bald für ein Design mit großen Leiterplatten, die mit ICs gefüllt waren. Dies machte es extrem schwierig, sie zusammenzulöten, und die Dichte reichte immer noch nicht aus, um ihre Leistungsziele zu erreichen. Die Teams arbeiteten ungefähr zwei Jahre an dem Design, bevor sogar Cray selbst “aufgab” und entschied, dass es am besten wäre, wenn sie das Projekt einfach absagen und alle entlassen würden, die daran arbeiten. Les Davis, Crays ehemaliger Design-Mitarbeiter, der im Cray-Hauptquartier geblieben war, entschied, dass dies mit niedriger Priorität fortgesetzt werden sollte. Nach einigen kleinen Personalbewegungen ging das Team weiter wie bisher.

Typisches Logikmodul, das die enge Packung zeigt. Die Pogo-Pins, die die Karten miteinander verbinden, sind die goldfarbenen Stäbe zwischen den ICs.

Sechs Monate später hatte Cray seinen “Eureka” -Moment. Er rief die Hauptingenieure zu einem Treffen zusammen und präsentierte eine neue Lösung für das Problem. Anstatt eine größere Leiterplatte herzustellen, würde jede “Karte” stattdessen aus einem 3-D-Stapel von acht bestehen, der in der Mitte der Leiterplatten mit Stiften verbunden ist, die von der Oberfläche abstehen (bekannt als “Pogos” oder “Z-Stifte”) “). Die Karten wurden direkt übereinander gepackt, so dass der resultierende Stapel nur etwa 3 Zoll hoch war.

Mit dieser Dichte konnte kein herkömmliches luftgekühltes System funktionieren. Es war zu wenig Platz für Luft zwischen den ICs. Stattdessen würde das System in einen Tank mit einer neuen inerten Flüssigkeit von 3M, Fluorinert, getaucht. Die Kühlflüssigkeit wurde unter Druck seitlich durch die Module gedrückt, und die Strömungsrate betrug ungefähr 1 Zoll pro Sekunde. Die erhitzte Flüssigkeit wurde unter Verwendung von Kühlwasserwärmetauschern gekühlt und in den Haupttank zurückgeführt. Die Arbeiten an dem neuen Design begannen 1982, einige Jahre nach dem ursprünglichen Startdatum.

Währenddessen wurde der Cray X-MP unter der Leitung von Steve Chen im Cray-Hauptquartier entwickelt und sah so aus, als würde der Cray-2 ernsthaft um sein Geld kämpfen. Um dieser internen Bedrohung sowie einer Reihe neuerer japanischer Cray-1-ähnlicher Maschinen zu begegnen, wurde das Cray-2-Speichersystem sowohl hinsichtlich der Größe als auch der Anzahl der “Pipes” in die Prozessoren erheblich verbessert. Als die Maschine schließlich 1985 ausgeliefert wurde, waren die Verzögerungen so lang, dass ein Großteil ihrer Leistungsvorteile auf den schnelleren Speicher zurückzuführen war. Der Kauf der Maschine war nur für Benutzer mit großen Datenmengen sinnvoll.

Der erste ausgelieferte Cray-2 verfügte über mehr physischen Speicher (256 MWord) als alle zuvor ausgelieferten Cray-Maschinen zusammen. Die Simulation wurde von einem 2-D-Bereich oder grobem 3-D-Bereich in einen feineren 3-D-Bereich verschoben, da für die Berechnung kein langsamer virtueller Speicher erforderlich war.

Verwendungen und Nachfolger[edit]

Der Cray-2 wurde hauptsächlich für die US-amerikanischen Verteidigungs- und Energieministerien entwickelt. Verwendet wurden in der Regel für die Atomwaffenforschung oder die ozeanografische (Sonar-) Entwicklung. Der erste Cray-2 (Seriennummer 1) wurde jedoch im Nationalen Rechenzentrum für Magnetfusionsenergie des Lawrence Livermore National Laboratory für nicht klassifizierte Energieforschung verwendet. Es fand auch seinen Weg in zivile Behörden (wie das NASA Ames Research Center), Universitäten und Unternehmen weltweit. Beispielsweise verwendeten Ford und General Motors den Cray-2 sowohl zur Verarbeitung komplexer Finite-Elemente-Analysemodelle von Karosserien als auch zur Durchführung virtueller Crashtests von Karosseriekomponenten vor der Produktion.

Der Cray-2 wäre vom Cray-3 abgelöst worden, aber aufgrund von Entwicklungsproblemen wurde nur ein einziger Cray-3 gebaut und nie bezahlt. Der spirituelle Nachkomme des Cray-2 ist der Cray X1, der von Cray angeboten wird.

Vergleich mit späteren Computern[edit]

Im Jahr 2012 präsentierte Piotr Luszczek (ein ehemaliger Doktorand von Jack Dongarra) Ergebnisse, die zeigten, dass ein iPad 2 die historische Leistung des Cray-2 auf einem eingebetteten LINPACK-Benchmark erreichte.[1]

Aufgrund der Verwendung von Flüssigkeitskühlung erhielt der Cray-2 den Spitznamen “Bubbles”, und allgemeine Witze rund um den Computer bezogen sich auf dieses einzigartige System. Zu den Gags gehörten “No Fishing” -Schilder, Pappdarstellungen des Loch Ness-Monsters, das aus dem Wärmetauschertank steigt, Plastikfische im Wärmetauscher usw.[citation needed] Der Stromverbrauch des Cray-2 betrug 150–200 kW. Untersuchungen, die Anfang der neunziger Jahre am Lawrence Livermore National Laboratory durchgeführt wurden, zeigten, dass der perfluorierte Polyether, der zum Kühlen von Cray-2-Schaltkreisen verwendet wird, in begrenztem Umfang unter Bildung des extrem giftigen Gases Perfluorisobutylen zerfällt.[2] Zu der Zeit hatte Cray ein Poster erstellt, das die transparente “Blasenkammer” zeigte, durch die die Kühlflüssigkeit für einen visuellen Effekt geleitet wurde, wobei das gleiche Material auf dem Boden glitzerte – der Witz war, dass, wenn dies tatsächlich geschah, die Einrichtung müsste evakuiert werden.[3] Der Hersteller der Flüssigkeit entwickelte einen Gaswäscher, der in Übereinstimmung mit der Pumpe platziert werden konnte, um dieses toxische Abbauprodukt katalytisch abzubauen.

Jeder vertikale Stapel von Logikmodulen befand sich über einem Stapel von Leistungsmodulen, die 5-Volt-Sammelschienen versorgten, von denen jede etwa 2200 Ampere lieferte. Der Cray-2 wurde von zwei Motorgeneratoren angetrieben, die 480 V dreiphasig aufnahmen.

Siehe auch[edit]

Verweise[edit]

  1. ^ Larabel, Michael (16. September 2012). “Apple iPad 2 so schnell wie der Cray-2 Super Computer”. Abgerufen 19. Februar 2015.
  2. ^ Kwan, J. Kelly, R., Miller G. Präsentation auf der American Industrial Hygiene Conference in Salt Lake City, UT, Mai 1991
  3. ^ Kelly, RJ, persönliche Erfahrung[unreliable source?]

Externe Links[edit]


after-content-x4