informationstechnik Ein Job für vier Millionen Rechner
Um Investitionen für neue Supercomputer zu umgehen, setzen Informatiker jetzt auf das Internet
Manchmal ist es schon beeindruckend, wie groteske Ideen aus einer Science-Fiction-Geschichte irgendwann Gestalt annehmen. Im ersten Band seiner Romanserie beschreibt Douglas Adams das Superhirn Deep Thought, das die berühmte letzte Antwort „42“ ausspuckt, zu der ihm leider die Frage entfallen ist. Es verspricht den Milchstraßenbewohnern, einen neuen Rechner zu konstruieren. „Einen Computer, der die Frage zur letzten Antwort berechnen kann, einen Computer von solch unendlicher und subtiler Komplexität… Und er soll heißen: Erde.“
Jetzt sind die Bauarbeiten zu diesem ultimativen Computer in vollem Gange. Weitgehend unbemerkt von der Öffentlichkeit, arbeiten Informatiker und Ingenieure an einer Technik, die vielleicht nicht den ganzen Planeten, aber zumindest das Internet in einigen Jahren in einen globalen Supercomputer verwandeln soll: „Grid Computing“ (grid steht im Englischen für ein Gitternetz, aber auch für das Stromnetz). Es könnte die nächste bahnbrechende Anwendung in der noch jungen Geschichte des Netzes sein.
Denn Rechenkraft ist nach wie vor knapp und wird es vermutlich bleiben. Zwar werden die Supercomputer von Jahr zu Jahr stärker, doch wachsen die Datenberge in Wissenschaft und Wirtschaft mindestens genauso schnell. So sendet der Umweltsatellit Envisat täglich den Inhalt von 770 CDs zur Erde. Weil die Dienste der Superrechner aber für viele Anwendungen kaum bezahlbar sind, muss eine andere Lösung her. Die bietet nun das Grid Computing. „Hier wird ein Rechenjob von einem Computer in Empfang genommen und in Portionen aufgeteilt, die dieser dann an viele andere Rechner im Grid weiterschickt“, erklärt Dietmar Erwin vom Forschungszentrum Jülich. Die Arbeitsrechner kauen dann die ihnen zugeteilten Bits durch, schicken ihr Teilergebnis an den Versender zurück, der das Ganze wieder zusammensetzt und dem Auftraggeber übermittelt.
Dass dieses „verteilte Rechnen“ die Leistung eines einzigen Supercomputers simulieren kann, zeigen Projekte wie fightaids@home oder seti@home, die radioastronomische Daten nach Signalen von Außerirdischen durchforsten. Hierbei werden gewaltige Datenmengen über das Internet an Millionen von PCs verschickt. Wenn diese gerade nicht genutzt werden, rechnen eigens entwickelte Bildschirmschonerprogramme ihre Aufgabe durch. „Das seti@home-Netzwerk hat über vier Millionen Teilnehmer mit einem PC. Damit wäre es in der Top-500-Liste der Supercomputer auf Platz zwei“, sagt Werner Ederer, bei IBM Programm-Manager für die neue Technik.
Wie schon beim www kam der erste Impuls für das Grid Computing aus der Wissenschaft. Klimaforscher wollen den globalen Kohlendioxid-Kreislauf detaillierter nachvollziehen, Biologen die ungeheuer komplexe Faltung von Proteinen verstehen. Wo chronisch schmale Forschungsbudgets den Kauf immer größerer Superrechner verboten, musste man aus den vorhandenen Mitteln das Beste herausholen.
Wenn das Heer der PCs erwacht
Nun könnte sich die Erfolgsgeschichte analog zum www wiederholen. Die Wirtschaft steigt in die neue Technik ein. Erster Schritt: IBM hat vergangene Woche die Software Globus angekündigt. Damit lassen sich kommerzielle Rechengitter aufbauen, die Unternehmen mit besonders großem Datenhunger nutzen können – Autohersteller und Flugzeugbauer, die Windkanalstudien und Crashtests analysieren, oder Finanzunternehmen, die sich durch Börsendaten pflügen wollen.
Viele Unternehmen haben ihren Superrechner bereits im Haus, ohne es zu ahnen. Es ist das Heer ihrer Büro-PCs. Bei IBM selbst dürfte das eine Drittelmillion sein, deren maximale Leistung acht ASCI-White-Supercomputern entspricht (die derzeitige Nummer vier der Top 500). Was liegt also näher, als den Data-Mining-Job oder den Crashtest künftig in ein firmeninternes Grid zu schicken, das etwa von IBM installiert und gewartet wird? Die Firma wirbt bereits damit, dass Prozessorleistung das fünfte Grundversorgungsgut der modernen Zivilisation werde neben Wasser, Strom, Wärme und Telefon.
Das funktioniert aber nur, wenn die Technik so einfach zu nutzen ist wie ein Wasserhahn oder ein Stecker und verlässlich und unabhängig von speziellen Computerplattformen arbeitet. Bisherige Grids wie das Jülicher Unicore oder seti@home basieren teilweise noch auf selbst gestrickter Software mit eigenen Formaten. Das künftige Grid Computing baut dagegen auf internationalen Standards auf, die unter dem Begriff Web Services zusammengefasst werden, ergänzt um die so genannte Open Grid Services Architecture. Sie kodieren die Teile eines Rechenjobs so, dass sie unabhängig vom Betriebssystem eines speziellen Computers dessen Chip nutzen und auf Authentizität überprüft werden können. Ein Biotechniker in Heidelberg, der eine komplizierte Proteinfaltung berechnen will, könnte den sechsten Knick des Moleküls von einem Computer in Rio erledigen lassen, während ein Rechenzentrum in Sydney den Anfang des Proteins kalkuliert.
Wer aus dem Asienurlaub allerdings einmal per Internet nach Hause telefoniert hat, um ein paar Dollar zu sparen, weiß, dass die Datenpakete auf ihrem Weg durchs Netz nicht immer im selben Tempo vorwärtskommen. Die Folge sind Aussetzer in der Übertragung. Diese Verzögerungen, Latenzzeiten genannt, sind auch für das Grid Computing nicht ganz unerheblich. Bei Strömungssimulationen etwa werden die Teilrechnungen in verschachtelten Schritten ausgeführt: Ein Chip muss wissen, was der andere gerade berechnet. „Wenn hier die Prozessoren räumlich weit voneinander entfernt sind, werden die Latenzzeiten zum Problem“, sagt Holger Marten, Leiter des Grid Computing-Centers in Karlsruhe. Da, wo einfach nur Datenberge der Reihe nach abgearbeitet werden müssen wie bei seti@home, spielten die Verzögerungen hingegen keine Rolle. In dem EU-Projekt Cross Grid untersuchen Marten und andere Forscher deshalb, wie man die Latenzzeiten in den Griff bekommen kann und welche Rechenjobs sich nicht für die neue Technik eignen.
Die ersten echten Rechennetze sind bereits im Aufbau. Die Oxford University hat zusammen mit IBM und der britischen Regierung im vergangenen Oktober das eDiamond-Grid gestartet. Es wird am Ende 100 Krankenhäusern in Großbritannien eine Datenbank mit Mammografien anbieten, die nicht mehr auf einem einzigen Server lokalisiert ist. Ärzte können dann ihre Scans, die sie bei der Brustkrebsvorsorge machen, mit anderen vergleichen, ohne sich sämtliche Daten laden und eine spezielle Software für den Abgleich der Scans installieren zu müssen. Das ganze erinnert ein wenig an dezentrale Musiktauschbörsen wie Kazaa. Tatsächlich sind diese Peer-to-Peer-Netzwerke ja ebenso wie das Grid Computing eine Spielart des verteilten Rechnens – nur mit anderem Zweck.
Auch wer mit Datamining oder Klimamodellen nichts am Hut hat, könnte demnächst auf Grid Computing stoßen: in Form neuer Spielkonsolen, die „gridifiziert“ werden und so die bislang üblichen Entwicklungsschübe überspringen. „Wir können nicht noch 20 Jahre warten, um eine tausendmal stärkere Playstation auf den Markt zu bringen“, sagt Shin’ichi Okamoto, CTO von Sony Computer Entertainment. Über ein Playstation Grid hofft Sony, diesen Sprung in wenigen Jahren machen zu können.
Bis zu einem World Wide Grid dürften noch einige Jahre ins Land gehen. Dann allerdings stünde ein Rechner zur Verfügung, dem man unerhörte Fragen stellen könnte. Vielleicht die, was beim Big Bang wirklich geschah. Wenn den globalen Supercomputer nicht das Schicksal ereilt, das Douglas Adams in Per Anhalter durch die Galaxis vorsieht. Kurz bevor die Erde ihr Ergebnis ausspucken konnte, wurde sie gesprengt – um einem galaktischen Hyperraum-Highway Platz zu machen.
- Datum
- Quelle (c) DIE ZEIT 07/2003
- Versenden E-Mail verschicken
- Empfehlen Facebook, Twitter, Google+
- Artikel Drucken Druckversion | PDF
-
Artikel-Tools präsentiert von:






