211service.com
Der Kampf um die Erhaltung der Daten eines alten Beschleunigers
Der Large Electron Positron Collider (LEP), ein Teilchenbeschleuniger an der Schweizer Franco-Grenze bei Genf, war bei seiner Fertigstellung 1989 eines der großen Wunder der Ingenieurskunst.
Die Maschine wurde in einem Ringtunnel mit einem Umfang von 29 Kilometern und etwa 100 Metern unter der Erde gebaut. Es beschleunigte gegenläufig rotierende Elektronen- und Positronenstrahlen auf Energien von 45 GeV.
Zunächst zerschmetterte es diese Strahlen, um Z-Bosonen zu erzeugen, Teilchen mit einer Masse von 91 GeV. Später wurde der Beschleuniger aufgerüstet, um, wie sich herausstellte, erfolglos nach dem schwer fassbaren Higgs-Boson mit Energien von bis zu 209 GeV zu suchen. Aber im Jahr 2000 wurde es stillgelegt und abgebaut.
Heute ist LEP für die meisten Physiker eine ferne Erinnerung, die sich jetzt auf den Nachfolger von LEP konzentrieren. In seinem riesigen unterirdischen Tunnel hat das CERN den Large Hadron Collider gebaut, den derzeit leistungsstärksten Beschleuniger der Welt, der letzten Monat in Betrieb genommen wurde.
Aber Physiker haben ein Problem mit dem Erbe von LEP. Während seiner Lebensdauer erzeugten die vier Experimente, die Daten vom Beschleuniger nahmen, 100 TB an Informationen. Mit diesen Experimenten verbundene Physiker arbeiten noch an etwa 20 Arbeiten. Nach deren Veröffentlichung werden die Daten eingefroren.
Diese Experimente können nicht wiederholt werden, und daher sind die von ihnen erzeugten Daten einzigartig. Es steht außer Frage, dass diese Daten aufbewahrt werden müssen. Die Frage ist, wie.
Heute skizzieren Andre Holzner vom CERN und einige Freunde die Bemühungen um die Erhaltung der Daten von LEP. Es wird derzeit auf einem Magnetbandsystem am CERN namens CASTOR gespeichert. Die Idee ist, dass bei jedem Medien-Upgrade die LEP-Daten übertragen werden.
Das ist keine große Sache angesichts des Geldes und der Arbeitsstunden, um die Arbeit zu erledigen: Obwohl 100 TB 1989 eine Menge Daten waren, ist dies nur ein Rückgang im Vergleich zur Leistung des LHC, der bald jeden Tag ungefähr so viel produzieren wird.
Schwieriger zu bewahren ist die Software, die notwendig ist, um die Daten zu verstehen. Ohne die dazugehörige Software zum Auslesen und Analysieren sind Daten eindeutig nutzlos, sagen Holzner und Co.
Das Problem ist, dass sich die Computerkenntnisse ändern. Während ein Großteil der ursprünglichen LEP-Software in Fortran geschrieben wurde, liegt der Schwerpunkt heute auf C++. Wie das richtige Fortran-Know-how für zukünftige Generationen erhalten werden kann, ist nicht klar.
Ein weiteres Problem besteht darin, dass ein Großteil der zur Analyse der Daten verwendeten High-Level-Software – benutzerspezifischer Analysecode und Plottermakros – nie in einer zentralen Datenbank gespeichert wurde. Stattdessen wurde es in persönlichen Verzeichnissen aufbewahrt, die ein Jahr nach Verlassen eines Labors gelöscht werden. Das ist jetzt verloren.
Künftige Forscher werden also zwar auf die Rohdaten zugreifen können, aber möglicherweise nie genau wissen, wie sie in die Form verarbeitet wurden, die in wissenschaftlichen Publikationen erscheint.
Besorgniserregender als all dies ist die Nachricht, dass einige der Originaldaten verloren gegangen sind, wahrscheinlich aufgrund von Verschleiß der Speicherbänder aufgrund von Übernutzung. Diese Daten können niemals wiederhergestellt werden.
Holzner und Co. versuchen, einige dieser Probleme zu beschönigen, indem sie sagen, dass es immer noch einige Kollaborationsmitglieder gibt, die dies tun, wenn die LEP-Daten erneut analysiert werden müssen.
Das ist nicht ganz beruhigend. Die Botschaft lautet: Wenn Sie die LEP-Daten studieren möchten, haben Sie Zeit, bis die aktuelle Generation von Kollaborationsmitgliedern in den Ruhestand geht. Danach bist du auf dich allein gestellt.
Ref: arxiv.org/abs/0912.1803 : Datenerhaltung bei LEP