Grid: van wetenschap naar e-Science Jan Just Keijser, Nikhef [email protected] • David Groep, NIKHEF Unix Professionals Lezing 4 Oktober 2010 Graphics: Real Time Monitor, Gidon Moont, Imperial College London, see http://gridportal.hep.ph.ic.ac.uk/rtm/ Voordat ik begin... • Werkzaam in de ICT sinds 1989 (Pink Elephant!) • Vanaf 2005 in dienst bij Nikhef: Nationaal Instituut voor Kern- en Hoge Energie Fysica • Eerst als 'System Integrator' voor het VL-e project: Virtual Laboratory for e-Science • Tegenwoordig 'Grid Systems Architect' voor het BiG Grid project • BIG = 'Budget voor Investeringen in Grootschalige onderzoeksfaciliteiten' • Gebruiker en voorstander van Open Source software sinds 1994 Slide courtesy: GridCafe.org and Bob Jones, EGEE (www.eu-egee.org) “If the customer calls it a grid, it is a grid” • De naam “Grid” is gekozen vanwege de analogie met het electriciteitsnetwerk (“power grid”) (Foster & Kesselman 1997) • Visie: “rekenkracht uit de muur”, net zoals je de stekker van een broodrooster in het stopcontact stopt • Dit idee is al vrij oud: ‘distributed computing’, ‘metacomputing’ • Gebaseerd op : ‘Web 2.0’, ‘Virtualisation’, ‘Cloud Computing’ Waarom hebben een Grid nodig? Wetenschappers hebben behoefte aan meer en meer rekenkracht en data-opslag. De hoeveelheid meetgegevens per experiment neemt exponentieel toe Referentie: de Bijbel 5 MByte X-ray image 5 MByte/image Functional MRI 1 GByte/day Bio-informatics databases 500 GByte elk Refereed journal papers 1 TByte/jr Satellite world imagery 5 TByte/jr US Library of Congress Internet Archive 1996-2002 Particle Physics 2005 Particle Physics Today: LHC 20 TByte 100 TByte 1 PByte/jr 20 PByte/jr 1 Petabyte = 1 000 000 000 Megabyte Van wetenschap naar e-Science • Het gebruik van computers en IT binnen experimenten neemt nog steeds toe • Sommige experimenten zouden zonder computers niet eens mogelijk zijn • Doordat IT een integraal onderdeel van het experiment wordt verandert het experiment zelf ook Wetenschap wordt e-Science CERN, Where the web was born … • Bij vorige HEP experimenten waren honderden wetenschappers en duizenden technici betrokken, lokaal en op afstand • Gebruikers op het CERN, opgericht in 1954 als de eerste internationale organisatie in Europa, wilden wereldwijd gegevens met elkaar delen • Deze behoefte bracht Berners-Lee op het idee om ‘World Wide Web’ te creëren 1989/1990 (nu 20 jr geleden!) Tim het in LHC Computing Large Hadron Collider • ‘the worlds largest microscope’ quarks • Zoektocht naar de fundamentele bouwstenen van de natuurkunde • 27 km omtrek • CERN, Genève 10-15 m atom nucleus ~ 20 PByte data per jaar, ~ 60 000 moderne PCs ! De ATLAS detector Ballon (30 Km) • Signal/Background 10-9 Stapel CDs met 1 jaar LHC data! (~ 20 Km) • Data volume (hoge frequentie) X (groot aantal kanalen) X (4 experimenten) 20 PetaBytes nieuwe data per jaar ● Concorde (15 Km) • Rekenkracht (event complexiteit) X (aantal events) X (duizenden gebruikers) 60.000 processoren ● Mt. Blanc (4.8 Km) Voorbij het Web: Grids en e-Science Work regardless of geographical location, interact with colleagues, share and access data The GRID: networked data processing centres and ”middleware” software as the “glue” of resources (computers, disks, mass storage). Scientific instruments, libraries and experiments provide huge amounts of data based on: [email protected] Hoe werkt het Grid? • Gebaseerd op geavanceerde Grid Middleware • Deze middleware zoekt automatisch de gegevens op die de wetenschapper nodig heeft, en de rekenkracht om deze gegevens te analyseren. • De middleware verdeelt ook de taken over de verschillende resources en regelt de beveiliging, accounting, monitoring en nog veel meer. Slide courtesy: GridCafe.org and Bob Jones, EGEE (www.eu-egee.org) Grids in e-Science Grid betekent ‘meer dan één' Meer dan één lokatie Meer dan één computer Meer dan één wetenschapsgebied Meer dan … Meer dan één organisatie National Grid Initiatives & European Grid Initiative • Op nationaal niveau worden een grid infrastructuur aangeboden voor nationale en internationale gebruikers door de NGI's • Het 'European Grid Initiative' coördineert de inspanningen van de verschillende NGI's en bewaakt de interoperabiliteit • Circa 40 Europese NGI's aangesloten, met links naar Zuid Amerika en Taiwan • Hoofdkantoor van EGI staat op het Science Park in Amsterdam Cross-domain en globale e-Science grids De gemeenschappen die tezamen het grid vormen: • Worden niet centraal/hierarchisch beheerd, • Werken (tijdelijk) samen om een specifiek probleem op te lossen, • Nemen voor deze samenwerking (een deel van) hun resources mee, • En delen deze resources naar eigen inzicht en op hun eigen voorwaarden. Grid Infrastructuur Om deze doelen te realiseren is een persistente infrastructuur nodig, gebaseerd op standaarden Hardware clusters, supercomputers, databases, mass storage, visualisatie, netwerken Beveiliging en AAA authentication, authorization, accounting, billing en beveiliging Software execution services, workflow, resource information systems, database access, storage management, meta-data Applications user support, ICT experts met domein kennis Nikhef (NDPF) 2500 2000 160 processor cores TByte disk Gbps netwerk SARA (GINA+LISA) 4800 1800 2000 160 processor cores PByte disk PByte tape Gbps netwerk RUG-CIT (Grid) Philips Research Ehv 1600 100 1 processor cores TByte disk Gbps netwerk 120 8800 10 processor cores GByte disk Gbps netwerk Authenticatie: Grid certificates • • • • • • • Grid infrastructuur maakt geen gebruik van usernames en passwords Voor authenticatie wordt gebruik gemaakt van een Public Key Infrastructure (PKI) met X.509 certificates: grid certificates In Nederland worden grid certificaten uitgegeven en beheerd door DutchGrid: Enkele onderzoeksinstituten zijn aangesloten bij TERENA: Trans-European Research and Education Networking Association TERENA is een 'web of trust' waarbij aangesloten instituten elkaars logins vertrouwen Via de 'TERENA Online Certificate Store' wordt dan een (geautomatiseerd) vertaalslag gemaakt van de gebruikersnaam en wachtwoord van de medewerker van een instituur naar een grid certificate. Dit vergemakkelijkt het beheer van grid certificates aanzienlijk Authenticatie: Grid proxies • • • • Soms is het nodig om login gegevens (credentials) door te geven aan een dienst Gebruikers delegeren hun credentials met behulp van een grid proxy Een grid proxy(RFC3820, RFC5820) is een “verwaterde” versie van een grid certificaat met een zeer beperkte geldigheid (12 uur tot maximaal 1 week) Een grid proxy wijkt een tikkeltje af van een normaal X.509 certificaat: – Normaliter zijn alleen certificaten getekend door Certificate Authorities (CA's) geldig. Bij een grid proxy tekent de gebruiker zelf een nieuw, tijdelijk certificaat. De grid middleware moet hiermee overweg kunnen – De naam van een grid proxy moet afgeleid zijn van de naam van het grid certifcaat van de gebruiker, bijv subject : /O=dutchgrid/O=users/O=nikhef/CN=Jan Just Keijser/CN=proxy issuer : /O=dutchgrid/O=users/O=nikhef/CN=Jan Just Keijser identity : /O=dutchgrid/O=users/O=nikhef/CN=Jan Just Keijser type : full legacy globus proxy strength : 1024 bits path : /tmp/x509up_u7651 timeleft : 11:59:40 Authenticatie: Robot certificaten • • • • • Voor bepaalde diensten kunnen ook robot certificates gebruikt worden. Gebruikers krijgen dan een gebruikersnaam en wachtwoord voor een Grid Portal Deze portal maakt gebruik van een hardware security device voor de authenticatie richting het grid Hierbij worden alle gebruikers van de portal vertaald naar een enkel grid certificate. Daarom mag slechts een beperkt aantal diensten (programma's) aangeboden worden via een portal Dutchgrid/Nikhef was één van de eerste organisaties die robot certificaten ondersteunen: – Op basis van Aladdin eToken – Beschikbaar voor Linux, Windows en Mac OS – Zowel voor robot certificaten als voor gebruikers Authorisatie: Virtual Organisations • • • • • Om gebruik te maken van een grid infrastructuur dient een wetenschapper (gebruiker) lid te zijn van een Virtual Organisation (VO) VO's kunnen op nationale en internationale schaal bestaan Internationale VO's: – /atlas – /lhcb – /enmr.eu – /ops Nationale VO's: – /lsgrid – /ncf – /vlemed Binnen een VO bestaan meerdere rollen en groepen – /Role=VO-admin : voor VO administratie – /Role=SGM : om software installaties uit te kunnen voeren – /lsgrid/Nijmegen – /lsgrid/Wageningen Hoe draai ik een programma op het grid Hoe draai ik een programma op het grid Workload Management System Compute Element Grid cluster NL 1 BE Grid Information System UK Gebruiker delegeert credentials & submit job Hoe draai ik een programma op het grid Workload Management System Compute Element Grid cluster NL 2 3 BE Grid Information System UK WMS haalt info uit information system & “bemiddelt” voor de job Hoe draai ik een programma op het grid Compute Element Workload Management System Grid cluster NL 4 BE 5 Grid Information System UK WMS stuurt job naar een site CE stuurt job naar een lokaal cluster Hoe draai ik een programma op het grid Compute Element Workload Management System Grid cluster NL 8 7 BE 6 Grid Information System UK Job status gaat terug naar CE, WMS Gebruiker vraagt job status op en haalt output op Image sources: VL-e Consortium Partners Virtual Laboratory for e-Science Data integration voor genomics, proteomics, etc. analysis Timo Breit et al. Swammerdam Institute of Life Sciences Medical Imaging en fMRI Avian Alert en FlySafe Willem Bouten et al. UvA Institute for Biodiversity Ecosystem Dynamics, IBED Silvia Olabarriaga et al. AMC and UvA IvI Bram Koster et al. LUMC Microscopic Imaging group Molecular Cell Biology en 3D Electron Microscopy Image sources: BiG Grid Consortium Partners BiG Grid SCIAMACHY Wim Som de Cerff et al. KNMI MPI Nijmegen: Psycholinguistics LOFAR: LOw Frequency ARray radio telescoop Uitdagingen: schaalvergroting Grid betekent vooral schaalvergroting: • Gedistribueerd rekenen op vele, verschillende computers, • Gedistribueerde opslag van gegevens, • Grote hoeveelheden data (Giga-, Tera-, Petabytes) • Grote aantallen bestanden (miljoenen). Dit levert “leuke” problemen op: • “even” inloggen op afstand is er op het grid niet altijd bij, • Het debuggen van een programma is een uitdaging, • Gewone filesystems verslikken zich in miljoenen bestanden, • Gegevens opslaan is één ding, gegevens zoeken en terugvinden blijkt echter nog lastiger. Uitdagingen: beveiliging Waarom is beveiliging zo belangrijk in een wetenschappelijk grid? • Als beheerder van een grid site laat je toe dat relatief onbekenden programma's op jouw computers draaien, • Al deze computers zijn verbonden aan het internet met supersnelle netwerken, Hierdoor is het grid een potentieel erg gevaarlijke dienst op internet http://www.biggrid.nl/ http://www.nikhef.nl/grid/