ResearchDataZone JoyceNijkamp,UvA([email protected]) PeterHinrich,SURFnet([email protected]) ITprojectenvooronderzoeksdomein@UvA • ProjectenporAolio2016Onderzoeksdomein -GerichtoprealisaLereferenLearchitectuurdomeinOnderzoek(in ontwikkeling). • Voorbeeldvanlopendeprojecten: -ResearchDataZone(voorheen:ScienceDMZ) -ScienceGateways -ResearchDataManagement -ImplementaLeUvA-HvADatarepository -Opslaginfrastructuurarchitectuur(SDS,iRODS) -ResearchWorkspaces/VRE -FederaLevetoegangtotResearchITeninfravanUvAenHvA -ReferenLearchitectuurRDM(landelijk) Uitgangspuntenarchitectuurontwikkelingvoor Onderzoek@UvA UitgangspuntentyperendvoordomeinOnderzoek: • Co-crea7e.Driver:Dynamiekinonderzoekentechnologie,ExperLse -Onderzoekers,IM,Architecten,ITsuppliers,andereinstellingen -VanuitkerncompetenLes -VanprojectkaarttotimplementaLe • Landelijkdraagvlak.Driver:OnderzoekisinternaLonaal,orgoversLjgend -SURFpartnervoordisseminaLe,afstemming -Veellandelijkearchitectuur–iniLaLeven -Architecturenwordenblauwdruk=>opnameinHORA WatiseenResearchDataZone(RDZ)? • WatiseenRDZ? TheRDZisapor.onofthenetwork,builtatornearthecampusorlaboratory'slocal networkperimeterthatisdesignedsuchthattheequipment,configura.on,andsecurity policiesareop.mizedforhigh-performancescien.ficapplica.onsratherthanfor general-purposebusinesssystemsor“enterprise”compu.ng. • KenmerkenvaneenRDZ Ø Voorgrotedatasetsen/ofwaarbeveiligingbelangrijkaspectis Ø GeautomaLseerdededicatedverbinding Ø Deonderzoekerheeadelead Ø Beleidmagafwijkenvanbeleidregulierenetwerk(firewallsed) Ø TrustedparLes,gebaseerdopafsprakenenprotocollen FaseringRDZdienst • Einddoel:SoawareDefinedoplossing(automaLsch,op initaLevanonderzoeker) • Eerstestap:PilotsomRDZconcepttedemonstrerenmetvast ingesteldeoplossingen • Daarna:verderautomaLseren HetResearchDataZone(RDZ)pilotproject • KenmerkenvandeAanpak -Co-creaLemetwetenschap -Gesprekkenmetfaculteiten.Daarkwambehoeaenaarvoren: traagnetwerkgrotedatastromen,vertrouwelijkheidniet gewaarborgd -Onderzoekerisopdrachtgever -PilotsgewijsbijinnovaLeprojecten,Learningbydoing -AansluiLngoplandelijke/SURFontwikkelingen • Pilotdeelname: -Humani.es:texthistorici -LifeSciences:publiekenprivaat(SILS,IBED,Seedvalley) Inhoudvandepilots • HumaniLes Datauitwisselingtussen -UvA–UU-SURFsara(metHPCnode)-KB(databron). Ø Datahebbenhoogvolume(xTB)enzijnsomsvertrouwelijk (auteursrecht) • Lifesciences: DatauitwisselingtussenSILS–Enza–SURFsara(metHPCnode) Ø Datahebbenhoogvolume(xTB)endatabronnenzijn vertrouwelijk(concurenLegevoelig) Vervolgstappen 1. Inkaartbrengenusecasesenrequirements(ongoing) 2. Uitnodigingvoorsamenwerkingmetandereuniversiteiten diemetzelfdeprobleemzigen(ongoing) 3. Architectuurontwerp 4. PilotimplementaLe 5. ImplementaLeadviesRDZalscentraledienstvooronderzoek Aanleiding:Dataomvangwordtgroter Netwerkenwordensneller Dataomvangneemttoeenwordtprobleemin steedsmeerdisciplines. SteedsmeergrotearchievenvoorcommuniLes Radioastronomie Klimaatdata Satellietdata DNAsequencing BeperkingenvanTCP • VeelresearchdatatransfersgebruikenTCP • Maximaledoorvoerisbeperkt,packetlossheeagroteinvloed • PacketlosswordtgezienalscongesLe,envermindertdoorvoer MetdankaanEliDart(Esnet)enToniHey(STFC) BeperkingenvanTCP LocalArea Maximalethroughput inMbit/s NaLonalArea (RUG-Unimaas) MetroArea (VUMC-AMC) RTTinms FirewallIssues • • • • Beperktinmaximalethroughput Groteaantallenkleineflows Kleinebuffers Meerlatency • Nietgeschiktvoor‘exoLsche’protocollen OpLmaliserenvoorgrotedatastromen • • • • Groterepacketsize(jumboframes) Anderenetwerkprotocollen(UDP) Anderetransferprotocollen(GridFTP) Accesscontrolipvfirewall Maatwerk.... ResearchDataZone ResearchDataZone • Netwerkzonevoorresearchdata • GeopLmaliseerdvoordatadelen& -transport • Gestandaardiseerdeoplossingen • PolicyFramework • ToegangsrestricLeenAAI ScienceDMZarchitectuur,metdankaanEliDart(Esnet) Nietalleenvoordeultrahigh-endtoepassingen! InternaLonaal 15:00parallelsessie: “Campusinfrastructuurenbigdatatransfer”