Research Data Zone

advertisement
ResearchDataZone
JoyceNijkamp,UvA([email protected])
PeterHinrich,SURFnet([email protected])
ITprojectenvooronderzoeksdomein@UvA
•  ProjectenporAolio2016Onderzoeksdomein
-GerichtoprealisaLereferenLearchitectuurdomeinOnderzoek(in
ontwikkeling).
•  Voorbeeldvanlopendeprojecten:
-ResearchDataZone(voorheen:ScienceDMZ)
-ScienceGateways
-ResearchDataManagement
-ImplementaLeUvA-HvADatarepository
-Opslaginfrastructuurarchitectuur(SDS,iRODS)
-ResearchWorkspaces/VRE
-FederaLevetoegangtotResearchITeninfravanUvAenHvA
-ReferenLearchitectuurRDM(landelijk)
Uitgangspuntenarchitectuurontwikkelingvoor
Onderzoek@UvA
UitgangspuntentyperendvoordomeinOnderzoek:
•  Co-crea7e.Driver:Dynamiekinonderzoekentechnologie,ExperLse
-Onderzoekers,IM,Architecten,ITsuppliers,andereinstellingen
-VanuitkerncompetenLes
-VanprojectkaarttotimplementaLe
•  Landelijkdraagvlak.Driver:OnderzoekisinternaLonaal,orgoversLjgend
-SURFpartnervoordisseminaLe,afstemming
-Veellandelijkearchitectuur–iniLaLeven
-Architecturenwordenblauwdruk=>opnameinHORA
WatiseenResearchDataZone(RDZ)?
•  WatiseenRDZ?
TheRDZisapor.onofthenetwork,builtatornearthecampusorlaboratory'slocal
networkperimeterthatisdesignedsuchthattheequipment,configura.on,andsecurity
policiesareop.mizedforhigh-performancescien.ficapplica.onsratherthanfor
general-purposebusinesssystemsor“enterprise”compu.ng.
•  KenmerkenvaneenRDZ
Ø Voorgrotedatasetsen/ofwaarbeveiligingbelangrijkaspectis
Ø GeautomaLseerdededicatedverbinding
Ø Deonderzoekerheeadelead
Ø Beleidmagafwijkenvanbeleidregulierenetwerk(firewallsed)
Ø TrustedparLes,gebaseerdopafsprakenenprotocollen
FaseringRDZdienst
•  Einddoel:SoawareDefinedoplossing(automaLsch,op
initaLevanonderzoeker)
•  Eerstestap:PilotsomRDZconcepttedemonstrerenmetvast
ingesteldeoplossingen
•  Daarna:verderautomaLseren
HetResearchDataZone(RDZ)pilotproject
•  KenmerkenvandeAanpak
-Co-creaLemetwetenschap
-Gesprekkenmetfaculteiten.Daarkwambehoeaenaarvoren:
traagnetwerkgrotedatastromen,vertrouwelijkheidniet
gewaarborgd
-Onderzoekerisopdrachtgever
-PilotsgewijsbijinnovaLeprojecten,Learningbydoing
-AansluiLngoplandelijke/SURFontwikkelingen
•  Pilotdeelname:
-Humani.es:texthistorici
-LifeSciences:publiekenprivaat(SILS,IBED,Seedvalley)
Inhoudvandepilots
•  HumaniLes
Datauitwisselingtussen
-UvA–UU-SURFsara(metHPCnode)-KB(databron).
Ø  Datahebbenhoogvolume(xTB)enzijnsomsvertrouwelijk
(auteursrecht)
•  Lifesciences:
DatauitwisselingtussenSILS–Enza–SURFsara(metHPCnode)
Ø  Datahebbenhoogvolume(xTB)endatabronnenzijn
vertrouwelijk(concurenLegevoelig)
Vervolgstappen
1.  Inkaartbrengenusecasesenrequirements(ongoing)
2.  Uitnodigingvoorsamenwerkingmetandereuniversiteiten
diemetzelfdeprobleemzigen(ongoing)
3.  Architectuurontwerp
4.  PilotimplementaLe
5.  ImplementaLeadviesRDZalscentraledienstvooronderzoek
Aanleiding:Dataomvangwordtgroter
Netwerkenwordensneller
Dataomvangneemttoeenwordtprobleemin
steedsmeerdisciplines.
SteedsmeergrotearchievenvoorcommuniLes
Radioastronomie
Klimaatdata
Satellietdata
DNAsequencing
BeperkingenvanTCP
•  VeelresearchdatatransfersgebruikenTCP
•  Maximaledoorvoerisbeperkt,packetlossheeagroteinvloed
•  PacketlosswordtgezienalscongesLe,envermindertdoorvoer
MetdankaanEliDart(Esnet)enToniHey(STFC)
BeperkingenvanTCP
LocalArea
Maximalethroughput
inMbit/s
NaLonalArea
(RUG-Unimaas)
MetroArea
(VUMC-AMC)
RTTinms
FirewallIssues
• 
• 
• 
• 
Beperktinmaximalethroughput
Groteaantallenkleineflows
Kleinebuffers
Meerlatency
•  Nietgeschiktvoor‘exoLsche’protocollen
OpLmaliserenvoorgrotedatastromen
• 
• 
• 
• 
Groterepacketsize(jumboframes)
Anderenetwerkprotocollen(UDP)
Anderetransferprotocollen(GridFTP)
Accesscontrolipvfirewall
Maatwerk....
ResearchDataZone
ResearchDataZone
• 
Netwerkzonevoorresearchdata
• 
GeopLmaliseerdvoordatadelen&
-transport
• 
Gestandaardiseerdeoplossingen
• 
PolicyFramework
• 
ToegangsrestricLeenAAI
ScienceDMZarchitectuur,metdankaanEliDart(Esnet)
Nietalleenvoordeultrahigh-endtoepassingen!
InternaLonaal
15:00parallelsessie:
“Campusinfrastructuurenbigdatatransfer”
Download