Memo Aan Gertjan Geerling;DELTARES, Leo van Ballegooijen; RWS WD, Marieke Ohm; RWS WD Datum Kenmerk Aantal pagina's 6 juli 2012 1205958-003-ZWS-0002 9 Van Doorkiesnummer E-mail Marc Weeber +31 (0)88 33 57 114 [email protected] Onderwerp Logboek database en dataverzameling 1 Aanleiding Het project “Effectiviteit” gaat over het beoordelen van maatregelen die er op gericht zijn de natuurwaarde en waterkwaliteit te verbeteren en liggen langs de Rijkswateren. De beoordeling wordt uitgevoerd over de natuurlijke processen en levensvormen die door de maatregelen worden bevorderd. Om deze beoordeling uit te voeren is een grote hoeveelheid monitoringsgegevens benodigd. De weidsheid aan monitoringsgegevens moet gezocht worden in de gemeten eenheid, de locatie en de tijd. Nadat Leon van Kouwen bij Deltares vertrok is het verzamelen van data en het categoriseren van binnenkomende data stil komen te liggen. Bij mijn aanstelling heb ik het werk van Leon opgepakt. Binnen deze memo geef ik een overzicht van onze systematiek waarop we de data verzamelen, de eisen die we stellen aan dataopslag, de wijze waarop we de data opslaan en de programmatuur die we hiervoor gebruiken. Aan het einde van deze memo wordt inzicht gegeven in de acties die nog worden geïnitieerd, lopen en zijn uitgevoerd. 2 Opzet dataverzameling Leon heeft zijn verzamelstructuur opgezet in Excel. Deze verzamelstructuur bestaat uit een lijst met de maatregelen, een literatuurlijst en een actielijst. Voordat deze structuur werd vastgelegd heeft men bepaald welke data er wordt verzameld. Vanuit deze structuur ben ik verder gegaan. 2.1 Lijst met de maatregelen Dit is een overzichtslijst met alle bij ons bekende maatregelen. Voor de natuurvriendelijke oevers is hiervan het overgrote deel afkomstig uit een inventarisatie van Movares (Movares 2001-2011, “Inspectieplan NVO Deelgebied 1,2 & 3” en daar aan hangend “Scope Deelgebied 1, 2 & 3). Onze resterende oevers zijn afkomstig vanuit overleg met de RWS disctricten en Datum Ons kenmerk Pagina 6 juli 2012 1205958-003-ZWS-0002 2/9 vermelding in de literatuur. Per natuurvriendelijke oever is er informatie weergegeven over de locatie, de dimensies van de oever en het type oever. Aanhangend aan de informatie is weergegeven of er monitoringsgegevens van OEPLA (oeverplanten), MAFY (macrofyten), MAFA (macrofauna), Vis, Chemie en/of Abiotiek beschikbaar is. Wanneer deze beschikbaar is wordt weergegeven uit welk jaar deze data afkomstig is en wat het ”onderwerp” is van deze data. Hierbij wordt de bron vermeldt waaruit deze informatie afkomstig is. De bron kan zowel de ruwe data als een verwijzing naar de ruwe data bevatten. Als het een digitaal bestand betreft is de directory weergegeven waar dit bestand kan worden gevonden. Bij een hardcopy document is de titel en dat het om een hardcopy bestand gaat opgenomen. 2.2 Literatuurlijst In de literatuurlijst zijn alle pdf’s, docs en hardcopy bestanden opgenomen die we tijdens het data verzamelen hebben binnen gekregen. In de literatuurlijst wordt vermeld waar het bestand over gaat. Ook wordt er vermeld of het bestand ruwe data bevat of bruikbaar kan zijn voor de analyse. Als het bestand een referentie naar ruwe data bevat dan wordt deze nog opgezocht. Tot nu toe is alleen het natuurvriendelijke oevers deel van de literatuurlijst aan de overzichtslijst gekoppeld. 3 Database Gertjan Geerling heeft het idee ontwikkeld om de te verkrijgen data op te slaan in een database. Na enige besprekingen met een database-expert binnen Deltares is er voor gekozen om een ruimtelijke database op te zetten. Dit zorgt ervaar dat data aan een locatie kan worden gekoppeld. Hierdoor kan de data gemakkelijker worden bevraagd, waardoor de analyse zonder veel moeite reproduceerbaar is. Fig 1. Overzicht van het verkrijgen, opslaan en weergeven van data. Datum Ons kenmerk Pagina 6 juli 2012 1205958-003-ZWS-0002 3/9 3.1 Vereisten database Het idee is om twee databases of twee verschillende outputs van één database te ontwerpen. De eerste database of output moet een overzicht geven van wat er aan data bij ons bekend is. De tweede database of output moet de daadwerkelijke data bevatten en bruikbaar zijn voor de analyses. 3.1.1 Beschikbaar De beschikbaarheids output (of database) geeft een overzicht van de gegevens die bij ons beschikbaar zijn. Dit geeft per natuurvriendelijke oever inzicht in de datakwantiteit van OEPLA, MAFY, MAFA, Vis, Chemie en Abiotiek. Dit kan met een soort van stoplichtensysteem waarbij groen aangeeft dat we ruimschoots voorzien zijn van data; oranje dat we data in ons bezit hebben, maar hier geen goede analyse over kunnen doen en rood dat we geen data van deze locatie in ons bezit hebben. Onder deze laag van kleuren wordt weergegeven welke data we in ons bezit hebben en waar deze data betrekking op heeft. Het doel van dit overzicht is om de districten te motiveren om data die nog mist aan te vullen. Het ruimtelijke aspect beoogt hier dat het voor het District gemakkelijk wordt gemaakt om monitoringsprojecten aan een natuurvriendelijke oever en/of andere locatie te koppelen. 3.1.2 Analyse De analyseerbare output (of database) bevat alle gegevens die we tijdens het project hebben verzameld. Met het behulp van de omtrek van de natuurvriendelijke oevers (polygonen) worden de gegevens opgevraagd. Deze gegevens willen we continue kunnen analyseren, zodat we niet hoeven te wachten tot alle data is verzameld. Hiervoor zullen we de analyses uitvoeren aan de hand van scripts die we op nieuw kunnen uitvoeren. Fig. 2. Het verkrijgen van data uit de database. 3.2 Datum Ons kenmerk Pagina 6 juli 2012 1205958-003-ZWS-0002 4/9 Maken Database We hebben al verschillende ontwerpen gemaakt voor de database. Door een vergroting van ons inzicht in databases en gesprekken met experts komen we geleidelijk tot een ontwerp dat onze wensen ondersteund. De criteria die gehanteerd worden is het voorkomen van het inefficiënt opslaan van data, het zoveel mogelijk opslaan van data in de structuur zoals het wordt aangeleverd, compatibiliteit van de outputstructuur met DONAR en compatibiliteit van de outputstructuur met de door ons gewenste bevraging. Fig. 3. Een voorbeeld van één van onze database ontwerpen. Het ontwerp is gemaakt in het programma MySQL Workbench. 3.3 Open source programmatuur Het verzamelen van de gegevens in een database, het uitvoeren van de gegevens op een geografische kaart en het analyseren van de gegevens zal voor een groot deel uitgevoerd worden met behulp van open source programma’s. Het voordeel van veel open source programma’s ten opzichte van conventionele programma’s is dat het bestandstype dat ze als resultaat leveren universeel is. Dit houdt in dat de programma’s onderling aan elkaar te koppelen zijn. Hierdoor kan een productieketen ontstaan waarbinnen data opslag en analyse aan elkaar zijn gekoppeld. In het meest idealistische geval houdt dit in dat je met één druk op Datum Ons kenmerk Pagina 6 juli 2012 1205958-003-ZWS-0002 5/9 de knop je data invoert, informatie inzichtelijk maakt en nieuwe resultaten van je analyses genereert. De open source programmatuur die we gebruiken zijn hier onder beschreven. 3.3.1 PostgreSQL/PostGIS PostgreSQL faciliteert het opzetten van een digitale database. Deze is nog niet ruimtelijk bevraagbaar. Met behulp van het programma PostGIS kan de PostgreSQL database ruimtelijk worden bevraagd (bijvoorbeeld aan de hand van polygonen). Dit maakt het mogelijk om ruimtelijke berekeningen uit te voeren. Link: http://www.postgresql.org/ http://postgis.refractions.net/ 3.3.2 QuantumGIS QuantumGIS is een geografisch informatie systeem (GIS) net zoals ArcMap van ESRI. Het voordeel van QuantumGIS is dat er bestanden uit digitale databases (zoals PostgreSQL) kunnen worden ingeladen. Deze bestanden kan je in QuantumGIS overzichtelijk maken door de opmaak op het gebruik af te stemmen. Link: http://www.qgis.org/ 3.3.3 Geoserver Geoserver is een digitale GIS viewer. Geoserver faciliteert het online beschikbaar en bekijkbaar maken van polygonen, puntdata en kaarten. Hierbij kan de opmaak die in QuantumGIS is aangemaakt worden overgenomen in Geoserver. Link: http://geoserver.org/ 3.3.4 Voorbeeld Een vergelijkbaar database ontwerp en uitvoer wordt momenteel ook ondernomen in het project “PMR”. Dit project werkt ook met biotische en abiotische gegevens die in één database worden ondergebracht. Ook bij dit project wordt gebruik gemaakt van de eerder beschreven open source software. Een document van dit project is bijgevoegd in de email. Een ander goed voorbeeld van wat er mogelijk is wordt getoond door een digitale data viewer die door Deltares ontwikkeld is voor een GIS cursus in Iraq. Link: http://pmr-geoserver.deltares.nl/iraq/ Datum Ons kenmerk Pagina 6 juli 2012 1205958-003-ZWS-0002 6/9 4 Acties Leon heeft bij zijn vertrek een lijst met uit te voeren acties achtergelaten. Deze acties hebben Gertjan en ik samen opgepakt. Het overgrote deel van deze acties zijn afgehandeld en bij een aantal van de acties zijn er nieuwe acties uit voortgekomen. 4.1 4.1.1 Ondernomen acties Actielijst Aan de hand van de actielijst heb ik onderzocht of de uitgevoerde acties ook terug waren te vinden in de verzamelde data. Dit heeft mij tevens geholpen om wegwijs te worden binnen de aangelegde datastructuur en een overzicht te krijgen van de reeds verzamelde data. 4.1.2 Openstaande acties Op de actielijst stonden nog enkele acties open. Deze hebben Gertjan en ik verdeeld. Een groot deel van deze acties is afgehandeld en staat het resultaat van beschreven. Tab. 1. Oude openstaande acties van Leons actielijst. Datum Ons kenmerk Pagina 6 juli 2012 1205958-003-ZWS-0002 7/9 NVO/VEO’s Maas Hiervan hebben we een shapefile van de ligging van de natuurvriendelijke- en vrij eroderende oevers behorend tot de derde tranche doorgekregen. Hierop volgen nog andere shapefiles met de ligging van andere NVO/VEO’s. Peilvariatie Ary van Spijk gaf aan niet beschikken over een GIS kaart met peilvariaties. Ook was hij in mindere mate bekend met EMOE. Gerben van Geest heeft dit opgelost door zelf een indeling te maken naar getijdeslag. Grote natuurprojecten langs Noordzeekanaal en Amsterdam-Rijn kanaal De informatie rond het Noordzeekanaal heb ik gekregen via Marco van Wieringen. De aanvraag naar informatie van het Amsterdam-Rijn kanaal loopt nog. 4.1.3 Literatuurlijst De literatuurlijst is aangevuld met de hardcopy rapporten van RWS. Hierbij zijn de onderwerpen vermeld waarop de rapporten aansluiten. De rapporten die betrekking hebben op NVO’s zijn gescand op bruikbaarheid als ruwe data, aanvullende informatie en voor de analyse. De rapporten met ruwe data, verwijzingen naar ruwe data en/of aanvullende informatie zijn opgenomen in de lijst met maatregelen. Uit deze lijst zal de database worden gevuld. De ruwe data waar naar verwezen wordt, wordt nog nagezocht. 4.1.4 Verzamelen data van districten Om de lijst met maatregelen te valideren en aan te vullen heb ik de contactpersonen van de verschillende districten aangesproken. Hiervoor heb ik eerst telefonisch contact met de betreffende persoon opgezocht. Hierna heb ik een mail gestuurd met daarin een overzicht van de maatregelen die binnen hun district vallen en de tot nu toe verzamelde data. Daarnaast zat er een bestand bij dat het type data wat we zoeken beschrijft en een KML-file die de (bij ons bekende) locaties van de natuurvriendelijke oevers weergeeft. Een KML-file kan je bekijken aan de hand van Google Earth. Aan de hand van dit verzoek heb ik van Frank Kok (DON) en Marco van Wieringen (DNH) de bij hun bekende data verkregen. Vanuit de districten is de belofte gemaakt dat de resterende data voor augustus wordt verzonden. 4.2 Datum Ons kenmerk Pagina 6 juli 2012 1205958-003-ZWS-0002 8/9 Te ondernemen acties De volgende acties staan nu uit of worden ondernomen. Tab. 2. Actielijst met wat er uit staat of nog wordt ondernomen. Datum Ons kenmerk Pagina 6 juli 2012 1205958-003-ZWS-0002 9/9