Nationale Wetenschapsagenda Route Document. Big Data Verantwoord Gebruiken: Zoeken naar Patronen in Grote Gegevensbestanden Documentversie: 29 maart 2016 / Ten behoeve van de voorbereiding op de 5 april route workshop. Toelichting Drie jaar geleden noemde Harvard Business Review data scientists de “sexiest job of the 21st century”. De revolutie die het meten, opslaan en analyseren van data teweeg brengt, raakt alle sectoren van onze maatschappij, van bedrijven tot overheid en wetenschap. Nederland staat voor de uitdaging vaart te maken met het toepassen van kennis en het ontwikkelen van nieuwe kennis en opleidingen op dit gebied. Terecht stelt de Nationale Wetenschapsagenda big data dan ook voor als één van de centrale thema’s, een zogenaamde “route”. Het gaat naast grote gegevensbestanden ook om heterogene en complexe data. De beschikbare data vraagt om nieuwe visies op kennisontwikkeling, nieuwe methodes voor analyse, nieuwe technologie en aandacht voor juridische en ethische aspecten. Deze route is bij uitstek ‘cross-­‐ cutting’. Veel disciplines hebben met big data te maken, van wiskunde tot medische wetenschappen en van computerwetenschappen tot economie. En er zijn veel toepassingen en kansen tot valorisatie. Dit vraagt om een vernieuwende agenda voor kennisontwikkeling en opleiding voor de Nederlandse data scientist van morgen. We gaan de agenda samen opzetten, met deelnemers uit wetenschap, uit de overheid en uit de private sector. Tijdens de workshop vragen we om uw input om nieuwe uitdagingen voor kennisontwikkeling en kansrijke nieuwe samenwerkingsverbanden te identificeren. We vragen u aan te geven waarom deze agenda urgent is en waarom Nederland uniek gepositioneerd is. De basis van de discussies zijn de vragen uit de Nationale Wetenschapsagenda en dit voorbereidend document van het organiserend comité. De kenniscoalitie van de Nationale Wetenschapsagenda zal onze resultaten gebruiken om extra investeringen in wetenschap te motiveren. 1. Plan van Aanpak Routeworkshop Het onderwerp “big data verantwoord gebruiken: zoeken naar patronen in grote gegevensbestanden” – kortweg “Big Data” genoemd in dit document – is één van de 16 exemplarische routes in de Nationale Wetenschapsagenda (NWA). Meer dan 25 van de 140 clustervragen – zie bijlage A – bieden een eigen perspectief op de route “Big Data”. De ambitie van de NWA stuurgroep is om via workshops de routes uit te werken, en deze uitwerkingen te gebruiken voor de onderbouwing van “thematisch onderzoek” in een investeringsagenda1. De routeworkshops 1 Mocht er door de politiek additionele financiering beschikbaar worden gesteld, dan wordt dit niet voor 2018 verwacht. Pas dan komt de vraag aan de orde op welke wijze de allocatie van middelen vorm zal krijgen. (Bron: “Wat gaat de stuurgroep met de uitkomsten van de routeworkshops doen, versie 1”. Maart 2016. https://www.esciencecenter.nl/pdf/Wat_gaat_de_stuurgroep_met_de_uitkomsten_van_de_routeworkshops _doen.pdf) 1 zijn géén instrument om voorstellen te formuleren die in onderlinge competitie voor financiering in aanmerking komen. Zij zijn veel eerder een instrument om kansrijke verbanden en gezamenlijke uitdagingen (de “game changing agenda”) te identificeren in het omvangrijke Nederlandse “big data ecosysteem”. Er wordt daarom expliciet gezocht naar nieuwe vormen van samenwerking over de gehele breedte van het big data kennis-­‐ en innovatieveld die een meerwaarde vertegenwoordigen ten opzichte van wat de betrokken partijen nu reeds individueel of in bestaande samenwerkingsvormen aan onderzoek uitvoeren. Dit document is geschreven ter voorbereiding van de routeworkshop “Big Data” op 5 april 2016 door de routeworkshop organisatie bestaand uit Wilco Hazeleger (NL eScience Center/KNMI/WU), José van Dijck (UvA/KNAW), Inald Lagendijk (TU Delft/Topteam ICT), Erik van de Linde (KNAW), Wim de Haas (WUR, NWA secretariaat) en Henk-­‐Jan Vink (TNO). Een eerste versie van dit document en daarin beschreven aanpak is besproken tijdens een voorbereidingsbijeenkomst met twintig deelnemers op 2 maart 2016. 2. Beoogde Resultaat van de Routeworkshop Het resultaat van de routeworkshop is een verslag van 3 à 4 pagina’s in te leveren uiterlijk 1 juni 2016, volgens de richtlijnen in bijlage B. Centraal in dit verslag staan (een beperkt aantal) “game changing vraagstukken”, waarin per vraagstuk – naast de inhoudelijke aspecten – de volgende belangrijke aspecten geadresseerd worden (zie ook de gele markeringen in bijlage B). • • • • Waarom heeft het vraagstuk in big data een hoge mate van “game changing” karakter bij het vinden van antwoorden op de complexe uitdagingen verwoord door de relevante clustervragen? Hierbij kan “game changing” refereren naar wetenschappelijke, maatschappelijke, en/of economische uitdaging en impact, maar ook naar nieuwe en onverwachte samenwerkingen. Waarom en vanuit welke oogpunten is het vraagstuk urgent? Van belang hierbij is de context van (i) bestaande (inter-­‐)nationale agenda’s; (ii) bestaande samenwerking en financiering; (iii) maatschappelijk-­‐economische kansen die voor Nederland gelden. Welke vernieuwende aanpak en samenwerking ontstaan rond big data vraagstukken die maximaal verbindend zijn? Hierbij kunnen verbindingen gevonden worden tussen o verschillende disciplines; o signaturen van onderzoek: fundamenteel-­‐toegepast-­‐praktijkgericht onderzoek; o stakeholders in het big data ecosysteem: wetenschap-­‐maatschappij-­‐bedrijfsleven. Welk type onderzoek, en welke partijen en samenwerkingsverbanden zijn noodzakelijk voor bovengenoemd thematisch onderzoek en het bereiken van wetenschappelijke, maatschappelijke en/of economische impact? De routeworkshop op 5 april 2016 – en de daarna te volgen openbare consultatieronde – zal zich expliciet richten op het identificeren van verbindende & game changing vraagstukken en de hierboven genoemde aspecten daarvan. Deelnemers wordt gevraagd zich hierop voor te bereiden aan de hand van de vragen in Sectie 9 van dit document. Gezien de planningstermijn – zie voetnoot 1 – is het tevens wenselijk om tijdens de routeworkshop na te denken hoe in de periode 2016 en 2017 de energie en enthousiasme voor de route “Big Data” 2 vastgehouden kan worden. In Sectie 9 van dit document komen enkele ideeën aan de orde. Deelnemers wordt gevraagd om zich hierop voor te bereiden. 3. De Route “Big Data” in de NWA De 25 clustervragen die rond het onderwerp “big data verantwoord gebruiken: zoeken naar patronen in grote gegevensbestanden” in de NWA zijn opgenomen, bieden een brede en rijke wandeling langs een grote diversiteit aan uitdagingen. Die uitdagingen gaan niet alleen over “grote” gegevensbestanden, maar ook over heterogene, diverse, tijdvariante, en complexe gegevensbestanden. De NWA beschrijft het belang van de route en kansen tot verbindingen rond complexe uitdagingen als volgt2. De implicaties van de explosief stijgende hoeveelheden gegevens die met behulp van informatie-­‐ en communicatietechnologie nu op alle denkbare terreinen kunnen worden vergaard, opgeslagen en geanalyseerd zijn moeilijk te overschatten. Het arsenaal aan instrumenten die continu gegevens produceren groeit nog steeds, zowel in de wetenschap als in de maatschappij. De parallelle ontwikkelingen in hardware en software voor de verwerking en analyse van deze gegevens leiden tot ongekende uitdagingen en mogelijkheden. Onderzoekers, bedrijven, overheden, maatschappelijke organisaties en burgers hebben hier allemaal mee te maken. Het onderwerp big data heeft betrekking op gegevens met een zeer grote omvang van terabytes of zelfs petabytes die bijna real time worden geproduceerd in een grote variatie wat de aard en structuur ervan betreft. Het gaat niet alleen om gegevens die worden verzameld door wetenschappers, maar ook door andere actoren – zoals door sociale media of door winkeliers via een klantenkaart. Het gaat bovendien om gegevens in alle wetenschappelijke disciplines – van astronomie en (epi)genetica, via informatica en statistiek, tot aan geschiedenis en taalwetenschappen. Big data daagt uit om nieuwe visies op de productie van wetenschappelijke kennis te ontwikkelen, nieuwe statistische analysemethoden te bedenken en implementeren, en om de begrenzing van private en publieke sfeer in de samenleving te herijken. Het onderwerp big data betreft een groot aantal toepassingsgebieden, van agroproductie en gezondheid tot militaire inlichtingen en veiligheid, van transport en logistiek tot klimaat en milieu, van geschiedenis en erfgoed tot biologische evolutie en ecosystemen. De route verbindt disciplines als criminologie, psychologie, kunstgeschiedenis, genetica, elektronica, informatica, biologie, chemie, ethiek, recht en wiskunde. Overheden, bedrijven, maatschappelijke organisaties en burgers hebben belang bij onderzoek op dit terrein. In ‘Klaar voor de Toekomst? Naar een brede strategie voor ICT’ (AWTI, 2015) komt de verbindende kracht van ICT op dit terrein sterk naar voren. Nederland heeft een sterke uitgangspositie in big data, en kan deze ten volle benutten om internationaal een impactvolle rol te spelen in data-­‐intensieve wetenschap en innovatie in data-­‐ intensieve bedrijven. Zeker op het gebied van complexe big data uitdagingen is in de afgelopen jaren een cultuur van samenwerken gegroeid, waarbij wetenschap, valorisatie, marktoriëntatie en maatschappelijke impact multidisciplinair worden aangepakt. De universitaire competenties op het gebied van data science zijn van wereldklasse, big data wordt door vele wetenschapsgebieden 2 https://vragen.wetenschapsagenda.nl/route/big-­‐data-­‐verantwoord-­‐gebruiken-­‐zoeken-­‐naar-­‐patronen-­‐in-­‐ grote-­‐gegevensbestanden. 3 impactvol omarmt, en de maatschappelijk-­‐economische invloed van big data zal in komende decennia alleen nog maar toenemen. Nederland heeft de kans om een wetenschappelijk big data topcluster te vormen waarin naast de traditionele waarden van multidisciplinaire kennisoverdracht (onderwijs) en multidisciplinaire kennisuitbreiding (onderzoek) ook multidisciplinaire waarde-­‐creatie met kennis (valorisatie) een primaire rol speelt. Big data is één van de routes waarin appreciatie voor en balans tussen de verschillende belangen – vanuit wetenschappelijk, maatschappelijk en bedrijvigheidsoogpunt – een belangrijk aspect is. 4. Extrinsieke en Intrinsieke Motivatie voor Big Data Big data is sterk met andere NWA routes verbonden. Voor de hand liggende verbindingen en overlap bestaan bijvoorbeeld met de routes Smart Industry, Smart Liveable Cities, Logistiek en Transport, Energietransitie, Tussen Conflict en Coöperatie, en Veerkrachtige & Zinvolle Samenleving. Vergelijkbaar met de Informatie-­‐ en Communicatietechnologie (ICT) is big data een enabling technologie die vele sectoren heeft getransformeerd en zal blijven transformeren, van commercie tot onderwijs, van overheid tot wetenschap, en van veiligheid tot entertainment. Dit levert enerzijds een sterke extrinsieke – en veelal domein/data-­‐specifieke – motivatie en urgentie voor de route “Big Data”. Big data is tenslotte een gedeelde game changer voor veel van de andere routes, of – het eerder genoemde AWTI rapport aanhalend – “big data is de innovator voor alle innovaties”. Inderdaad zijn veel van de clustervragen die met de Route “Big Data” verbonden zijn, geformuleerd vanuit een extern perspectief. Anderzijds brengt een dergelijk sterke extrinsieke motivatie het risico met zich mee dat onvoldoende stil gestaan wordt bij de noodzaak tot high-­‐quality en curiosity-­‐driven onderzoek naar de intrinsiek gemotiveerde game changers in big data. Voldoende aandacht voor de intrinsieke uitdagingen in big data is noodzakelijk om aan de verwachting van maatschappij, wetenschap en economie te kunnen voldoen. Ten eerste omdat een Nederlandse basis van onverwachte en creatieve big data ideeën noodzakelijk is om het ecosysteem te voeden. Ten tweede omdat voldoende talent in big data moet worden opgeleid die – veelal in samenspraak met andere disciplines – innovaties in welke sector dan ook tot stand kunnen brengen. Het is daarom het nadrukkelijke doel van deze routeworkshop om intrinsiek gemotiveerde game changing vraagstukken in big data te identificeren, en deze (bijvoorbeeld) via de clustervragen te verbinden met extrinsieke motivaties. 5. Structurering van de Clustervragen Om het gesprek in de big data workshop vorm te geven, kan goed gebruik worden gemaakt van de beschrijving in Sectie 3 als ook de individuele woorden in de uitdaging “big data verantwoord gebruiken: zoeken naar patronen in grote (en heterogene) gegevensbestanden”. We constateren dat in beide de volgende drie elementen herkenbaar zijn. Ten eerste, de heterogene en grote gegevensbestanden die te vinden zijn in een grote diversiteit van wetenschappelijke, economische en maatschappelijke toepassingen. De tekst spreekt van “zeer grote omvang van terabytes of zelfs petabytes die bijna real time worden geproduceerd in een grote variatie wat de aard en structuur ervan betreft” en “het onderwerp big data betreft een groot aantal 4 toepassingsgebieden”. Veel van de clustervragen hebben betrekking op het game changing karakter van het gebruik van complexe en grote gegevensbestanden op domein en data-­‐specifieke wetenschappelijke en economische kansen en uitdagingen. Uitdagingen liggen rond de typologie van data, open en citizen data, beschikbaar maken en ontsluiting van de data, en combineren van data. Twee voorbeelden van relevante clustervragen zijn: • • Hoe kunnen big data en technologische innovatie (e-­‐health) bijdragen in de zorg (clustervraag 105)? Hoe ontwikkelen we nieuwe meetmethoden binnen de sociale wetenschappen (clustervraag 64)? Ten tweede, de methoden voor het zoeken naar patronen in complexe en grote gegevensbestanden. De tekst spreekt van “de parallelle ontwikkelingen in hardware en software voor de verwerking en analyse van deze gegevens leiden tot ongekende uitdagingen en mogelijkheden”, en refereert naar het verbinden van een groot aantal onderliggende disciplines. De clustervragen hebben veelal betrekking op het game changing karakter van nieuwe methoden en technologie voor analyse van complexe en grote gegevensbestanden. Uitdagingen liggen rond de interpretatie, kwaliteit, validatie, gedistribueerde karakter van de data en de inzet van citizen science. Twee voorbeelden van relevante clustervragen zijn: • • Kunnen we grote datasets en het verzamelen daarvan benutten voor het realiseren van waarden, het genereren van inzichten en het verkrijgen van antwoorden (clustervraag 112)? Kunnen we taaltechnologie ontwikkelen waarmee onze computer met ons kunnen communiceren (clustervraag 113)? Tot slot, de sociaal-­‐maatschappelijk dimensie die tot uiting komt in de woorden verantwoord gebruiken. De tekst stelt dat “overheden, bedrijven, maatschappelijke organisaties en burgers belang hebben bij onderzoek op dit terrein”. Het game changing karakter komt vooral tot uitdaging in clustervragen die de kaders van gebruik van big data benoemen, vanuit het oogpunt van ethiek, veiligheid, transparantie en accountability. Twee voorbeelden van relevante clustervragen zijn: • • Hoe garanderen we digitale veiligheid (clustervraag 60)? Wat zijn de gevolgen van nieuwe technologieën en big data op de effectiviteit van bestuur en rechtstaat (clustervraag 109)? Deze indeling in drie kijkwijzen op “big data verantwoord gebruiken: zoeken naar patronen in grote gegevensbestanden” kan in het navolgende figuur gevisualiseerd worden. Deze representatie kan worden aangevuld met de betreffende clustervragen, zie voor een aanzet daartoe de Bijlage A. Het is mogelijk om vanuit andere NWA routes of gedurende de routeworkshop nog additionele “clustervragen” toe te voegen wanneer deze duidelijk meerwaarde hebben ten opzichte van de huidige set van 25 clustervragen. 5 Kaders voor gebruik “verantwoord gebruiken” Verbindende en game-­‐ changing vraagstukken Data-­‐ en domeinspecifieke uitdagingen Analyse methoden en technieken “zoeken naar patronen” “grote gegevensbestanden” 6. Gebruik van de “Bollen” in de Routeworkshop Bovenstaande representatie wordt gebruikt om het gesprek tijdens de routeworkshop in twee ronden vorm te geven (zie Sectie 8 voor de details van het dagprogramma, en Sectie 9 voor de gewenste voorbereiding). Eerste Ronde In de eerste ronde worden deelnemers zo veel mogelijk gemengd in groepen van ongeveer 15 personen. Doel van deze ronde is om te zoeken naar verbindingen tussen de “bollen”. In deze ronde worden de deelnemers uitgedaagd om vooral buiten de eigen discipline, netwerken, en samenwerkingen te denken. Welke concrete game changer(s) kan (kunnen) geïdentificeerd worden om grote voortgang/versnelling te kunnen bereiken binnen de big data uitdagingen van de deelnemers? De opgave is om uitgaande van de eigen motivatie – neem daarvoor een selectie van clustervragen als leidraad – in gezamenlijkheid te komen tot de formulering & rapportage van maximaal drie vraagstukken die elk • • • • game changing zijn. Geef aan in welke zin het vraagstuk game changing is, bij voorkeur door in de naam van het vraagstuk de beoogde transformatie te benoemen (voor voorbeelden, zie Sectie 7). verbindingen tussen de “bollen” leggen. Identificeer om welke verbindingen het gaat (zie Sectie 2). urgent en kansrijk zijn. Benoem de kansen en de reden van urgentie voor Nederland. Wat zit er voor Nederland in? aangeven of het onderzoek intrinsieke of extrinsieke motivatie kent (zie Sectie 4). Geef de argumenten voor de gekozen motivatie. 6 De gesprekken in de eerste ronde worden vormgegeven door de volgende agenda. 1. Voorstelrondje. 2. Rondje langs de deelnemers. (a) Hebt u een concreet voorbeeld van een big data uitdaging in uw veld waarvan u vindt dat deze game changing kan zijn? Of: (b) Welk van de in Sectie 7 genoemde game changers is het meest relevant voor uw veld? En welke het minst relevant? 3. Benoem gezamenlijk maximaal 3 initiële ideeën voor game changers. Voor elk van deze game changers bespreek de volgende aspecten. a. In welke zin is dit vraagstuk een game changer? b. Hoe sluit de game changer aan bij de cluster vragen? Zijn er witte vlekken in de huidige set van 25 NWA vragen verbonden aan de route “Big Data”? c. Is het vraagstuk intrinsiek of extrinsiek gemotiveerd? d. Wat is de typologie en de beschikbaarheid van de data die nodig is voor deze game changer? e. Op welke manier kan positieve waarden worden gecreëerd voor wetenschap, maatschappij, en/of economie? f. Zijn er negatieve aspecten / risico’s die geadresseerd moeten worden in deze game changer? g. Hoe zou u het succes of impact van de game changer uiteindelijk willen “meten”? Wat is er anders over 10 jaar? 4. Afsluitend rondje: welke aspecten zijn nog onderbelicht gebleven? De resultaten van de eerste ronde worden zoveel mogelijk plenair besproken en tijdens de workshop beschikbaar gemaakt aan alle deelnemers om op te reageren. Tweede Ronde In de tweede ronde worden deelnemers gegroepeerd naar bollen en disciplines. Doel van deze ronde is om de consequenties van game changers uit de eerste ronde te beschouwen binnen de eigen discipline, netwerken, en samenwerkingen, zowel op lange als korte termijn. De uitdaging is om op twee categorieën van vragen antwoorden te formuleren, waarbij bol-­‐specifieke antwoorden worden gezocht. De eerste categorie vragen betreft de consequenties van de game changers op de lange termijn. Doel van de discussie is te identificeren welke acties in de “eigen bol” genomen moeten worden en wat daarvoor nodig is van de “andere bollen”. De tweede categorie vragen betreft de consequenties van de game changers op de korte termijn. Doel van deze discussie is om tot ideeën te komen voor gezamenlijke activiteiten in de periode 2016-­‐2017 om het momentum van het NWA proces rond Big Data vast te houden. 7 De gesprekken in de tweede ronde worden vormgegeven door de volgende agenda. 1. Kies gezamenlijk (en beargumenteer waarom) de twee meest en de twee minst aansprekende game changers om het gesprek vorm te geven. Gebruik de informatie uit de plenaire rapportage van Ronde 1 en de samenvattingen beschikbaar op de flip-­‐overs. 2. Rondje langs de deelnemers & discussie (lange termijn van de aansprekende game changers). a. Wat maakt dit vraagstuk voor uw “bol” tot een game changer? b. Welke expertise is er nodig om dit vraagstuk aan te kunnen en waar zit die in Nederland (of zou die ontwikkeld moeten worden)? i. Voor de bol “Analyse”: denk aan wiskunde, informatica. ii. Voor de bol “Data/Domein Specifiek”, denk aan meetmethoden, data ontsluiting, domein specifiek-­‐ kennis. iii. Voor de bol “Kaders”, denk aan: juridisch, economisch, ethisch, beleidsmatig. c. Op welke manier kan waarden worden gecreëerd voor wetenschap, maatschappij, en/of economie? d. Welke risico’s brengt deze game changer met zich mee? Denk aan consequenties voor banen, overgespannen verwachtingen, angst voor big data, … e. Waarom deze game changer in Nederland aanpakken? Denk bijvoorbeeld aan: i. Hebben we unieke kennis en kunde? ii. Geeft het unieke bijdrage aan Europese programmering? f. Welke consequenties heeft deze game changer voor onderwijs in Nederland? 3. Rondje langs de deelnemers & discussie (korte termijn). a. Wie of welke partijen gaat u uitnodigen voor een vervolggesprek/kennissessie naar aanleiding van de workshop vandaag? b. Aan welke vervolgactiviteiten zou u komend jaar willen deelnemen? c. Op welke manier kan de route Big Data nog breder & positief onder de aandacht van publiek en beleidsmakers gebracht worden en welke rol kunt u daarbij spelen? Denk aan: prijzen om exposure te vergroten, hackatons (scholen), data projecten met kinderen, en een “canon van de big data”. d. Wat heeft u vandaag gemist? Ook de resultaten van de tweede ronde worden zoveel mogelijk plenair besproken en tijdens de workshop beschikbaar gemaakt aan alle deelnemers om op te reageren. Het Vervolg Na de routeworkshop zal een samenvatting naar de deelnemers verstuurd worden voor opmerkingen en correcties. Rond 15 april zal dit document en de samenvatting van de routeworkshop beschikbaar zijn voor openbare consultatie, met de mogelijkheid te reageren via een web survey. Tenslotte zal begin mei een samenvattend rapport en de 3-­‐4 pagina’s samenvatting over de game changers geschreven worden door het organiserend team aangevuld met enkele 8 deelnemers van de voorbereidingsbijeenkomst van 2 maart. De 3-­‐4 pagina’s samenvatting wordt uiterlijk op 1 juni bij de NWA stuurgroep ingeleverd. Zoals eerder genoemd, het organiserend team hecht eraan dat de energie en enthousiasme niet verloren gaat na de 1 juni deadline. Alle ideeën hiervoor zijn welkom, zie ook punt 3 van de agenda tweede ronde gesprekken. 7. Aanzet tot Game Changing Vraagstukken Zonder inperkend te willen zijn, kunnen reeds enkele voorbeelden van game changing vraagstukken gegeven worden om de gedachten te bepalen. Omdat het woord “change” duidt op een transformatieproces, worden deelnemers aangemoedigd te denken in termen van noodzakelijke veranderingen, van “hoe het nu is” naar “hoe het zou moeten worden”. • • • Hoe komen we van Orakel naar Verantwoording? Big data wordt vaak als een black box of orakel gezien. Data erin, patronen eruit. We willen graag dat het transparant is hoe patronen tot stand komen, hoe ze te interpreteren, en hoe daaraan conclusies te verbinden. Er kunnen allerlei effecten in de data zitten die voor bias of hiaten zorgen, wat kan leiden tot gebrek aan vertrouwen in big data methoden en technieken. Hieraan gekoppeld is de vraag wie er uiteindelijk verantwoordelijk is voor de geconstateerde patronen (accountability) zeker wanneer op basis daarvan maatschappelijk of politieke besluitvorming plaatsvindt. Deze zorg kan zich ook uitstrekken naar het commercieel-­‐ economische domein. Het is bekend dat bedrijven die diensten bieden op basis van big data uitvoerig experimenteren met het gebruik van geïdentificeerde patronen, en zich daarbij laten sturen door verdienmodellen. In het ontwerp van big data systemen is het een kans om vanuit strategisch oogpunt recht, regulering en governance reeds in de design fase mee te nemen. Hoe stijgen we uit boven Correlatie en komen tot Causaliteit in Resultaten? Big data heeft grote waarde als uitkomsten van analyses ‘actionable’ zijn. Eén van de grootste domein overstijgende uitdagingen daarbij is het verschil tussen correlatie en causaliteit. In sommige domeinen zijn correlaties reeds “actionable”, maar als het gaat om toekomstgerichte acties – of dat nou overheidsbeleid is of predictief onderhoud van vliegtuigen – dan is slechts causale afhankelijk verantwoord te gebruiken. Wat is er nodig om de transformatie te maken van uit big data niet alleen correlatie maar ook causaliteiten te halen? Hoe synthetiseren we data-­‐gedreven en model-­‐gedreven aanpakken? In big data gaat het vrijwel nooit om de grote gegevensbestanden zelf, maar om de impliciet gedragen hypothesen, modellen, en informatie in de data. Een belangrijk doel van big data analyse is dan ook het omzetten van de ruwe data naar betekenisvolle patronen, naar causale relaties, modellen, informatie, semantiek en kennis. Hiertoe is het combineren van de data met domeinkennis, inclusief simulatiemodellen, onvermijdelijk. De deep-­‐analysis van tekst, auditieve en visuele informatie, en sensorische data met daarbij in achtneming van de kwaliteit van de data en de beschikbare domeinkennis en –modellen is één van de game changing uitdagingen in het genereren van betekenisvolle data en in de big data analyse. 9 • • Hoe blijft data beschikbaar in de toekomst? Bij big data analyses en gebruik gaat het vrijwel altijd om het combineren van gegevens. Daarom zijn aspecten van interoperabiliteit, toegankelijkheid, standaardisatie, en (privacy) bescherming van de data van cruciaal belang, nu, maar vooral ook in de toekomst. Verschillende aspecten komen hier samen, zoals technische en semantische uitwisselbaarheid, maar ook juridische, ethische, bestuurlijke en governance aspecten. In het domein van de life sciences spreekt men van het FAIR data principe voor big data: Findable, Accessible, Interoperable en Re-­‐usable. Vergelijkbaar hiermee, spreekt men in de smart industry van “dare to share”. Zonder dit goed te regelen zal data in isolatie bestaan en kan er geen wetenschappelijk, maatschappelijk en/of economisch meerwaarde aan worden onttrokken. Een ander aspect van het combineren van gegevens is het vastleggen van hóe ruwe big data gecombineerd en geanalyseerd is tot verrijkte data. Dit aspect van stewardship raakt aan de recente ontwikkelingen op het gebied van gedistribueerde transactie/process logging met behulp van de z.g. “block chain”. Zonder goed vast te leggen hoe data bewerkt, verrijkt, etcetera is, lopen we het risico dat er uiteindelijk geen kennis meer is over het bronmateriaal en gehanteerde processing: een toekomstig legacy probleem vergelijkbaar met wat er momenteel met sommige ICT systemen aan de hand is. Hoe maken we Big Data “Groen & Groeibaar”? Naast intelligentie in de algoritmen om patronen in de data te vinden, wordt in toenemende mate de hoeveelheid data zelf een beperkende factor. Enerzijds is het niet langer mogelijk om alle verzamelde data in de analysis op te nemen (schaalbaarheids-­‐ en real-­‐time beperkingen), anderzijds worden externe en interne communicatie-­‐bandbreedte en energieverbruik beperkende factoren in hoeveel data men kan en wil bewerken. Dit aspect raakt aan technologische ontwikkeling van gedistribueerde data systemen, aan optimale analyse methodes en algoritmen, en aan de big data workflow en processing pipeline. Het verder opschalen van reken-­‐ en communicatiebandbreedte zal binnen afzienbare tijd tegen energieproblemen aanlopen. Reeds nu gebruiken data centers (“de cloud”) 5% van de totale wereldwijde energieconsumptie. Om een voorbeeld te geven, de 2 miljard views3 van PSY’s clip “Gangnam Style” op YouTube kostte 300 GWh, het jaargebruik van zo’n 100,000 huishoudens. De kans bestaat dat groei van big data analyse beperkt wordt door het energiegebruik. 3 https://www.youtube.com/watch?v=9bZkp7q19f0 10 8. Dagprogramma 5 april Routeworkshop “Big Data” 09:30 – 10:00 uur Ontvangst te Trippenhuis, Amsterdam. 10:00 – 10:15 uur Opening en introductie NWA. Jose van Dijck (president KNAW, UvA) 10:15 -­‐ 10:45 uur “Verbinders en Game Changers”. Inald Lagendijk (Topteam ICT, TU Delft) 10:45 – 12:00 uur Ronde 1 Tafelgesprek(ken), met tien tafels van elk 15 personen. Elke tafel heeft een gespreksleider en flip-­‐over/elektronisch notulist. Zie Sectie 6 voor de agenda van deze ronde. 12:00 – 12:30 uur Plenair 10 maal 2 minuten pitch per group/flip-­‐over door gespreksleider om de essentie samen te vatten. Maak hierbij ook gebruik van de mogelijkheid in SOCRATIVE om reacties uit de zaal te verzamelen. 12:30 – 13:30 uur Lunch Gelegenheid om reacties bij de flip-­‐overs te schrijven met yellow stick-­‐ its, en eigen aantekeningen te verrijken ter voorbereiding op Ronde 2. Ook de kans om via SOCRATIVE feedback te geven op resultaten uit Ronde 1. Specifieke opdracht: maak kennis met 5 deelnemers die u niet kent. Deel een uitdaging met SOCRATIVE. 13:30 – 14:00 Cross-­‐cutting data uitdagingen. Wilco Hazeleger (NL eScience Center, WU, KNMI). 14:30 – 15:30 uur Ronde 2 Tafelgesprek(ken), met tien tafels van elk 15 personen. Elke tafel heeft een gespreksleider en flip-­‐over/elektronisch notulist. Zie Sectie 6 voor de agenda van deze ronde. 15:30 – 16:00 uur Plenair 10 maal 2 minuten pitch per group/flip-­‐over door gespreksleider om de essentie samen te vatten. 16:00 – 16:15 uur Afronding en sluiting. 16:15 – 17:15 uur Informeel napraten, borrel. Specifieke opdracht: maak kennis met 5 deelnemers die u niet kent. Deel een uitdaging met SOCRATIVE. 11 9. Vragen en Voorbereiding op de Routeworkshop De deelnemers wordt gevraagd zich voor te bereiden op de workshop op de volgende manier. • • • Wanneer u naar aanleiding van dit document een vraag voor toelichting hebt, kunt u die voorafgaand aan de routeworkshop indienen via https://www.surveymonkey.com/r/63GPBTL . U kunt in maximaal 50 woorden een vraag stellen over het document of over het proces. Het organiserend comité kan daar dan rekening mee houden op 5 april en uw vraag hopelijk dan beantwoorden. Ter voorbereiding van Ronde 1 wordt u gevraagd om een antwoord voor te bereiden op de volgende vragen uit Sectie 6. o Hebt u een concreet voorbeeld van een big data uitdaging in uw veld waarvan u vindt dat deze game changing kan zijn? Of: Welk van de in Sectie 7 genoemde game changers is het meest relevant voor uw veld? En welke het minst relevant? o U kunt daarbij de volgende deelvragen in beschouwing nemen. § In welke zin is dit vraagstuk een game changer? § Hoe sluit de game changer aan bij de cluster vragen? Zijn er witte vlekken in de huidige set van 25 NWA vragen verbonden aan de route “Big Data”? § Is het vraagstuk intrinsiek of extrinsiek gemotiveerd? § Wat is de typologie en de beschikbaarheid van de data die nodig is voor dit onderzoek? § Zijn er negatieve aspecten / risico’s die geadresseerd moeten worden in deze game changer? § Hoe zou u het succes of impact van de game changer uiteindelijk willen “meten”? Wat is er anders over 10 jaar. § Welke expertise is er nodig om dit vraagstuk aan te kunnen? § Op welke manier kan waarden worden gecreëerd voor wetenschap, maatschappij, en/of economie? § Welke risico’s brengt deze game changer met zich mee? Denk aan consequenties voor banen, overspannen verwachtingen, angst voor big data, … § Welke consequenties heeft deze game changer voor onderwijs in Nederland? Ter voorbereiding van Ronde 2 wordt u gevraagd om een antwoord voor te bereiden op de volgende vragen uit Sectie 6. o Aan welke vervolgactiviteiten zou u komend jaar willen deelnemen? o Op welke manier kan de route Big Data nog breder & positief onder de aandacht van publiek en beleidsmakers gebracht worden en welke rol kunt u daarbij spelen? Denk aan: prijzen om exposure te vergroten, hackatons (scholen), data projecten met kinderen, en een “canon van de big data”. o Wat heeft u in dit document gemist? 12 Bijlage A: Clustervragen achterliggend aan de route big data verantwoord gebruiken zoeken naar patronen in grote gegevensbestanden Per clustervraag wordt een positionering gegeven op basis van de figuur op pagina 4. De inkleuring van de drie “bolletjes” geeft aan waar de primaire game changer verwacht mag worden, gezien vanuit de thematiek van “big data verantwoord gebruiken zoeken naar patronen in grote gegevensbestanden”. De drie perspectieven zijn: “grote gegevensbestanden”(linksonder), “zoeken naar patronen” (rechtsonder), en “verantwoord gebruiken”(boven). De positionering is geen doel op zich. Het is een hulpmiddel bij het vormgeven van de discussie over urgente en gedeelde game changers van big data uitdagingen en toepassingen vanuit het perspectief van de clustervragen. Om die reden zijn enkele kernzinnen overgenomen uit de beschrijving van elke clustervraag in de NWA die de relatie tot de route karakteriseert. Voor meer gedetailleerde informatie, zie https://vragen.wetenschapsagenda.nl/route/big-­‐data-­‐verantwoord-­‐gebruiken-­‐zoeken-­‐naar-­‐ patronen-­‐in-­‐grote-­‐gegevensbestanden . Nr. Clustervraag; en kernzin in relatie tot de route “big data verantwoord gebruiken zoeken naar patronen in grote gegevensbestanden” 008 Hoe verandert het klimaat, inclusief extreme weersomstandigheden, en wat zijn de gevolgen ervan? Kernzin: Klimaatverandering is een complex, mondiaal verschijnsel met sterk variërende regionale effecten. Dit vraagt om een geïntegreerde, deels internationale aanpak over schaalniveaus en disciplines heen en vereist een actieve samenwerking tussen fundamenteel wetenschappelijk onderzoek op het terrein van klimaatfysica, hydrologie en wiskunde, toepassingsgeoriënteerde studies gericht op veiligheid en rampenbeheersing en praktijkgericht werk. 036 Welke gevolgen hebben maatschappelijke veranderingen als digitalisering, globalisering en grotere mondigheid van burgers voor publieke en semi-­‐publieke instellingen? Kernzin: Innovatieve vormen van regulering (nudging, burgerparticipatie, normen ingebouwd in de techniek) blijken soms effectievere prikkels en sturing te kunnen bieden. Hoe kunnen nieuwe mogelijkheden worden benut om de effectiviteit, legitimiteit en de maatschappelijke acceptatie van rechtsregels, wetgeving, rechtspraak en handhaving te bevorderen? Wat is de wisselwerking tussen technische, sociale, economische en institutionele factoren achter deze ontwikkelingen? 056 Hoe kunnen vrede, veiligheid en coöperatie worden bevorderd – en bedreigingen en schendingen geadresseerd – binnen en tussen nationale rechtsstaten en binnen en tussen groepen en samenlevingen? Kernzin: Slimme oplossingen voor dagelijkse problemen van burgers in gediversifieerde samenlevingen en duurzame relaties in het verkeer tussen bedrijven, overheden en maatschappelijke partners vragen om fundamentele inzichten in onder meer de werking van sociale en economische systemen, het gedrag van individuen, groepen en instituties, de ontwikkeling van taal en cultuur en daarmee samenhangende identiteitsvorming, onderwijs en ontwikkeling van jonge mensen. Positionering 13 057 060 062 064 081 098 105 Kunnen we een balans vinden tussen informatie-­‐vrijheid en privacy? Kernzin: Toegepast onderzoek kan zich daarbij richten op het ontwerpen van innovatieve technologie of van een juridisch en beleids-­‐ instrumentarium dat toegang tot data bevordert en tegelijkertijd bescherming biedt aan de eigenaren van deze data. Gegeven het internationale karakter van digitale informatie, en de datapositie van bedrijven, ontstaat de vraag in hoeverre we informatiestromen eigenlijk kunnen reguleren. Hoe garanderen we onze digitale veiligheid? Kernzin: Innovaties zijn nodig om de digitale infrastructuur veiliger te maken. Deze vraag vindt aansluiting bij onderwerpen als big data en kwantumcomputers en –internet. Hoe beïnvloedt technologie het menselijk bestaan en sociale veranderingen en welke ethische vragen roept dat op? Ook hangt de vraag samen met de kwestie in hoeverre een balans kan worden gevonden tussen privacy, vrije beschikbaarheid van data en gegevensmonopolies. Hoe werkt wetenschap, wat is goede wetenschap en hoe kan beleid hierop inspelen? Kernzin: nader in te vullen. Hoe ontwikkelen we nieuwe meet-­‐methoden binnen de sociale wetenschappen? Kernzin: (…) er (komt) steeds meer informatie via nieuwe digitale technologieën en methoden beschikbaar. Het duiden van deze informatie is complex, mede omdat informatie voor verschillende doelen en op verschillende aggregatieniveaus wordt verzameld. Hoe gaat kennis van genetica een rol spelen in het begrijpen van, screenen op en behandelen van (zeldzame) ziekten? Kernzin: (Het) is (…) noodzakelijk om screeningstechnologieën te blijven ontwikkelen en verbeteren. De screeningsmethoden zelf moeten eenvoudiger, betrouwbaarder, minder invasief en goedkoper worden. Hoe kunnen we doorbraken binnen het fundamenteel-­‐biomedische onderzoek beter vertalen naar de ontwikkeling van nieuwe medicijnen? Kernzin: Naast het blijvend stimuleren van fundamenteel en toegepast ICT-­‐ onderzoek is het van belang dat de infrastructuur binnen Nederland verder wordt versterkt, en dat relevante en kosteneffectieve e-­‐health toepassingen ook daadwerkelijk worden geïmplementeerd. Dit vereist niet alleen praktische, up-­‐to-­‐date scholingsprogramma’s, maar ook goede samenwerking tussen ICT-­‐ specialisten en medisch specialisten. Bovendien moet er nauwkeurig aandacht worden besteed aan de zorgen over privacy en verantwoordelijkheid die de grote beschikbaarheid van medische en dus zeer persoonlijke gegevens met zich meebrengt. Tevens zal een nauwe samenwerking tussen data-­‐ genererende systemen zoals medische apparatuur, sensoren, robotica en dataverwerkers leiden tot een efficiëntere inzet van middelen. Hoe kunnen big data en technologische innovatie (e-­‐health) bijdragen in de zorg? 14 107 109 110 111 Kernzin: De big data revolutie biedt ook de mogelijkheid om medisch onderzoek te versnellen door informatie uit alle mogelijke databestanden met elkaar te combineren. Een belangrijke uitdaging is om deze data in zorg en onderzoek FAIR te maken, dat wil zeggen Findable, Accessible, Interoperable en Reusable. Hiervoor moeten aspecten zoals standaardisering, gebruikersgemak, duurzame opslag, eigendomsrechten en privacy goed zijn geregeld binnen de gehele gezondheidssector. Met deze ontwikkelingen is het nodig om nieuwe concepten, methoden en software te ontwikkelen om de veelheid aan gezondheidsgegevens en kennis goed te kunnen analyseren en interpreteren, en naar persoonlijk gezondheidsadvies te kunnen vertalen. Hoe kunnen we beter anticiperen op de invloed van nieuwe technologie op de mens en maatschappij, en de invloed van bestaande technologie beter begrijpen en beoordelen? Kernzin: Nieuwe technologieën roepen vragen op ten aanzien van privacy, de kwaliteit van leven, de mogelijkheid dat superintelligente robots de mens overbodig maken en de vraag wie er aansprakelijk is als een zelfrijdende auto een verkeerde beslissing neemt. De beschrijving en normering van de invloed van technologie op de samenleving kan input geven voor beleid, de bedrijfsvoering van technologische bedrijven en de werkwijze van technologische onderzoekers of ingenieurs. Wat zijn de gevolgen van nieuwe technologieën en big data op de effectiviteit van bestuur en rechtstaat? Kernzin: (…) de gegroeide aandacht voor de mogelijkheden die big data bieden, hebben reeds ingrijpende gevolgen gehad voor het functioneren van het openbaar bestuur. Denk aan digitale loketten, gekoppelde databestanden en fraudedetectie door patroonherkenning. Tegelijkertijd heeft big data grote potentie voor acceptatie en innovatie van wetgeving en rechtspraak. Bestaande bestuurlijke procedures en wetgeving zijn vaak voor innovatieve ontwikkelingen een belemmering. Ten slotte zijn moderne ontwikkelingen, bijvoorbeeld in de ICT, heel goed bruikbaar om bestuur, wetgeving en handhaving effectiever te maken. Wat is de invloed van oude en nieuwe media op individu en samenleving? Kernzin: De huidige generatie (…) is vooral gericht op bonding: het bijeenbrengen van gelijkgestemden middels vrienden, volgers en likes. Daarnaast zorgt de overweldigende hoeveelheid informatie die via het internet beschikbaar is voor een sterke mate van selectieve blootstelling: mensen zien, horen en overwegen zaken die sporen met bestaande attitudes en preferenties. Tegelijkertijd zijn de vraagstukken op zowel micro-­‐ als macroniveau over bijvoorbeeld gezondheid, milieu, democratie of innovatie complexer dan ooit. Gaat digitalisering ons erfgoed redden? Kernzin: Met behulp van nieuwe data kunnen we systematische antwoorden zoeken op vragen over culturen en hun materiële nalatenschap. Ook kunnen we beter grip krijgen op de relatie tussen materieel en immaterieel erfgoed. Voorts spelen ontwerpende aspecten een rol. Het betreft de toegankelijkheid van het bronnenmateriaal: voor onderzoekers zijn efficiënte data en tekst mining-­‐technieken en methoden cruciaal voor het betekenisvol kunnen 15 112 113 114 115 117 ontsluiten van erfgoed. Big data: kunnen we grote datasets en het verzamelen daarvan benutten voor het realiseren van waarden, het genereren van inzichten en het verkrijgen van antwoorden? Kernzin: algoritmen (…) maken het mogelijk om gegevens snel te doorzoeken, ordenen, verwerken en gebruiken, veelal online en in real time. Efficiëntie, kwaliteit, validatie en betrouwbaarheid zijn belangrijke aspecten hierbij. Wiskunde en informatica gaan hand in hand om de grote vragen rond algoritmen te lijf te gaan. Denk hierbij aan distributed/streaming technologieën. Data-­‐analyse en -­‐visualisatie zijn speerpunten van het huidige en toekomstige ICT-­‐onderzoek. Deze vraag raakt tevens aan onderzoek naar privacy, transparantie en informatievrijheid en aan de vraag of big data ons begrip van de wereld in het algemeen veranderen. Kunnen we taaltechnologie ontwikkelen waarmee onze computers (smartphones, tablets) met ons kunnen communiceren? Kernzin: (…)kent vele uitdagingen op het terrein van taal-­‐ en spraakherkenning, -­‐synthese en -­‐modificatie, zoals bijvoorbeeld het overwinnen van de problemen veroorzaakt door de meertaligheid van internet. Voor internationale informatie-­‐uitwisseling, samenwerking en handelscontacten is het belangrijk intelligente zoekmachines te ontwikkelen. Daarmee zouden we ook op grond van onderzoek van big data ontwikkelingen in de markt of de maatschappij kunnen voorspellen. Hoe kunnen we ‘dingen’ (hardware) altijd en overal met elkaar verbinden en de rekensnelheid van processoren verder verhogen bij een lager energieverbruik? Kernzin: grote hoeveelheden gegevens die worden genereerd en uitgewisseld, vragen om softwareontwikkeling om deze data te kunnen verwerken en om te zetten in real-­‐time bruikbare informatie. De maatschappelijke betekenis en invloed van deze toenemende datasnelheid, -­‐dichtheid en -­‐uitwisselbaarheid voor de samenleving is ook onderwerp van studie. Hoe bouwen en onderhouden we software die morgen ook nog werkt? Kernzin: Wetenschappelijke uitdagingen liggen op het vlak van nieuwe manieren van software ontwikkelen, het ontwikkelen van software die zichzelf kan repareren, onderzoek naar adaptiviteit en configureerbaarheid van systemen, en nieuwe methoden om kwetsbaarheden en fouten in software te detecteren. Economische kansen liggen in het ontwerpen en bouwen van innovatieve methoden en technieken en in het beheersbaar houden van de kosten van softwareontwikkeling en systeemonderhoud. Wat gaan de kwantum-­‐computer en het kwantum-­‐internet voor ons betekenen? Kernzin: Zal (de kwantum) computer innovatie op indrukwekkende wijze versnellen? Is het internet nog veilig als er een kwantumcomputer bestaat, of kan het juist veel veiliger worden? (…) nieuwe materialen, chipstructuren en software en wiskundige algoritmes (zijn) nodig. We moeten ook van tevoren nadenken over maatschappelijke en economische kansen van deze technologie. 16 121 123 124 127 131 132 Kunnen we (bio-­‐)elektronica ontwerpen die direct met ons lichaam communiceert, en materialen en technologie die lichaamsfuncties herstellen of ondersteunen? Kernzin: (…) technologieën die een extensie van de menselijke functies vormen. Of (…) systemen die biologische functies van mens en dier vertalen in hard-­‐ en software voor specifieke doeleinden, zoals geur-­‐ of versheidsindicatoren. Of (…) uitvindingen die instrumenten voor sturing binnen sociale netwerken opleveren. Er is (…) een raakvlak met het terrein van de mens-­‐computerinteractie dat op zijn beurt deels weer past in het onderzoeksgebied van de kunstmatige intelligentie en dat van de data science. Hoe krijgen we grip op de onvoorspelbaarheid van complexe netwerken en chaotische systemen? Kernzin: Uitdagingen liggen op uiteenlopende terreinen, van te ontwikkelen statistische methoden voor het empirisch evalueren van netwerkmodellen en het bepalen van betrouwbaarheidsmarges bij conclusies uit complexe datasets, tot grafentheorie, algoritme-­‐analyse, matrixoperaties en ontwikkelen en valideren van modellen van systemen met niet-­‐lineair gedrag. Er is een raakvlak met vloeistofdynamica, klimaat, ecologie en socio-­‐economische systemen. Hoe slaan we de brug tussen verschillende schalen bij het modelleren van dynamische systemen, zoals stromingen van en in vloeistoffen en gassen? Kernzin: Veel stromingen kenmerken zich door complexe schaalinteracties, van moleculaire tot mondiale schaal. Uitdagingen zijn het analyseren van grootschalige datasets van simulaties van multischaal modellen, grote datasets uit experimenten en de assimilatie van verschillende datatypes in complexe modellen. Toepassingen liggen in uitlopende terreinen zoals in weersvoorspelling, droogprocessen in de industrie, getijden en voorspelling van hoogwater, koeling van micro-­‐elektronica, aerodynamica van vliegtuigen en windmolens. Wat zijn de oorsprong, geschiedenis en toekomst van het heelal? Kernzin: nader in te vullen. Hoe ontstaan en evolueren melkweg-­‐stelsels, sterren en planeten? Kernzin: (Er) is (…) een duidelijke verbinding met de astrochemie, de informatica en de wiskunde en zijn er raakvlakken met het thema zelforganisatie. Big data, grootschalige gegevensverzameling, is bij uitstek een thema bij deze vraag. Hoe kunnen we met ruimte-­‐vaartuigen en telescopen meer begrijpen van het heelal en ons zonne-­‐stelsel exploreren? Kernzin: nader in te vullen. 17 Bijlage B: Leidraad Output Routeworkshop (21 maart 2016) Tot nu tot zijn alle routes uitgewerkt aan de hand van verschillende vraagstukken (ook wel aangeduid als: aspecten, thema’s, tafels, bollen, gamechangers, e.d.). Dit mag echter niet tot nieuwe versplintering leiden. De output van de routes begint daarom met een verbindende, inleidende tekst. Vervolgens worden de verschillende onderdelen van de route nader uitgewerkt. BESCHRIJVING ROUTE ALGEMEEN (covernotitie) -­‐ Wat is de inhoud van de route? Op welke NWA vragen heeft deze betrekking? Dit is vooral voor nieuwe routes belangrijk. -­‐ Hoe is de route uitgewerkt in verschillende vraagstukken? Wat is de relatie tussen deze vraagstukken? BESCHRIJVING PER VRAAGSTUK Inhoud: vraagstuk, impact en vernieuwing Hoe luidt uw vraagstuk? Formuleer de vraag en licht deze toe in max 5 regels. Wat is de maatschappelijke/wetenschappelijke/economische impact van uw vraagstuk, oftewel: welke maatschappelijke/wetenschappelijke vraag denkt u op te lossen en wat is de economische meerwaarde van die oplossing (indien aan de orde)? Via welke vernieuwende invalshoek, verbinding of aanpak (ook wel: gamechanger) denkt u uw vraagstuk op te lossen? Motiveer de vernieuwing en de oplossingsrichting. Max 10 regels. Aan welke maatschappelijke of wetenschappelijke hogere-­‐orde opgave draagt uw vraagstuk bij? Denk aan: duurzame energievoorziening, gezond voedsel voor iedereen, …; onderzoek naar leven op andere planeten, … Verbindingen Welke typen onderzoek zijn nodig om uw vraagstuk op te lossen? Denk aan fundamenteel, strategisch, praktijkgericht, normatief, … Welke (wetenschappelijke) disciplines zijn nodig om uw vraagstuk op te lossen? Denk aan psychologie, internationaal recht, neurologie, sociolinguïstiek, landinrichting, … Welke transdisciplinaire samenwerking is nodig om uw vraagstuk op te lossen, oftewel: welke niet-­‐wetenschappelijke kennis is van belang om uw vraagstuk op te lossen? Bv: de plaatselijke bevolking die kan helpen een gebied in kaart te brengen. Welke sectoren/organisaties (inter)nationaal zijn nodig om uw vraagstuk op te lossen? Het gaat niet om naam en toenaam, maar om typen organisaties, zoals: kennisinstellingen publiek en privaat, bedrijfsleven/mkb, overheid, collectebusfondsen, belangen-­‐ en vertegenwoordigende organisaties, …. Welke organisaties hebben de intentie om aan uw vraagstuk deel te nemen? Het gaat niet om naam en toenaam maar om typen organisaties. Positie in het wetenschaps-­‐ en innovatiesysteem Op welke wetenschappelijke, maatschappelijke en/of economische sterktes in Nederland bouwt uw vraagstuk voort, oftewel: wat legitimeert onderzoek naar uw vraagstuk in Nederland? 18 Wees specifiek: verwijs naar infrastructuur, kennisinstellingen, Nobel-­‐ en Spinozaprijswinnaars, … In welke onderzoeks-­‐ en/of beleidsagenda’s dan wel roadmaps (inter)nationaal is uw vraagstuk opgenomen en hoe verhoudt uw vraagstuk zich tot deze agenda’s? Welke lopende onderzoeksprogramma’s (inter)nationaal raken aan uw vraagstuk en wat is er vernieuwend aan uw vraagstuk ten opzichte van de lopende programma’s? Middelen Wat is de financiële omvang van de lopende programma’s zoals hierboven benoemd? Het gaat om een orde van grootte, niet om exacte bedragen, bv 1-­‐5 M p/j. Welke financieringsopties ziet u, en hoeveel kunt u daarbij (max) aan subsidie inwinnen? Denk aan overheden, NWO, bedrijven, collectebusfondsen; regionaal, (inter)nationaal. Van welke bestaande infrastructuur zou u graag gebruikmaken en hoe schat u de kosten in? Het gaat om een orde van grootte, niet om exacte bedragen. Welke additionele middelen zijn nodig om de vernieuwende aanpak van uw vraagstuk mogelijk te maken? Denk aan een omvang van M1 -­‐ M10 p/j; het gaat om een orde van grootte. NWA-­‐interne vragen Van welke NWA-­‐vragen is uw vraagstuk een uitwerking? Noem vraagnummers en vragen. Onder welke route valt uw vraagstuk? Met welke andere route is er overlap, en hoe bent u tot afstemming gekomen? 19