Dynamiek van infectieziektenverspreiding Agent based modeling Besmetting in netwerken Roel Bakker Creating 010 Hogeschool Rotterdam 1 Inhoud Wie is Roel Bakker? Overzicht werk voor Creating 010 2 Wie is Roel Bakker ? http://www.linkedin.com/in/roelbakker10 http://scholar.google.nl/citations?user=GKPr_tAAAAAJ&hl=nl Hoofddocent bij Informatica big data (Hadoop), data science (statistiek, R, Twitter data), Java, databases, cryptografie modelleren van infectieziektenverspreiding, met name HIV/SOA Eigen bedrijf: Skardahl BV (0.1 fte) simulatiesoftware Onderzoeker bij Creating 010 Achtergrond: CMI, HR Onderzoeker bij afd. Maatschapplijke Gezondheidszorg, Erasmus MC (0.2 fte) (0.5 fte), (0.2 fte) UvA (promotie, biologie/(elektro)fysiologie), RU Nijmegen, Univ Wageningen ABN Amro: technisch IT-specialist, IT-architect Werk voor Creating 010 SIA Raak project – professsionals supported architectuur SunnyApp (simulatieterrasbezetting) Techniek van agent based modeling ligt in het verlengde van werk Erasmus MC meer gericht op software architectuur van simulatiemodellen 'magic tree' data structuur ontwerp complexe agent based (netwerk) modellen vs eenvoudige deterministische modellen CyberDEW project (vanaf 1 feb 2013) vergelijking IDS (intrusion detecten systems) Achtergrond: modelleren van infectieziektenverspreiding http://anintroductiontoinfectiousdiseasemodelling.com/ MGZ, Erasmus MC infectieziektenmodellen STDSIM (HIV/SOA) Onchosim (rivierblindheid) Schistosim (schistosomiasis) Lymfasim (elephantiasis) Lepra, TB kankerscreeningsmodellen diverse varianten van MISCAN: borstkanker, baarmoederhalskanker, colonkanker, etc 5 Modelleren van infectieziektenverspreiding http://anintroductiontoinfectiousdiseasemodelling.com/STD STDSIM STDSIM is een complex model, het simuleert hypothetische individuen in een bevolking inclusief: geboorte, sterfte, immigratie, emigratie seksuele relaties (incl concurrency), prostitutiecontacten, oneoff contacten verschillende SOA en HIV interventies: condoomgebruik, minder partners, SOA behandeling tgv symptomen, massabehandeling, vaccinatie, circumcision (M), screening, behandeling met AIDS remmers (incl UTT) 6 Recente toepassingen STDSIM (submitted to The Lancet) 7 Recente toepassingen STDSIM (to be resubmitted to PLoS Medicine) 8 STDSIM - example sexual networks WB profile 1: monogamy, CS 9 STDSIM - example sexual networks WB profile 3: concurrency, no CS 10 STDSIM - example sexual networks WB profile 2: concurrency, CS 11 STDSIM: te complex ??? STDSIM: complex model, complexe software te veel een 'black box' risico op fouten verborgen 'geheimen' (klein) deel van mijn werk voor Creating 010 zoeken naar een oplossing voor het algemene probleem van complexe modellen / software 12 Soorten modellen deterministisch compartimentenmodel; macroscopisch simulatie van fracties vd bevolking dmv continue toestandsvariabelen model beschreven door stelsel differentiaalvergelijkingen eenvoudig te implementeren, documenteren en verifieren SIR model (vgl reactiekinetiek van chemische reacties) stochastisch, discrete; microscopisch simulatie van aantallen individuen in een bepaalde toestand mbv discrete variabelen en stochastiek (RNG, trekkingen uit verdelingen) relatief eenvoudig te implementeren, documenteren en valideren voordelen: discrete bevolkingsgrootte, betrouwbaarheidsintervallen (bijv bij eliminatievraagstukken) nadelen: complexer, minder snel (elke toestandsovergang is een event) vgl reactiekinetiek waar het gedrag van individuele moleculen wordt gesimuleerd, bijv (stochastic simulations algorithms, Gillespie) 13 Soorten modellen deterministisch compartimentenmodel; macroscopisch S I R stochastisch, discrete; microscopisch 14 SIR model http://www.epidemics.elsevier.com/ http://demonstrations.wolfram.com/SIREpidemicDynamics/ S simple SIR (susceptible, infected, removed) model : deterministic and compartmental I R 15 Soorten modellen individual / agent based model simulatie van individuen heterogeniteit ('niet alle moleculen van een soort zijn gelijk') realistisch (maar veel parameters) andere processen dan Poisson processen (Poisson proces: vaste kans per tijdseenheid => duur tot event uit exp verdeling) 'alles is mogelijk' nadelen: validatie/verificatie van model netwerk model als individueel model, niet alleen random contacten tussen individuen (in groepen), maar contact via relaties (links) voordelen: realistisch nadelen: complex, dynamiek van netwerk (begin/einde van link, links tussen wie?) 16 17 18 19 Agent Based Modeling Agent Based Modeling (incl network modeling) is nodig (zie Nature, Doyne Farmer) wordt populairder (oa tgv rekenkracht van PCs) is de enige voor de hand liggende manier om processen in netwerken te bestuderen 20 Complexiteit van ABM - 1 Hoe om te gaan met software complexiteit? goede applicatieve infrastructuur software libraries voor agent based modeling (Skardahl) onderdelen van de Apache Commons Math library getest mbv R slimme event scheduler (2x sneller dan Java PQ) 'Abstract Finite State Machine' 'Magic Tree' (publicatie in voorbereiding) gedeeltelijk genereren van applicatie specificeer model als deterministisch compartimenten model genereer het discrete stochastische model (uit de 'rates' vd differentiaalvergelijkingen) genereer een ABM zonder heterogeniteit maar met agents (objecten) ipv alleen aantallen vergelijk met stochastisch model en deterministisch model voeg heterogeniteit toe 21 Open issues netwerk aspecten zijn niet eenvoudig te verifieren misschien wel te toetsen aan theorie als alle 'nodes' gelijk zijn? visualisatie veel inzicht in dit soort complexe modellen is te krijgen door het gedrag te visualiseren 22 Infectiedruk in netwerken (waar ik wakker van lig...) NB vervang 'infectie' door alles wat 'besmettelijk' is (gedrag, nieuws, trend, malware) Is het mogelijk om op een willekeurig moment i/d tijd te voorspellen wat de kans op besmetting is van M (midden) en R (rechts)? Vooral het risico dat R loopt is interessant..... L R M 23 Infectiedruk in netwerken (waar ik wakker van lig...) bij constante contact rate en transmissiekans Pm(t) = 1 – exp(-bt) L R M 24 Simulatie terrasbezetting Hoe werkt de simulatie? Mensen in verschillende toestanden: Terrassen van verschillende grootten, bijv op zoek (10 min), op terras (30 min), winkelen (2u) 10, 20, 40, 100 stoelen Aantal terrassen Aantal mensen Mensen kiezen terras at random, gewogen naar grootte 25 Simulatie terrasbezetting Demo – sorry, (nog) geen mooie visualisatie.. 26 Toekomst SIA Raak aansluiten van simulatie op Data Space API Agent based modeling nieuwe toepassingen (netwerk modellen) publiceren 27 Vragen / discussie 28