Mobiliteit en Logistiek Van Mourik Broekmanweg 6 Postbus 49 2600 AA Delft www.tno.nl TNO-rapport T 015 269 68 61 F 015 269 68 54 ATMO 5g Lange Termijn Reistijdschatter Datum 28 december 2005 Auteur(s) Ir. Gerdien Klunder (TNO) Dr. Thierry Verduijn (TNO) Dr Hans van Lint (TU Delft) Exemplaarnummer Oplage Aantal pagina's Aantal bijlagen Opdrachtgever Projectnaam Projectnummer nvt nvt 58 <number of appendices> Transumo ATMO 5g 016.75042 Alle rechten voorbehouden. Niets uit deze uitgave mag worden vermenigvuldigd en/of openbaar gemaakt door middel van druk, foto-kopie, microfilm of op welke andere wijze dan ook, zonder voorafgaande toestemming van TNO. Indien dit rapport in opdracht werd uitgebracht, wordt voor de rechten en verplichtingen van opdrachtgever en opdrachtnemer verwezen naar de Algemene Voorwaarden voor onderzoeksopdrachten aan TNO, dan wel de betreffende terzake tussen de partijen gesloten overeenkomst. Het ter inzage geven van het TNO-rapport aan direct belang-hebbenden is toegestaan. © 2005 TNO TNO-rapport 2 / 58 Inhoudsopgave 1 1.1 1.2 1.3 1.4 Inleiding .......................................................................................................................... 3 Aanleiding en doelstelling ............................................................................................... 3 Plan van Aanpak .............................................................................................................. 3 Resultaten ........................................................................................................................ 4 Leeswijzer........................................................................................................................ 4 2 2.1 2.2 2.3 2.4 2.5 2.6 2.7 2.8 Literatuur overzicht ...................................................................................................... 6 Opzet van het literatuur onderzoek .................................................................................. 6 Betrouwbaarheid reistijden .............................................................................................. 6 Effecten van weerscondities op het verkeer..................................................................... 9 Verklarende factoren voor reistijden ............................................................................. 14 Reistijden voorspellen m.b.v. historische data met verklarende factoren:..................... 18 Reistijdvoorspellingsmethoden m.b.v. historische data:................................................ 15 Effect van opdelen van de route voor reistijdvoorspelling: ........................................... 25 Conclusies Liteartuuronderzoek .................................................................................... 25 3 3.1 3.2 3.2.1 3.2.2 3.2.3 3.3 3.4 3.5 Analyse van Regiolab data A13-A20-A16.................................................................. 27 Geselecteerde traject ...................................................................................................... 27 Verkeers-, meteo en overige data................................................................................... 28 Data van gerealiseerde reistijden ................................................................................... 28 Meteodata ...................................................................................................................... 29 Vakanties en evenementen............................................................................................. 30 Analyse van de gerealiseerde reistijden ......................................................................... 31 Analyse van gerealiseede reistijden en neerslagdata ..................................................... 39 Conclusies...................................................................................................................... 40 4 Voorspelmethode ......................................................................................................... 41 5 5.1 5.2 5.3 5.4 Testen van voorspelmethode....................................................................................... 45 Opzet van testmethode................................................................................................... 45 Resultaten ...................................................................................................................... 45 Reflectie op resultaten en geraadpleegde lieratuur ........................................................ 47 Verbeteringsmogelijkheden ........................................................................................... 47 6 6.1 6.2 Conclusies en aanbevelingen....................................................................................... 49 Belangrijkste bevindingen ............................................................................................. 49 Onderzoeksagenda ......................................................................................................... 49 TNO-rapport 1 3 / 58 Inleiding 1.1 Aanleiding en doelstelling Een lange termijn reistijdvoorspeller geeft een voorspelling voor de te verwachten reistijd voor een tijdstip dat minimaal vier uur in de toekomst ligt. Dit kan een voorspelling van de reistijd zijn voor een tijdstip later op de dag of voor (over-) morgen. Voor het maken van een lange termijn reisvoorspelling kan weinig informatie worden ontleend aan de huidige situatie op het wegennet. Een lange termijn reistijdvoorspeller gebruikt daarom in het algemeen historische gegevens om de te verwachte reistijd te bepalen. Meestal wordt de voorspelling gekoppeld aan kenmerken zoals het tijdstip-opde-dag en dag-van-de-week waarop de reis gaat plaatsvinden. Over de effecten van factoren zoals weer, evenementen, wegwerkzaamheden, vakanties etc. bestaat nog veel onduidelijkheid. Op dit moment worden lange termijn reistijdvoorspellers nauwelijks gebruikt in de praktijk. Navigatiesystemen en routeplanners gebruiken gemiddelde snelheden die gelden voor de gehele dag bij het berekenen van reistijden. De verwachting is dat dit de komende jaren zal veranderen. De variabiliteit en onbetrouwbaarheid van reistijden als gevolg van congestie zal de komende jaren toenemen waardoor de behoefte aan goede reistijdvoorspellingen toeneemt. Provincies zoals Zuid-Holland en Brabant zijn ook begonnen met het inwinnen van verkeersgegevens op het onderliggend wegennet. De overheid stimuleert actief de ontwikkeling van de markt voor reisinformatie (ICT in Bereikbaarheid/Haaglanden). Het doel van het TRANSUMO-ATMO-5g deelproject is het ontwikkelen van een lange termijn reistijdvoorspeller die factoren als weer, evenementen, vakanties en wegwerkzaamheden meeneemt in de voorspellen van de reistijd. De onderzoeksvragen voor het onderzoek zijn als volgt geformuleerd: • Wat is de invloed van de factoren weer, evenementen, vakanties en wegwerkzaamheden op gerealiseerde reistijden? • Welke voorpelmethoden en -technieken kunnen worden gebruikt om deze factoren in voorspellingen te verwerken? • Wat zijn de effecten van het meenemen van deze factoren op de kwaliteit van reistijdvoorspellingen? Dit project bouwt voort op de kennis en ervaring van TNO en TU Delft op het gebied van reistijdschatters en voorspellers. Uit het onderzoek Predictime, dat in 2003 door TNO is uitgevoerd is naar voren gekomen dat de k-nearest neighbour methode goede perspectieven biedt voor het ontwikkelen van de lange termijn reistijdvoorspeller. De toepassingsmogelijkheden van deze methode zal in dit onderzoek worden onderzocht. 1.2 Plan van Aanpak Het plan van aantal onderscheidt drie stappen: Stap1: Data verzameling en keuze van traject voor onderzoek TNO-rapport 4 / 58 Eerst wordt een keuze gemaakt voor het traject waarvoor de reistijden worden voorspeld. Dit traject is de proeftuin voor het ontwikkelen en testen van de voorspelmethode. De keuze voor het traject wordt gebaseerd op beschikbaarheid van data en een inschatting van de aanwezigheid van variatie in de reistijden als gevolg van congestie. Voor dit traject worden de volgende werkzaamheden uitgevoerd: 1. Verzamelen van verkeersgegevens 2. Genereren van reistijdprofielen 3. Verzamelen van gegevens over weer, vakanties en evenementen, etc. Stap 2: Ontwikkelen van voorspelmethode reistijden In stap 2 wordt op basis van beschikbare kennis bij TNO en TU Delft een nieuwe voorspelmethode ontwikkeld voor lange termijn reistijden die rekening houdt met een breed scala aan verklarende factoren zoals weer, evenementen, vakanties en wegwerkzaamheden. De basis voor deze methode is de k-nearest neighbour methode. De volgende activiteiten worden uitgevoerd: 1. Literaturstudie naar de relatie tussen reistijden en factoren als dag-van-deweek, tijdstip-van-de-dag, weer, evenementen, etc. 2. In kaart brengen van correlaties tussen deze factoren en reistijden door analyse van de verzamelde data. 3. Uitwerken van de k-nearest neighbour methode met de verklarende factoren 4. Implementeren en kalibreren van de k-nn methode. Stap 3: Demonstreren van de reistijdvoorspeller voor het geselecteerde traject In deze stap wordt een beperkte demonstratiemodel gebouwd en wordt een plan opgesteld hoe de voorspelmethode verder kan worden verbeterd en hoe de voorspelmethode kan worden uitgebreid naar een geheel verkeersnetwerk.. De werkzaamheden betreffen: 1. Bouwen van de demonstrator 2. Opstellen van plan voor vervolgonderzoek en toepassen van de voorspeller 1.3 Resultaten Er zijn in het project een viertal resultaten gerealiseerd: o o o o 1.4 Overzicht van de wetenschappelijke literatuur op het gebied van reistijdvoorspellers voor de lange termijn. Voorspellingsmethode voor lange termijn reistijdvoorspellingen waarin de invloed van weer en andere factoren wordt meegenomen. Demonstrator van de lange termijn reistijdvoorspeller Onderzoeksagenda voor het verbeteren van de voorspellingsmethode en het uitbreiden van het reistijdvoorspeller naar netwerken. Leeswijzer In hoofdstuk 2 worden een overzicht gepresenteerd van de verkeerskundige literatuur. Daarbij worden de resultaten van onderzoek naar de effecten van weer, evenementen, etc op reistijden is besproken en wordt de literatuur over voorspellingsmethoden die met deze factoren meenemen samengevat. In hoofdstuk 3 wordt de keuze voor het traject waarvoor de reistijden worden voorspeld toegelicht en worden de correlaties tussen de reistijden en verklarende factoren onderzocht. Hoofdstuk 4 presenteert de voorspelmethode. De resultaten van de voorspelmethoden worden in hoofdstuk 5 TNO-rapport 5 / 58 weergegeven. Conclusies en richtingen voor verdere ontwikkeling van de reistijdvoorspeller worden besproken in hoofdstuk 6. TNO-rapport 2 6 / 58 Literatuur overzicht 2.1 Opzet van het literatuur onderzoek Voor de literatuurstudie voor ATMO 5G zijn relevante artikelen opgezocht via een groot aantal bronnen en zoekmachines op internet (o.a. Science Direct) en van de cdroms van de proceedings van de TRB Annual Meetings en ITS world congressen van afgelopen jaren (o.a. Nagoya, Chicago, Berlijn) De bestudeerde papers kunnen ingedeeld worden naar een aantal categorieën van onderwerpen die voor ATMO 5G relevant kunnen zijn: • Betrouwbaarheid reistijden; • Effecten van weerscondities op het verkeer; • Verklarende factoren voor reistijden; • Reistijdvoorspellingsmethoden m.b.v. historische data; week, tijdstip van de dag, weer, grote evenementen, incidenten etc; • Effect van opdelen van de route voor reistijdvoorspelling. In de volgende paragrafen worden de geidentificeerde artikelen en papers kort gepresenteerd (door middel van een abstract). Ook worden kort de voor ATMO 5g relevante aspecten en resultaten aangegeven. 2.2 Betrouwbaarheid reistijden Li, R. (2004), Examining travel time variability using AVI data, Institute for Transport Studies, Monash University working paper, pp.16; pfd: RuiminLi_CAITR2004.pdf Abstract Knowledge of travel time variability is valuable for improving the reliability of traffic information services and increasing the accuracy of travel time predictions. To identify the source of travel time variability, information on the travel time distribution properties is needed. Most investigations of travel time distributions rely on data from probe vehicles and consequently have limited sample size. Based on extensive Automatic vehicle identification (AVI) data collected from the CityLink Tollway in Melbourne, a comprehensive investigation of travel time distributions was conducted in terms of various time windows. Given the number of factors affecting travel time variability and their interaction effects, multiple regression with two-way interaction terms was used to quantify the contribution of the various sources to the variability in travel time. The application of the methodology to two groups of data, namely travel times in morning peak and afternoon peak, demonstrates that they have distinctive sources of variability. Morning peak travel times vary mostly because of demand related factors, while 25% variability of travel times in afternoon peak is related to capacity related factors. Het doel van het onderzoek beschreven in dit paper is het analyseren van eigenschappen van reistijdverdelingen en het identificeren van factoren die bijdragen aan de reistijd. Het belang van de betrouwbaarheid van reistijden wordt benadrukt (belangrijker dan de reistijd zelf). Data voor de studie is verkregen van Automatic Vehicle Identification op een tolweg in Melbourne Australie. TNO-rapport 7 / 58 De reistijdverdelingen gaan steeds meer lijken op een normale verdeling naarmate het tijdvenster kleiner wordt. Voertuig-voertuig variabiliteit in reistijd is gerelateerd aan de gemiddelde reistijd en verklaart ongeveer de helft van de reistijdvariatie in de ochtendspits en buiten de spits, maar relatief weinig voor de avondspits. Chen C. et al. (2003), Travel time reliability as a measure of service quality, Proceedings of Annual Meeting of the Transportation Research Board, National Research Council, Washington DC, pp. 22; pdf: travel time reliability.pdf Abstract Statistics from a corridor along Interstate 5 in Los Angeles show that average travel time and travel time variability are meaningful measures of freeway performance. Variability of travel time is an important measure of service quality for travelers. Travel time can be used to quantify the effect of incidents, and incident information can help reduce the travel time uncertainty. Predictability of travel time is a measure of ITS benefits. These measures differ from those defined in the HCM and other aggregate measures of delay. Voor een corridor in Los Angeles, een gedeelte van de I-5, worden reistijden geanalyseerd. Er worden maten geïntroduceerd die de reistijd en de variabiliteit kwantificeren, zoals Level of Service, vertraging en reistijd. Er wordt aangegeven dat men aan de standaardafwijking van reistijden hogere kosten toekent dan aan de reistijd zelf. Uit de data van de I10 blijkt dat er een sterke correlatie is tussen de gemiddelde reistijd en de standaardafwijking; een hogere reistijd heeft ook een hogere standaardafwijking. Het 90e percentiel wordt beschouwd als een goede maat die de gemiddelde reistijd en de variabiliteit combineert. Op de I10 is de bandbreedte tussen het 10e percentiel en het 90e percentiel rond de 20 minuten, op een mediaan reistijd tussen de 30 en 40 minuten (resultaten worden alleen weergegeven in figuren). Er wordt ook gedemonstreerd dat indien het optreden van incidenten vooraf bekend is, dit leidt tot een betere inschatting van de reistijd, zodat de vertraging met 5.9% verbeterd kan worden. De onderzoekers geven tenslotte aan dat ze geïnteresseerd zijn in het effect van weer, geplande strookafsluitingen en evenementen op reistijden, als aanbeveling voor verder onderzoek. Cohen, H., Southworth, F. (1999), On the Measurement and Valuation of Travel Time Variability Due to Incidents on Freeways, Journal of Transportation & Statistics, pp. 123-131; pdf: Tt variability due to incidents.pdf . Abstract Incidents on freeways frequently cause long, unanticipated delays, increasing the economic cost of travel to motorists. This paper provides a simple model for estimating the mean and variance of time lost due to incidents on freeways. It also reviews methods for assigning a monetary value to the variability that such incidents introduce into daily travel. The paper offers an easy-to-implement approach to measuring the performance of freeway incident reduction strategies, an approach that should be useful in early project selection exercises where a sketch planning process is used to identify promising actions. In dit paper wordt een model opgesteld om de vertraging door incidenten te kunnen schatten en er worden evaluatiemethoden gegeven voor de betrouwbaarheid van reistijden. Hiervoor is een literatuuronderzoek uitgevoerd over het waarderen van betrouwbaarheid van reistijden. Twee eenvoudige modellen zijn uitgekozen om het belang van de betrouwbaarheid van reistijden te illustreren; het eerste model geeft extra TNO-rapport 8 / 58 kosten (disutility) aan variabiliteit van de reistijd (vb. standaarddeviatie), de tweede verbindt extra kosten aan de tijd die in de file wordt doorgebracht. De waarden die in de literatuur zijn gevonden (betrouwbaarheid vs. reistijd) verschillen sterk. Lint, J.W.C., Zuylen, H.J. van (2005), Monitoring and predicting freeway travel time reliability: using width and skew of the day-to-day travel time distribution, Proceedings of Annual Meeting of the Transportation Research Board, pp. 15; pdf: Monitoring and predicting freeway travel time reliability TRB 05-0231.pdf. Abstract: Day-to-day variability of route travel times on for example freeway corridors is generally considered closely related to the reliability of a road network. The more travel times on some routes are dispersed in a particular time-of-day (TOD) and day-of-week (DOW) period, the more unreliable travel times are conceived. In literature many different aspects of the day-to-day travel time distribution have been proposed as indicators of reliability. Mean and variance do not provide much insight since these metrics tend to obscure important aspects of the distribution under specific circumstances. We argue that both skew and width of this distribution are relevant indicators for unreliability, and consequently propose two reliability metrics, based on three characteristic percentiles, that is, the 10th, 50th and 90th percentile for a given route and TOD/DOW period. High values of either metric indicate high travel time unreliability. However, the weight of each metric on travel time reliability may be application or context specific. The practical value of these particular metrics is in the fact that they can be used to construct so-called reliability maps, which visualize not only the unreliability of travel times for a given DOW/TOD period, but also help identify DOW/TOD periods in which it is likely that congestion sets in (or dissolves). This means identifying the uncertainty of start, end and hence length of morning and afternoon peak hours. Combined with a long-term travel time prediction model, the metrics can be used to predict travel time (un) reliability. Finally, the metrics may be used in discrete choice models as explanatory variables for driver uncertainty. In dit paper zijn twee betrouwbaarheidsmaten voor reistijden geïntroduceerd die meer informatie geven dan het gemiddelde en de variantie en op basis waarvan een duidelijk onderscheid gemaakt kan worden van verschillende verkeersfases (congestie, free flow, overgang). Hiermee kan voor lange termijn voorspellingen aangegeven worden hoe de betrouwbaarheid van de reistijd varieert per dag van de week en tijdstip van de dag en op welke tijdstippen van de dag (afh. van dag van de week) congestie in zet of afbouwt. De oorzaken van onbetrouwbaarheid zijn niet verder onderzocht. Conclusie betrouwbaarheid en variabiliteit van reistijden Betrouwbaarheid van reistijden wordt hoger gewaardeerd dan de reistijd zelf. De waarden die in de literatuur zijn gevonden voor de waardering van betrouwbaarheid vs. reistijd verschillen echter sterk. Er worden verschillende maten geïntroduceerd die de betrouwbaarheid van reistijden weergeven, zoals Level of Service, vertraging, standaardafwijking van de reistijd, het 90e percentiel, de “Misery Index” en skew en width van de reistijdverdeling (Lint, 2005). Mediaan en percentielwaardes zijn robuustere statistieken dan het gemiddelde en de variantie voor het kwantificeren van reistijdbetrouwbaarheid. TNO-rapport 2.3 9 / 58 Effecten van weerscondities op het verkeer Chin, S.M., Franzese, O., Greene, D.L., Hwang, H.L., Gibson, R.C. (2004), Temporary Losses of Highway Capacity and Impacts on Performance: Phase 2. Report No. ORNL/TM-2004/209, pp. 78; pfd: losses of highway capacity.pdf. Abstract The Temporary Loss of Capacity (TLC) study develops estimates of highway capacity losses and delay caused by transitory events, such as construction work zones, crashes, breakdowns, extreme weather conditions, and sub-optimal traffic controls. The scope of the study includes all urban and rural freeways and principal arterials in the nation’s highway system. Impacts other than capacity losses and delay, such as re-routing, re-scheduling, reduced mobility, and reduced reliability, are not covered in this phase of research. Rapport van het Oak Ridge National Laboratory (Tennessee), waarin capaciteitsverlies en vertraging wordt geschat van tijdelijke gebeurtenissen, zoals wegwerkzaamheden, incidenten, extreem weer en sub-optimale verkeersregelingen. Er is zoveel mogelijk gebruik gemaakt van “peer-reviewed studies”. Bij aannames gebaseerd op expert judgement is geprobeerd een onderschatting te geven. De bijdrage aan vertraging op snelwegen en de belangrijkste stroomwegen in de V.S. van incidenten (botsingen) is geschat op 33 %, van slechte weersconditites op 24 %, van wegwerkzaamheden op 21 %, van sub-optimale verkeersregelingen op 13 % en van voertuigen met pech op 9 %. Van de slechte weerscondities werd 90 % van de vertraging veroorzaakt door sneeuw (veranderingen in verkeersvolume door het weer zijn hierbij niet meegenomen). Over het effect van weer op het verkeer worden de volgende conclusies getrokken/ aannames gedaan: Uit eerder onderzoek (Lamm et al., 1990) is gebleken dat snelheden niet bijzonder worden beïnvloed door regen en nat wegdek, totdat de regen het zicht belemmert. Bij een intensiteit van 2400 voertuigen per strook per uur is een afname van de free-flow speed van 7-13 km/h gerapporteerd voor lichte regen en van 13-16 km/h voor zware regen. Het effect van lichte sneeuwval is tussen lichte en zware neerslag. Zware sneeuw heeft een zeer grote invloed; free-flow speed neemt af van 100 naar 60 km/h en de capaciteit neemt af met 30 %. Voor ijsstormen is bij gebrek aan data hetzelfde percentage aangenomen. Over mist zijn geen studies gevonden die het effect op de capaciteit hebben gekwantificeerd; er is uitgegaan van een afname van 20% van de capaciteit en van een veilige snelheid van 50 km/h bij dichte mist. Goodwin, L. C. (2002), Weather Impacts on Arterial Traffic Flow, Mitretek Systems, working paper, pp. 5; pdf: weather impacts on arterial traffic flow.pdf Abstract This paper synthesizes literature regarding weather effects on traffic flow along signalized arterial roadways. Generally, weather impacts traffic by reducing visibility, decreasing pavement friction, as well as impacting driver behavior and vehicle performance (e.g., traction, stability, maneuverability). Weather effects on roads and traffic are presented, relevant literature is reviewed, and findings from the literature are summarized in the conclusion In dit paper is een literatuurstudie gedaan naar weerseffecten op de verkeersstroom (signalized arterial roadways) en naar de mogelijkheden hierop te optimaliseren met verkeerslicht instellingen. Veranderingen in verkeersvariabelen, zoals intensiteit, TNO-rapport 10 / 58 snelheid etc. afhankelijk van het weer en de tijd van de dag, zijn gegeven in procenten. In de literatuur is gevonden dat snelheden afnemen met 10 % tot 25 % bij regen en nat wegdek en 30 % tot 40 % bij sneeuw en sneeuwwegdek. Reistijdvertraging is 11 % bij nat wegdek en meer dan 12 % bij regen, harde wind, slecht zicht en glad wegdek. Knapp. K.K., Kroeger, D., Giese, K. (2000), The Mobility and Safety Impacts of Winter Storm Events in a Freeway Environment, Iowa State University, pp. 86; pdf: winstorm.pdf Abstract: The safety and traffic-flow service qualities of a freeway segment are a function of its prevailing conditions. Good weather, adequate pavement conditions, and an incident-free environment are assumed. Unfortunately, there are many time periods of varying length in which these assumptions are incorrect, and the mobility and safety of a freeway segment are compromised. A more comprehensive knowledge of how poor weather, snow and ice events in particular, impacts the safety and service provided by a freeway will improve the decision-making capabilities of the traveler and those responsible for roadway operations and maintenance. This project will study the traffic characteristics and crash occurrences during winter storm events within the freeway environment. The ability to estimate the operation and safety characteristics of a roadway based on readily available environmental data should assist in the development of winter maintenance standards and policies based on roadway user impacts. In addition, more quantifiable and informed resource allocation and operational-safety response decisions can be made. Based on data from the past, the impacts of a winter storm on traffic volumes and crash occurrence rates will be evaluated and quantified. Gericht op de verkeerseffecten van hevige sneeuwbuien (sneeuwval meer dan 0.2 inch per uur). Aangezien we bij ATMO 5G waarschijnlijk sneeuwval niet als verklarende variabele mee zullen nemen omdat dit zelden voorkomt in Nederland, niet direct relevant. Stern, A.D., Shah, V., Goodwin, L., and P. Pisano (2003), Analysis of Weather Impacts on Traffic Flow in Metropolitan Washington, US Department of Transportation, Federal Highway Adminstration, pp. 20; pdf: AMS2003_trafficflow.pdf. TNO-rapport 11 / 58 Abstract The Federal Highway Administration (FHWA) has been sponsoring research into the impacts of weather on surface transportation. Some of the research involves investigating the travel delay associated with the influence of weather. This paper describes two methods used to approximate the delay given the influence of adverse weather. The first method was regression analysis using surface observations from three Washington area airports. The hourly weather observations from the airports were organised into discrete elements such as Sky Cover, Surface Visibility, Wind Speed, etc. These elements were then converted into categories so that the data could be used later for processing. The travel time data and the weather data was combined by assigning travel times to a weather observation if the travel time lies within thirty minutes before or after the weather observation was made. Since the weather observations did not correlate with specific road segments, regression models were used to predict travel times on the road segments. The second method was intended to be a better approximation of weather conditions along road segments. For this method, weather data from a Doppler radar (works by sensing the reflectivity from a target) was used. The radar data and the travel times were correlated using a Geographic Information System (GIS). The range reference frame of the radar was overlaid onto the road network and then correlated with road segments. Dit paper gebruikt twee methoden om reistijdvertraging door verschillende weerssituaties te schatten op een aantal wegvakken rond Washington D.C., namelijk regressie analyse en “analysis of means”. Reistijden werden verkregen van de (publiek beschikbare) website www.SmarTraveler.com. Bij de eerste methode zijn de volgende weerscondities meegenomen: neerslag, windsnelheid, zicht en conditie van het wegdek (droog, nat, sneeuw/ijs, ijzel). De weerdata waren alleen per weerstation beschikbaar, dus niet nauwkeurig op wegvakniveau. Voor elk wegvak per rijrichting is een regressie model geschat (in totaal 66). Conditie van het wegdek bleek in elk model een verklarende variabele te zijn. In 11 modellen was neerslag een verklarende variabele en in 6 resp. 5 modellen windsnelheid en zicht. Bij het optreden van slechte weerscondities is de reistijdtoename 14%. Voor een specifieke dag met een sneeuwstorm werd de reistijdtoename voorspeld op 53%; de reistijdenbron (de website www.SmarTraveler.com) gaf een reistijdtoename van 155 % aan. De tweede methode werd toegepast met behulp van nauwkeuriger (zowel in ruimte als in tijd) weerdata, ingewonnen met behulp van (Doppler) radar. De weerdata waren per 6 minuten beschikbaar. De reistijden per 5 minuten. Het regressie model voorspelt de reistijdtoename gebaseerd op lineaire verbanden tussen weersvariabelen en reistijd. Indien er sprake was van neerslag, nam de reistijd toe met 24 % in de spits en met 3.5 % in de dalperiode. Aanbevelingen voor vervolgonderzoek zijn regressie analyse met binaire variabelen en het koppelen van de data aan incidenten en congestie variabelen. Agarwal, M., Maze, T.H., Souleyrette, R. (2005), Impact of weather on urban freeway traffic flow characteristics and facility capacity, Final Technical Report, Iowa State Universtity, pp. 20; pdf: weather_impacts.pdf. Abstract Adverse weather reduces the capacities and operating speeds on roadways, resulting in congestion and productivity loss. A thorough understanding of the mobility impacts of weather on traffic patterns is necessary to estimate speed and capacity reductions. Nearly all TNO-rapport 12 / 58 traffic engineering guidance and methods used to estimate highway capacity assume clear weather. However, for many northern states, inclement weather conditions occur during a significant portion of the year. This paper describes how the authors quantified the impact of rain, snow, and pavement surface conditions on freeway traffic flow for the metro freeway region around the Twin Cities. The research database includes four years of traffic data from in pavement system detectors, weather data over the same period from 3 automated surface observing systems (ASOS), and two years of available weather data from 5 road weather information systems (RWIS) sensors at the freeway’s roadside. Our research classifies weather events by their intensities and identifies how changes in weather type and intensities impact the speed, headways, and capacity of roadways. Results indicate that severe rain, snow, and low visibility cause the most significant reductions in capacities and operating speeds. Rain (more than 0.25 inch/hour), snow (more than 0.5 inch/hour), and low visibility (less than 0.25 mile) showed capacity reductions of 10%–17%,19%–27%, and 12 % and speed reductions of 4%–7%, 11%–15%, and 10%–12%, respectively. Speed reductions due to heavy rain and snow were found to be significantly lower than those specified by the Highway Capacity Manual 2000. In dit rapport wordt het effect van slechte weersomstandigheden op het verkeer in de V.S. onderzocht. Dit is vooral van belang voor de noordelijke steden in de V.S., waar sneeuwval vaak voorkomt, terwijl er tot nu toe weinig onderzoek naar gedaan is. Er wordt een klein overzicht gegeven van de literatuur op dit gebied. In een studie in Duitsland is een afname van 9.5 km/h (4 strooks) tot 12 km/h (6 strooks) bij nat wegdek gerapporteerd. In een studie van Ibrahim en Hall werd een snelheidsreductie van 3%5% gerapporteerd bij lichte regen en sneeuw, zware regen 14%-15% en zware sneeuw 30%-40% (klassengrenzen niet gespecificeerd). Liang et al rapporteerde een snelheidsreductie van 8 km/h bij mist en 19.2 km/h bij sneeuw. Vergeleken met de gerapporteerde studies, richt dit paper zich meer op stedelijke gebied, namelijk het snelwegennet van the Twin Cities en specificeert het de klassengrenzen. Er is een database van 4 jaar (2000 – 2004) gebruikt. De resultaten zijn vergeleken met de waarden uit de Highway Capacity Manual en laten hiermee grote verschillen zien. Bij regen neemt de snelheid af met 1%-7% (HCM: 2%-17%), bij sneeuw met 3%-15% (HCM: 8%-40%), bij lage temperaturen 0%-3.6%, bij hoge windsnelheid 1%-1.5% en bij slecht zicht 6%-11% (deze laatste drie zijn niet opgenomen in de HCM). Tevens zijn capaciteitsreducties bepaald. Deze komen beter overeen met de waarden uit de HCM. Han, L.D., Chin, S-M., Hwang, H-L. (2003), Estimating Adverse Weather Impacts on Major US Highway Network, Proceedings of the 82nd Annual Meeting of the Transportation Research Board, pp. 17; pfd: Adverse weather impacts.pdf TNO-rapport 13 / 58 Abstract Adverse weather conditions often diminish visibility, reduce tire-pavement traction, cause drivers to slow down, or increase following distances on highways. Consequently, the driver faces increase in delay, necessity to use alternative/undesirable route, and possibility of postponing or cancellation of travel. The movement of goods can also be adversely impacted resulting in significant losses. This paper presented a framework for estimating the impact, in terms of delay, of adverse weather events on travel in the United States. The speed estimation methodology for travel in adverse weather was based on Highway Capacity Manual. Using GIS and database tools, one can estimate travel delay and other relevant statistics at various resolutions including weather forecast zone, county, FHWA urbanized area, metropolitan area, state, and national levels. The estimation procedure employed NCDC’s Storm Data and FHWA’s HPMS and NHPN databases, which are all publicly accessible. The estimation procedure, which can be implemented repeatedly to assess the change from one year to the next, was used to estimate adverse weather impacts for the year of 1999. It was found that adverse weather events do cause traffic woes and significant delay. In fact, some 50 million vehicle-hours were lost due to fog, ice, and snow events in 1999. The majority of the delay, not surprisingly, occurred during winter and early spring. It is up to transportation professionals to address this issue, now it has been identified and quantified. In dit paper wordt de impact geschat van zware weersomstandigheden in termen van vertraging in de Verenigde Staten. Snelheidsverlaging en capaciteitsverlaging voor regen en sneeuwstormen zijn overgenomen uit de highway capacity manual. Er was geen data voor het effect op de capaciteit van ijsstormen en mist, deze zijn geschat. Er zijn relaties opgesteld tussen snelheid, flow en capaciteit afhankelijk van het weertype. Er is nagegaan waar en wanneer bepaalde weertypes in de V.S. optraden, dit is gekoppeld aan highway segments en zo is de vertraging geschat. Conclusies invloed van weer op verkeersstromen en rijgedrag Weersvariabelen die effect hebben op het verkeer (snelheid, capaciteit etc.) die in bovenstaande papers genoemd worden, zijn sneeuw, neerslag, mist, wind, zicht en gladheid van het wegdek. Sneeuw heeft verreweg het grootste effect. De gerapporteerde effecten, zowel voor sneeuw als voor neerslag, lopen enorm uiteen. Voor sneeuw varieert dit van 3% (snelheidsafname) tot 150% (reistijdtoename). Bij zware sneeuw liggen de genoemde percentages meestal op 30-40%. Bij neerslag varieert de snelheidsafname van 3% tot 15%. Ook is er een reistijdtoename van 24% gerapporteerd. Er wordt verwezen naar een eerdere studie, waaruit bleek dat neerslag pas effect heeft als het het zicht belemmert. Het effect van zowel sneeuw als regen is sterk afhankelijk van de intensiteit van de neerslag. Glad/nat wegdek wordt ook in enkele studies genoemd als weersomstandigheid met een significante invloed. Er wordt bijvoorbeeld een reistijdvertraging genoemd van 11% bij nat wegdek. In het paper van Chin et al wordt echter verwezen naar de studie van Lamm et al., waarin gesteld wordt dat nat wegdek niet van invloed is totdat neerslag het zicht belemmert. Het effect van andere weersomstandigheden zoals mist en wind is nog nauwelijks onderzocht. Uit de gerapporteerde effecten blijkt dat sneeuwval en regen en in mindere mate ook nat wegdek een significante invloed hebben op de snelheid en de reistijd. Deze factoren kunnen een reistijdvoorspelling dus zeker verbeteren, hoewel er over de conditie van het wegdek tegenstrijdige resultaten gerapporteerd zijn. Omdat het effect van neerslag sterk afhankelijk is van de intensiteit van de neerslag, is het voor een voorspelling TNO-rapport 14 / 58 noodzakelijk zeer gedetailleerde neerslaggegevens te gebruiken, zowel in tijd als in plaats. 2.4 Verklarende factoren voor reistijden Onderzoeken naar verklarende factoren voor reistijden m.b.v. historische data. Daarbij ligt de nadruk op het bepalen van correlatie tussen reistijden en mogelijke verklarende factoren voor de variatie in de reistijden. Li, R. (2004), Examining travel time variability using AVI data, Institute for Transport Studies, Monash University working paper, pp.16; pfd: RuiminLi_CAITR2004.pdf Abstract Knowledge of travel time variability is valuable for improving the reliability of traffic information services and increasing the accuracy of travel time predictions. To identify the source of travel time variability, information on the travel time distribution properties is needed. Most investigations of travel time distributions rely on data from probe vehicles and consequently have limited sample size. Based on extensive Automatic vehicle identification (AVI) data collected from the CityLink Tollway in Melbourne, a comprehensive investigation of travel time distributions was conducted in terms of various time windows. Given the number of factors affecting travel time variability and their interaction effects, multiple regression with two-way interaction terms was used to quantify the contribution of the various sources to the variability in travel time. The application of the methodology to two groups of data, namely travel times in morning peak and afternoon peak, demonstrates that they have distinctive sources of variability. Morning peak travel times vary mostly because of demand related factors, while 25% variability of travel times in afternoon peak is related to capacity related factors. Met behulp van multiple regression is bepaald in welke mate tijdstip van de dag, dag van de week, regenval en incidenten verklarend zijn voor de variabiliteit in de reistijd. Zware regenval zorgde voor langere reistijden en een grotere variabiliteit. In de ochtendspits kan 56% van de variabiliteit worden verklaard. Tijdstip van de dag en dag van de week verklaren 53 %. 2% wordt verklaard door regen en incidenten. Interactie effecten verklaren slechts 1 % in de ochtendspits. In de avondspits is dit 7 % en 43 % door tijdstip van de dag, dag van de week, weer en incidenten. Tijdstip van de dag en dag van de week verklaren in de avondspits 25% van de variabiliteit. Chung, E. (2004), Travel time pattern classification with weather data, Proceedings of World ITS Conference Nagoya, pp. 9; pdf: Ttpattern weather.pdf Abstract Previous study using daily rainfall by the author have found that rain is not a factor in classifying travel time. As weather conditions have been observed to affect driving behaviour, this study further investigates the effect of rainfall on travel time in terms of classification.The study uses hourly rainfall measured at a weather station close to the study area. This paper discusses whether using a more precise weather data improves the outcome of the classification or are there other factors that are not taken into consideration. Om na te gaan of neerslag effect heeft op de reistijd, zijn uurlijkse neerslagdata gebruikt van een weerstation in de buurt van het studie traject in Tokyo van april 2000 tot TNO-rapport 15 / 58 september 2003. In een eerdere studie leek dit niet het geval, om dit beter te kunnen onderzoeken zijn nauwkeurigere neerslagdata gebruikt. Een clustering-algoritme (SLR) is toegepast op de data. De gevonden clusters zijn weekdagen, zaterdag, en zondag inclusief vakantiedagen. Regen bleek geen apart cluster te zijn. Ook uit grafieken blijkt dat de reistijd op regendagen moeilijk te onderscheiden is van de reistijd op mooie dagen. Vervolgens is de verkeersvraag op regendagen vergeleken met de verkeersvraag op mooie dagen. De verkeersvraag op regendagen blijkt veel kleiner te zijn, zodat als verklaring aangenomen wordt dat dit de reductie in free-flow speed en capaciteit compenseert. De vraag voor ATMO 5g is of regen geen verklarende factor is voor de reistijd en het gevonden effect voor de verkeersvraag ook geldt voor onze corridor. Iwasaki, M., Kotani, M., Saito, K. (1997), Classification of historical mean speed patterns on a motorway for prediction of near-future traffic flow states, Proceedings of the 4th World Congress on ITS Berlin, pp. 6; pdf: classification speed patterns.pdf. Abstract This paper focused to make historical traffic flow patterns using for the prediction of nearfuture traffic states and travel time. Historical traffic flow patterns, especially mean speed fluctuation patterns, are one of the important factors for a prediction technique of nearfuture travel time of a long section on motorways. Authors use more than 1-year traffic flow fluctuation data collected by vehicle detectors on a long motorway section. In this study, some classification techniques were introduced to converge less dispersed mean speed patterns. It is pointed out that annual daily mean speeds patterns clearly different among motorway sections, and average coefficient of variations during congested flow conditions were about two to twenty times larger than free flow conditions. The results suggest that to in-crease an accuracy of travel time prediction on a motorway sections, there exist the needs to prepare many historical mean speed patterns. M.b.v. een database met historische data zijn snelheidsprofielen, gemiddelde snelheden en standaardafwijkingen van de gemiddelde snelheid vergeleken voor de volgende classificaties: alle dagen, weekdagen, zaterdag en vakantiedag, elk uitgesplitst naar weertype ‘fair’ (normaal?), bewolkt of regen. Geen duidelijke conclusies wat betreft de classificatie naar weertypes, uit de resultaten volgt bijvoorbeeld niet dat de snelheid bij regen lager ligt (ongeveer net zo vaak hoger). Wel lijkt de standaardafwijking bij regen altijd lager te zijn dan bij normaal weer of bewolkt. Conclusie over correlatie tussen reistijden en verklarende factoren Uit alle boven genoemde onderzoeken blijkt dat tijdstip van de dag, dag van de week, vakantiedag (soms samen genomen met zondag) significante variabelen zijn voor de reistijd. Er zijn geen duidelijke reistijdeffecten gevonden voor neerslag. 2.5 Reistijdvoorspellingsmethoden op basis van historische data In deze paragraaf presenteren we gepubliceerd onderzoek naar reistijdvoorspellingsmethoden op basis van historische data, zoals de knn methode. De wijze waarop verklarende factoren zoals dag van de week, weer etc. kunnen worden meegenomen in de voorspellingsmethoden wordt in de volgende paragraaf gepresenteerd. TNO-rapport 16 / 58 Kwon, J., Coifman, B., and Bickel, P. (2000), Day-to-Day Travel Time Trends and Travel Time Prediction from Loop Detector Data, Transportation Research Record no. 1717, Transportation Research Board, pp 120-129; pdf: day-to-day ttpredict.pdf Abstract This paper presents an approach to estimate future travel times on a freeway using flow and occupancy data from single loop detectors and historical travel time information. The work uses linear regression with stepwise variable selection method and more advanced tree based methods. The analysis considers forecasts ranging from a few minutes into the future up to an hour ahead. Leave-a-day-out cross-validation was used to evaluate the prediction errors without under-estimation. The current traffic state proved to be a good predictor for the near future, up to 20 minutes, while historical data is more informative for longerrange predictions. Tree based methods and linear regression both performed satisfactorily, showing slightly different qualitative behaviors for each condition examined in this analysis. Unlike preceding works that rely on simulation, this study uses real traffic data. Although the current implementation uses measured travel times from probe vehicles, the ultimate goal of this research is an autonomous system that relies strictly on detector data. In the course of presenting the prediction system, the paper examines how travel times change from day-to-day and develops several metrics to quantify these changes. The metrics can be used as input for travel time prediction, but they should be also beneficial for other applications such as calibrating traffic models and planning models. Dit paper introduceert plaats-tijd afhankelijke “metrics” die de verandering in reistijd karakteriseren, afhankelijk van tijdstip van de dag en dag van de week. Zogenaamde “unusual measures” geven aan in hoeverre een bepaalde dag afwijkt van de gemiddelde reistijd op deze dag van de week volgens historische gegevens. Ook andere variabelen, zoals het weer en “events” kunnen in de methode opgenomen worden. Er wordt opgemerkt dat het voorgestelde model heel specifiek is voor de onderzochte lokatie, maar dat met de voorgestelde methodes ook eenvoudig voor andere situaties soortgelijke modellen opgesteld kunnen worden. Bickel, P., Chen, C., Kwon, J., Rice, J., Zwet, E. van, and P. Varaiya (2004). Measuring Traffic, University of California, working paper, pp. 35; pdf: measuring traffic.pdf. Abstract A traffic performance measurement system, PeMS, currently functions as a statewide repository for traffic data gathered by thousands of automatic sensors. It has integrated data collection, processing, and communications infrastructure with data storage and analytical tools. In this paper, we discuss statistical issues that have emerged as we attempt to process a data stream of two GB per day of wildly varying quality. In particular, we focus on detecting sensor malfunction, imputation of missing or bad data, estimation of velocity, and forecasting of travel times on freeway networks. Verschillende reistijd voorspellingsmethoden zijn getest op de I-10 data van Los Angeles, o.a. de k-nearest neighbor methode. Weerskenmerken, dag v/d week etc. worden niet in de methodes meegenomen. De “regression predictor” presteert het best, maar wordt meestal geëvenaard door de k-nearest neighbor methode. Informatie van tijdstippen uit het verleden levert geen betere voorspelling op dan wanneer alleen de meest recente informatie gebruikt wordt. TNO-rapport 17 / 58 Dit paper bevestigt dat de k-nearest neighbor methode goede resultaten oplevert. Echter, we zullen deze methode gaan gebruiken met andere variabelen, zoals weersgegevens en evenementen etc. Sun, H., Liu, H.X., Xiao, H., Ran, B. (2002), Short Term Traffic Forecasting Using the Local Linear Regression Model, Submitted for the Annual Meeting of theTransportation Research Board, pp. 19; pdf: short term traffic forecasting.pdf Abstract Traffic data is highly nonlinear and also varies with times of day. It changes abruptly when entering or leaving a congestion hour. Therefore, the prediction of travel time requires accurate models. This leads to the problem of approximating nonlinear and timevariant functions. In this paper, we propose and apply local linear regression models to the shortterm traffic prediction. The local linear regression is one type of the local weighted regression methods. They have been applied to many problems, including artificial intelligence, dynamic system identification, data mining, etc. It can be used for nonlinear time series prediction under certain mixing conditions. The performance of the proposed model is compared with the previous nonparametric approaches, such as nearest neighborhood and kernel methods using the 32 day traffic speed data collected on Houston US-290 Northwest Freeway. We found that the local linear methods consistently have better performance than the nearest neighborhood and the kernel smoothing method. Drie reistijdvoorspellers worden met elkaar vergeleken, nl. de local-linear method, de nearest neighbor method en de kernel-smoothing method. Hierbij wordt zowel gebruik gemaakt van een historische database als van real-time informatie. De local-linear method geeft de beste resultaten, wat verklaard kan worden doordat deze de real-time verkeersgegevens expliciet gebruikt in de voorspelling. In deze studie is geen informatie beschikbaar over weer, incidenten, evenementen etc. Wel wordt aangegeven dat dit in deze methoden meegenomen kan worden. Liu, X., Chien, S. (2002), The Development of Dynamic Travel Time Prediction Models for South Jersey Real-Time Motorist Information System, New Jersey Institute of Technology pp. 54; pdf: SouthJerseyRealTimeMotoristInformationSystem.pdf. Abstract Traffic congestion, continuing to be one of the major problems in various transportation systems, may be alleviated by providing timely and accurate traffic information to motorists. Thus, they can avoid congested routes by using other alternative routes or changing their departure times. In the advent of Intelligent Transportation Systems (ITS), the Advanced Travel Information Systems (ATIS) have been deployed for this purpose in many places in the United States. Three important issues need to be evaluated for successful deployment of these systems and will be discussed in the study: • An integrated surveillance and communication system to monitor traffic conditions; • A sound dynamic estimation/prediction system to accurately forecast travel time as well as congestion over space and time; and • The effectiveness and reliability of the estimation/prediction system. This project is sponsored by NJDOT, the objectives of this project include: • Development of real-time traveler information generation algorithms. • Dissemination of traveler information • Development of model for estimating travel time and delays. TNO-rapport 18 / 58 To provide accurate traffic information (e.g., travel times and delays), the research team at New Jersey Institute of Technology (NJIT) proposes a model that can dynamically predict travel times as well as delay based on real-time and historical information collected from different data resources. Een methode is ontwikkeld voor korte termijn reistijdschatting en voorspelling voor de automobilist in een bepaald studienetwerk. Kalman filtering is toegepast om de voorspellingsnauwkeurigheid te verbeteren. Chrobok, R., Kaumann, O., Whale, J., Schreckenberg, M. (2004), Different methods of traffic forecast based on real data, European Journal of Operational Research Vol. 155, pp. 558-568; pdf: EJOR 2004 155 Chrobok.pdf Abstract Different methods to forecast traffic are analysed and discussed. An elementary approach is to develop heuristics based on the statistical analysis of historical data. Daily traffic demand data from 350 inductive loops of the inner city of Duisburgover a period of 2 years served as input. The sets of data are organized into four basic classes and a matchingprocess that assigns these sets into their class automatically is proposed. Furthermore, two models for shortterm forecast are examined: the constant and the linear model. These are compared with a prediction based on heuristics. The results show that the constant model provides a good prediction for short horizons whereas the heuristics is better for longer times. The results can be improved with a model that combines the short- and long-term methods. Verschillende methoden voor het voorspellen van de verkeerssituatie (de intensiteit) worden geanalyseerd. Een elementaire aanpak is gericht op het ontwikkelen van heuristieken m.b.v. statistische analyse van historische data. Hiervoor worden de historische data in clusters ingedeeld, nl. maandag t/m dondergdag, vrijdag en de dag voor een vakantie, zaterdag behalve vakanties, zondag en vakanties. M.b.v. een matching methode kan een intensiteitsprofiel automatisch aan een van deze clusters worden toegekend. Ook worden twee eenvoudige voorspellingsmodellen voor de korte termijn bestudeerd; het constante en het lineaire model. Deze modellen worden ook gecombineerd met de heuristieken voor historische data. Voor korte termijn voorspellingen (tot 18 minuten) is de constante reistijd methode het best; voor langere termijn voorspellingen werken de heuristieken beter. Conclusie voorspelmethoden Er zijn een aantal verschillende voorspelmethoden gepresenteerd, die in staat zijn verschillende kenmerken zoals dag van de week, weer etc. mee te nemen. Een vergelijking van deze methoden op grond van bovenstaande papers is niet goed mogelijk, omdat ze de methoden niet hebben toegepast met de genoemde factoren, behalve het paper van Chrobok. 2.6 Reistijden voorspellen op basis van historische data met verklarende factoren Onderzoeken naar het voorspellen van reistijden m.b.v. historische data met verklarende factoren zoals dag van de week, tijdstip van de dag, weer, grote evenementen, incidenten etc. TNO-rapport 19 / 58 Wu, C.H., Su, D.C., Chang, J., Wei, C.C., Ho, J.M., Lin, J.J. and D.T. Lee (2003), An Advanced Traveler Information System with Emerging Network Technologies, to appear in the 6th Asia-Pacific Conference on Intelligent Transportation Systems, pp. 9; pdf: 2003-Itsap-Atis.pdf. Abstract Advanced Traveler Information Systems (ATIS) plays an important role in intelligent transportation systems; it assists travelers with pre-trip and en route travel information to improve the convenience, safety and efficiency of travel. In this paper we present a highway ATIS system which provides more decisive and valuable travel information than conventional ATIS systems by integrating it with newly emerging Web service and wireless communication technologies. Following the Web service standards, our system can aggregate multiple travel-related data from different sources and provide value-added services to application developers or users. Through multimedia messaging services or wireless LAN communication, we can support access of the system to mobile travelers with visualized real-time traffic information for pre-trip planning or en route referencing. In order to make our system more reliable and useful, the methods of lost data reconstruction and travel time prediction are also proposed and examined. Dit paper presenteert een “intelligent transportation web service”, waarvoor een architectuur wordt gegeven. Er worden drie travel time prediction methods voorgesteld, waaronder een methode die historische data gebruikt, met gebruikmaking van de dag van de week en tijdstip van de dag. Effect van het weer op de reistijd wordt genoemd, maar wordt verder niets mee gedaan. Ook worden er methodes voor aanvullen van ontbrekende data gegeven en worden visualisatie methodes voor reistijdplanning voorgesteld. Er worden geen resultaten van de voorgestelde reistijdplanners gegeven. Patnaik, J., Chien, S., Bladikas, A. (2004), Estimation of Bus Arrival Times Using APC Data, Journal of Public Transportation vol 7 no 1, pp. 1-20; pdf: Journal of Public Transportation.pdf. Abstract Bus transit operations are influenced by stochastic variations in a number of factors (e.g., traffic congestion, ridership, intersection delays, and weather conditions) that can force buses to deviate from their predetermined schedule and headway, resulting in deterioration of service and the lengthening of passenger waiting times for buses. Providing passengers with accurate bus arrival information through Advanced Traveler Information Systems can assist passengers’ decision-making (e.g., postpone departure time from home) and reduce average waiting time. This article develops a set of regression models that estimate arrival times for buses traveling between two points along a route. The data applied for developing the proposed model were collected by Automatic Passenger Counters installed on buses operated by a transit agency in the northeast region of the United States. The results obtained are promising, and indicate that the developed models could be used to estimate bus arrival times under various conditions. In dit onderzoek is de relatie onderzocht tussen busreistijden en verschillende inputs zoals tijdstip van de dag, dag van de week en weer. Als voorspellingsmethode zijn regressie modellen gebruikt. De voorspelde reistijden worden vergeleken met de reistijden in de haltetabel en de werkelijke reistijden en aankomsttijden. De gebruikte methodes geven over het algemeen betere resultaten dan de standaard reistijden in de TNO-rapport 20 / 58 dienstregeling. Weer bleek geen significante variabele te zijn. Dit kan te wijten zijn aan het feit dat de weerdata niet gedetailleerd genoeg waren, of dat tijdens de studie periode de weersvariaties niet significant waren.Ook dag van de week bleek geen meetbare bijdrage aan de reistijd te leveren. De grootste invloed op de reistijd hadden tijdstip van de dag, aantal stops en overstaptijden. Als aanbevelingen voor toekomstig onderzoek wordt genoemd het gebruiken van grotere hoeveelheden en nauwkeuriger data genoemd, groeperen van de data naar dag, tijdstip en reistijdpatroon en het toevoegen van verkeersvariabelen zoals congestie en incidenten. Dat dag van de week geen significante bijdrage bleek te leveren aan de reistijd is wellicht te verklaren doordat voor busreistijden de invloed van de stops en overstaptijden vele malen groter is dan de invloed van dag van de week. Daardoor is vertaling naar reistijden van normale personenvoertuigen lastig. Jacobs, C. (2003), Average speed prediction using artificial neural networks, Delft University of Technology, Master thesis, pp. 227; pfd: Speed prediction NN thesis.pdf. Abstract Nowadays cars have navigation systems guiding the traveler from departure to destination. The navigation system uses route planners to determine the best route for the traveler. However these route planners do not use dynamic traffic information to decide what route is best. These route planners use the maximum speed allowed on a road to determine the travel time. So it is possible that the traveler is guided over congested routes while another route will lead the traveler faster to its destination. In this thesis at first it is explored what influences the average speed on the road and it is tried to predict this average speed using a feed forward neural network. If this average speed is known the real travel time can be determined for parts of the road and the best route can be discovered using this travel time. Analyzing the data showed that time, day of the week, month, weather, events, holidays and special events like accidents are factors that influence the average speed on the road. These influencing factors are used to predict the average speed on a specific point on a road. Therefore three models are developed. Two of these models are tested using JavaNNS developed at the Wilhelm-Schickard-Institute for Computer Science in Tübingen, Germany. The research on the architecture of neural networks and tests showed that a feed forward neural network with one hidden layer, from which the number of hidden neurons is determined by the formula of Fletcher and Goss (between 2Ni+1 and 2vNi +No), is capable of predicting the average speed using only the time, month, day of the week and the average speed of 40 minutes before. At least 76% of the predictions have a difference smaller or equal to 10% if the prediction is made 40 minutes ahead. From these results it can be concluded that Artificial Neural Networks are capable of making good approximations for problems like predicting the average speed. Van de volgende factoren is vastgesteld (d.m.v. het op het oog vergelijken van de reistijden) dat deze van invloed zijn op de reistijd in Nederland: tijdstip van de dag, dag van de week, maand, weer, evenementen, vakanties en speciale gebeurtenissen zoals incidenten. Met behulp van neurale netwerken is een snelheidsvoorspelling gedaan voor een specifieke locatie. De weerskenmerken die onderzocht zijn, zijn: mist (heeft invloed), sneeuw (heeft invloed) en warm en zonnig weer (geen invloed gevonden). Er wordt een suggestie gedaan om de invloed van de tijd van het jaar niet te splitsen in maanden, maar de maanden nog verder op te splitsen (elke maand in drieën). Een landelijke feestdag (vb. Tweede paasdag) geeft hetzelfde verkeersbeeld als een zondag. TNO-rapport 21 / 58 Grote evenementen kunnen files veroorzaken, in dit onderzoek wordt dit alleen voor het North Sea Jazzfestival laten zien. Gorell, R., Raines, A. (2001), Using traffic status forecasting to estimate travel times, Proceedings of the Travel Time Estimation Workshop Avignon, Serti Project, pp. 4549; pdf: Travel time estimation.pdf Abstract Techniques have been developed which provide long and short-term predictions of traffic status (flows and speeds). The study of historical records has been used to construct a template of expected behaviour for a particular day of the week. This provides a long-term prediction that can be used for incident detection. Shortterm predictions are produced by either fitting different types of curve to recently collected data or by applying Interacting Multiple Models that use different models for free-flow and congested traffic. In addition Neural Network approaches have also been considered. The techniques developed have been incorporated into a demonstrator that can produce predictions from a few minutes to many hours ahead. A good match has been found between predicted and recorded values. The techniques will soon be incorporated into an on-line demonstrator that will also produce predictions of travel time in real time. A service is being developed that will enable the predictions to be made available to third parties via the UK Travel Information Highway, for purposes including travel time information services, predictions for traffic models and incident detection and prediction. Twee methoden voor het voorspellen van de verkeerssituatie zijn getest, nl. regressie analyse en historical pattern analyse. Onze belangstelling gaat vooral uit naar deze laatste. De bedoeling van de historical pattern analysis is om aan het begin van de dag een voorspelling te kunnen geven van de flow (en snelheden) voor de hele dag. Met behulp van hypotheseanalyse is nagegaan welke parameters van invloed zijn op de flow. Factoren die zijn onderzocht, zijn dag van de week, weer, nationale feestdagen, schoolvakanties, seizoenen, grote sport evenementen, wegwerkzaamheden en industriële acties. Dag van de week (met schoolvakanties als apart geval) bleek de sterkste invloed te hebben, gevolgd door nationale feestdagen en seizoensinvloeden. Het weer bleek geen grote invloed te hebben, zit wellicht deels in seizoensinvloed (niet voldoende detail in data om dit te scheiden). Met behulp van de historische data kan voor elke situatie een “template” van het intensiteits- en snelheidsprofiel geconstrueerd worden. De methode is met een “test-bed” getest. Binnenkort komt er een on-line demonstrator die real-time reistijdvoorspellingen kan genereren. In dit rapport staan ook nog beschrijvingen van vele andere, voor ATMO 5G minder relevante, onderzoeken met betrekking tot travel time estimation. Chien, S., Chen, M., and Xiaobo Liu (2003), Use of Neural Network / Dynamic Algorithms to Predict Bus Travel Times Under Congestion Conditions, NJDOT, Project Report, pp. 102; pdf: UseDynamicToPredictBusTimes.pdf. TNO-rapport 22 / 58 Abstract This research applied time and location dependent data automatically collected by APC units installed in buses, including passenger counts and average travel time between major bus stops. The objective of this study is to develop a dynamic model (e.g., the integration of artificial neural networks and Kalman filtering algorithm) that can predict bus arrival information with the use of real-time and historical data. The following tasks have been conducted while achieving the objective: • Conduct extensive literature review in travel time prediction models. • Identify geometric factors that affect bus travel times. • Collect APC data to examine the bus travel times. • Develop dynamic models that can adequately predict bus arrival times at major bus stops, • Evaluate the accuracy of the developed predictive models. Het doel van deze studie was het ontwikkelen van een Neural/Dynamic model (ANN + Kalman filtering) voor het voorspellen van busreistijden. Hiervoor is data gebruikt van automatische passagier telsystemen (APCs) aangevuld met recente informatie van busreistijden, het weer, tijd van de dag etc. De voorspelde reistijden zijn vergeleken met de reistijden in de routetabel (met de RMSE). Weinig verrassende conclusies; de voorspelde reistijden zijn in alle gevallen beter dan de tijden in de haltetijdentabel. De combinatie van ANN met Kalman filtering is in alle gevallen beter dan een voorspelling met alleen ANN. Boucher, S., (2004), Journey Time Estimation Using Route Profiles, University of Dublin, dissertation, pp. 64; pdf: journey times profiles.pdf Abstract Estimating journey times is of increasing importance in the modern world for the fulfilment of social and business occasions. Probably the most variable journey times are the times experienced when using a road network. Intelligent Transportation Systems (ITS) are used to address this problem to estimate journey times for interested authorities and commuters. This dissertation presents the design, implementation and evaluation of a tool that is used to generate route profiles for use in the ITS domain. The tool is biased for use on the interurban national primary routes in the Republic of Ireland. This ubiquitous computing project allows journey times to be generated using a set of probe vehicles. The probe vehicles are tracked using Global Positioning System (GPS). Journey times are tagged with context data such as the prevailing weather conditions during the time the GPS reading was made. To accomplish the above goals, a Geographic Information System (GIS) application was developed in order to process GPS and weather data to produce contextualised journey records. These historical records are stored in a database and queried by a web server to deliver records to the road management tool or traveller information system. This tool has built route profiles of a road network. These route profiles could be used later to provide an indication of the level of service that is being provided by road management authorities. For example, authorities could use the generated journey times as a measure of adequacy for journey times of roads. The tool could also be used by commuters to make more informed decisions about their journey plans. Given better road management and better driver comfort and safety, road networks should become more pleasurable to use. Proefschrift. Historische reistijddata zijn verzameld met probe vehicles uitgerust met een GPS systeem. Deze data zijn aangevuld met weersinformatie. Hiermee is een tool ontwikkeld die wegbeheerders een indicatie geeft van de level of service van een TNO-rapport 23 / 58 bepaalde route. Ook kunnen wegen geidentificeerd worden die slecht presteren bij slechte weersomstandigheden en kan een indicatie gekregen worden van de veranderde verkeersvraag bij andere weersomstandigheden. Wouters, J.A.A., Chan, K.F., Kolkman, J., Kock, R.W. (2005), Customized Pre-trip Prediction of Freeway Travel Times for Road Users, Proceedings of the 84th Annual Meeting Transportation Research Board, pp. 14, pdf: customized pre-trip prediction.pdf. Abstract One of the objectives of the Department of Transport (DoT) in the Netherlands is to provide better information to road users about the traffic situation on Dutch freeways. The idea was put forward to use existing historical freeway inductive loop data to compute a customized pre-trip travel time prediction for road users. In order to investigate the feasibility and usefulness of this idea, the DoT launched the AIDA project. A prototype database was constructed, containing almost two years of travel time data for all Dutch freeway road sections with inductive loops. A statistical algorithm was designed to compute the average travel time for any freeway journey on any future date & time. An internet trial application was built to test database and algorithm. The accuracy of the travel time predictions was evaluated using independent loop data. The usefulness for road users was investigated by means of an on-line survey. The results show a very good match between the predicted and actual travel times. Only in 10% of the analysed cases did the actual travel time exceed the travel time prediction interval by more than 5 minutes. Out of 161 respondents 50% indicated that they found the information useful. Furthermore 22% indicated that they would consider a different departure time based on AIDA information. Thus the project has shown convincingly that the AIDA concept is not only feasible but also useful to road users. Presently the DoT is looking into the uses of the concept: for road users and possibly also for traffic operators. In dit onderzoek is een methode toegepast om pre-trip (langer dan 2-3 uur van tevoren) reistijden te voorspellen. Op basis van historische data van enkele jaren wordt een gemiddelde reistijd bepaald van overeenkomende dagen in een aantal categorieën zoals dag van de week. Weers- en seizoenseffecten worden indirect meegenomen door alleen dagen mee te nemen die dicht in de buurt liggen van de huidige datum. De methode is online toegepast op een website waarop de voorspelde reistijden werden weergegeven voor de gewenste vertrektijd en voor een kwartier eerder en later. Ook de variabiliteit van de reistijden werd weergegeven (15% en 85% percentiel). Onder de gebruikers van de site is een onderzoek gehouden naar de bruikbaarheid van deze informatie. 50% vond de informatie bruikbaar. Schrader, C. C., Kornhauser, A. L., Friese, L. (2003), Using Historical Information in Forecasting Travel Times, Proceedings of the Annual Meeting of the Transportation Research Board, pp. 17; pdf: Historical information in forecasting travel times.pdf TNO-rapport 24 / 58 Abstract When solving the roadway network problem of finding the quickest route from point A to B, one would like to have the best information available on the travel times between locations in the network. Current systems find this shortest path based on hypothetical travel times calculated from distance and assumed speed. This paper develops a better solution through the creation of forecasts of travel times using historical information. Recognizing that traffic patterns often repeat themselves over time, data from the Milwaukee Highway System is analyzed, and timeof- day is discovered as an important indicator of travel time. This paper develops a travel time predictor function with time-ofday as the independent variable. This ten-parameter function is the sum of three normal curves (each representing a “rush-hour” period) and a constant, fitted through a least-squares regression. The use of this function to update travel times in a network is also explained. In dit paper is een reistijdvoorspellingsmethode ontwikkeld die gebruikt maakt van historische data. Het reistijdprofiel wordt opgebouwd uit drie normale verdelingen en een constante en bevat tien parameters met tijd van de dag en een binaire variabele voor weekdag of weekend als onafhankelijke variabelen. De gebruikte historische data zijn van de maand juni in 2002. Jaar-op-jaar trends en seizoenseffecten konden daarom niet meegenomen worden. Geen duidelijke beschrijving van de resultaten en geen opzienbare conclusies. Hillman, J. (2004), Travel time challenge, Proceedings of the World ITS Conference Nagoya, pp. 6; pdf: travel time challenge.pdf Abstract ITS applications with functions like dynamic route guidance or trip planning will need traveltime estimates for discrete road links and on a nationwide basis. But such travel-times are rarely measured directly. And up to now Travel Time Calculators have performed poorly. This is because estimating travel times with sufficient accuracy is not only complicated, but requires using complete, comprehensive and accurate input data. The job is essentially to understand prevailing speeds. Unfortunately DOT sensor networks in the US provide insufficient coverage and usually unreliable data feeds. So we must look for other means, and account for slow prevailing speeds due to weather, crashes and other unanticipated events, scheduled events, and expected congestion. Fortunately, input data for the most important factors in travel time estimates is now available or achievable. Beschrijving over het belang van goede reistijdvoorspellingen, de benodigde data en verklarende factoren en de problemen die er zijn bij de dataverzameling en voorspellingen. Er is geen reistijd voorspellingsmethode getest en dus geen resultaten gepresenteerd. Conclusies over reisttijdvoorspellingen met verklarende factoren In bovenstaande papers worden verschillende methoden gebruikt om reistijden te voorspellen met behulp van historische data, zoals neurale netwerken, kalman filtering, en meer statistische methoden zoals regressie analyse. De methode die wij hebben toegepast, is in geen enkel paper aangetroffen. De methode van Wouters, J.A.A. heeft de meeste gelijkenis met onze methode. Dag van de week en tijdstip van de dag wordt opnieuw in meerdere papers aangewezen als de meest significante variabelen voor reistijd vorospellingen. Van weersinvloeden wordt geen significante invloed gevonden. Wellicht is dit te wijten aan te onnauwkeurige weersdata. TNO-rapport 2.7 25 / 58 Effect van opdelen van de route voor reistijdvoorspelling Wei, C-H., Lee, Y. (2004), Effects of road partition to the travel time forecasting model performance, Proceedings of the 11th World Congress on Intelligent Transportation Systems, Nagoya, pp. 8; pdf: road partition.pdf Abstract Artificial neural network technique is applied to build a travel time estimation model which exhibits a functional relation between real-time traffic data as the input variables and the actual bus travel time as the output variable. A great quantity of traffic data are collected from bus global positioning systems, vehicle detectors and the incident database. In the model development, the data from neighboring sections and time intervals are considered to present the time-space relation for travel. To account for various ways of specifying freeway sections, four criteria are employed to partition the freeway into comparable units. These are based on interchanges, similar distances, travel times and geometry. In most sections of four partitions, the mean absolute percentage errors of the outputs are under 20%, indicating a good forecasting effect. For prediction, the path travel time is obtained from the section models with a dynamic forecast concept. Through the validation process, the MAPE of the travel times at each O-D path are known to be mostly under 20%. Het effect van de partitie van de route op de reistijdvoorspelling is bepaald, waarbij de reistijdvoorspellingen zijn gedaan met behulp van neurale netwerken. Er zijn 4 partities bekeken: op basis van op/afritten, gelijke afstanden, gelijke reistijd en gelijke geometrie. Gelijke reistijd gaf de beste resultaten, gevolgd door gelijke geometrie. Vervolgens zijn de reistijden van verschillende routes bepaald door de reistijden van de partities te sommeren voor verschillende OD-paren. Gelijke reistijd kan in dit geval niet gebruikt worden. Het is afhankelijk van het OD-paar welke partitie de beste resultaten geeft, maar in de meeste gevallen geeft een partitie naar gelijke geometrie de beste resultaten. Bovendien zijn de resultaten met deze partitie stabieler. Conclusies over het opdelen van routes We hebben slechts een paper gevonden die hier onderzoek naar heeft gedaan. Gelijke reistijd gaf in dit onderzoek de beste resultaten, gevolgd door gelijke geometrie. Gelijke reistijd kan niet in onze methode gebruikt worden, omdat het opdelen van de route vooraf moet gebeuren en een partitie naar reistijd zou onder verschillende omstandigheden tot een andere partitie leiden. 2.8 Conclusies literatuuronderzoek ********* terugverwijzen met refernenties naar de belangrijkste papers waarop de conclusie is gebaseerd ********** • Conclusies betrouwbaarheid en variabiliteit • Conclusies over additionele factoren zoals weer, etc.; Er zijn reeds verschillende onderzoeken uitgevoerd naar het voorspellen van reistijden met behulp van historische data. De verklarende variabelen die mee worden genomen, beperken zich meestal tot dag van de week en tijdstip van de dag en soms vakanties. Van deze variabelen is het duidelijk dat er sprake is van een effect op de reistijd (of intensiteit). Dag van de week en tijdstip op de dag hebben de sterkste invloed. TNO-rapport 26 / 58 Gegevens over het weer worden zelden meegenomen. Als neerslag wordt meegenomen, zijn de resultaten niet eenduidig; ook is de mate van detail van de historische weerdata over het algemeen te laag om dit te kunnen scheiden van andere verklarende factoren. In een onderzoek in Tokyo is specifiek het effect van neerslag op de reistijd onderzocht met redelijk nauwkeurige neerslagdata. Regen bleek echter geen apart cluster op de leveren. Een verklaring hiervoor is dat de verkeersvraag op regendagen in Tokyo kleiner blijkt te zijn. In onderzoeken waar specifiek gekeken wordt naar het effect van weer op het verkeer (en niet in combinatie met reistijdvoorspelling), wordt wel een duidelijk effect gevonden. Zo wordt bijvooorbeeld in de literatuur aangegeven dat de gemiddelde snelheid bij regen afneemt met 10 tot 25 %. • Conclusies over voorspelmethoden voor addtionele factoren Qua voorspellingsmethodiek zijn bekende methoden Neurale netwerken, Kalman filtering en de neirest-neighbor methode. Deze methodes gebruiken over het algemeen kenmerken van het (historische) reistijdprofiel, gecombineerd met actuele gegevens van het reistijdprofiel. Methodes voor lange termijn voorspelling die slechts gebruik maken van aanvullende kenmerken van de situatie op een gegeven tijd en dag en niet van de actuele reistijd zelf, hebben we alleen gevonden bij het AIDA project van AVV (Jacorien Wouters). In deze studie zijn echter geen weersinvloeden meegenomen. • Gevolgen voor ATMO 5G ************ nog aanvullen ************* TNO-rapport 3 27 / 58 Analyse van Regiolab data A13-A20-A16 3.1 Geselecteerde traject Voor het ontwikkelen en testen van de reistijdvoorspeller voor de lange termijn is gekozen voor het traject Delft-Zwijndrecht (en vice versa). Dit traject bestaat voor een zeer groot deel uit het hoofdwegennet, namelijk A13, A20 en A16 en voor een klein gedeelte het onderliggend wegennet (Kruithuisweg te Delft, Afslag 22 Plantageweg te Zwijndrecht). De data voor dit traject zijn (grotendeels) beschikbaar binnen Regiolab. In de ochtendspits en de avondspits is er congestie in beide richtingen. In de ochtend is er langzaamrijden verkeer op de Zuid-Noord richting op de A16, A20 en A13 (tot aan afslag Rotterdam Airport) en op de Noord-Zuid richting op de A13 bij Overschie. In de avondspits is er langzaam rijdend verkeer van Delft Zuid tot aan Kleinpolderplein en op de A20 van Kleinpolderplein tot Terbregseplein. Dit traject representeert tevens een fictieve case in het goederenvervoer. Over het traject vindt veelvuldig vervoer plaats van groente- en fruit en bevoorrading van supermarkten. Rond Barendrecht is een groot cluster van groente- en fruithandelaren gevestigd. Dagelijks worden door Bakker Barendrecht meerdere zendingen afgeleverd bij het distributiecentrum van Albert Heijn in Pijnacker (naast de A13). Anderzijds vindt vanuit dit distributiecentrum de bevoorradingplaats van supermarkten in Barendrecht, Hendrik Ido Ambacht en Zwijndrecht. Figuur 1: Traject Delft-Zwijndrecht (** zit de Kruithuisweg nu wel of niet in de data set, was wel afgesproken **) TNO-rapport 28 / 58 3.2 Verkeers-, meteo en overige data 3.2.1 Data van gerealiseerde reistijden Het traject is geselecteerd omdat de gegevens beschikbaar zijn binnen RegioLab. De data van het hoofdwegennet zijn afkomstig uit de Monica database van Rijkswaterstaat. Voor de analyse van de reistijden en snelheden is het traject opgesplitst in de zes deeltrajecten (zie Tabel 1 ). Tabel 1: Deeltrajecten op geselecteerde traject “heen” 1 Delft-zuid-Zestienhoven; lengte 4025 m 2 Zestienhoven-Kleinpolderplein; 3813 m 3 Kleinpolderplein-Terbregse pl; 4790 m 4 Terbr.Plein-Brienenoord; 5797 m 5 Brienenoord-Ridderkerk; lengte 2517 m 6 Ridderkerk-Zwijndrecht; lengte 4960 m “terug” 7 Zwijndrecht-Ridderkerk; lengte 4700 m 8 Ridderkerk-Brienenoord; lengte 3420 m 9 Brienenoord-Terbr.Plein; lengte 4877 m 10 Terbr.Plein-Kl.P..plein; lengte 3635 m 11 Kl.P.plein-Zestienhoven; lengte 3635 m 12 Zestienhoven-Delft-zuid; lengte 3005 m Voor het traject (zowel noord-zuid als zuid-noord) zijn uit Regiolab historische reistijden afgeleid op 15 minuten-basis voor het gehele jaar 2004, op het laatste stuk onderliggend wegennet in Zwijndrecht na, omdat er over dat deel geen informatie beschikbaar is in Regiolab. In Tabel 2 en Tabel 3 staat per deeltraject en per dag van de week de gemiddelde reistijd van de historische reistijden weergegeven. Tabel 2: reistijden in minuten voor alle trajecten op de route van noord naar zuid Traject 1 2 3 4 5 6 totaal Maandag 03:03 03:11 03:10 03:29 01:24 02:38 16:55 Dinsdag 03:13 03:16 03:17 03:35 01:25 02:41 17:27 Woensdag 03:21 03:18 03:19 03:36 01:24 02:39 17:37 Donder dag 03:19 03:18 03:15 03:37 01:26 02:42 17:37 Vrijdag 03:28 03:24 03:25 03:04 01:24 02:38 17:23 Zaterdag 02:19 02:48 02:45 03:16 01:20 02:35 15:03 Zondag 02:10 02:44 02:45 03:15 01:20 02:33 14:47 Gem. 02:59 03:08 03:08 03:30 01:23 02:38 Tabel 3: reistijden in minuten voor alle trajecten op de route van zuid naar noord Traject 1 2 3 4 5 6 totaal Maandag 02:48 02:09 03:09 02:34 02:44 01:51 15:15 Dinsdag 03:03 02:12 03:15 02:46 02:52 01:59 16:07 Woensdag 02:51 02:12 03:16 02:54 02:53 02:00 16:06 Donder dag 03:05 02:14 03:13 02:05 02:55 01:51 15:23 Vrijdag 02:48 02:14 03:09 02:45 02:48 01:54 15:38 Zaterdag 02:33 02:01 02:53 02:09 02:44 01:55 14:15 Zondag 02:32 02:01 02:51 02:08 02:28 01:39 13:39 Gem. 02:49 02:09 03:07 02:35 02:46 01:53 15:19 De voornaamste bron voor verkeersgegevens op het hoofdwegennet zijn de detectielussen van Rijkswaterstaat. Het komt voor dat detectielussen uitvallen en voor korte of langere tijd geen verkeersdata leveren. In het databestand is geregistreerd TNO-rapport 29 / 58 hoeveel detectielussen in een bepaalde tijdsperiode niet hebben gewerkt. Aan de hand van deze data is bepaald op welke dagen er technische problemen waren met de metingen, zodat de reistijden op deze dagen geen goede weergave zijn van de werkelijke reistijd op deze dagen. Als criterium voor deze dagen hebben we gebruikt dat het totaal aantal tijdsintervallen waarin minder dan twee detectoren op een deeltraject niet zijn uitgevallen goter is dan 200. In totaal worden op deze manier 12 dagen afgewezen. Een alternatieve aanpak is dat deze waarnemingen niet worden geëlimineerd, maar er wordt aan elke waarneming een kwaliteitslabel toevoegd die aangeeft of de data betrouwbaar zijn. Naarmate er meer detectielussen op een deeltraject zijn uitgevallen wordt de waarde van het kwaliteitslabel verlaagd. In de voorspellingsmethode kan dan worden gekozen of waarnemingen met een lage kwaliteit wel of niet worden meegenomen. Tabel x: Kwaliteit van waarnemingen Traject 1 Traject 2 Traject 3 Traject 4 Traject 5 Traject 6 Traject 7 Traject 8 Traject 9 Traject 10 Traject 11 Traject 12 tijdsintervallen met onbruikbare reistijd 813 2.31% 825 2.35% 811 2.31% 847 2.41% 859 2.44% 681 1.94% 670 1.91% 895 2.55% 761 2.17% 729 2.07% 817 2.33% 819 2.33% In tabel x wordt een overzicht gegeven van de kwaliteit van de verkeersgegevens op de baanvakken op het traject Delft-Zwijndrecht. Het percentage onbruikbare reistijden blijkt op alle trajecten laag te zijn. 3.2.2 Meteodata Voor het analyseren van het effect van weer op de reistijden en snelheden zijn meteodata aangekocht van Meteoconsult. Het bestand met meteodata bestaat uit de volgende elementen: • Neerslag in milimeters; De neerslagdata zijn beschikbaar per uur per pixel van 2.5 bij 2.5 kilometer, zoals te zien in Figuur 2. Per deeltraject is de gemiddelde neerslaghoeveelheid van de bijbehorende pixels bepaald. • Zicht in kilometers, elk uur gemeten op weerstation Rotterdam Aiport. • Temperatuur, elk uur gemeten op weerstation Rotterdam Airport • Weertype, beschreven in tekst. De data bevat 58 verschillende weertypes. Een aantal voorbeelden: Lichte sneeuw, Lichte sneeuwbui, Matige of zware regen en sneeuw, Matige sneeuw, Motsneeuw, Onweer met regen of sneeuw, Geheel bewolkt, Geheel bewolkt na ijzel, Geheel bewolkt na mist. Een volledige lijst is opgenomen in de bijlage. TNO-rapport 30 / 58 Figuur 2: Neerslag data per pixel (bron MeteoConsult) 3.2.3 Vakanties en evenementen Extra informatie is verzameld over op welke dagen feestdagen, schoolvakanties en grote evenementen hebben plaatsgevonden. In Tabel 4 zijn de data gegeven van de basisschoolvakanties in de regio “midden”. De vakanties van het voortgezet onderwijs en de bouwvakvakantie vallen binnen deze data. Tabel 5 geeft een overzicht van de grote evenementen die hebben plaatsgevinden in de regio Rotterdam in 2004. Tabel 4: Vakanties van het basisonderwijs in de regio “midden” in 2004 Vakantie kerst voorjaar mei zomer herfst kerst Periode/Data 20 december 2003 t/m 4 januari 2004 21 februari t/m 29 februari 2004 30 april t/m 9 mei 2004 3 juli t/m 22 augustus 2004 16 oktober t/m 24 oktober 2004 25 december 2004 t/m 9 januari 2005 Tabel 5: Grote evenementen in de regio Rotterdam Naam evenement Rotterdams Filmfestival ABN AMRO World Tennis Tournament 2004 Rotterdam Marathon Marco Borsato in De Kuip Parkpop Den Haag Zomercarnaval FFWD Dance Parade Wereldhavendagen Periode/data 21 januari t/m 1 februari 16 februari t/m 22 februari 4 april 9,10,12,14, 16, 17 juni 27 juni 31 juli 14 augustus 3 t/m 5 september TNO-rapport 31 / 58 3.3 Analyse van de gerealiseerde reistijden De variabiliteit van de gerealiseerde reistijden is groot. Als maat voor de spreiding in de reistijden per dag-van-de-week en per deeltraject is in Tabel 6 de maximale standaardafwijking opgenomen, over elk tijdsinterval over de dag. Deze standaardafwijking verschilt sterk op de verschillende dagen van de week. Tabel 6: maximale standaard afwijking in minuten voor alle trajecten en dagen van de week traject Maandag 11:10 7:01 4:04 5:54 1:30 2:09 7:34 2:12 3:23 4:02 3:02 6:37 1 2 3 4 5 6 7 8 9 10 11 12 Dinsdag 6:57 3:53 6:33 10:37 0:47 5:12 7:20 2:18 4:15 5:31 4:04 7:16 Woensdag 7:00 3:55 4:56 4:13 0:40 0:47 6:20 4:34 9:47 6:10 6:01 8:16 Donder -dag 6:55 3:03 1:29 3:03 0:35 1:28 8:27 3:54 4:16 4:52 5:25 2:05 Vrijdag 6:55 5:07 6:01 4:41 0:50 0:23 8:26 4:10 4:53 5:30 4:30 5:37 Zaterdag 6:18 2:55 2:12 2:19 0:11 3:15 3:31 2:13 2:24 2:06 6:48 5:13 Zondag 1:30 1:40 4:51 3:54 0:19 1:15 1:49 2:31 1:56 2:23 2:38 3:49 Max 11:10 7:01 6:33 10:37 1:30 5:12 8:27 4:34 9:47 6:10 6:48 8:16 De reistijden fluctueren ook sterk gedurende de dag. In Figuur 3 is weergegeven hoe de reistijd varieert gedurende de dag en de bandbreedte van de reistijden tussen het 10% percentiel en het 90% percentiel, op het traject van noord naar zuid. Op het traject van zuid naar noord is dit weergegeven in Figuur 5. 45 40 reistijd (min) 35 30 25 20 15 10 0 5 10 15 tijd (uur) 20 25 TNO-rapport 32 / 58 Figuur 3: Spreiding van reistijden over de dag op het hele traject van noord naar zuid; de rode lijnen geven het 10% percentiel en het 90% percentiel aan. De blauwe lijn is de mediaan. 40 35 reistijd (min) 30 25 20 15 10 0 5 10 15 20 25 tijd (uur) Figuur 4: Spreiding van reistijden over de dag op het hele traject van zuid naar noord; de rode lijnen geven het 10% percentiel en het 90% percentiel aan. De blauwe lijn is de mediaan. De correlatie tussen reistijd en tijd-van-de-dag en dag-van-de-week kan worden geanalyseerd met behulp van een clusteringsmethode. Door uit de historische set van reistijden op een slimme manier clusters te kiezen zal de spreiding van reistijden binnen zo’n deelverzameling (cluster) kleiner zijn dan de spreiding in de totale reistijdenset. De clusters vormen samen de totale reistijdenset, oftewel, elke reistijd uit de totale verzameling wordt toegekend aan een of meerdere clusters. Met de reistijden binnen een cluster kan vervolgens een reistijdvoorspelling gedaan worden voor een toekomstige situatie. Als er binnen de clusters een kleinere spreiding in de reistijden is dan in de totale reistijdenset heeft de reistijdvoorspelling een grotere betrouwbaarheid dan een gemiddelde reistijd op basis van de gehele dataset. Er zijn een aantal uitdagingen in dit proces: • het maken van clusters zodanig dat de spreiding binnen een cluster zo klein mogelijk is; • het vinden van een cluster waarin de situaties behorende bij de reistijden in het cluster zo veel mogelijk lijken op de specifieke situatie waarvoor de voorspelling gedaan moet worden; • het bepalen van een reistijd voor een specifieke situatie uit de data in het bijbehorende cluster. TNO-rapport 33 / 58 In dit deel van het rapport richten we ons op de eerste uitdaging, nl. het construeren van clusters waarbinnen de spreiding zo klein mogelijk is. De tweede en derde uitdaging zijn onderdeel van de voorspellingsmethode. Het construeren van clusters kan vanuit twee benaderingen worden gedaan, namelijk via een traditionele clustering methode of via een meer intuïtieve methode waarbij vooraf al een beeld bestaat van de eigenschappen welke tot een kleinere spreiding zullen leiden. Een traditionele clustering methode kan de historische reistijdprofielen zodanig clusteren dat binnen een cluster de reistijdprofielen zoveel mogelijk op elkaar zullen lijken. De eigenschappen behorende bij de reistijdprofielen (zoals dag van de week etc.) kunnen binnen een cluster echter wel verschillen. De tweede methode gaat juist uit van de eigenschappen die naar verwachting tot een kleinere spreiding zullen leiden. De reistijden zijn dan geclusterd volgens overeenkomende eigenschappen. Binnen een cluster hebben alle reistijden ten minste een vergelijkbare eigenschap. Het voordeel van deze methode is dat door een analyse van de clusters die op deze manier zijn geconstrueerd, inzicht geeft over welke variabelen in welke mate verklarend zijn voor de reistijden. Immers, als een cluster dat geclusterd is op basis van een bepaalde eigenschap een veel kleinere spreiding heeft dan de oorspronkelijke dataset, betekent dat dat deze eigenschap in belangrijke mate bepalend is voor de reistijden. Vanwege de extra inzichten die de tweede methode op kan leveren, hebben we gekozen voor clustering op basis van overeenkomende eigenschappen. Voor een eerste analyse hebben we gekozen voor de volgende clusters: • Maandag t/m donderdag (samen in een cluster) • Maandag t/m donderdag (vier aparte clusters) • Vrijdag • Zaterdag • Zondag • Seizoen: “herfst” (oktober, november, december) Er is gekozen voor een apart cluster voor de herfstperiode, omdat op basis van ervaring bekend is dat er in deze periode vaak sprake is van langere reistijden. Dit blijkt ook uit onze historische reistijden, zoals te zien is Figuur 5. TNO-rapport 34 / 58 seasonal influence tuesday 3000 tt between 8:00 and 20:00 2500 2000 1500 1000 500 0 0 10 20 30 week 40 50 60 Figuur 5: gemiddelde reistijd tussen 8:00 uur en 20:00 uur op dinsdag in de loop van het jaar. Verder maken we een onderscheid naar “normale dagen” en “speciale dagen”. Op speciale dagen is er iets aan de hand wat naar verwachting tot afwijkende reistijden zal leiden. Onder speciale dagen vallen de volgende dagen of dagen waarop de volgende situaties zich voordoen: • Grote evenementen • Wegwerkzaamheden • Schoolvakanties • Feestdagen Een overzicht van de reistijden op de A13 per cluster naar dag van de week is te zien in Figuur 6. De rode buitenste grafieken zijn het 10 % en 90 % percentiel. Hieraan valt meteen op dat de spreiding op de doordeweekse dagen erg groot is. Ook valt op dat het reistijdprofiel op vrijdag en op zaterdag duidelijk afwijkend is van het gemiddelde snelheidsprofiel. TNO-rapport 35 / 58 mothucluster normal A13 2000 2000 1500 1500 tt tt normal cluster A13 1000 500 500 0 0 5 10 15 20 time (h) friday cluster normal A13 2000 2000 1500 1500 tt tt 0 1000 1000 500 0 0 5 10 15 20 time (h) saturday cluster normal A13 1000 500 0 5 10 15 time (h) 0 20 0 5 10 15 time (h) 20 Figuur 6: Reistijdprofielen A13 van verschillende clusters (dagen van de week) In Figuur 7 is gekeken of er een correlatie is tussen de reistijd van vandaag en de reistijd van morgen. Uit de figuur volgt direct dat deze correlatie er niet is, als dit het enige criterium is. Wellicht dat er voor bepaalde dagen met bepaalde specifieke eigenschappen wel zo’n correlatie te vinden is. Dit zou in een latere studie uitgezocht kunnen worden. 700 600 tomorrow 500 400 300 200 100 100 200 300 400 today 500 Figuur 7: Correlatie tussen reistijden opeenvolgende dagen 600 700 TNO-rapport 36 / 58 Tenslotte is de spreiding van de reistijden per cluster geanalyseerd. Als maat voor de spreiding gebruiken we de “mean absolute deviation” (MAD) en de “mean relative deviation” (MRD). Deze maten zijn o.a. toegepast in het paper van [Chrobok]. ∑ MAD = MRD = ∑ N n =1 | xn − y n | N N n =1 ⋅ 100% | xn − y n | xn ⋅ 100% N Per cluster hebben we bepaald wat de gemiddelde MAD en MRD is van de mediaan ten opzichte van het 10% percentiel en het 90% percentiel, over alle dagen in het cluster. De bandbreedte bepalen we door de som van de gemiddelde MAD of de MRD te bepalen van het 10% en het 90 % percentiel. De resultaten hiervan staan in tabel 7. Tabel 7: gemiddelde relatieve/absolute afwijking ten opzichte van de mediaan voor het 10% percentiel en het 90% percentiel van de A13. all normal days A13 all special days A13 normal mo-th A13 special mo-th A13 normal mo A13 normal tue A13 normal wedn A13 normal thu A13 special mo A13 special tue A13 special wedn A13 special thu A13 normal fri A13 special fri A13 normal sa A13 special sa A13 normal sun A13 special sun A13 autumn mo-th A13 No heavy rain mo-th A13 MRD perc10 13% 6% 9% 8% 8% 7% 8% 10% 8% 10% 9% 8% 13% 14% 2% 2% 2% 2% 8% 9% MRD perc90 25% 39% 21% 25% 14% 23% 18% 19% 19% 31% 19% 29% 28% 34% 10% 7% 3% 8% 21% 19% Bandbreedte 38% 45% 30% 33% 23% 30% 26% 29% 27% 41% 28% 37% 41% 48% 12% 10% 5% 10% 30% 28% MAD perc10 70 18 54 35 46 29 45 47 52 49 59 30 75 73 6 7 6 6 59 53 MAD perc90 123 133 113 110 77 101 100 87 109 138 98 108 148 165 31 22 9 24 117 102 Bandbreedte 192 151 167 145 123 130 145 134 161 188 158 139 222 237 38 29 15 31 175 156 Tabel 8: gemiddelde relatieve/absolute afwijking ten opzichte van het gemiddelde voor het 10% percentiel en het 90% percentiel van de A16. all normal days A16 all special days A16 normal mo-th A16 special mo-th A16 MRD perc10 13% 6% 9% 3% MRD perc90 25% 39% 21% 5% Bandbreedte 38% 45% 30% 8% MAD perc10 70 18 54 8 MAD perc90 123 133 113 14 Bandbreedte 192 151 167 23 TNO-rapport 37 / 58 normal fri A16 special fri A16 normal sa A16 special sa A16 normal sun A16 special sun A16 13% 4% 2% 2% 2% 2% 28% 14% 10% 3% 3% 3% 41% 19% 12% 6% 5% 5% 75 13 6 7 6 6 148 43 31 9 9 9 222 56 38 16 15 15 Uit deze resultaten valt op dat met name vrijdag een grote bandbreedte kent, en de zondag een zeer kleine (hetgeen naar verwachting is). Ook de zogenaamde “speciale dagen” hebben een grotere bandbreedte dan de overige dagen, volgens de MRD. De MAD kent aan de speciale dagen een iets kleinere bandbreedte toe. De dagen maandag t/m donderdag apart kennen een iets kleinere bandbreedte dan wanneer deze in hetzelfde cluster zitten. Vervolgens is voor elk cluster nagegaan of het gebruiken van de mediaan van het cluster als voorspelling zou leiden tot een betere voorspelling dan wanneer de mediaan van de totale database gebruikt zou worden. Dit is gedaan door voor elke dag in een cluster te bepalen wat voor deze dag de fout (de MRD) zou zijn indien de mediaan van het cluster als voorspelling gebruikt zou worden voor deze dag. De gemiddelde MRD voor alle dagen in het cluster is een maat voor de kwaliteit van het de mediaan van dit cluster als reistijdvoorspeller. Hetzelfde is gedaan voor de mediaan van de totale reistijdenset als voorspeller, zodat vergeleken kan worden tot welke verbetering de clustering heeft geleid. De resultaten van de berekening staan in Tabel 9 tot en met Tabel 12. Tabel 9: Vergelijking van het gemiddelde van elk cluster als reistijdvoorspeller met het gemiddelde van de totale reistijdenset als reistijdenvoorspeller voor de A13 all normal days A13 all special days A13 normal mo-th A13 special mo-th A13 autumn mo-th A13 no heavy rain mo-th A13 normal mo A13 normal tue A13 normal wedn A13 normal thu A13 special mo A13 special tue A13 special wedn A13 special thu A13 normal fri A13 special fri A13 normal sa A13 special sa A13 normal sun A13 special sun A13 meanMRD 15% 17% 13% 15% 9% 24% 14% 11% 13% 16% 15% 13% 16% 23% 11% 8% 6% 5% 16% 13% meanMRDref 14% 15% 13% 14% 9% 20% 14% 10% 15% 14% 15% 11% 20% 25% 15% 14% 14% 13% 21% 13% impr pp -0.83 -1.09 0.26 -1.46 -0.25 -4.04 0.24 -1.06 1.44 -2.31 0.2 -1.83 3.13 2.16 4.27 6.45 8.19 7.96 5.08 0.13 rel. improvement -6% -7% 2% -11% -3% -21% 2% -11% 10% -17% 1% -17% 16% 9% 28% 45% 59% 61% 24% 1% TNO-rapport 38 / 58 Tabel 10: Vergelijking van het gemiddelde van elk cluster als reistijdvoorspeller met het gemiddelde van de totale reistijdenset als reistijdenvoorspeller voor de A16 all normal days A16 all special days A16 normal mo-th A16 special mo-th A16 normal fri A16 special fri A16 normal sa A16 special sa A16 normal sun A16 special sun A16 meanMRD 15% 17% 13% 5% 16% 13% 11% 3% 6% 2% meanMRDref 14% 15% 13% 15% 20% 17% 15% 17% 14% 18% impr pp -0.83 -1.09 0.26 10.2 3.13 4.11 4.27 14.07 8.19 15.39 rel. improvement -6% -7% 2% 66% 16% 24% 28% 83% 59% 88% Op de A13 leidt de clustering voor slechts enkele clusters tot een verbeterde reistijdvoorspelling. Dit is met name woensdag (als apart cluster), vrijdag en het weekend. Op de A16 leidt de clustering wel voor vrijwel alle clusters tot een grote verbetering. De grootste verbetering wordt ook hier gehaald in het weekend en door de “speciale dagen” apart te clusteren. Tabel 11: Vergelijking van het gemiddelde van elk cluster als reistijdvoorspeller met het gemiddelde van de totale reistijdenset als reistijdenvoorspeller voor de A13 all normal days A13 all special days A13 normal mo-th A13 special mo-th A13 autumn mo-th A13 No rain mo-th A13 normal mo A13 normal tue A13 normal wedn A13 normal thu A13 special mo A13 special tue A13 special wedn A13 special thu A13 normal fri A13 special fri A13 normal sa A13 special sa A13 normal sun A13 special sun A13 meanMAD 76 74 68 78 52 132 74 55 72 80 76 56 89 118 38 26 18 17 87 67 meanMADref 68.95 76.2023 62.9561 70.8339 48.027 102.6719 68.9267 50.897 69.5558 67.499 68.95 56.0573 87.3989 105.2133 75.6047 74.0176 71.2713 68.2166 98.2691 61.152 improvement -7 2 -5 -7 -4 -29 -5 -4 -2 -13 -7 0 -2 -12 38 48 53 52 11 -5 rel. improvement -11% 3% -9% -10% -7% -29% -7% -8% -3% -19% -11% 0% -2% -12% 50% 65% 75% 76% 11% -9% Tabel 12:Vergelijking van het gemiddelde van elk cluster als reistijdvoorspeller met het gemiddelde van de totale reistijdenset als reistijdenvoorspeller voor de A16 all normal days A16 meanMAD 76.3062 meanMADref 68.95 improvement -7.3562 rel. improvement -11% TNO-rapport 39 / 58 all special days A16 normal mo-th A16 special mo-th A16 normal fri A16 special fri A16 normal sa A16 special sa A16 normal sun A16 special sun A16 74.1691 68.4388 15.564 89.0537 43.5151 37.6827 7.9218 17.7716 5.9634 76.2023 62.9561 77.1877 87.3989 80.8193 75.6047 83.6452 71.2713 85.8261 2.0332 -5.4827 61.6237 -1.6548 37.3042 37.922 75.7234 53.4997 79.8627 3% -9% 80% -2% 46% 50% 91% 75% 93% ********** toevoegen van inzichten en conclusies MAD ************* 3.4 Analyse van gerealiseede reistijden en neerslagdata Tenslotte is gekeken naar het effect van de gedetailleerde neerslagdata op de bandbreedte van de reistijden. Vervolgens hebben we voor het totale traject bepaald wat de bandbreedte is op een aantal specifieke tijdstippen, nl. 8:00 uur, 12:00 uur, 17:30 uur en 22:00 uur. Rond 8:00 uur is de reistijd in de ochtendspits over het algemeen het hoogst, in de avondspits is dit rond 17:30 uur. Rond deze tijdstippen is de spreiding in reistijden ook het grootst. 12:00 uur en 22:00 uur zijn gekozen als rustigere tijdstippen met een kleine spreiding in de reistijd. De bandbreedte hebben we gedefinieerd als het verschil tussen het 90%-percentiel en het 10%-percentiel, oftewel, het reistijdverschil van 80 % van de reistijden rondom de mediaan. Clusters zijn gemaakt op basis van dag van de week en neerslaghoeveelheid. De neerslaghoeveelheid is opgedeeld in 4 klassen, nl. geen neerslag, lichte neerslag (tot 0.1 mm), matige neerslag (tussen 0.1 en 0.5 mm) en zware neerslag (meer dan 0.5 mm). De resultaten zijn weergegeven in de Tabel 13 t/m Tabel 16 . Tabel 13: Bandbreedtes in seconden om 8:00 uur alle dagen geen neerslag 0 < neerslag <= 0.1 0.1 < neerslag <= 0.5 neerslag > 0.5 totale database 400 393 463 370 372 ma t/m do 407 395 517 257 117 vr 295 337 513 257 328 za 42 22 451 366 386 zo 34 36 463 370 372 Tabel 14: bandbreedtes in seconden om 12:00 uur 12 uur alle dagen geen neerslag 0 < neerslag <= 0.1 0.1 < neerslag <= 0.5 neerslag > 0.5 totale database 202 132 80 296 358 ma t/m do 102 191 47 88 352 Tabel 15: Bandbreedtes in seconden om 17:30 uur vr 365 210 51 249 352 za 67 68 70 341 355 zo 28 25 80 296 358 TNO-rapport 40 / 58 alle dagen geen neerslag 0 < neerslag <= 0.1 0.1 < neerslag <= 0.5 neerslag > 0.5 totale database 1679 1679 1475 1948 1272 ma t/m do 1520 1565 1366 1781 1444 vr 1840 1905 1430 1781 1649 za 299 189 1639 1966 1272 zo 300 300 1475 1948 1272 vr 96 96 65 61 26 za 40 42 65 58 66 zo 33 34 56 45 66 Tabel 16: Bandbreedtes in seconden om 22:00 uur alle dagen geen neerslag 0 < neerslag <= 0.1 0.1 < neerslag <= 0.5 neerslag > 0.5 totale database 58 62 56 45 66 ma t/m do 69 76 65 45 19 In deze resultaten valt op dat clustering naar neerslaghoeveelheid niet altijd leidt tot een kleinere bandbreedte. Met name op zaterdag en zondag leidt een matige tot grote hoeveelheid neerslag tot een grotere bandbreedte. Het effect van de neerslag is niet voor alle tijdstippen gelijk en ook niet eenvoudig te verklaren. Zo leidt een kleine hoeveelheid neerslag rond 12:00 uur tot een kleinere bandbreedte, terwijl dit rond 8:00 uur tot een grotere bandbreedte leidt. Op doordeweekse dagen rond 22:00 uur heeft de neerslaghoeveelheid een positief effect op de bandbreedte van de reistijden. In het weekend is het effect juist negatief. 3.5 Conclusies (********* later *************) TNO-rapport 4 41 / 58 Voorspelmethode 4.1 Keuze voor reistijdvoorspellingsmethode Er is gekozen om een variant van de k-nearest neighbor methode toe te passen. In een eerdere studie van TNO (PredicTime) is de k-nearest neighbor (kNN) methode als een goede methode naar voren gekomen voor zowel korte als lange-termijn reistijdschatting. De methode is geschikt om toe te passen op grote hoeveelheden historische data. De k-nearest neighbor methode zoekt in de databse naar de k situaties die het meest overeenkomen met de te voorspellen situatie. In PredicTime is de methode toegepast voor korte termijn reistijdschatting, waarbij alleen de actuele reistijden en reistijden uit het recente verleden werden gebruikt om het model te voeden. Voor ATMO 5G is de methode aangepast voor lange termijn reistijdschatting, waarbij een groot aantal verklarende factoren voor reistijden meegenomen kunnen worden. Ook zijn een aantal modelkeuzes gedaan die de implementatie vereenvoudigen en die het mogelijk maken dat er ook een voorspelling gegenereerd wordt als er geen vergelijkbare situaties in de database voorkomen. De huidige implementatie zoekt alle situaties die het meest lijken op de te voorspellen situatie, ongeacht of dit er k zijn of meer of minder dan k. De methode kan dus beter de NN-methode genoemd worden. Van de gebruikte methode zijn geen eerdere implementaties en resultaten bekend uit de literatuur. 4.2 Beschrijving van de methode 4.2.1 Opzet van de methode De methode heeft gelijkenis met de k-Nearest Neighbour-methode, nl: binnen een set van reistijden worden reistijden gezocht die op basis van extra kenmerken van de dag en de tijd (zoals dag van de week, weer etc) het meest lijken op de dag en tijd waarvoor de voorspelling gedaan moet worden. Hieruit wordt een reistijd afgeleid. Dit wordt per deeltraject apart bepaald, waarbij het starttijdstip van de voorspelling van elk volgend deeltraject af hangt van de voorspelling van de reistijd over het vorige deeltraject. Een voorspelling is mogelijk op basis van aankomsttijd of op basis van vertrektijd. De methode bestaat uit de volgende stappen: Voorbereiding: 1. Vul voor elk deeltraject een database met historische reistijden en bijbehorende eigenschappen; 2. Deel de database op in een aantal basisclusters op basis van eigenschappen waarvan vooraf bekend is dat er per cluster sprake is van een duidelijk anders reistijdprofiel. Dit zal de uiteindelijke zoektijd in de databse verkleinen. Voorspelling voor een gegeven tijd en dag: 3. Bepaal in welk basiscluster deze voorspelling hoort; TNO-rapport 42 / 58 4. Bepaal welke reistijden binnen het cluster op basis van extra eigenschappen de meeste gelijkenis vertonen met de te voorspellen situatie; deze reistijden vormen een sub-cluster. 5. Bepaal een reistijd aan de hand van de reistijden in het sub-cluster. 6. Bepaal het starttijdstip (of eindtijdstip bij een gegeven aankomsttijd) voor het volgende deeltraject en herhaal stappen 3 t/m 6 voor het volgende deeltraject. 4.2.2 Uitwerking stap 4: het vinden van overeenkomstige situaties Om te bepalen welke situaties uit de database het meest lijken op de te voorspellen situatie, moet een afstandsmaat gedefinieerd worden voor de afstand tussen de te voorspellen situatie en een willekeurige situatie uit de database. Veel van de extra eigenschappen van de reistijden zijn discrete of zelfs binaire variabelen, zoals wel/geen vakantiedag, wel/geen groot evenement etc. De “afstand” van twee situaties voor deze variabelen kan dus ook slechts twee waardes hebben, nl. komt wel overeen (1) of komt niet overeen (0). Enkele variabelen zijn wel continu, zoals de neerslaghoeveelheid. Om de methode eenvoudig te houden en ervoor te zorgen dat er voor iedere situatie voldoende vergelijkende situaties in de database gevonden worden, hebben we ervoor gekozen alle variabelen op te delen in klassen. Per klasse is dus altijd sprake van wel/geen overeenkomst, zodat de mate van overeenkomst tussen twee situaties eenvoudig op de volgende manier bepaald kan worden: Dist = ∑ ∑ N Mi i =1 j =1 α i j ⋅ | k i j ( x1 ) − k i j ( x 2 ) | waarin: k i j (x) = binaire variabele die aangeeft of situatie x valt binnen klasse j van variabele i; α ij N Mi = weegfactor voor klasse j van variabele i; = aantal variabelen; = aantal klassen van variabele i. Voor een te voorspellen situatie v en P situaties (records) x1 … x P in de database, wordt op de volgende manier de minimale afstand bepaald: d k = ∑i =1 ∑ j =i1α i j ⋅ | k i j (v) − k i j ( x k ) | N M dmin = min{d k } k Alle situaties die vervolgens worden gebruikt voor de reistijdvoorspelling, zijn alle records uit het subcluster waarvoor geldt dat d k = dmin . Het aantal situaties dat hieraan voldoet, kan dus varieren. Parameters in de methode zijn de weegfactoren en de klassenindeling, m.a.w. het aantal klassen en de klassengrenzen. TNO-rapport 43 / 58 ******* welke opties zijn er voor het bepalen van een reistijdvoorspelling als we meerdere historische waarnemingen hebben gevonden die overeenkomen met de eigenschappen en omstandigheden van de te voorspellen reistijd? Hebben we inzicht hoeveel waarnemingen er door de methode worden uitgefilterd. 4.2.3 Uitwerking stap 5: het afleiden van een reistijdvoorspelling binnen een sub-cluster Uit de reistijden in het sub-cluster wordt een reistijdvoorspelling afgeleid. Een aantal mogelijkheden om dit te doen, zijn: • kies 1 waarde; • kies (gewogen) gemiddelde; • kies mediaan of andere percentielwaarde. Indien slechts 1 waarde gekozen wordt als reistijdvoorspelling, hangt de voorspellingskracht van deze waarde sterk af van de kwaliteit en de precieze omstandigheden van deze ene waarde. Indien er bij deze waarde sprake was van een omstandigheid die niet als verklarende variabele is meegenomen in de methode, maar die toch voor een afwijkende reistijd heeft gezorgd, zoals een incident, zal dit een slechte voorspelling opleveren. Een waarde afgeleid uit meerdere historische situaties zal gemiddeld genomen betere resultaten opleveren, omdat de invloed van overige omstandigheden zal worden “uitgemiddeld”. Daarom zullen we niet kiezen uit slechts 1 waarde als reistijdvoorspelling (tenzij het subcluster slechts bestaat uit 1 reistijd). Een gewogen gemiddelde kan bijvoorbeeld situaties die het meest met de te voorspellen situatie overeenkomen, zwaarder wegen. Echter, op grond van onze afstandsmaat komen alle situaties in het subcluster evenveel overeen. Eventueel zou een nauwkeuriger afstandsmaat gebruikt kunnen worden (zonder klassenindeling) om de weegfactoren te bepalen. Het is echter de vraag of het toekennen van een groter gewicht aan slechts enkele historische waarnemingen de voorspellingskracht zal verbeteren, om dezelfde reden als waarom we er niet voor hebben gekozen om te voorspellen op basis van slechts 1 waarde. De mediaan is een statistische maat die het midden van een set waarden bepaalt. De mediaan is een robuustere maat dan het gemiddelde en wordt niet beïnvloed door grote uitschieters, in tegenstelling tot het gemiddelde. Om deze reden hebben wij ervoor gekozen de mediaan te gebruiken om de reistijdvoorspelling te bepalen. Een percentielwaarde kan gebruikt worden om een voorspelling te genereren die een indicatie geeft van de reistijdbetrouwbaarheid. Het 90e percentiel wordt beschouwd als een goede maat die de gemiddelde reistijd en de variabiliteit combineert [ref]. Het 90% percentiel geeft bijvoorbeeld een schatting van de reistijd waar de daadwerkelijk gerealiseerde reistijd in 90% van de gevallen binnen zal blijven. In de studie van [ref] zijn de 15% en 85% percentielwaardes gebruikt om de reistijdbetrouwbaarheid weer te geven. Om het 90% (of 85%) percentiel te kunnen bepalen, is het wel een vereiste dat het sub-cluster voldoende waarnemingen bevat. 4.2.4 Voor- en nadelen Voordelen van deze methode zijn: • Er worden altijd historische waarnemingen gevonden bij de te voorspellen situatie, ook als er variabelen zijn waarvoor geen van de situaties in de database mee overeenkomt. ************ beter formuleren ************* TNO-rapport 44 / 58 • De methode is eenvoudig uit te breiden met extra variabelen. Deze kunnen aan de database en het evaluatie-routine worden toegevoegd. • De methode is zeer robuust. Bij het ontbreken van waarnemingen (bijvoorbeeld door het uitvallen van detectielussen) blijft de methode werken. Alleen als voor langere periode geen nieuwe waarnemingen worden toegevoegd verliest de methode aan waarde. Mogelijke nadelen van de methode zijn: • De methode kent een continue behoefte aan data; Voor elke voorspelling wordt de database geraadpleegd. Naarmate meer data moet worden doorzocht zal de snelheid van de voospelmethode afnemen. Er kunnen versnellingen worden ontwikkeld om op basis van karakteristieken gedeeltes van de database uit te sluiten van het zoekproces. • Regelmatig onderhoud van de database is noodzakelijk; bij veranderde omstandigheden (bijvoorbeeld verandering snelheidslimiet, aanpassing infrastructuur, veranderde verkeersvraag etc) geeft de methode geen goede resultaten meer. Bij structurele wijzigingen van de infrastructuur (bijvoorbeeld extra capaciteit of aanpassing maximum snelheid) biedt methode geen passende oplossing. Er moet voor de nieuwe situatie eerste nieuwe data worden verzameld. TNO-rapport 5 45 / 58 Testen van voorspelmethode 5.1 Opzet van testmethode De basisclustering van de database (stap 2) is gedaan op basis van dag van de week, waarbij maandag t/m donderdag in hetzelfde cluster is opgenomen (overeenkomstig hoofdstuk xx en ref Chrobok). Voor het bepalen van de situaties in het cluster die het meest lijken op de te voorspellen situatie (stap 4), is de methode toegepast zonder j weegfactoren, dus α i = 0 ∀i, j . Verder zijn de volgende variabelen met de aangegeven klassengrenzen meegenomen: Tabel x: variabelen en klassengrenzen zoals toegepast in de voorspellingsmethode klassengrenzen tijdstip Rond de spitsperiodes per kwartier, daarbuiten per uur, tussen 01:00 en 05:30 slechts een klasse. dag van de week Ma t/m do, vr, za, zo feestdag Ja/nee evenement Ja/nee vakantiedag Ja/nee dagneerslag (mm) 0-10, 10-50, >50 hoeveelheid neerslag per uur (mm) 0-0.1, 0.1-0.5, >0.5 mist (op uurbasis) Ja/nee lichte sneeuw (op uurbasis) Ja/nee matige/zware sneeuw (op uurbasis) Ja/nee 5.2 Resultaten Voor elke dag in 2004 hebben we met de beschreven methode de reistijd voorspeld, waarbij de database telkens bestaat uit alle data uit 2004, behalve de te voorspellen dag, en behalve ongeldige metingen (per tijdstip en per traject apart verwijderd). Voor een aantal belangrijke tijdstippen op elke dag hebben we de absolute relatieve fout bepaald, namelijk midden in de ochtendspits, een rustiger tijdstip midden op de dag, midden in de avondspits en een rustig tijdstip later op de avond. Het gemiddelde van de absolute relatieve fout op deze tijdstippen over alle voorspellingen, staat weergegeven in tabel x. Hierin is ter referentie als voorspelling het jaarlijks gemiddelde (per kwartier) gebruikt, de jaarlijkse mediaan (per kwartier), de jaarlijkse mediaaan geclusterd naar dag van de week (ma t/m do in 1 cluster, vr, za, zo apart). Vervolgens is de methode toegepast met alle variabelen en klassengrenzen, zoals aangegeven in tabel x. Tenslotte is de methode ook toegepast met de variabelen uit tabel x, met de uitgebreide neerslagdata, maar zonder de uitgebreide weertypes (mist, lichte sneeuw, matige/zware sneeuw). Tabel xxx: gemiddelde absolute relatieve fout op het totale traject van noord naar zuid Tijd 08:00 12:00 17:30 22:00 Referentie jaarlijks gemiddelde 15.7% 7.3% 37.2% 3.8% referentie jaarlijkse mediaan 15.0% 5.1% 34.4% 2.7% referentie jaarlijkse mediaan 8.4% 4.0% 20.6% 2.7% TNO-rapport 46 / 58 met dagclustering reistijd met schattingsmethode uitgebreide weertypes reistijd met schattingsmethode neerslag eigen met 7.7% 4.5% 19.8% 3.4% 7.6% 4.6% 19.4% 3.3% eigen met Tabel xxx: gemiddelde absolute relatieve fout op het totale traject van zuid naar noord tijd 08:00 12:00 17:30 22:00 referentie jaarlijks gemiddelde 36.5% 10.8% 19.0% 9.4% referentie jaarlijkse mediaan 26.1% 5.4% 15.3% 4.8% referentie jaarlijkse mediaan met dagclustering 17.7% 4.9% 12.6% 4.8% reistijd met eigen schattingsmethode met 15.7% 5.3% 12.7% 5.9% uitgebreide weertypes reistijd met eigen schattingsmethode met 15.5% 5.3% 12.6% 5.9% neerslag Uit deze resultaten valt op dat de mediaan beter scoort dan het gemiddelde, dat dagclustering leidt tot een grote verbetering en dat toevoegen van weersvariabelen de voorspelling in de spits ten opzichte van dagclustering nog enigszins verbetert. Buiten de spits leidt het toevoegen van weertypes tot een kleine verslechtering. Het meenemen van extra weertypes (mist, sneeuw) behalve neerslag leidt gemiddeld niet tot een verbetering (kleine verslechtering). In onderstaande tabellen staat per tijdstip voor welk percentage van de voorspellingen de absolute relatieve fout binnen een marge van 10% is gebleven. Gezien het feit dat binnen een kwartiersperiode de reistijdschommelingen in de praktijk vaak vrij groot zijn en er ook sprake is van onderlinge reistijdverschillen van verschillende bestuurders in hetzelfde tijdsinterval, is een percentage van 10% een streng criterium. Reistijdvoorspellingen die binnen deze marge vallen kunnen als zeer goed beschouwd worden. Tabel xxx: percentage voorspellingen waarop 10 % op het totale traject van noord naar zuid tijd 08:00 referentie jaarlijks gemiddelde referentie jaarlijkse mediaan 39.5% referentie jaarlijkse mediaan met dagclustering 69.3% reistijd met eigen schattingsmethode met 77.3% uitgebreide weertypes reistijd met eigen schattingsmethode met 77.3% neerslag de absolute relatieve fout kleiner is dan 12:00 17:30 22:00 80.3% 20.0% 95.9% 85.5% 28.8% 96.2% 88.0% 42.5% 93.7% 87.7% 41.6% 94.5% TNO-rapport 47 / 58 Tabel xxx: percentage dagen waarop de absolute relatieve fout kleiner is dan 10 % op het totale traject van zuid naar noord tijd 08:00 12:00 17:30 22:00 referentie jaarlijks gemiddelde 15.6% 61.9% 29.0% 75.9% referentie jaarlijkse mediaan 17.0% 88.2% 37.3% 92.6% referentie jaarlijkse mediaan met dagclustering 49.9% 88.2% 54.3% 92.3% reistijd met eigen schattingsmethode met uitgebreide weertypes 53.7% 87.1% 57.5% 90.4% reistijd met eigen schattingsmethode met neerslag 54.5% 87.1% 57.8% 90.4% Uit deze resultaten valt opnieuw op dat de voorspellingsmethode met de meegenomen variabelen tot een grote verbetering heeft geleid ten opzichte van de jaarlijkse mediaan (of gemiddelde) als voorspelling. De dagclustering leidt opnieuw tot de grootste verbetering. Op het traject van noord naar zuid is in de ochtendspits een percentage van ruim 77% binnen een foutmarge van 10% gehaald, hetgeen zeer goed genoemd mag worden. In de avondspits is het resultaat minder goed, wat verklaard kan worden doordat de variatie in reistijden in de avondspits veel groter is. Op het traject van zuid naar noord zijn de resultaten voor de ochtendspits en de avondspits ongeveer gelijk en iets minder goed dan de ochtendspits van het traject van noord naar zuid. 5.3 Reflectie op resultaten en geraadpleegde lieratuur • Met een relatief eenvoudige methode is het mogelijk goede reistijdvoorspellingen te doen voor de lange termijn, zeker in vergelijking met statische reistijden die momenteel gebruikt worden in routeplanners. • Het toevoegen van weersinvloeden zorgt gemiddeld voor een kleine verbetering van de reistijdvoorspelling; • In de literatuur wordt aangegeven dat een aantal weersinvloeden, zoals neerslag, sneeuw en gladheid wegdek, een significante invloed op snelheid en reistijd hebben, maar het is in de geraadpleegde literatuur niet gelukt dit aan te tonen met clusteringtechnieken of reistijdvoorspellingsmethoden. 5.4 Verbeteringsmogelijkheden • Het effect van grote evenementen alleen lokaal mee nemen. Op dit moment worden alle evenementen meegenomen op het hele traject, ongeacht of het evenement zich afspeelt in Rotterdam of Den Haag; • Meer weertypes meenemen, zoals condities die tot een glad wegdek leiden; • Weegfactoren in de methode calibreren, bijvoorbeeld m.b.v. regressie analyse. • Mogelijk kan het tot een verbetering leiden als in bepaalde situaties alleen overeenkomstige situaties worden meegenomen die op een specifieke variabele overeen moeten komen, zoals in het geval van sneeuwval (bij de huidige implementatie komt een situatie die bijvoorbeeld 5 keer overeenkomt met de TNO-rapport 48 / 58 referentie situatie, maar waarin geen sneeuwval voorkomt, net zo goed overeen als een andere situatie die ook 5 keer overeenkomt, waarin wel sneeuwval voorkomt); • Als er voor een specifieke situatie te weinig overeenkomstige situaties gevonden worden, zou een andere reistijdvoorspellingsmethode wellicht tot een beter resultaat leiden; • Vergelijking met clusteringsmethode die zelf een clustering bepaalt; • Traject opdelen in op- en afritten; hiermee kan de methode beter worden toegepast als reistijdvoorspeller voor verschillende routes op netwerkniveau TNO-rapport 6 49 / 58 Conclusies en aanbevelingen 6.1 Belangrijkste bevindingen • Conclusie tav methoden voor LT voorspellingen • Conclusie tav van betrouwbaaarheid van voorspellingen • Conclusie tav belangrijke beïnvloedende factoren • Conclusie tav eigen methoden en resulaten Mogelijkheden aanlevering (weer)data?? 6.2 Onderzoeksagenda Het onderzoek naar een betrouwbare en effectieve lange termijn reistijdvoorspeller voor een traject binnen een netwerk is nog niet voltooid. Op basis van de bevindingen van het ATMO 5g onderzoek is de volgende onderzoeksagenda opgesteld: • Verbeteren van de ontwikkelde methode • Uitbreiden van de ontwikkelde methode met onderliggend en stedelijk wegennet • Toepassen van de ontwikkelde methode op andere trajecten in Nederland • Uitbreiden naar een netwerkvoorspeller TNO-rapport A Geraadpleegde Literatuur 50 / 58 TNO-rapport 51 / 58 B Trajectspecificering Op basis van het geselecteerde traject zijn de Monica meetpunten bepaald die op de grenzen van deze meetpunten liggen. Tussen deze meetpunten wordt vervolgens de gemiddelde resitijd bepaald. Hierbij wordt van het volgende uitgegaan • • • • • Begin datum: 2004 01 01 Eind datum: 2004 12 01 Begin tijd: 0:00 Eind tijd: 23:59 Aggregatie : 15 minuten Op de volgende pagina’s zijn de gespecificeerde trajecten weergegeven. TNO-rapport Traject 1 Rijsoord – Ridderster 28725 - 24025 4700 m Ridderster – Rijsoord 24035 - 28995 4960 Traject 2 Ridderster – Brienenoord 24025 – 20605 3420 m Brienenoord – Ridderster 21518 - 24035 2517 52 / 58 TNO-rapport Traject 3 Brienenoord – Terbregse plein 20605 - 15728 4877 m Terbregse plein – Brienenoord 15721 - 21518 5797 m Traject 4 Terbregseplein – Kleinpolderplein 33565 - 29930 3420 m Kleinpolderplein – Terbregse plein 30110 - 34900 2517 m 53 / 58 TNO-rapport Traject 5 Kleinpolderplein – Zestienhoven 18640 - 15005 3635 m Zestienhoven – Kleinpolderplein 15007 - 18820 3813 m 54 / 58 TNO-rapport Traject 6 Zestienhoven – Delft zuid 15005 – 12000 3005m Delft zuid – Zestienhoven 11510 – 15007 3497 m 55 / 58 TNO-rapport 56 / 58 TNO-rapport C 57 / 58 Weertypes in tekst Hieronder is de volledige lijst met weertypes in tekst weergegeven, zoals opgeleverd door MeteoConsult: • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • Weerlicht Onweer zonder neerslag IJsregen Lichte motregen Lichte motregen en regen Lichte motregen met ijzel Lichte regen Lichte regenbui Matige motregen Matige of zware motregen en regen Matige of zware regenbui Matige regen Zware motregen Zware regen Lichte regen en sneeuw Lichte sneeuw Lichte sneeuwbui Matige of zware regen en sneeuw Matige sneeuw Motsneeuw Onweer met regen of sneeuw Geheel bewolkt Geheel bewolkt na ijzel Geheel bewolkt na mist Geheel bewolkt na motregen Geheel bewolkt na onweer Geheel bewolkt na regen Geheel bewolkt na sneeuw Half bewolkt Half bewolkt na mist Half bewolkt na motregen Half bewolkt na onweer Half bewolkt na regenbui Half bewolkt na sneeuwbui Licht bewolkt Licht bewolkt na mist Licht bewolkt na motregen Licht bewolkt na regenbui Licht bewolkt na sneeuwbui Onbewolkt Onbewolkt na mist Onbewolkt na regenbui Vrijwel onbewolkt Vrijwel onbewolkt na mist Vrijwel onbewolkt na motregen TNO-rapport • • • • • • • • • • • • • 58 / 58 Vrijwel onbewolkt na regenbui Vrijwel onbewolkt na sneeuwbui Zwaar bewolkt Zwaar bewolkt na mist Zwaar bewolkt na motregen Zwaar bewolkt na onweer Zwaar bewolkt na regen Zwaar bewolkt na regenbui Zwaar bewolkt na sneeuw Zwaar bewolkt na sneeuwbui Mist met rijp Nevel Mist