Marktonderzoek – Hoe pak ik een kwantitatief onderzoek aan? 1 Steekproeven Basisprincipes • • • • • • • Kleinere groep uit groter geheel Door extrapolatie oordeel over universum Schatting Geen zekerheid Normale verdeling Statistische theorie Besparing van tijd en geld 2 Steekproeven Basiskennis 1. Representatief 2. Grootte steekproef –Betrouwbaarheid –Nauwkeurigheid 3. Toevalligheid/Significante verschillen –Chi-kwadraat test 3 Steekproeven Basiskennis 1. Representatief 2. Grootte steekproef –Betrouwbaarheid –Nauwkeurigheid 3. Toevalligheid/Significante verschillen –Chi-kwadraat test 4 1. Representatief 5 Representatief? • Eerste mogelijkheid : U legt deze vraag voor aan een aantal voorbijgangers in de Antwerpse winkelstraten. • Tweede mogelijkheid : Er wordt gevraagd op de website van de GVA om deze vraag te beantwoorden. • Derde mogelijkheid ; Enquête afnemen door marktonderzoekbureau 6 Steekproeven Representatief • Onderzoeksbureau iVox ondervroeg op vraag van Gazet van Antwerpen duizend inwoners van de stad over al deze thema’s. Belangrijk om te weten: de enquête werd afgenomen tussen 12 december en 15 januari en dateert dus van vóór de aanslagen in Frankrijk. Er werd zorgvuldig geselecteerd naar geslacht, leeftijd, opleidingsniveau, districtsniveau en politiek stemgedrag. 7 Representatief • Inwoners België – Vlaanderen 6.000.000 – Wallonië 4.000.000 – Brussel 1.500.000 • Studenten Thomas More Hogeschool? 8 2. Grootte steekproef Vraag : 200?300?1000?......? Probleem : tijd, geld, verwerking Doelstelling van de enquête : – hoe betrouwbaar moet ze zijn? – hoe nauwkeurig moet ze zijn? 9 Enkele begrippen verduidelijken • Standaarddeviatie of standaardafwijking • Afwijking van het gemiddelde • Normaalverdeling of Gausscurve 10 Steekproeven Normaalverdeling/Gauss-verdeling 11 Toepassing bij steekproeven Standaarddeviatie wordt standaardfout bij steekproeven : Meerdere keren een steekproef trekken en ondervragen waardoor men verschillende uitkomsten van het gemiddelde bekomt: Standaardfout van het gemiddelde of sX 12 Steekproeven Betrouwbaarheid - 3 Sx -2Sx -1Sx X + Sx Betrouwbaarheid van 95% dat het gemiddelde ligt tussen X plus 2 maal standaardfout en min tweemaal standaardfout, +2Sx +3Sx 13 Steekproeven Nauwkeurigheid of foutenmarge - 3 Sx -2Sx -1Sx X + Sx +2Sx +3Sx De grootte van de standaardfout of Sx ; hoe kleiner de foutenmarge hoe groter de steekproef moet zijn 14 Bepalen grootte steekproef • In marktonderzoek wordt geopteerd voor een betrouwbaarheid van 95% • De nauwkeurigheid wordt bepaald door de marktonderzoeker/marketeer • Formule zie handboek • Calculator : http://www.steekproefcalculator.com/steekpr oefcalculator.htm http://www.journalinks.be/steekproef/ 15 Standaardfout van proporties Bij enquêtes wordt gepeild naar bv - Kent u product “Y” waarop ja of neen wordt geantwoord - Bent u akkoord of niet met een bepaalde stelling waarop ja of niet wordt geantwoord = proportie bv 60% ja en 40 % neen Hier kan opnieuw een standaardfout worden berekend : standaardfout proportie of Sp 16 Steekproeven Bepalen steekproefgrootte bij het schatten van proporties Nauwkeurigheid/foutenmarge bij 95 % betrouwbaarheid (afgerond) Steekproefgrootte 50 100 150 200 300 400 500 1000 1500 2000 4000 5000 10000 25000 50000 1% of 99% 2,76 1,95 1,59 1,38 1,13 0,98 0,87 0,62 0,50 0,44 0,31 0,28 0,20 0,12 0,09 5% of 95% 6,04 4,27 3,49 3,02 2,47 2,14 1,91 1,35 1,10 0,96 0,68 0,60 0,43 0,27 0,19 10% of 90% 15% of 85% 20% of 80% 25% of 75% 30% of 70% 35% of 65% 40% of 60% 45% of 55% 8,32 5,88 4,80 4,16 3,39 2,94 2,63 1,86 1,52 1,31 0,93 0,83 0,59 0,37 0,26 9,90 7,00 5,71 4,95 4,04 3,50 3,13 2,21 1,81 1,56 1,11 0,99 0,70 0,44 0,31 11,09 7,84 6,40 5,54 4,53 3,92 3,51 2,48 2,02 1,75 1,24 1,11 0,78 0,50 0,35 12,00 8,49 6,93 6,00 4,90 4,24 3,80 2,68 2,19 1,90 1,34 1,20 0,85 0,54 0,38 12,70 8,98 7,33 6,35 5,19 4,49 4,02 2,84 2,32 2,01 1,42 1,27 0,90 0,57 0,40 13,22 9,35 7,63 6,61 5,40 4,67 4,18 2,96 2,41 2,09 1,48 1,32 0,93 0,59 0,42 13,58 9,60 7,84 6,79 5,54 4,80 4,29 3,04 2,48 2,15 1,52 1,36 0,96 0,61 0,43 13,79 9,75 7,96 6,89 5,63 4,88 4,36 3,08 2,52 2,18 1,54 1,38 0,98 0,62 0,44 50% 13,86 9,80 8,00 6,93 5,66 4,90 4,38 3,10 2,53 2,19 1,55 1,39 0,98 0,62 0,44 17 Steekproeven Samenstelling / stappenplan 1 Definitie van de ‘relevante’ populatie en haar kenmerken ↓ 2 Definitie van het steekproefkader of sampling frame ↓ 3 Bepaling van het benodigde budget en de benodigde tijd ↓ 4 Keuze van de steekproefmethode (o.m. toevallig versus niet-toevallig) ↓ 5 Bepaling van de noodzakelijke steekproefgrootte ↓ 6 Trekking van de steekproef en verzameling van de informatie ↓ 7 Nagaan van de representativiteit ↓ 8 Verwerking van de gegevens Marc De Laet, Pol Toye Marktonderzoek in rechte lijn 2014 UDB © 18 Steekproeven Definitie populatie • Doelgroep duidelijk en ondubbelzinnig vastleggen • Eventueel: vooronderzoek • Basis: – sociodemografische kenmerken – gedragsmatige kenmerken Marc De Laet, Pol Toye Marktonderzoek in rechte lijn 2014 UDB © 19 Steekproeven Definitie populatie op basis van sociodemografische kenmerken • • • • • • • • • Geslacht Leeftijd Sociale status Beroep Woonplaats Woonomgeving Beroepssector Leefwijze … Marc De Laet, Pol Toye Marktonderzoek in rechte lijn 2014 UDB © 20 Steekproeven Definitie populatie op basis van gedragsmatige kenmerken • Gebruiker • Niet-gebruiker • Aankoper • Ex-gebruiker • … van • Product • Merk • … Marc De Laet, Pol Toye Marktonderzoek in rechte lijn 2014 UDB © 21 Steekproeven Sampling frame • Lijst van elementen van de doelgroep • Mogelijke bronnen: – beroepsverenigingen – opdrachtgever – handelsregister –… • Niet van alle doelgroepen lijsten Marc De Laet, Pol Toye Marktonderzoek in rechte lijn 2014 UDB © 22 Steekproeven Keuze steekproefmethode • Zuiver toevallige ↔ niet-toevallige trekking • Zuiver toevallige (aselecte): – ieder element gekende kans om uitgeloot – statistische formules toepasbaar • Niet-toevallige (selecte): – kans niet gekend – statistische regels niet toepasbaar – geen extrapolatie Marc De Laet, Pol Toye Marktonderzoek in rechte lijn 2014 UDB © 23 Steekproeven Bepalen steekproefgrootte praktijk • Handige programma’s: – – – – http://www.surveysystem.com/sscalc.htm http://www.raosoft.com/samplesize.html http://www.dssresearch.com/toolkit/default.asp http://www.gmi-mr.nl/resources/sample-sizecalculator.php – http://www.macorr.com/ss_calculator.htm Marc De Laet, Pol Toye Marktonderzoek in rechte lijn 2014 UDB © 24 Steekproeven Bepalen steekproefgrootte praktische werkwijze 1 Bepaal de gewenste betrouwbaarheid: 68,3 %, 95 %, 99,7 % enz… 2 Bepaal de gewenste maximum afwijking: d.w.z. de marge: sx of sp 3 Bepaal s (bij metingen), of p (proportie) uit ofwel: – vroeger onderzoek – een vooronderzoek of pretest – de formule: maximumwaarde - minimumwaarde 6 Marc De Laet, Pol Toye Marktonderzoek in rechte lijn 2014 UDB © 25 Steekproeven Standaarddeviatie S = f1 X1 − X 2 S = Marc De Laet, Pol Toye Marktonderzoek in rechte lijn 2014 + f2 x2 − X ² + … + fk Xk − X ² n−1 𝑘 𝑖=𝑙 fi Xi − X ² n−1 UDB © 26 Steekproeven Standaardfout σ σX = n Marc De Laet, Pol Toye Marktonderzoek in rechte lijn 2014 s sX = n UDB © 27 Steekproeven Betrouwbaarheidsinterval P X − z 1−α × 2 Marc De Laet, Pol Toye s n Marktonderzoek in rechte lijn 2014 ≤ μ ≤ X + z 1−α × 2 UDB © s n = 1 -α 28 Steekproeven Standaardfout voor proporties Sp = Marc De Laet, Pol Toye Marktonderzoek in rechte lijn 2014 P ×Q n ≅ p ×q n UDB © 29 Verwerken van de gegevens Representativiteitscontrole • Vergelijking kenmerken populatiesamenstelling en steekproef • Criterium moet beschikbaar zijn voor populatie én steekproef • Samenstelling moet niet exact dezelfde → steekproefgegevens ‘trillen’ • Objectieve beoordeling → statistiek: chi-kwadraat test Marc De Laet, Pol Toye Marktonderzoek in rechte lijn 2014 UDB © 30 Verwerken van de gegevens Chi-kwadraat (1) 2 X = F0 − Fe ² Fe • Verschillen tussen twee frequentietabellen samengevat in chi-kwadraat waarde • Fo = de geobserveerde frequentie Fe = de verwachte frequentie Marc De Laet, Pol Toye Marktonderzoek in rechte lijn 2014 UDB © 31 Verwerken van de gegevens Chi-kwadraat (2) • Twee hypothesen – Ho: de twee frequentieverdelingen verschillen niet werkelijk van elkaar, het geconstateerde verschil is te wijten aan het toeval van de steekproeftrekking en is dus te verwaarlozen Symbolisch: Fe = Fo – H1: de waargenomen waarden verschillen zo sterk van de verwachte, dat we vermoeden dat ze uit een andere populatie komen Symbolisch: Fe ≠ Fo. • Vrijheidsgraden • Overschrijdingskans Marc De Laet, Pol Toye Marktonderzoek in rechte lijn 2014 UDB © 32 Verwerken van de gegevens Representativiteitscorrectie Populatiesamenstelling ≠ steekproefsamenstelling … → principieel/statistisch: steekproef verwerpen → in praktijk: steekproef corrigeren = herwegen Marc De Laet, Pol Toye Marktonderzoek in rechte lijn 2014 UDB © 33 Verwerken van de gegevens Chi-kwadraattafel Kritische waarden Vrijheidsgraden Kans op voorkomen .10 .5 .02 .01 1 2.706 3.841 5.412 6.635 12 18.549 21.026 24.054 26.217 2 4.605 5.991 7.824 9.210 13 19.812 22.362 25.472 27.688 3 6.251 7.815 9.837 11.345 14 21.064 23.685 26.873 29.141 4 7.779 9.488 11.688 13.277 15 22.307 24.996 28.259 30.578 5 9.236 11.070 13.388 15.086 16 23.542 26.296 29.633 32.000 6 10.345 12.592 15.033 16.812 17 24.769 27.587 30.995 33.409 7 12.017 14.067 16.622 18.475 18 25.989 28.869 32.346 34.805 8 13.362 15.507 18.168 20.090 19 27.204 30.144 33.687 36.191 9 14.684 16.919 19.679 21.666 20 28.412 31.410 35.020 37.566 10 15.987 18.307 21.161 23.209 21 29.615 32.671 36.343 38.932 11 17.275 19.657 22.618 24.725 22 30.813 33.924 37.659 40.289 Marc De Laet, Pol Toye Marktonderzoek in rechte lijn 2014 UDB © 34