Betrouwbaarheid data De database van Experian is voornamelijk

advertisement
Betrouwbaarheid data
De database van Experian is voornamelijk gebaseerd op registratie data, waardoor in veel gevallen
een betrouwbaarheid van 61-80% en deels meer dan 80% wordt gerealiseerd.
Beschikbaar op huishoudenniveau
Landelijke dekking: voor alle 7,3 miljoen huishoudens in Nederland
Weging met statistieken van CBS
Hoe doen we dat?
Toelichting:
Experian verzamelt consumenteninformatie bij openbare bronnen. Een overzicht van deze bronnen
vindt u in de bijlage. Waar mogelijk verzamelen we landelijk dekkende registratiedata op adresniveau.
Door koppeling van brongegevens wordt bepaald of een adres residentieel (consumenten) is of niet
en of er bedrijfsregistraties op een adres zijn. Dit bepaald of een adres particulier, mixed of zakelijk (of
anderszins niet-residentieel zonder bedrijfsregistratie) is. In bepaalde gevallen mogen wij de brondata
op adresniveau niet doorleveren. Door gebruik te maken van statistische analyses wordt de data
zodanig gemodelleerd zodat we het resultaat daarvan wel kunnen leveren. Waar geen
registratiegegevens bekend zijn, wordt gebruik gemaakt van invulmethodes en modellering. Met
behulp van de registratiedata worden bouwstenen gemaakt (12.150 pixels), bestaande uit groepen
huishoudens met gelijksoortige karakteristieken. Daarnaast wordt gekeken naar het soort buurt waarin
een adres zich bevindt (44 Mosaic typen).
Marktonderzoeksgegevens worden geanonimiseerd gekoppeld aan bouwstenen en hiermee worden
logistische regressiemodellen ontwikkeld per kenmerk – correlatie tussen Experian data en
onderzoeksdata. Bij het toewijzen van kenmerken aan huishoudens, wordt rekening gehouden met
CBS statistieken op een zo nauwkeurig mogelijk geografisch niveau (buurt, postcode 4p, gemeente,
etc.). Om de informatie toegankelijk te maken, creëren we hierop segmentaties. We groeperen
eenheden huishoudens of postcodes via clusteranalyse en streven hierbij zo veel mogelijk naar
homogeniteit binnen een cluster en zo veel mogelijk heterogeniteit tussen clusters.
Hiermee bouwen we een database met daarin volledige informatie over ieder huishouden van
Nederland.
Bijlage
Experian Databronnen
Geodan
Kadaster
Navteq
DataLand
Falkplan Andes
RDC
Nieuw e Kaart van
Nederland
Jonge Gezinnen
Centraal Bureau
voor de Statistiek
M&R
Developm ents
Kam er van
Koophandel
Cherridata
TNS Nipo
GfK Panel
Services
TNT Post
KPN Telecom
NOM
Experian
De Experian databronnen bevatten:
1. Registratiedata
3. GIS data
2. Onderzoeks- en lifestyledata
Download