Vragen Datamining

advertisement
Vragen Datamining
1) Een statisticus zegt dat je data mining niet moet gebruiken want je zal altijd wel een
patroon vinden. Hoe weerleg je dit?
2) Oefening text mining: entity, 2 bigrams, preprocessing stappen, tf-idf tabel,
sensitivity analysis
3) Waarom kNN lazy learner en wat met computational efficiency?
4) Wat is confidence?
5) Wat is data mining?
Project:
1) Sampling uitleggen combo en wat gebruikt? Heb gezegd niks gebruikt, combo is
under- en oversampling
2) Wat is de cost? Heb gezegd niet gebruikt, vroeg dan cost-benefit
3) Postcode genormaliseerd? Niet gebruikt, uitleggen waarom niet.
4) Decision tree geplot of zijn die variabelen degenen van model? Heb gezegd dat die
variabelen van model zijn, niet geplot
5) Op basis van wat training en test set bepaald? Test set van 2014, vroeg dan
validatieset en heb gezegd random.
Download