Spatial classificatie Marlies Mooijekind Overzicht Spatial classificatie Two-step methode: classificeert objecten in spatial database Spatial classificatie van images Conclusies Spatial classificatie Classificatie: het toekennen van een een voorgedefinieerde klasse aan object op basis van zijn eigenschappen Spatial classificatie: – geometrie – spatial relaties met andere objecten – eigenschappen van objecten in de buurt Classificatieproces Learning fase: bouw classifier m.b.v. eigenschappen learning set – classifier: decision tree, neurale netwerken Avg_income(x, LARGE) True Close_to(x,water) True False High_profit = N Test fase Applicatie fase High_profit = N False High_profit = Y Algoritmen Veel algoritmen Verschillen in: – soort classifier – toepassing (fraude detectie, landgebruik etc.) – objecten die geclassificeerd worden • Pixels in images • Objecten in spatial database Objecten in spatial database Objecten in spatial database: – object heeft non-spatial attributen en geometrisch attribuut Two-step methode – vindt object beschrijvingen – maakt decision tree Two-step methode Object beschrijving: – non-spatial attributen, number of salespersons in a store – spatial gerelateerde attributen met nonspatial waarden, population living within 1km from store – spatial predikaten, close_to(X,sea) – spatial functies, driving_distance(x,sea) Bouwt decision tree Voorbeeld Learning set: – 5 objecten OID1,..,OID5 (winkels, winkelcentra) – class label high_profit: Y of N BlockID A B C H … Population 5000 4500 5500 6000 … Avg_income $25,500 $27,500 $28,300 $31,500 … Crimes 50 40 50 30 … Object beschrijving Alleen relevante attributen, predikaten en functies gebruiken – versnelt bouwen decision tree – decision tree compacter en nauwkeuriger Welke attributen, predikaten en functies zijn relevant ? Selecteren predikaten/functies Two-step methode – kies sample objecten uit learning set – eerste ruwe predikaten/functies vinden van sample objecten (bijv. m.b.v. MBRs) – relevante ruwe predikaten/functies extraheren – alleen relevante predikaten/functies in detail berekenen voor alle objecten in learning set Extractie relevante predikaten/functies Elke predikaat/functie initieel gewicht 0 Update gewichten – Voor elk sample: nearest hit en nearest miss S Nearest hit Nearest miss Extractie relevante predikaten/functies Behoud alleen predikaten/functies met gewicht > threshold gebaseerd op statische methoden Object beschrijvingen Bereken relevante predikaten/functies in detail en generaliseer OID High_ Others profit 1 Y Close_to(x,Oak_park), Close_to(x,Swan_lake) 2 Y Close_to(x,Blue_river) 3 N Close_to(x,Fir_park), Close_to(x,Blue_river) 4 N 5 N Close_to(x,Oak_park) OID High_ Others profit 1 Y Close_to(x,park), Close_to(x,water) 2 Y Close_to(x,water) 3 N Close_to(x,park), Close_to(x,water) 4 N 5 N Close_to(x,park) Spatial gerelateerde attributen met non-spatial waarden Geaggregeerde informatie BlockID A B C H … Population 5000 4500 5500 6000 … Avg_income $25,500 $27,500 $28,300 $31,500 … Crimes 50 40 50 30 … Spatial gerelateerde attributen met non-spatial waarden Geaggregeerde attributen berekenen met buffers: – hoe groot buffers – welk deel van object dat buffer snijdt meerekenen Relevantie analyse Geaggregeerde data generaliseren OID High_ profit 1 Y 2 Y 3 N 4 N 5 N Sum(pop) Avg_income 15000 20000 14500 12000 19000 $27,127 $28,512 $29,193 $28,500 $30,500 Object beschrijving OID High_ Others profit 1 Y Sum_pop(x,MEDIUM), Avg_income(x, SMALL), Close_to(x,park), Close_to(x,water) 2 Y Sum_pop(x,LARGE), Avg_income(x, MEDIUM), Close_to(x,water) 3 N Sum_pop(x,MEDIUM),Avg_income(x, LARGE), Close_to(x,park), Close_to(x,water) 4 N Sum_pop(x,SMALL), Avg_income(x, MEDIUM) 5 N Sum_pop(x,LARGE), Avg_income(x, LARGE), Close_to(x,park) Avg_income(x, LARGE) True Close_to(x,water) True False High_profit = N High_profit = N False High_profit = Y Pixels in images Veel methoden pixel-based Sommige methoden segmentatie van images: – classificatie objecten = groepen van pixels Experimenten: – subclassificatie m.b.v. geometrie (water in rivieren, kanalen, meren etc.) Conclusies Spatial classificatie: – non-spatial attributen – geometrie – spatial relaties tussen objecten – eigenschappen van buurobjecten Classificatie van – objecten in spatial database: two-step methode – pixel in images: verder onderzoek nodig