Spatial classificatie

advertisement
Spatial classificatie
Marlies Mooijekind
Overzicht




Spatial classificatie
Two-step methode: classificeert
objecten in spatial database
Spatial classificatie van images
Conclusies
Spatial classificatie


Classificatie: het toekennen van een
een voorgedefinieerde klasse aan
object op basis van zijn eigenschappen
Spatial classificatie:
– geometrie
– spatial relaties met andere objecten
– eigenschappen van objecten in de buurt
Classificatieproces

Learning fase: bouw classifier m.b.v.
eigenschappen learning set
– classifier: decision tree, neurale netwerken
Avg_income(x, LARGE) True
Close_to(x,water) True
False High_profit = N


Test fase
Applicatie fase
High_profit = N
False High_profit = Y
Algoritmen


Veel algoritmen
Verschillen in:
– soort classifier
– toepassing (fraude detectie, landgebruik
etc.)
– objecten die geclassificeerd worden
• Pixels in images
• Objecten in spatial database
Objecten in spatial database

Objecten in spatial database:
– object heeft non-spatial attributen en
geometrisch attribuut

Two-step methode
– vindt object beschrijvingen
– maakt decision tree
Two-step methode

Object beschrijving:
– non-spatial attributen, number of
salespersons in a store
– spatial gerelateerde attributen met nonspatial waarden, population living within
1km from store
– spatial predikaten, close_to(X,sea)
– spatial functies, driving_distance(x,sea)

Bouwt decision tree
Voorbeeld

Learning set:
– 5 objecten OID1,..,OID5 (winkels, winkelcentra)
– class label high_profit: Y of N
BlockID
A
B
C
H
…
Population
5000
4500
5500
6000
…
Avg_income
$25,500
$27,500
$28,300
$31,500
…
Crimes
50
40
50
30
…
Object beschrijving

Alleen relevante attributen, predikaten
en functies gebruiken
– versnelt bouwen decision tree
– decision tree compacter en nauwkeuriger

Welke attributen, predikaten en functies
zijn relevant ?
Selecteren predikaten/functies

Two-step methode
– kies sample objecten uit learning set
– eerste ruwe predikaten/functies vinden van
sample objecten (bijv. m.b.v. MBRs)
– relevante ruwe predikaten/functies
extraheren
– alleen relevante predikaten/functies in
detail berekenen voor alle objecten in
learning set
Extractie relevante
predikaten/functies


Elke predikaat/functie initieel gewicht 0
Update gewichten
– Voor elk sample: nearest hit en nearest
miss
S
Nearest hit
Nearest miss
Extractie relevante
predikaten/functies

Behoud alleen predikaten/functies met
gewicht > threshold gebaseerd op
statische methoden
Object beschrijvingen

Bereken relevante predikaten/functies in
detail en generaliseer
OID High_ Others
profit
1
Y
Close_to(x,Oak_park),
Close_to(x,Swan_lake)
2
Y
Close_to(x,Blue_river)
3
N
Close_to(x,Fir_park),
Close_to(x,Blue_river)
4
N
5
N
Close_to(x,Oak_park)
OID High_ Others
profit
1
Y
Close_to(x,park),
Close_to(x,water)
2
Y
Close_to(x,water)
3
N
Close_to(x,park),
Close_to(x,water)
4
N
5
N
Close_to(x,park)
Spatial gerelateerde attributen
met non-spatial waarden

Geaggregeerde informatie
BlockID
A
B
C
H
…
Population
5000
4500
5500
6000
…
Avg_income
$25,500
$27,500
$28,300
$31,500
…
Crimes
50
40
50
30
…
Spatial gerelateerde attributen
met non-spatial waarden

Geaggregeerde attributen
berekenen met buffers:
– hoe groot buffers
– welk deel van object
dat buffer snijdt
meerekenen


Relevantie analyse
Geaggregeerde
data generaliseren
OID High_
profit
1
Y
2
Y
3
N
4
N
5
N
Sum(pop) Avg_income
15000
20000
14500
12000
19000
$27,127
$28,512
$29,193
$28,500
$30,500
Object beschrijving
OID High_ Others
profit
1
Y
Sum_pop(x,MEDIUM), Avg_income(x, SMALL),
Close_to(x,park), Close_to(x,water)
2
Y
Sum_pop(x,LARGE), Avg_income(x, MEDIUM),
Close_to(x,water)
3
N
Sum_pop(x,MEDIUM),Avg_income(x, LARGE),
Close_to(x,park), Close_to(x,water)
4
N
Sum_pop(x,SMALL), Avg_income(x, MEDIUM)
5
N
Sum_pop(x,LARGE), Avg_income(x, LARGE),
Close_to(x,park)
Avg_income(x, LARGE) True
Close_to(x,water) True
False High_profit = N
High_profit = N
False High_profit = Y
Pixels in images


Veel methoden pixel-based
Sommige methoden segmentatie van
images:
– classificatie objecten = groepen van pixels

Experimenten:
– subclassificatie m.b.v. geometrie (water in
rivieren, kanalen, meren etc.)
Conclusies

Spatial classificatie:
– non-spatial attributen
– geometrie
– spatial relaties tussen objecten
– eigenschappen van buurobjecten

Classificatie van
– objecten in spatial database: two-step
methode
– pixel in images: verder onderzoek nodig
Download