Thex - Bookmarks als basis voor datamining Data mining op basis van bookmarks is eenvoudig. We kunnen zo gebruik maken van het werk van anderen. Mits (en het zal blijken dat dit zeker niet altijd zo is, er zijn vreemde mensen op dee's aard), de bookmarks van de juiste kwaliteit zijn. Hiervoor zijn enkele GSAK macro's nodig: • FindBookmark. Dit macro is gepubliceerd en mined naar bookmark lists op basis van de gevonden loggers van de caches in de voorstaande database. • CombineBookmarkLists. Deze macro is niet gepubliceerd en adminitreert centraal de bookmarks gevonden in alle databases (ipv per database apart). Informatie uit deze centrale database wordt gebruikt om te voorkomen dat FindBookmark dubbel werk verricht door al gedane gebruikers opnieuw te bekijken. De macro ontdubbelt ook gevonden info door de hoogste content aan te houden. • LoadListOfBookmarks. Deze macro is niet gepubliceerd, en leest van een ascii lijst met bookmark guids alle caches in. • LoadListOfBookmarksTag. Deze macro is niet gepubliceerd, en leest van een ascii lijst met bookmark guids alle caches in. Daarna wordt van een extra kolom in het bookmark bestand een onderverdeling gemaakt in nachtcache/niet nachtcache, en van de niet nachtcaches vervolgens lost place, tunnel, mijn, nader uit te zoeken, duiken, lockpicking (in separate databases). Daarnaast heb ik nog: • BookmarkMacro (thex) Menu waarin alle aanroepen zitten. • LoadBookmark (thex) Laadt een bookmark in je database op basis van bookmark guid. Kan laden in de database zelf of in de ignore cache tabel in GSAK (niet meer inlezen via GPX). • ListBookmark (thex) Maakt een HTML overzicht van 1 bookmark. Hierna kun je laden in de database zelf of in de ignore cache tabel. • ImportBookmark (GSAK Forum) Importeer caches in eigen bookmarks of een bookmark via guid. Databases: Centraal is/wordt een database aangemaakt: macro/bookmark.db3. Deze bevat 2 tabellen: • CacherInfo (de bookmarks, toegankelijkheid bookmark, aantal elementen per owner/bookmark). • BookmarkIgnore, ignore voor export als html of voor export als csv. De macro CombineBookmarkLists opereert op deze database. De database wordt indien aanwezig ook gebruikt door FindBookmarks. 1 Thex - Bookmarks als basis voor datamining Lokaal wordt in de bestaande GSAK database 2 tabellen aangemaakt: • CacherInfo (de bookmarks, toegankelijkheid, aantal elementen per owner/bookmark). • CacherFilter, guids al gehad, op te halen uit de centrale database. De macro FindBookmark werkt op deze database. macro CombineBookmarkLists doet een aantal taken, en heeft een menu sturing op basis van commandline parameters: Aanroepen CombineBookmarkLists • Combineer databases en gooi dubbele entries weg: CombineBookmarkLists • Clear central database: CombineBookmarkLists.gsk?Clear • Copy to central database: CombineBookmarkLists.gsk • Generate list in html form from central, ignored bookmarks wordt weggelaten CombineBookmarkLists.gsk?ListIgnore • Generate list in html form from central CombineBookmarkLists.gsk?List • Lokaal wordt weggegooid (alle databases) CombineBookmarkLists.gsk?Cleanup • Export als cvs, ignored bookmarks wordt weggelaten CombineBookmarkLists.gsk?ExportIgnore • Export als csv CombineBookmarkLists.gsk?Export • Laadt de ignore lijst (guids). Oude content wordt weggegooid/geleegd. CombineBookmarkLists.gsk?LoadIgnore Procedure: 2 Thex - Bookmarks als basis voor datamining Per database kun je met FindBookmark naar bookmarks minen. Kan op alle loggers, top 1000 loggers. Twee fasen: • Stap 1: Minen. • Stap 2: Daarna toevoegen aantal elementen in een bookmark. De FindBookmark macro kijkt centraal welke loggers er al zijn en slaat deze over (niet in de berekening van de doorlooptijd overigens). Aam het einde komt een HTML pagina als overzicht. Stap 3: Met CombineBookmarkLists kunnen de lokale databases centraal toegevoegd worden. Daarbij vindt ontdubbeling van de bookmarks plaats, waarbij de beste waarde aangehouden/bewaard wordt. CombineBookmarkLists kan exporteren naar cvs en html, en uit de bookmarks de bookmarks in de ignore lijst weghalen. Deze lijst kan weer bijgewerkt worden door hetzelfde macro met parameter LoadIgnore. Vast bestand c:\theo\ignore.txt wordt genomen. Via CombineBookmarkLists kun je ook de lokale databases en de centrale database legen. Stap 4: Verdere export: ik zou alleen bookmarks die nog niet eerder onder handen zijn genomen meenemen om te laden. Hiervoor kan de ignore lijst in de centrale database gebruikt worden. Ik maak 1 excel waar alle bookmarks in getagged zijn. Diegene die ik niet meer wil zien gaan op de ignore lijst (zie plaat hieronder). Stap 5: Databases onderhouden (en aangemaakt) door macro LoadListOfBookmarksTag: • • • • • • • • • • T_NC - nachtcaches T_NNC - niet nachtcaches T_LP - Lost places T_BUNKER - Bunkers T_LOCKP - Lockpicking T_GROT - Grotten en holen T_MIJN - Mijnen T_TUNNEL - Tunnels T_UITZOEKEN - Rest: nader uit te zoeken T_REST - Rest: nader uit te zoeken: o %Waadpak% o %Zwem% o %Boat% o %Duik% o %Klim% Tags in eerste kolom t.b.v. macro LoadListOfBookmarksTag: 3 Thex - Bookmarks als basis voor datamining bo;d5f3b46a-727f-4efb-a9e7-6c3be90c1103 bo;23b02c0f-12ef-4bd8-b11c-90126cf49e6a bo;c104a834-3239-4ddf-a3d2-1f84a2dba3f8 De volgende tags zijn in gebruik: • bo - boot • bu - bunker • du - duiken • dui - duiken • ho - hol/grot • kl - klimmen/abseilen • lock - lockpicking • lp - lost place • nc - nachtcache • ui - nader uitzoeken • wa - waadpak • zw - zwemcache 4 Thex - Bookmarks als basis voor datamining Centraal CacherInfo Centraal Macro/bookmarks.db3 CombineBook markLists BookmarkIg nore CombineBook markLists CombineBook markLists Lokaal Lokaal CombineBook markLists?Exp ort Lokaal Lokaal Sqlite.db3 Sqlite.db3 CacherInfo FindBookmark s CacherInfo CacherFilter FindBookmark s CombineBook markLists?Loa dIgnore CacherFilter Lokaal HTML Sqlite.db3 HTML Excell Ignore list Sqlite.db3 Sqlite.db3 CSV Ascii T_TUNNEL Sqlite.db3 LoadListOfBoo kmarks List of bookmarks List of bookmarks (tagged) Ascii Ascii LoadListOfBoo kmarksTag T_LP Sqlite.db3 Lokaal T_NC T_NNC T_GROT Sqlite.db3 Sqlite.db3 Sqlite.db3 Sqlite.db3 5