Stages 2012-2013 @ iAdvise

advertisement
Bedrijf:
iAdvise Groep(IntoData)
Adres: Veldkant 33B
2550 Kontich
Telefoon: 03 - 451 93 28
Website: www.iadvise.eu
Company blog: iadviseblog.wordpress.com
Contactpersoon: Frederik Vallaeys
Email: [email protected]
De iAdvise groep
De iAdvise groep is een consultancybedrijf dat zich vooral richt op het aanreiken en uitwerken van
kwalitatief hoogstaande IT-oplossingen. Onze groep van enthousiaste en gemotiveerde consultants
streeft er steeds naar om hierin uit te blinken met respect voor elkaar en andere organisaties.
Kennis delen is hierin van primair belang voor iAdvise: door middel van werkgroepen, seminaries,
workshops en een eigen blog zorgen we ervoor dat onze kennis zo snel en zo goed mogelijk wordt
doorgegeven aan onze consultants, stagiairs en klanten. We gaan er dan ook prat op dat we telkens
mee zijn met de laatste ontwikkelingen.
Binnen de iAdvise groep hebben we het sub-bedrijf IntoData dat zich vooral richt op het aanreiken en
uitwerken van kwalitatief hoogstaande IT-oplossingen binnen het Data werk domein.
IntoData heeft verschillende partnerships met grote gekende data softwareproducenten zoals Oracle,
Talend en Informatica. We gaan er dan ook prat op dat we telkens mee zijn met de laatste
ontwikkelingen.
Een stage bij IntoData is dus een unieke kans als je interesse hebt in één van de verschillende data
georiënteerde domeinen.
We hebben in het verleden reeds vele stage opdrachten gehad die mooie resultaten hebben
opgeleverd. De opdrachten zijn specifiek genoeg om te weten ”waar en hoe” te starten, maar er wordt
voldoende ruimte gelaten voor verdere analyse en ontwikkeling. Je werkt steeds aan een volwaardig
project voor een fictieve externe of interne klant en krijgt op die manier een realistisch beeld van het
leven in de bedrijfswereld.
We kennen de eisen van je hogeschool/universiteit en stagebegeleider, en zorgen voor een uitstekende
begeleiding wat betreft je verslag en presentatie. Je wordt volledig in onze groep opgenomen
gedurende de stage en je bent welkom bij alle activiteiten; zowel professioneel als “plezier”! Onze
deuren staan dan ook dag en nacht voor je open.
Wij zorgen voor een project, uitstekende begeleiding en opvolging, en daarnaast verwachten van jou
een maximale inzet.
Naast kennis (delen) en kwaliteit van het werk vinden wij de manier van samenwerken, zelfstandigheid,
en “tot oplossingen komen” belangrijk. Dit zijn de kwaliteiten die nadien in de bedrijfswereld het
verschil zullen maken tussen een goede consultant en een zeer goede consultant. Behoor je tot de
laatste categorie, dan zullen we graag met je verder werken na het behalen van je diploma.
Academiejaar:
Project:
Opdrachtgever:
Stagebegeleider:
2016 – 2017
Graph Database
iAdvise Groep(IntoData)
Jan Huyzentruyt ([email protected] - 03 451 93 28)
Intodata Team
Voor Intodata staat data centraal. Wij verzorgen de dataondersteuning in diverse soorten van
projecten, tools en frameworks. Hiervoor staat een team van mensen garant dat zich aangetrokken
voelt tot elk data gerelateerd aspect binnen een informatiseringstraject.





data structuring (relational, dimensional modeling)
data integratie (etl-elt, data movement, migration, replication) voor operationele systemen of
datawarehouses
data quality en master data management (MDM)
data delivery (visualization, reporting, BI / BA)
data governance
De dataservices-markt evolueert razendsnel. Vermits wij de klant steeds een stapje voor willen blijven,
moeten wij niet alleen een duidelijk beeld hebben van de noden en trends die binnen onze markt
doorbreken, wij moeten eveneens in een vroeg stadium inzicht hebben in de nieuwste technologieën
en tools.
Stage opdracht:
Data is de “nieuwe olie” voor een bedrijf: de data kan net als olie er voor zorgen dat de radertjes (lees:
business processen) goed draaien, het is de grondstof tot informatie/kennis , het is de brandstof die
bedrijven toelaat om meer business/omzet te genereren.
Ook de talrijke webshops hebben dit begrepen. Meerdere keren per dag word je online via allerlei
advertentieblokken gelokt naar hun shop en via allerlei kanalen word je aangemoedigd je persoonlijke
gegevens achter te laten. Hoe meer deze webshops over je te weten komen, hoe gerichter zij hun
marketing campagnes kunnen sturen. Maar zijn deze gegevens wel steeds correct? Zo kan je je bv.
makkelijk meerdere keren met een ander e-mailadres registreren. Ook je adres gegevens ga je niet
spontaan up to date houden.
Daarom kampen bedrijven zoals webshops vaak met onjuiste data: dubbels, verkeerde adressen, ...
Misschien doet je partner bovendien nog eens hetzelfde; of je broer of zus waarmee je nog samen
onder hetzelfde dak woont ...
Voor bepaalde domeinen, zoals klantgegevens, producten, ... is het dus noodzakelijk om een “single
version of the truth” te bepalen in een Master Data Management systeem. Het uiteindelijke doel van
een MDM is om een “golden record” te stockeren van belangrijke business domeinen in een centrale
master data hub. Een heel belangrijke stap in dit proces is het achterhalen van potentiële dubbels.
Bij dit ontdubbelingsproces kan
 Ofwel gebruik gemaakt worden van pre-build MDM software, zoals Talend, Informatica, …
 Ofwel zelf iets gebouwd worden met behulp van bv. Graph databases (Neo4J) in combinatie
met een programmeertaal zoals Python
Graph databases bieden een alternatieve manier om databases te bouwen, die zich perfect leent voor
ontdubbeling van data. Graph databases representeren hun data in “nodes” (knooppunten) en “edges”
(pijlen met een richting). Een node staat voor een bepaald object, zoals bv. een klant, en is steeds
uniek. De edges geven de relaties weer tussen de nodes. Op die manier is bijna alle informatie te
ordenen als “wolken van nodes” met een wirwar aan pijlen om hun onderlinge relaties weer te geven.
Dubbels zijn op die manier makkelijk herkenbaar. Als extraatje zou het zelfs interessant zijn om
“households” in kaart te kunnen brengen volgens gelijkaardige algoritmes.
Het doel van deze stage is om
 onderzoek te doen naar de mogelijkheden van een Graph database (met name Neo4J)
 meer specifiek verschillen, voor- en nadelen uitlijsten in vergelijking met een traditionele
RDBMS
 Aantonen hoe een Graph database in combinatie met Python kan gebruikt worden om
gegevens te ontdubbelen (“golden record”) en records te linken aan elkaar (“household”).
 De resultaten van dit onderzoek moet het IntoData-team beter in staat te stellen de juiste
keuzes te maken bij de vragen van hun klanten rond deze problematiek.

Voor deze stageplaats zijn wij op zoek naar een informatica-profiel met een grote leergierigheid en de
wil om nieuwe technologieën te bestuderen en de passie om met data te werken.
De Begeleiding
Er wordt uiteraard gezorgd voor de nodige opleiding en begeleiding door een vooraf samengesteld
team. Tijdens je stage werk je in de context van een echt project; dit wil zeggen dat je een “klant” krijgt
die je tijdens je eerste stagedag(en) zijn noden uitlegt en vertelt welke functionaliteit geautomatiseerd
moet worden, en met welke vereisten en beperkingen. Daarnaast worden enkele technische mensen
voorgesteld die geregeld met je samenzitten voor het bespreken van oplossingen en het helpen bij
eventuele problemen.
We proberen alle onderdelen van een goed project aan bod te laten komen, zowel op technisch als op
menselijk vlak. Buiten analyse en ontwikkeling zijn communicatie, teamwerk, motivatie en
doorzettingsvermogen noodzakelijke onderdelen die niet mogen ontbreken
Download