3 miljard bouwstenen en 1,5 Terabyte per persoon

advertisement
10
Case Study
Case Study
Case TUI Nederland
11
Case Erasmus Medisch centrum
3 miljard bouwstenen
en 1,5 Terabyte per persoon
Een DNA van een mens telt waarin 30.000 genen
“OLTP verloopt nu ontzettend snel”
verscholen liggen. Anno nu kan het DNA door
middel van een zogenaamde sequencer-techniek
helemaal in kaart worden gebracht. Uitgeprint
betekent dat een sliert papier van 250 kilometer
TUI Nederland had een issue. De bestaande IT-infrastructuur was niet meer berekend op de grote hoeveel-
lang, in digitale vorm een bestand van 1,5 terabyte.
heid queries binnen de infrastructuur van de verschillende websites. Toen de CIO van TUI Nederland in 2008
Van één individu, dus.
hoorde van Oracle Exadata, twijfelde hij geen moment. Exadata zou deze issues rond Online Transaction
Processing (OLTP) kunnen oplossen.
De organisatie
TUI Nederland, eigenaar van onder andere Holland International, Kras, Arke en
ArkeFly, levert pakketreizen aan consumenten. Het bedrijf heeft een vloot met
eigen vliegtuigen en koopt daarnaast reiscomponenten in, waaronder hotels,
transfers en excursies. Het concern heeft een bruto jaaromzet van meer dan
1,5 miljard euro en er werken meer dan 2.500 mensen. TUI Nederland is
onderdeel van het in Engeland beursgenoteerde bedrijf TUI Travel PLC, waar
onder andere ook Thomson Holidays onder valt en in totaal meer dan 48.000
mensen werken.
Datamutatie intensieve website
Een paar jaar geleden werd het softwareplatform van TUI Nederland geheel
vernieuwd. Consumenten konden vanaf dat moment op de website van bijvoorbeeld Arke zoeken op voorraden. Het betekende dat op basis van datuminvoer alleen nog de op dat tijdstip beschikbare producten werden getoond.
“Voor een boeking betekent dit bijvoorbeeld dat wanneer een laatste vliegtuigstoel weg is, ook alle andere ingrediënten niet meer geboekt kunnen worden,”
zegt Eli Lysen, senior manager Information & Communication Technology bij
TUI Nederland. “Voortdurend reisingrediënten zoals transfers, hotels, vliegtuigen en excursies bijwerken is echter heel datamutatie intensief. Het lukte ons
niet meer om de website queries geladen te krijgen op het databasecluster.”
“Toen ik dat product zag,
was ik meteen onder
de indruk. Een volledig
geïntegreerd platform,
met alle componenten
geoptimaliseerd en op
elkaar afgestemd.”
Extra servers geen optie
De IT-gerelateerde issues zorgden
aan de klantzijde voor vervelende
situaties. Lysen: “Klanten die dachten te kunnen boeken, merkten verderop in het boekingproces dat het
toch niet kon. Nog vervelender voor
klanten was dat zij soms de melding kregen dat een reis niet meer
geboekt kon worden, terwijl deze
eigenlijk nog wel beschikbaar was.”
In de oude situatie had TUI vier HP Itanium Enterprise servers staan. Om de
explosieve groei aan datamutatie berekeningen te faciliteren, werd besloten
om zes extra Titaniums bij te plaatsen. Lysen: “De infrastructuur kon het echter
nog steeds niet aan. Wij stonden toen voor de keuze: of het softwareplatform
weer aanpassen, of extra Titaniums bijplaatsen, of overgaan op Oracle Exadata. Mijn gevoel zei dat het bijplaatsen van extra machines geen oplossing
voor het probleem zou zijn. Teruggaan in functionaliteit zou businesstechnisch
niet wenselijk zijn geweest.”
2 full racks Oracle Exadata
In 2008 maakte Lysen tijdens Oracle OpenWorld kennis met Versie 1 van Exadata. Lysen: “Toen ik dat product zag, was ik meteen onder de indruk. Een
volledig geïntegreerd platform, met alle componenten geoptimaliseerd en op
STORAGE. Speciale Editie Oracle Exadata
elkaar afgestemd, plus InfiniBand aan de achterkant, dat sprak mij meteen
erg aan.”
“Wij hadden haast, er moest iets gebeuren,” zegt Lysen. “Daarom zijn we
vrijwel blind gevaren op de kennis van Oracle Consulting. We hebben ook geen
Proof-of-Concept uitgevoerd, we zijn het gewoon gaan proberen. Met in ons
achterhoofd het idee dat de machine dermate zwaar was dat deze zeker in
onze behoeften zou moeten voorzien.”
In de tweede helft van 2009 schafte TUI een full rack aan van de Exadata
database machine. Lysen: “In eerste instantie gingen we live op Versie 1, een
leenmachine, omdat we haast hadden en voor de decemberboekingen het
apparaat in productie moesten hebben. Zo gauw Versie 2 echter vanuit de
fabriek werd geleverd, zijn we overgestapt op die machine.”
ROI: businessfunctionaliteit
De belangrijkste toepassing waar TUI Exadata voor gebruikt is OLTP. Lysen:
“We hebben dan ook eerst de OLTP-omgeving ingericht, Data Warehousing kwam pas later. De basisimplementatie duurde slechts ongeveer een
maand. Oracle Consulting heeft ons daarbij goed geholpen. Zij hebben scripts
gemaakt voor de inrichting op de machine op basis van hun eigen best
practices.”
Uiteindelijk heeft TUI in totaal 2 full racks van de Exadata aangeschaft. “In
theorie hebben we genoeg aan 1 machine, mits je dan gebruik gaat maken
van compressietechnieken,” zegt Lysen. “Daar hebben we alleen nog geen
tijd voor gehad. De tweede machine is ook nog niet in productie, die gaan we
straks in ieder geval gebruiken voor redundantie en disaster recovery.”
De ROI van de aanschaf zit volgens Lysen in de businessfunctionaliteit. “Wij
moesten zo snel mogelijk meer power hebben om de businessbehoeften
te faciliteren. Die power hebben we gekregen. De queries verlopen nu ontzettend snel. Het beheer is bovendien rustiger geworden en de database
systemen draaien stabieler dan de aan elkaar geknoopte componenten die
we eerst hadden. We rijden nu met een mooie robuuste auto, waarmee je
tenminste veilig op een fatsoenlijke snelheid kunt rijden.”
Data-explosie in DNA onderzoek
Het DNA-onderzoek ontwikkelde zich de afgelopen jaren in het kielzog van
ICT. Zonder de support van informatietechnologie was het niet mogelijk een
DNA in kaart te brengen, op te slaan en vervolgens te vergelijken met een
ander DNA. In 1996 ontstond zo het werkveld Bioinformatica. DNA-onderzoek
wordt vaak direct in verband gebracht met forensisch onderzoek in politioneel
sporenonderzoek Het is echter vooral de veredeling van voedingsmiddelen,
zoals tomaten, granen en vis, die al jaren een prominent domein van Bioinformatica vormt. Nog belangrijker is het werk dat wordt gedaan in de medische
sector op het gebied van DNA-diagnostiek en erfelijkheidsonderzoek.
Professor Dr. Peter J. van der Spek is Hoogleraar Bioinformatica en hoofd van
de gelijknamige afdeling van het Erasmus Medisch Centrum in Rotterdam.
“Een DNA uitlezen doen we in één dag. En niet één keer, we doen dat van
dezelfde patiënt tussen de 40 en 80 keer. Dat levert veel data op, zo’n 1,5 TB,”
vertelt hij. “Om te vergelijken heb je minimaal nog een DNA nodig, in geval van
erfenlijkheidsonderzoek zelfs van beide ouders. De hoeveelheid te analyseren
data is immens.” Het bouwen van de database onderscheidt de medische
sector van de forensische, die immers geen database aanlegt en alleen op
matches analyseert, en de veel kleinere DNA’s van voedingsmiddelen, waarbij
een afgebakend terrein wordt onderzocht.
“Een DNA uitlezen doen we in één dag. En niet één
keer, we doen dat van dezelfde patiënt tussen de 40 en
80 keer. Dat levert veel data op, zo’n 1,5 TB.”
Performance-problemen
De enorme hoeveelheid data stelt de bioinformaticus voor grote performanceproblemen. “We hebben ons georiënteerd op de markt en zijn op zoek gegaan
naar partners, want we voelen er helemaal niets voor een IT-bedrijf te worden.
We houden ons liever bij onze leest, en dat is DNA-onderzoek.” Van der Spek
kwam in contact met VX Company uit Baarn, die hem de Exadata van Oracle
demonstreerden. Zijn team ontwikkelde samen met technici van VX Company
een speciaal datamodel dat op de Exadata draait en onderzoeken nu gezamenlijk de mogelijkheden om de compressie te optimaliseren. “Dat beperkt
immers de benodigde opslagruimte en versnelt de query-responsetijden. Daar
willen we dus graag in investeren.”
“Ik ben erg blij met de samenwerking met Oracle, VX Company en Complete
Genomics de leverancier van de sequencer-software. We werken ook samen
met de grote universteiten in de VS. En met Intel, die ons speciale next generation CPU’s levert. Als white labels.”
Soortgelijke ontwikkelingen
We werken ook samen met
bij andere UMC´s
de grote universteiten in de VS.
Van der Spek weet dat ook andere UMC’s DNA-onderzoek doen,
En met Intel, die ons speciale
maar kent hun problemen rond
next generation CPU’s levert.”
IT-support. Toch is hij niet van
plan om een landelijk initiatief te
ontplooien. “Zelfs met de verenigde acht UMC’s in Nederland bereiken we niet
de schaalgrootte om een exploitabel researchcentrum op te zetten.” En dus
spant hij zich in voor een Europees DNA-research centrum.
Softwareleverancier Complete Genomics was zo onder de indruk van de
snelheid waarmee Van der Spek en zijn team werkten dat ze een Letter of
Understanding opstelden om steun te betuigen aan zijn Europese initiatief.
“Ze helpen ons een trainingscenter op te zetten, ze willen leren van onze
patiëntenkennis, ze willen meegroeien in ons partnership met Oracle. Anders
gezegd: het Europese centrum wordt een publiek-privaat samenwerkingsverband. Juist die bruggen moet je nu bouwen.” Dat vindt hij uiterst belangrijk
en bovendien bezit hij de vaardigheden daarvoor, opgedaan in zijn loopbaan in
de private sector, onder meer bij Organon en Johnson & Johnson. “We zijn als
academische instelling echt een kennisinstelling geworden die aan de voorkant functioneert.”
Europese samenwerking? Is het Europese centrum een droom?
Nee. Van der Spek en zijn team bezitten inmiddels wereldfaam op het gebied
van DNA-onderzoek. De partnerships met Oracle, VX Company, Intel en
Complete Genomics zijn daar de weerklank van. Dat opent deuren naar investeerders die voor
anderen gesloten
blijven.
Het team van Van der Spek gebruikt naast de Exadata de datamining- en
datavisualisatie-technologieën van TIBCO’s Spotfire. Deze zeer visueel georiënteerde tools kunnen een doorsnede maken van de data in de database, zodat
speciale datasets kunnen worden geëxtraheerd voor nader onderzoek. Ook
bijzonder: het ontwikkellab van Spotfire bevindt zich niet geheel toevallig op
dezelfde etage als het team van Van der Spek. Maar hij benadrukt nogmaals, dat hij niet van plan is een ICT-afdeling te beginnen. “ICT is een
faciliteit voor ons werk. Onze eisen zijn zwaar, daar kan de ITafdeling van het Erasmus MC niet aan voldoen. Begrijpelijk,
want die hebben een andere focus, een andere taak.” En
dus investeert Van der Spek zelf en zoekt naar partners.
STORAGE. Speciale Editie Oracle Exadata
Download