RAM: array database management through relational - UvA-DARE

advertisement
UvA-DARE (Digital Academic Repository)
RAM: array database management through relational mapping
Ballegooij, A.R.
Link to publication
Citation for published version (APA):
van Ballegooij, A. R. (2009). RAM: array database management through relational mapping
General rights
It is not permitted to download or to forward/distribute the text or part of it without the consent of the author(s) and/or copyright holder(s),
other than for strictly personal, individual use, unless the work is under an open content license (like Creative Commons).
Disclaimer/Complaints regulations
If you believe that digital publication of certain material infringes any of your rights or (privacy) interests, please let the Library know, stating
your reasons. In case of a legitimate complaint, the Library will make the material inaccessible and/or remove it from the website. Please Ask
the Library: http://uba.uva.nl/en/contact, or a letter to: Library of the University of Amsterdam, Secretariat, Singel 425, 1012 WP Amsterdam,
The Netherlands. You will be contacted as soon as possible.
UvA-DARE is a service provided by the library of the University of Amsterdam (http://dare.uva.nl)
Download date: 18 Jul 2017
Bijlage C
Samenvatting
In de wetenschappelijke wereld is database technologie lang niet zo populair als in de
zakelijke wereld, terwijl wetenschappelijke experimenten en simulaties enorme hoeveelheden data genereren die georganiseerd, beheerd en geanalyseerd moeten worden.
Dit zijn juist de hoofdtaken van een databasemanagementsysteem. Er zijn een aantal
redenen aan te wijzen waarom databasetechnologie niet zo veel gebruikt wordt in de
wetenschappelijke wereld: bestaande databasemanagementsystemen bieden niet voldoende verwerkingssnelheid; er is een verschil tussen wetenschappelijke gegevensstructuren en het relationele model dat door databasemanagementsystemen aangeboden wordt en het is niet duidelijk genoeg dat het gebruik van databasemanagementsystemen voldoende effectief is om de investering in het gebruik er van te verantwoorden.
Recente ontwikkelingen in de database wereld richten zich juist op het omgaan
met de enorm grote wetenschappelijke verzamelingen gegevens [1]. Echter, het struikelblok dat overwonnen moet worden om de structuur van wetenschappelijke gegevens verzamelingen te bewerken met databasetechnologie bestaat nog steeds. Wij
zoeken de oplossing voor dit probleem in de toevoeging van array datastructuren aan
een database omgeving. Deze ondersteuning voor multidimensionale array als een
gegevensstructuur voor databases kan de essentiële schakel zijn voor databasetechnologie om voet aan de grond te krijgen in de wetenschappelijke wereld [2].
Het onderzoeksdoel van dit proefschrift is de realisatie van een uitbreidbare
array database architectuur met gebruikmaking van bestaande relationele database technologie. Eerdere pogingen om een array database systeem te ontwikkelen
begonnen helemaal opnieuw met de ontwikkeling van een nieuw systeem. Wij kiezen voor een alternatieve aanpak gebaseerd op relationele mapping: het representeren
van nieuwe gegevensstructuren en operaties op deze structuren in relationele termen.
Deze aanpak is eerder succesvol gebleken bij het realiseren van object georiënteerde
databases met de zogenaamde object-relational aanpak [3]. In navolging van de succesvolle object-relational aanpak heeft de opkomst van XML databases en de XQuery
taal [4] tot een reeks van XML-relational aanpakken geleid, zoals [5, 6, 7].
Dit onderzoeksdoel wordt nagestreefd met behulp van drie afzonderlijke doelen.
Het eerste doel is de specificatie van een efficiënte array mapping: we presenteren
173
174
Bijlage C. Samenvatting
een array gegevensmodel en laten zien hoe dit gegevensmodel geı̈mplementeerd kan
worden in een relationele database omgeving.
Het tweede doel is het verkennen van de mogelijkheden van de optimalisatie
van array queries in relatie tot de optimalisatie van de gegenereerde relationele
queries. Wij onderzoeken de bruikbaarheid van bestaande query optimalisatietechnieken voor de gepresenteerde array taal.
Het derde doel is het aantonen dat het direct vertalen van array queries in relationele operaties betere resultaten oplevert dan een vertaling met tussenkomst
van een hoog niveau relationele query taal. Wij presenteren vertalingen voor array
queries naar een aantal verschillende talen en bespreken de voordelen die het direct
genereren van een ‘slimme’ vertaling biedt boven een naı̈eve vertaling die vertrouwt
op de optimalisatie mogelijkheden van het relationele systeem.
Dit onderzoek vind plaats met behulp van een prototype van een array database
systeem genaamd het RAM systeem [8, 9]. Dit systeem wordt gebruikt in een aantal
experimenten om te valideren dat zowel de relationele mapping als de ontwikkelde
optimalisatie technieken effectief zijn [10, 11, 12].
BIBLIOGRAFIE
175
Bibliografie
[1] J. Gray, D.T. Liu, M. Nieto-Santisteban, A.S. Szalay, D. DeWitt, and G. Heber.
Scientific Data Management in the Coming Decade. Technical Report MSR-TR2005-10, Microsoft, Berkeley, Johns Hopkins University, Wisconsin, Cornell,
2005.
[2] D. Maier and B. Vance. A Call to Order. In Proceedings of the 12th ACM
SIGACT-SIGMOD-SIGART Symposium on Principles of Database Systems, pages 1–16. ACM Press, 1993.
[3] Michael Stonebraker and Dorothy Moore. Object Relational DBMSs: The Next
Great Wave. Morgan Kaufmann Publishers Inc., San Francisco, CA, USA, 1995.
[4] W3C.
XML
Query
(XQuery).
http://www.w3.org/TR/xquery/, 2007.
Recommendation,
[5] Microsoft. Microsoft support for XML. http://msdn.microsoft.com/sqlxml.
[6] IBM. DB2 XML Extender. http://www.ibm.com /software /data /db2 /extenders
/xmlext /library.html.
[7] University of Konstanz, University of Twente, and CWI. MonetDB/XQuery.
http://monetdb.cwi.nl/XQuery.
[8] A.R. van Ballegooij, A.P. de Vries, and M. Kersten. RAM: Array processing
over a relational DBMS. Technical Report INS-R0301, CWI, March 2003.
[9] A.R. van Ballegooij. RAM: A Multidimensional Array DBMS. In Proceedings
of the ICDE/EDBT 2004 Joint Ph.D. Workshop, 2004.
[10] R. Cornacchia, A.R. van Ballegooij, and A.P. de Vries. A Case Study on Array Query Optimisation. In Proceedings of the First International Workshop on
Computer Vision meets Databases (CVDB 2004), 2004.
[11] A.R. van Ballegooij, R. Cornacchia, and A.P. de Vries. Automatic optimization
of array queries. Technical Report INS-E0501, CWI, 2005.
[12] A.R. van Ballegooij, R. Cornacchia, A.P. de Vries, and M. Kersten. Distribution
Rules for Array Database Queries. In DEXA 2005, 2005.
Download