Κατανεμημένη Διήθηση Και Διάχυση XML Δεδομένων σε Συστήματα Ομοτίμων Κόμβων
Speaker:

Iris Miliaraki

Date: 21/07/2011
University: Univ. of Athens
Room : A56
Time: 2:00pm
Slides:
Abstract:

[Υποστήριξη της διδακτορικής διατριβής της Ίριδας Μηλιαράκη].

Τα συστήματα δημοσιεύσεων/συνδρομών (publish/subscribe systems) ή αλλιώς τα συστήματα διήθησης δεδομένων (filtering systems) αποτελούν μια ευρέως διαδεδομένη πρόταση στις μέρες μας. Τέτοια συστήματα έχουν διάφορες ενδιαφέρουσες και χρήσιμες εφαρμογές όπως οι ειδοποιήσεις για ειδήσεις ή δημοσιεύσεις ψηφιακών βιβλιοθηκών αλλά και για οποιαδήποτε άλλη πληροφορία μπορεί να ενδιαφέρεται ένας χρήστης. Δεδομένου ότι το μοντέλο XML έχει καθιερωθεί για την μορφοποίηση και την ανταλλαγή δεδομένων στο διαδίκτυο, μεγάλο μέρος της έρευνας στην περιοχή αυτή έχει επικεντρωθεί στον σχεδιασμό αποδοτικών συστημάτων για την διήθηση δεδομένων XML. Για να επιτύχουμε αποδοτική διήθηση δεδομένων XML σε μεγάλη κλίμακα και να αποφύγουμε τα συνήθη προβλήματα που εμφανίζουν οι συγκεντρωτικές προσεγγίσεις, πρέπει να οδηγηθούμε στην ανάπτυξη μιας τέτοια υπηρεσίας σε ένα κατανεμημένο περιβάλλον.

Στα πλαίσια της διατριβής, σχεδιάσαμε, υλοποιήσαμε και αξιολογήσαμε πειραματικά ένα κατανεμημένο σύστημα που ονομάστηκε FoXtrot. Η πρόταση μας συνδυάζει ένα μη αιτιοκρατικό αυτόματο για αποδοτική διήθηση δεδομένων XML καθώς και τους κατανεμημένους πίνακες κατακερματισμού (distributed hash tables) για ένα πλήρως κατανεμημένο και κλιμακωτό σύστημα. Η βασική ιδέα αυτής της εργασίας είναι η κατανομή του αυτόματου στους κόμβους του δικτύου και η εκτέλεση παράλληλων ανεξάρτητων υπολογισμών που μας προσφέρει η ιδιότητα της μη-αιτιοκρατίας. Εκτός από τις τεχνικές που παρουσιάζονται για το δομικό ταίριασμα (structural matching) των δεδομένων XML και για τις οποίες χρησιμοποιούμε το αυτόματο που περιγράψαμε, προτείνουμε και διάφορες εναλλακτικές τεχνικές για το ταίριασμα των τιμών (value matching) που περιλαμβάνονται στα δεδομένα XML με στόχο την κατανομή του φόρτου και αυτής της εργασίας.

Τέλος, πραγματοποιήσαμε μια εκτενή πειραματική αξιολόγηση του συστήματος FoΧtrot τόσο σε ένα ελεγχόμενο περιβάλλον όσο και σε ένα ρεαλιστικό περιβάλλον μεγάλης κλίμακας που παρέχεται από το PlanetLab. Με βάση την αξιολόγηση προκύπτει ότι το σύστημα FoXtrot επιτυγχάνει υψηλές επιδόσεις τόσο για την αποθήκευση των ερωτήσεων στο κατανεμημένο αυτόματο όσο και για την διήθηση και διάχυση των δεδομένων XML. Επιπλέον, είναι χαρακτηριστικό της δυνατότητας κλιμάκωσης του συστήματος ότι η αύξηση του μεγέθους του δικτύου που εκτελείται το FoXtrot οδηγεί σε αισθητή βελτίωση της απόδοσης του συστήματος.

MaDgIK 2009-2018