A Web Usage Mining Framework for Web Directory Personalization
Speaker:

Dimitrios Pierrakos

Date: 21/02/2011
University: Uni. of Athens and NCSR Demokritos
Room : A56
Time: 10:00am
Slides:
Abstract: Η κύρια συνεισφορά της διατριβής αφορά την παρουσίαση μιας πρωτοποριακής προσέγγισης η οποία ξεπερνάει τα μειονεκτήματα της εξατομίκευσης του Παγκόσμιου Ιστού και των θεματικών καταλόγων του Παγκόσμιου Ιστού, συνδυάζει τα πλεονεκτήματά τους και παρέχει ένα καινούριο "εργαλείο" για την αντιμετώπιση της υπερ-πληροφόρησης. Ειδικότερα, η διατριβή εστιάζεται στην κατασκευή λειτουργικών θεματικών καταλόγων οι οποίοι μοντελοποιούν τα ενδιαφέροντα ομάδων χρηστών, που ονομάζονται κοινότητες χρηστών (user communities). Η δημιουργία κοινοτήτων χρηστών, δηλ., προτύπων χρήσης που αντιπροσωπεύουν τις προτιμήσεις πλοήγησης των μελών της κοινότητας, με τη βοήθεια της εξόρυξης γνώσης από δεδομένα χρήσης του Παγκόσμιου Ιστού, έχει αρχικά μελετηθεί στο πλαίσιο συγκεκριμένων ιστοτόπων. Στη εν λόγω διατριβή, επεκτείνουμε την προσέγγιση αυτή σε ένα πολύ μεγαλύτερο τμήμα του Παγκόσμιου Ιστού, μέσα από την ανάλυση των δεδομένων χρήσης που συλλέγονται από τους διακομιστές διαμεσολάβησης (proxy servers) ενός Παροχέα Υπηρεσιών Διαδικτύου (Internet Service Provider, ISP). Κατά τη διάρκεια της διατριβής, αναπτύχθηκαν και αξιολογήθηκαν τρεις μέθοδοι μοντελοποίησης κοινοτήτων, με βάση την ομαδοποίηση (clustering) και την πιθανοτική μάθηση (probabilistic learning). Οι τεχνικές αυτές επιτρέπουν την αξιοποίηση των υπαρχόντων καταλόγων Παγκόσμιου Ιστού και την εξειδίκευσή τους ως προς τα ενδιαφέροντα των κοινοτήτων χρηστών. Σημαντική προϋπόθεση για την ανάπτυξη των τεχνικών αυτών είναι ότι πρέπει να επιτρέπουν την αλληλοεπικάλυψη των κοινοτήτων. Με άλλα λόγια, ο χρήστης πρέπει να μπορεί να είναι μέλος περισσοτέρων της μίας κοινότητας. Αυτό είναι πολύ σημαντικό για την εξατομίκευση του Παγκόσμιου Ιστού, καθώς ο χρήστης μπορεί να ανήκει σε περισσότερες από μία ομάδες. Πιο συγκεκριμένα, στη διατριβή παρουσιάζεται ένα ολοκληρωμένο πλαίσιο ανακάλυψης γνώσης με στόχο τη δημιουργία εξατομικευμένων θεματικών καταλόγων Παγκόσμιου Ιστού, βασιζόμενοι σε κοινότητες χρηστών. Οι εξατομικευμένοι κατάλογοι αποτελούν ένα πρωτότυπο αντικείμενο εφαρμογής της εξατομίκευσης του Παγκόσμιου Ιστού, πέραν της Σύστασης Σελίδων (Web page Recommendations) ή τους προσαρμοσμένους ιστοτόπους (adaptive Web sites). Τα μέλη μιας κοινότητας μπορούν να χρησιμοποιούν τον εξατομικευμένο κατάλογο ως σημείο εκκίνησης για την πλοήγησή τους στον Παγκόσμιο Ιστό, βασιζόμενοι μόνο στη θεματολογία που τους ενδιαφέρει, χωρίς την υποχρέωση να προσπελαύνουν "αχανείς" θεματικούς καταλόγους. Επομένως, η εξατομίκευση μπορεί να αποδειχτεί ιδιαίτερα χρήσιμη για ένα μεγάλο και γενικό θεματικό κατάλογο όπως το ODP ή το Yahoo!. Οι εξατομικευμένες εκδόσεις των συγκεκριμένων καταλόγων μπορούν επίσης να χρησιμοποιηθούν από διάφορες υπηρεσίες του Παγκόσμιου Ιστού, π.χ., οι Πύλες Παγκόσμιου Ιστού (Web Portals), προκειμένου να παρέχουν στους συνδρομητές τους μια πιο εξατομικευμένη άποψή του. Επιπλέον, τους εξατομικευμένους καταλόγους μπορούν να εκμεταλλευθούν οι μηχανές αναζήτησης (Web search engines), προκειμένου να παρέχουν εξατομικευμένα αποτελέσματα σε ερωτήματα των χρηστών. Επίσης, στη διατριβή παρουσιάζεται το σύστημα OurDMOZ, το οποίο ενσωματώνει και υλοποιεί τα διαφορετικά τμήματα της προτεινόμενης μεθοδολογίας. Συγκεκριμένα, το OurDMOZ συλλέγει και επεξεργάζεται δεδομένα χρήσης, αντιστοιχίζει τα δεδομένα στο θεματικό κατάλογο, εφαρμόζει τεχνικές μηχανικής μάθησης για την εξαγωγή των μοντέλων των κοινοτήτων χρηστών και στο τέλος κατασκευάζει τους εξατομικευμένους θεματικούς καταλόγους με βάση τις κοινότητες των χρηστών. Η διατριβή περιλαμβάνει επιπλέον και τα αποτελέσματα της αξιολόγησης του συστήματος από χρήστες, η οποία πραγματοποιήθηκε προκειμένου να καταδειχθούν τα δυνητικά πλεονεκτήματα του συστήματος και κατ΄ επέκταση της έννοιας των εξατομικευμένων καταλόγων Παγκόσμιου Ιστού με βάση τις κοινότητες χρηστών για τον τελικό χρήστη.

MaDgIK 2009-2018