Μυλωνάς Ιωάννης (Υποψήφιος Διδάκτορας)
- Τίτλος διατριβής: «Data Reduction Techniques for Efficient Instance-based Learning»
- Επιβλέπων: Ουγιάρογλου Στέφανος
- Μέλη Συμβουλευτικής Επιτροπής:
- Μπράτσας Χαράλαμπος, Επίκουρος Καθηγητής, Τμήμα Μηχανικών Πληροφορικής και Ηλεκτρονικών Συστημάτων, ΔΙ.ΠΑ.Ε
Κωτσάκης Ρήγας, Επίκουρος Καθηγητής, Τμήμα Μηχανικών Πληροφορικής και Ηλεκτρονικών Συστημάτων, ΔΙ.ΠΑ.Ε. - Περίληψη:
Αντικείμενο της διατριβής είναι οι τεχνικές μείωσης των δεδομένων εκπαίδευσης (Data Reduction Techniques – DRTs) σε προβλήματα κατηγοριοποίησης. Συγκεκριμένα οι τεχνικές αυτές, γνωστές ως αλγόριθμοι επιλογής αντιπροσωπευτικών στιγμιοτύπων (Prototype Selection – PS) και αλγόριθμοι παραγωγής αντιπροσωπευτικών στιγμιότυπων (Prototype Generation), αποτελούν βήμα προ-επεξεργασίας των δεδομένων εκπαίδευσης με στόχο την αποτελεσματική κατηγοριοποίηση βάσει στιγμιότυπων (instance-based classification). Γενικά, οι τεχνικές αυτές εφαρμόζονται σε δεδομένα εκπαίδευσης που είναι οργανωμένα σε γραμμές και στήλες και είναι σε θέση να μειώσουν το μέγεθος των δεδομένων διατηρώντας όμως υψηλή την ακρίβεια της κατηγοριοποίησης και μειώνοντας το υπολογιστικό κόστος. Στόχος της διατριβής είναι η ανάπτυξη αποτελεσματικών τεχνικών μείωσης πολύπλοκων δεδομένων εκπαίδευσης, δηλαδή δεδομένα που αφορούν ροές δεδομένων (data streams) [1], κατανεμημένα δεδομένα (distributed data) [2],[3] δεδομένα σε μη μετρικούς χώρους [4], δεδομένα σε περίπλοκες δομές (π.χ. γράφοι) κ.α. Επίσης πεδίο έρευνας αποτελεί και η ανάπτυξη τεχνικών μείωσης δεδομένων που λαμβάνουν υπόψη το φαινόμενο της εννοιολογικής απόκλισης (concept drift) [5] που εμφανίζεται σε ροές δεδομένων. Το φαινόμενο αυτό συμβαίνει όταν με την πάροδο του χρόνου η κατανομή των δεδομένων στο χώρο και στις κλάσεις μεταβάλλεται.
[1] ‘Streaming data’, Wikipedia. 17 Αύγουστος 2024. Ημερομηνία πρόσβασης: 9 Οκτώβριος 2024. [Έκδοση σε ψηφιακή μορφή]. Διαθέσιμο στο: https://en.wikipedia.org/w/index.php?title=Streaming_data&oldid=1240848968
[2] ‘Distributed database’, Wikipedia. 31 Ιούλιος 2024. Ημερομηνία πρόσβασης: 9 Οκτώβριος 2024. [Έκδοση σε ψηφιακή μορφή]. Διαθέσιμο στο: https://en.wikipedia.org/w/index.php?title=Distributed_database&oldid=1237869130
[3] M. H. ur Rehman, C. S. Liew, A. Abbas, P. P. Jayaraman, T. Y. Wah, και S. U. Khan, ‘Big Data Reduction Methods: A Survey’, Data Sci. Eng., τ. 1, τχ. 4, σελ. 265–284, Δεκεμβρίου 2016, doi: 10.1007/s41019-016-0022-0.
[4] ‘Hardware and Systems Engineering Design – Linear and Nonlinear Spaces’. Ημερομηνία πρόσβασης: 30 Σεπτέμβριος 2024. [Έκδοση σε ψηφιακή μορφή]. Διαθέσιμο στο: https://www.hwe.design/theories-concepts/foundation-of-the-study-of-linear-algebra-and-functional-analysis/linear-and-nonlinear-spaces
[5] A. Liu, J. Lu, και G. Zhang, ‘Concept Drift Detection: Dealing With Missing Values via Fuzzy Distance Estimations’, IEEE Trans. Fuzzy Syst., τ. 29, τχ. 11, σελ. 3219–3233, Αυγούστου 2021, doi: 10.1109/TFUZZ.2020.3016040.