Καζλάρης Ιωάννης (Υποψήφιος Διδάκτορας)

Τίτλος διατριβής: Μείωση παραισθήσεων σε μεγάλα γλωσσικά μοντέλα.
Επιβλέπων: Αντωνίου Ευστάθιος
Μέλη Συμβουλευτικής Επιτροπής:
Κωνσταντίνος Διαμαντάρας, Καθηγητής, Τμήμα Μηχανικών Πληροφορικής & Ηλεκτρονικών Συστημάτων, ΔΙΠΑΕ
Μπράτσας Χαράλαμπος, Επίκουρος Καθηγητής, Τμήμα Μηχανικών Πληροφορικής και Ηλεκτρονικών Συστημάτων, ΔΙ.ΠΑ.Ε
Περίληψη:
Η ταχεία εξέλιξη της βαθιάς μάθησης έχει οδηγήσει σε μοντέλα που μπορούν να κατανοούν και να παράγουν κείμενο και οπτικά δεδομένα με μεγάλη ακρίβεια. Παρά την πρόοδο, το φαινόμενο της παραγωγής “παραισθήσεων”, όπου τα μοντέλα παράγουν ανακριβές ή αυθαίρετο περιεχόμενο συνεχίζει να απασχολεί την ερευνητική κοινότητα. Η συγκεκριμένη εργασία έχει ως στόχο την διερεύνηση και χρήση μεθόδων βαθιάς μάθησης (π.χ. Reinforcement Learning, Meta-Prompting, Chain of Thoughts, Tree of Thoughts, Contrastive Learning κ.λπ.) για τη βελτίωση της ευθυγράμμισης και ομοιομορφίας των διανυσματικών αναπαραστάσεων και την μείωση της συχνότητας εμφάνισης του φαινομένου των παραισθήσεων σε μεγάλα γλωσσικά μοντέλα.
Οι κύριοι στόχοι της διατριβής περιλαμβάνουν την ανάπτυξη του θεωρητικού υπόβαθρου νέων προσεγγίσεων, την υλοποίησή τους με τεχνικές βαθιάς μάθησης, την διεξαγωγή εκτενών πειραμάτων  σε κατάλληλα σύνολα δεδομένων και την αξιολόγηση των αποτελεσμάτων. Αναμένεται ότι αυτή η μελέτη χρήσης υπαρχόντων προσεγγίσεων αλλά και η διερεύνηση καινοτόμων μεθόδων, θα συμβάλει στον περιορισμό της παραγωγής ψευδαισθήσεων των μοντέλων σε εργασίες που απαιτούν λεπτομερή κατανόηση των σχέσεων μεταξύ δεδομένων.
Οι προκλήσεις που θα αντιμετωπιστούν περιλαμβάνουν την αυξημένη υπολογιστική πολυπλοκότητα, την ανάγκη για μεγάλο όγκο ποιοτικών δεδομένων, την εξασφάλιση ότι το μοντέλο θα γενικεύεται αποτελεσματικά σε νέα, άγνωστα δεδομένα, καθώς και τις εγγενείς ιδιομορφίες των προαναφερθέντων μεθόδων.