Καλλονιάτης Αντώνης (Υποψήφιος Διδάκτορας)
- Τίτλος διατριβής: Ανάλυση και δημιουργία χιουμοριστικών κειμένων στα Ελληνικά
- Επιβλέπων: Αδαμίδης Παναγιώτης
- Μέλη Συμβουλευτικής Επιτροπής:
- Γουλιάνας Κωνσταντίνος, Καθηγητής, Τμήμα Μηχανικών Πληροφορικής & Ηλεκτρονικών Συστημάτων,ΔΙΠΑΕ
Τάντος Αλέξανδρος, Επικ. Καθηγητής, Τμήμα Φιλολογίας, ΑΠΘ - Περίληψη:
Η εκτίμηση και η χρήση του χιούμορ έρχονται τόσο φυσικά στους ανθρώπους που δεν τους επιτρέπει να αντιληφτούν πλήρως τα περίπλοκα γνωστικά βήματα, την παγκόσμια γνώση, την ανθρώπινη νοημοσύνη και τη δημιουργικότητα πίσω από αυτό. Η κωδικοποίηση όλων αυτών έτσι ώστε ένα υπολογιστικό σύστημα να μπορεί να συμπεριφέρεται όπως οι άνθρωποι είναι μια δύσκολη εργασία. Το πρόβλημα του υπολογιστικού χιούμορ θεωρείται ότι είναι ένα από τα πιο πολύπλοκα προβλήματα της τεχνητής νοημοσύνης. Η αντίληψη του χιούμορ απαιτεί από ένα υπολογιστικό μοντέλο εκτός από γλωσσολογικές γνώσεις να έχει εκπαιδευτεί και με δεδομένα κατανόησης από τα συμφραζόμενα του κειμένου ή της ομιλίας. Ομοίως, η δημιουργία χιούμορ απαιτεί από το σύστημα να δημιουργήσει όχι μόνο ένα αστείο κείμενο που να ταιριάζει στο πλαίσιο της κατάστασης, αλλά και να κρίνει την κατάσταση ως κατάλληλη για την χρήση ενός αστείου.
Σε αυτήν τη διατριβή, θα ερευνήσουμε ένα πολύ διαδεδομένο αλλά δύσκολο να αναλυθεί συναίσθημα: το χιούμορ. Αυτή η μελέτη, από όσο γνωρίζουμε, θα είναι μια από τις πρώτες έρευνες για το υπολογιστικό χιούμορ στην Ελληνική γλώσσα. Λαμβάνοντας υπόψη τις αδυναμίες που συζητήθηκαν στις προηγούμενες ενότητες, θα ερευνήσουμε συγκεκριμένα ερωτήματα και για τα δύο σκέλη του υπολογιστικού χιούμορ, την κατανόηση και την δημιουργία του.
Η επιστημονική έρευνα στην αναγνώριση του χιούμορ βασίζεται κυρίως σε τεχνικές Μηχανικής Μάθησης (Machine Learning) που εφαρμόζονται σε ένα σύνολο χαρακτηριστικών της γλώσσας. Η ερευνητική εργασία που έχει γίνει με την χρήση δεδομένων που εξάγονται από την σύνθεση ενός διαλόγου είναι πολύ περιορισμένη. Ακόμη και οι Purandare και Litman [32], που χρησιμοποίησαν δεδομένα ομιλίας από ένα σήριαλ της τηλεόρασης, επέλεξαν μικρά μεμονωμένα τμήματα ομιλίας, αγνοώντας κάθε είδους πληροφοριών που παρέχονται από τα συμφραζόμενα. Στόχος μας είναι να ξεπεράσουμε τους περιορισμούς της προηγούμενης έρευνας, δηλαδή την ανάλυση του χιούμορ σαν ένα πρόβλημα ταξινόμησης και να δημιουργήσουμε ένα υπολογιστικό μοντέλο που θα ενσωματώσει την χρήση δεδομένων βασισμένων σε οντολογίες πεδίου, που ορίζουν σχέσεις με χαρακτηριστικά του περιβάλλοντος και της εκάστοτε κατάστασης. Για το σκέλος της κατανόησης του χιούμορ από τον υπολογιστή, το ερώτημα είναι αν και πώς θα μπορέσουμε να βελτιώσουμε την απόδοση αναγνώρισης του χιούμορ από το υπολογιστικό μοντέλο που θα δημιουργήσουμε.
Ως προς το σκέλος της παραγωγής χιούμορ η επιστημονική έρευνα δίνει μεγάλο βάρος στην χρησιμοποίηση μοντέλων που βασίζονται σε πρότυπα τα οποία παράγουν μια μεγάλη ποσότητα κονσερβοποιημένων αποτελεσμάτων, που μπορεί ή όχι να είναι αστεία και ταιριάζουν με δυσκολία στο πλαίσιο ενός διαλόγου ή στο περιβάλλον μιας κατάστασης. Όπως είδαμε, αυτό περιορίζει σε μεγάλο βαθμό τα θετικά αποτελέσματα της ανθρώπινης αξιολόγησης των συστημάτων αυτών, τα οποία δεν υπερβαίνουν το 20% της συνολικής εκτίμησης. Η έρευνα για την δημιουργία αυθόρμητου χιούμορ συνομιλίας είναι στην αρχή της. Ακόμα και τα πρόσφατα διαδραστικά συστήματα ομιλίας (Εικονικοί Βοηθοί) που είναι πλέον σε θέση να δομήσουν περίπλοκες συνομιλίες, εξακολουθούν να ακούγονται πολύ ρομποτικά και στερούνται της αίσθησης του χιούμορ. Σε αυτήν τη διατριβή θα αναπτύξουμε ένα μοντέλο που αφού κρίνει ένα διάλογο κατάλληλο για την χρήση αστείου, θα δημιουργεί αστείες λέξεις/προτάσεις με δυναμική τροποποίηση προτύπων σε διαφορετικές μορφές προτάσεων και θα τις εντάσσει στο διάλογο ώστε να ταιριάζουν με τα συμφραζόμενα. Για τη δημιουργία του χιούμορ, το ερώτημα είναι αν και πώς μπορούμε να δημιουργήσουμε εκφράσεις (ανταπόκριση σε διάλογο), που να είναι αστείες και σχετικές με το πλαίσιο του διαλόγου.
Η κατανόηση της φυσικής γλώσσας, που είναι μέρος του προβλήματος του υπολογιστικού χιούμορ, είναι από μόνη της ένα δύσκολο πρόβλημα, και δεν έχει επιλυθεί ακόμη για όλες τις γλώσσες. Οι εποπτευόμενες τεχνικές Μηχανικής Μάθησης (Machine Learning) που εφαρμόζονται σε ένα σύνολο χαρακτηριστικών για τη γλώσσα έχουν αποδειχθεί ότι επιτυγχάνουν πολύ καλά αποτελέσματα [10, 47, 27]. Όμως, οι περισσότερες από τις έρευνες στη Μηχανική Μάθηση βασίζονται κυρίως σε έγγραφα κειμένου γραμμένα στην Αγγλική γλώσσα, μια γλώσσα που ομιλείται σε όλο τον κόσμο με τεράστιους διαθέσιμους πόρους δεδομένων (datasets). Ωστόσο, η μελέτη του Schroeder [38] αναδεικνύει το υψηλό ποσοστό κειμένων κοινωνικών μέσων που δεν είναι γραμμένα στην Αγγλική γλώσσα. Ο Fischer [10] δίνει μερικές ενδιαφέρουσες πληροφορίες σχετικά με τις γλώσσες που χρησιμοποιούνται στο Twitter με βάση τις γεωγραφικές τοποθεσίες. Με τον τεράστιο όγκο τέτοιων δεδομένων που είναι διαθέσιμα στα κοινωνικά μέσα, υπάρχει ανάγκη ανάπτυξης τεχνολογιών και για τις άλλες γλώσσες. Με την έρευνα μας, θα προσπαθήσουμε να καλύψουμε αυτό το κενό στην βιβλιογραφία χρησιμοποιώντας την Ελληνική γλώσσα για την δημιουργία χιούμορ. Το ερευνητικό μας ερώτημα είναι αν μπορούμε να κατασκευάσουμε υπολογιστικά μοντέλα για αναγνώριση και δημιουργία χιούμορ στην Ελληνική γλώσσα.