5 Αυγ 2020

Οι μηχανές μιλούν μαζί μας καθημερινά

Μπορούν να μεταφράζουν, να μετατρέπουν ομιλία σε κείμενο, να απαντούν σε ερωτήσεις και να μαθαίνουν όπως τα παιδιά

Της Τασούλας Καραϊσκάκη
Δημοσιογράφος

ΑΠΟ ΤΙΣ ΕΦΗΜΕΡΙΔΕΣ – Φεβρουάριος 2020

Δεν το αντιλαμβανόμαστε, αλλά βρισκόμαστε καθημερινά σε σχεδόν συνεχή επικοινωνία με κάποια ρομποτική μηχανή:
  • όταν τηλεφωνούμε σε τράπεζα·
  • όταν αναζητούμε πληροφορίες στο διαδίκτυο·
  • όταν γράφουμε ένα μήνυμα και το κείμενο διορθώνεται αυτόματα·
  • όταν ακούμε τις φωνητικές οδηγίες από το σύστημα πλοήγησης του αυτοκινήτου·
  • όταν μεταφράζουμε αυτόματα ένα κείμενο στο Google·
  • όταν απολαμβάνουμε τη μηχανική διερμηνεία της συζήτησής μας με ετερόγλωσσο συνομιλητή μέσω Skype·
  • όταν γράφουμε χειρόγραφα στην οθόνη του κινητού και λαμβάνουμε δακτυλογραφημένο κείμενο·
  • όταν στοχεύουμε με την κάμερα του κινητού μια αλλόγλωσση πινακίδα και έχουμε άμεσα την ίδια πινακίδα γραμμένη στα ελληνικά...

Πίσω από αυτές τις υπηρεσίες κρύβονται εξαιρετικά πολύπλοκες τεχνολογίες, τις οποίες έχουν αναπτύξει ερευνητές τόσο στο εξωτερικό όσο και στη χώρα μας —από πολύ νωρίς μάλιστα. Το πρώτο ελληνικό εκκολαπτήριο γλωσσικών τεχνολογιών, το Ινστιτούτο Επεξεργασίας Λόγου (ΙΕΛ) του Ερευνητικού Κέντρου «Αθηνά», μετράει τρεις δεκαετίες ζωής και αναρίθμητα επιτεύγματα.

Ισχυροί αλγόριθμοι, μεγάλα δεδομένα και εύρωστα συστήματα επεξεργασίας φωνής συνεργάζονται για την παραγωγή φυσικής ανθρώπινης φωνής από ρομπότ

Ο διευθυντής του ινστιτούτου Βασίλης Κατσούρος, αφού μας εξηγεί πώς μπορεί κάποιος να χρησιμοποιήσει το κινητό του για αυτόματη απομαγνητοφώνηση μιας συνέντευξης (ήταν εντυπωσιακή η άμεση μετατροπή της φωνής σε κείμενο επί της οθόνης του κινητού), πιάνει το νήμα της αποκωδικοποίησης των τεχνολογικών θαυμάτων του ινστιτούτου από την αρχή.

«Ας δούμε πώς λειτουργεί ένας φωνητικός βοηθός, στον οποίο δίνουμε μια εντολή ή από τον οποίο ζητάμε μια πληροφορία. Η μηχανή ακούει τη φωνή, τη μετατρέπει σε κείμενο, ανασύρει από μια αξιόπιστη βάση δεδομένων (συνήθως τη Wikipedia) την απάντηση, συνθέτει ένα κείμενο και το μετατρέπει σε φωνή. Όλος αυτός ο κύκλος περιλαμβάνει τεχνολογίες πάνω στις οποίες εργάζεται το ινστιτούτο.

»Με τον ίδιο τρόπο γίνεται και η αυτόματη διερμηνεία. Θέλεις να επικοινωνήσεις με έναν Σλοβένο συνεργάτη σου; Μιλάς στη γλώσσα σου, η μηχανή μετατρέπει τη φωνή σε κείμενο, το μεταφράζει στα σλοβενικά και μετατρέπει το κείμενο σε φωνή στην άλλη άκρη της γραμμής».


«Ζούμε σε μια ευτυχή συγκυρία, διαθέτουμε μεγάλη υπολογιστική ισχύ, ισχυρούς αλγορίθμους, πλούτο αξιόπιστων πηγών δεδομένων και γνώσης. Οι μηχανές μαθαίνουν γρήγορα από τα δεδομένα (γι’ αυτό γίνεται προσπάθεια για ανοικτά δεδομένα), από την ποσότητα αλλά και την ποιότητα της γνώσης με την οποία τις τροφοδοτούμε», λέει ο κ. Κατσούρος.

Ο κ. Στέλιος Πιπερίδης, πρόεδρος του Επιστημονικού Συμβουλίου του ΙΕΛ, ξεκαθαρίζει: «Για όλες τις τεχνολογίες σήμερα ισχύει το “garbage in, garbage out”: Αν τροφοδοτήσεις τη μηχανή με σκουπίδια, θα πάρεις ως αποτέλεσμα σκουπίδια. Οι μηχανές εκπαιδεύονται όπως και τα παιδιά μας».

«Στόχος είναι η ανθρώπινη επικοινωνία με τη βοήθεια των μηχανών. Εργαζόμαστε, για παράδειγμα, πάνω σε τεχνολογίες μετάφρασης της ελληνικής νοηματικής γλώσσας. Θα βιντεοσκοπείς με την κάμερα του κινητού τον άνθρωπο που μιλάει στη νοηματική και θα λαμβάνεις σε πραγματικό χρόνο σε κείμενο το περιεχόμενο των λεγομένων του. Αντίστροφα, θα μιλάς στο κινητό και ένα άβαταρ θα μετατρέπει την ομιλία σου σε νοηματική», τονίζει ο κ. Κατσούρος.

Η τεχνολογία την οποία τελειοποιούν αυτή τη στιγμή στο ινστιτούτο επιτρέπει, όπως σημειώνουν οι κ. Κατσούρος και Πιπερίδης, η μηχανή να μπορεί να κατανοεί όχι μόνο φωνή αλλά και τα παραγλωσσικά στοιχεία, όπως οι δισταγμοί, οι εμφάσεις, τα «εεε», τα «χμμμ», το κούνημα του κεφαλιού, το χαμόγελο, οι κινήσεις των χεριών.

«Η μηχανή θα αναλύει όχι μόνο τη γλώσσα, αλλά και τη χροιά της φωνής, τις εκφράσεις, τις διαθέσεις, τα συναισθήματα», εξηγεί ο κ. Κατσούρος. «Θα πρέπει π.χ. το bot στο τηλεφωνικό κέντρο μιας τράπεζας να αναγνωρίζει τις αντιδράσεις του πελάτη και να τον εξυπηρετεί πριν εκείνος χάσει την υπομονή του», συμπληρώνει ο κ. Πιπερίδης.

Η ομάδα ερευνητών του ΙΕΛ, που παράγει από τις πλέον πρωτοποριακές γλωσσικές καινοτομίες στον κόσμο

Παράλληλα, οι ερευνητές του ΙΕΛ διερευνούν το πώς μια μηχανή μπορεί αυτόματα να καταλάβει τι κατανόησε ένας άνθρωπος διαβάζοντας ένα κείμενο.

«Με τεχνολογίες καταγραφής της οφθαλμοκίνησης κατά την ανάγνωση, αναλύοντας τις στάσεις του ματιού πάνω σε λέξεις και φράσεις, και ταυτόχρονα τις απαντήσεις που έχουν δώσει παιδιά, ανιχνεύεται ο βαθμός κατανόησης του κειμένου. Επίσης, μπορεί να αξιολογηθεί η ορθότητα μιας απάντησης και εν γένει η παραγωγή γραπτού λόγου από μαθητές», λέει ο κ. Κατσούρος.

«Με την τεχνολογία καταγραφής της οφθαλμοκίνησης θα μπορούσε, επίσης, να γίνει αξιολόγηση διδακτικών βιβλίων και να εντοπιστούν δυσνόητα σημεία», προσθέτει ο κ. Πιπερίδης.



Από τις εφημερίδεςΠροτείνουμε

Δεν υπάρχουν σχόλια:

▼ Διαβάστηκαν περισσότερο την τελευταία εβδομάδα