Κυριακή 16 Φλεβάρη 2003
ΡΙΖΟΣΠΑΣΤΗΣ
ΡΙΖΟΣΠΑΣΤΗΣ
Σελίδα 7
ΕΝΘΕΤΗ ΕΚΔΟΣΗ: "7 ΜΕΡΕΣ ΜΑΖΙ"
ΠΟΙΚΙΛΗΣ ΥΛΗΣ - ΕΠΙΣΤΗΜΗ
Ηλεκτρονικές φωνές που ξεγελούν

Εχετε ακούσει τον Μάικ; Ο Μάικ είναι επαγγελματίας εκφωνητής και είναι παντού σήμερα στις ΗΠΑ. Στο Ιντερνετ θα σας διαβάσει ό,τι οδηγίες θέλετε, ή ακόμα και τα μηνύματα ηλεκτρονικού ταχυδρομείου που έχετε λάβει. Σύντομα ο Μάικ θα λέει και τον καιρό στην τηλεόραση. Αλλά μην περιμένετε να δείτε το πρόσωπό του στην οθόνη. Δεν είναι άνθρωπος. Είναι μια φωνή που παράγεται από ηλεκτρονικό υπολογιστή, ο οποίος συνθέτει προμαγνητοφωνημένα φωνήματα σε μια ομαλή ηχητική ροή, που μοιάζει καταπληκτικά με ανθρώπινη ομιλία.

Από το 2001, που βγήκε στην αγορά από την κατασκευάστρια AT&T, ο Μάικ έχει γίνει αστέρας της τεχνολογίας παραγωγής ήχου από κείμενο. Είναι ένα μέλος της διαρκώς αυξανόμενης οικογένειας των επονομαζόμενων Φυσικών Φωνών της εταιρίας. Τα άλλα μέλη της οικογένειας είναι ο Ράινερ και η Κλάρα (που μιλούν γερμανικά), η Ρόζα (ισπανικά), ο Αλέν (γαλλικά) και η Οντρεϊ και ο Τσαρλς (αγγλικά με βρετανική προφορά). Μια άλλη φωνή, η Κρίσταλ, ήταν η φωνή του υπολογιστή στην ταινία «Κόκκινος πλανήτης». Ο Μάικ, η Κρίσταλ, ο Ράινερ κι η Ρόζα είναι μόνο λόγια, χωρίς σώμα.

Η τεχνολογία σύνθεσης φωνής έχει κάνει τον τελευταίο καιρό ένα άλμα στην αληθοφάνεια και στη φυσικότητα του αποτελέσματος. Ολα ξεκινούν από την καταγραφή πολύωρης ανάγνωσης κειμένων από έναν άνθρωπο με καλή άρθρωση. Η φωνή του αναλύεται στη συνέχεια από έναν υπολογιστή και τα μικρότερα κομμάτια της (φωνήματα) συντίθενται και ανασυντίθενται για να συνθέσουν τις ζητούμενες λέξεις. Αρχικά η επεξεργασία της φωνής οδηγούσε στο διαχωρισμό 50-60 φωνημάτων, που αντιστοιχούν σε ήχους συμφώνων, φωνηέντων και συμπλεγμάτων. Ομως, η φωνή που δημιουργούνταν από τη σύνθεση αυτού του μικρού αριθμού φωνημάτων δεν μπορούσε να συλλάβει τις απαλές διακυμάνσεις του τόνου εκφοράς.

Στα μέσα της δεκαετίας του 1990, οπλισμένοι με τους νέους πολύ ισχυρότερους υπολογιστές, οι ερευνητές άρχισαν να συλλέγουν ένα τεράστιο πλήθος φωνημάτων, έτσι ώστε για κάθε φώνημα να έχουν πάνω-κάτω 10.000 ημιφωνήματα, που επιτρέπουν καλύτερο ανασυνδυασμό τους. Τα δισεκατομμύρια των δυνατών συνδυασμών ήταν τώρα ένα πιο εφικτό υπολογιστικό έργο για τα ισχυρότερα μηχανήματα, αλλά και πάλι έπαιρνε αρκετή ώρα.

Ο Αλιστερ Κόνκι, ένας από τους ερευνητές της AT&T, βρήκε τρόπο να εφαρμόσει στο πρόβλημα τον αλγόριθμο της λύσης του παλιού μαθηματικού προβλήματος του πλανόδιου πωλητή, όπου ένας πωλητής πρέπει να επισκεφτεί, π.χ., 50 πόλεις διανύοντας τη μικρότερη δυνατή απόσταση συνολικά. Ο Κόνκι προσδιόρισε κόστη στις αμέτρητες δυνατές επιλογές και συνδυασμούς ημιφωνημάτων και ανέθεσε στον υπολογιστή να βρει το μονοπάτι της λιγότερο ακριβής διαδρομής. Ετσι, έπαιρνε ένα αποτέλεσμα το οποίο περιείχε τα ημιφωνήματα που συνδυάζονται καλύτερα για τη σύνθεση της ζητούμενης λέξης.

Αφού έλυσε το πρόβλημα της ταχύτητας ασχολήθηκε με το πρόβλημα των αμφίσημων λέξεων στο γραπτό λόγο (που ιδιαίτερα στην αγγλική γλώσσα είναι συχνό φαινόμενο) και το πρόβλημα της κατανόησης της παύλας άλλοτε ως ενωτικό σημείο και άλλοτε ως το αλγεβρικό σημείο μείον. Παραμένει το πρόβλημα της αδυναμίας κατάλληλης αλλοίωσης της φωνής, ώστε να αποδίδει το συναίσθημα, π.χ., κατά την απαγγελία ποιημάτων, ή σε μια έντονη συνομιλία.

Οι διαφημιζόμενες χρήσεις αυτής της τεχνολογίας είναι κυρίως για την εξυπηρέτηση των τυφλών και όσων έχουν προβλήματα όρασης, για την έμμεση ανάγνωση κειμένων από ανθρώπους που έχουν κουρασμένα μάτια, στον κινηματογράφο και αλλού. Ομως, εύκολα μπορεί να χρησιμοποιηθεί και για άλλους σκοπούς. Σχετικά αθώους, όπως του μαθητή που έδωσε εντολή σε μια συνθετική φωνή να απαγγείλει τη φράση «ο γιος μου θα λείψει δικαιολογημένα σήμερα», την κατέγραψε και την αναπαρήγαγε με το μαγνητόφωνο αφού τηλεφώνησε στο διευθυντή του σχολείου του, μέχρι άλλες πιο ...προχωρημένες χρήσεις, όπως ο βομβαρδισμός με διαφημιστικά μηνύματα μέσω τηλεφώνου, ή ακόμα τα παραπλανητικά τηλεφωνήματα με τη φωνή γνωστών και φίλων (η ελληνική τηλεόραση έχει προβάλει τουλάχιστον μια τηλεταινία που χρησιμοποιεί αυτό το εφιαλτικό εύρημα). Οπως συνήθως, το πρόβλημα δεν είναι τι κάνει η νέα μηχανή, αλλά τι τη βάζεις να κάνει.


Επιμέλεια:
Σταύρος ΞΕΝΙΚΟΥΔΑΚΗΣ
Πηγές: «Discover», NASA


Κορυφή σελίδας
Ευρωεκλογές Ιούνη 2024
Μνημεία & Μουσεία Αγώνων του Λαού
Ο καθημερινός ΡΙΖΟΣΠΑΣΤΗΣ 1 ευρώ