Η εισαγωγή των ελληνικών στα συστήματα πληροφορικής της Ευρωπαϊκής Επιτροπής
τεχνικά προβλήματα και θετικές επιπτώσεις

υπό Παναγιώτη Ε. ΑΛΕΒΑΝΤΗ

Περίληψη: το άρθρο αυτό αναφέρεται στο ιστορικό της εισαγωγής των ελληνικών στα συστήματα πληροφορικής της Ευρωπαϊκής Επιτροπής. Περιγράφονται με συντομία τα τεχνικά προβλήματα που έπρεπε να λυθούν προκειμένου να συνυπάρξουν ελληνικοί και ειδικοί λατινικοί χαρακτήρες. Οι ευεργετικές επιπτώσεις που είχε στις λατινογενείς γλώσσες της Ευρωπαϊκής Κοινότητας η επιτυχής λύση των προβλημάτων αυτών για τα ελληνικά. Και τα αποτελέσματα που επιτεύχθηκαν όσον αφορά την εισαγωγή της πλήρους ή εκτεταμένης πολυγλωσσίας. Το άρθρο περιλαμβάνει τα εξής κεφάλαια: Σύντομη ιστορική αναδρομή. Αλφάβητα και υπολογιστές. Τα ελληνικά στη CELEX. Η πλήρης ή εκτεταμένη πολυγλωσσία. Αναφέρονται επίσης με συντομία η σημερινή κατάσταση, τα προβλήματα που απομένουν να επιλυθούν καθώς και οι προοπτικές. Περιλαμβάνει επίσης και μερικούς χρήσιμους τόπους στο διαδίκτυο.

Summary : The present article covers the history of the introduction of Greek in the computer systems of the European Commission. Shortly described are the technical problems that had to be solved in order to ensure the co-existence of Greek and special Latin characters. How the successful solution of these problems for Greek benefited the languages of the European Community written with the Latin script. And the results attained concerning the introduction of full or extended multilingualism. The present article is divided in the following chapters : Short historical overview. Alphabets and computers. Greek in CELEX. Full or extended multilingualism. It also covers the current situation, the problems still waiting a solution and the perspectives.

 

Σύντομη ιστορική αναδρομή

Όταν την 1η Ιανουαρίου του 1981 η Ελλάδα γινόταν πλήρες μέλος των Ευρωπαϊκών Κοινοτήτων[1] η πληροφορική βρισκόταν ακόμη στην εποχή των «μεγάλων συστημάτων»· οι γραμματείς διέθεταν απλές ηλεκτρικές γραφομηχανές ενώ τερματικά για υπολογιστές υπήρχαν μόνον στα γραφεία των επαγγελματιών της πληροφορικής. Βέβαια, στις Ηνωμένες Πολιτείες, η Apple είχε ήδη κυκλοφορήσει τον πρώτο προσωπικό της υπολογιστή και η IBM παρουσίαζε το δικό της μοντέλο, το πρώτο PC (Personal Computer).

Οι Συνθήκες περί ιδρύσεως των Ευρωπαϊκών Κοινοτήτων, μετά την τροποποίησή τους λόγω της προσχώρησης της Ελλάδος, προέβλεπαν επτά επίσημες γλώσσες και γλώσσες εργασίας[2]. Η υποχρεωτική αυτή πολυγλωσσία δεν αποτελεί ούτε περιττή πολυτέλεια ούτε πολιτικό συμβιβασμό· αντίθετα είναι πρωταρχικής σημασίας για τον Ευρωπαίο πολίτη και την λειτουργία της ίδιας της Ευρώπης. Έτσι με βάση την αρχή πως "ουδείς δικαιολογείται να αγνοεί το νόμο" οι πολίτες της Ένωσης πρέπει να λαμβάνουν γνώση του Ευρωπαϊκού Κοινοτικού Δικαίου στη γλώσσα τους, τη στιγμή μάλιστα που συχνά το Ευρωπαϊκό υπερτερεί του εθνικού Δικαίου και είναι άμεσα εφαρμόσιμο σε όλη την επικράτεια της Ένωσης. Πράγματι, οι κανονισμοί για τις τιμές των αγροτικών προϊόντων επηρεάζουν όλους τους ευρωπαίους αγρότες, οι αποφάσεις περί ανταγωνισμού εφαρμόζονται άμεσα στις επιχειρήσεις και με τα προγράμματα χρηματοδότησης π.χ. των ΜΜΕ η Ένωση παρεμβαίνει στην οικονομική δραστηριότητα σε πολλές περιοχές απανταχού της Ευρώπης.

Πρώτες εφαρμογές.  Οι πρώτες υπηρεσίες που έπρεπε να εντάξουν τα ελληνικά στην καθημερινή τους εργασία ήταν όσες ασχολούνταν με τη μετάφραση και τη δημοσίευση κειμένων νομοθεσίας και νομολογίας. Ήδη, λίγο πριν την επίσημη ένταξη, η Επιτροπή και τα άλλα Κοινοτικά Όργανα[3] φρόντισαν να δημιουργήσουν ελληνικά μεταφραστικά γραφεία. Το ελληνικό μεταφραστικό γραφείο της Επιτροπής ολοκλήρωσε τη μετάφραση του παράγωγου κοινοτικού δικαίου στα ελληνικά πριν από την 1η Ιανουαρίου 1981. Από εκείνη την ημερομηνία και μετά η Επίσημη Εφημερίδα των Ευρωπαϊκών Κοινοτήτων (εις το εξής ΕΕ) άρχισε να κυκλοφορεί και στα ελληνικά. Αυτό σήμαινε πως το κεντρικό τυπογραφείο της Υπηρεσίας Επισήμων Εκδόσεων των Ευρωπαϊκών Κοινοτήτων έπρεπε να προσλάβει ελληνόφωνο προσωπικό και να προσαρμόσει κατάλληλα τα εκδοτικά του συστήματα. Το ίδιο έπρεπε να κάνουν κι αρκετές από τις εκδοτικές επιχειρήσεις που συνεργάζονταν μαζί του.

Τρεις, ήταν κυρίως, οι πρώτες εφαρμογές πληροφορικής, στις οποίες τα ελληνικά κρίθηκαν απαραίτητα· όλες σχετίζονταν άμεσα με τη μετάφραση και τις δημοσιεύσεις. Η πρώτη χρονολογικά εφαρμογή ήταν η ηλεκτρονική κωδικοποίηση της ελληνικής έκδοσης της ΕΕ, στα πλαίσια της ηλεκτρονικής φωτοστοιχειοθεσίας και της ηλεκτρονικής αρχειοθέτησής της (ενόψει της μελλοντικής εισαγωγής στις βάσεις δεδομένων της Επιτροπής). Ήλθαν μετά τα πρώτα συστήματα επεξεργασίας κειμένων (συστήματα πρώτης γενιάς όπως το Olivetti ETS 2010) και η προσαρμογή της πολύγλωσσης βάσης δεδομένων ορολογίας, του αυτόματου λεξικού τεχνικών όρων Eurodicautom.

Η εισαγωγή των ελληνικών στις παραπάνω εφαρμογές δεν έγινε εύκολα. Κατ' αρχάς δεν υπήρξε για τις εφαρμογές αυτές μεγάλο πολιτικό ενδιαφέρον αφού αφορούσαν κυρίως τους εργαζόμενους στα Κοινοτικά Όργανα και όχι κατ' ανάγκη το ευρύ κοινό. Εξ άλλου, στις αρχές της δεκαετίας του 1980 τα συστήματα πληροφορικής είχαν περιορισμένες δυνατότητες και μετά βίας πολλές φορές κάλυπταν ακόμη και τις λατινογενείς επίσημες κοινοτικές γλώσσες. Έτσι τα ελληνικά, που δεν γράφονται βέβαια με το λατινικό αλφάβητο, ήταν εκείνη την εποχή οι «φτωχοί συγγενείς» στα συστήματα πληροφορικής, εάν και όταν υποστηρίζονταν. Οι λύσεις που δόθηκαν ήταν μάλλον αποσπασματικές και αυτό δεν οφείλονταν τόσο στη έλλειψη καλής θέλησης όσο κυρίως στην τεχνολογική υστέρηση της εποχής[4]. Επιπλέον και οι «ευρωσκληρηντικοί» ρυθμοί με τους οποίους κινούνταν εκείνη την εποχή η Ευρώπη δεν άφηναν περιθώρια για πολλή πρόοδο.

Η εσωτερική αγορά και ο ρόλος της CELEX.  Στα μέσα ωστόσο της δεκαετίας του 1980, η κατάσταση άρχισε να αλλάζει και σε αυτό συνέβαλαν αρκετά γεγονότα. Κατ' αρχάς η πρώτη Επιτροπή Delors (1985) έθεσε ως στόχο την Ευρωπαϊκή ολοκλήρωση (ή ορθότερα ενοποίηση) πρώτα με την Ενιαία Πράξη - που οδήγησε στην Εσωτερική Αγορά του 1993 - και μετά με τη Συνθήκη του Μάαστριχτ λίγα χρόνια αργότερα. Στα πλαίσια της υλοποίησης των πολιτικών αυτών στόχων τα Κοινοτικά  Όργανα και ιδίως η Επιτροπή ανέλαβαν νέες εξουσίες· ο φόρτος εργασίας αυξήθηκε και οι ρυθμοί εργασίας άρχισαν να επιταχύνονται· τέλος το Κοινοτικό Δίκαιο άρχισε να επηρεάζει όλο και περισσότερο την καθημερινή ζωή του ευρωπαίου πολίτη. Εξ άλλου, την ίδια περίπου εποχή το τεχνολογικό περιβάλλον μεταβλήθηκε σημαντικά : οι μικροϋπολογιστές, τα δίκτυα ανταλλαγής δεδομένων και οι τράπεζες πληροφοριών άρχισαν να γίνονται εργαλεία απαραίτητα για όσους εργάζονταν στα γραφεία.

Ένα από τα αποτελέσματα της επιτάχυνσης της ευρωπαϊκής ενοποίησης ήταν να γίνει όλο και πιο επιτακτική η ανάγκη για διάθεση της κοινοτικής νομοθεσίας και νομολογίας με ηλεκτρονικά μέσα. Έτσι μετά από σημαντικές πιέσεις των άλλων Κοινοτικών Οργάνων και των Κρατών Μελών, η Επιτροπή άνοιξε στο κοινό το αυτοματοποιημένο διοργανικό σύστημα τεκμηρίωσης του κοινοτικού δικαίου CELEX (Communitatis Europæ LEX). Όμως, επειδή όπως αναφέρθηκε παραπάνω, οι Συνθήκες προβλέπουν πολλές επίσημες γλώσσες, το CELEX έπρεπε να διατεθεί σε όλες, να συμπεριλάβει δηλαδή και τα ελληνικά.

Ταυτόχρονα, ο φόρτος εργασίας στα Κοινοτικά Όργανα επέβαλε τη μαζική εισαγωγή της πληροφορικής στα γραφεία των ευρωυπαλλήλων με στόχο την αύξηση της παραγωγικότητας. Το πρόβλημα ήταν ιδιαίτερα έντονο στις μεταφραστικές υπηρεσίες, που έπρεπε να εξασφαλίσουν την αναγκαία υποστήριξη των νομοθετικών πρωτοβουλιών της Επιτροπής.

Top

Αλφάβητα και υπολογιστές

Πριν προχωρήσουμε θα πρέπει να πούμε δύο λόγια για τον τρόπο με τον οποίο οι υπολογιστές επεξεργάζονται τους αλφαβητικούς και τους αριθμητικούς χαρακτήρες. Στα κυκλώματα, που βρίσκονται στο εσωτερικό των υπολογιστών, κυκλοφορούν ηλεκτρικά ρεύματα με τη μορφή διακοπτόμενων παλμών. Όταν από ένα κύκλωμα δεν περνά ρεύμα λέμε πως το κύκλωμα βρίσκεται στην κατάσταση "μηδέν"· αντίστοιχα το κύκλωμα από το οποίο περνά ρεύμα βρίσκεται στην κατάσταση "ένα". Έτσι, όλες οι πληροφορίες που επεξεργάζεται ο υπολογιστής, θα πρέπει να αντιστοιχούν σε κάποιους συνδυασμούς από "μηδέν" (0) και "ένα" (1) και αυτά τα δύο ψηφία ονομάζονται "δυαδικά ψηφία" ή "δυφία" (binary digits ή bits).

Προκειμένου ο υπολογιστής να μπορέσει να επεξεργασθεί ένα σύνολο χαρακτήρων, όπως λόγου χάριν ένα αλφάβητο, θα πρέπει να καθιερώσουμε κάποια κωδικοποίηση των χαρακτήρων αυτών με βάση συγκεκριμένες παραδοχές όσον αφορά τους συνδυασμούς των δυφίων που χρησιμοποιούνται. Με τον τρόπο αυτό όσοι χρησιμοποιούν τον υπολογιστή θα ερμηνεύουν τους ηλεκτρικούς του παλμούς με τον ίδιο τρόπο και αυτό θα ισχύει επίσης και στην περίπτωση ανταλλαγής δεδομένων μεταξύ διαφορετικών υπολογιστών.

Οι πρώτοι υπολογιστές χρησιμοποίησαν κώδικες με βάση συνδυασμούς επτά δυφίων (ή και λιγότερων), μπορούσαν δηλαδή να επεξεργαστούν σύνολα 128 (=27) χαρακτήρων. Ένας τέτοιος κώδικας είναι και ο κώδικας ASCII (American Standard Code for Information Interchange) που αντιστοιχεί στο διεθνές πρότυπο ISO 646 (ISO: International Standardisation Organisation, Διεθνής Οργανισμός Τυποποίησης). Στους 128 αυτούς χαρακτήρες περιλαμβάνονται οι αριθμοί 0 ως 9, το βασικό λατινικό αλφάβητο σε κεφαλαία και πεζά, καθώς και ορισμένα σημεία στίξης και σύμβολα όπως @, &, ', (, ), -, +, =, $, % κλπ. Δεν περιλαμβάνονται τα ελληνικά αλλά ούτε και οι τονούμενοι και άλλοι ειδικοί λατινικοί χαρακτήρες των λατινογενών ευρωπαϊκών γλωσσών. Στην πράξη, μέχρι το 1990, οι ειδικοί λατινικοί χαρακτήρες είτε αγνοούνταν παντελώς είτε σε ειδικές περιπτώσεις όπως λόγου χάριν στη βάση δεδομένων CELEX, μεταγραμματίζονταν σε έναν ή δύο χαρακτήρες (π.χ. è, é, ê = e, ä = ae, å = aa, æ = ae, ç = c, ß =ss, κλπ.). Επιπλέον, συχνά τα πεζά γράμματα μετατρέπονταν σε κεφαλαία.

Τα προβλήματα με τα ελληνικά και η προταθείσα λύση.  Όμως η επιβαλλόμενη εισαγωγή των ελληνικών στη CELEX ήταν αδύνατη σε ένα τέτοιο περιβάλλον. Προτάθηκαν βέβαια κάποιες "ενδιάμεσες" λύσεις. Μία από αυτές για παράδειγμα προέβλεπε την αντικατάσταση των πεζών λατινικών γραμμάτων από κεφαλαία ελληνικά (όπως είχε ήδη γίνει σε κάποιες εφαρμογές στην Ελλάδα[5]). Μία άλλη πρόταση που απορρίφθηκε ήταν και ο μεταγραμματισμός του Ελληνικού στο Λατινικό αλφάβητο ("φραγκοχιώτικα" ή "greeklish"). Δυστυχώς η υιοθέτηση τέτοιων λύσεων θα δημιουργούσε σοβαρά προβλήματα. Πρώτα απ' όλα το Συμβούλιο της Επικρατείας έχει αποφανθεί πως νομικά κείμενα που έχουν γραφεί μόνον με κεφαλαία δεν αναγνωρίζονται ως  δεσμευτικά[6]. Εξ άλλου, τα ελληνικά κείμενα του Κοινοτικού Δικαίου περιέχουν και λέξεις που γράφονται με λατινικούς χαρακτήρες (π.χ. αποφάσεις "sui generis", επιτροπές "ad hoc", προγράμματα ESPRIT και RACE) που δεν μεταφράζονται ούτε μεταγραμματίζονται στα ελληνικά, ενώ ταυτόχρονα αποτελούν χρήσιμους όρους διερεύνησης σε κείμενα που είναι αποθηκευμένα σε τράπεζα πληροφοριών. Τέλος, οι τόνοι δεν μπορούν να λείπουν από κανένα νομικό κείμενο στα ελληνικά αφού η παράλειψη τους μπορεί να οδηγήσει σε παρανοήσεις ή και σε λανθασμένα αποτελέσματα μίας έρευνας σε βάση δεδομένων με πλήρες κείμενο[7],[8]. Φυσικά, αντίστοιχα προβλήματα, αλλά σε μικρότερο σχετικά βαθμό, παρουσιάζονται και σε άλλες λατινογενείς γλώσσες όπως η γαλλική, η γερμανική και η ισπανική.

Όλα τα παραπάνω δεδομένα οδήγησαν στο συμπέρασμα πως για τη σωστή αντιμετώπιση της πολυγλωσσίας απαιτείτο σε πρώτη φάση η εισαγωγή στη CELEX κωδικοποίησης με 256 (=28) τουλάχιστον χαρακτήρες, δηλαδή χαρακτήρες που να αντιστοιχούν σε 8-ψήφια κωδικοποίηση. Η εξέλιξη αυτή δεν ήταν ολωσδιόλου ανεπάντεχη αφού οι υπηρεσίες της Επιτροπής είχαν ήδη από το 1979 μελετήσει το πρόβλημα[9]. Αλλά το πρόβλημα χρειάστηκε να λυθεί κατ' αρχάς για τα ελληνικά, για τα οποία εκδηλώθηκε έντονο πολιτικό ενδιαφέρον[10].

Από τα ελληνικά στα πλούσια λατινικά.  Η εισαγωγή της πολυγλωσσίας στα συστήματα πληροφορικής της Ευρωπαϊκής Επιτροπής πέρασε λοιπόν από τις εξής φάσεις:

  • εισαγωγή των ελληνικών κατ’ αρχάς στην βάση δεδομένων CELEX και δευτερευόντως στα συστήματα πληροφορικής γραφείου της Επιτροπής,
  • επέκταση στις λατινογενείς γλώσσες των λύσεων που δόθηκαν για τα ελληνικά και δημιουργία ενός τυποποιημένου περιβάλλοντος “κοινοτικής” πολυγλωσσίας που περιελάμβανε τις οκτώ - τότε - λατινογενείς γλώσσες και τα ελληνικά,
  • επέκταση στις υπόλοιπες λατινογενείς ευρωπαϊκές γλώσσες, καθώς και στις μη-λατινογενείς (γλώσσες που γράφονται με κυριλλικούς, αραβικούς κλπ. χαρακτήρες), ενόψει της επέκτασης της Ευρώπης προς ανατολάς και νότο, αλλά και με βάση τις εξελίξεις που σημειώθηκαν εντωμεταξύ στον τομέα της διεθνοποίησης της πληροφορικής.

Βέβαια η επιτυχής υλοποίηση ενός πλήρως πολύγλωσσου περιβάλλοντος (ταυτόχρονος χειρισμός ειδικών λατινικών και ελληνικών χαρακτήρων) απαιτεί στην πραγματικότητα κωδικοποίηση με συνδυασμούς δύο 8-ψήφιων χαρακτήρων. Η υιοθέτηση μίας τέτοιας λύσης με πολλαπλούς χαρακτήρες (multi-byte) ήταν αδιανόητη στα τέλη της δεκαετίας του 1980 για πολλούς λόγους: ανυπαρξία φθηνών τερματικών (ή προσομοιωτών - emulators - για προσωπικούς υπολογιστές), αδυναμία εισαγωγής ακόμη και 8-ψήφιων χαρακτήρων σε συστήματα διαχείρισης βάσεων δεδομένων, αδυναμία διαβίβασης μέσω των δικτύων κλπ. Ευτυχώς η κατάσταση έχει έκτοτε βελτιωθεί, λόγω της υιοθέτησης διεθνών προτύπων αλλά και χάρη στην κατανόηση της σημασίας της πολυγλωσσίας από τις μεγάλες εταιρείες πληροφορικής.

Top

Τα ελληνικά στη CELEX: θεμέλιο της κοινοτικής πολυγλωσσίας

Στις αρχές του 1986, η Επιτροπή ενεργοποίησε τη διαδικασία δημιουργίας της ελληνικής βάσης δεδομένων CELEX. Γρήγορα διαπιστώθηκε πως για να δοθεί μία σωστή λύση στο πρόβλημα έπρεπε πρώτα να θεσπισθεί ένα πρότυπο για την 8-ψήφια κωδικοποίηση του Ελληνικού αλφαβήτου. Το πρότυπο που τελικά επιλέχτηκε το 1987 ήταν το διεθνές πρότυπο ISO 8859/7 κι αυτό για πολλούς λόγους. Κατ' αρχάς έτσι επέβαλε η κοινοτική νομοθεσία[11], που απαιτεί τη χρήση διεθνών προτύπων σε όλα τα συστήματα πληροφορικής και τηλεπικοινωνιών, η ανάπτυξη των οποίων χρηματοδοτείται από τον κρατικό ή τον κοινοτικό προϋπολογισμό. Επίσης αυτό το διεθνές πρότυπο είναι ταυτόσημο με το αντίστοιχο εθνικό ελληνικό πρότυπο, το ΕΛΟΤ 928 (ΕΛΟΤ: Ελληνικός Οργανισμός Τυποποίησης). Στην πραγματικότητα ο υπογράφων συνέβαλε όσον του ήταν δυνατόν στην υιοθέτηση αυτού του προτύπου, η θέσπιση του οποίου χρόνιζε αδικαιολόγητα[12]. Είναι προφανές πως η διάθεση της CELEX στην Ελλάδα δεν θα ήταν δυνατή αν δεν είχε υιοθετηθεί κοινό πρότυπο.

Το πρόβλημα …  Η εισαγωγή των ελληνικών στο σύστημα CELEX, σε συνδυασμό με την απαίτηση για διασύνδεση των υπολογιστών της Επιτροπής, σήμαινε πως έπρεπε να προσαρμοστεί με το νέο διεθνές πρότυπο ολόκληρο το περιβάλλον πληροφορικής της Επιτροπής. Θα 'πρεπε δηλαδή οι ελληνικοί χαρακτήρες να εισαχθούν με βάση το πρότυπο σε συγκεκριμένα προϊόντα πληροφορικής και κυρίως:

  • στα τερματικά[13], [14]  και τους εκτυπωτές,
  • στο λογισμικό δηλαδή στο σύστημα διαχείρισης της βάσης δεδομένων,
  • στα προγράμματα τροφοδοσίας της βάσης με δεδομένα και,
  • στα δίκτυα μέσω των οποίων οι χρήστες μπορούν να διερευνήσουν τη βάση.

Το περιβάλλον πληροφορικής της Επιτροπής, που από το 1985 και μετά γνώρισε τεράστια ανάπτυξη, επέβαλε επίσης τη λύση του προβλήματος στα πλαίσια μίας σαφώς καθορισμένης Αρχιτεκτονικής[15]. Βέβαια η απαίτηση να εφαρμόζονται πάντοτε τα διεθνή πρότυπα προκειμένου να διευκολύνεται η διασύνδεση των υπολογιστών είναι αρκετά λογική· όμως η αγορά δεν είναι πάντα διατεθειμένη να ανταποκριθεί ακόμη κι όταν η ανάγκη είναι προφανής. Γι' αυτό θα πρέπει πάντα να υπάρχουν εναλλακτικές επιλογές προκειμένου να υιοθετηθούν ρεαλιστικές και υλοποιήσιμες λύσεις.

… και οι λύσεις. Αυτό ίσχυσε και στην περίπτωση της CELEX. Η επιτυχής υλοποίηση ενός πλήρως πολύγλωσσου περιβάλλοντος (ταυτόχρονος χειρισμός ειδικών λατινικών και ελληνικών χαρακτήρων) απαιτεί όπως αναφέρθηκε κωδικοποίηση με συνδυασμούς δύο 8-ψήφιων χαρακτήρων. Ωστόσο, για τη CELEX, η υιοθέτηση ενός πλήρως πολυγλωσσικού περιβάλλοντος δεν ήταν στην πραγματικότητα απαραίτητη. Είναι προφανές πως η συχνότητα ελληνικών λέξεων σε αμιγώς λατινογενή κείμενα είναι εξαιρετικά μικρή και οι λέξεις αυτές δεν αποτελούν ποτέ αντικείμενο έρευνας. Από την άλλη πλευρά οι λατινογενείς λέξεις με ειδικούς (π.χ. τονούμενους) λατινικούς χαρακτήρες είναι εξαιρετικά σπάνιες σε ελληνικά κείμενα και δεν αποτελούν αντικείμενο έρευνας (όπου ο ειδικός λατινικός χαρακτήρας αποτελεί κρίσιμο κριτήριο έρευνας).

Ταυτόχρονα αποκλείστηκαν και διάφορες άλλες "εξωτικές" λύσεις όπως λόγου χάριν η υιοθέτηση 7-ψήφιας κωδικοποίησης με αλλαγή κάθε φορά του περιβάλλοντος από ελληνικό σε λατινικό και αντίστροφα (μηχανισμοί επέκτασης σύμφωνα με το ISO 2022[16]). Η πρόταση αυτή στηρίχτηκε στο γεγονός πως οι ειδικοί λατινικοί χαρακτήρες υπήρχαν σε κάθε εθνική 7-ψήφια κωδικοποίηση του λατινικού αλφαβήτου. Όμως η υιοθέτηση του γαλλικού λόγου χάριν προτύπου θα σήμαινε πως οι γερμανικοί ή οι δανέζικοι χαρακτήρες θα αγνοούνταν. Επιπλέον για τα Ελληνικά η λύση αυτή παρουσιάζει πολλά προβλήματα αξιοπιστίας (π.χ. κατά την διαβίβαση των δεδομένων μέσω του δικτύου) αλλά και λειτουργικά αφού συνήθως οι εντολές στους υπολογιστές δίδονται με λατινικούς χαρακτήρες. Τέλος, επειδή στην περίπτωση των ελληνικών ο Οργανισμός Τηλεπικοινωνιών της Ελλάδος (ΟΤΕ) πρότεινε την κωδικοποίηση των τόνων με ξεχωριστούς 7-ψήφιους χαρακτήρες, υπολογίστηκε πως ο όγκος των διαβιβαζόμενων δεδομένων θα ήταν αυξημένος κατά 40 %, με αποτέλεσμα οι συνδρομητές να πρέπει να πληρώσουν “κάτι” παραπάνω. Εξάλλου η υιοθέτηση "ιδιωτικών" κωδικοποιήσεων[17] είχε απορριφθεί εκ των προτέρων αφού θα αποτελούσε παραβίαση της ισχύουσας Κοινοτικής νομοθεσίας (βλ. παραπάνω).

Για όλους αυτούς τους λόγους, εκείνη την εποχή (1989), η υιοθέτηση των προτύπων της σειράς ISO 8859 ήταν η πλέον αποδοτική και ρεαλιστική επιλογή για τη λύση του προβλήματος. Κατ’ αρχάς όπως αναφέρθηκε χρησιμοποιήθηκε το πρότυπο ISO 8859/7 για το ελληνολατινικό περιβάλλον[18]. Σε μεταγενέστερο στάδιο, και με βάση την εμπειρία που αποκτήθηκε στα πλαίσια της εισαγωγής των ελληνικών, υλοποιήθηκε και η εισαγωγή των ειδικών λατινικών χαρακτήρων στη CELEX για τις λατινογενείς γλώσσες. Για τις γλώσσες αυτές χρησιμοποιήθηκε το διεθνές πρότυπο ISO 8859/1. Έτσι:

  • στην ελληνική βάση CELEX εφαρμόστηκε κωδικοποίηση σύμφωνα με το ISO 8859/7 (που ισοδυναμεί με το ΕΛΟΤ 928)·
  • στις βάσεις CELEX για τις λατινογενείς γλώσσες εφαρμόστηκε κωδικοποίηση σύμφωνα με το ISO 8859/1 (που ισοδυναμεί με την 8-ψήφια κωδικοποίηση κατά ANSI (American National Standards Institute: Αμερικανικός Εθνικός Οργανισμός Τυποποίησης)·
  • στα τερματικά εφαρμόστηκε κωδικοποίηση σύμφωνα με το ISO 8859/1 για τα λατινικά και το ISO 8859/7 για τα ελληνικά με εφαρμογή μηχανισμών επέκτασης με ακολουθίες διαφυγής σύμφωνα με το ISO 4873· με τον τρόπο αυτό εξασφαλίστηκε η χρήση ενός μόνο τερματικού για την διερεύνηση της ελληνικής και των λατινογενών βάσεων καθώς και για την χρησιμοποίηση του συστήματος επεξεργασίας κειμένων· η ίδια κωδικοποίηση (ISO 8859/1 και /7) χρησιμοποιήθηκε και στους εκτυπωτές·
  • στο σύστημα επεξεργασίας κειμένων, που εφήρμοζε εσωτερικά “ιδιωτική” κωδικοποίηση δύο 7-ψήφιων χαρακτήρων, προσαρμόστηκαν κατάλληλα τα φίλτρα εισαγωγής και εκτύπωσης δεδομένων μέσω των τυποποιημένων τερματικών που αναφέρθηκαν παραπάνω·
  • τέλος τα δίκτυα προσαρμόστηκαν κατάλληλα προκειμένου να επιτρέπουν την διαβίβαση 8-ψήφιων χαρακτήρων κατά “διάφανο” τρόπο.

Οι τεχνικές λεπτομέρειες της εισαγωγής των ελληνικών στη CELEX και στο περιβάλλον πληροφορικής γραφείου δεύτερης γενεάς (Q-Office® της Quadratron σε περιβάλλον UNIX με τερματικά συμβατά με το πρότυπο VT200® της DEC), καθώς και η μεταγενέστερη επέκταση των τεχνικών λύσεων στις λατινογενείς γλώσσες έχουν ανακοινωθεί εγκαίρως σε πιο τεχνικό περιβάλλον[19]. Ήδη το 1990 η Επιτροπή είχε προσαρμόσει το περιβάλλον πληροφορικής γραφείου και το σύνολο της αρχιτεκτονικής της στα πρότυπα ISO 8859. Όμως η ταχύτατη πρόοδος που σημειώθηκε την εποχή εκείνη σε συνδυασμό με τα προβλήματα που άφησε εκ φύσεως ανεπίλυτα ο 8-ψήφιος “ιστορικός συμβιβασμός” μετέτρεψαν γρήγορα σε παρωχημένες τις κάποτε πρωτοποριακές λύσεις.

Top

Ένα βήμα μπροστά : πλήρης ή εκτεταμένη πολυγλωσσία

Το 1991 οι υπηρεσίες της Επιτροπής - με πρωτοβουλία της Υπηρεσίας Μετάφρασης - απεφάσισαν να διατυπώσουν τις ανάγκες τους όσον αφορά την πολυγλωσσία που πρέπει να υποστηρίζουν οι υπολογιστές. Η εργασία αυτή ήταν απαραίτητη για αρκετούς λόγους: κατ’ αρχάς είχε αρχίσει να διαγράφεται στον ορίζοντα η προσχώρηση νέων κρατών από το βορρά (σκανδιναβικές χώρες), και το νότο (Κύπρος, Μάλτα)· στη συνέχεια διαπιστώθηκε πως αναπτύσσονταν όλο και πιο σοβαρά στενές σχέσεις  με τις χώρες της κεντρικής και ανατολικής Ευρώπης και την Τουρκία· τέλος η ευρωπαϊκή ενοποίηση συνοδεύεται - στα πλαίσια και της Συνθήκης του Μάαστριχτ - και από μία ιδιαίτερη ενίσχυση του ρόλου των περιφερειών σε ολόκληρη την Ευρωπαϊκή Ένωση.

Ταυτόχρονα οι υπηρεσίες της Επιτροπής εγκατέλειψαν τα συστήματα πληροφορικής γραφείου δεύτερης γενιάς και εξοπλίσθηκαν με προσωπικούς υπολογιστές που λειτουργούσαν σε γραφικό περιβάλλον φιλικό προς τον χρήστη (προσωπικοί υπολογιστές με MS-Windows® με επεξεργαστές κειμένων WordPerfect® και MS-Word®). Επιπλέον διαπιστώθηκε η ύπαρξη έντονου ενδιαφέροντος των μεγάλων εταιρειών πληροφορικής για την υιοθέτηση 16-ψήφιων “καθολικών” λύσεων του προβλήματος της πολυγλωσσίας που θα κάλυπταν όλες τις γλώσσες του κόσμου. Ενδιαφέρον που συγκεκριμενοποιήθηκε μέσα από τις σχετικές εργασίες τυποποίησης σε διεθνές επίπεδο στα πλαίσια του Διεθνούς Οργανισμού Τυποποίησης[20] αλλά και της ιδιωτικής σύμπραξης Unicode®[21].

Οι προδιαγραφές.  Οι σχετικές εργασίες πραγματοποιήθηκαν σε συνεργασία και με τα άλλα Κοινοτικά Όργανα στα πλαίσια της επιτροπής συντονισμού της τυποποίησης. Ο υπογράφων είχε την τιμή να εκτελέσει χρέη εισηγητή της σχετικής ομάδας εργασίας που κατέληξε στις βασικές απαιτήσεις όσον αφορά την υποστήριξη της πολυγλωσσίας στα συστήματα πληροφορικής των Κοινοτικών Οργάνων[22]. Οι απαιτήσεις αυτές διαβιβάστηκαν επίσημα από την Επιτροπή στους Ευρωπαϊκούς Οργανισμούς τυποποίησης και χρησίμευσαν ως βάση για την οριστικοποίηση των σχετικών προτύπων αλλά και για την υλοποίηση προϊόντων μερικά από τα οποία έχουν πια καθιερωθεί στο εμπόριο.

Όπως αναφέρεται στο τελικό κείμενο, που εγκρίθηκε ομόφωνα από όλα τα Κοινοτικά Όργανα, «η μαζική παραγωγή, διαβίβαση, ανταλλαγή, επεξεργασία, αρχειοθέτηση, αποθήκευση, και ανάκτηση πολύγλωσσων εγγράφων, γλωσσαρίων και λεξικών είναι δυνατή μόνο με την εκτεταμένη χρησιμοποίηση ισχυρών και ευέλικτων υπολογιστικών συστημάτων». Αυτός ήταν και ο λόγος για τον οποίο τα Κοινοτικά Όργανα έπρεπε να προχωρήσουν στην εισαγωγή της “εκτεταμένης” πολυγλωσσίας στα συστήματα πληροφορικής που χρησιμοποιούν.

Mε βάση τις επίσημες γλώσσες των κρατών μελών της Ευρωπαϊκής Ένωσης και των κρατών με τα οποία η Ένωση αναπτύσσει στενές σχέσεις - χώρες της Ευρωπαϊκής Ζώνης Ελεύθερων Συναλλαγών (ΕΖΕΣ) μετέπειτα Ενιαίου Ευρωπαϊκού Χώρου (ΕΕΧ), χώρες Κεντρικής και Ανατολικής Ευρώπης, κλπ. - διαμορφώθηκαν δύο σύνολα γλωσσών. Το πρώτο από αυτά περιελάμβανε 24 γλώσσες πρώτης προτεραιότητας που έπρεπε να υποστηριχθούν βραχυπρόθεσμα ή και μεσοπρόθεσμα στα συστήματα πληροφορικής της Ευρωπαϊκής Ένωσης. Ένα δεύτερο σύνολο περιελάμβανε 39 γλώσσες δεύτερης προτεραιότητας που θα έπρεπε να υποστηριχθούν επίσης. Για την υλοποίηση των παραπάνω προσδιορίστηκαν τα ακόλουθα στοιχεία:

  • το πλήρες σύνολο των χαρακτήρων που απαιτούνται προκειμένου να υποστηριχθούν σωστά οι γλώσσες αυτές·
  • οι αρχές που πρέπει να ληφθούν υπόψη προκειμένου να εξασφαλισθεί η σωστή αλφαβητική κατάταξη των χαρακτήρων ανάλογα με την γλώσσα·
  • η ψηφιακή κωδικοποίηση των χαρακτήρων του πλήρους συνόλου (σε περιβάλλον 16-ψήφιων συνδυασμών)·
  • τέλος τα πληκτρολόγια για κάθε γλώσσα / χώρα ανάλογα με τις συνήθειες των χρηστών (σε εθνικό και διεθνές επίπεδο).

Σύστημα επαλήθευσης. Οι προδιαγραφές θέσπισαν επίσης και ένα σύστημα επαλήθευσης για την υποστήριξη της πολυγλωσσίας. Έτσι ένα σύστημα πληροφορικής (υλικό / λογισμικό) θεωρείται ότι εξασφαλίζει την υποστήριξη μίας γλώσσας στα πλαίσια ενός πολυγλωσσικού περιβάλλοντος εφ’ όσον υλοποιεί τα ακόλουθα:

  • υποστήριξη όλων των χαρακτήρων που απαιτούνται για την σωστή αναπαραγωγή της συγκεκριμένης γλώσσας σε οποιοδήποτε περιφερειακό υποσύστημα (οθόνη, εκτυπωτής, κλπ.)·
  • σωστή υποστήριξη για την υπό εξέταση γλώσσα όλων των ειδικών λειτουργιών που συνδέονται με τις εφαρμογές τις οποίες υποστηρίζει το σύστημα πληροφορικής (π.χ. μετατροπή κεφαλαίων σε πεζά, μετακίνηση δεδομένων, εύρεση και αντικατάσταση)·
  • ύπαρξη αλγόριθμων που εξασφαλίζουν σωστή και μη-ασαφή αλφαβητική κατάταξη γραμμάτων, λέξεων ή εκφράσεων της γλώσσας·
  • ύπαρξη αλγόριθμων που εξασφαλίζουν σωστό συλλαβισμό λέξεων ή εκφράσεων της συγκεκριμένης γλώσσας·
  • ύπαρξη (υπο-)προγραμμάτων που εξασφαλίζουν σωστή ορθογραφική διόρθωση λέξεων ή εκφράσεων της γλώσσας·
  • στα πλαίσια πολυγλωσσικού περιβάλλοντος, δυνατότητα επισήμανσης των διάφορων γλωσσών μέσω της χρήσης επισήμανσης τύπου SGML[23] (ISO 8879). Στην περίπτωση αυτή θα πρέπει να χρησιμοποιούνται οι κώδικες γλωσσών του ISO 639.

Τέλος, σημαντικό ρόλο παίζει και η γραφική εμφάνιση των γραμματοσειρών με τις οποίες θα υλοποιηθούν οι χαρακτήρες στα τερματικά και τους εκτυπωτές. Θα πρέπει να αποφευχθεί η ασάφεια μεταξύ όμοιων χαρακτήρων που ανήκουν σε διαφορετικές γραφές (π.χ. ανάμεσα στο ελληνικό και το λατινικό Α) χωρίς ωστόσο αυτό να αποβεί σε βάρος της αισθητικής συνάφειας (π.χ. οι ελληνικοί και οι λατινικοί χαρακτήρες όταν βρεθούν δίπλα-δίπλα σε ένα κείμενο θα πρέπει να ταιριάζουν αισθητικά).

Είναι προφανές πως για τη διαμόρφωση των παραπάνω θέσεων, που αφορούν την “εκτεταμένη” πολυγλωσσία, καθοριστικό ρόλο έπαιξε η εμπειρία που αποκτήθηκε στα πλαίσια της εισαγωγής της ελληνικής γλώσσας στη CELEX και στα συστήματα πληροφορικής γραφείου δεύτερης γενιάς. Βέβαια και στην περίπτωση αυτή έπρεπε να γίνουν κάποιοι συμβιβασμοί που πήραν περισσότερο τη μορφή “προσωρινών” τοπικών λύσεων σε αναμονή των τελικών “καθολικών” λύσεων που έδωσε τελικά η αγορά.

Η υλοποίηση[24].  Όπως και στην περίπτωση της εισαγωγής των ελληνικών στο σύστημα CELEX (βλ. παραπάνω Τα ελληνικά στη CELEX), η εκτεταμένη πολυγλωσσία έπρεπε να εισαχθεί σε όλα τα προϊόντα πληροφορικής σε χρήση από τους υπαλλήλους των Οργάνων της Ευρωπαϊκής Ένωσης, δηλαδή:

  • προσωπικούς υπολογιστές και εκτυπωτές,
  • λογισμικά ιδίως στο σύστημα επεξεργασίας κειμένων, προγράμματα διαχείρισης βάσεων δεδομένων (σχεσιακά και πλήρους κειμένου) και άλλα λογισμικά καθημερινής χρήσης,
  • εφαρμογές τηλεπικοινωνιών και δίκτυα μέσω των οποίων οι χρήστες ανταλλάσσουν δεδομένα (ηλεκτρονικό ταχυδρομείο, μεταφορά αρχείων, διερεύνηση βάσεων δεδομένων).

Ήταν προφανές από την αρχή πως η εισαγωγή της πολυγλωσσίας στους προσωπικούς υπολογιστές έπρεπε να γίνει κατ’ αρχάς σε επίπεδο λειτουργικού συστήματος[25] ή σε επίπεδο γραφικού συστήματος επικοινωνίας με τον χρήστη[26]. Όμως τόσο το MS-DOS® όσο και το Windows® 3.x που είχαν επιλεγεί ως βασικά προϊόντα στις αρχές της δεκαετίας του 1990 λειτουργούσαν σε περιβάλλον 8-ψήφιας κωδικοποίησης. Έτσι όπως και στην περίπτωση της εισαγωγής των ελληνικών στα συστήματα δεύτερης γενεάς (βλ. παραπάνω Τα ελληνικά στη CELEX … οι λύσεις) χρησιμοποιήθηκαν 8-ψήφιες κωδικοποιήσεις που στηρίζονταν στα πρότυπα της σειράς ISO 8859[27] καθώς και επεκτάσεις με ακολουθίες διαφυγής. Επιπλέον το 1992 λόγω έλλειψης σχετικών προϊόντων στην αγορά η Επιτροπή χρηματοδότησε μόνη της την ανάπτυξη προσωρινών λύσεων για την υποστήριξη της πολυγλωσσίας στα συστήματα επεξεργασίας κειμένων (σύστημα MF-Windows® της γερμανικής εταιρείας Dialogica για την συμπλήρωση του Windows 3.x και την μετατροπή αρχείων μεταξύ των διάφορων κωδικοποιήσεων) καθώς και για την πρόσβαση σε βάσεις δεδομένων (προσομοιωτής TerWinal® της βελγικής εταιρείας Iris 2000).

Ευτυχώς σε αντίθεση με τα συστήματα δεύτερης γενεάς, όπου τέτοιες λύσεις εθεωρούντο οριστικές χωρίς να διαφαίνεται πιθανότητα βελτίωσης, στα συστήματα τρίτης γενεάς οι λύσεις ήταν σαφώς προσωρινές εν όψει της εφαρμογής λύσεων με πολλαπλούς χαρακτήρες σύμφωνα με το πρότυπο ISO 10646 (που ισοδυναμεί με το εμπορικό σήμα Unicode®). Έτσι, το 1994 το Windows® NT και το 1995 το Windows® 9x - που κατέχουν σημαντικό μερίδιο της αγοράς λειτουργικών συστημάτων - υιοθετούσαν την υποστήριξη της εκτεταμένης πολυγλωσσίας σύμφωνα με τα διεθνή πρότυπα ως κανονικό και όχι ως πρόσθετο χαρακτηριστικό. Και το 1996, υλοποιώντας τις επίσημες δεσμεύσεις που ανέλαβε έναντι της Επιτροπής αλλά και δημόσια, η Microsoft εξασφάλισε την υποστήριξη της πλήρους πολυγλωσσίας σύμφωνα με το πρότυπο Unicode® και τις προδιαγραφές της Επιτροπής σε όλα τα επιμέρους στοιχεία του MS-Office® 97.

Στις αρχές του 2000 τα προϊόντα πληροφορικής που κυκλοφορούν στην Ευρωπαϊκή και Αμερικανική αγορά – και που χρησιμοποιούνται από τα Όργανα της Ευρωπαϊκής Ένωσης – υποστηρίζουν την πλήρη πολυγλωσσία σύμφωνα με τα πρότυπα. Και μάλιστα η υποστήριξη είναι γενική δηλαδή δεν απαιτείται η αγορά επιπλέον εξαρτημάτων ή προγραμμάτων με εξαίρεση τα προγράμματα ορθογραφικής διόρθωσης και συλλαβισμού. Συγκεκριμένα υποστηρίζουν την πλήρη πολυγλωσσία :

  • τα λειτουργικά συστήματα Windows® 9x και Windows® 2000 (το τελευταίο υποστηρίζει εξ αρχής χαρακτήρες και πληκτρολόγιο για πολυτονικά ελληνικά)·
  • το σύστημα πληροφορικής γραφείου MS-Office® 2000·
  • το σύστημα διαχείρισης σχεσιακής βάσης δεδομένων ORACLE®·
  • το σύστημα διαχείρισης βάσης δεδομένων πλήρους κειμένου Fulcrum Ful/Text®·
  • το σύστημα πρόσβασης στο διαδίκτυο Netscape®.

Ταυτόχρονα η μεγάλη ανάπτυξη του διαδικτύου οδήγησε στην ανάπτυξη και των σχετικών ελληνικών εφαρμογών. Δικτυακοί τόποι και ιστοσελίδες με τα κείμενα ελληνικών εφημερίδων και ειδησεογραφικών πρακτορείων, ελληνικά ηλεκτρονικά βιβλιοπωλεία, ηλεκτρονικές λίστες ανταλλαγής απόψεων, τόποι για ηλεκτρονικές συζητήσεις, πύλες πρόσβασης, βάσεις δεδομένων με πλήρες κείμενο και άλλες πολλές ιστοσελίδες με ελληνικά – ακόμη και πολυτονικά – δείχνουν πως τα ελληνικά έχουν πάρει πια τη θέση που τους αξίζει στον κόσμο των διφύων.

Μερικές ακόμη βελτιώσεις. Στις αρχές της τρίτης χιλιετίας το μεγαλύτερο μέρος των τεχνικών προβλημάτων που σχετίζονται με την πολυγλωσσία και ειδικότερα με την υποστήριξη των ελληνικών στα συστήματα πληροφορικής έχουν λυθεί οριστικά. Όμως κάποιες περαιτέρω βελτιώσεις κρίνονται ακόμη απαραίτητες.

  • Κατ’ αρχάς το ηλεκτρονικό ταχυδρομείο παρουσιάζει ακόμη προβλήματα. Δυστυχώς, ένα μέρος της ευθύνης για το πρόβλημα φέρει και ο ΟΤΕ. Όπως αναφέρθηκε και παραπάνω, όταν το 1988 πρωτοτέθηκε το ζήτημα της κωδικοποίησης των ελληνικών στα συστήματα τηλεματικής, ο ΟΤΕ υποστήριξε 7-ψήφιες λύσεις για τα ελληνικά προκειμένου να εξασφαλίσει συμβατότητα με τα ήδη υπάρχοντα συστήματα. Δυστυχώς την εποχή εκείνη δεν υπήρχαν «ήδη υπάρχοντα συστήματα» στην Ελλάδα· απλώς σχεδιαζόταν το ελληνικό δίκτυο ανταλλαγής δεδομένων, το γνωστό HELLASPACK. Και παρά τις επεμβάσεις της Ευρωπαϊκής Επιτροπής που προσπάθησε να πείσει την ελληνική πλευρά να υιοθετήσει τουλάχιστον 8-ψήφιες λύσεις, ο ΟΤΕ επέμενε μέχρι τέλους στις απόψεις του. Το αποτέλεσμα είναι σήμερα σε όλα τα συστήματα ηλεκτρονικού ταχυδρομείου η διεύθυνση και συχνά το θέμα (subject) να πρέπει να δίδονται σε 7-ψήφιες κωδικοποιήσεις με αποτέλεσμα να ευδοκιμούν ακόμη τα «φραγκοχιώτικα» (greeklish). Ευτυχώς προοδευτικά εφαρμόζονται 8-ψήφιες κωδικοποιήσεις στο θέμα (subject) και το περιεχόμενο (content) του μηνύματος ενόψει της εφαρμογής 16-ψήφιων λύσεων.
  • Η  δημοφιλέστερη[28] εφαρμογή τηλεματικής, το διαδίκτυο (internet) υποστηρίζει ήδη όπως αναφέρθηκε 8-ψήφιες κωδικοποιήσεις και κατακτάται σιγά-σιγά και από 16-ψήφιες. Στον χώρο αυτό οι προκλήσεις που πρέπει να αντιμετωπισθούν στο μέλλον έχουν να κάνουν περισσότερο με το περιεχόμενο παρά με την τεχνική. Λόγου χάριν όταν μια ιστοσελίδα περιέχει ελληνικά θα πρέπει αυτό να δηλώνεται με συστηματικό τρόπο στην αρχή της σελίδας, προκειμένου το ελληνικό αλφάβητο να εμφανίζεται αυτόματα στην οθόνη και να μην απαιτείται επέμβαση του χρήστη. Η δήλωση του συνόλου χαρακτήρων της ιστοσελίδας διευκολύνει επίσης και την στατιστική καταγραφή των ελληνικών ιστοσελίδων – που καταγράφονται ως αγγλικές όταν η δήλωση αυτή απουσιάζει.
  • Εξαιρετικά χρήσιμη θα είναι και η σταδιακή μετατροπή με βάση τα πρότυπα, όλων των συστημάτων που εφαρμόζουν ακόμη «ιδιωτικές» κωδικοποιήσεις. Πρόκειται κυρίως για τις εξής εφαρμογές:
    • Τη βάση ΝΟΜΟΣ, μια σπουδαία ελληνική εφαρμογή με το πλήρες κείμενο της ελληνικής νομοθεσίας και νομολογίας από καταβολής ελληνικού Κράτους. Ο ΝΟΜΟΣ έχει δυστυχώς κωδικοποιηθεί σύμφωνα με την “ιδιωτική” κωδικοποίηση της DEC για τα ελληνικά και όχι σύμφωνα με το ΕΛΟΤ 928. Βέβαια με τη χρήση ευέλικτων προσομοιωτών διερεύνησης (βλ. παραπάνω) οι ευρωυπάλληλοι μπορούν να διερευνήσουν και αυτή τη βάση χωρίς ιδιαίτερα προβλήματα από τον τυποποιημένο σταθμό εργασίας τους. Και η προβλεπόμενη διάθεση του συστήματος στο διαδίκτυο με βάση τα ισχύοντα πρότυπα θα εξασφαλίσει σωστή πρόσβαση χωρίς προβλήματα.
    • Τα συστήματα με αρχαία ελληνικά κείμενα όπως λόγου χάρη το Thesaurus Linguæ Græcæ, ή η βάση Περσέας. Η μετατροπή τους σε 16-ψήφιες εφαρμογές με βάση την τυποποιημένη κωδικοποίηση του ISO θα τις κάνει κοινό κτήμα σε όσους έχουν πρόσβαση στο διαδίκτυο.
  • Μερικά βήματα θα πρέπει επίσης να γίνουν και στον τομέα της τυποποίησης.
    • Η καθιέρωση κωδικών ISO για τις διάφορες φάσεις εξέλιξης της ελληνικής γλώσσας (π.χ. αρχαία, ελληνιστική κοινή, βυζαντινή, νέα ελληνική) θα εξασφαλίσει καλύτερη υποστήριξη σε επίπεδο λειτουργικού συστήματος και εφαρμογών.
    • Τέλος θα πρέπει να προβλεφθούν και τα βυζαντινά συμπλέγματα (ligatures) και τα σημεία γραφής της βυζαντινής μουσικής. Ευτυχώς ο ΕΛΟΤ έχει ήδη κατανοήσει τα προβλήματα αυτά και εργάζεται για την επίλυσή τους[29].
    • Τέλος οι τεχνικές δυνατότητες που παρέχονται σήμερα σε όλους τους προσωπικούς υπολογιστές θα πρέπει να οδηγήσουν σε περιορισμό και σταδιακή κατάργηση των «φραγκοχιώτικων» (greeklish) αντί στην τεχνητή συντήρησή τους[30].

Top

Συμπέρασμα

Η εισαγωγή των ελληνικών στα συστήματα πληροφορικής της Ευρωπαϊκής Επιτροπής συνέβαλε στην προώθηση της τυποποίησης του ελληνικού αλφαβήτου στην Ελλάδα και διεθνώς· η εμπειρία που αποκτήθηκε απετέλεσε τη βάση για την προώθηση της πλήρους ή εκτεταμένης πολυγλωσσίας στα συστήματα πληροφορικής των Οργάνων της Ευρωπαϊκής Ένωσης. Εν έτει 2000 τα τεχνικά προβλήματα έχουν ουσιαστικά λυθεί και όλοι οι ενδιαφερόμενοι χρήστες έχουν τη δυνατότητα να συντάξουν, να διακινήσουν, να διερευνήσουν και να συμβουλευθούν στο διαδίκτυο ελληνικά ηλεκτρονικά κείμενα, χρησιμοποιώντας τα φθηνά τυποποιημένα συστήματα που διατίθενται στην αγορά. Η ισότιμη παρουσία των ελληνικών δίπλα στις υπόλοιπες γλώσσες του κόσμου έχει εξασφαλισθεί κατά τυποποιημένο τρόπο και το μέλλον δεν μας επιφυλάσσει εκπλήξεις όσον αφορά το τεχνικό μέρος του προβλήματος. Αντίθετα η πρόκληση που μας περιμένει όλους, είτε μένουμε στην Ελλάδα είτε στο εξωτερικό, σχετίζεται κυρίως με την ποσότητα και την ποιότητα του περιεχόμενου[31] με το οποίο τροφοδοτούμε τα συστήματα πληροφορικής που διατίθενται στο διαδίκτυο.

Top

Ευχαριστίες

Η εισαγωγή των ελληνικών στα συστήματα πληροφορικής της Επιτροπής δεν θα ήταν δυνατή χωρίς την αρμονική συνεργασία αρκετών συναδέλφων από τα Όργανα της Ευρωπαϊκής Ένωσης αλλά και συμπατριωτών από την Ελλάδα και τη Διασπορά. Οι κυριότεροι από τους συνεργάτες αυτούς είναι οι εξής:

  • ο José Marin-Navarro της Διεύθυνσης Πληροφορικής της Επιτροπής ήταν υπεύθυνος πληροφορικός για την ελληνική CELEX·
  • η αείμνηστη Monique Vincent είχε την ευθύνη γιά την εισαγωγή των ελληνικών και της πολυγλωσσίας στα συστήματα πληροφορικής γραφείου 2ης και 3ης γενιάς·
  • ο Roland Mertz (τότε στην Διεύθυνση Πληροφορικής) και ο Γιωργος Βλαχοπουλος (τότε στην μονάδα Πληροφορικής της Υπηρεσίας Μετάφρασης), εργάστηκαν γιά την υλοποίηση της πολυγλωσσίας στα συστήματα πληροφορικής γραφείου 2ης γενιάς·
  • ο Μάριος Ραϊσης, πρώην διευθυντής του Κέντρου Υπολογιστών της Επιτροπής υποστήριξε την όλη προσπάθεια από την αρχή με τις πολύτιμες συμβουλές και την εμπειρία του·
  • ο Γιάννης Μαϊστρος του ΕΜΠ και ο Βαγγέλης Μελαγρακης του ΕΛΟΤ εξασφάλισαν τον συντονισμό μεταξύ Βρυξελλών και Αθηνών προκειμένου να προχωρήσουν οι εργασίες τυποποίησης·
  • ο πρώην Ευρωβουλευτής Γιώργος Σαρειδακις, τα μέλη της Ομάδας Νομικής Πληροφορικής του Συμβουλίου,  αείμνηστος Τάσος Πασιας, καθηγητής του ΑΠΘ και  Έλλη Μαμουνα-Κουτσικακη του Ελληνικού Υπουργείου Εξωτερικών, ο 'Αγγελος Κτενας (τότε στο Γραφείο της Επιτρόπου κ. Βάσως Παπανδρεου), καθώς και ο δημοσιογράφος Γιώργος Δαρατος, συνέβαλαν αποφασιστικά, ο καθένας με τον τρόπο του, στην επιτυχία του έργου· τέλος,
  • ο Λάζαρος Τοσουνιδης, (τότε στην Διεύθυνση Πληροφορικής της Επιτροπής) ανέλαβε από το 1992 και μετά τον συντονισμό της προσπάθειας για την εκτεταμένη πολυγλωσσία και πέτυχε σημαντικά αποτελέσματα.

Top

Σύντομο βιογραφικό σημείωμα

Ο Παναγιώτης Ε. Αλεβαντης πήρε πτυχίο Φυσικού το 1977 από το Πανεπιστήμιο Πατρών.  Από το 1979 ως το 1984, εργάστηκε ως Βοηθός αρχισυντάκτη για Τεχνολογία και Φυσική στην εγκυκλοπαίδεια ΠΑΠΥΡΟΣ-LAROUSSE-BRITANNICA και ως επιστημονικός συντάκτης στα περιοδικά ΕΠΙΚΑΙΡΑ και 4ΤΡΟΧΟΙ. Μετά από διετή θητεία στο Μεταφραστικό Γραφείο της Ευρωπαϊκής Επιτροπής, εργάστηκε από το 1986 ως το 1991 ως υπεύθυνος έργου για την δημιουργία της βάσης δεδομένων CELEX στα ελληνικά και τον εκσυγχρονισμό του όλου συστήματος. Το 1991 επέστρεψε στην Μεταφραστική Υπηρεσία όπου και συντόνισε, ανάμεσα σε άλλα, και τις εργασίες εισαγωγής της εκτεταμένης πολυγλωσσίας στους υπολογιστές της Επιτροπής. Από το τέλος του 1992 και μέχρι το Μάιο του 1997 ήταν υπεύθυνος πληροφοριών (Information Officer) στην Γενική Διεύθυνση Ανταγωνισμού της Ευρωπαϊκής Επιτροπής. Από το Μάιο του 1997 ως το Μάιο του 1998 ήταν υπεύθυνος πληροφοριών στην Γενική Διεύθυνση Ενέργειας. Στη συνέχεια και μέχρι το τέλος του 2002 υπηρέτησε στη Μονάδα Πολιτικής Προστασίας της Γενικής Διεύθυνσης Περιβάλλοντος της Ευρωπαϊκής Επιτροπής. Το 2003 επέστρεψε στο Ελληνικό τμήμα της Γενικής Διεύθυνσης Μετάφρασης. Την περίοδο 2014-2016 ήταν υπεύθυνος του Γραφείου Αθηνών της Γενικής Διεύθυνσης Μετάφρασης από όπου και συνταξιοδοτήθηκε τον Ιανουάριο του 2017. Επικοινωνία: panagiotis[παπάκι]alevantis.com.

Οι απόψεις που εκφράζονται στο άρθρο αυτό είναι προσωπικές και δεν δεσμεύουν κατά κανένα τρόπο την Ευρωπαϊκή Επιτροπή. Το άρθρο αυτό διαβιβάστηκε για δημοσίευση στο Περιοδικό «Ελληνική Διεθνής Γλώσσα» τον Ιούνιο του 1996· αναθεωρήθηκε μερικώς το Μάιο του 1997 και ξανά τον Σεπτέμβριο 1998 σε επουσιώδη μόνον σημεία. Δημοσιεύτηκε σε δύο συνέχειες στα τεύχη 29 (Ιαν.- Μαρτ. 1997) και 30 (Ιαν. - Μαρτ. 1997). Αναδημοσιεύτηκε στο διαδίκτυο στις 24 Σεπτεμβρίου 1997 στα πλαίσια αλληλογραφίας στο περιοδικό ΣΑΜΙΖΝΤΑΤ. Το κεφάλαιο Ένα βήμα μπροστά : πλήρης ή εκτεταμένη πολυγλωσσία αναθεωρήθηκε ριζικά τον Ιούνιο του 2000. Το άρθρο διατίθεται από τον Νοέμβριο 2000 και στο διαδίκτυο (http://alevantis.com). 

Μερικές διορθώσεις Ιανουάριος 2001, Απρίλιος 2006, Αύγουστος 2017.

Top 

Μερικοί χρήσιμοι τόποι στο διαδίκτυο

  1. Η Ευρωπαϊκή Ένωση διαθέτει πληροφορίες (και στα ελληνικά) στον τόπο : http://europa.eu. Περιλαμβάνει ιστοσελίδες για τις Υπηρεσίες Μετάφρασης καθώς και πρόσβαση στο Eurodicautom (αντικαταστάθηκε από το νέα σύστημα ΙΑΤΕ) και στη CELEX (αντικαταστάθηκε από το Eur-Lex).
  2. ΕΛΟΤ http://www.elot.gr/, Διεθνής Οργανισμός Τυποποίησης https://www.iso.org, και σύμπραξη Unicode http://www.unicode.org/.
  3. Ο τόπος της βάσης νομικών δεδομένων ΝΟΜΟΣ http://lawdb.intrasoftnet.com.
  4. Οι τόποι του Θησαυρού της Ελληνικής Γλώσσας http://stephanus.tlg.uci.edu/ και του Περσέα http://www.perseus.tufts.edu/ περιέχουν πολυάριθμες συνδέσεις προς τόπους κλασσικών σπουδών. Ο τόπος Μυριόβιβλος http://www.myriobiblos.gr/ περιλαμβάνει πολυτονικά κείμενα με κωδικοποίηση Unicode.
  5. Τέλος οι τόποι του Ινστιτούτου Ελληνικού Δυναμικού (http://www.hri.org/) και το http://www.in.gr/ αποτελούν δύο από τις πάμπολλες δικτυακές πύλες με πλούσιο ελληνικό περιεχόμενο.

Top 


Σημειώσεις, Παραπομπές και Βιβλιογραφία

[1]   Οι Ευρωπαϊκές Κοινότητες είναι οι εξής:
  • Ευρωπαϊκή Οικονομική Κοινότητα,
  • Ευρωπαϊκή Κοινότητα ¶νθρακα και Χάλυβα,
  • Ευρωπαΐκή Κοινότητα Ατομικής Ενεργείας·

το 1989 με την Ενιαία Πράξη γίνεται αναφορά σε μία μόνο "Ευρωπαϊκή Κοινότητα"· η Συνθήκες του Μάαστριχτ και του ¶μστερνταμ αναφέρονται στη "Ευρωπαϊκή Ένωση"

[2]   Γαλλικά, Αγγλικά, Γερμανικά, Ολλανδικά, Ιταλικά, Δανικά και Ελληνικά· σε αυτές προστέθηκαν το 1985 τα Ισπανικά και Πορτογαλικά  και το 1994 τα Σουηδικά και τα Φινλανδικά. Έτσι σήμερα - 2000 - η Ευρωπαϊκή Ένωση έχει 11 επίσημες γλώσσες και γλώσσες εργασίας.

[3]   Σήμερα, τα Κοινοτικά Όργανα είναι :

  • το Συμβούλιο Υπουργών,
  • το Ευρωπαϊκό Κοινοβούλιο ή Συνέλευση,
  • η Ευρωπαϊκή Επιτροπή,
  • το Δικαστήριο των Ευρωπαϊκών Κοινοτήτων,
  • η Οικονομική και Κοινωνική Επιτροπή,
  • το Ελεγκτικό Συνέδριο και
  • η Επιτροπή των Περιφερειών.

[4]   Αξίζει να σημειωθεί πως για κάθε μία από τις τρεις αυτές εφαρμογές υιοθετήθηκε διαφορετική κωδικοποίηση του ελληνικού αλφαβήτου· σε δύο εφαρμογές - επεξεργασία κειμένων και Επίσημη Εφημερίδα - χρησιμοποιήθηκαν 7-ψήφιες κωδικοποιήσεις, ενώ για το Eurodicautom υιοθετήθηκε 8-ψήφια κωδικοποίηση. Μάλιστα η κωδικοποίηση στην επεξεργασία κειμένων ήταν ασαφής δηλαδή κωδικοποιούσε τους όμοιους στην εμφάνιση ελληνικούς και λατινικούς χαρακτήρες με τον ίδιο κωδικό πράγμα που δημιουργούσε σειρά προβλημάτων με τα παραγόμενα κείμενα.

[5]   Skourlas, C. “National Documentation Center: Software development for public Databases Management”, Proceedings of Online Information ’88,  London, Learned Information, 1988 (σ.σ. πρόκειται για τις εργασίες ανάπτυξης βάσεων δεδομένων για το ελληνικό Εθνικό Κέντρο Τεκμηρίωσης).

[6]   Προφορική πληροφορία του αείμνηστου Α. Πασιά.

[7]   Alevizos, T. et al. "Information retrieval and Greek-Latin text", Proceedings of Online Information '88, London, Learned Information 1988 (σ.σ. στα πλαίσια των εργασιών ανάπτυξης βάσεων δεδομένων για το ελληνικό Εθνικό Κέντρο Τεκμηρίωσης).

[8]   Passias, A. "Problèmes liés à l'élaboration d'instruments linguistiques du projet INNOMOS: Synonymie et polysémie dans le langage juridique hellènique", 2° Convegno Informatica Giuridica al servizio del Paese· αναδημοσίευση στο Πληροφορική και Δίκαιο, 1:1987, Θεσσαλονίκη.

[9]   McGregor Ross, H. “Character Sets for Communication of Text”, study prepared for the Commission of the European Communities, May 1979, London.

[10]  Από το 1986 και μετά επανειλημμένα στην Ομάδα Νομικής Πληροφορικής του Συμβουλίου Υπουργών· το 1988 στις υπηρεσίες τις Επιτροπής από τον τότε Έλληνα Επίτροπο Γ. Βάρφη, τον τότε Υφυπουργό Εξωτερικών Θ. Πάγκαλο και τον τότε Ευρωβουλευτή Γ. Σαρειδάκι (με σειρά από ερωτήσεις στο Ευρωπαϊκό Κοινοβούλιο)· και τέλος το 1989 από την τότε Ελληνίδα Επίτροπο Β. Παπανδρέου.

[11]  Απόφαση του Συμβουλίου της 22ας Δεκεμβρίου 1986, περί τυποποίησης στον τομέα των τεχνολογιών πληροφοριών και των τηλεπικοινωνιών (87/95/ΕΟΚ), Επίσημη Εφημερίδα των Ευρωπαϊκών Κοινοτήτων, σειρά L, αριθ. 36, 7/2/87, σ. 31.

[12]  Το πρότυπο υιοθετήθηκε μετά από δύο κοινές συνεδριάσεις της Τεχνικής Επιτροπής 48 του Ελληνικού Οργανισμού Τυποποίησης (ΕΛΟΤ) και της αντίστοιχης υποεπιτροπής του ISO που έγιναν κατά τη διάρκεια του 1986, η μία στο Ηράκλειο της Κρήτης και η άλλη στην Αθήνα· οι συναντήσεις αυτές οργανώθηκαν μετά από ενέργειες του υπογράφοντος που έφερε σε επαφή τον Peter Fenwick, πρόεδρο της υποεπιτροπής του ISO, με τον Γιάννη Μαΐστρο, καθηγητή του ΕΜΠ και μέλος της ΤΕ 48. Στη συνέχεια το πρότυπο υιοθετήθηκε από τον ISO με τη διαδικασία του κατεπείγοντος.

[13]  Η εισαγωγή των ελληνικών στα τερματικά έγινε δυνατή μόνο μετά την θέσπιση ενός επίσημου προτύπου για το ελληνικό πληκτρολόγιο - το ΕΛΟΤ 1000.

[14]  Η εισαγωγή των ελληνικών στα τερματικά και τους εκτυπωτές απαίτησε την ανάπτυξη / προσαρμογή ελληνολατινικών γραμματοσειρών και την επίλυση προβλημάτων αισθητικής και γραφικής συνάφειας των χαρακτήρων.

[15]  Guidelines for an Informatics Architecture, [Κατευθυντήριες γραμμές γιά μιαν Αρχιτεκτονική Πληροφορικής], 4η έκδοση, Luxembourg, Office des Publications Officielles des Communautés Européennes (OPOCE), 1990.

[16] Πράγματι είναι δυνατόν με μία 7-ψήφια κωδικοποίηση να κωδικοποιηθούν πολλά αλφάβητα· τότε όμως θα πρέπει το σύστημα να εκπέμπει ένα ειδικό σήμα (μίαν "ακολουθία διαφυγής") κάθε φορά που ο 7-ψήφιος κώδικας αλλάζει "νόημα" (π.χ. τη μία αντιπροσωπεύει ένα λατινικό αλφάβητο και την άλλη το ελληνικό ή το κυριλλικό). Για τα προβλήματα που προκύπτουν από μία τέτοια μέθοδο κωδικοποίησης βλ. και Marin-Navarro, J. and Alevantis, P. E. “Alice in the wonderland of SGML: streamlining text entry in the CELEX databasesThe Electronic Library, Vol. 9, No 3, page 155, June 1991.

[17]  Proprietary coding schemes: πρόκειται για κώδικες που δεν αναφέρονται σε κάποιο πρότυπο (εθνικό, ευρωπαϊκό ή διεθνές) αλλά χρησιμοποιούνται σε συστήματα του εμπορίου (π.χ. ο κώδικας EBCDIC της IBM, ή οι κωδικοσελίδες - code pages - των προσωπικών υπολογιστών).

[18]  Alevantis, P. "Creating the Greek CELEX database, technical or managerial challenge ?", Terminologie et Traduction, No 1, σ. 11-21, Luxembourg, OPOCE, 1988.

[19]  Alevantis, P.E. and Marin-Navarro, J. “From έ, ΰ  and  ς  to é, ü and ß: introducing paneuropean multilingualism into the CELEX databases”, Proceedings of Online Information ’90,  London, Learned Information, 1990.

[20]  ISO 10646: Information technology - Universal Multiple-octet Coded Character Set (UCS) - Part 1: Architecture and basic multilingual plane.

[21]  The Unicode Standard, Version 2.0, The Unicode Consortium, Addison-Wesley Developers Press, 1996.

[22]  Multilingualism : The needs of the Institutions of the European Community”, SdT-02 (92)D/466, version 4, 30 juillet 1992, Bruxelles.

[23]  SGML : Standard Generalized Mark-up Language, Τυποποιημένη Γενική Γλώσσα Επισήμανσης· πρόκειται για τον πρόδρομο της HTML (Hypertext Mark-up Language) που αποτελεί τη βάση των εφαρμογών στο World Wide Web.

[24]  Από το 1992 και μετά υπεύθυνος έργου για την εισαγωγή της πλήρους πολυγλωσσίας στα συστήματα πληροφορικής της Ευρωπαϊκής Επιτροπής ήταν ο Λάζαρος Τοσουνίδης, της Διεύθυνσης Πληροφορικής της Επιτροπής στο Λουξεμβούργο.

[25]  Το λειτουργικό σύστημα (operating system) εξασφαλίζει τις βασικές λειτουργίες του υπολογιστή· παραδείγματα λειτουργικών συστημάτων είναι τα MS-DOS, UNIX, Windows® NT, Windows® 98, Linux κ.ά.

[26]  Παράδειγμα γραφικού συστήματος επικοινωνίας με το χρήστη (graphical user interface) είναι το Windows 9x· τα σύγχρονα λειτουργικά συστήματα λειτουργούν σε γραφικό περιβάλλον για να διευκολύνουν την επικοινωνία με το χρήστη.

[27]  Οι υπηρεσίες της Επιτροπής υιοθέτησαν λύσεις που στηρίζονταν στο πρότυπο ISO 8859/7 (ΕΛΟΤ 928). Δυστυχώς τα προϊόντα που κυκλοφόρησαν την εποχή εκείνη στην ελληνική αγορά παρά τις διαφημίσεις δεν υλοποιούσαν πλήρως το ΕΛΟΤ 928 (διέφεραν κατά 7 χαρακτήρες) με αποτέλεσμα να υπάρξουν μακροπρόθεσμα μερικά προβλήματα συμβατότητας.

[28]  Ευτυχώς οι εφαρμογές που προέβλεπε να αναπτύξει ο ΟΤΕ όταν επέμενε στις 7-ψήφιες κωδικοποιήσεις (τηλεκειμενογραφία-teletex και τηλεεικονογραφία-videotex) δεν αναπτύχθηκαν διεθνώς και κατά συνέπεια εγκαταλείφθηκαν και στην Ελλάδα· η μόνη εφαρμογή τηλεεικονογραφίας που γνώρισε μεγάλη επιτυχία ήταν το γαλλικό Minitel, αλλά το 7-ψήφιο γαλλικό αυτό σύστημα δεν πέρασε ποτέ τα σύνορα του “εξαγώνου”.

[29]  Ιδιωτική συνομιλία με τον Ε. Μελαγράκη του ΕΛΟΤ. Βλέπε επίσης Παπαδημητρίου, Λ. “Ο Ατατούρκ, το Internet και το ελληνικό αλφάβητο”, ΤΟ άλλο ΒΗΜΑ, 30 Ιουλίου 1995, σ. 22.

[30]  Ανδρουτσόπουλος, Ι. «Από τα φραγκοχιώτικα στα greeklish», ΤΟ ΒΗΜΑ, Νέες Εποχές, 5 Σεπτεμβρίου 1997, σ. 3.

[31]  Βλέπε και τα σχετικά κεφάλαια στην Ιστορία της Ελληνικής Γλώσσας, εκδ. Ελληνικό Λογοτεχνικό και Ιστορικό Αρχείο, Αθήνα, 1999, με σχετική βιβλιογραφία.

Top






updated

Νέα
Βίος
Έργα
Γραπτά
Ιδέες
Τόποι
Κοινωνία


Κεντρική σελίδα