Το Tsakonian Digital είναι ένα έργο που στοχεύει στην υποστήριξη των προσπαθειών διατήρησης και αναζωογόνησης των Τσακώνικων —του τελευταίου επιζώντος απογόνου της Αρχαίας Δωρικής Ελληνικής (δείτε 1.1 Γενική περιγραφή)— παρέχοντας ψηφιακούς πόρους και εργαλεία για την εκμάθηση και τη χρήση της γλώσσας. Επικεφαλής του έργου είναι ο Jaime García Chaparro, Senior Data Scientist με έδρα τη Μαδρίτη της Ισπανίας, με επίκεντρο την τεχνική ανάπτυξη (συλλογή δεδομένων, εκπαίδευση μοντέλων, ανάπτυξη ιστοσελίδας) και ο καθηγητής Maxim Kisilier, με έδρα την Αγία Πετρούπολη, στη γλωσσολογική και θεσμική πλευρά, ως ένας από τους κορυφαίους ειδικούς στα Τσακώνικα παγκοσμίως. (García Chaparro, 2025)
Κύριοι Στόχοι
- Ψηφιοποίηση: Μετατροπή αναλογικού υλικού (λεξικά, γραμματικές, ηχογραφήσεις) σε επεξεργάσιμα ψηφιακά δεδομένα.
- Τεχνητή Νοημοσύνη (AI): Ανάπτυξη μοντέλων Μηχανικής Μετάφρασης (NMT) και επεξεργασίας φυσικής γλώσσας (NLP) ειδικά για τα Τσακώνικα.
- Εκπαίδευση: Δημιουργία διαδραστικών εφαρμογών και υλικού για την εκμάθηση της γλώσσας από μη-φυσικούς ομιλητές.
Τεχνολογική Προσέγγιση
Το έργο αξιοποιεί σύγχρονες τεχνικές για την αντιμετώπιση του προβλήματος των “λιγοστών δεδομένων” (low-resource languages):
- OCR και Καθαρισμός Δεδομένων: Χρήση προηγμένων αλγορίθμων για την εξαγωγή κειμένου από παλαιά βιβλία. Η κύρια πηγή είναι το έργο του Ιωάννη Καμβύση Για να κ̔οντούμε τα γρούσσα νάμου (Gia na khondoúme ta groússa námou), συμπληρωμένο από το Λεξικό της Τσακωνικής Διαλέκτου (1986) του Θανάση Κωστάκη και επιλεγμένους τόμους από τα Χρονικά των Τσακώνων. (García Chaparro, 2025)
- Transfer Learning: Προσαρμογή μεγάλων γλωσσικών μοντέλων (LLMs) για την κατανόηση της τσακωνικής δομής.
- Pipeline γέφυρας AI: Το μοντέλο NMT χρησιμεύει επίσης ως ενδιάμεσος για να επιτρέψει την αλληλεπίδραση των Τσακώνικων με εμπορικές πλατφόρμες AI (π.χ. Google Translate, DeepL, GPT, Gemini). Η ροή εργασίας μεταφράζει την τσακωνική είσοδο στα Ελληνικά, περνά το ελληνικό κείμενο στην εμπορική πλατφόρμα και μεταφράζει την απάντηση πίσω στα Τσακώνικα. Αυτό παρακάμπτει την ανάγκη για απευθείας εκπαίδευση ενός πλήρους συστήματος AI με επίκεντρο τα Τσακώνικα σε εξαιρετικά σπάνια δεδομένα. (García Chaparro, 2025)
Πρόσβαση στο Έργο
Οι πόροι του Tsakonian Digital είναι διαθέσιμοι μέσω:
- Επίσημη Ιστοσελίδα: tsakoniandigital.com (υπό ανάπτυξη).
- GitHub: Αποθετήρια ανοιχτού κώδικα για τα εργαλεία επεξεργασίας.
- Αυτό το Vault: Η ψηφιακή βιβλιοθήκη που περιηγείστε αποτελεί μέρος του οικοσυστήματος του Tsakonian Digital.
Tsakonian Digital Vault