Un modello di intelligenza artificiale (AI) di deep learning può prevedere parole, frammenti e frasi mancanti da tavolette cuneiformi che hanno fino a 4500 anni.
Le tavolette di argilla incise con testo cuneiforme in lingua accadica sono strumenti chiave per comprendere le culture che esistevano in Mesopotamia (più o meno l’area dell’odierno Iraq) tra il 2500 a.C. e il 100 d.C. Molte di queste tavole, data l’età, sono danneggiate e prive di sezioni chiave del testo.L’informatico Gabriel Stanovsky dell’Università Ebraica di Gerusalemme e colleghi di diversi dipartimenti hanno collaborato per utilizzare l’intelligenza artificiale e svelare i segreti di queste tavole, completando il testo cuneiforme che manca.
Cos’è la scrittura cuneiforme
La scrittura cuneiforme è un sistema di scrittura utilizzato nell’antica Mesopotamia. È considerata la forma di scrittura più antica del mondo ed è stata utilizzata per oltre 3.000 anni. La scrittura cuneiforme è costituita da piccoli segni a forma di cuneo che venivano iscritti in tavolette di argilla bagnata.
Codificare tavole in scrittura cuneiforme
In passato la ricerca ha già “letto” vecchi documenti (lettere del rinascimento, o rotoli di ercolano), ma mai con questa tipologia di approccio alle scritture della civiltà sumerica.
Il team ha fatto ricorso ad un modello AI di deep learning già addestrato su 104 lingue diverse. Tra queste, anche alcune lingue semitiche come l’ebraico, che condivide somiglianze con l’accadico. Hanno quindi addestrato l’algoritmo con la trascrizione di 10.000 tavolette in scrittura cuneiforme. Il modello di intelligenza artificiale è stato in grado di suggerire parole e frasi contestualmente accurate per riempire le lacune. Prendetelo come una specie di T9, ma con il mesopotamico.
Come facciamo a sapere che i suggerimenti sono pertinenti? I ricercatori hanno testato l’AI anche su parti già note delle tavolette, e anche lì il completamento è stato ottimo. L’intelligenza artificiale ha ricostruito le frasi in scrittura cuneiforme con un soprendente 89% di precisione, in alcuni casi addirittura ampliando anche le possibili interpretazioni dei testi.
L’importanza di conoscere le lingue
“La scoperta principale di questo studio,” dice Stanovsky, ”è che l’uso di altre lingue ha davvero aiutato a codificare l’accadico”. Effettivamente, senza pre-addestrare il modello su quelle 104 lingue diverse, la precisione di lettura delle tavolette cuneiformi era inferiore di quasi 30 punti percentuali.
È uno strumento che nei prossimi anni, ne sono certo, libererà un enorme potenziale per la decifrazione di importanti documenti storici.
Riferimenti: arxiv.org/abs/2109.04513