Kunstmatige intelligentie en kleitabletten: nog geen perfecte match
Eeuwenoude teksten vertalen, ontbrekende delen van kleitabletten aanvullen: steeds vaker duiken artikelen op over de mogelijkheden die kunstmatige intelligentie biedt voor het onderzoek naar documenten in de oudste schriften. Kunnen we de ontcijfering van eeuwenoude teksten voortaan beter overlaten aan de computer?
Universitair hoofddocent Alwin Kloekhorst denkt dat het zo’n vaart niet loopt. ‘Deze zomer was in het nieuws dat AI kleitabletten zou kunnen scannen en dan ook meteen vertalen. Ik kan me eigenlijk niet voorstellen dat dit klopt’, zegt de specialist Hettitisch, een taal die in het spijkerschrift geschreven werd. ‘Als je teksten in het Hettitisch ziet, lijkt het geschreven in heel mooie rechte tekentjes, maar in de praktijk zijn dat 3D-gravures. Dat maakt het heel lastig ze te scannen en door een computer te laten herkennen.’
Daar komt bij dat de 30.000 fragmenten van Hettitische teksten die overgeleverd zijn, eigenlijk te weinig zijn om een computer goed te trainen om het Hettitisch te kunnen vertalen, denkt Kloekhorst. ‘Als je alle fragmenten van kleitabletten uittypt, houd je iets van drieduizend A4’tjes over. Het is lastig om daar een systeem mee aan de slag te laten gaan, zeker omdat het fragmenten zijn waarin soms belangrijke onderdelen in ontbreken. Je ziet ook dat onderzoekers die daar nu mee aan de slag zijn, vaak lage betrouwbaarheidspercentages hebben van maximaal zeventig procent.’
Snellere vergelijking
Hoewel de computer Kloekhorsts werk vooralsnog dus nog niet kan overnemen, ziet hij op andere terreinen wel mogelijkheden voor AI. ‘Duitse onderzoekers hebben twee weken geleden een digitaal corpus van alle bestaande teksten in het Hettitisch online gezet. Daar ben ik heel blij mee, want het was een enorme lacune in ons veld dat dit nog niet bestond.’
Die ontwikkeling maakt onder meer de statistische analyse van de teksten eenvoudiger. ‘In het Hettitisch staat de schrijfwijze niet helemaal vast’, legt Kloekhorst uit. ‘Als je het corpus digitaal hebt, kun je veel sneller vergelijken welke spelling waar wordt gebruikt dan wanneer je elke keer naar de bibliotheek moet om een afschrift van een kleitablet op te zoeken.’
Mens als controleur
De afgelopen jaren is daarom al flink geïnvesteerd in digitalisering van kleitabletten. ‘Van het Hettitisch is misschien relatief weinig overgeleverd, van andere oude talen hebben we misschien wel een half miljoen tabletten’, aldus Kloekhorst. ‘Een deel daarvan ligt nu te verkruimelen in het depot van musea. Met een nieuwe 3D-scanner kunnen we die digitaliseren. Dat is ontzettend tof, ook omdat je als wetenschapper veel gerichter kunt werken door je meteen te focussen op de tekst zelf, zonder al het handwerk van data verzamelen. Er zijn zelfs pogingen geweest om kleitabletten binnenin enveloppes van klei te kunnen scannen!’
En misschien, hoopt Kloekhorst, kan AI over een aantal jaar dan wel degelijk helpen om te ontcijferen wat er op die gedigitaliseerde tabletten staat. ‘Misschien kan een computer analyseren welke fragmenten bij elkaar horen door breuklijnen van tabletten te vergelijken’, droomt hij. ‘Dat zou ontzettend helpen, al denk ik dat we de mens nodig blijven hebben als controleur.’