Cimbern-Kuratorium Bayern hat KI-Taskforce gegründet

Mit dem Einsatz von Künstlicher Intelligenz werden multiple Ziele verfolgt – von der Sprachdokumentation über die Förderung des interaktiven Lernens und die Erreichung jüngerer Zielgruppen bis zum nachhaltigen Erhalt der alten Sprache Zimbrisch.

Text: Heike Arnold

Am 08. Februar 2025 trafen sich Sprach- und IT-Experten und Vorstandsmitglieder des bayerischen Cimbern-Kuratoriums zur virtuellen konstituierenden Sitzung ihrer KI-Taskforce, deren Gründung in der letzten Vorstandssitzung des Jahres 2024 beschlossen worden war. Der Einsatz von KI soll die Forschung und den Erhalt der zimbrischen Sprache unterstützen und innovative Strategien fördern, um die Sprache für zukünftige Generationen lebendig zu halten. KI ermöglicht es, Ressourcen effizienter zu nutzen, kreative Ansätze zu entwickeln und die Gemeinschaft enger zu vernetzen.

Zum Beginn der Online-Sitzung betonte Priv.-Doz., Dr. rer. nat., Dipl.-Chem. (Univ.) Raphael Berger, Vorstandsmitglied und Leiter der KI-Taskforce des Kuratoriums, erneut die Bedeutung, die einer vollumfänglichen Digitalisierung des vorhandenen Materials in zimbrischer Sprache in Form von Audio- und Video-Dateien, Büchern, Texten etc. zum langfristigen Erhalt der zimbrischen Sprache zukommt. Hier kann KI einen wichtigen Beitrag zur Digitalisierung und Archivierung leisten. Automatisierte Transkriptions- und Übersetzungstools können helfen, die Sprache in Schriftform festzuhalten und einen breiteren Zugang zu ermöglichen.

Riesige Datenmengen und Volldigitalisierung erforderlich

Dabei steht die KI-Taskforce des Cimbern-Kuratoriums vor besonderen Herausforderungen: Es gibt das Zimbrisch der Sieben Gemeinden, das der Dreizehn Gemeinden und das sogenannte „Luserner Zimbrisch“. Man will sich deshalb zunächst auf das Zimbrisch der Sieben Gemeinden (Sette Comuni) und in einem Projekt A auf die Sammlung und Volldigitalisierung von Daten konzentrieren. Die gesammelten Daten müssen aufbereitet und strukturiert werden. Eine experimentelle Voruntersuchung des zimbrischen Wörterbuchs von Hugo F. Resch, die Taskforce-Mitglied und IT-Experte Stefan Duschl gemeinsam mit Hans Geiselbrechtiger und Raphael Berger vorgenommen hatte, ergab, dass darin 27.000 Satzpaare zimbrisch-deutsch enthalten sind (bei vielen Dupletten), jedoch etwa 50.000 saubere zimbrisch-deutsche Datensätze benötigt werden, um eine KI wie beispielweise ChatGPT dazu zu bringen, die Sprache Zimbrisch zu verstehen. Ein bloßes Einscannen zimbrischer Texte genügt zur Digitalisierung nicht, da hierbei lediglich Abbilder eines Dokumentes erzeugt werden, und der Einsatz von OCR (automatische Text- und Schrifterkennung) scheint im Falle der zimbrischen Sprache nicht vielversprechend. Duschl hält es jedoch „für unumgänglich, das gesamte Material zu volldigitalisieren, um das Zimbrische langfristig zu fördern und zu erhalten.“ Man will deshalb, wie eingangs bereits erwähnt, innovative Scan-Tools nutzen, um in einem Pilotprojekt am Beispiel des „Lukas-Evangeliums“ zu erproben, ob das Cimbern-Kuratorium e. V. die erforderlichen Ressourcen aus den eigenen Reihen zur Verfügung stellen kann bzw. zu eruieren, ob finanzielle Förderung und Unterstützung durch größere Institutionen etwa durch die Bereitstellung von Großrechnerkapazitäten erforderlich ist.